2018-07-16

Was ist Wikidata und wie kann es die bibliothekarische Arbeit unterstützen?

In der aktuellen Ausgabe von “ABI Technik” ist ein kurzer Text von mir in der Rubrik “ABI Technikfrage” enthalten, den ich vor gut drei Monaten geschrieben habe. Hier der Link zur Bezahlversion: https://doi.org/10.1515/abitech-2018-2013. Parallel veröffentliche ich den Wortlaut (angereichert mit Links und Anmerkungen) hier auf dem Blog unter einer CC0-Lizenz (so wie alle anderen Inhalte auch).

Wikidata ist eine von der Wikimedia Foundation seit 2012 betriebene Wissensdatenbank, die von jeder Person manuell oder maschinell bearbeitet werden kann. Die gemeinschaftlich erstellten Daten stehen unter einer CC0-Lizenz. In Wikidata können nicht bloß Informationen über etwas erfasst, sondern diese Aussagen auch mithilfe von Qualifikatoren beschrieben werden, etwa indem Quellen verlinkt, Zeiträume für die Gültigkeit einer Aussage angegeben oder divergierende Aussagen gewichtet werden.

Eines der ersten Ziele von Wikidata war die Unterstützung der Wikipedia-Projekte. Die Datenbank ermöglicht es, strukturierte Informationen wie die Bevölkerungszahl eines Landes einmalig zu erfassen und in den knapp 300 verschiedenen Wikipedia-Sprachversionen anzuzeigen, so dass nicht mehr parallel jede Wikipedia aktualisiert werden muss. Allerdings hat sich Wikidata schnell von der Wikipedia emanzipiert und deckt einen größeren Anwendungsbereich ab: Mittlerweile gibt es etwa so viele Einträge in Wikidata wie es Artikel in allen Wikipedia-Sprachversionen zusammen gibt.[1]

Die große Abdeckung und Vielfalt und der offene Charakter von Wikidata ließen schnell verschiedenste Nutzungsansätze entstehen. Dabei nutzen einige Anwendungen Wikidata bloß als Datenquelle, während andere die gesamte Wikidata-Infrastruktur zum Aufbau neuer Datensammlungen und Anwendungen verwenden.

Im bibliothekarischen Bereich hat Wikidata bisher vor allem in Bezug auf Normdaten von sich reden gemacht. Viele Wikidata-Einträge, etwa zu Personen, haben eine ganze Reihe von Identifikatoren unterschiedlichster Normdatenbanken. Damit kann Wikidata als Normdaten-Drehscheibe benutzt werden [2], über die weitere Quellen herangezogen werden können, einfach indem man eine entsprechende Abfrage mit der GND-ID einer Person, der ISIL einer Bibliothek oder einer anderen Normdaten-ID macht. Diese Möglichkeit wird etwa benutzt, um “Knowledge Cards” zu einer Person mit Bild und Basisinformationen innerhalb eines Bibliothekskatalogs anzuzeigen.[3]

Bei der Nordrhein-Westfälischen Bibliographie (NWBib) wird Wikidata gar als primäre Normdatenquelle für den Aufbau einer hierarchisch gegliederten Ortsklassifikation geographisch-administrativer Einheiten (Gemeinden, Städte, Stadtteile usw.) verwendet.[4] Der Grund: Wikidata ist die einzige nutzbare Datenquelle, die sowohl die nötige Abdeckung hat als auch die Informationen zur hierarchischen Gliederung enthält und auf einfache Weise bearbeitet werden kann.

Sehr relevant für Bibliotheken sind auch die unter dem Namen “WikiCite” stattfindenden Bemühungen, innerhalb Wikidata eine bibliographische Datenbank aufzubauen. Die WikiCite-Community trifft sich jährlich auf der gleichnamigen Konferenz, auch Bibliothekarinnen und Bibliothekare aus verschiedenen Ländern sind dabei. Verwandt damit ist das Scholia-Projekt, das Profile für Wissenschaftler/innen auf Basis von Wikidata generiert und damit sehr schön demonstriert, wie Funktionalitäten von kommerziellen, geschlossenen Diensten wie Web of Science in einer offenen und kollaborativen Umgebung umgesetzt werden können.

Wikidata ist erst fünf Jahre alt und bietet bereits eine Menge Nutzen und interessante Ansätze für Bibliotheken. Grund genug, ein Auge auf die weitere Entwicklung zu haben.


[1] [Edit 2018-07-16, 12:26] Mittlerweile bin ich mir bei dieser Aussage nicht mehr so sicher. Wikidata hat laut Statistikseite ca. 33 49 Millionen Einträge während alle Sprachversionen zusammen laut https://en.wikipedia.org/wiki/List_of_Wikipedias#Grand_total etwa 48 Millionen Einträge haben (inklusive "user pages, images, talk pages, ‘project’ pages, categories, and templates"). Falls jemand mich auf genaue Artikel-Zahlen hinweisen kann, würde mich das freuen.

[2] Im deutschsprachigen Raum vertreten vor allem Jakob Voß und Joachim Neubert die Idee von Wikidata als “Normdaten-Hub”, siehe etwa ihre Vortragsfolien “Wikidata as authority linking hub”.

[3] Siehe etwa Dan Scotts Blogbeitrag “Enriching catalogue pages in Evergreen with Wikidata”.

[4] Das Projekt ist noch nicht abgeschlossen, für weitere Informationen siehe etwa die Wikiseiten https://github.com/hbz/nwbib/wiki/Neukonzeption-der-Raumsystematik und https://github.com/hbz/nwbib/wiki/Wikidata-Matchingverfahren.