2009-12-19

Freie Metadaten - (k)ein Thema für den Bibliothekskongress

Dieser Beitrag von Anne Christensen, Patrick Danowski und Adrian Pohl wurde zeitgleich auf den Blogs netbib, Bibliothek 2.0 und mehr und Übertext veröffentlicht.

Katalogdaten sind zweifellos gefragter denn je - nicht nur für Zwecke der Fremddatenübernahme bei der Katalogisierung, sondern auch im Web 2.0, von Sozialen Katalogisierungsanwendungen wie LibraryThing und Open Library. Darüberhinaus gewinnen mit dem unaufhaltsamen Fortschritt von Linked Data, der dieses Jahr seinen bisherigen Höhepunkt erreicht hat, Katalogdaten in einem weiteren Anwendungsbereich an Bedeutung. Die Verlinkung freier Daten (Linked Open Data) bietet uns die Möglichkeit, das Wissen, was in den Titel- und Normdaten enthalten ist, abzuschöpfen und durch die Verknüpfung mit anderen - nichtbibliothekarischen - Wissensressourcen seine Nutzungsmöglichkeiten zu maximieren.

Kommerz mit Metadaten

Parallel zu dieser Entwicklung des Internet zum Linked-Data-Web und der Aussicht auf ganz neue Möglichkeiten der Recherche und Wissensgewinnung entwickelt sich aber auch die kommerzielle Nutzung von Metadaten in ganz neue Dimensionen. OCLC, das etwa ein Drittel seines Umsatzes mit dem Verkauf von anderen produzierter Katalogdaten macht, versuchte mit einer neuen Metadaten-Policy - unter Umgehung der Mitgliederbasis und der bibliothekarischen Gemeinschaft, die das Vorhaben schließlich zu Fall brachten -, sein Monopol auf die Katalogdaten der Mitgliedsbibliotheken juristisch zu zementieren. Organisationen wie EBSCO und Serials Solutions  versuchen mit ihren neuen Produkten EBSCO Discovery Service und Summon eine Menge Geld im Bereich Aggregierung und Verkauf von Metadaten und dazugehörigen Suchoberflächen zu verdienen.

Open Access: ja, Open Data: ja, Open Bibliographic Data: nein

Vor diesem Hintergrund ist es verwunderlich, dass die deutschsprachigen Bibliotheken und Bibliotheksverbünde sich bisher kaum mit neuen Nutzungsmöglichkeiten ihrer bibliographischen Daten auseinandergesetzt haben. Adrian Pohl stellte zwar am Ende seiner Dokumentation der OCLC-Metadaten-Kontroverse bereits u.a diese Frage für die deutschsprachige Bibliothekswelt:

"Wie stehen deutsche Bibliotheken im Allgemeinen zu einem Urheberrecht auf bibliografische Metadaten und zu einer Einschränkung des Zugangs auf diese Daten? Wie zum freien Zugang und zur kostenlosen Verbreitung von Metadaten?" (S.288)

Über Problemstellungen wurde aber bisher selten geredet und an die Öffnung und Verfügbarmachung der mit öffentlichen Mitteln produzierten bibliothekarischen Daten wird kaum ein Gedanke verschwendet. Zur gleichen Zeit wird die Bibliothekswelt nicht müde als ein wichtiger Pfeiler der Open-Access-Bewegung lautstark von anderen, nämlich Wissenschaftlern, die Freigabe ihrer Arbeitsprodukte, sowohl von Publikationen also auch von Rohdaten, zu fordern.

Es tut sich was...

Es sind aber erste Entwicklungen hin zur Freigabe bibliographischer Daten auszumachen: Im Strategieentwurf des Gemeinsamen Bibliotheksverbund (GBV) vom August dieses Jahres ist die Entwicklung einer Lizenz zur Freigabe der Verbunddaten festgehalten, auch das Hochschulbibliothekszentrum Nordrhein-Westfalen (hbz) unterstützt die Freigabe von Katalogdaten und Patrick Danowski hat - wie im Übertext berichtet - auf der Tagung "Semantic Web für Bibliotheken" angekündigt, dass die CERN Library ihre Daten öffnen werde. (Leider hat sich der angekündigte Termin auf Januar 2010 verschoben)

...aber: Zwei Open-Data-Vorträge abgelehnt

Dass das Thema - auch im Bibliothekswesen - an Bedeutung gewinnt, ist also klar. Dies zeigte sich auch daran, dass mindestens zwei Vortragsvorschläge dazu - von den Autoren und der Autorin dieses Beitrags - für den Bibliothekskongress 2010 eingereicht worden sind. (Die beiden Abstracts sind am Ende dieses Textes dokumentiert.) Leider entschied die Programmkommission (deren Zusammensetzung nicht transparent im Internet dokumentiert ist), dass dem Thema "Freie bibliographische Daten" auf dem Bibliothekskongress kein Forum geboten werde. Beide Vorträge wurden abgelehnt. Insgesamt ist das Auswahlverfahren für den Bibliothekartag wie Bibliothekskongress wenig transparent.

Nachdem die erwähnte Tagung "Semantic Web in Bibliotheken" vom hbz und der ZBW im November 2009 innerhalb von kürzester Zeit ausgebucht war, ist es umso bedauerlicher, dass dem offensichtlichen Interesse von Kolleginnen und Kollege an dieser Thematik in dem Leipziger Programm anscheinend nicht Rechnung getragen wurde. Bibliotheken haben mit Open Data die Chance, sich als Erzeugerinnen und Anbieterinnen von qualitativ hochwertigen, webfähigen Daten zu profilieren. BID Deutschland, die Bundesvereinigung Deutscher Bibliotheksverbände, als Veranstalterin des Leipziger Kongresses versäumt damit den eigenen Anspruch, "zeitgemäße Informationsdienstleistungen als Voraussetzung für die Entwicklung von international konkurrenzfähigen Produkten zur Verfügung zu stellen".

Gespannt erwarten wir das Programm, um zu sehen welche Themen BID Deutschland für wichtig und innovativ hält.


Dokumentation der eingereichten Abstracts:

Freie Metadaten
Referenten: Anne Christensen (SUB Hamburg), Adrian Pohl (hbz)

ABSTRACT
Open Source und Open Access sind mittlerweile im öffentlichen und bibliothekarischen Diskurs fest verankerte Begriffe. In den letzten Jahren wird zunehmend auch über Open Data diskutiert – seien die freien Daten, um die es dabei geht, wissenschaftliche, statistische, administrative Daten oder eben Metadaten.
Dieser Vortrag dient als Einführung in das Thema "Freie Metadaten" und beantwortet Fragen wie: Was heißt frei? Um welche Daten geht es? Warum sollen Daten frei sein? Behandelt werden der Hintergrund der Bestrebungen nach freien Metadaten, ihre Geschichte, die dahinterstehenden Motivationen und Ziele. Besondere Berücksichtigung findet dabei die Veröffentlichung von bibliografischen Daten und Normdaten als Open Linked Data.
Zudem werden Vorhaben zur Freisetzung der bibliografischen Metadaten im deutschsprachigen Raum betrachtet und es wird auf Fragen der Umsetzung eingegangen: Welche Lizenz soll ich wählen? Bin ich rechtlich befugt, alle Daten in meinem Katalog freizugeben? In welchem Format publiziere ich meine Daten?

Aus dem Silo ins Semantic Web: Bibliographische Daten als Linked Data Publizieren

P. Danowski

CERN Scientific Information Service, 1211 Geneve, Schweiz

Inhalt

Tim Barners Lee hat den Begriff Linked Data fuer eine Methode beschrieben mit der Daten veroeffentlich, geteilt und verbunden werden. Dabei sollen die Daten mit URL basirten Identifiern erreichbar sein und andere Daten im Netz referenzieren (verlinken).[1] Inzwischen wurde eine Vielzahl von Daten mit dieser Methode publiziert.[2]

Spaetestens seit dem letzten Jahr sind auch Bibliotheken auf dieses Thema aufmerksam geworden und beginnen ihrer Ressourcen in dieses Netz von Daten einzubringen. In dem Vortrag wird gezeigt, wie sich bibliographsche Daten als Linked Data publizieren lassen.

Dabei soll darauf eingegangen werden welche Frage zu klaeren sind. Dies sind unter anderen:

- Die Wahl einen Formats (einer Ontology)

- Lizenzfragen

- Vertrauensfragen

Der gesammten Prozess soll anhand eines Projekt fuer die Katalog Daten der CERN Library veranschaulicht werden. Es soll auch beschrieben werden welche Probleme in dem Prozess aufgekommen sind und welche Loesungsmoeglichten hierfür entdeckt wurden.

Quellenangaben

[1] vgl. auch http://en.wikipedia.org/wiki/Linked_data

[2] Zu der Menge der Daten gibt es ein klickbares Diagramm in dem die Verbindung der verschieden Ressources erkennbar ist. http://www4.wiwiss.fu-berlin.de/bizer/pub/lod-datasets_2009-07-14.html