2011-01-31

Linked Open Data vs. WorldCat, oder: Eine Alternative, die keine ist

Der Wissenschaftsrat hat heute einige Papiere veröffentlicht:
  • Empfehlungen zu wissenschaftlichen Sammlungen als Forschungsinfrastrukturen (Pressemitteilung, PDF)
  • Empfehlungen zu Forschungsinfrastrukturen in den Geistes- und Sozialwissenschaften (Pressemitteilung, PDF)
  • Übergreifende Empfehlungen zu Informationsinfrastrukturen (Pressemitteilung, PDF)
Bisher habe ich diese Papiere nicht genauer in Augenschein nehmen können. Ein viertes Papier Empfehlungen zur Zukunft des bibliothekarischen Verbundsystems in Deutschland steht auch noch aus und wird am 3. Februar nachgereicht (Update 3.2.2011: siehe hier). Wie es scheint, gibt diese zentrale Aussage in den Übergreifenden Empfehlungen zu Informationsinfrastrukturen (S. 54) aber schon einen Vorgeschmack auf das Papier:
"Die Integration von Katalogdaten in Metadatenbanken setzt international gültige Standards voraus. Im Bibliotheksbereich werden derzeit zwei verschiedene, nicht kompatible Ansätze praktiziert: die Zusammenführung von Katalogdaten in einer bibliographischen Datenbank, z. B. WorldCat, welche die Kataloge mehrerer tausend, auch deutscher OCLC-Mitgliedsbibliotheken umfasst, sowie die Bereitstellung von Katalogdaten in Form in das offene Web integrierter Linked Open Data. Der Wissenschaftsrat bekräftigt seine Empfehlung, dass die bibliothekarischen Verbünde im Interesse der Wissenschaft sowie ihrer eigenen Zukunftsfähigkeit rasch zu einer abgestimmten strategischen Entscheidung für einen der beiden Ansätze finden müssen. Dabei muss sicher gestellt werden, dass die Verfügbarkeit und Weiterentwicklung entsprechender Dienste nicht monopolisiert wird."
Zunächst einmal: Den impliziten Befund, dass OCLCs WorldCat und Linked Open Data inkompatibel sind, kann ich bestätigen, OCLC hat dies selbst unmissverständlich klar gemacht (siehe hier). Wie soll man diesen Abschnitt nun desweiteren interpretieren? Offensichtlich macht der Wissenschaftsrat hier erst eine vermeintliche Wahlmöglichkeit "WorldCat oder Linked Open Data"[1] auf und empfiehlt, dass die Bibliotheksverbünde sich gemeinsam entscheiden, in Zukunft ausschließlich auf eine dieser Lösungen zu setzen. Allerdings wird mit dem letzten Satz dieses Zitats die eine Möglichkeit (WorldCat) direkt wieder ausgeschlossen, denn: Es kann eigentlich niemand ernsthaft auf WorldCat setzen, der eine Monopolisierung von Diensten ausschließen möchte, die über bibliographische Daten angeboten werden. Jedenfalls nicht, wenn er die Entwicklungen der letzten Jahre verfolgt hat. (Siehe dazu etwa hier, hier und hier.)

In der dem Papier zugehörigen Pressemitteilung heißt es auch:
"Der Wissenschaftsrat empfiehlt ferner eine enge Vernetzung von Informationsinfra­strukturen mit der aktuellen Forschung." 
Diese Empfehlung kann ich nur unterstützen und gleichzeitig feststellen: Die bestmögliche Erleichterung der Integration bibliographischer Daten in wissenschaftliche Forschungsumgebungen ist eines der Argumente für Open Linked Data. Denn wenn bibliographische Daten und andere Informationen offen lizenziert und unter Nutzung allgemeiner Standards im Web publiziert sind, ist sichergestellt, dass sie naht- und problemlos in wissenschaftliche Forschungs- und Textproduktionsumgebungen integriert werden können und dass dieser Integration auch in Zukunft nichts im Weg steht.

Es scheint also, als sei Open Linked Data die einzige Möglichkeit, den Anforderungen des Wissenschaftsrats gerecht zu werden. Unter diesen Vorzeichen könnte man sich ja zurücklehnen und sich auf den Auf-/Umbau der zukünftigen deutschen Informationsinfrastruktur unter Anwendung von Linked-Open-Data-Standards freuen. Allerdings glaube ich nicht, dass man sich auf diese optimistische Einschätzung verlassen kann...


[1] Ich bin mir nicht sicher, wie klar der Begriff des Wissenschaftsrats von Linked Open Data ist. Ich richte mich hier wie anderswo nach der Open Definition und bezeichne allein jene Daten als offen, die mit einer offenen Lizenz im Sinne dieser Definition lizenziert sind, siehe auch das Linked Open Data star scheme by example.

Kommentare:

till hat gesagt…

Nur ein kurzer, spontaner Kommentar, bevor ich morgen doch wieder nicht antworte :-):
Ich sehe die strategische Entscheidung "WorldCat oder LOD" nicht, die da vielleicht unterstellt wird. Wäre ja schön, es gäbe eine Strategie, mit der könnte man sich dann auseinandersetzen...
LOD und WorldCat-Modell auf einer Ebene gegeneinander zu stellen, ist derzeit aber auch aus praktischen Gründen schwierig. Das WorldCat-Modell stellt ja eine ganze Menge Infrastruktur und Dienste zur Verfügung, die es so bei LOD noch nicht gibt (das Modell, denn die eigentlichen WorldCat-Dienste werden nach meinem Eindruck in Deutschland ja gar nicht so intensiv genutzt, wohl aber Dienste, die nach ähnlichem Modell funktionieren). Leider ist diese WorldCat-Infrastruktur (u.ä.) halt ein (rechtlich und technisch) recht geschlossenes, aber mehr oder weniger gut integriertes (je nachdem, welche Ebene man betrachtet) System. Und da passt die Bibliothekswelt mit ihren klassischen Ansätzen hervorragend hinein. Ist ja auch kein Wunder, OCLC ist gut integrierter Teil dieser Welt. Im Sinne einer effizienten Abwicklung des bisherigen Geschäfts könnte das manchem ja sogar als sinnvoll erscheinen. Ich sehe da den "Sieg" von LOD noch nicht...
LOD hingegen muss sich erstmal zur Infrastruktur entwickeln. Nein, falsch formuliert, da gibt es kein passives, anonymes Warten auf "sich entwickeln". Die die mitmachen, müssen es gemeinsam zu einer offenen Infrastruktur entwickeln (wie schon beim Web, das ist in der Bibliothekswelt aber ja auch noch nicht so richtig verstanden). Und da stellt sich dann vielleicht die Frage, wie das mit bestehenden, weitgehend an geschlossenen Modellen orientierten Strukturen funktionieren soll, ohne strukturelle Veränderungen (und da stellt sich natürlich die Frage nach Geschäftsmodellen). Dazu gibt es aber ja vielleicht am 3. Februar mehr...
Spannend. Dicke Bretter...
Gute Nacht erstmal...

Adrian Pohl hat gesagt…

Till, ich gebe dir völlig recht, dass die Entscheidung "WorldCat oder LOD" einen Kategorienfehler beinhaltet, dass hier Äpfel mit Birnen verglichen werden. Das eine ("WorldCat") bezeichnet eben eine schon bestehende Infrastruktur, das andere ("Linked Open Data") eine Menge von Technologien und ein Lizensierungsparadigma, auf deren Basis eine Infrastruktur aufgebaut wird.

Und von einem "Sieg" für LOD würde ich auch nicht sprechen, ganz im Gegenteil bringt ja der letzte Satz des Textes meine Skepsis zum Ausdruck. Ich sehe es genauso, dass der WorldCat eher die konsequente (und kurzfristig vielleicht auch "effizientere") Weiterführung der bisherigen Praxis bdeutet und LOD einen Bruch darstellt, der manchen mit zuviel Fragen und Unsicherheit verbunden sein mag.

CH hat gesagt…

@Till
Dass das Web als solches in Bibliothen noch nicht angekommen ist, ist natürlich tragisch. Darüber zu lamentieren hilft allerdings nicht. LOD im Bibliothekskontext zum Durchbruch zu verhelfen geht m.E. nur durch harte Kärrnerarbeit der LOD-Pioniere.

An meinem Beispiel: ich weiß, was LOD ist, was die Voraussetzungen sind und was wir als kleine Bibliothek machen können, um weiterzuhelfen. Was ich nicht weiß: wie würde ich als Anwender eigentlich konkret vorgehen, wenn ich diese Daten für eine eigene Anwendung nutzen möchte?

Ich hab's drüben bei Jakob kürzlich schon geschrieben: Wir (sprich: ich) benötigen Tools, die es Nicht-Nerds ermöglichen, LOD tatsächlich anzuwenden. Und zwar Tools, deren Einstiegshürden maximal bei der von Yahoo Pipes liegen. Vielleicht wäre ja auch ein Selbstlernkurs in der Art von Lernen 2.0 denkbar? Ich wäre erster und begeisterter Teilnehmer.

Bitte nicht falsch verstehen, ich will Euch persönlich da jetzt nichts aufdrücken. Wer das machen könnte, sei dahingestellt. KIM fällt mir da spontan ein. Aber ich halte ein praktisches(!) Verständnis der Materie für unabdingbar, wenn LOD in absehbarer Zeit ein bibliothekarisches Thema werden soll.

Felix hat gesagt…

@CH
Du schreibst: "wie würde ich als Anwender eigentlich konkret vorgehen, wenn ich diese Daten für eine eigene Anwendung nutzen möchte?" und: "Wir (sprich: ich) benötigen Tools, die es Nicht-Nerds ermöglichen, LOD tatsächlich anzuwenden."

Ich verstehe diesen Einwand - wenn es denn einer ist - nicht ganz. Ebenso wenig, wie MARC, XML oder JSON von "Nicht-Nerds" verstanden wird oder verstanden werden muss, müssen LOD Standards wie RDF vom "Anwender" verstanden werden. Natürlich ist ein Tool wie Yahoo Pipes für einfache Zwecke auch für LOD wünschenswert, aber ich bezweifele, dass die Implementierung komplexerer Infrastruktur damit möglich ist.

LOD ist, wie Till bereits anmerkte, an sich keine konkrete Infrastruktur, sondern kann eben nur die Basis für eine solche bilden. Und Infrastruktur wird selten von Nicht-Nerds aufgebaut (und dass man kein Über-Geek sein muss, um RDF-Daten zu verarbeiten, habe ich hier versucht herauszustellen).

CH hat gesagt…

Es geht mir nicht darum, dass Otto-Normal-Bibliothekar "komplexe Infrastrukturen" errichtet. Also nicht darum, dass ich die vom Wissenschaftsrat angedachten Metadateninfrastrukturen für die Wissenschaftslandschaft am heimischen Schreibtisch nachbauen kann. Ziel ist einfaches Verstehen der Möglichkeiten. Ich kann mich nicht für etwas einsetzen, das ich nicht verstehe. Und wie mir geht es vermutlich vielen, den meisten Bibliothekaren.

Daher ist ein Tool à la Yahoo Pipes m.E. zwingend erforderlich. Abgesehen davon werden dann vielleicht Anwendungen für LOD möglich, an den die LOD-Pioniere nicht denken. Und gerade da wird es doch spannend. Es ist für die erwähnten NIcht-Nerds vielleicht nicht zwingend erforderlich, RDF bis ins letzte Detail zu verstehen. Anders herum bleibt RDF jedoch vermutlich eine Nerd-Spielerei, wenn sich nicht halbwegs massentaugliche Anwendungsmöglichkeiten finden.

Daher vielen Dank für das Posting zur RDF-Bearbeitung. Das werde ich mir bei nächster Gelegenheit mal ansehen und ein wenig herumspielen.

Felix hat gesagt…

@CH

Ich verstehe, Du meinst mit "Anwender" einen "Otto-Normal-Bibliothekar", das war mir nicht ganz klar. Dazu muss ich allerdings anmerken: "Nicht-Nerds" sind das in meinen Augen auch nicht unbedingt. Ich habe den Eindruck, dass es durchaus einige Entwickler gibt, die erst durch LOD in Berührung mit bibliographischen Daten jenseits von Amazon und Co. gekommen sind, und die - um es positiv auszudrücken - von der wundersamen Bibliotheksinsel, auf der sich MARC und andere Jahrtausende alte exotische Kreaturen wie Z39.50 tummeln, fasziniert sind.

Standardisierung - rechtliche wie technische - ist ein, wenn nicht der Faktor, der in meinen Augen für LOD spricht. Standardisierung ist jedoch eine sehr soziale Frage, und je mehr Impulse aus verschiedenen Bereichen in diese Richtung gehen, desto größer wird die Vielfalt an verfügbaren Daten und Werkzeugen. Ich will gar nicht behaupten, dass der Erfolg von LOD bereits als sicher angenommen werden kann (und erst recht nicht, dass mit LOD alle Probleme ein für allemal gelöst sind). Aber ich halte es nicht für unwahrscheinlich, dass eine solche Standardisierung Kräfte freisetzen kann, die zukünftig eben in die Entwicklung innovativer Anwendungen fließen können - auch, wenn in der Übergangsphase zunächst zusätzliche Kräfte benötigt werden.

Ich gebe Dir absolut recht: hoffentlich werden "Anwendungen für LOD möglich, an den[sic!] die LOD-Pioniere nicht denken". Ebenso hoffe ich aber, dass Anwendungen für bibliographische Daten möglich werden, an die die Bibliothekswelt bislang noch nicht gedacht hat. Das spannende an LOD ist doch unter anderem, dass es eine domänenübergreifende Datenintegration ermöglicht. Und diese sehe ich im WorldCat-Szenario eher nicht.

CH hat gesagt…

Nicht nur Otto-Normal-Bibliothekar, auch Otto-Normal-So-Ganz-Allgemein. Seien es nun Wissenschaftler, Journalisten, aber auch Schüler oder sonstwer. Die Daten sind vorhanden, man kann sie miteinander verknüpfen und gar wundervolle Dinge mit ihnen anstellen. Nur ist bislang mehr oder weniger spezielles Expertenwissen notwendig.

Daher ist unsere Hoffnung die selbe: "Ebenso hoffe ich aber, dass Anwendungen für bibliographische Daten möglich werden, an die die Bibliothekswelt bislang noch nicht gedacht hat."

Woher soll ich als Bibliothekar wissen, was meine Nutzer wirklich wollen? Es wäre anmaßend, dies Wissen für mich zu reklamieren. Daher bin ich ja so sehr für eine Vereinfachung der Instrumente, um möglichst vielen Nutzungsszenarien zugänglich zu machen.

Zur Einschätzung des WorldCat als Sackgasse der Datenintegration sind sich ja vermutlich alle einig. Der von Adrian zitierte Satz zur Vermeidung von Monopolisierung deutet m.E. auch mehr als deutlich darauf hin, dass der Wissenschaftsrat dies ebenso sieht.

till hat gesagt…

Tja, die DFG schreibt nun "Hier wäre der WorldCat mit einer bereits weit fortgeschrittenen Abdeckung deutscher Daten (trotz aller berechtigten Kritik an der derzeitigen Umsetzung) ebenso zu prüfen wie andere kurzfristig verfügbare Verfahren." (S. 9 in http://www.dfg.de/download/pdf/foerderung/programme/lis/positionspapier_bibliotheksverbuende.pdf).
(es geht um die Überwindung der bisherigen Grenzen der Verbundsysteme durch einen großen "Datenpool").

Adrian Pohl hat gesagt…

@Till Mir scheint allerdings der Fokus des DFG-Papiers ein anderer zu sein als der des Wissenschaftsrats. Wenn ich das richtig sehe möchte der WR bis 2012 eine Strategie haben, die bis 2020 umgesetzt werden soll, was für mich eine mittel- bis langfristige Strategie ist, während das DFG-Papier von der einer "kurzfristigen" und "schnellstmöglichen" Lösung spricht. Es heißt ja unmittelbar vor der von dir zitiertem Stelle:

"Es sollte kurzfristig geprüft werden, auf welcher datentechnischen Plattform die Datenzusammenführung schnellstmöglich gegebenenfalls unter Verzicht auf nationale Regelwerke und Datenformate beziehungsweise durch eine Vereinfachung von Datenmodellen zu realisieren ist."

Dass bei einem solchen Anspruch WorldCat der aussichtsreichste Kandidat ist, ist klar...

Kommentar veröffentlichen