2016-05-22

Machbarkeitsstudie zum Aufbau einer OER-Infrastruktur

Seit 2012 bin ich im Bereich Open Educational Resources (OER) aktiv, wobei mein Fokus zunächst auf Metadatenschemata und kontrollierten Vokabularen lag. Seit 2014 beschränken sich meine OER-Aktivitäten weitestgehend auf die Mitarbeit bei der Entwicklung der OER World Map. Die OER World Map ist eine Plattorm, auf der OER-Aktive aus der ganzen Welt Informationen für und über die globale OER-Community sammeln. Erfasst werden Daten über OER-Akteure und -Projekte, über Veranstaltungen und Onlineangebote im Bereich OER. Neben meiner Zuständigkeit für die Datenmodellierung übernehme ich im OER-World-Map-Team auch Aufgaben eines Product Owners.

Etwas länger noch befasse ich mich immer wieder mit der Weiterentwicklung der überregionalen Informationsinfrastruktur in Deutschland. 2011 habe ich etwa die Intransparenz des Neustrukturierungsprozesses beklagt, den der Wissenschaftsrat begonnen hatte, um ihn gemeinsam mit der Deutschen Forschungsgemeinschaft (DFG) weiterzuführen. 2012 habe ich selbst an einem DFG-Antrag (libOS) zum Thema mitgeschrieben und den letztlich erfolgreichen Antrag 2013 einer kritischen Analyse unterzogen.

In Anbetracht dieser Aktivitäten überrascht es nicht, dass ich sehr am Prozess und Ergebnis der Entwicklung einer überregionalen technischen Infrastruktur für OER im deutschsprachigen Raum interessiert bin, fließen darin doch gewissermaßen zwei meiner Interessengebiete zusammen. Da einige Entwicklungen im Hinblick auf die zukünftige OER-Infrastruktur stattgefunden haben, wird es Zeit, eine Zwischenbilanz zu ziehen.

Im letzten Jahr wurde das Deutsche Institut für Internationale Pädagogische Forschung (DIPF) vom Bundesministerium für Bildung und Forschung (BMBF) beauftragt eine Machbarkeitsstudie zum Aufbau einer OER-Infrastruktur in Deutschland zu erstellen. Neben einer Literaturanalyse wurden für die Studie Experteninterviews sowie Workshops durchgeführt. Am 10. Februar hat das DIPF das Ergebnis veröffentlicht, das hier einer näheren Betrachtung unterzogen wird.

Ich gehöre zu den für die Studie interviewten Personen, habe an einem der Workshops teilgenommen habe und Rückmeldungen zu einem Entwurf der Studie gegeben. Außerdem habe ich auf dem OER-Fachforum am 1. März 2016 in Berlin an einem "Thementisch" mit den Machern des Papiers und anderen Personen darüber diskutiert. Somit werden meine inhaltlichen Anmerkungen die Verfasser der Studie kaum überraschen. Alle Seitenangaben beziehen sich auf Deutscher Bildungsserver: Machbarkeitsstudie zum Aufbau und Betrieb von OER-Infrastrukturen in der Bildung (Stand: Februar 2016). 2016, 66 S. - URN: urn:nbn:de:0111-pedocs-117154.

Der Auftrag

Die Studie ist im Auftrag des Bundesministerium für Bildung und Forschung (BMBF) entstanden. Die Leistungsbeschreibung bzw. Auftragstexte sind zwar nicht bekannt und wurden – laut Christian Füller – auch auf Nachfrage nicht vom Ministerium herausgegeben. Allerdings gibt der Text der Studie selbst einigen Aufschluss. Ganz offensichtlich möchte das BMBF in OER investieren. So sei die Studie dadurch motiviert, "Bedarf, Voraussetzungen und Zielrichtungen einer öffentlichen Förderung freier Bildungsmaterialien" (S.5) zu konkretisieren. Die Aufgabe lautet, "Bedingungen und Erfordernisse für Aufbau und Betrieb einer OER‐Infrastruktur im Internet" zu untersuchen "im Dialog mit Expertinnen und Experten aus Bildungspraxis, Bildungsadministration und Wissenschaft, mit Akteuren der OER‐Bewegung sowie mit Medienproduzenten und ‐anbietern" (S.5).

Es geht also um "Infrastruktur". Das ist das, was idealerweise unsichtbar ist, was erst bemerkt wird, wenn es nicht funktioniert (wie z.B. die Stromversorgung, das DSL-Netz, OSI-Protokolle oder Zeichenkodierungen). Im Falle einer Dateninfrastruktur geht es um Daten, um Protokolle und Schnittstellen, um Software etc.

Ergebnisse/Empfehlungen der Studie

Im Folgenden werde ich nun sechs zentrale Empfehlungen des DIPF-Machbarkeitspapiers näher betrachten.

Absage an ein länderübergreifendes OER-Portal

Auf S.4 heißt es: "Aufbau und Betrieb einer zentralen Infrastruktur, im Sinne eines einzelnen Repositoriums bzw. Referatoriums, für OER über alle Bildungsbereiche hinweg stellen keine realistische Option dar". Ich bin sehr froh, dass dies so deutlich ausgesagt wird, findet sich doch noch im Bericht der OER-Arbeitsgruppe, der der Machbarkeitsstudie als "Orientierungsrahmen" diente, eine Empfehlung zum "Aufbau einer neuen bzw. die Unterstützung bereits bestehender länderübergreifender Plattformen im Internet" (Bericht der OER-Arbeitsgruppe, S.8).

Aus meiner Erfahrung neigt die Politik bisher gerne dazu, zentrale "Portale" zu fördern (z.B. vascoda, Europeana, Deutsche Digitale Bibliothek). Problematisch ist dies, weil meist die Ressourcen auf Ebene der Dienste fehlen, die eigentlich die Inhalte bereitstellen und dass ein enormer Aufwand betrieben werden muss, um die Metadaten einzusammeln und in eine einheitliche Struktur zu bekommen. Dazu kommen die Hemmnisse, die die föderale Struktur Deutschlands mit sich bringt. (Fördert man dagegen die Anwendung geteilter Standards und Schnittstellen bei den verschiedenen Diensten ist am Ende der Aufbau eines übergreifenden Rechercheangebots weniger aufwändig.)

Statt eines zentralen Angebots befürwortet die Studie die "Vernetzung bestehender (Teil-))Infrastrukturen", wozu als zentrale Komponente der Aufbau eines "Metadaten-Austausch-Services" (MDAS)(S.4) empfohlen wird. Hier schleicht sich also unter Umständen doch eine länderübergreifende Infrastrukturkomponente hinein. Ich werde dies weiter unten genauer betrachten.

Förderung von Repositorien und Nachweissystemen

Die erste der auf S.4 genannten "zentralen Empfehlungen" lautet:

Fördermaßnahmen sollten Anreize für den Aufbau bzw. die Vernetzung von Repositorien und Nachweissystemen in bislang wenig OER‐aktiven Handlungsfeldern schaffen (z.B. berufliche Bildung, Erwachsenenbildung).

Es wird also empfohlen, fach- oder bildungsbereichspezifische Systeme aufzubauen

  1. für die Publikation von OER und sie beschreibender strukturierter Metadaten im Web (Repositorien) sowie
  2. für die Rechereche nach OER (läuft unter dem relativ neuen, aus dem OER-Bereich kommenden Terminus "Referatorium" )

Förderung des Aufbaus digitaler Materialbestände

Die größere Herausforderung als der Aufbau einer technischen Infrastruktur ist die Entwicklung einer OER-Kultur. Damit meine ich, dass OER-Inhalte in der Breite von Lehrenden und Lernenden produziert, gepflegt, geremixt und in vielfältigen Bildungskontexten genutzt werden. Diese Frage, wo die Inhalte letztlich herkommen, wer sie erstellt und pflegt, ist nicht unbedingt von einem Infrastrukturpapier zu beantworten – es geht ja nicht um social enginieering. Dennoch nimmt die zweite "zentrale Empfehlung" darauf Bezug:

Empfohlen wird der Aufbau von digitalen Materialbeständen i.S.v. Referenzsystemen für OER zu pädagogisch oder bildungspolitisch besonders relevanten Themen (z.B. Inklusion, frühe Bildung, Alphabetisierung).

Wie dies genau umgesetzt werden soll, wird allerdings nicht näher erläutert. Die schwierige und grundlegende Frage, wie ein Wachstum von OER-Produktion und -Nutzung angeregt und die Entstehung einer nachhaltigen OER-Community gefördert werden kann, soll allerdings im die DIPF-Studie flankierenden, auch vom BMBF geförderten Projekt Mapping OER adressiert werden.

Interoperable Metadaten und Metadaten-Austausch-Service

Die dritte "zentrale Empfehlung" lautet wie folgt:

Bestehende OER‐Plattformen sollten um systematische Zugänge, Zugangsvokabulare für unterschiedliche Fächer und Arbeitsinstrumente ergänzt werden, die die Adaption der Materialien in anderen Bildungskontexten unterstützen. Fördermaßnahmen sollten an die Bereitstellung technischer Schnittstellen und interoperabler Metadaten geknüpft werden, welche für die Realisierung eines Metadaten‐Austausch‐Services (s.u.) notwendig sind.

Diese Forderungen lassen die Herzen von Bibliothekarinnen und Bibliothekaren höher schlagen, wird doch für die Inhaltserschließung die Nutzung geteilter kontrollierter Vokabulare und Klassifikationen (Normdaten) gefordert sowie die Bereitstellung von Schnittstellen zum Einsammeln der damit entstehenden Daten.

Was es aber mit dem Metadaten-Austausch-Service genau auf sich hat und welche Aufgabe er erfüllt bleibt unklar. In der Studie wird er als "zentraler", "aggregierender" "Hintergrunddienst" charakterisiert, der folgende Aufgaben übernimmt:

  • Er sammelt die Metadaten aus den deutschen OER-Referatorien regelmäßig ein (Aggregation).
  • Die verschiedenen Metadaten werden in eine gemeinsame Zielstruktur überführt (Normalisierung) und ggf. automatisch angereichert.
  • Der so entstehende übergreifende Metadatenpool wird zum Download und über Schnittstellen angeboten.

Es ist etwas verwunderlich, dass zum einen von einem zentralen OER-Referatorium abgeraten wird und zum anderen mit dem MDAS ein Service empfohlen wird, der anscheinend eine Menge der nötigen Vorarbeiten für ein solches zentrales Portal leistet.

Einige Skepsis im Hinblick auf die Notwendigkeit sowie leichte Umsetzbarkeit und Pflege des MDAS ist sicher angebracht. Allerdings adressiert das Design des MDAS zumindest eine wichtige Frage einer jeden Dateninfrastruktur, die auch mit nutzergenerierten Daten zu tun hat: Wie bekomme ich Menschen dazu in einer verteilten Infrastruktur kleiner Services, Ressourcen zu taggen und zu bewerten? Prinzipiell ist es überhaupt schwierig eine kritische Masse von Menschen aufzubauen, die Tags und Bewertungen vergeben, wenn man nicht schon eine so große Nutzerschaft wie etwa Amazon hat. Im Bibliotheksbereich ist der Katalog-2.0-Hype zumindest in Bezug auf nutzergenerierte Inhalte nach einigen Jahren vergangen, weil innerhalb der Nutzerschaft eines Bibliothekskatalog eben keine kritische Masse hergestellt werden kann. Bessere Chancen bestehen, wenn die nutzergenerierten Inhalte zwischen verschiedenen Katalogen/Referatorien augetauscht werden. So tauchen dieselben Daten überall auf, wo eine Ressource recherchierbar ist und die Chance, dass Nutzer/innen Lust bekommen, selbst zu taggen oder kommentieren, wird größer. Siehe auch einen Blogpost von 2012, in dem ich gewissermaßen mit der Idee eines Metadaten-Austausch-Service für moderne Bibliothekskataloge gespielt habe.

Auch wenn der MDAS also durchaus ein sinnvolles Ziel verfolgt, bin ich mir nicht sicher, ob dazu wirklich ein zentraler Dienst notwendig ist. Mir scheint als wären die Verfasser/innen am DIPF hier stark von ihren Erfahrungen im Rahmen der vom DIPF betriebenen Suchmaschine ELIXIER beeinflusst. ELIXIER stellt auch einen zentrale Datenaggregationsdienst dar. In der Beschreibung der ELIXIER-Historie heißt es:

ELIXIER – was übrigens für "Elaborated Lists in XML for Internet Educational Ressources" steht – startete im Mai 2007 mit dem Ziel, eine standardisierte Schnittstelle für den Austausch von Metadaten zwischen den deutschen Bildungsservern zu entwickeln und damit einen gemeinsamen Ressourcenpool für Lehr-/Lernmaterialien – insbesondere für den Schulunterricht – bereit zu stellen.

Meines Erachtens sollten auch Möglichkeiten genauer betrachtet werden, auf einen zentralen Mittler wie den MDAS zu verzichten und die Daten direkt zwischen den einzelnen Services auszutauschen.

Freie Software als Voraussetzung einer Förderung

Die DIPF-Machbarkeitsstudie empfiehlt als Voraussetzung der Förderung – neben strukturierten Metadaten und technischer Schnittstellen zum Datenaustausch –, dass neue Softwaresysteme als freie Software entwickelt werden sollten. So heißt es auf den Seiten 58 und 62: "Die Förderung [von Repositorien und Referatorien, A.P.] sollte gebunden sein an die Entwicklung der betreffenden Systeme als Open‐Source‐Produkt , um eine Nachnutzung für andere Einrichtungen zu gewährleisten." Diesen Punkt darf man meines Erachtens nicht unterschätzen. Dadurch werden – im Falle eines Erfolgs von OER und der entwickelten Open-Source-Systeme – Abhängigkeiten von kommerziellen Anbietern proprietärer Systeme verhindert.

Transparente Koordination & Kommunikation

Als ein wünschenswertes Ziel nennt die Studie "eine kontinuierliche Abstimmung" der einzelnen, an der OER‐Infrastruktur beteiligten Dienste. "Die Realisierung koordinierter Kommunikationsprozesse und konsensfähiger Workflows ist als zentrales Kriterium für den erfolgreichen Aufbau einer nachhaltig funktionsfähigen ... Infrastrukturbildung zu betrachten". (S.65)

Mit anderen Worten, die beteiligten Akteure sollen sich beim Aufbau der Infrastruktur austauschen, damit eine einheitliche Praxis bei der Er- und Bereitstellung der Daten entstehen möge.

Das Papier schlägt zu diesem Zweck vor, drei Gremien einzurichten:

  1. eine Koordinierungsstelle. die "interoperable Strukturen und Workflows zwischen den beteiligten Anbietern" entwickelt, "um die Interaktion der unterschiedlichen Repositorien, Referatorien und eines zentralen Hintergrunddienstes zu koordinieren",
  2. ein OER-Beirat soll die Koordinierungsstelle fachlich unterstützen, indem "Vertreter/inne/n aller Bildungsbereiche" Metadatenstandards und Schnittstellen abstimmen sowie
  3. ein Runder Tisch, der ein "regelmäßiges offenes Diskussionsforum" darstelle, in dessen Rahmen "auf der Basis z.B. von Arbeitsgruppen oder Workshops innovative Vorhaben zur Weiterentwicklung OER‐förderlicher Infrastrukturen konzipiert".

Wenn ich das richtig verstehe soll die Koordinierungsstelle mit fachlicher Unterstützung des OER-Beirats die technischen Vorgaben der OER-Infrastruktur spezifizieren, deren Anpassung und Weiterentwicklung am "Runden Tisch" diskutiert wird. Ich halte es für etwas verfrüht, für den Austausch direkt drei formale Gremien vorzuschlagen, weil man erst einmal schauen sollte, wieviele und welche Akteure sich überhaupt beteiligen. Zudem halte ich andere Punkte im Kontext der kooperativen Entwicklung einer gemeinsamen Praxis – die ich in einem gesonderten Beitrag aufzählen werde – für viel wichtiger.

Fazit

Zwar wird der Entstehungsprozess der Studie zurecht kritisiert. Diese Kritik sollte auch ernstgenommen und es sollte daraus gelernt werden. Dennoch scheint mir das ziemlich gut zu laufen im Vergleich zu Prozessen der Planung, Förderung und Entwicklung von Dateninfrastrukturen in anderen Bereichen.

Insgesamt stimmt mich der Inhalt der Studie weiterhin sehr optimistisch, was den Aufbau der OER-Infrastruktur angeht. Insbesondere folgende Punkte sind hervorzuheben:

  • die Absage an ein länderübergreifendes OER-Portal,
  • die Empfehlung, Förderung an die Nutzung und Entwicklung von freier Software zu binden,
  • die Tatsache, dass viele Überlegungen gemacht werden – und das nicht erst seit dieser Studie – hinsichtlich Metadatenschemata, geteilten Klassifikations- und Verschlagwortungssystemen und Schnittstellen, die die einfache Zusammenführung verteilt vorliegender Metadaten sicherzustellen, mit dem Ziel das Auffinden relevanter OER zu verbessern.

Man darf gespannt sein, wie sich der weitere Prozess gestaltet.

2016-02-23

Werbung & Lobbying mit Open Educational Resources

Bei der Recherche für einen anderen Blogpost bin ich auf das Whitepaper “Unternehmensfinanzierte Open Educational Resources (OER) an Schulen” gestoßen, das vor kurzem von YAEZ – einer auf “Corporate Publishing für junge Zielgruppen” spezialisierten Agentur – publiziert wurde. YAEZ hat beispielsweise in der Vergangenheit – kostenlose aber (noch) nicht offen lizenzierte – Unterrichtsmaterialien zum Thema “Vernetzte Mobilität – Die digitale Revolution auf Rädern” erstellt, bezahlt von der Initiative “Unsere Autos” des Verbands der Automobilindustrie (VDA). [1]

Das Whitepaper wird auf den YAEZ-Seiten auch unter dem Titel “Erfolgsfaktoren für OER in der Bildungskommunikation” beworben. Hier einige der im Whitepaper genannten Vorteile für Unternehmen, die eine Publikation von OER brächten: “Image verbessern”, “Bekanntheit steigern”, “Inhalte beeinflussen”, “positives Bild vermitteln”, “Kunden gewinnen”, “Gewinn steigern”, “Gewinnung von qualifizierten und geeigneten Auszubildenden”.

Seit langem schon betrachten Unternehmen die Schulen als wichtiges Ziel von Lobbying und Werbung, und das Angebot und die Nutzung durch Unternehmen bereitgestellter Unterrichtsmaterialien nimmt stetig zu, wie etwa gerade ein Beitrag in der letzten Heute Show aufzeigt (siehe auch die dazugehörige “Fakten”-Seite mit weiterführenden Links). Von Unternehmen finanzierte offen lizenzierte Unterrichtsmaterialien sind allerdings bisher noch selten. Wenn die Zahl der Unternehmens-OER aber so rapide wächst wie jene der nicht-offenen (aber kostenlosen) Unterrichtsmaterialien, dann werden die bisher hauptsächlich durch Lernende, Lehrende und öffentliche Bildungseinrichtugen erstellten und gepflegten Open Educational Resources bald Konkurrenz bekommen.

[1] Angeblich platziert YAEZ seine Produkte auch auf lehrer-online, ich habe allerdings auf Anhieb die VDA-Materialien oder andere von YAEZ genannte Beispielmaterialien dort nicht finden können.

2015-12-08

Does GND define authoritative headings?

I already wrote about authority files. In that post I said about Integrated Authority File (GND) which is "operated cooperatively by the German National Library, all German-speaking library networks, the German Union Catalogue of Serials (ZDB) and numerous other institutions" (source):

In the Integrated Authority File a numeric ID (GND ID) is used to identify an authority record. Likewise, each bibliographic record that references this authority record uses the GND ID.

Furthermore, I would even say that this ID is kind of the authoritative "heading" that enables searching for resources about Princess Diana in every data base that uses GND. But a heading in the sense of an authoritative string that all GND users use to refer to Princess Diana does not exist.

On the verge of an edit war ;-)

In December 2013 I had already edited the Wikipedia entry on "Authority Control" to reflect this practice (Edit 1).

Wikipedia user Gymel (Thomas Berger) doesn't agree as you can see by his reverts of my changes (Edit 2, Edit 4 after I put the GND ID back in Edit 3). As this topic can hardly be discussed in Wikipedia commit messages I am writing this post to provide some evidence for my thinking in the hope that the Wikipedia entry will be corrected (once again) soon.

What are "headings", anyway?

Wikipedia says:

In library science, authority control is a process that organizes library catalog and bibliographic information by using a single, distinct name for each topic. The word authority in authority control derives from the idea that the names of people, places, things, and concepts are authorized, i.e., they are established in one particular form. These one-of-a-kind headings are applied consistently throughout the catalog, and work with other organizing data such as linkages and cross references.

In short, headings are authorized names that

  1. are applied consistently throughout the catalog and
  2. are used for linkages and cross references.

With regard to GND (and many other authority files), one would have to adjust point 1: As there is no one catalog GND is maintained for, it should rather read "applied consistently throughout catalogs". Accordingly, below I will have a look at many catalogs from different GND users to see whether there is consensus on one authoritative heading across these different catalogs.

With regard to Geman-speaking cataloging practice, I argue that

  1. no authoritative name strings exist that are applied across catalogs of all GND users, but authoritative strings may only exist within a single catalog
  2. linkages and cross references are exclusively managed by using the GND ID and not a string.

Evidence

Below I am providing some evidence for the two points I made above.
Usage of different headings for presentation purposes

Taking our example Princess Diana (GND ID 118525123), I looked at several data sources to see which heading they use. Interestingly, you just have to look at different representations of the authority record from the German National Library (DNB) alone and will already find different headings in use:

The DNB-OPAC uses Diana, Wales, Prinzessin. We might think that this is the authoritative string. The GND RDF provided by DNB using the GND ontology defines both a "preferred name entity" and a "preferred name". We can already find a differrence here – at least in punctuation:


<http://d-nb.info/gnd/118525123>
        gndo:preferredNameEntityForThePerson [
            gndo:epithetGenericNameTitleOrTerritory "Wales, Prinzessin"^^<http://www.w3.org/2001/XMLSchema#string> ;
            gndo:personalName "Diana"^^<http://www.w3.org/2001/XMLSchema#string>
        ] ;
    gndo:preferredNameForThePerson "Diana <Wales, Prinzessin>"^^<http://www.w3.org/2001/XMLSchema#string> .

Taking a look at the DNB-MARC, we can see that birth and death date sneak into the heading (I may be wrong here as I am not very familiar with MARC, really):


        <datafield tag="100" ind1="0" ind2=" ">
            <subfield code="a">Diana</subfield>
            <subfield code="c">Wales, Prinzessin</subfield>
            <subfield code="d">1961-1997</subfield>
        </datafield>

We will also find headings for Princess Diana (GND ID 118525123) that include birth and death dates in data bases of other GND maintainers:

hbz union catalogue: Diana, Wales, Prinzessin, 1961-1997"

GBV union catalogue: Diana <Wales, Prinzessin> *1961-1997*

SWB union catalogue actually has two different headings: Diana, Wales, Prinzessin [1961-1997] and recorded as "Ansetzung Landesarchiv BW": Wales, Diana; Prinzessin; 1961 - 1997 | 118525123

Kalliope (for example this record): Diana <Wales, Princess> (1961-1997)

At last we have two entries that follow the different punctuation versions of the DNB.

HeBIS (e.g. this record): Diana, Wales, Prinzessin

BVB: Diana <Wales, Prinzessin>

Usage of GND IDs for linking

This should be clear to everyone that name strings aren't used for linking to GND entries. As example, I only point to the wide-spread practice of creating beacon files to point to ones catalogued resources on the basis of GND IDs: https://de.wikipedia.org/wiki/Wikipedia:BEACON.

tl;dr

The Integrated Authority File (GND), operated cooperatively by a large group of libraries and library service centers in German-speaking countries, does not define authoritative name strings (= headings) to be used across the different catalogs of GND users.

2015-10-26

Bibliotheksbärendienst, die Dritte

Eigentlich wollte ich doch bereits mit dem vorletzten Beitrag mein Soll für dieses Jahr erfüllt haben. Mindestens ein weiterer Beitrag ist aber offensichtlich noch nötig...

Was lief

Nach meinem Beitrag vom Mittwochabend bekam ich Freitagmorgen eine E-Mail von der Person, deren E-Mail ich in meinem Blog zitiert hatte, mit einer unbegründeten Aufforderung, die Angaben aus Ihrer Nachricht und ihren Namen umgehend von meinem Blog zu löschen. Da mir so etwas bisher nicht passiert ist, versetzte mich die Sache in ganz schöne Aufregung. Ein befreundeter Jurist und ich versuchten in kurzer Zeit, die rechtliche Lage einzuschätzen, insbesondere lasen wir auch diesen Text von Thomas Stadler, der im folgenden noch desöfteren genannt werden sollte.

Auch wenn wir beide die Lage so einschätzten, dass mein Zitat höchstwahrscheinlich keine rechtlichen Folgen haben könnte, empfahl mein Freund mir, es vorerst aus dem Blog zu nehmen. Schließlich sei die Sache nicht sicher, so "beispielsweise das Landgericht Köln regelmäßig auch die Veröffentlichung von Briefen, die berufliche oder geschäftliche Fragen betreffen, für unzulässig hält" wie es in dem genannten Text heißt. Ich ersetzte den Text durch eine Anmerkung, dass ich zur Löschung aufgefordert worden war und informierte De Gruyter. Meine Reaktion lässt sich zum einen damit erklären, dass mir schlicht die Gelassenheit und Standhaftigkeit für einen souveränen Umgang mit der Sache gefehlt haben. Zum anderen war es mir aber mittlerweile auch unangenehm, den Absendernamen genannt zu haben. Klaus Graf hatte zwar bereits auch einen Beitrag zu der Sache veröffentlicht, so dass also die Sache ohnehin nicht mehr rückgängig zu machen war – allerdings ohne den Namen zu nennen.

Die Sache ließ mir aber nach der Löschung keine Ruhe und ich war schnell unzufrieden, der Aufforderung ohne Notwendigkeit nachgekommen zu sein. Ich schrieb eine weitere E-Mail an De Gruyter, in der ich darstellte, dass die derzeitige Lage für keinen zufriedenstellend sei. Mit Verweis auf den Stadler-Text wies ich auf die Rechtmäßigkeit meines Vorgehens hin und schlug vor, das Zitat ohne Nennung des Absenders wieder in den Beitrag aufzunehmen. Auch wies ich De Gruyter darauf hin, dass sie am Streisand-Effekt kein Interesse haben dürften. Die nächste De-Gruyter-Antwort kam dann von der nächsthöheren Hierarchieebene in einem deutlich gelasseneren Ton. Es hieß nun, De Gruyter habe sich von Anfang nicht an der Wiedergabe der Verlagsposition in meinem Blogbeitrag gestört, sondern lediglich an dem direkten Zitat aus einer Geschäftsmail. Eine Paraphrase des Mail-Inhalts wäre nie als ein Problem angesehen worden. Bisher – so teilte ich De Gruyter daraufhin mit – habe sich die Sache für ich ganz anders angehört, schließlich lautete der Betreff der ersten E-Mail "Aufforderung zum Löschen" und nicht "Aufforderung zum Paraphrasieren". Was da bei De Gruyter wirklich ablief, kann ist jede/r eingeladen, sich selbst auszumalen.

Offensichtlich hatten sie auch eine Löschaufforderung an Klaus Graf geschrieben, der dies sofort auf Inetbib publik machte. Ich aber wollte die Sache hinter mich bringen und entschied mich zum zweiten, aktuellen Update des Blogposts inklusive Paraphrase der E-Mail. So weist der Text zumindest keine Lücke mehr auf und lädt zur Diskussion des eigentlichen Sachverhalts ein. Ich twitterte das Update und sendete eine Mail an Inetbib.

Was kam

Im folgenden haben sich Klaus Graf – der zunächst zur Solidarität mit mir aufgerufen hatte – und Dietrich Pannier zur Löschung kritisch geäußert und auch Eric Steinhauer wies mich auf Twitter darauf hin, dass ich das Recht auf meiner Seite habe und es sich lediglich um "Stilfragen" handele.

Klaus Graf hat sogar einen Überblick über die Rechtsprechung und Literatur zum Thema erstellt und kommt zu dem Schluss:

Grundsätzlich ist bei der Veröffentlichung fremder E-Mails trotzdem Vorsicht geboten. Aber bei harmlosen Fällen wie der Causa De Gruyter sind übermäßige Ängste nicht am Platz. Eindeutig war die Stellungnahme des Bibliotheksjuristen Dietrich Pannier in INETBIB:

http://www.inetbib.de/listenarchiv/msg56677.html

Pohl habe mit dem Zitat "weder Latten der Höflichkeit noch des Rechts gerissen [...]. Man kann es auch so empfinden, dass der forsche, aber rechtlich unbeachtliche Vorhalt des Verlag geeignet sein könnte, weitere Personen von Anfragen abzuhalten."

Ich gebe Klaus Graf und Dietrich Pannier recht. Niemand sollte generell auf ein Zitieren von E-Mails zu verzichten, und ich rate, bei einer solchen Reaktion Ruhe zu bewahren und nicht voreilig zu löschen. Am besten macht man sich schon vor der Veröffentlichung von E-Mailzitaten im Web mit der Rechtslage vertraut. Da die Sache nun einmal so gelaufen ist, belasse ich es dabei und kann mich damit trösten, eine ganze Menge dabei gelernt zu haben.

Was bleibt

So wichtig Diskussionen darüber sind, ob und wie man am besten E-Mails im Web zitiert, wichtiger ist es, dass es auch in der Sache weitergeht. Die von mir im letzten Beitrag gestellte Frage ist für mich immer noch nicht abschließend beantwortet. Ich habe unterschiedliche Meinungen zur Rechtslage in Bezug auf das kostenpflichtige Angebot von Bibliotheksdienstartikeln durch De Gruyter gehört. Klaus Graf bezeichnet dies als Verstoß gegen das Urheberrecht:

Eine Retrodigitalisierung ohne Zustimmung des Autors bei Zeitschriften, bei denen nicht ausdrücklich ausschließliche Nutzungsrechte über das eine Jahr des § 38 UrhG hinaus übertragen wurden, ist auch mit Blick auf § 137 L UrhG ein Verstoß gegen das Urheberrecht.

Absichern lässt sich das auch mit der Zweckübertragungslehre:

https://de.wikipedia.org/wiki/Zweck%C3%BCbertragungslehre

Eric Steinhauer hält das Angebot für legal und verweist in einer direkten Nachricht an mich auf Jani, in: Wandtke/Bullinger, § 137l, Rn. 14, wo es heißt:

Sofern der Vertragspartner die Nutzungsrechte in dem von § 137l geforderten Umfang erworben hat, kann er die Sammlung und die in ihr enthaltenen Einzelwerke ... digital herausbringen (Schulze UFITA 2007/III, 641, 691). Ein juristischer Fachverlag darf so z. B. ältere Jahrgänge einer Zeitschrift auf DVD oder in einer Online-Datenbank anbieten. Bezogen auf die einzelnen Werke ist diese Befugnis wegen § 38 nicht exklusiv.

Steinhauers Fazit: "DeGruyter kann also digitalisieren, aber die Autoren der Althefte dürfen ihre Artikel weiterhin online stellen." (Siehe dazu auch den Kommentar von Klaus Graf als Antwort auf Bernhard Mittermaiers Anfrage.)

Ich kann und möchte das rechtlich nicht beurteilen und habe keine Zeit und Lust, mich näher damit auseinanderzusetzen. Da hier gegensätzliche Meinungen vorliegen, fänd ich es angemessen, wenn auch De Gruyter sich zu der Sache äußert und die rechtlichen Erwägungen darlegt, die einer kommerziellen Re-Publikation der Bibliotheksdienstbeiträge vorausgingen. Eventuell gibt ja demnächst auch der Vertrag zwischen der ZLB und De Gruyter zur Übergabe des Bibliotheksdienst Aufschluss über die Sache. Klaus Graf hat eine Informationsfreiheitsanfrage diesbezüglich gestellt...

Was tun

Ich sehe drei Handlungsfelder.

  1. Es scheint klar zu sein, dass alle Autorinnen und Autoren ihre Bibliotheksdienst-Artikel anderswo online stellen können. Ich würde mich freuen, wenn in nächster Zeit mehr und mehr Artikel unter CC0, CC-BY oder CC-BY-SA im Netz auftauchen würden. Es gibt dazu verschiedenste Plattformen. Ich habe in der Vergangenheit am liebsten E-LIS benutzt, da dauert eine Publikation aber eine ganze Weile (Ist halt von und für Bibliothekar/innen ;-). Ansonsten gibt es auch eine Menge anderer Dienste wie ResearchGate, die eine Publikation von Artikeln im Web ermöglichen. (Man sollte nur darauf achten, nicht so etwas wie Scribd oder Academia.edu zu benutzen, wo ein Download Konto und Login beim jeweiligen Dienst voraussetzen.)
  2. Die Referenzierung von Closed-Access-Artikel bei De Gruyter sollte vermieden werden, insofern es eine frei zugängliche Version desselben Textes gibt. Zwar sind die bei De-Gruyter angebotenen Artikel aus verschiedenen Gründen eine deutlich attaktivere Referenz in einem Artikel als etwa ein Link auf das ZLB-Archiv (siehe dazu meinen Kommentar). Da die De-Gruyter-Version nicht Open Access ist, ist das ZLB-Archiv aber vorzuziehen.
  3. Vergangene Veröffentlichungen im Bibliotheksdienst oder anderweitige Nicht-Open-Access-Publikationen lassen sich zwar nicht mehr rückgängig machen, allerdings lässt sich Closed Access bei zukünftigen Publikationen leicht verhindern. Ich kann nur unterstreichen, was Christian Hauschke dazu auf Infobib geschrieben hat:

    Wer offene Fachkommunikation befördern möchte – und nur offene Fachkommunikation ist in meinen Augen tatsächlich stattfindende Fachkommunikation – hat eigentlich keine Ausrede mehr. Egal, ob man sich mit der Schweizer Verbundlandschaft, mit Problemen beim Einsatz von Textvergleichsprogrammen zur vermeintlichen Plagiatsvermeidung, mit sozialer Bibliotheksarbeit, Anforderungen an einen Fachinformationsdienst, RFID in Bibliotheken oder mit Barrierefreiheit für Digitale Bibliotheken beschäftigt: Es gibt eigentlich kein Thema mehr, für das sich nicht ein Ort außerhalb der früher mal üblichen Zeitschriften finden würde. Schön wäre dann noch der Schritt weg von den sattsam bekannten Sammelbänden, die meist doch eh nur Artikelsammlungen sind, hin zu Themenschwerpunkten in OA-Zeitschriften.

2015-10-21

Wie werden Nutzungsrechte übertragen?

Wie in meinem letzten Beitrag angekündigt, hatte ich eine Mail an De Gruyter geschrieben mit dem Wunsch, dass mein Bibliotheksdienstartikel von 2009 nicht weiter auf der De-Gruyter-Webseite gegen einen Betrag von 30 Euro angeboten würde. Am 9. Oktober erhielt ich eine Antwortmail von De Gruyter.

Update II: Nachdem ich das ursprüngliche Original-E-Mail-Zitat an dieser Stelle nach einer Aufforderung von De Gruyter zum Löschen desselben heute (2015-10-23) morgen ersatzlos entfernt hatte (Update I), hat De Gruyter mir erklärt, dass es sich ausschließlich an meinem Zitieren von Geschäftsmails gestört hätte, wo eine Paraphrasierung der Verlagsposition geboten gewesen wäre. Ich entschuldige mich hiermit insbesondere für die ursprüngliche Nennung des Absendernamens – das ist in der Tat kein guter Stil – und komme dem Wunsch nach Paraphrasierung nach:

In der E-Mail hieß es, ZLB und De Gruyter hätten vertraglich vereinbart, dass die Bibliotheksdienstes-Jahrgänge von 1967 bis 2012 von De Gruyter retrodigitalisiert[*] und anschließend gegen Geld im Web angeboten werden könnten. Die ZLB habe somit diese Verwertungsrechte an De Gruyter übertragen.

Die Antwort von De Gruyter wirft in meinen Augen die grundlegende Frage auf, ob die ZLB die Verwertungsrechte für die Jahrgänge 1996 bis 2012 überhaupt je besessen hatte, die sie an De Gruyter verkauft haben soll. Soweit ich weiß, gab es keine schriftlichen Verträge zwischen der ZLB und den Autor/innen, ich zumindest habe so etwas nie unterzeichnet. Was es gab, war die dokumentierte Publikationspraxis, dass Artikel zunächst in der Printfassung und drei Monate später frei zugänglich im Web veröffentlicht wurden. So hieß es etwa noch im August 2012 auf der Startseite des Bibliotheksdienst (Wayback Machine): "Die Beiträge der Rubrik "Themen" der einzelnen Hefte werden drei Monate nach Erscheinen der Druckausgabe online im PDF-Format veröffentlicht, die Stellenanzeigen ca. 14 Tage nach Erscheinen der Druckausgabe." Vor diesem Hintergrund halte ich es für zweifelhaft, dass die ZLB alle wesentlichen Nutzungsrechte an den abgelieferten Artikeln erhalten hat, was sicher notwendige Voraussetzung ist, um sie an De Gruyter veräußern zu können.
Mich würde interessieren, wie die rechtliche Situation von Menschen eingeschätzt wird, die sich mit Nutzungsrechtfragen besser auskennen.

Was indes den von mir verfassten Text angeht, kann ich – auch wenn ich die Argumentation rechtlich fragwürdig halte – niemanden davon abhalten, ihn gegen Geld zu verbreiten. Schließlich habe ich den Artikel selbst unter CC-BY lizenziert, was wiederum voraussetzt, dass ich – und damit andere Autor/innen wohl auch – die ausschließlichen Nutzungsrechte nicht an die ZLB abgegeben habe...

[*] Auf meine Nachfrage hin wurde bestätigt, das tatsächlich die gedruckten Hefte aller Jahrgänge des Bibliotheksdienst digitalisiert worden seien, auch die Jahrgänge 1996 bis 2012, deren Artikel bereits in durchsuchbarer elektronischer Form vorlagen.

2015-09-29

Bibliotheksbärendienst

Gestern wollte ich auf einen Artikel im Bibliotheksdienst aus dem Jahr 2009 verlinken. Leider hat der alte Link auf den Einzelartikel bei der ZLB nicht mehr funktioniert und tut dies wohl schon länger nicht mehr. Die Wayback Machine hat ihn das letzte Mal im August 2013 archiviert. Bei de Gruyter, das den Bibliotheksdienst mittlerweile betreibt, werden 30 Euro für den Artikel verlangt. Mir wird schlecht, wenn ich das sehe, vor allem, weil ich damals vor Veröffentlichung des Artikels sichergestellt habe, dass ich den Preprint zeitgleich unter einer CC-BY-Lizenz veröffentlichen kann (siehe dazu den ersten Übertext-Blogpost von 2009).

Ich hatte von der Diskussion anlässlich des Wechsels von Bibliotheksdienst zu de Gruyter in Erinnerung, dass es ein 12-monatiges Embargo für Bibliotheksdienst-Artikel geben würde, nach dessen Ablauf sie frei im Internet verfügbar sind. Dem widerspricht, dass fast 50 Jahre alte Beiträge bei de Gruyter nur gegen Geld erreichbar sind.

Nachdem ich auf Twitter nachgefragt hatte, hat Jörg Prante mich darauf hingewiesen, dass die Jahrgänge 1996-2012 ja weiterhin bei der ZLB online zugreifbar sind. Leider sind in der Tat nur ganze Jahrgänge oder einzelne Hefte sowie einzelne Seiten verlink- und downloadbar (siehe hier), der direkte Zugriff auf einen einzelnen Artikel ist gar nicht mehr möglich.

Mein Fazit zum Angebot der Biblbiotheksdienst-Inhalte.

  1. alte ZLB-Artikel-URLs zu Artikeln von funktionieren nicht und sind nur noch via Wayback Machine aufrufbar
  2. stattdessen bietet die ZLB gar keine URLs oder gar DOIs für einzelne Artikel mehr an, man kann nur noch einen ganzen Jahrgang oder ein gesamtes Heft verlinken und runterladen, was eine vernünftige Zitierweise unmöglich macht.
  3. De Gruyter hingegen hat DOIs für die einzelnen Artikel von 1967 bis 2015 und nimmt 30 Euro pro Artikel.
  4. Das bedeutet, dass ein Online-Zugriff auf die BD-Artikel von 1967 bis 1995 auschließlich gegen Geld möglich ist.

Nachdem die Online-Version meines Artikels (damals nach einem dreimonatigen Embargo) veröffentlicht war, hatte ich auch die Verlagsversion parallel veröffentlicht. Zum Glück wir diese bei einer Google-Suche nach dem Artikeltitel auch am höchsten gerankt. Nichtsdestotrotz soll auch die De-Gruyter-Fassung frei zugänglich sein, und ich werde De Gruyter dazu mit Verweis auf diesen Blogpost auffordern.

Im übrigen gebe ich Klaus Graf echt, wenn er schreibt:

Es ist doch ein Skandal, dass die älteren Ausgaben , die in der ZLB Open Access waren, bei De Gruyter nun GELD kosten! Wieso thematisiert niemand diese Ungeheuerlichkeit? Was ist das für eine erbärmliche verrottete Zunft, die zum Aufdecken von Misständen einen Außenseiter wie mich braucht?

Ich hatte das Ganze einfach bisher nicht mitbekommen und leiste (“Besser spät als nie.”) jetzt einen kleinen Beitrag dazu, dieser Praxis von De Gruyter ein Ende zu setzen. (Ausdrücklich rege ich mich hier NICHT über Klaus Grafs Ton auf. Der Mann hat einfach meistens recht, wenn es um Bibliotheken und Open Access geht und das ewige Auf-die-Netiquette-Verweisen lenkt nur von der nötigen Auseinandersetzung ab.)

Einen Beitrag von mir im Bibliotheksdienst wird es in Zukunft übrigens nicht mehr geben. Ich rufe auch alle anderen dazu auf, lieber in Open-Access-Alternativen wie Informationspraxis oder Libreas oder auch einfach in einem Blog zu veröffentlichen.

2014-07-10

Name Authority Files & Linked Data

I haven't been spending very much time following the developments regarding the Bibframe vocabulary and only follow the Bibframe mailing list sporadically. That's why I am happy when someone else makes the effort to take a deeper look at the vocabulary and reports the results. That is what Robert Sanderson did with his text titled "Differences between BibFrame and other Linked Open Data Approaches".

The Problem: Using strings as/instead of identifiers

In his text, Rob wants to "point out the differences between BibFrame's use of RDF and other more common usage patterns". This blog post only discusses the first of the differences Rob points out in the chapter "String Authorities rather than Identifiers": Instead of putting the focus on interlinking things (bibliographic resources, persons, concepts, organisations etc.) identified by URIs, Bibframe emphasizes an approach that rather builds on using blank node identifiers and defining authorities by a canonical string like "Tolkien, J. R. R. (John Ronald Reuel), 1892-1973". Rob writes:

"BibFrame tries to make use of existing authority records and canonical string-based labels due to its background in MARC, a format designed to be as compact as possible for adding metadata to strings. Unfortunately, this does not map well into Linked Data which makes use of identifiers to globally and uniquely distinguish real world and digital entities. These two world-views collide in the use of Authorities in BibFrame."

By and large, I agree with Rob's diagnosis. It is important to note that this "string approach" isn't limited to Bibframe (as Rob says himself when he refers to MADS) but to a whole approach of representing authority data in RDF. Also, this isn't solely a MARC thing but is based on the Anglo-American cataloging practice in general. In fact, one can easily use MARC with an identifier-based authority approach as a look at some MARC records of German libraries shows. (Further down more about this.)

There are different practices of authority cataloging

What became clear to me while reading Rob's text is that German libraries might better be avoiding Bibframe, at least if its focus stays on a string-based authority approach. The following statement by Rob may be true for the Anglo-American cataloging practice:

An "authority is about the approved form in which the person's name should be recorded as a string, it does not identify the person directly. (...) This is a fundamental difference between regular Linked Open Data and BibFrame's use of RDF. BibFrame relies on strings, due to its heritage, whereas LOD makes use of identity."

Accordingly, the Library of Congress describes its name authority file as follows (my emphasis):

"The Library of Congress Name Authority File (NAF) file provides authoritative data for names of persons, organizations, events, places, and titles."

Accordingly, this is what the authority RDF for Tolkien looks like in the Library of Congress name authority (snippet):

@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@prefix madsrdf: <http://www.loc.gov/mads/rdf/v1#> .
@prefix identifiers: <http://id.loc.gov/vocabulary/identifiers/> .

<http://id.loc.gov/authorities/names/n79005673>
    a madsrdf:Authority, madsrdf:PersonalName, skos:Concept ;
    identifiers:lccn "n 79005673" ;
    identifiers:oclcnum "oca00239830" ;
    madsrdf:authoritativeLabel "Tolkien, J. R. R. (John Ronald Reuel), 1892-1973"@en ;
    madsrdf:elementList ([
            madsrdf:elementValue "Tolkien, J. R. R."@en ;
            a madsrdf:FullNameElement
        ]
        [
            madsrdf:elementValue "(John Ronald Reuel),"@en ;
            a madsrdf:FullNameElement
        ]
        [
            madsrdf:elementValue "1892-1973"@en ;
            a madsrdf:DateNameElement
        ]
    ) ;
    madsrdf:hasExactExternalAuthority <http://viaf.org/viaf/sourceID/LC%7Cn+79005673#skos:Concept> ;
    madsrdf:identifiesRWO [
        madsrdf:birthdate "18920103" ;
        madsrdf:deathdate "19730902" ;
        madsrdf:hasAffiliation [
            madsrdf:affiliatedWith "University of Leeds" ;
            a madsrdf:Affiliation
        ], [
            madsrdf:affiliatedWith "University of Oxford" ;
            a madsrdf:Affiliation
        ] ;
        a madsrdf:RWO, <http://xmlns.com/foaf/0.1/Person>
    ] .

One may find information about the "real word object" in this RDF but it doesn't get that much attention as it not even gets its own URI but is only identified by a blank node. (We will see further down that Library of Congress's approach is unique in this respect compared to other RDF authority files worldwide.)

About cataloging practice in Germany and Austria, though, one can not say that it "relies on strings" . A central tool for German-speaking catalogers is the German Integrated Authority File — created and curated by many different institutions in the German-speaking world. The Integrated Authority File exists since 2012 and is the product of integrating three different authority files for persons, corporate bodies and subject headings. It is described by the Deutsche Nationalbibliothek (DNB) as follows.

"The Integrated Authority File (GND) contains data records representing persons, corporate bodies, congresses, geographic entities, topics and works."

This already sounds a bit different and doesn't mention "names" at all. Let's take a deeper look at the German cataloging practice regarding authorities.

German ID-based authority practice

In the Integrated Authority File a numeric ID (GND ID) is used to identify an authority record. Likewise, each bibliographic record that references this authority record uses the GND ID. For an example take a look at these two MARC XML records from DNB.

This cataloging practice emerged in the 1990s and makes German library data "linked data ready". The Integrated Authority File data was one of the first linked data publications in the German library world. Publishing the authority data, Deutsche Nationalbibliothek chose another approach than the Library of Congress. Instead of just publishing authority records in RDF and assigning URIs (Uniform Resource Identifiers) to these records they created URIs for the things the authority records describe, i.e. for persons, corporate bodies topics etc. "http://dnb.info/" is used as namespace where the respective GND ID is appended. For example: The ID for Tolkien's authority record is '118623222' and his Linked data URI is 'http://d-nb.info/gnd/118623222'. You can fetch the following RDF information from this URI (snippet, in turtle notation):

GND authority data in RDF

@prefix foaf: <http://xmlns.com/foaf/0.1/> .
@prefix gndo: <http://d-nb.info/standards/elementset/gnd#> .
@prefix owl: <http://www.w3.org/2002/07/owl#> .

<http://d-nb.info/gnd/118623222>
    gndo:gndIdentifier "118623222" ;
    gndo:preferredNameEntityForThePerson [
        gndo:forename "J. R. R." ;
        gndo:surname "Tolkien"
    ] ;
    gndo:preferredNameForThePerson "Tolkien, J. R. R." ;
    a gndo:DifferentiatedPerson ;
    owl:sameAs <http://dbpedia.org/resource/J._R._R._Tolkien>, <http://viaf.org/viaf/95218067> ;
    foaf:page <http://de.wikipedia.org/wiki/J._R._R._Tolkien> .

As you can see, the German Integrated Authority File (GND) has its own ontology (GND ontology, see here for an overview over the ontology's class hierarchy) created and maintained by the DNB. The owl:sameAs links to DBpedia and VIAF (which models person authorities as persons, not as strings) clearly show that GND defines name authorities as persons with an ID and not simply as name authorities with canonical strings.

Linking to GND using Dublin Core & MARC relators

From 2010 on a handful of libraries and library service centers in Germany started publishing their bibliographic records as linked data. As one might expect reading the previous paragraph, it was quite easy for them to not only produce RDF but to link to other datasets, at least to the GND. Just take a look at these examples from two German union catalogs in RDF: lobid and b3kat.

In 2012, the DNB started publishing the German national bibliography as linked data. Also in 2012, different linked data publishers form the German-speaking library world started working together within the KIM-DINI working group (KIM = Competence Centre Interoperable Metadata) to promote best practices for the RDF representation of bibliographic records which resulted in a set of recommendations (German, pdf) first published 2013. Following these recommendations, an RDF representation of a DNB title record currently looks like this (snippet):

@prefix dc: <http://purl.org/dc/elements/1.1/> .
@prefix dcterms: <http://purl.org/dc/terms/> .
@prefix marcRole: <http://id.loc.gov/vocabulary/relators/> .

<http://d-nb.info/1022176307>
    marcRole:ill <http://d-nb.info/gnd/156605406> ;
    marcRole:trl <http://d-nb.info/gnd/110833732> ;
    dc:title "Der kleine Hobbit" ;
    dcterms:alternative "The hobbit <dt.>" ;
    dcterms:creator <http://d-nb.info/gnd/118623222> ;
    dcterms:issued "2012" .

You can see how DC terms and MARC relator properties are used to directly link to the persons in the GND authority file. (And yes, the German version of "The hobbit" was named "The small hobbit" though Bilbo is actually of average height — at least for a hobbit.)

Linking to GND using Bibframe (test data)

For some weeks now, DNB provides Bibframe representations of the title records along with the just mentioned linked data. Here is the RDF that you get when requesting it for the same resource:

@prefix bf: <http://bibframe.org/vocab/> .

<http://d-nb.info/1034321757>
    bf:dimensions "20 cm" ;
    bf:ean "9783423715669" ;
    bf:editionStatement "Neuausg." ;
    bf:extent "397 S." ;
    bf:frequency <http://marc21rdf.info/terms/continuingfre%23/u> ;
    bf:illustrativeContentNote "Ill." ;
    bf:instanceOf <http://d-nb.info/bf_temp/work_1034321757> ;
    bf:isbn10 "3423715669" ;
    bf:isbn13 "9783423715669" ;
    bf:modeOfIssuance "Einbändiges Werk" ;
    bf:nbn "13,A46", "13,N20" ;
    bf:responsibilityStatement "John Ronald R. Tolkien. Aus dem Engl. von Walter Scherf. Mit Vignetten von Max Meinzold" ;
    bf:title "Der kleine Hobbit" ;
    a bf:Instance .


<http://d-nb.info/bf_temp/work_1034321757>
    bf:associatedAgent [
        bf:hasGNDLink <http://d-nb.info/gnd/118623222> ;
        bf:label "Tolkien, J. R. R." ;
        bf:resourceRole <http://id.loc.gov/vocabulary/relators/aut> ;
        a bf:Person
    ], [
        bf:hasGNDLink <http://d-nb.info/gnd/110833732> ;
        bf:label "Scherf, Walter" ;
        bf:resourceRole <http://id.loc.gov/vocabulary/relators/trl> ;
        a bf:Person
    ], [
        bf:hasGNDLink <http://d-nb.info/gnd/156605406> ;
        bf:label "Hehn-Kynast, Juliane" ;
        bf:resourceRole <http://id.loc.gov/vocabulary/relators/ill> ;
        a bf:Person
    ], [
        bf:hasGNDLink <http://d-nb.info/gnd/1022774611> ;
        bf:label "Meinzold, Max" ;
        bf:resourceRole <http://id.loc.gov/vocabulary/relators/ill> ;
        a bf:Person
    ] ;
    bf:hasInstance <http://d-nb.info/1034321757> ;
    bf:title "Der kleine Hobbit", "The Hobbit" ;
    bf:uniformTitle "The Hobbit, dt." ;
    a bf:Work .

The most obvious difference compared to the DC-based RDF above is that there are actually two resources — a Bibframe instance and a work. Taking a look at the links to authority data you see what Rob is complaining about: Instead of a simple dcterms:creator link between a bibliographic resource and a person you get a blank node for a Bibframe person that then links to the GND with bf:hasGNDLink. Doesn't look like any sane person would prefer this data over the RDF shown above.

How do others do it?

So we have these two different practices of representing name authority data in RDF and see that the Bibframe initiative — calling itself the "foundation for the future of bibliographic description that happens on the web and in the networked world" — chose a rather impractical approach. This begs the question of how others do this. I understand Bibframe as an initative with an international scope so I guess it should meet the demands and be in line with authority practices around the world.

Below are examples of some RDF representations of records from other name/person authority files (snippets). I won't go into much detail discussing these but will comment on the general approach taken.

viaf.org

VIAF follows the same Linked Data compatible approach as DNB to represent authorities in RDF. Tolkien is typed as foaf:Person and can be directly linked to using properties like dcterms:creator.

Example:

@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@prefix void: <http://rdfs.org/ns/void#> .
@prefix owl: <http://www.w3.org/2002/07/owl#> .
@prefix viaf: <http://viaf.org/ontology/1.1/#> .
@prefix foaf: <http://xmlns.com/foaf/0.1/> .
@prefix skosxl: <http://www.w3.org/2008/05/skos-xl#> .
@prefix skos: <http://www.w3.org/2004/02/skos/core#> .
@prefix rdaGr2: <http://rdvocab.info/ElementsGr2/> .
@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
@prefix rdaEnt: <http://rdvocab.info/uri/schema/FRBRentitiesRDA/> .

<http://viaf.org/viaf/95218067>
    rdaGr2:dateOfBirth "1892-01-03" ;
    rdaGr2:dateOfDeath "1973-09-02" ;
    a rdaEnt:Person, foaf:Person ;
    owl:sameAs <http://d-nb.info/gnd/15818212X>, <http://data.bnf.fr/ark:/12148/cb11926763j#foaf:Person>, <http://dbpedia.org/resource/J._R._R._Tolkien>, <http://libris.kb.se/resource/auth/97224>, <http://www.idref.fr/027164918/id> ;
    foaf:name "J.R.R Tolkien", "JRR Tolkien", "John Ronald Reuel Tolkien", "T'olk'in, J. R. R. 1892-1973", ... .

Libris

Looking to Sweden's Libris catalog, we see a lot of similarities to VIAF. Libris primarily types person authorities as foaf:Person but adds a skos:Concept with its own URI which is linked to the person with foaf:focus.

@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@prefix dbpedia: <http://dbpedia.org/property/> .
@prefix skos: <http://www.w3.org/2004/02/skos/core#> .
@prefix foaf: <http://xmlns.com/foaf/0.1/> .
@prefix rda: <http://RDVocab.info/ElementsGr2/> .
@prefix owl: <http://www.w3.org/2002/07/owl#> .
@prefix dc: <http://purl.org/dc/elements/1.1/> .
@prefix libris: <http://libris.kb.se/vocabulary/experimental#> .
@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .

<http://libris.kb.se/resource/auth/97224>
    rda:dateOfBirth "1892" ;
    rda:dateOfDeath "1973" ;
    dbpedia:birthYear "1892" ;
    dbpedia:deathYear "1973" ;
    libris:key "Tolkien, J. R. R., 1892-1973" ;
    rdf:seeAlso <http://en.wikipedia.org/wiki/J._R._R._Tolkien> ;
    a foaf:Person ;
    rdfs:isDefinedBy <http://data.libris.kb.se/open/auth/97224.rdf> ;
    owl:sameAs <http://dbpedia.org/resource/J._R._R._Tolkien>, <http://id.loc.gov/authorities/names/325978>, <http://viaf.org/viaf/95218067> ;
    foaf:name "J. R. R Tolkien", "John R. R Tolkien", "John Ronald Reuel Tolkien", "Tolkien, J. R. R., 1892-1973", "Tolkien, John R. R., 1892-1973", "Tolkien, John Ronald Reuel, 1892-1973" .

<http://libris.kb.se/resource/auth/97224#concept>
    a skos:Concept ;
    skos:altLabel "J. R. R Tolkien", "John R. R Tolkien", "John Ronald Reuel Tolkien", "Tolkien, J. R. R., 1892-1973", "Tolkien, John R. R., 1892-1973", "Tolkien, John Ronald Reuel, 1892-1973" ;
    skos:exactMatch <http://viaf.org/viaf/95218067/#skos:Concept> ;
    foaf:focus <http://libris.kb.se/resource/auth/97224> .

National Diet Library (NDL), Japan

An authority file of the National Diet Library looks quite similar to Libris' authorities. Interestingly, foaf:primaryTopic is used instead of foaf:focus to link the skos:Concept to the foaf:Person.

@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
@prefix skos: <http://www.w3.org/2004/02/skos/core#> .
@prefix xl: <http://www.w3.org/2008/05/skos-xl#> .
@prefix rda: <http://RDVocab.info/ElementsGr2/> .
@prefix foaf: <http://xmlns.com/foaf/0.1/> .
@prefix dct: <http://purl.org/dc/terms/> .

<http://id.ndl.go.jp/auth/entity/00000047>
    rda:dateOfBirth "1931" ;
    a foaf:Person ;
    foaf:name "阿部洋" .

<http://id.ndl.go.jp/auth/ndlna/00000047>
    dct:created "1979-04-01" ;
    dct:modified "2005-01-05T10:44:08" ;
    dct:source "奥付", "韓国と台湾の教育開発 / 阿部宗光, 阿部洋 編" ;
    a skos:Concept ;
    rdfs:label "阿部, 洋, 1931-" ;
    skos:exactMatch <http://viaf.org/viaf/sourceID/NDL%7C00000047> ;
    skos:inScheme <http://id.ndl.go.jp/auth#personalNames> ;
    xl:prefLabel [
        ndl:transcription "Abe, Hiroshi, 1931-"@ja-latn, "アベ, ヒロシ, 1931-"@ja-kana ;
        xl:literalForm "阿部, 洋, 1931-"
    ] ;
    foaf:primaryTopic <http://id.ndl.go.jp/auth/entity/00000047> .

Bibliothèque nationale de France

BNF does it the other way around compared to Libris. Here, the a name authority is primarily typed as skos:Concept. This skos:Concept is linked to the person Tolkien using foaf:focus and, thus, enables direct linking to person authorities.

@prefix bio: <http://vocab.org/bio/0.1/> .
@prefix dc: <http://purl.org/dc/terms/> .
@prefix foaf: <http://xmlns.com/foaf/0.1/> .
@prefix owl: <http://www.w3.org/2002/07/owl#> .
@prefix rdagroup2elements: <http://RDVocab.info/ElementsGr2/> .
@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
@prefix skos: <http://www.w3.org/2004/02/skos/core#> .


<http://data.bnf.fr/ark:/12148/cb11926763j>
    a skos:Concept ;
    rdfs:seeAlso <http://catalogue.bnf.fr/ark:/12148/cb11926763j>, <http://fr.wikipedia.org/wiki/J._R._R._Tolkien> ;
    owl:sameAs <http://dbpedia.org/resource/J._R._R._Tolkien>, <http://isni-url.oclc.nl/isni/0000000121441970>, <http://www.idref.fr/027164918> ;
    skos:altLabel "John Ronald Renel Tolkien (1892-1973)"@fr ;
    skos:prefLabel "John Ronald Reuel Tolkien (1892-1973)"@fr ;
    foaf:focus <http://data.bnf.fr/ark:/12148/cb11926763j#foaf:Person> .

<http://data.bnf.fr/ark:/12148/cb11926763j#foaf:Person>
    a foaf:Person ;
    rdagroup2elements:biographicalInformation "Romancier. - Professeur de langue et littérature anglo-saxonnes" ;
    rdagroup2elements:dateOfBirth <http://data.bnf.fr/date/1892/> ;
    rdagroup2elements:dateOfDeath <http://data.bnf.fr/date/1973/> ;
    rdagroup2elements:fieldOfActivityOfThePerson <http://dewey.info/class/800/>, "Littératures" ;
    rdagroup2elements:languageOfThePerson <http://id.loc.gov/vocabulary/iso639-2/eng> ;
    dc:date "1892-1973" ;
    bio:Birth "1892-01-03" ;
    bio:Death "1973-09-02" ;
    owl:sameAs <http://viaf.org/viaf/95218067> ;
    foaf:birthday "01-03" ;
    foaf:depiction <http://upload.wikimedia.org/wikipedia/commons/thumb/d/d9/Tolkien_1916-2.jpg/200px-Tolkien_1916-2.jpg> ;
    foaf:familyName "Tolkien" ;
    foaf:gender "male" ;
    foaf:givenName "John Ronald Reuel" ;
    foaf:name "John Ronald Reuel Tolkien" ;
    foaf:page <http://data.bnf.fr/ark:/12148/cb11926763j> .

Biblioteca Nacional de España

Looking at the BNE authority data what sticks out is the use of IFLA's FRBR and FRAD vocabularies. Obviously, BNE follows existing Linked Dta practices and doesn't emphasize the canonical strings as it types name authorities as persons. This becomes evident by the owl:sameAs links to GND, Viaf, Libris etc.

Some help for the people who don't know IFLA's FRBR and FRAD properties by heart:

  • ifla-frbr:C1005 = Person
  • ifla-frbr:P3039 = hasNameOfPerson
  • ifla-frad:P4031 = hasOtherVariantNamePerson
  • ifla-frbr:P3040 = hasDatesOfPerson

Here is a turtle snippet:

@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@prefix ifla-frbr: <http://iflastandards.info/ns/fr/frbr/frbrer/> .
@prefix ifla-frad: <http://iflastandards.info/ns/fr/frad/> .
@prefix locmads: <http://www.loc.gov/mads/rdf/v1#> .

<http://datos.bne.es/resource/XX933704>
    a ifla-frbr:C1005 ;
    ifla-frbr:P3039 "Tolkien, J. R. R." ;
    ifla-frad:P4031 "Tolkien", "Tolkien, John Ronald Reuel" ;
    ifla-frbr:P3040 "1892-1973" ;
    owl:sameAs <http://d-nb.info/gnd/118623222>, <http://dbpedia.org/resource/J._R._R._Tolkien>, <http://libris.kb.se/resource/auth/97224>, <http://viaf.org/viaf/95218067>, <http://www.idref.fr/027164918/id> .

Rådata nå!

(Update, 2015-09-23)

Re-reading this, I noticed that I missed Rådata nå! one of the first authority files that was available as Linked Open Data. For the sake of comprehensiveness and to pay tribute to this pioneer effort in publishing library authorites, I am adding it now. Rådata nå! follows a pattern that is quite similar to VIAF. It uses a mix of vocabularies (FOAF, Dublin Core, SKOS and others), typing a person authority with foaf:Person and putting owl:sameAs to VIAF, GND and DBpedia. Example snippet:

@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@prefix radatana: <http://def.bibsys.no/xmlns/radatana/1.0#> .
@prefix skos: <http://www.w3.org/2004/02/skos/core#> .
@prefix foaf: <http://xmlns.com/foaf/0.1/> .
@prefix owl: <http://www.w3.org/2002/07/owl#> .
@prefix dc: <http://purl.org/dc/terms/> .
@prefix whois: <http://www.kanzaki.com/ns/whois#> .
@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .

<http://data.bibsys.no/data/notrbib/authorityentry/x90061718>
radatana:catalogueName "Ibsen, Henrik" ;
dc:identifier "x90061718" ;
dc:modified "2009-11-27"^^<http://www.w3.org/2001/XMLSchema#date> ;
whois:since "1828"^^<http://www.w3.org/2001/XMLSchema#gYear> ;
whois:until "1906"^^<http://www.w3.org/2001/XMLSchema#gYear> ;
a foaf:Person ;
rdfs:label "Henrik Ibsen" ;
owl:sameAs <http://d-nb.info/gnd/118555286>, <http://dbpedia.org/resource/Henrik_Ibsen>, <http://viaf.org/viaf/71378383> .

Conclusion

As the overview shows, one currently can not find any other institution that follows an authority approach similar to the Library of Congress' that focuses on canonical strings. I guess, if Bibframe wants to be picked up by a broad mass of institutions internationally it will have to accomodate to the existing environment which would mean re-thinking Bibframe authorities by putting the primary focus on an approach that supports direct linking to persons as authorities. Today's mails on the Bibframe list by Kevin Ford of LoC (especially this one) give some hope that this may actually happen.

In Kevin Ford's and Ray Denenberg's first reply to Rob Sanderson's text on the Bibframe mailing list they write:

"BIBFRAME has explicitly stated that bf:Authority is not designed to compete with existing library authority efforts or replicate traditional library authorities. Furthermore, nowhere is it ever asserted that 'bf:Person != foaf:Person' and nowhere is it said that 'bf:Authority == madsrdf:Authority'. Nothing, either way, is actually declared presently. Rather, bf:Authority is an abstraction allowing the implementer to reference a traditional authority. It is these traditional authorities that include the strings in question.".

It is correct that there is no explicit and formal statement that a bf:Authority can not be a foaf:Person and must be a mads:Authority. But the use of a vocabulary is not only (and probably even not in the first place) guided by its RDFS/OWL representation. Examples and tools can have a lot more power directing the use of a vocabulary. The example Bibframe data from Deutsche Nationalbibliothek shown above makes clear that even early implementers (at least one) obviously did understand Bibframe authorities as string-centric (otherwise they'd put a direct link to the GND into the data).

Besides the DNB Bibframe test data, there exist other examples suggesting Bibframe is primarily dealing with string authorities:

  • Definitions and names currently have a lot of "controlled name" in them, e.g. http://bibframe.org/vocab/Person.html.
  • Examples in the Bibframe vocabulary documentation, e.g. at [http://bibframe.org/vocab/creator.html])(http://bibframe.org/vocab/creator.html).
  • Output of the Bibframe Editor, here is some example output I get when I chose a LoC person authority to link to (converted to turtle):

    @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
    
    
    <http://example.org/46bf66bc-51e0-4c80-9444-79141c2e28cc>
        <http://bibframe.org/vocab/language> <http://id.loc.gov/vocabulary/languages/eng> ;
        <http://bibframe.org/vocab/title> "Ways of Worldmaking" ;
        <http://id.loc.gov/vocabulary/relators/aut> <http://example.org/6636d72e-9933-649a-b769-2ef41d241937> ;
        a <http://bibframe.org/vocab/Work> .
    
    
    <http://example.org/6636d72e-9933-649a-b769-2ef41d241937>
        <http://bibframe.org/vocab/authoritySource> <http://id.loc.gov/authorities/names> ;
        <http://bibframe.org/vocab/authorizedAccessPoint> "Goodman, Nelson"@en ;
        <http://bibframe.org/vocab/hasAuthority> <http://id.loc.gov/authorities/names/n50037322> ;
        a <http://bibframe.org/vocab/Person> .
    

If Bibframe wants to make clear that it in fact does NOT require people to use blank nodes with string authorities and that it supports and may even prefer direct interlinking of works and associated agents then it should behave like that and replace the current definitions, examples and output of the Bibframe editor. It would be even better if the Library of Congress changed its approach of modeling its own authorities and added URIs for the real-world objects (persons, corporate bodies etc.) to their authority data so that one could directly link to them.