2009-10-23

Turboübertext mit Dublin-Core-Anreicherung in RDFa

Eine Aufgabe im zweiten Semester meines MALIS-Studiengangs ist, eine beliebige Webseite zu katalogisieren, indem der Inhalt der fünfzehn simplen Dublin-Core-Elements angegeben wird. Freundlicherweise war meine Arbeitsgruppe (mein Dank geht an Irene, Katrin und Tobi) damit einverstanden, mein Blog als Versuchsobjekt zu nehmen. Mein Kollege und Freund Felix Ostrowski (foaf-Anreicherung folgt ;-) hat mich schließlich tatkräftig dabei unterstützt, das Blog anzureichern.

Auf der Basis der Katalogisierungs-Ergebnisse ist nun das Blogger-Template, aus dem die Seiten des Blogs (die Überseite http://www.uebertext.org/ sowie die Seiten der einzelnen Beiträge, z.B. http://www.uebertext.org/2009/09/pladoyer-fur-ein-twitter-recherche.html) generiert werden, mit den Dublin-Core-Elements in RDFa angereichert. Darüber hinaus habe ich noch die DC-Terms-Refinements "is part of" und "license" ergänzt.


Mit dem RDFa-Distiller des W3C lässt sich das im XHTML-Text verstreute RDFa in ein RDF/XML-Dokument destillieren und die Ergebnisse sehen schon ziemlich gut aus.

Gerne lade ich das Blogger-Template irgendwo hoch, vielleicht in einem Wiki. Hat jemand einen Vorschlag, welches der geeignetste Ort ist?

Warum Blog-Vorlagen nicht an der Basis anreichern?

So sinnvoll die Aufgabe, eine Webseite zu katalogisieren sein mag, um Vertrautheit mit den Dublin-Core-Elementen zu fördern - es ist klar, dass heutzutage nicht Bibliothekare hingehen werden, um das Web zu katalogisieren. Diese Unterfangen wäre auch gänzlich unsinnig, weil die meisten Metadaten, auf die sich die Dublin-Core-Elemente beziehen, bereits in strukturierter Form vorliegen und nur noch entsprechend markiert werden müssen.

Es wäre also sehr wünschenswert, wenn Blogging-Plattformen wie Blogger, WordPress, Twoday, Blogsport usw. das xHTML-Markup ihrer Vorlagen standardmäßig mit Dublin-Core-Attributen anreichern würden. Dies würde dem Netz ohne großen Aufwand eine große Menge maschinenlesbarer Metadaten einbringen. Eine Twitter-Anfrage an Dublin Core, ob es bereits Bestrebungen in diese Richtung gibt, blieb leider unbeantwortet.

1 Kommentar:

Jakob hat gesagt…

Anstatt Publikationen per Hand zu katalogisieren ist Harvesting angesichts der Publikationsflut die einzige Möglichkeit. Auf der einen Seite fehlen dafür noch die auszeichnungen u.A. in Blogs (ob Twitter das geeignete Medium für eine Anfrage ist, wage ich allerdings zu bezweifeln). Auf der anderen Seite fehlt es jedoch auch an Harvesting-Clients und aggregierten Datenbanken - zumindest in Bibliotheken.

Kommentar veröffentlichen