2009-11-09

Wissen und Informationsfreiheit

Anstatt eines Credos, hier ein Scio, also anstatt eines Glaubensbekenntnisses ein Wissensbekenntnis:
Ich weiß, dass über alles Wissen gestritten werden muss. Nur dieses  Wissen ist unbestreitbar, dass die beste Voraussetzung jedes Wissensstreits der freie Zugriff Aller auf die relevanten Informationen ist.

2009-11-03

Exzerpt-Monitoring und -anreicherung mit Tynt

 [Update, 21.12.2009: Ich war ja von Anfang an selbst nicht so sehr begeistert von Tynt und habe das Experiment abgebrochen. Mittlerweile habe ich das Exzerptmonitoring wieder deaktiviert.]

Seit einer Woche habe ich übrigens Tynt Insight für dieses Blog installiert. Das ist ein Tool zum Monitoring der Nutzeraktionen auf den Webseiten einer bestimmten Domain. Eine Anmeldung bei Tynt und das Kopieren einer Zeile Javascript in den Quelltext reichen aus und es geht los. (Da Tynt Insight auf Javascript basiert lässt es sich auch - etwa durch die Nutzung von noscript oder ähnlichem - umgehen.)

Und was macht dieses Tool jetzt genau? Es sind vor allem zwei Nutzeraktionen, die Tynt erfasst, zählt und auswertet: Copy & Paste und das Kopieren von Bildern. (Augenfixationserkennung wird noch nicht unterstützt. ;-) Das heißt, ich kann in Echtzeit erfahren, welche Zeichenketten sich Übertext-Leser zu welcher Zeit markiert und kopiert haben. Darüberhinaus werden alle 24 Stunden Statistiken über die Aktivitäten erstellt. So kann ich erfahren, welche Inhalte für die Leserinnen besonders interessant sind und kann diese - wenn ich mir den Pro-Account gönne - sogar automatisch twittern lassen.

Metadaten automatisch mitgeliefert

Soso, mag jetzt so manch einer denken, das ist ja sehr aufschlussreich, besonders für ein Blog, dessen Beiträge jeweils 30 bis 100mal angeschaut werden... Ehrlich gesagt war das Exzerptmonitoring auch nicht der ausschlaggebende Punkt für mich, Tynt Insight zu installieren. Ganz im Gegenteil, ich finde es persönlich eher abschreckend, wenn ich weiß, dass jedes Exzerpieren registriert wird.

Was mich gereizt hat war die Anreicherung von Exzerpten durch die automatische Beigabe von Metadaten. Probier es einfach mal aus und kopiere eine beliebige Zeichenkette, füge sie - etwa in einen Editor - ein und du wirst sehen: nicht nur die kopierte Zeichenkette erscheint, sondern auch interessante Metadaten, nämlich die Lizenzinformation und eine URL, die dich zur jeweiligen Seite mit dem hervorgehobenen Exzerpt zurückführt.

Sinnvoll & praktisch oder überflüssig & nervig?

Mich würde interessieren was andere von diesem Tool halten. Findet ihr es praktisch oder gefällt es euch nicht? Mich hat es teilweise schon genervt, wenn ich beim Einfügen mehr Text stehen habe als ich eigentlich kopiert hatte. Andererseits kann ich mir aufbauend auf dieser Technik sehr praktische Anwendungen für das Exzerpieren und Zitieren elektronischer wissenschaftlicher (Hyper-)Texte vorstellen. Dies kann sicher jeder nachvollziehen, der etwa schonmal eine Textpassage zitieren wollte, die dazugehörige Quellenangabe aber verlegt hatte.

2009-11-01

Flickr und Open Library verlinken

Ich hatte vor einiger Zeitschon mal was drüber gelesen, es bisher aber nie ausprobiert: das Maschinentagging von Flickr-Bildern zur Verlinkung mit der Open Library. Eine Präsentation zur Open Library beim MALIS-Studiengang war nun der Anlass, diesen spaßigen Dienst einmal auszuprobieren.

Zunächst habe ich ein Testfoto machen lassen und auf Flickr hochgeladen. Dann war es ein leichtes, die Verknüpfung zum entsprechenden Bucheintrag bei der Open Library herzustellen, weil diese Maschinentags alles andere als kompliziert sind. Sie haben die Form openlibrary:id='Buch-ID', in meinem Fall also openlibrary:id=OL2274241M.

Das Ergebnis: Auf der Flickr-Seite des Fotos erscheint ein kleiner verlinkter Hinweis "LIB Symbolische Maschinen ist ein Buch der Open Library", dem jedeR folgen kann um die  bibliographischen Daten des Buches einzusehen oder - falls verfügbar - im digitalisierten Volltext zu stöbern. Leider funktioniert die Verknüpfung momentan (noch) nicht in die andere Richtung, d.h. beim Bucheintrag in der Open Library gibt es keinen Link auf maschinengetaggte Flickr-Bilder.

Ist es nicht schön, was man alles Tolles machen kann, wenn man nur eindeutige IDs und darauf aufbauende stabile URLs hat...

2009-10-23

Turboübertext mit Dublin-Core-Anreicherung in RDFa

Eine Aufgabe im zweiten Semester meines MALIS-Studiengangs ist, eine beliebige Webseite zu katalogisieren, indem der Inhalt der fünfzehn simplen Dublin-Core-Elements angegeben wird. Freundlicherweise war meine Arbeitsgruppe (mein Dank geht an Irene, Katrin und Tobi) damit einverstanden, mein Blog als Versuchsobjekt zu nehmen. Mein Kollege und Freund Felix Ostrowski (foaf-Anreicherung folgt ;-) hat mich schließlich tatkräftig dabei unterstützt, das Blog anzureichern.

Auf der Basis der Katalogisierungs-Ergebnisse ist nun das Blogger-Template, aus dem die Seiten des Blogs (die Überseite http://www.uebertext.org/ sowie die Seiten der einzelnen Beiträge, z.B. http://www.uebertext.org/2009/09/pladoyer-fur-ein-twitter-recherche.html) generiert werden, mit den Dublin-Core-Elements in RDFa angereichert. Darüber hinaus habe ich noch die DC-Terms-Refinements "is part of" und "license" ergänzt.


Mit dem RDFa-Distiller des W3C lässt sich das im XHTML-Text verstreute RDFa in ein RDF/XML-Dokument destillieren und die Ergebnisse sehen schon ziemlich gut aus.

Gerne lade ich das Blogger-Template irgendwo hoch, vielleicht in einem Wiki. Hat jemand einen Vorschlag, welches der geeignetste Ort ist?

Warum Blog-Vorlagen nicht an der Basis anreichern?

So sinnvoll die Aufgabe, eine Webseite zu katalogisieren sein mag, um Vertrautheit mit den Dublin-Core-Elementen zu fördern - es ist klar, dass heutzutage nicht Bibliothekare hingehen werden, um das Web zu katalogisieren. Diese Unterfangen wäre auch gänzlich unsinnig, weil die meisten Metadaten, auf die sich die Dublin-Core-Elemente beziehen, bereits in strukturierter Form vorliegen und nur noch entsprechend markiert werden müssen.

Es wäre also sehr wünschenswert, wenn Blogging-Plattformen wie Blogger, WordPress, Twoday, Blogsport usw. das xHTML-Markup ihrer Vorlagen standardmäßig mit Dublin-Core-Attributen anreichern würden. Dies würde dem Netz ohne großen Aufwand eine große Menge maschinenlesbarer Metadaten einbringen. Eine Twitter-Anfrage an Dublin Core, ob es bereits Bestrebungen in diese Richtung gibt, blieb leider unbeantwortet.

2009-09-17

Plädoyer für ein Twitter-Recherche-Hashtag

Beim Missverstehen der Twitter-Anwendung WeFollow ist mir gestern eine Idee gekommen: Wieso nicht ein Twitter-Hashtag etablieren, das Recherchierende ihrem Tweet hinzufügen, wenn dieser eine Auskunftsanfrage beinhaltet? Auskunftsbibliothekare oder andere, die gerne bei Recherchen weiterhelfen, können sich dieses Hashtag abonnieren und die Anfragen mit hilfreichen Links auf Bibliographien, Kataloge oder andere Informationsquellen beantworten.
Das Ganze wäre sozusagen eine auf Rechercheanfragen spezialisierte Form von Diensten wie AskOnTwitter. Allerdings ist eine spezielle Anwendung für einen solchen Dienst nicht einmal nötig, wenn das ganze über ein Hashtag läuft.

Ist nur noch die Frage, welches Hashtag wir dafür benutzen sollten. Es sollte nicht zu lang sein aber auch noch nicht haufenweise vorkommen, damit man es mit der neuen Funktion besetzen kann. Wie wäre es denn mit #theke? Oder lieber was auf Englisch? #enquiry? #inquiry? #infodesk?

Ich habe direkt mal begonnen...

2009-09-02

Wann ist Digitalität?

Das digitale Zeitalter bzw. "digital age" ist spätestens seit den 90er Jahren in aller Munde. Diese Ausdrücke sind offensichtlich gängige Etiketten für die Bezeichnung des Wandels unserer Gesellschaft zur Wissensgesellschaft, für die Verbreitung von Computer und Internet.

Diese Sprachpraxis zeigt, dass Digitalität meist an die elektronische Übertragbarkeit von Signalen gekoppelt wird. Ein Blick in die englischsprachige Wikipedia genügt indes, um darauf hingewiesen zu werden, dass digitale Medien [1] schon seit Jahrtausenden existieren. Eines der ältesten Beispiele für ein digitales - in diesem Fall sogar binäres - Medium dürfte das Leuchtfeuer sein, welches zwei unterschiedliche Zustände zur Verfügung stellt, um Information zu transportieren: es brennt oder es brennt nicht, an & aus.

Man könnte also behaupten, das digitale Zeitalter habe bereits vor tausenden von Jahren begonnen und die gängige Verwendung des Ausdrucks sei somit unpassend und irreführend. Unpassend und irreführend: ja. Allerdings würde ich jedoch den Beginn der digitalen Ära etwas später ansetzen, frühestens mit der Erfindung der Hieroglyphen um 3000 oder der Alphabetschrift um etwa 1500 bis 800 vor unserer Zeitrechnung. Erst hier hat sich die Praxis etabliert, komplexe Sachverhalte mittels eines Codes, d.h. eines beschränkten Inventars von Zeichen, zu kommunizieren.

Digitalität basiert auf Code

Und es ist der Code, an dessen Verwendung die Existenz von digitalen Medien notwendigerweise gebunden ist. Ein Code ist eine endliche Menge klar unterschiedener Typen. Der Code "Alphabet" zum Beispiel besteht aus 26 Buchstabentypen. Typen sind Klassen, abstrakte Entitäten. Schließlich würde niemand behaupten, er habe den Buchstaben 'A' gesehen, denn: Das 'A' gibt es nicht, ich sehe immer nur ein bestimmtes 'A'. Die einzelnen sichtbaren Erscheinungsweisen (die Token) eines Buchstaben sind äquivalent, untereinander austauschbar. Dies zeigt sich etwa darin, dass wir unzählige verschiedene Schriftarten haben, die sich miteinander kombinieren lassen und dennoch das Geschriebene nicht unleserlich machen.

Ein Code ist nie - wie Derrida schreibt - „strukturell geheim“. Selbst, wenn ich eine Schriftsprache nicht verstehe, kann ich den dahinterliegenden Code (das Alphabet) herausfinden und ihn wiedergeben. Bei der gesprochenen Sprache hingegen existiert ein solcher Code nicht, sie ist analog. Die Struktur einer oralen Sprache herausfinden heißt, diese Sprache verstehen. Ohne jedes Verstehen des Geäußerten sind die wahrgenommenen Laute nur Geräusch.

Digitales Zeitalter vs. Bitzeitalter

Was soll das Ganze hier? Texte sind digital, das Internet ist digital, wollen wir sie verstehen, müssen wir die Digitalität verstehen. Auch müssen wir Schrift und Computer(programm) unterscheiden können, um die Revolution, den Wandel verstehen zu können, den Computer und Internet mit sich bringen. In einem früheren Beitrag habe ich schon ein Phänomen beleuchtet, wo (Autoren-)Probleme dem Computer oder Internet zugeschrieben wurden, die sich letztlich auf die ursprünglichere Digitalität der Schrift gründen. Gerade mit der Entfaltung des Bitzeitalters (wie ich es jetzt mal nenne) ist meines Erachtens eine differenzierte Betrachtung angebracht, will man die Ursachen und Zusammenhänge bestimmter Phänomene und Probleme ergründen.

Was macht nun das Bitzeitalter aus? Was sind seine Eigentümlichkeiten? Welche zusätzlichen Features (und Bugs) bringt es mit sich?
Der Binärcode ist Resultat maximaler Reduktion - er besteht nur aus zwei Typen: ja/nein, an/aus. Elektronische Speicherung und Übertragung machen nun auch die Token nahezu körperlos, so dass Informationen
sich problemlos und massenhaft kopieren und transportieren lassen und überall und jederzeit abrufbar sind. Dennoch können die Tokens wiederum nicht ohne körperliche Trägermedien existieren. Zudem ist für Menschen der Binärcode selbst nicht lesbar und somit untrennbar an Hard- und Software gebunden, die ihn lesbar machen. Hieraus ergeben sich dann etwa die Probleme der digitalen Langzeitarchivierung.

Welche weiteren Möglichkeiten und Probleme bringt das Bitzeitalter mit sich? Was sind die Eigentümlichkeiten von Programmcode, Hypertext und XML? Ich bin sicher, dass ich auf diese und andere Fragen zurückkommen werde. Zunächst bin ich aber mit diesen zwar grundlegenden aber nicht
tiefgehenden, weil knappen Ausführungen am Ende angelangt.

[1] Im Unterschied zur gängigen Verwendung des Ausdrucks 'Medium' für körperliche Kommunikationsmittel (Fernsehen, Radio, Buch, Zeitung etc.) gebrauche ich einen weiten Medienbegriff, der auch Schrift, orale Sprache, Malerei usw. umfasst.

Quellen:
Mein Verständnis des Digitalen speist sich aus den Texten "Sprachen der Kunst" (hier: Kapitel IV) und "Revisionen" (hier: Kapitel VIII) von Nelson Goodman, der die Digitalität akribisch mithilfe logischer Terminologie definiert. Der Text "Signatur. Ereignis. Kontext" (u.a. hier (S.68-109) erschienen) von Jacques Derrida ist auch sehr aufschlussreich.

2009-08-17

minibib: Bibliothek im Park

Was sah ich da gestern bei einem kleinen Familienausflug im Stadtgarten Kölns: ein kleines, feines neues Häuschen, das zudem noch Bücher beherbergt. Ein zweiter Blick brachte Sicherheit. Da ist, ohne dass ich es mitbekommen hätte, die erste "Minibib" Deutschlands in Köln aufgestellt worden. Die Eröffnung fand schon am 30. Juni dieses Jahres statt. (Vielleicht sollte ich doch einmal den Lokalmedien mehr Aufmerksamkeit schenken...)

Ein nettes Konzept: Bibliothek ohne Computer, ohne Ausweise und ohne Bibliothekare. Allein etwa 1000 Bücher verschiedener Sparten (Kinder-, Jugend- & Sachbücher, Romane) warten darauf ausgeliehen und gelesen zu werden. Die Bücher werden aus Schenkungen an die Stadtbibliothek ausgewählt und in der Minibib aufgestellt. Eine
ehrenamtliche Person berät und informiert und passt auf, dass jedeR nur ein Buch ausleiht und nichts durcheinander kommt. Die Leihfrist beträgt zwei Wochen, allerdings ist das eher ein Richtwert - kontrollieren kann und will es ja niemand. Eine kleine Strichliste dient dem Überblick über Ausleihen und Rückgaben. Wie mir die ehrenamtliche Mitarbeiterin gestern bestätigte, übertrifft der Rücklauf die optimistischsten Erwartungen. Das Vertrauensprinzip scheint aufzugehen.

Wir jedenfalls nahmen diese Gelegenheit zu einer kleinen Ruhepause mit Kinderbüchern gerne wahr und werden sicher auch in Zukunft öfter mal vorbeischauen...

Weitere Infos unter http://www.stbib-koeln.de/foerderverein/index.htm