2016-11-11

Stöbergraph

Yewno, gegründet 2011, ist ein durch Venture Capital finanziertes Unternehmen, das laut Selbstbeschreibung eine "Inferenz- und Analyse-SaaS-Plattform im Bereich Knowledge Discovery" anbietet:

Yewno, Inc. (“Yewno”) is a inference and analytics software as a service platform in the field of knowledge discovery; Yewno is the starting point that delivers infinite knowledge potential by displaying paths of information for you to navigate on your research journey. (Quelle)

Seit Juni 2016 wird das Produkt "Yewno for Education" im Beta-Stadium angeboten. Ein "Yewno for Finance" ist in Entwicklung. Hier geht es um ersteres. Eine öffentlich zugängliche Yewno-Testversion gibt es derzeit nicht. Dementsprechend habe ich den Dienst nicht testen können. Die Informationen in diesem Post stammen zum Großteil aus einem Scholarly-Kitchen-Artikel von Jill O'Neill und einem Beitrag im Rahmen der Buchmesse.

Datenbasis und Kooperationspartner

Yewno sammelt und prozessiert große Mengen von wissenschaftlichen Text, um anhand von linguistischer Datenverarbeitung und maschinellem Lernen Beziehungsnetze zu generieren, die schließlich visualisiert und durchstöbert werden können. Ein Blick auf die GitHub legt nahe, dass auch Wikipedia bzw. Wikidata einen Teil beiträgt zur Generierung der Verknüpfungen. Allerdings spielen Volltext eine zentrale Rolle und Yewno betreibt eine Menge Aufwand, um an große Mengen von Volltexten zu kommen. Laut dem genannten Buchmesse-Beitrag sind Verträge mit Oxford University Press, Stanford University Press, Springer Nature und Taylor & Francis Group geschlossen. Die Datenbasis umfasse "50 Millionen hochwertigen wissenschaftlichen Dokumenten, Artikeln und Büchern" und eine Verdopplung bis Weihnachten 2016 sei geplant. Offensichtlich zielt Yewno derzeit auf die Geisteswissenschaften, mit meta.com gibt es im STM-Bereich auch schon eine sehr ähnliche Lösung.

Acht Bibliotheken testen derzeit die Beta-Version: Harvard, Stanford, MIT, University of Michigan, University of California–Berkeley, Stonehill College, Oxford University und die Bayerische Staatbibliothek. Es verwundert nicht, dass die meisten dieser Institutionen ihre Bestände im Rahmen des Google-Book-Projekts digitalisieren. Man kann wohl davon ausgehen, dass auch diese Bestände in die Yewno-Datenbasis eingeflossen sind.

Visualisierung verknüpfter Konzepte, Snippets und Weiterleitung zum Volltext

Yewno ist als ein "Entdeckungswerkzeug" in Ergänzung zu klassischen Recherchesystemen konzipiert. Es richtet sich eher an Neulinge in einem bestimmten Gebiet, die sich zunächst einen Überblick verschaffen und dann möglicherweise tiefer einsteigen wollen. Den Kern von Yewno macht ein Netzwerk von Konzepten aus, das aus dem von Yewno zusammengetragenen Literaturkorpus generiert und anhand eines interaktiven Graphen visualisiert wird. Die Konzepte sind mit relevanten Literaturquellen verknüpft, aus denen Snippets angezeigt werden. Auf Basis des lizenzierten elektronischen – und mutmaßlich auch des gedruckten – Bestands der Bibliothek, wird der Nutzer – wenn erwünscht und vorhanden – zum Volltext geleitet.

Da ich das Tool nicht getestet habe und die YouTube-Videos wenig hergeben, kann ich nichts dazu sagen wie gut Yewno seine Versprechen erfüllt. Es scheint sich aber durchaus um einen interessanten Ansatz zu handeln, der – sei es durch Yewno oder ähnliche andere Produkte – traditionelle Discovery-Systeme in Zukunft ergänzen könnte. Schade, dass so etwas auf einer geschlossenen Datenbasis aufsetzt und nicht auf einem offenen Korpus von Open-Access-Dokumenten...