Perspektiv-AG – Kataloganreicherung

Neulich musste ich in der Perspektiv-AG des hbz meine Gedanken zur Zukunft der Kataloganreicherung geben. Hier sind sie:

Perspektiv-AG – Kataloganreicherung

Ich glaube, dass Kataloganreicherung, so wie wir es jetzt betreiben, nur ein vorübergehendes Phänomen sein wird. Daten wie Inhaltsverzeichnisse sind ein wertvoller Dienst an den Nutzer und steigern die Effizienz der Bibliothek, aber Google zeigt bereits den Trend: Die Endnutzer wollen nicht nur Inhaltsverzeichnisse, sie wollen die Volltexte. Der folgende Satz sollte hier im Raum bleiben, denn ich habe ihn vertraulich erhalten: Stefan Gradmann hat für die DNB ein Gutachten, u.a. über Kataloganreicherung erstellt, und ist genau zu diesem Schluss gekommen: Kataloganreicherung mit Inhaltsverzeichnissen ist nicht das das Ziel, sondern nur eine erste Übung um das zu erreichen, was Nutzer wirklich wollen: Volltextdigitalisierung.

Die Zukunft liegt in der Volldigitalisierung von Büchern und darum sollten wir unseren Fokus noch mehr in diese Richtung wenden. Mit ZVDD und ScanToWeb wurde bereits ein Anfänge gemacht, aber es sind zaghafte Anfänge. Wenn wir in diese Richtung fortgehen wollen, müssten wir die Volltexte nicht nur, über bibliographische Metadaten gut erschlossen, anbieten, sondern auch die Volltexte selbst durchsuchbar machen. Mit der Verbunddatenbank stoßen wir da an unsere Grenzen. Sinnvoll wäre der Einsatz von Suchmaschinentechnologie.

Allerdings hat Kataloganreicherung, so wie wir es betreiben, einen Vorteil gegenüber Volltextindexierung. Inhaltsverzeichnisse geben den Inhalt eines Buches in sehr konzentrierter Form wieder. Der Wortschatz, der dort benutzt wird ist ein sehr relevanter, d.h. Suchen über Inhaltsverzeichnisse führen zu mehr relevanten Treffern als Suchen über den gesamten Volltext. Dies könnte zu einem Vorteil werden, wenn man also nicht nur die Volltexte indexiert, sondern eine weitere Suche auch über Inhaltsverzeichnisse und Register. Ich nenne eine solche Suche jetzt mal „Relevanz Plus“. Das wäre ein Mehrwert gegenüber anderen Suchmaschinen, die Volltexte von Büchern durchsuchbar machen.

Die Digitalisierung von Büchern macht einen Wandel durch. Die DFG macht heute recht strenge Vorgaben, z.B. müssen Strukturdaten erfasst werden. Und genau diese Strukturdaten könnten gebraucht werden um die „Relevanz Plus“-Suche anzubieten.

Was nun von den traditionellen bibliographischen Metadaten? Wenn man so über Volltextindexierung redet, könnte man meinen, sie seien nicht mehr nötig. Das ist aber nicht der Fall. Eine Known-Item-Suche – und die ist bei etablierten Forschern eher der Fall –  ist immer noch am besten über bibliographische Metadaten zu händeln. Außerdem brauchen wir bibliothekarische Metadaten für die verschiedenen Workflows in den Bibliotheken. Was ich allerdings als schwierig empfinde ist, dass bibliothekarische Metadaten getrennt von z.B. Volltexten gehändelt werden. Bibliothekarische Systeme wie die Verbunddatenbank können nur die bibliographischen Daten händeln. Die einzige Lösung, die ich sehe ist über Suchmaschinentechnologie. Eine Suchmaschine müsste diese Daten mit Volltexten und differenziertere Suche über Strukturdaten vereinigen.

Wenn wir eine solche Suchmaschine anbieten könnten, und wenn diese Suchmaschine auch noch offen wäre für andere Metadatenformate aus dem Museums- und Archivbereich, wären wir ein ganz heißer Kandidat für die technische Plattform für die Deutsche Digitale Bibliothek.

Eine weitere Möglichkeit der Kataloganreicherung möchte ich noch ansprechen, die vor allem damit zu tun hat, dass nur 20% unserer Titel sacherschlossen sind: Web 2.0-Funktionalitäten wie Tagging und Annotationen. Es gibt bereits Möglichkeiten solche Features auch anzubieten, z.B. durch eine Verknüpfung mit LibraryThing, aber dadurch wird diese Funktionalität und die Vorteile, die diese Funktionalitäten bieten, z.B. eine Suche über Tags, ausgelagert. Anderseits ist es auch unsinnig, dass jeder Verbund oder Bibliothek für sich diese Funktionalitäten entwickelt, denn sie sind nur wirklich gut, wenn Masse da ist. Hier würde ein zentrales Repository wirklich sinnvoll. Aber diese Überlegungen sind noch sehr unausgegoren. Es wäre aber vielleicht eine Möglichkeit einen weiteren Mehrwert für die Endnutzer anzubieten und müsste deswegen untersucht werden.

Ein Gedanke zu „Perspektiv-AG – Kataloganreicherung

  1. Als wir erstmals 1996 mit Schweizer Sortiment (Abbruch nach 150 Inhaltsverzeichnissen) und dann 2001/2002 mit der Vorarlberger Landesbibliothek die Kataloganreicherung über Inhaltsverzeichnisse starteten, ging es immer primär um Erschließung und Information Retrieval. Die Anzeige der TOCs ist ein sehr schöner und nützlicher Nebeneffekt, sobald man etwas gefunden hat.

    Die Bereitstellung der Volltexte ist ein zweiter Aspekt, der stets klassisch oder digital erfolgen muss. Aber dieses Stock-Management sollte man nicht mit Retrieval verwechseln.

    Seit 1994 nutzen wir mit IBM Domino (damals noch Lotus Notes) eine Datenbanktechnologie, die sowohl die strukturierten Metadaten, die Inhaltsverzeichnisse (mit PDF, TXT, TIF oder anderen Formaten) als auch Volltexte in einem Record speichern und volltext suchen kann. Wir nutzen die gleiche Speichertechnologie auch für 500.000 Zeitungsseiten im Volltext, ganze Buchreihen, Zeitschriften, Parlamentsschriften, 250.000 Covere Pages und andere, teils große Web-Inhalte. Es gibt auch andere Datenbanktechnologien, die ähnliches können. Die Bibliotheken haben diese Technologien nicht rechtzeitig gefordert. Heute lagern die großen Anbieter die kompletten Inhalte in ihre Cloud aus – und machen die Bibliotheken solange noch abhängig, bis die Volltexte dort komplett sind und die Bibliotheken vor Ort kaum noch nötig sind.

    Doch ob alles digital bereitsteht und auch nachgefragt wird, muss sich erst noch beweisen. Da nicht mal die Steine als Schrifttafeln verschwunden sind – siehe Friedhöfe – wird Papier sich gewiss noch lange halten. Was ist ein Wohnzimmer, eine Studierstube mit nur einem Kindel an der Wand?
    http://www.agi-imc.de, Manfred Hauer

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert