Perspektiv-AG – Kataloganreicherung

Neulich musste ich in der Perspektiv-AG des hbz meine Gedanken zur Zukunft der Kataloganreicherung geben. Hier sind sie:

Perspektiv-AG – Kataloganreicherung

Ich glaube, dass Kataloganreicherung, so wie wir es jetzt betreiben, nur ein vorübergehendes Phänomen sein wird. Daten wie Inhaltsverzeichnisse sind ein wertvoller Dienst an den Nutzer und steigern die Effizienz der Bibliothek, aber Google zeigt bereits den Trend: Die Endnutzer wollen nicht nur Inhaltsverzeichnisse, sie wollen die Volltexte. Der folgende Satz sollte hier im Raum bleiben, denn ich habe ihn vertraulich erhalten: Stefan Gradmann hat für die DNB ein Gutachten, u.a. über Kataloganreicherung erstellt, und ist genau zu diesem Schluss gekommen: Kataloganreicherung mit Inhaltsverzeichnissen ist nicht das das Ziel, sondern nur eine erste Übung um das zu erreichen, was Nutzer wirklich wollen: Volltextdigitalisierung.

Die Zukunft liegt in der Volldigitalisierung von Büchern und darum sollten wir unseren Fokus noch mehr in diese Richtung wenden. Mit ZVDD und ScanToWeb wurde bereits ein Anfänge gemacht, aber es sind zaghafte Anfänge. Wenn wir in diese Richtung fortgehen wollen, müssten wir die Volltexte nicht nur, über bibliographische Metadaten gut erschlossen, anbieten, sondern auch die Volltexte selbst durchsuchbar machen. Mit der Verbunddatenbank stoßen wir da an unsere Grenzen. Sinnvoll wäre der Einsatz von Suchmaschinentechnologie.

Allerdings hat Kataloganreicherung, so wie wir es betreiben, einen Vorteil gegenüber Volltextindexierung. Inhaltsverzeichnisse geben den Inhalt eines Buches in sehr konzentrierter Form wieder. Der Wortschatz, der dort benutzt wird ist ein sehr relevanter, d.h. Suchen über Inhaltsverzeichnisse führen zu mehr relevanten Treffern als Suchen über den gesamten Volltext. Dies könnte zu einem Vorteil werden, wenn man also nicht nur die Volltexte indexiert, sondern eine weitere Suche auch über Inhaltsverzeichnisse und Register. Ich nenne eine solche Suche jetzt mal „Relevanz Plus“. Das wäre ein Mehrwert gegenüber anderen Suchmaschinen, die Volltexte von Büchern durchsuchbar machen.

Die Digitalisierung von Büchern macht einen Wandel durch. Die DFG macht heute recht strenge Vorgaben, z.B. müssen Strukturdaten erfasst werden. Und genau diese Strukturdaten könnten gebraucht werden um die „Relevanz Plus“-Suche anzubieten.

Was nun von den traditionellen bibliographischen Metadaten? Wenn man so über Volltextindexierung redet, könnte man meinen, sie seien nicht mehr nötig. Das ist aber nicht der Fall. Eine Known-Item-Suche – und die ist bei etablierten Forschern eher der Fall –  ist immer noch am besten über bibliographische Metadaten zu händeln. Außerdem brauchen wir bibliothekarische Metadaten für die verschiedenen Workflows in den Bibliotheken. Was ich allerdings als schwierig empfinde ist, dass bibliothekarische Metadaten getrennt von z.B. Volltexten gehändelt werden. Bibliothekarische Systeme wie die Verbunddatenbank können nur die bibliographischen Daten händeln. Die einzige Lösung, die ich sehe ist über Suchmaschinentechnologie. Eine Suchmaschine müsste diese Daten mit Volltexten und differenziertere Suche über Strukturdaten vereinigen.

Wenn wir eine solche Suchmaschine anbieten könnten, und wenn diese Suchmaschine auch noch offen wäre für andere Metadatenformate aus dem Museums- und Archivbereich, wären wir ein ganz heißer Kandidat für die technische Plattform für die Deutsche Digitale Bibliothek.

Eine weitere Möglichkeit der Kataloganreicherung möchte ich noch ansprechen, die vor allem damit zu tun hat, dass nur 20% unserer Titel sacherschlossen sind: Web 2.0-Funktionalitäten wie Tagging und Annotationen. Es gibt bereits Möglichkeiten solche Features auch anzubieten, z.B. durch eine Verknüpfung mit LibraryThing, aber dadurch wird diese Funktionalität und die Vorteile, die diese Funktionalitäten bieten, z.B. eine Suche über Tags, ausgelagert. Anderseits ist es auch unsinnig, dass jeder Verbund oder Bibliothek für sich diese Funktionalitäten entwickelt, denn sie sind nur wirklich gut, wenn Masse da ist. Hier würde ein zentrales Repository wirklich sinnvoll. Aber diese Überlegungen sind noch sehr unausgegoren. Es wäre aber vielleicht eine Möglichkeit einen weiteren Mehrwert für die Endnutzer anzubieten und müsste deswegen untersucht werden.