Suche über Kataloganreicherungsdaten

Kataloganreicherung – die Ergänzung von bibliographischen Metadaten mit Inhaltsverzeichnissen, Klappentexten, Probekapiteln, Register, u.ä. – ist schon seid einiger Zeit “Business as usual” in der Welt der wissenschaftlichen Bibliotheken. Alle Bibliotheksverbünde in Deutschland bieten die Daten als Dienstleistung an. Bibliotheken scannen vor allem Inhaltsverzeichnisse und laden diese in Repositorien wo sie mit den bibliographischen Daten in den Verbunddatenbanken verlinkt werden. So gelangen diese Daten, oder zumindest die Links zu ihnen, in die Lokalsysteme.

Die wohl gängigste Nutzung dieser Informationen ist ein Aufruf des Inhaltsverzeichnisses oder anderer Daten durch den Bibliotheksbenutzer um festzustellen, ob das Buch, das ihn interessiert, auch wirklich für seine Nachfrage relevant ist. So werden Fehlausleihen und –fernleihen vermieden und das freut nicht nur den Nutzer, sondern auch die Bibliothek.

Es gibt aber einen weiteren Grund für Kataloganreicherung: eine tiefere Erschließung der Bücher und Zeitschriften. Bibliothekarische Formalerschließung hört auf der Titelebene auf und verbale Sacherschließung wird, laut Haubfleisch und Siebert (2008, S. 385) aus Zeit- und Kostengründen nicht realisiert. Es kann nicht nach einzelnen Aufsätzen in Sammelbänden oder bei Büchern mit nichtssagenden Titeln auf Kapitelebene gesucht werden. Wenn Kataloganreichrungsdaten durchsuchbar gemacht werden, ist dieses Problem zum großen Teil[1] gelöst. Für die Bibliotheksbenutzerin erhöhen sich die Chancen, Information, die sie braucht, zu finden. Für die Bibliothek hat dies das erfreuliche Ergebnis, dass eine Nichtnutzung der Medien verringert wird.

Während das Verlinken der Kataloganreichrungsdaten mit den Metadaten gängige Praxis ist, so ist die Erschließung über diese Daten, bzw. das Angebot einer Suche über Inhaltsverzeichnisse und ähnliches in nur wenigen Bibliotheken realisiert, da dies nicht so ohne weiteres technisch umgesetzt werden kann. Es ist schade, dass das Potential der Kataloganreicherung nicht voll ausgenutzt wird, zumal sehr viel Geld und Aufwand in sie investiert wurde.

Mich würde zu dem Thema Erschließung über Kataloganreicherung folgendes interessieren:

  • In welchen Bibliotheken und anderen Institutionen wird eine Suche über Kataloganreicherungsdaten angeboten oder ist ein solches Angebot geplant?
  • Wie wird das technisch umgesetzt? Werden die Kataloganreicherungsdaten als Teil der bibliografischen Metadaten indexiert? Wird Suchmaschinentechnologie eingesetzt? Mit welchen Problemen werden sie dabei konfrontiert?
  • Wenn keine Suche über Kataloganreicherungsdaten angeboten wird und das auch nicht geplant ist: Warum nicht?

Fußnoten:

1. “zum größten Teil”, weil die Daten natürlich nicht formal- und sacherschlossen, z.B. mit Normdaten verknüpft, angeboten werden, sondern nur als Text vorliegen. Haubfleisch und Siebert (2008, S. 385) sagen dazu: “Durch Catalogue Enrichment können diese umfangreichen und sehr spezifischen Informationen nun erstmals, zwar nicht regelgerecht, aber ressourcenschonend, zusätzlich zu den Ergebnissen der weiterhin erforderlichen bibliothekarischen Sacherschließung bereitgestellt werden.”

Quellenangabe:

Haubfleisch, Dietmar; Siebert, Irmgard (2008): Catalogue Enrichment in Nordrhein-Westfalen : Geschichte, Ergebnisse, Perspektiven. In: Bibliotheksdienst 42 (5), S. 384–391.

Kataloganreicherungsdaten als Linked Open Data

Peter Mayr berichtet in seinem Blog darüber, wie Kataloganreicherungsdaten als Linked Open Data verwendet werden:
Offene Katalogdaten in freier Wildbahn gesichtet!

Es handelt sich dabei um die ISBN-Suche, die von der deutschen Wikipedia angeboten wird. Dieser Dienst bietet die Möglichkeit nach ISBN in allen möglichen Katalogen zu suchen. Aber es gibt auch „isbn2toc“, die die digitalisierten Inhaltsverzeichnisse zu den Büchern herausgeben.

Dieser Dienst erfreut mich gleich zweimal:

  1. Erstens glaube ich, dass Kataloganreicherungsdaten wie Inhaltsverzeichnisse einen echten Mehrwert für die Nutzer von Bibliotheks- und anderen Katalogen bieten. Die klassischen bibliografischen Daten reichen dem Bibliotheksnutzer oft nicht aus, um festzustellen, ob das Buch, das beschrieben wurde, wirklich ein Buch ist, dass seinem Informationsbedürfnis entspricht. Und die klassischen Bibliothekskataloge erschließen die Bücher oft nicht tief genug, so dass vor allem bei Konferenzbänden und Sammelschriften kein Nachweis über Autoren und Titel der einzelnen Aufsätze bzw. Vorträge im Katalog vorhanden ist. Die Tatsache, dass die Wikipedia diesen Dienst anbietet, zeigt, dass wir Bibliothekare in unserer Einschätzung recht haben und durch Kataloganreicherung einen echten Mehrwert bieten.
  2. Zweitens glaube ich, dass durch (Linked) Open Data unsere Daten von anderen nachgenutzt werden können und innovative, nicht-bibliothekarische Dienstleistungen entstehen können. Wir haben viel in die Erstellung der Daten investiert und je mehr die Daten genutzt werden, desto mehr lohnt sich die Investition. Durch die Freigabe der Daten können nicht nur Bibliotheken, sondern auch andere Institutionen coole Dienste anbieten.

Danke, Peter, für den Hinweis.

Catalogue Enrichment im hbz

Heute habe ich im hbz eine Präsentation zu Catalog Enrichment gegeben. Dabei habe ich das Angebot von Amazon mit denen des Verbundkatalogs verglichen und versucht die Fragen „Warum ist Kataloganreicherung wichtig?“ sowie „Wie reichern wir beim hbz den Verbundkatalog (und somit die Lokalsysteme) an?“ zu beantworten.

Hier meine Präsentation auf Slideshare:

Perspektiv-AG – Kataloganreicherung

Neulich musste ich in der Perspektiv-AG des hbz meine Gedanken zur Zukunft der Kataloganreicherung geben. Hier sind sie:

Perspektiv-AG – Kataloganreicherung

Ich glaube, dass Kataloganreicherung, so wie wir es jetzt betreiben, nur ein vorübergehendes Phänomen sein wird. Daten wie Inhaltsverzeichnisse sind ein wertvoller Dienst an den Nutzer und steigern die Effizienz der Bibliothek, aber Google zeigt bereits den Trend: Die Endnutzer wollen nicht nur Inhaltsverzeichnisse, sie wollen die Volltexte. Der folgende Satz sollte hier im Raum bleiben, denn ich habe ihn vertraulich erhalten: Stefan Gradmann hat für die DNB ein Gutachten, u.a. über Kataloganreicherung erstellt, und ist genau zu diesem Schluss gekommen: Kataloganreicherung mit Inhaltsverzeichnissen ist nicht das das Ziel, sondern nur eine erste Übung um das zu erreichen, was Nutzer wirklich wollen: Volltextdigitalisierung.

Die Zukunft liegt in der Volldigitalisierung von Büchern und darum sollten wir unseren Fokus noch mehr in diese Richtung wenden. Mit ZVDD und ScanToWeb wurde bereits ein Anfänge gemacht, aber es sind zaghafte Anfänge. Wenn wir in diese Richtung fortgehen wollen, müssten wir die Volltexte nicht nur, über bibliographische Metadaten gut erschlossen, anbieten, sondern auch die Volltexte selbst durchsuchbar machen. Mit der Verbunddatenbank stoßen wir da an unsere Grenzen. Sinnvoll wäre der Einsatz von Suchmaschinentechnologie.

Allerdings hat Kataloganreicherung, so wie wir es betreiben, einen Vorteil gegenüber Volltextindexierung. Inhaltsverzeichnisse geben den Inhalt eines Buches in sehr konzentrierter Form wieder. Der Wortschatz, der dort benutzt wird ist ein sehr relevanter, d.h. Suchen über Inhaltsverzeichnisse führen zu mehr relevanten Treffern als Suchen über den gesamten Volltext. Dies könnte zu einem Vorteil werden, wenn man also nicht nur die Volltexte indexiert, sondern eine weitere Suche auch über Inhaltsverzeichnisse und Register. Ich nenne eine solche Suche jetzt mal „Relevanz Plus“. Das wäre ein Mehrwert gegenüber anderen Suchmaschinen, die Volltexte von Büchern durchsuchbar machen.

Die Digitalisierung von Büchern macht einen Wandel durch. Die DFG macht heute recht strenge Vorgaben, z.B. müssen Strukturdaten erfasst werden. Und genau diese Strukturdaten könnten gebraucht werden um die „Relevanz Plus“-Suche anzubieten.

Was nun von den traditionellen bibliographischen Metadaten? Wenn man so über Volltextindexierung redet, könnte man meinen, sie seien nicht mehr nötig. Das ist aber nicht der Fall. Eine Known-Item-Suche – und die ist bei etablierten Forschern eher der Fall –  ist immer noch am besten über bibliographische Metadaten zu händeln. Außerdem brauchen wir bibliothekarische Metadaten für die verschiedenen Workflows in den Bibliotheken. Was ich allerdings als schwierig empfinde ist, dass bibliothekarische Metadaten getrennt von z.B. Volltexten gehändelt werden. Bibliothekarische Systeme wie die Verbunddatenbank können nur die bibliographischen Daten händeln. Die einzige Lösung, die ich sehe ist über Suchmaschinentechnologie. Eine Suchmaschine müsste diese Daten mit Volltexten und differenziertere Suche über Strukturdaten vereinigen.

Wenn wir eine solche Suchmaschine anbieten könnten, und wenn diese Suchmaschine auch noch offen wäre für andere Metadatenformate aus dem Museums- und Archivbereich, wären wir ein ganz heißer Kandidat für die technische Plattform für die Deutsche Digitale Bibliothek.

Eine weitere Möglichkeit der Kataloganreicherung möchte ich noch ansprechen, die vor allem damit zu tun hat, dass nur 20% unserer Titel sacherschlossen sind: Web 2.0-Funktionalitäten wie Tagging und Annotationen. Es gibt bereits Möglichkeiten solche Features auch anzubieten, z.B. durch eine Verknüpfung mit LibraryThing, aber dadurch wird diese Funktionalität und die Vorteile, die diese Funktionalitäten bieten, z.B. eine Suche über Tags, ausgelagert. Anderseits ist es auch unsinnig, dass jeder Verbund oder Bibliothek für sich diese Funktionalitäten entwickelt, denn sie sind nur wirklich gut, wenn Masse da ist. Hier würde ein zentrales Repository wirklich sinnvoll. Aber diese Überlegungen sind noch sehr unausgegoren. Es wäre aber vielleicht eine Möglichkeit einen weiteren Mehrwert für die Endnutzer anzubieten und müsste deswegen untersucht werden.