Suche über Kataloganreicherungsdaten

Kataloganreicherung – die Ergänzung von bibliographischen Metadaten mit Inhaltsverzeichnissen, Klappentexten, Probekapiteln, Register, u.ä. – ist schon seid einiger Zeit “Business as usual” in der Welt der wissenschaftlichen Bibliotheken. Alle Bibliotheksverbünde in Deutschland bieten die Daten als Dienstleistung an. Bibliotheken scannen vor allem Inhaltsverzeichnisse und laden diese in Repositorien wo sie mit den bibliographischen Daten in den Verbunddatenbanken verlinkt werden. So gelangen diese Daten, oder zumindest die Links zu ihnen, in die Lokalsysteme.

Die wohl gängigste Nutzung dieser Informationen ist ein Aufruf des Inhaltsverzeichnisses oder anderer Daten durch den Bibliotheksbenutzer um festzustellen, ob das Buch, das ihn interessiert, auch wirklich für seine Nachfrage relevant ist. So werden Fehlausleihen und –fernleihen vermieden und das freut nicht nur den Nutzer, sondern auch die Bibliothek.

Es gibt aber einen weiteren Grund für Kataloganreicherung: eine tiefere Erschließung der Bücher und Zeitschriften. Bibliothekarische Formalerschließung hört auf der Titelebene auf und verbale Sacherschließung wird, laut Haubfleisch und Siebert (2008, S. 385) aus Zeit- und Kostengründen nicht realisiert. Es kann nicht nach einzelnen Aufsätzen in Sammelbänden oder bei Büchern mit nichtssagenden Titeln auf Kapitelebene gesucht werden. Wenn Kataloganreichrungsdaten durchsuchbar gemacht werden, ist dieses Problem zum großen Teil[1] gelöst. Für die Bibliotheksbenutzerin erhöhen sich die Chancen, Information, die sie braucht, zu finden. Für die Bibliothek hat dies das erfreuliche Ergebnis, dass eine Nichtnutzung der Medien verringert wird.

Während das Verlinken der Kataloganreichrungsdaten mit den Metadaten gängige Praxis ist, so ist die Erschließung über diese Daten, bzw. das Angebot einer Suche über Inhaltsverzeichnisse und ähnliches in nur wenigen Bibliotheken realisiert, da dies nicht so ohne weiteres technisch umgesetzt werden kann. Es ist schade, dass das Potential der Kataloganreicherung nicht voll ausgenutzt wird, zumal sehr viel Geld und Aufwand in sie investiert wurde.

Mich würde zu dem Thema Erschließung über Kataloganreicherung folgendes interessieren:

  • In welchen Bibliotheken und anderen Institutionen wird eine Suche über Kataloganreicherungsdaten angeboten oder ist ein solches Angebot geplant?
  • Wie wird das technisch umgesetzt? Werden die Kataloganreicherungsdaten als Teil der bibliografischen Metadaten indexiert? Wird Suchmaschinentechnologie eingesetzt? Mit welchen Problemen werden sie dabei konfrontiert?
  • Wenn keine Suche über Kataloganreicherungsdaten angeboten wird und das auch nicht geplant ist: Warum nicht?

Fußnoten:

1. “zum größten Teil”, weil die Daten natürlich nicht formal- und sacherschlossen, z.B. mit Normdaten verknüpft, angeboten werden, sondern nur als Text vorliegen. Haubfleisch und Siebert (2008, S. 385) sagen dazu: “Durch Catalogue Enrichment können diese umfangreichen und sehr spezifischen Informationen nun erstmals, zwar nicht regelgerecht, aber ressourcenschonend, zusätzlich zu den Ergebnissen der weiterhin erforderlichen bibliothekarischen Sacherschließung bereitgestellt werden.”

Quellenangabe:

Haubfleisch, Dietmar; Siebert, Irmgard (2008): Catalogue Enrichment in Nordrhein-Westfalen : Geschichte, Ergebnisse, Perspektiven. In: Bibliotheksdienst 42 (5), S. 384–391.

3 Gedanken zu “Suche über Kataloganreicherungsdaten

  1. Liebe Frau Seiler,

    die ULB Münster macht in ihrem Suchmaschinen basierten Angebot disco gescannte Inhaltsverzeichnisse durchsuchbar. Momentan sind etwa 320.000 gescannte Inhaltsverzeichnisse aus dem hbz Verbund und von der DNB in die Suche integriert.

    Die Qualität der Suchergebnisse konnte signifikant gesteigert werden. Aufgrund der verfügbaren Daten gilt dies momentan insb. für deutschsprachige Titel neueren Datums. Beispiel: Isopren

    Aufgrund der positiven Resonanz durch die Nutzer plant die ULB Münster diesen Service auszubauen.

    Für weitere Informationen siehe http://www.ulb.uni-muenster.de/forum/nachrichten/2012-02-07_disco-suche.html.

    Beste Grüße
    Holger Przibytzin

  2. Hallo, Herr Przibytzin,

    danke für Ihre Antwort. Ich habe in disco nach „Bill Clinton“ gesucht, weil ich weiß, dass er auch Autor von Aufsätzen in Sammelbänden ist, bei denen sein Name nicht in den üblichen Metadaten vorkommt. Dabei habe ich auch Treffer aus Inhaltsverzeichnissen gefunden. Einige sind relevant zu dem, was ich suche, andere waren es nicht (wenn z.B. „Hillary CLINTON“ und „BILLof Rights“ gefunden wurde. Wichtig finde ich, dass ein Auszug aus dem Inhaltsverzeichnis gefunden wurde, der mir zeigt, wie es zu dem Treffer kam und über den ich, ohne erst aufs Inhaltsverzeichnis zu klicken, feststellen konnte, ob das Buch relevant ist. Schöne Sache!
    Viele Grüße
    Anette Seiler

  3. Mit bisher 1,7 Millionen Inhaltsverzeichnissen (Feb 2013) aus über 120 Sprachen konnten wir mit und für Bibliotheke die Suche in Bibliotheken nachhaltig verbessern. Wir produzieren u.a. für die DNB und tauschen über Verbünde die Daten seit 2006 aus.
    Seit 2002 werden die Texte der TOCs mit computerlinguistischen Verfahren analysiert und extrahiert, ja diese Indexierungsoption war der Grund für die Entwicklungen, Scanning und OCR eine nötige Vorstufe, wo keine digitalen Texte bereitstehen. Die Resultate der maschinellen Indexierung sind in JEDEM Bibliothekssystem suchbar, wenn man denn die Daten einspielt. Seit Sommer 2003 wird die „gesharte“ Kollektion in http://www.dandelon.com mittels einer Retrieval-Engine gesucht, seit 2011 ist die Retrieval-Engine Apache Lucene genutzt. Seit Herbst 2012 wenden wir die linguistischen Verfahren auf 53 Sprachen an und können jeweils deutsche Deskriptoren liefern.
    Die meisten Mitglieder der dandelon.com-Community suchen von Anfang an über den OPAC in diesen Inhaltsverzeichnissen und nutzen inzwischen teils zusätzlich oder alternativ Retrieval-Engines, die sich inzwischen als Discovery Engines vermarkten.

    http://www.agi-imc.de, Manfred Hauer, +49 6321 9635 10

Schreib einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *