Die Erschließung und Digitalisierung von Alten Drucken

Erschließung

Das Ziel der Erschließung ist, dem Benutzer die gewünschte Information zur Verfügung zu stellen. Am optimalsten ist eine bibliothekarische Erschließung, bei der der Benutzer das gewünschte Buch, ja, die gewünschte Seite im Buch sofort direkt auf seinen Schreibtisch bekommt – auch wenn die Bibliothek, aus der das Buch stammt auf der anderen Seite der Erde ist.

Außerdem dient die Erschließung der Verwaltung der Bestände einer Bibliothek. Die Information über Bücher wird für bibliothekarischen Aufgaben wie Selektion, Erwerbung oder Ausleihe benutzt.

Wenn im Folgenden von „Benutzern“ gesprochen wird, sollte also bedacht werden, dass es sich dabei nicht nur um den Wissenschaftler handelt, der Information für seine Studien braucht oder den Laien, der sich aus privaten Gründen für ein Buch interessiert sondern auch um Bibliothekare, die ihre Sammlungen verwalten müssen.

Metadaten

Erschließungsdaten werden in Metadaten verzeichnet. Am bekanntesten sind die Katalogeinträge, die bibliographische Metadaten beinhalten. Im folgenden sollen die verschiedenen Metadatentypen kurz beschrieben werden, gerade auch um zu zeigen, dass Erschließung mehr als bibliographische Verzeichnung ist:

Bibliographische Metadaten

Die bibliographischen Metadaten versuchen, in stark verkürzter Form alle Informationen über ein Buch wiederzugeben, so dass das Buch in einer Bibliothek gefunden werden kann.

Der Inhalt und die Form eines solchen Katalogisats wird durch Regelwerke normiert. Heute wird in Deutschland und Österreich RAK benutzt, in der Schweiz AACR2.

Die Daten werden in Datenbanken in verschiedenen bibliographischen Formaten abgelegt. Im deutschsprachigen Raum gibt es z.B. das MAB2-und das PICA-Format. Außerdem gibt es vereinfachte Formate wie z.B. das Dublin Core (DC) Format.

Sammlungsmetadaten

Sammlungs- und Bestandsbeschreibungen spielten auch im klassischen Angebot der Bibliotheken eine große Rolle. Sie verschafften einem Benutzer den Überblick über die Art und Zusammensetzung der Bestände in einer Bibliothek.

Sammlungsmetadaten werden in modernen Portalen wie das ZVDD integriert. Informationen über Sammlungen werden im Collection Description Format, ISAD(G) oder EAD verzeichnet.

Strukturdaten

Strukturdaten sind bereits im analogen Bereich bekannt: Inhaltsverzeichnisse in Büchern. Sie geben Information über die verschiedenen Teile eines Buches oder Zeitschrift, z.B. über die Kapitel und Abschnitte oder über die Lemmata in einem Wörterbuch. In der analogen Welt haben Bibliothekare diese nicht (immer) verzeichnet – auch wenn es bei den Benutzern durchaus erwünscht war. In der Welt der Digitalisierung ist es anders: Diese Metadaten werden vor allem in Digitalsierungsprojekten eingesetzt um eine einfache Navigation in Digitalisaten zu erlauben.

Die am meisten benutzten Formate sind METS und TEI.

Es gibt noch andere Metadatentypen in Bibliotheken: administrative und technische Metadaten, auf die hier aber nicht eingegangen werden soll.

Volltexte

Im Zeitalter elektronischer Medien ist eine Suche nach bestimmten Begriffen im Volltext üblich – etwas, was mit den traditionellen Metadaten nicht möglich war.

Die Verfügbarmachung und Indexierung eines Volltextes ist also eine weitere Erschließungsform. Der Benutzer kann dadurch noch einfacher auf die Inhalte der Drucke zugreifen. Das Ziel der Erschließung ist nicht mehr nur ein Buch, sondern auch bestimmte Sätze oder gar Phrasen in diesem Buch.

Volltextindexierung wird manchmal sehr skeptisch gesehen. Dennoch ist sie eine wertvolle Form der Erschließung. Eine zusätzliche Erschließung des Druckes durch Bibliothekare bietet aber dem Benutzer einen Mehrwert, den Suchmaschinen wie Google nicht leisten können.

Andere Aspekte der Erschließung

Wenn es darum geht, dem Benutzer von Büchern darin zu helfen, die gewünschten Informationen zu bekommen, spielen noch andere Aspekte eine Rolle, die auch im Zusammenhang mit der Erschließung genannt werden müssen.

Portale

Während sich Bibliothekare auf ihre eigenen Bestände konzentriert, liegen für den Benutzer relevante Bücher in vielen Bibliotheken verstreut. Vor allem bei alten Drucken, von denen viele unikal sind oder nur noch in wenigen Ausgaben bestehen, muss er in der Lage, sein schnell feststellen zu können, was in welchen Bibliotheken verfügbar ist.

Über Portale können verschiedene Kataloge gleichzeitig und komfortabel durchsucht werden. Beispiele von Portalen ist das Zentrale Verzeichnis Digitaler Drucke (ZVDD) oder der KVK der eine verteilte Recherche über mehrere Kataloge ermöglicht.

Es gehört also auch zur Erschließungsaufgabe von Bibliotheken ihre Information einem oder mehreren Portalen zugänglich zu machen.

Open Access

Es hilft dem Benutzer nicht, wenn er weiss, dass ein Buch, dass seiner Forschung relevant ist, existiert, er aber nicht darauf zugreifen kann.

Open Access spielt heute vor allem im Zusammenhang mit der elektronischen Information eine große Rolle. Digitalisate sollten übers Internet ohne Zugangsbeschränkungen erreichbar sein.

Präsentation

Erschließungsarbeit wird nicht nur dadurch geleistet, indem man ein Werk, z.B. ein Digitalisat findbar macht und auch durch Open Access verfügbar macht, sondern auch dadurch dass man es benutzbar macht. Es hilft nicht, ein Lexikon zu digitalisieren und die Images auf eine Website zu stellen. Es muss möglich sein in dem Werk zu blättern oder direkt zu einem gewünschten Lemmata zu springen. Der DFG-Viewer ist eine Dienstleistung, die dies ermöglicht.

Persistente Identifier

Auch das Thema Zitierfähigkeit wird in Zeiten der Digitalisierung und Verfügbarmachung übers Internet sehr akut. Wichtig ist hier, dass man immer wieder auf die Quelle der Information zugreifen kann und dass man auch (wie bei einem gedruckten Buch) granular, d.h. bis auf Seitenebene zitieren kann.

Durch persistente Identifier sind elektronische Daten auch bei einem Adresswechsel (z.B. wenn die Softwareplattform, auf der die Digitalisate liegen, ausgetauscht wird) immer noch findbar und sollten in Digitalisierungprojekten benutzt werden. Beispiele sind PURLs, URNs und DOIs.

So wird eine weitere Erschließung über Zitate und Bibliographien ermöglicht.

Die Entwicklung der Erschließung der Alten Drucke seit Ende der 1960er Jahre

Nicht nur die bibliothekarischen, sondern auch die technischen Rahmenbedingungen haben sich in den letzten vierzig Jahren grundlegend verändert. Aber auch die Benutzer der bibliothekarischen Werkzeuge, die Forscher, deren eigentliches Ziel die Alten Drucke selbst sind, haben neue Erwartungen entwickelt.

Virtuelle Nationalbibliographie

Historisch bedingt gab es im deutschsprachigen Gebiet, obwohl es dort zu manchen Zeiten die höchste Buchproduktion weltweit gab, keine Nationalbibliothek, in der eine Nationalbibliographie angelegt werden konnte. Es gab zu viele autonome Staaten – die Definition „Nation“, wie sie für eine Nationalbibliothek nötig ist, war also fast unmöglich. Erst seit 1913 werden neu erschienene Werke in einer Nationalbibliographie erfasst. Dennoch ist eine Nationalbibliographie für die Jahrhunderte davor ein Desiderat unter Forschern und Bibliotheken.

Durch verschiedene Projekte werden seit 1969 die Bücher der vorigen Jahrhunderte retrospektiv erfasst. So soll schließlich eine virtuelle Nationalbibliographie der gedruckten Werke des deutschsprachigen Raumes geschaffen werden.

Inkunabeln werden im Gesamtkatalog der Wiegendrucke verzeichnet, die Drucke es 16. Jahrhunderts im VD16, die des 17. Jahrhunderts im VD17. Das VD18, das alle Drucke des 18. Jahrhunderts verzeichnen soll, ist geplant.

Es werden Drucke aus dem deutschen Sprachraum, egal in was für einer Sprache sie geschrieben sind, sowie alle deutschen Drucke egal welcher Provenienz verzeichnet.

Im Folgenden werden u.a. die drei großen Verzeichnisse der Drucke im Deutschen Sprachraum (VD16, VD17 und VD18) behandelt werden. Es sollen hier nicht die Details über die einzelnen Projekte beschrieben werden, sondern gezeigt werden, wie sich die Erschließung über die Jahrzehnte hinweg geändert hat, weil es eine bibliothekarische und technische Entwicklung gegeben hat, die einerseits die Arbeit der Bibliothekare, anderseits aber auch die Erwartungen der Forscher verändert haben.

VD16

Entwicklungsgeschichte

Das VD16 begann konventionell als Buchausgabe, da die EDV im Jahr 1969 noch in ihren Anfängen steckte.

Seit 1986 wurde die EDV bei der Arbeit mit dem VD16 eingesetzt um Besitzstände zu erfassen.

Seit 1993 werden neue Titelaufnahmen in einer Supplementdatei erfasst.

In den 1990er Jahren entstand das Bedürfnis, das gesamte VD16 in elekronischer Form umzuwandeln. Zuerst sollten die Aufnahmen des Grundwerks nur gescannt und als Images zur Verfügung gestellt werden. Letztlich fiel die Entscheidung aber zugunsten einer Konversion mit strukturierten Daten.

Heute werden alle Daten (Neuaufnahmen, Korrekturen, Besitznachweise) online in einer Aleph-Datenbank, die vom BVB verwaltet wird, erfasst.

Mit der Konversion der Daten in eine elektronische Form ersetzt die VD16-Datenbank die Druckausgabe nicht nur, sondern aktualisiert fortlaufend deren Katalogisate auf einen neusten Wissenstand.

Erschließungkonventionen

Im VD16 war die Erschließung auf die bibliographische Beschreibung der Werke beschränkt. Erst in den letzten Jahren, wo man nun technisch dazu in der Lage ist, wird die traditionelle Erschließung erweitert durch andere Methoden, wie digitalisierte Schlüsselseiten und gar digitalisierte Werke.

Die Drucke werden nach Autopsie mit Wiedergabe der typographischen Besonderheiten (z.B. Zeilenbrechung, Abbreviaturen) neu katalogisiert. Diese diplomatisch getreue und qualitativ hochwertige Wiedergabe hat allerdings den Nachteil, dass sie sehr umständlich und zeitraubend ist.

Auch beigefügte Schriften zu den eigentlichen Texten werden erfasst.

Titel

Titel werden in Vorlageform erfasst. Es fehlen normierte Titel (Ansetzungstitel) und Einheitssachtitel. Diese Titel sind jetzt sukzessive nachzutragen.

Personen

Alle „literarischen Beiträger“, also nicht nur die Autoren selbst, sondern auch die Verfasser von Widmungsgedichten, Vorreden, Epigrammen und dergleichen werden erfasst.

Seitdem die Erfassung der Daten in einer Datenbank erfolgt, werden auch die Ansetzungsformen der Personennamen mit der überregionalen PND abgeglichen.

Mit der Erfassung sekundärer Autoren erschließt das VD16 ein reiches, noch lange nicht ausgeschöpftes Material für personen- und geisteswissenschaftlichen Forschungen.

VD17

Das VD17 wurde, im Gegensatz zum VD16, von Anfang an als Datenbank konzipiert. Heute wird es als PICA-Datenbank beim GBV gehostet.

Erschließungkonventionen

Das VD17 ist, wie das VD16, ein Rekatalogisierungsprojekt, d.h. die Erschließung erfolgt durch Autopsie auf nationalbibliographischen Niveau.

RAK-WB

Die Katalogisierungsrichtlinien folgen, anders als für VD16, dem RAK-WB, die nach einigen Überarbeitungen in den frühen neunziger Jahren auch zur Katalogisierung alter Drucke geeignet war.

Personen

Inhaltlich misst die Forschung besonders der Frage nach der im Buch genannten Personen große Bedeutung bei. Im barocken Buch finden sich neben den Verfassern und Herausgebern oft literarische und künstlerische Beiträger, Huldigungen und Dank an namentlich genannte Förderer sowie Zensurvermerke. Gerade über diese Namen ist die Rekonstruktion des sozial- und literaturhistorischen Beziehungsgeflechts, das die Buchproduktion der Zeit bestimmte, möglich.

Für alle Verfasser und sonstigen beteiligten Personen, die nach RAK eine Haupt- oder Nebeneintragung erhalten, wird im VD17 in der PND eine Normform ermittelt.

Die Bildung von Normformen für die weiteren Personen wäre jedoch vom zeitlichen Aufwand her nicht tragbar. So werden in drei neu definierten Kategorien für Beiträger, Widmungsempfänger und Zensoren diese Personen nur in leicht angepasster Vorlageform erfasst. Dies ist, im Vergleich zum VD16, eine Neuerung.

Sachtitel

Während im VD16 die Titel in der Titelbeschreibung genauso wie das Impressum diplomatisch getreu wiedergegeben wird und sogar Zeilenumbrüche vermerkt werden, werden Titel im VD17 in einer retrievalfähigen normierten Form bis zu einer Länge von 25 Wörtern verzeichnet. Die diplomatisch getreue Wiedergabe wird durch das digitale Bild der Schlüsselseiten ersetzt.

Bei deutschsprachigen Titeln werden suchrelevante Worte zusätzlich in orthographisch normierter Form in einem eigenen Feld gespeichert und indexiert.

Fingerprint

Eine wesentliche Neuerung des VD17 ist der Fingerprint. Er soll der sicheren Identifizierung eines Einzeldrucks dienen. Dabei handelt es sich um eine Zeichenkombination, die jeweils zwei festgelegten Zeilen von vier bestimmten Seiten jeden Druckes enstammt.

Der so entstandene Code ermöglicht eine schnelle maschinelle Dublettenprüfung. Zusammen mit dem Titelblatt gilt der Fingerprint als ausgabedifferenzierendes Kriterium.

Schlüsselseiten

Großunternehmen, wie das VD17, müssen eine Titelaufnahme auf nationalbibliographischen Niveau erstellen, können aber nicht dem Ideal der Buchhistoriker, der unverwechselbaren Beschreibung eines Exemplars, Folge leisten. Allerdings kann den Forschern entgegen gekommen werden, indem man ihnen mehr Information als die bibliographische Beschreibung zur Verfügung stellt: indem man einige Schlüsselseiten oder gar das ganze Werk digitalisiert. Da eine komplette Massendigitalisierung aller Bücher Mitte der Neunziger Jahre noch als unmögliches Unterfangen gesehen wurde, man aber dennoch den Wunsch nach mehr als nur bibliographische Information erfüllen wollte, entschloss man sich zur Digitalisierung von Schlüsselseiten.

Deshalb werden zur Ergänzung der Titelaufnahme neben den Titelseiten (inkl. evtl. Kupfertitel) die erste Seite des Hauptteils, Kolophon, Druckersignete und Seiten, mit Namen von Widmungsempfängern als Schlüsselseiten gescannt und mit der Titelaufnahme verknüpft.

Sacherschließung

Wegen der begrenzten zur Verfügung stehenden Fördermittel ist eine Sacherschließung nicht zu leisten. Ersatzweise werden für zusätzliche Sucheinstiege rund 140 Gattungsbegriffe vergeben.

—-

Bevor über das VD18 berichtet werden kann, müssen erst ein paar andere Entwicklungen, die in der Zwischenzeit stattfanden und die die Erschließung Alter Drucke maßgeblich geändert haben, angerissen werden.

Google Buchsuche

Seit 1998 ist Google online und hat mehr als alle Suchmaschinen davor und danach große Herausforderungen an die bibliothekarische Erschließung gestellt. Google zeichnet sich vor allem durch seine Einfachheit, seiner Schnelligkeit und seiner Sortierung nach Relevanz aus. OPACs wirkten daneben kompliziert und langsam. So kam es, dass seit etwa 2004 auch Bibliotheken Suchmaschinentechnologie einsetzen, z.B. die hbz-Verbundzentrale mit seinem Dreiländerkatalog.

Aber für den Bereich Alte Drucke viel relevanter war 2004 Googles Ankündigung alle Bücher der Welt zu digitalisieren und über Volltextsuche zu erschließen. Im VD17 Projekt hatte man inzwischen gesehen, dass die Digitalisierung wichtiger Schlüsselseiten die bibliothekarische Erschließung um einiges aufwertet. Aber man hatte die Digitalisierung aller Bücher als zu teuer und zu kompliziert bezeichnet.

Es war nicht so, als ob man in Bibliotheken überhaupt keine Bücher digitalisiert hätte. Seit Mitte der 1990er Jahre sind in großem Umfang Werke – gerade von alten Werken mit unikalen Charakter – digitalisiert und über das Internet frei zugänglich gemacht worden. Aber mit Google fand ein Paradigmenwechsel statt: von der selektiven „Boutique“-Digitalisierung von besonders wertvollen Drucken hin zur Massendigitalisierung.

Die Digitalisierung bedeutet auch, dass sich die Forschungsgewohnheiten der Benutzer ändern. Die Benutzer von Katalogen wollen ja primär nicht Katalogeinträge von Büchern finden, sondern unmittelbaren Zugang zu den Büchern selbst erlangen und begannen dies nun mehr und mehr zu fordern.

Google zeigt auch, dass Alte Drucke durchaus von Interesse für moderne Forscher und damit für moderne Google-Benutzer sein können. So hat Google einen Vertrag mit der Bayerischen Staatsbibliothek geschlossen um ab 2008 alle urheberrechtsfreien Bücher, also auch alte Drucke, zu scannen. Die Digitalisate sollen über das Internet zur weltweiten Nutzung zur Verfügung gestellt werden.

Eine Beschränkung auf ausgewählte Texte oder eine Priorisierung bestimmter Bestandssegmente ist nicht vorgesehen. Eine Auswahl der Bücher findet nur nach ihrer konservatorischen Eignung für den Scanprozess und hinsichtlich bestimmter Vorgaben nach Größe und Umfang statt, die durch Googles Scantechnologie bedingt sind. Auch die mit Google vereinbarten Qualitätsstandards sind denen anderer geförderter Digitalisierungsprojekte ähnlich.

Google wird oft als Konkurrent der Bibliotheken gesehen. Bei der BSB ist man anderer Meinung: Die Zusammenarbeit entspricht ja dem ureigensten Auftrag jeder Bibliothek und ist ein hauptsächliches Ziel der bibliothekarischen Erschließung: Menschen und Wissen miteinander in Verbindung zu bringen.

Umorientierung der DFG

In der Auseinandersetzung mit Volltextdigitalisierung und Suchmaschinen förderte die DFG 2005 eine Studie über Digitalierung in Bibliotheken mit dem Ziel Empfehlungen für weitere Projekte zu geben.

Es wurde festgestellt, dass die digitalisierten Werke nicht in der breiten Öffentlichkeit, wohl aber in den Fachcommunities bekannt waren und auch intensiv genutzt werden.

Außerdemt: Digitalisierung ist durchaus eine gute Methode der Erschließung, die des Forschers Arbeit um einiges erleichtert.

Es wurde empfohlen, die Digitalisierung von Bibliotheksbeständen weiterhin zu fördern.

Der Bericht bewirkte, dass die DFG neue Richtlinien für Digitalisierungsprojekte aufstellte und seitdem die Perspektive der Gesamtdigitalisierung des gedruckten und handschriftlichen deutschen Kulturguts hat.

ZVDD

Das ZVDD ist das Zentrale Verzeichnis Digitalisierter Drucke.

Ausgangsposition

Mitte der 2000er Jahre hatte allein die DFG bereits über 100 Digitalisierungsprojekte gefördert. Mindestens nochmal so viele wurden von anderer Seite unterstützt oder privat durchgeführt. Aber: jedes Projekt stand für sich im Netz und wartete auf Kundschaft. Der Verzicht auf Zentralisierung und Standardisierung führte dazu, dass die Benutzer die Angebote entweder nicht fanden, oder sie nicht im gewünschten Maße nutzten, da sie mit jedem Projekt eine neue Betriebsanleitung studieren mussten. Es herrschte also einen Mangel an Erschließung, der durch das ZVDD aufgehoben werden sollte.

Ein weiteres Problem sollte mit dem ZVDD gelöst werden: Mit dem Beginn der Massendigitalisierung würde die Gefahr der Doppeldigitalisierung von Ausgaben zunehmen. Eine solche Mehrfachdigitalisierung kann vermieden werden, wenn an zentraler Stelle ermittelt wird, ob ein Werk bereits digitalisiert wurde.

Vier Informationsschichten

In dem Portal werden mehr als nur die bibliographischen Metadaten berücksichtigt. Erschließungsdaten sind in vier Schichten beschrieben. Diese Schichten sind hierarchisch aufgebaut und jede Schicht „vererbt“ Information nach unten. Information, die z.B. in der Sammlungsschicht verzeichnet ist, gilt für alle Ausgaben in der Sammlung.

Sammlungen

Digitalisierungsprojekte führen zur Entstehung von Sammlungen digitaler Objekte, die oft durch ein gemeinsames Thema oder einem gemeinsamen Dokumenttyp gekennzeichnet werden.

Ausgaben (Werke)

Der Kern der ZVDD-Metadaten bilden die bibliographischen Datensätze.

Es war gerade auf diesem Gebiet der bibliographischen Metadaten, in dem eine große Heterogenität der Daten sichtbar wurde.

Strukturmetadaten

Hierbei handelt es sich um Erschließungsdaten unterhalb der Werksebene, wie z.B. über einzelne Kapitel oder Lemmata. Diese Daten können in verschieden Formaten, z.B. in METS oder in TEI kodiert sein. Diese können plattformübergreifend mit dem DFG-Viewer dargestellt werden.

Volltexte

Da Volltexte in zunehmenden Maße als Resultat von Digitalisierungsprojekten angeboten werden, sollten sie durch Suchabfragen, z.B. durch Suchmaschinentechnologie, zugänglich gemacht werden. Dieser Aspekt des Projekts wurde aber während der Projektlaufzeit nicht umgesetzt.

Zusammenarbeit mit anderen Einrichtungen und Portalen

ZVDD und Virtuelle Fachbibliotheken

Das ZVDD profitiert davon, wenn aus den virtuellen Fachbibliotheken fachspezifische Digitalisierungsprojekte gemeldet werden. Auf der anderen Seiten stellt das ZVDD den ViFas auch nach Fächern zusammengestellte OAI-Sets mit Metadaten zu den digitalisierten Werken zur Nachnutzung bereit.

Außerdem könnten die ViFas mittelfristig auch schreibenden Zugang zu dem zentralen Datenpool bekommen, so dass eine weitere Nacherschließung der digitalisierten Werke durch die virtuellen Fachbibliotheken erfolgen kann.

ZVDD und andere Portale

Die im ZVDD versammelten Metadaten stehen auch anderen Portalen zur Nachnutzung zur Verfügung. So verspricht man sich, dass Digitalisate über viele verschiedene Wege dem interessierten Publikum bekannt gemacht und so in größerem Maße genutzt werden.

Erschließung in der Gegenwart

DFG Aktionslinie VD16/VD17

Die DFG stellt zur Zeit Fördergelder für die Digitalisierung der in den nationalen Verzeichnissen nachgewiesenen Drucke des VD16 und VD17 zur Verfügung. So sollen die bereits verfügbaren Erschließungsdaten dieser Verzeichnisse durch den digitalen Zugriff gezielt ergänzt und der Zugriff auf die Drucke erheblich verbessert werden.

Vier Projekte werden im Augenblick gefördert. Eines davon soll beispielhaft dargestellt werden:

Sammlung Ponickau

Die Sammlung Ponickau ist ein Beispiel des „state of the art“ der modernen Erschließung im Zusammenhang mit alten Drucken.

Die Sammlung

Die Sammlung Ponickau an der ULB Sachsen-Anhalt in Halle ist eine einzigartige Sammlung von literarischen und anderen Zeugnissen zur Geschichte und Geographie des mitteldeutschen Raumes.

Das Digitalisierungsprojekt

Die Digitalisierung von Drucken des 17. Jahrhunderts der Sammlung Ponickau ist ein Projekt, dass von Juli 2007 bis voraussichtlich Juli 2009 läuft.

9621 Drucke aus dem 17. Jahrhundert mit ca insgesamt 600 000 Seiten sollen in den zwei Jahren digitalisiert werden.

Bibliographische Metadaten

Es gibt bereits bibliographische Metadaten, die im Zuge des VD17 erstellt wurden und in der VD17-Datenbank im GBV zur Verfügung gestellt werden. Auf dieser Grundlage werden automatisiert Metadaten in folgenden Formaten generiert:

  • MODS
  • MARCXML
  • Dublin Core

Diese Daten werden über eine OAI- und eine RSS-Schnittstelle interessierten Benutzern und anderen Institutionen und Portalen, z.B. ZVDD zur Verfügung gestellt.

Außerdem wird automatisch eine Sekundärausgabe des Digitalisats in der GBV-Verbunddatenbank erstellt.

Strukturmetadaten

Im Projekt wird eine zusätzliche Strukturierung des digitalisierten Werkes verzeichnet, die es erlaubt, bestimmte Abschnitte, Kapitel, Illustrationen eines Drucks gezielt zu recherchieren und über eine Navigationsfunktion aufzusuchen.

URN Granular

Damit die einzelnen Seiten des digitalen Werkes zitierfähig sind, wurde im Zuge dieses Projekts zusammen mit der DNB URN-granular entwicklet. Bis zu diesem Zeitpunkt war es nur möglich gewesen URNs als persistente Identifier für ganze Werke zu vergeben. Die DFG-Richtlinien forderten allerdings die persistente Identifizierung nicht nur des ganzen Werks, sondern auch der einzelnen Images oder Teilen von Images. Nun kann automatisiert einzelnen Images URNs zu vergeben werden.

Volltexterstellung durch OCR

OCR-Erzeugung mit Büchern des siebzehnten Jahrhunderts ist nicht einfach, wird dennoch im Projekt angestrebt.

Da mit Antiqua-Schriften eine OCR-Erkennung schon lange gute Resultate liefert, wird der Anteil der Sammlung Ponickau, der in Antiqua vorliegt, mit OCR erfasst.

Open Access

Für das Projekt Ponickau wird Open Access über folgende Einstiege gewährleistet:

  • Internetpräsentation
  • OAI-Schnittstelle
  • VD17
  • GBV-Verbunddatenbank
  • ZVDD
  • Suchmaschinenen
  • RSS-Feed

Alle Digitalisate stehen weltweit allen interessierten Nutzern frei übers Internet auch im PDF-Format zur Verfügung.

Mit dem Beispiel der Sammlung Ponickau sollte gezeigt werden, wie sehr die Erschließung von Alten Drucken in den letzten vier Jahrzehnten erweitert wurde. Die Alten Drucke sind nicht nur über den Bibliothekskatalog, sondern über eine breite Palette von Einstiegspunkten auffindbar. Open Access ermöglicht den unmittelbaren Zugriff auf die Digitalisate. Strukturmetadaten bieten eine gezielte Suche nach bestimmten Abschnitten in den einzelnen Werken und persistente Identifier ermöglichen es, dass das digitalisierte Werk als Ganzes als auch die einzelnen Images in wissenschaftlichen Arbeiten zitiert werden können.

Erschließung in der Zukunft

VD18

Das Verzeichnis der im Deutschen Sprachraum erschienenen Drucke des 18. Jhs ist im Augenblick in Vorbereitung.

Für die Erschließung der alten Drucke sollen modernste technische Verfahren, z.B. der über die AG Neukatalogisierung entwickelte Austausch von bibliographischen Metadaten zwischen den Verbünden, eingesetzt werden.

Digitalisierung

Das VD18 soll auf hohem Erschließungsniveau realisiert werden. Dieses Niveau wird durch Digitalisierung und bibliographischer Verzeichnung gewährleistet werden.

Darum sollen die Werke des 18. Jhs auch digitalisiert werden. Zur Digitalisierung gehört allerdings mehr als das Scannen von Seiten: die Erfassung von Strukturdaten, die Präsentation, z.B. über den DFG-Viewer und die Langzeitarchivierung.

Bibliographisches Format

Es sind noch nicht alle Fragen in Hinsicht auf das bibliographische Format geklärt.

Unstrittig ist: Die Aufnahmen sollen nach Autopsie nach RAK-WB ergänzt durch die „Empfehlungen der Arbeitsgemeinschaft Alter Drucke beim GBV“ katalogisiert werden.

In der Zeit der Aufklärung begannen (vor-)industrielle Formen der Massenproduktion von Büchern, die eine tiefer als üblich gehende bibliographische Differenzierung von Ausgaben erschweren, die zum Teil aber auch weniger wichtig erscheinen. Es soll auf die Erfassung von Ausgaben differenzierenden Elementen wie der Fingerprint verzichtet werden.

Die Zukunft der Erschließung

Herausforderungen der Digitalisierung

Im VD18 sollen Alte Drucke digitalisiert und bibliographisch verzeichnet werden. Das Wort „Digitalisierung“ steht an erster Stelle.

Es kann hier nicht auf die technischen Details hinsichtlich Digitalisierung eingegangen werden außer zu bemerken, dass die Technik große Fortschritte gemacht hat. Schon lange wird nicht mehr über den Umweg von Mikrofilm digitalisiert (außer in der Bestandsbewahrung) auch Flachbettscanner, die die Alten Drucke beschädigen, werden nicht mehr eingesetzt. An der BSB werden heutzutage neben Buchscanner auch Scan-Roboter benutzt, die ca. 1250 Seiten pro Stunden digitalisieren können.

Digitalisierung beschränkt sich nicht auf das Scannen. Es wurde bereits erwähnt, dass die bibliothekarische Erschließung völlig neue Dimensionen bekommen hat: Strukturmetadaten werden erfasst. Volltexte werden aus den Images generiert und mit Suchmaschinentechnologie indexiert. Die einzelnen Images werden persistent identifiziert. All dies muss verwaltet werden. Bald wird man nicht mehr von Terabyte, sondern von Petabyte an Speicherplatz sprechen. Software muss entwickelt, administrative und technische Metadaten verwaltet werden. Auch eine weitere Herausforderung zeichnet sich ab: die Langzeitarchivierung all dieser Daten.

Ziel des Ganzen bleibt aber, was schon in der Bibliothek von Alexandria das Ziel der Erschließung war: die Verfügbarmachung der Information für den Benutzer.

Erschließung als Dialog

Auch die traditionelle bibliographische Erschließung kann durch die moderne Technologie wie die Vernetzung im Internet oder Digitalisierung der Alten Drucke selbst, weiter entwickelt werden.

Erschließung durch Bibliothekare

Dadurch, dass Alte Drucke als Digitalisate weltweit zur Verfügung stehen, ist die bibliographische Erschließung nicht mehr auf die Institution, die das gedruckte Werk besitzt, beschränkt. So könnte z.B. Sacherschließung von Bibliothekaren, die gar nicht in der Bibliothek anwesend sind, gemacht werden.

Input von Forschern : Bibliothek 2.0

Durch die Digitalisierung erhält die Kooperation zwischen Bibliothek und Forschung eine neue Dynamik. Die Arbeit der Erschließung kann in Interaktion mit Forschern geschehen.

Denkbar sind sogenannte Bibliothek 2.0-Technologien, über die die Forscher einen Beitrag zur Erschließung liefern können. Man könnte z.B. ein Wiki zu VD18-Titeln aufbauen. Forscher könnten dort über die Drucke diskutieren und sie annotieren. Außerdem könnten sie über Verknüpfungen Verbindungen zu anderen Drucken herstellen.

Es wurde immer bedauert, dass die Sachererschließung in den großen VD-Projekten nicht machbar war. Denkbar wäre nun eine sogenannte Tagging-Funktionalität, in der auch nicht-Bibliothekare Schlagworte vorschlagen können.

Eine Renaissance der Alten Drucke?

Durch die Digitalisierung wird der Öffentlichkeit bewusst werden, welche Fülle von unterschiedlichen und gar nicht erwarteten Materialien in Bibliotheken vorliegen.

So kann in Zukunft ein neues Interesse für die alten Drucke erweckt werden, die bislang nicht die Breitenwirkung haben konnten, da sie nicht einfach einsehbar waren. Diese Sensibilisierung der Benutzer und die kulturelle Vermittlung des Buches in digitaler Form wird Bibliotheken immer stärker herausfordern, sogleich aber auch ihre Bedeutung in der Welt des Wissens stark hervorheben.

Ein Gedanke zu „Die Erschließung und Digitalisierung von Alten Drucken

  1. hallo, suche eine geignetes programm für vewwalten meiner bücher ca 4000,, darunter sehr viele alte kinderbücher, möchte die bücher auch per scann oder isbn eingeben, hilft mir dabei google,
    derzeit hab ich alle bücher in eine exel datei

    dadnke norbertwanka

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert