Neubelebung dieses Blogs

Auf diesem Blog hat sich gesundheitsbedingt nun sehr lange nichts mehr getan. Da ich nun wieder in Vollzeit arbeite, soll auch der Blog neu belebt werden.

Worum soll es zukünftig gehen? Bei meiner Arbeit geht es im Augenblick um Digitalisierung und Kataloganreicherung. In einem Bereich, der mir in der Vergangenheit sehr am Herzen lag, nämlich „Semantic Web“ und „Linked Data“ bin ich nicht mehr tätig, und daher werde ich darüber kaum noch schreiben.

Was Digitalisierung und Kataloganreicherung betrifft, interessiert mich vor allem die technische Seite. Aber das ist ja nur ein Aspekt  dieses Aufgabenbereichs. In der letzten Zeit hatte ich viel mit urheberrechtlichen und organisatorischen Fragen zu tun. Deshalb wird mein erstes Posting nach diesem langen Winterschlaf ein juristisches Thema haben.

Viel Spaß!

ToDos in der deutschen, bzw. europäischen Digitalisierungslandschaft

Deutscher Bibliotheksverbund (Hg.) (2011): Deutschland braucht eine nationale Digitalisierungsstrategie! Thesenpapier des Deutschen Bibliotheksverbands e.V. Online verfügbar unter http://www.bibliotheksverband.de/fileadmin/user_upload/DBV/positionen/ThesenpapierDigitalisierung_dbv_Papier.pdf, zuletzt geprüft am 15.6.2011.

Europäische Kommission (Hg.) (2011): Die neue Renaissance. Empfehlungen der Drei Weisen zum Ausbau des europäischen kulturellen Erbes im Netz : Zusammenfassung. Online verfügbar unter http://ec.europa.eu/information_society/activities/digital_libraries/doc/refgroup/executive_summary_de.pdf, zuletzt geprüft am 15.6.2011.

ToDos

Beide Papiere geben eine Liste der Aufgaben, die noch im Rahmen der Digitalisierung zu bewältigen sind. Man muss bedenken, dass ein Thesenpapier oder eine Zusammenfassung nicht in die Tiefe, die man sich manchmal wünscht, gehen können sondern nur oberste Prioritäten festlegen können. Diese wären folgende:

Zentrale Digitalisierungsportale

Das Thesenpapier des DBV sieht die DDB, das der Europäischen Kommission sieht die Europeana als zentrale Digitalisierungsportale, die es zu entwickeln und zu fördern gilt – auch über eine Projektphase hinaus.

So können die digitalisierten Werke so breit wie möglich zugänglich und nachnutzbar gemacht werden.

Die Frage, die ich mir immer wieder stelle ist: brauchen wir, mal vom Prestige abgesehen, wirklich beide Portale? Ja, die DDB soll gleichzeitig ein Datenlieferant für die Europeana sein, aber braucht es für die Aufgabe wirklich ein eigenes Portal?

Standards

Nicht nur sollten die Digitalisierungsprojekte den Standards der DDB, sondern auch denen der Europeana, entsprechen. Das ist kein leichtes Unterfangen, da Standards immer weiter entwickelt werden müssen und nicht immer miteinander kompatibel sind. Wo werden die Standards festgelegt? Wo werden sie weiterentwickelt? In einem förderalen System wie der Bundesrepublik Deutschland ist es schon schwierig Vertreter der verschiedenen Kulturbereiche (Bibliotheken, Archive, Museen, Denkmalschutz) aus 16 Bundesländer unter einem Hut zu bringen. Wenn das auf ganz Europa ausgeweitet wird, wird es zu einer fast unlösbaren Aufgabe.

Einbindung (der Metadaten) der aktuell von Verlagen angebotenen elektronischen Ressourcen

Das ist sinnvoll, da ein zentraler Zugang zu digitalen Objekten nicht nur die retrodigitalisierten, sondern auch aktuelle Werke bereitstellen sollte.

Weitere Standards und Workflows müssen mit den schon bestehenden Standards aus Bibliotheken, Archiven und Museen kompatibel gemacht werden.

Urheberrechte

Zuerst müssten Regelungen bezüglich der sogenannten „verwaisten“ Werke getroffen werden, also der Werke, die urheberrechtlich geschützt sind, aber deren Rechteinhaber unbekannt sind.

Im europäischen Papier heißt es weiterhin, dass die Rechteinhaber Vorrang bei der Verwertung von vergriffenen Werken haben sollen. Wie könnte das bewerkstelligt werden?

Auf europäischer Ebene müssten die Unterschiede im Rechtestatus digitalisierter Materialien zwischen den Mitgliedsstaaten beseitigt werden.

Digitalisierung

Die Digitalisierung an sich muss weiter gefördert werden. So spricht der DBV für die Zeit von 2012 bis 2016 zusätzlich zur schon vorhandenenen DFG-Förderung sowie der Förderung der Länder und Regionen von jährlich 10 Millionen Euro. Davon könnten pro Jahr 200.000 Titel digitalisiert werden. Die eine Million Titel, die so digitalisiert werden könnte ist natürlich nur ein bruchteil aller Materialien, die digitalisiert werden müssten. Eine solche Förderung müsste also auch über das Jahr 2016 hinaus weiter laufen. Nach dem europäischen Papier sind rund 100 Milliarden Euro notwendig um das gesamte europäische Erbe online zu bringen. 10 Millionen sind da fast ein Tropfen auf einem heißen Stein.

Um eine solche Förderung sinnvoll koordinieren zu können, um z.B. Doppeldigitalisierung zu vermeiden, braucht es natürlich Information zu schon abgeschlossenen Digitalsierungen. Dafür ist ein zentrales Portal, sei es die DDB, sei es die Europeana, dringend notwendig.

Prioritäten

Das deutsche Thesenpapier spricht davon, dass der Schwerpunkt der Digitalisierungsaktivitäten bei älteren (15. bis 18. Jahrhundert) und wertvolleren Werken liegen sollte. Leider wird kein Grund dafür gegeben, warum ausgerechnet diese Materialien priorisiert werden sollten.

Die Europäische Kommission schlägt die priorisierte Digitalisierung von vergriffenen Werken vor.

Wahrscheinlich werden sich beide Vorschläge stark überschneiden.

Langzeitarchivierung

Beide Papiere machen darauf aufmerksam, dass Langzeitarchierung Teil der Digitalisierungsbestrebungen sein sollte. Es genügt nicht, ein zentrales Portal für Digitalisate und die Digitalisierung selbst zu finanzieren – es muss möglich sein, auf die Digitalisate auch in fernerer Zukunft zuzugreifen.

Das Papier der Europäischen Kommission schlägt vor, dass der Europeana eine Schlüsselrolle in der digitalen Langzeitverfügbarkeit zukommen sollte. Außerdem wird aufgemerkt, dass Langzeitarchivierung nicht nur ein technisches, sondern auch ein organisatorisches, juristisches und finanzielles Problem ist.

Finanzierung

Unter „Digitalisierung“ wurden bereits Zahlen zu den Kosten der Digitalisierung gegeben. Dazu kommen noch die erheblichen Kosten für die Portale und Langzeitarchivierung. Auch für die anderen ToDos braucht es Ressourcen.

Das Papier der Europäischen Kommission sieht die Verantwortung für die Digitalisierung in erster Linie bei den einzelnen Staaten und weist darauf hin, dass diese einzelnen Staaten ihre Investitionen in die Digitalisierung deutlich erhöhen müssten. Auch das Papier des DBV sieht den Bund als wichtigsten Geldgeber für solche Investitionen.

Beide Papiere sprechen sich außerdem für eine Förderung privater Partner aus. Das europäische Papier empfiehlt öffentlich-private Partnerschaften für Digitalisierungsvorhaben und gibt auch Details darüber, wie solche Partnerschaften zu gestalten sind. Das deutsche Papier sieht vor allem in der Digitalisierung des Schrifttums des 19. Jahrhunders eine Kooperation mit kommerziellen Partnern.

Was haben wir davon?

In beiden Papieren wurden Forderungen gestellt, die viele Ressourcen kosten werden. Erstaunlicherweise wird kaum über die andere Seite der Rechnung gesprochen. Was bringt uns das ganze? Entscheider, die über die Ressourcen verfügen brauchen nicht nur eine Liste von Forderungen. Sie müssen auch wissen, welchen Nutzen das alles hat, ob die Rechnung aufgeht, ob es sich lohnt, das Geld zu investieren. Diese Hilfe wird in beiden Papieren kaum gegeben.

Das Thesenpapier des DBV spricht davon, dass „die digitale Erschließung der kulturellen und wissenschaftlichen Überlieferung“ ein „wichtiges gesamtgesellschaftliches Zukunftsprojekt“ ist. Die Deutsche Digitale Bibliothek (DDB) könnte „ein einzigartiges Forschungsinstrument für Wissenschaftler“ werden. Mehr wird leider nicht gesagt.

Das Papier der Europäischen Kommission wird, wenn auch nur kurz, konkreter: So heißt es:

Wir denken aber, dass die Vorteile den Aufwand rechtfertigen. Die Vorteile sind einerseits ein breiterer Zugang zu Kultur und Wissen und damit deren Demokratisierung, sowie andererseits die Vorteile für das Bildungssystem, sowohl für Schulen als auch für die Hochschulen. Außerdem entsteht ein wesentlicher ökonomischer Nutzen, etwa im Rahmen der Entwicklung neuer Technologien und Dienstleistungen für die Digitalisierung, der digitalen Langzeitverfügbarkeit und in der innovativen, interaktiven Weiterentwicklung kultureller Inhalte. Das digitalisierte Material selbst kann zur treibenden Kraft für Innovationen werden und die Grundlage für neue Dienstleistungen in Bereichen wie Tourismus oder Bildung sein.

Das ist immerhin etwas. Aber vielleicht sollten die Verfasser solcher Papiere mal darüber nachdenken, diese Vorteile in einem separaten Thesenpapier detaillierter zu beschreiben und zu beziffern. Dann würde es der Politik und Wissenschaft, die ja bei den ToDos gefragt sind, vielleicht einfacher fallen, diese auch tatkräftig umzusetzen.

Lesen in der digitalen, online Welt

Cull, Barry W. (2011): Reading revolutions. Online digital text and implications for reading in academe. In: First Monday 16 (6). Online verfügbar unter http://firstmonday.org/htbin/cgiwrap/bin/ojs/index.php/fm/article/view/3340/2985, zuletzt geprüft am 9.6.2011.

Ich werde zuerst die (für mich) interessanten Punkte des Autors wiedergeben. Am Schluss folgen dann meine eigenen Gedanken zu dem Text.

Zusammenfassung

Einleitung

Einige Wissenschaftler halten das Internet für eine Bedrohung – sie meinen, dass Lesen sich durch Google und Co. nachteilig entwickeln wird. Diese These möchte der Autor untersuchen.

Obwohl das Internet oft als ein Medium für die Übertragung von Bildern, Videos und Musik wahrgenommen wird [1], so ist es doch immer noch hauptsächlich ein Kommunikationsmedium für Texte. Darum kann das Internet nur in einer sehr gebildeten und belesenen Gesellschaft Erfolg haben.

Gedruckte Information ist nicht tot, aber gebildete Menschen auf der ganzen Welt lesen heute regelmäßig an ihren Bildschirmen. Und alle Leser – auch Studierende und Lehrende – lesen digitalen Text anders als gedruckten Text.

Lesen ist so allgemein, dass oft vergessen wird, wie wichtig es in der Entwicklung und Kommunikation menschlichen Wissens ist. Es ist eine zentrale Fertigkeit in unserer modernen Gesellschaft. Gerade darum, weil Lesen so wichtig ist, könnte eine Änderung der Lesegewohnheiten, schwere Folgen haben.

Eine Änderung unserer Lesegewohnheiten hat nicht nur technologische, gesellschaftliche oder Verhaltensfacetten. Neurologen wie Maryanne Wolf meinen sogar, dass neurologische Veränderungen eintreten, dass es unser Gehirn sich von einem „lesenden Gehirn“ zu einem „digitalen Gehirn“ entwickelt.

Wie wird Lesen in dem Artikel definiert? Cull meint damit jedes anhaltende Lesen aus Spaß oder zur Information. Das schließt auch das reflektierende und kritische Lesen für Studium und Arbeit ein, dass vor allem mit Studierenden und Lehrenden assoziiert wird. Diese Art des Lesens – auch aus Spaß – ist anhaltend und gehen in die Tiefe. Es ist eher eine kontemplative Tätigkeit, die ein wenig im Gegensatz zu dem Zeitgeist des Internets, der Unmittelbarkeit, steht.

Eine kurze Geschichte des Lesens

Lesen, als kulturelle Aktivität, hat seit seinen Anfängen schon viele große Veränderungen erlebt. Die ersten Zeichen, die gelesen wurden, wurden erst vor etwa 6000 Jahren entwickelt, das erste vollständige Alphabet wurde von den Griechen um etwa 750 vor Christus erfunden. Bis zum vierten Jahrhundert musste ein Buch aufgerollt um gelesen werden zu können. Aus den Schriftrollen wurden zusammengefaltete Blätter und später der Kodex, die moderne Buchform, entwickelt.

Die ersten Leser und Schreiber haben sich selbst und anderen immer laut vorgelesen. Erst im neunten Jahrhundert führten Klosterregeln dazu, dass leise gelesen wurde. Im dreizehnten Jahrhundert war das stille Lesen für sich selbst normal geworden. Der Autor zitiert Darnton, der meint, dass dieser Wechsel vom lauten zum stillen Lesen eine größere mentale Anpassung erforderte als der Wechsel zum gedruckten Text.

In der Mitte des 15. Jahrhunderts erfand Johannes Gutenberg die Druckpresse mit beweglichen Lettern. Diese Erfindung revolutionierte langsam aber sicher das Lesen und mehr. Der Autor zitiert wieder Darnton:

„For the first half century of its existence, the printed book continued to be an imitation of the manuscript book. No doubt it was read by the same public in the same way. But after 1500 the printed book, pamphlet, broadside, map, and poster reached new kinds of readers and stimulated new kinds of reading. Increasingly standardized in its design, cheaper in its price, and widespread in its distribution, the new book transformed the world. It did not simply supply more information. It provided a mode of understanding, a basic metaphor of making sense of life.“

Aber erst während der industriellen Revolution wurde Lesen eine weitverbreitete Freizeitaktivität in Europa und Nordamerika. Und als sich dann die post-Industrielle Gesellschaft entwickelte, wurde Lesen eine zentrale Tätigkeit in vielen Berufen.

Lesetrends im modernen Nordamerika

Etwa die Hälfte aller Amerikaner und Kanadier lesen regelmäßig in ihrer Freizeit. Der Autor zitiert Grisworld, der davon ausgeht, dass in der Gesellschaft ein hochgebildetes und wohlhabendes Elite-Segment entstehen wird, dass mehr lesen wird als die Durchschnittsleser der Vergangenheit. Diese Klasse wird aus der jungen Kommunikations-Elite und den älteren Menschen, die weniger technologisch fortgeschritten sind, aber gerne lesen, bestehen und sie wird immer eine Minderheit, auch in den hoch gebildeten Gesellschaften sein. Es wird geschätzt, dass sie in den westlichen Ländern und Japan etwa ein Viertel bis ein Drittel der Population ausmachen werden. Lesen ist also keine weitverbreitete Tätigkeit mehr, aber diese Klasse der Lesenden wird Lesen sehr hoch schätzen.

Der Nutzen des Lesens in der Freizeit

Was bringt Lesen in der Freizeit?

Als erstes stärkt regelmäßiges Lesen die Lesefähigkeit: je mehr man liest, desto besser kann man lesen.

Es gibt aber auch viele bemerkenswerte Beziehungen zwischen Lesen und positivem gesellschaftlichem Verhalten. So gibt es eine Korrelation zwischen Jugendlichen, die starke Leser sind und einer niedrigen Kriminalitätsrate, niedrigen Arbeitslosigkeitsrate und niedriger Abhängigkeit von Sozialhilfe. Außerdem sind die Ausgaben für Gesundheit niedriger.

Außerdem sind die Amerikaner, die viel lesen, viel mehr im kulturellen und gesellschaftlichem Leben engagiert als die, die nicht lesen.

Wenn sich nun die Lesegewohnheiten ändern, könnte die Gefahr sein, dass sich diese Auswirkungen des Lesens auch ändern werden.

Trends im Internetgebrauch

Der gesellschaftliche Nutzen des Internets ist noch immer sehr umstritten. Aber wie ist die Entwicklung in diesem Bereich?

Weltweit erreicht das Internet 26% der Menschen. Die Benutzung von Mobiltelefonen, die immer mehr auch das Internet bereit stellen, hat 67% der Weltbevölkerung erreicht. Der Autor berichtet von kanadischen Studien, in denen festgestellt wurde, dass 98% High School Schüler das Internet täglich mindestens eine Stunde besuchen. 20% der Schüler sind mehr als fünf Stunden am Tag im Internet. Aber man hat auch festgestellt, dass der erhöhte Nutzen des Internets nicht zu Lasten des Lesens geht. Es ist eine Tatsache, dass die Menschen, die viel im Internet sind, auch viel Lesen. Zeit im Internet vermindert nicht die Zeit, die zum Lesen genutzt wird.

Online Forschung und Lesegewohnheiten

Es ist wichtig zu bemerken, dass auch wenn viel Zeit im Internet verbracht wird, das nicht automatisch eine Entwicklung der Forschungs- oder (kritischen) Lesefähigkeiten hat. Die Richtigkeit der Information, die im Internet gefunden wird, wird vor allem von Studierenden nicht immer hinterfragt.

In der Lehre und Forschung – egal ob Studierender im ersten Jahr, Lehrende, Forschende oder Professoren – hat sich die Tendenz heraus entwickelt, eher „horizontal“ als „vertikal“ nach Information zu suchen. Information wird überflogen und es wird sich schnell zwischen einzelnen Webseiten hin und her bewegt. Der Autor zitiert Rowlands et al., die sagen:

„The average times that users spend on e-book and e-journal sites are very short: typically four and eight minutes respectively. It is clear that users are not reading online in the traditional sense, indeed there are signs, that new forms of „reading“ are emerging as users „power browse“ horizontally through titles, content pages and abstracts going for quick wins. It almost seems that they go online to avid reading in the traditional sense.“ [2]

Web Designer wissen schon länger, dass Menschen online nicht viel lesen wollen und dass es darum nicht immer sinnvoll ist, längere Texte ins Netz zu stellen. [3]

Es entwickelt sich ein typisches „Bildschirmleseverhalten“, dass darin besteht, dass Texte überflogen werden. Man hält Ausschau nach Schlüsselwörtern, liest nicht mehr linear und liest eher selektiv. Weniger Zeit wird benutzt um in die Tiefe oder konzentriert zu lesen. Die Gefahr besteht, dass Leser nur Textfragmente lesen, ohne den Kontext, in dem sie stehen, zu wissen oder dass sie von Links und Information, die eigentlich am Rande stehen, abgelenkt werden.

Aber es wäre nicht richtig zu sagen, dass solche Lesegewohnheiten nur online stattfinden. Eine Studie unter Lehrenden und Forschenden hat gezeigt, dass auch gedruckte Information oft ähnlich gelesen wird. Akademiker lesen nur selten einen Zeitschriftenartikel oder ein Buch vom Anfang bis zum Ende, sondern sie lesen Teile, oft nicht in Reihenfolge, benutzen Hände und Finger um sich im Text vor und zurück zu bewegen, sie unterstreichen und annotieren, verbinden das, was sie lesen oft mit dem, was sie schreiben und verteilen oft Papierstücke über ihren Tisch.

Online Text in wissenschaftliche Bibliotheken

Für mehrere Jahrtausende bis etwa vor zwanzig Jahren, war es die zentrale Aufgabe von Bibliotheken Texte in physischer Form zu beherbergen: von Tontafeln, über Schriftrollen zu gedruckten Büchern und Zeitschriften. Auch wenn gedruckter Text immer noch eine wichtige Aufgabe von wissenschaftlichen Bibliotheken ist, so ist es nun auch eine Kernaufgabe von Bibliotheken, Zugang zu digitalen Informationen zu ermöglichen. In der westlichen Welt geben Bibliotheken bereits ein Mehrteil ihrer Medienbudgets für elektronische anstatt gedruckte Information aus.

Bibliothekare sind davon überzeugt, dass digitale Texte eine Zukunft haben. Sie kaufen nicht nur elektronische Texte, sondern sind auch zu Herausgebern solcher Texte geworden, indem sie Printmedien digitalisieren [5]. Die Digitalisierung hat Wissenschaftlern und der allgemeinen Öffentlichkeit große Vorteile gebracht. Aber Gründe für diesen Wandel sind auch wirtschaftliche und haben mit immer steigenden Zeitschriftenabonnements und zurückgehenden Bibliotheksbudgets zu tun.

Bei elektronischen Zeitschriftenartikeln mit ihrer relativ kurzen Länge und Focus auf neue wissenschaftliche Erkenntnisse wurde sehr schnell erkannt, dass sie ideale Kandidaten für eine digitale Verfügbarmachung sind. Artikel über die neusten wissenschaftlichen Forschungen können so sehr viel schneller auf die Schreibtische der Forscher gebracht werden als in gedruckter Form.

Populäre eBooks

Schon seit einigen Jahren stellen wissenschaftliche Bibliotheken auch Monografien in digitaler Form zur Verfügung. Allerdings machen komplizierte Schnittstellen und verschiedene Digital Rights Management-Systeme der Verlage diese Aufgabe schwieriger. Zum Beispiel gibt es schon seit längerem digitale Werkzeuge zum Unterstreichen und Annotieren. Dennoch finden viele Leser, dass Monografien in gedruckter Form besser geeignet sind um sie gründlich lesen und annotieren zu können als wenn die Bücher auf einem Computer-Bildschirm dargestellt werden.

Allerdings ist dieser Markt im Augenblick im Wandel. Kindle, iPad und andere eBook-Reader revolutionieren gerade das Lesen elektronischer Bücher. Google ist mit vielen großen Bibliotheken eine Partnerschaft eingegangen und digitalisiert ganze Bestände. Außerdem hat Google Verträge mit großen Verlagen abgeschlossen um elektronische Bücher zur Verfügung zu stellen. Auch andere Digitalisierungsinitiativen wie Hathi Trust machen Bücher in digitaler Form verfügbar. Deshalb könne es durchaus sein, dass das Lesen von Büchern im elektronischen Format bald so komfortabel wird wie bei gedruckten Ausgaben.

Die Vorlieben der Studierenden

Studierende ziehen Text auf Papier zum Lesen vor, aber sie wollen auch die Vorteile die online digitaler Text bringt. Sie mögen den schnellen Zugriff, den sie auf elektronische Medien haben, aber drucken die elektronischen Dokumente dann aus um sie zu lesen.

Die kognitive Neurowissenschaft des Lesens

Lesen hat auch eine kognitive und neurologische Komponente. Es ist daher denkbar, dass das Lesen von eBooks auch neurologische Auswirkungen hat.

Das Gehirn hat sich nicht für Kultur entwickelt, sondern Kultur hat sich so entwickelt, dass sie durch das Gehirn bearbeitbar ist. In der Geschichte haben alle Schreibsysteme gemeinsame Eigenschaften: meistens bestehen sie aus einer Kombination von Strichen. Das Gehirn kann trainiert werden, diese Striche zu interpretieren.

Es ist zwar so, dass das Überfliegen von Text und das Herumspringen im Text nicht auf online Lesen beschränkt ist, aber diese Art zu lesen ist die am häufigsten benutze bei elektronischen Texten.

Wissenschaftler haben in den letzten Jahren festgestellt, dass es große Unterschiede zwischen online-Lesen und Lesen von gedruckten Texten gibt.

Das Lesen von online Texten ist kognitiv komplexer als das Lesen von gedruckten Texten. Eine Ursache dafür sind Hyperlinks. Durch diese Verknüpfungen werden dem Leser mehr Möglichkeiten geboten. Der Leser muss also mehr Entscheidungen treffen, wie er mit den Möglichkeiten umgehen wird und das führt wiederum dazu, dass mehr Hirnaktivität benötigt wird. Es wurde auch festgestellt, dass das Scrollen am Bildschirm mehr mentale Arbeit bedeutet.

Auch der Kontext jedes Mediums führt zu kognitiven Unterschieden beim Lesen von elektronischen oder gedruckten Texten. Der Rahmen, in dem der Text steht hat eine Auswirkung darauf, wie der Leser den Text aufnimmt. Dieser Paratext, wie z.B. der Buchumschlag, die Widmung und die Danksagungen bilden einen Rahmen, der die Interpretation des Textes beim Leser formt. Diese paratextuellen Elemente sind bei online Texten anders als bei gedruckten Texten.

Weiterhin wurde festgestellt, dass beim Lesen von elektronischen Texten die Leser alle drei bis zehn Minuten ihre Aktivität ändern. Bei so viel Veränderung ist nicht möglich, gründlich zu lesen. Auch Multitasking, wie es beim Lesen von online Texten (oder vom Leben in der digitalen Welt an sich) oft erfordert wird spielt eine Rolle. Es ist eine Tatsache, dass es länger dauert zwei Dinge gleichzeitig als hintereinander weg zu erledigen. Wissen, dass aus gleichzeitig laufenden Aktivitäten gewonnen wurde, kann weniger flexibel in neuen Situationen eingesetzt werden.

Wie bereits gesagt, überfliegen Leser online Texte eher als gedruckte Texte. Dies führt aber dazu, dass die Texte weniger gut verstanden werden. Es wurde auch festgestellt, dass das Lesen am Bildschirm 20 bis 30% langsamer ist als das Lesen von Texten auf Papier.

Jetzt, wo Computer sehr mobil geworden sind und überall mitgenommen werden können, muss sich auch noch gefragt werden, welche psychologischen Folgen die immerwährende Verbindung zum Internet für die Benutzer hat. Viele Studierende studieren, folgen Vorlesungen und pendeln zur Universität und schalten dabei nie ihre Notebooks, Mobiltelefone oder iPads ab. Dieser direkte Zugang zu Information kann dazu führen, dass Studierende sich nicht mehr mit der Information beschäftigen oder sie verstehen wollen – man kann es ja zu jeder Zeit nachgucken. Aber eine Auseinandersetzung mit der Information ist wichtig, damit sie in Wissen umgewandelt werden kann.[4]

Viele dieser Unterschiede im Lesen zwischen elektronischem und gedruckten Text haben mit Zeit zu tun, die Zeit die üblicherweise genutzt wird um sich mit einem Text auf Papier auseinander zu setzen im Gegensatz zu der Zeit, die genutzt wird über den Text zu fliegen – ein Verhalten, das zwar auch bei gedruckten Texten möglich ist, aber bei online Texten üblicher ist. Maryanne Wolf sagt dazu:

„I am worried about kids who are immersed in digital culture. They will get to college and they will have been Twittering so much that they won’t have the patience to read those really long cognitively convoluted and complex sentences. They may not have developed those rich networks which are required in order to read at a high level of sophistication … The effort is what we are going to lose. They are becoming not so much a lazy reader, but an atrophied reader.“

Schlussbemerkungen

Über die Jahrtausende hat sich Lesen immer wieder geändert und es hat auch uns Menschen geändert.

Es muss erst noch gesehen werden, ob Maryanne Wolfs Befürchtungen wahr werden. Viel mehr Forschung ist nötig um festzustellen, welche Änderungen das Lesen von online Texten wirklich mit sich bringen.

Wenn man aber davon ausgeht, dass wir möchten, dass Wissen auch im menschlichen Gehirn und nicht nur in elektronischen Geräten gespeichert wird, muss man bedenken, dass Zugang zu Information und die Erwerbung von Wissen zwei unterschiedliche Dinge sind. Zugang zu Information ist nicht mit erworbenem Wissen gleichzusetzen. Durch Informationstechnologie ist Zugang zu Information relativ einfach geworden, aber die Erwerbung von Wissen bleibt schwierig und braucht Zeit – Zeit, die Worte zu verstehen, Zeit, zwischen den Zeilen zu lesen, Zeit um die gelesenen Ideen zu reflektieren.

Meine eigenen Gedanken

Wie lese ich? Wie gehe ich mit geschriebenen Text um?

Ich habe mir beim Lesen und Arbeiten mit dem Text die Frage gestellt: Wie lese ich?

Ja, wenn ich Information im Internet suche, browse ich durch Suchergebnisse und überfliege Texte bis ich die Antwort finde. Ich liebe das Internet dafür, dass es mir schnellen Zugang zu Information gibt. Aber ich drucke mir auch einzelne Artikel aus, lese sie vom Anfang bis zum Ende, unterstreiche Textpassagen und schreibe Anmerkungen. Und dann setze ich mich schon mal hin und schreibe über das, was ich gelesen habe, so wie ich es jetzt auch tue. Diese Auseinandersetzung mit dem Text braucht allerdings Zeit und da Zeit begrenzt ist, kann ich es nicht immer und mit allen Texten machen. Es ist wichtig, eine gesunde Mitte zwischen Überfliegen und Lesen zu finden.

Ich sagte gerade, dass ich Texte ausdrucke, damit ich sie unterstreichen und annotieren kann. Mit großer Aufmerksamkeit beobachte ich den eReader-Markt und glaube, dass die Entwicklung bald so weit ist, dass ich mit Text auch auf einem elektronischen Lesegerät genauso komfortabel wie auf Papier umgehen kann. Im Augenblick gibt es noch Aspekte, die mich stören und die mir zu bedenken geben, dass Papier und Stift immer noch einfacher sind. Aber es war ja auch mal, vor vielen Jahren, einfacher auf Papier mit einem Stift zu schreiben als auf einem Rechner. Diese Zeiten sind vorbei. Textverarbeitung ist einfacher und schneller als das mühsame Schreiben auf Papier. Vielleicht wird das Lesen eine ähnliche Entwicklung machen. Wenn es dann soweit ist, werde ich umsteigen.

Fußnoten

[1] Es ist kurzsichtig zu glauben, dass sich Wissen allein in Texten kommuniziert werden kann. Wissen kann auch in Bildern, Audio-Dateien und Video weitergegeben werden und das Internet erlaubt den einfachen Umgang mit diesen Kommunikationsmitteln. Zum ersten Mal in der Geschichte der Menschheit ist der Austausch dieser anderen Möglichkeiten so einfach wie der von Text. Man hört immer wieder, dass diese anderen Medien oder völlig neue Möglichkeiten wie Gaming verpönt werden, weil sie als eine Gefahr für das Lesen gesehen werden. Text ist nicht unbedingt besser als Bilder, Ton- und Video wenn es in der Kommunikation von Ideen geht. Der Umgang mit diesen neuen Medien wird zukünftig genauso wichtig sein wie Lesen. Aber darum geht es in diesem Artikel gar nicht. Der Autor beschränkt sich auf die Aktivität des Lesens und diskutiert nicht Lesen im Kontext weiterer Kommunikationsmöglichkeiten.

[2] Ich frage mich, ob dieses horizontale Lesen, das Überfliegen und Browsen von Texten nur an dem Medium Internet liegt oder auch ganz einfach daran, dass wir in einer Informationsexplosion leben. Es wird so viel Information generiert, dass man nicht mehr alles detailliert und in die Tiefe gehend lesen kann. Das Überfliegen von Texten, das Lesen von Inhaltsverzeichnissen und Abstracts dient auch dazu, aus dem Überangebot von Texten die relevantesten herauszuholen.

[3] Und deshalb fürchte ich, dass kaum einer den Text, den ich hier geschrieben habe, wirklich von Anfang bis Ende lesen wird.

[4] Ähnliche Befürchtungen können aber für das Schreiben und Lesen an sich vorgebracht werden. Schreiben wurde entwickelt, um Gedanken außerhalb eines menschlichen Gehirns zu fixieren. Dafür gab es mehrere Gründe: Erstens brauchte sich ein einzelner Mensch nicht mehr so viel zu merken und zweitens war die Information auch für andere, an anderen Orten und zu anderen Zeiten verfügbar. Das Internet führt diese Entwicklung einfach nur fort. Wahrscheinlich gab es auch Befürworter der mündlichen Tradition, die sich, als das Schreiben und Lesen entwickelt wurde, befürchteten, dass sich Denken und Wissen durch die neue Entwicklung ändern würde. Vielleicht haben sie argumentiert, dass sich die Merkfähigkeit der Menschen zurück entwickeln würde. Wir wissen es nicht. Ihre Befürchtungen wurden uns nicht überliefert. Und natürlich hat sich das Denken und Wissen durch Schreiben und Lesen geändert – aber es war wohl auch zum Besten der Menschheit. Könnten die Änderungen im Wissen und Denken, die uns das Internet bringt, nicht auch zum Besten der Menschheit sein?

[5] oder Dokumentenserver betreuen

JPEG2000 als Digitalisierungs- und Langzeitarchivierungsformat

Gelesen:

van der Knijff, Johan (2011): JPEG2000 for Long-term Preservation. JP2 as a Preservation Format. In: D-Lib Magazine 17 (5/6). Online verfügbar unter http://www.dlib.org/dlib/may11/vanderknijff/05vanderknijff.html, zuletzt geprüft am 31.5.2011.

Zusammenfassung:

JPEG 2000 wird immer öfter als Digitalierungsdateiformat in Bibliotheken eingesetzt. Prominente Beispiele sind die Koninklijke Bibliotheek der Niederlande, die British Library und die Library of Congress, die JP2-Dateien als Ersatz für unkomprimiertes TIFF sehen. TIFF ist aber im Augenblick noch immer das am meisten genutzte Bild-Dateiformat für die Langzeitarchivierung.
Der Artikel stellt sich die Frage, inwieweit JP2-Dateien den Ansprüchen der Langzeitarchierung genügen. Es nutzt nichts, viel Geld und andere Ressourcen für die Digitalisierung von Kulturgütern auszugeben, wenn die digitalisierten Daten in ein paar Jahren oder Jahrzehnten nicht mehr angezeigt werden können, wenn eine Migration in andere Datenformate nur mit Informationsverlust möglich ist, oder wenn eine Emulation nur schwierig durchzuführen ist. Für die Beurteilung der Langzeitarchivierungsqualitäten des Dateiformats schaut der Autor auf zwei Aspekte des Dateiformats, einmal auf die Möglichkeit Farbprofile in der Datei aufzunehmen und zweitens die Möglichkeit Information zur Auflösung im Dateikopf zu notieren. Beide Aspekte spielen eine wichtige Rolle in der Langzeitarchivierung von Bilddaten.
Was Farbprofile betrifft, so ist es bei JP2-Dateien nur möglich, „Input“-Profile aufzunehmen, nicht aber andere Profile, hauptsächlich „Display“-Profile. Der Autor kommt zum Schluss: „a literal interpretation of the format specification limits the use of ICC profiles to such a degree that any serious colour management becomes impossible in JP2. For colour imagery, the only colour space that can be handled without using ICC profiles is sRGB. Full-colour printed materials often contain colours that cannot be represented in the sRGB colour space. […] The JP2 format is unsuitable for applications that require colour support beyond sRGB.“
Dazu kommt, das verschiedene JPEG2000-encoder das Farbmanagement auf unterschiedlichste Weise angehen. Einige betten gar keine ICC-Profile ein, andere betten auch „Display“-Profile als „Input“-Profile ein (weichenalso die JPEG2000-Spezifikation auf) und wieder andere erlauben nur das Einbetten von sogenannten „Input“-Profilen. Viele Encoder erstellen auch JPX- anstatt JP2-Dateien. JPX ist eine Erweiterung des JP2-Formats, aber nur wenige Decoder unterstützen JPX, so dass die Erweiterungen meistens gar nicht genutzt werden können. JPX ist also kein Format, dass für die Langzeitarchivierung genutzt werden kann.
Was die Auflösungsinformation in den Kopfzeilen der JP2-Dateien betrifft, so ist die Situation komplexer als bei anderen Datenformaten, denn es wird zwischen zwei unterschiedlichen Auflösungstypen unterschieden. Beide sind optional und jedes Bild kann irgendein, beide oder keine der Auflösungsinformationen beinhalten. Einmal kann die „capture resolution“ verzeichnet werden, zweitens eine „display resolution“. Es gibt einige Probleme mit den Definitionen dieser Auflösungen, aber auch kein Mapping der Auflösungsinformationen zwischen JP2 und anderen Bildformaten. Außerdem benutzt kein JPEG2000-Encoder die Auflösungsfelder so, wie die Spezifikation es vorschreibt.
Was bedeutet das nun für die Langzeitarchivierung? Was die Farbprofile betrifft, so kann man, wenn man die Spezifikation wörtlich nimmt, keine ICC-Farbrofile außer sRGB benutzen. Was die Auflösungsinfomation betrifft, so könnte diese in zukünftigen Migrationen verloren gehen.
Der Autor schlägt einige Lösungen vor. Viele Probleme könnten behoben werden, wenn kleine Änderungen an der JPEG2000-Spezifikation vorgenommen würden, z.B. in dem man sie mit der neusten ICC-Spezifikation abstimmt. Außerdem sollten Software-Autoren angehalten werden, ihre En- und Decoder der (angepassten) Spezifikation zu genügen.
Bis zu einem solchen Zeitpunkt schlägt der Autor vor, dass Institutionen, die das JP2-Format nutzen wollen folgende Information dokumentieren:

  • Welches Dateiformat wird genutzt? (JP2, JPX?)
  • Beinhalten die Bilder ICC-Profile?
  • Welches sind die Eigenschaften dieser ICC-Profile?
  • Werden ICC-Profile mit der „Restricted“- oder „Any ICC“-Methode eingebettet?
  • Beinhalten die Bilder mehrere Versionen der ICC-Profile?
  • Welche Felder (wenn überhaupt) werden benutzt um Information zur Bildauflösung zu speichern?
  • Welche Software wurde benutzt um die Bilddateien zu erstellen?

Außer der letzten Frage können alle Fragen benutzt werden, wenn man ExifTool und JHOVE benutzt. Diese Dokumentation kann also weitgehend automatisiert werden.
Nur mit einer solchen Dokumentation kann man Langzeitarchivierungsrisiken richtig abschätzen. Außerdem kann die Information dazu dienen mittelfristig eine Migration vorzunehmen, z.B. eine Normalisation um einer ergänzten JPEG2000-Spezifikation zu genügen.
Außerdem empfiehlt der Autor neuen und fortlaufenden Digitalisierungsprojekten folgendes:

  • Vermeide JPX
  • bette ICC-Profile ein und benutze dazu die „Restricted“-Methode
  • vermeide mehrere ICC-Profile

In eigener Sache – Neue Weichenstellungen

Nach längerer krankheitsbedingter Abwesenheit vom Arbeitsplatz, habe ich vor einer Woche meine Wiedereingliederung in die Arbeit begonnen. Im Augenblick bin ich guter Dinge, dass es klappen wird. Allerdings werde ich erst Anfang August wieder richtig, d.h. full-time im Berufsleben zurück sein.

Ich werde mich in Zukunft hauptsächlich auf Digitalisierung konzentrieren. Das bedeutet, dass ich sowohl die Digitalisierungsprojekte, die in der hbz-Verbundzentrale gehostet werden, als auch die Kataloganreicherung mit-betreuen werde.

Das bedeutet auch, dass ich mich zukünftig weniger mit dem Thema „Semantic Web“ auseinandersetzen werde. Dazu fehlt mir einfach die Zeit und die Kraft. Einerseits bin ich traurig, dass ich mich weniger mit diesem – meiner Meinung nach – sehr zukunftsträchtigen Thema beschäftigen werde, anderseits muss ich aber auch an meine Gesundheit denken und in der Hinsicht glaube ich, dass die richtige Entscheidung getroffen wurde.

So ist der Stand der Dinge im Augenblick. Die Zukunft wird ergeben, ob sich das wieder ändert.

SWIB10

Natürlich bin ich in der Hinsicht ein bißchen subjektiv. Anderseits neige ich auch dazu, mich eher zu kritisieren als zu loben. Darum ist es vielleicht gar nicht falsch zu sagen, dass die Tagung „Semantic Web in Bibliotheken“ (SWIB10) ein großer Erfolg war. Wir hatten gute Sprecher, ein interessiertes Publikum, tolle Pausengespräche und mit der Organisation hat es auch richtig gut geklappt. Dank an Joachim Neubert und Dank an alle Kolleginnen und Kollegen bei der ZBW und dem hbz für ihre Hilfe!

Wenn man die SWIB10 mit der SWIB09 vergleicht, fällt auf, wie viel sich in einem Jahr getan hat. Bei der SWIB09 ging es eher darum zu motivieren, warum es sinnvoll ist, Semantic Web-Technologie in Bibliotheken einzusetzen und wie man es machen könnte. Inzwischen wurden die Pläne verwirklicht und haben noch mehr Bibliotheken Linked Data veröffentlicht. Was mich nun, vielleicht auch für die SWIB11, interessieren würde, sind nicht mehr Pläne und Prototypen, ist auch nicht die Veröffentlichung von Linked Data, sondern erstens, was mit den RDF-Daten, die Bibliotheken freisetzen geschehen kann (also Applikationen) und zweitens vielleicht auch mal ein Blick weg von Linked Data zu den anderen Semantic Web-Technologien (wie kann aus unseren Daten neue Information entstehen).

Nach der SWIB ist vor der SWIB. Joachim und ich haben uns gestern zusammengesetzt und zurück- und vorwärts geschaut. Die nächste SWIB, also SWIB11 findet wohl Ende November 2011 in Hamburg statt. Wir haben uns überlegt, welche Themen hervorgehoben und welche Sprecher eingeladen werden können. Feedback von der Community ist uns sehr willkommen. Welche Themen interessieren euch?

culturegraph.org

Am Freitag ging folgende gemeinsame Presseerklärung der DNB und des hbz raus:

http://www.hbz-nrw.de/dokumentencenter/presse/pm/culturegraph_de/

Wir haben in unserer Linked Open Data-Gruppe im hbz lange über Identifier für Titeldaten diskutiert. Schnell kamen wir zum Schluss, dass sich das mehrfache Prägen von Identifier für eine Ressource (z.B. ein Buch) nicht verhindern lassen kann, auch wenn man mit lobid.org eine neutrale Plattform anbieten möchte, um genau das zu tun. Verbundzentralen und Bibliotheken werden ihre Daten als Linked Data veröffentlichen und für „Harry Potter und der Stein der Weisen“ wird es zig Identifier geben.

Linked Data lebt von Verlinkung. Wichtig ist es also, diese vielen URIs zu einer Ressource miteinander zu verlinken. Erst dann kann man mit den bibliographischen Titeldaten, die jemand anders veröffentlichen auch in der eigenen Datenbank etwas anfangen, z.B. Dublettenerkennung oder Kataloganreicherung.

Und wichtig ist es auch, dass es für jeden Titel viele andere Identifier gibt, die nicht unbedingt dem URI-Schema folgen aber dennoch oft, z.B. für Mashups benutzt werden. Die ISBN ist die bekannteste, aber man denke da auch an die Nationalbibliographienummer, Library of Congress Catalog Number,  ASIN von Amazon oder Open Library Identifier. Man wird vielleicht nicht immer ein „sameAs“ benutzen wollen, aber es gibt noch andere Relatoren für solche, etwas ungenaueren Verknüpfungen. Gerade heute hat Michael Bergman in seinem Blog darüber geschrieben:

The Nature of Connectedness on the Web

culturegraph.org ist deshalb für mich eine der wichtigsten Entwicklungen in der Linked Data in Libraries-Szene. Ich hoffe, dass dieser „Hub“ von Identifiern schnell wächst und auch von anderen kulturellen Institutionen angereichert werden wird.

Linked-Open-Data-Aktivitäten im hbz-Verbund

Adrian Pohl und ich haben beim Oracle Summit für Bibliotheken am 27. Oktober in Weimar einen Vortrag zum Thema Linked-Open-Data-Aktivitäten im hbz-Verbund gehalten. Die Folien sind nun auf der Oracle-Website verfügbar:

http://www.oracle.com/global/de/events/2010/local/sun/weimar/presentations/ORACLE_10_hbz.pdf

Mein Beitrag fängt bei Folie 20 an und handelt über die Umwandlung bibliographischer Daten in RDF-Tripel.