Kölner Bibliotheken und Open Linked Data

Ich weiß, ich bin spät dran. Andere haben schon ausführlich drüber geschrieben: Kölner Bibliotheken stellen in Zusammenarbeit mit dem Hochschulbibliothekszentrum ihre Bibliotheksdaten zum Download bereit und veröffentlichen sie unter einer CC0 Lizenz.

Hier die Website des hbz: http://opendata.hbz-nrw.de/

Oliver Flimm hat die Reaktionen in seinem Blog gesammelt, z.B. hier: http://blog.openbib.org/2010/03/18/offene-katalogdaten-reaktionen/

Als Mitarbeiterin des hbz bin ich sehr froh und stolz über diese Ereignisse!

Warum ist es gut, die Daten zur Verfügung zu stellen? In meiner Arbeit mit dem Semantic Web in Bibliotheken und Linked Open Data wurde ich auch von einem TED-Talk von Tim Berners-Lee, dem Vater des WWW und Semantic Web, inspiriert:

(Website: http://www.ted.com/talks/tim_berners_lee_on_the_next_web.html)

Vor ein paar Tagen gab es einen weiteren TED-Talk von Tim Berners-Lee, in dem er zeigt, was mit Linked Open Data passieren kann:

(Website: http://www.ted.com/talks/tim_berners_lee_the_year_open_data_went_worldwide.html)

Während es in den USA und Großbritannien inzwischen selbstverständlich geworden ist, dass Daten, die mit öffentlichen Geldern erstellt wurden auch für die Öffentlichkeit freigegeben werden, sind wir in Deutschland noch nicht soweit. „Es sind unsere Daten!“, sagen einige BibliotheksdirektorInnen. Nein! Es sind nicht die Daten der Bibliotheken! Steuergelder haben sie finanziert und deshalb gehören sie den Steuerzahlern, der Öffentlichkeit.

Andauernd wird gejammert, dass wir BibliothekarInnen unsere Relevanz in der Welt der Information verlieren, dass keiner mehr Bibliotheken will und alle lieber googeln. Auch das stimmt nicht. Bibliotheken können eine große Rolle im Semantic Web spielen, denn sie haben relevante Daten von sehr hoher Qualität und sind vertrauenswürdige Einrichtungen. Es fehlt nur eins: den Willen, Teil der neuen Informationswelt zu werden indem wir die Daten frei geben.

Ja, heute bin ich stolz darauf, Mitarbeiterin des hbz zu sein und in Köln zu arbeiten. Wir haben einen wichtigen Schritt getan. Ich hoffe, dass andere Bibliotheken und Bibliotheksverbünde schnell folgen werden.

Nun zum nächsten Schritt: die Daten in RDF übersetzen.

Informavore

Ein sehr interessantes Video der Digital Life Design Konferenz in München, Januar 2010, ist hier zu sehen:

Quelle: http://video.dld-conference.com/watch/i21RPVZ

John Brockmann, David Gelernter, Frank Schirrmacher und Andrian Kreye diskutieren über Information Overload. Das Internet ist ein riesiger, unübersichtlicher Markt der Ideen. Wie findet der Internet-Benutzer die Ideen, die wichtig sind? Welche Machtstrukturen herrschen über die Ideen? Algorithmen? Menschen? Können Maschinen das Genie aus all den Ideen herauspicken oder brauchen wir Menschen? Verlassen wir uns zu sehr auf die Maschinen? Früher haben die Redakteure der Zeitungen und Zeitschriften, die Lektoren in den Verlagen entschieden, welche Ideen so gut sind, dass sie weitergegeben werden. Heute ist das nicht mehr der Fall. Es gibt eine unübersichtliche Kakophonie von Gedanken, Empfehlungen, Feeds, etc. Wie können wir mit diesem Informations-Overload umgehen?

Digitalisierungsmetadaten

Wenn ich hier von „Digitalisierung“ spreche, meine ich nicht „Scannen“ oder „Fotografieren“, also nicht die Umwandlung von analoger Information in digitale Daten, sondern den ganzen Prozess, der bei Digitalisierung durchlaufen werden muss. Darunter fällt unter anderen die Selektion, Aushebung, Transport, Scannen, Qualitätsmanagement, Erschließung, Bereitstellung im WWW, usw.

Während dieses Prozesses fallen auf verschiedenen Ebenen verschiedene Metadaten an. Einige werden nur für einen eingeschränkten Zeitraum gebraucht, andere müssen für den ganzen Lebenszyklus eines Digitalisats zur Verfügung gestellt werden. Mir fallen spontan folgende Ebenen ein:

  • Institutionen (z.B. Policies, die für alle Digitalisierungsprojekte einer Institution gelten). Diese Metadaten dürfen allerdings nicht auf eine Institution beschränkt werden, da bei Digitalisierung viel Wert auf Kooperation zwischen Institutionen gelegt wert. Außerdem kommt es fast zwangsläufig zu einem Datenaustausch zwischen Institutionen.
  • Sammlungsebene. Nicht alle Digitalisierung findet im Sammlungskontext statt, aber oft doch. Vielleicht könnte man auch „Batches“ als Sammlungen bezeichnen (?). Und natürlich gibt es Sammlungen von Sammlungen.
  • Stücke, z.B. ein Buch.
  • Images, z.B. von einer Seite eines Buches. Manchmal ist Stück mit Image identisch, z.B. bei Fotos

Das ist jetzt die Reihenfolge auf einer vertikalen Ebene. Diese Ebenen werden von

  • Strukturmetadaten miteinander verbunden.

Aber es gibt auch eine horizontale Ebene. Darunter könnte z.B. folgendes fallen:

  • Metadaten, wenn wir von Meta-Metadaten sprechen, z.B. den Erstellern der Metadaten
  • Geräte, z.B. Scanner oder Kameras
  • Aktionen/Workflows – was muss in welcher Reihenfolge getan werden?
  • Personen – wer macht was?
  • Rechte – wer darf was unter welchen Umständen?
  • Schnittstellen, zwischen Institutionen und/oder Sammlungen
  • Qualitätsmanagement, z.B. Qualitätskriterien, die wieder von
  • Zielen abhängig sind, z.B. will man für Webzugriff, für Volltextindexierung oder für die Archivierung digitalisieren? Das führt wiederum zu
  • Formaten
  • (Projekt)Management – all dies muss ja irgendwie verwaltet werden und auch dafür braucht es Metadaten

Metadaten kann man klassifizieren. Folgende Einteilung ist üblich:

  • Beschreibende / Bibliographische Metadaten
  • Administrative Metadaten
  • Technische Metadaten
  • Rechtsmetadaten
  • Strukturmetadaten

Diese Klassen sind allerdings nicht streng voneinander getrennt, sondern formen Schnittmengen, z.B. bei administrativen Metadaten und technischen Metadaten. Und auch nicht alle Metadatengruppen können in diese Klassen eingeteilt werden.

Wenn man also in der Digitalisierung an Metadaten denkt, so ist eine Klassifikation oder Hierarchie ein sehr eingeschränktes Ausdrucksmittel. Es handelt sich um Konzepte, die man irgendwie, manchmal hierarchisch miteinander verbinden kann, die anderseits aber auch eher als Netz miteinander verknüpft sind. Es werden Cluster, Mengen und Schnittmengen gebildet.

So viele Konzepte, so viele Strukturen, Beziehungen und Eigenschaften zwischen den Konzepten. Ein interessantes Thema, dass sich lohnt, genauer betrachtet zu werden.

Photoshop Elements nach Flickr – nicht so einfach, wenn man deutsch ist

So langsam lerne ich Photoshop Elements kennen. Der Organizer gefällt mir – dazu später mehr – und Fotos können gut bearbeitet werden.

Nun wollte ich Fotos nach Flickr hochladen und stand vor einem Problem. Nach der Adobe Website und anderen Quellen ist das möglich, aber so sehr ich den Instruktionen folgte und Einstellungen einstellte – bei mir funktionierte es nicht. Flickr stand für mich unter den Adobe Partner Services nicht zur Verfügung.

Heute fand ich dann diesen Tipp:

Für die USA liefert der Hersteller Adobe selbst ein Plug-in mit. Und da sowohl Photoshop Elements als auch flickr international gleich funktionieren, können Sie auch in Europa den direkten flickr-Export nutzen: Starten Sie den Organizer von Elements und wählen Sie unter „Voreinstellungen, Adobe Partner-Services“ den Standort „USA“ aus. Die Sprache können Sie weiterhin deutsch lassen. Nun stehen unter dem Reiter „Weitergabe“ die Einträge für die US-amerikanischen Dienstleister. Unter dem Button „Mehr Optionen“ finden Sie den flickr-Export. Hier müssen einmalig der flickr-Benutzername und das Passwort eingetragen werden. Der Rest (Bilder kleinrechnen, hochladen und Tags zuordnen) geht automatisch. Markus Linden

Und genau das funktioniert.

Die Anmeldung bei Flickr war unkompliziert. Auch das Auswählen der Daten, die man hochladen möchte ist einfach. Allerdings gab es dann eine Fehlermeldung, dass die Dateien zu groß oder in einem nicht-unterstützten Format seien. Ein Blick in die Flickr FAQs zeigt:

Wenn Sie einen Pro Account haben, können Sie Fotos bis zu 20 MB hochladen.

und

Flickr unterstützt offiziell JPEG-, nicht animierte GIF- und PNG-Dateien. Sie können auch TIFF-Dateien sowie einige andere Dateitypen hochladen, diese werden dann jedoch automatisch konvertiert und im JPEG-Format gespeichert.

Nun, die Bilder sind über 100 MB groß und im Adobe PNG-Format – also auf keinen Fall geeignet für Flickr. Ich habe in Adobe PS Elements keine Möglichkeit gesehen, mit der die PSD-Dateien für den Upload automatisch in JPG verwandelt werden könnten, also habe ich Kopien der PSD-Dateien in JPG verwandelt (mit der Dateigröße von 10 MB) und in Elements importiert. Man kann den Daten einem Flickr-Album zuordnen und Zugriffsbeschränkungen festlegen. Dann wird nochmal auf den Knopf zum Hochladen geklickt und los geht es. Die Ladegeschwindigkeit hängt sicher von der Internetanbindung ab. Hier bei uns auf dem Land ist es sehr langsam.

Aber anderseits: wenn ich etwas an Elements zu bemängeln habe, ist es die Langsamkeit. Oder liegt es einfach daran, dass ich mit PSD- und nicht mit JPG-Dateien als Default arbeite?

Digitale Bildbearbeitung

Ich möchte eine neue Kategorie in meinen Blog einführen, nämlich „Digitale Bildbearbeitung“. Damit verbindet sich berufliches (siehe die Kategorie „Digitalisierung“) und privates Interesse. Ich fotografiere nämlich recht gerne und möchte mich jetzt, wo ich wieder ein bißchen Zeit habe, ein bißchen in die Bildbearbeitung und Fotografie einarbeiten. Bis jetzt beschränkte sich meine Fotografie hauptsächlich darauf, auf etwas Interessantes zu zielen und abzudrücken. Ja klar, frau macht sich ein bißchen mehr Gedanken als das (z.B. über Bildaufbau und goldener Schnitt), aber das ist es oft schon. Wenn die Fotos nicht so werden, wie ich es gerne hätte, stehe ich ein bißchen hilflos da. Deshalb möchte ich mein Gerät, eine Fuji S9500 und Bildbearbeitung kennenlernen. Meine Grundausstattung ist, neben der Kamera und Stativ, folgendes:

  • ein Dell Studio XPS Notebook mit Windows 7
  • Adobe Photoshop Elements 8 – zum Ordnen und Bildbearbeiten
  • The GIMP zur Bildbearbeitung
  • XNView 1.97 – zum Anschauen (ich habe bei Photoshop Elements noch nicht denselben Komfort gefunden
  • s7raw – zum Umwandeln der RAF-Dateien (RAW-Format von Fuji) in PSD-Dateien (Adobe Photoshop-Format

Braucht man noch was anderes?

Außerdem habe ich noch einen großen Karton voller Fotos, die sich über die Jahrzehnte angesammelt haben. Irgendwann möchte ich die mal digitalisieren. Ich besitze einen HP-Scanner, den man wahrscheinlich dafür einsetzen könnte, aber noch scheue ich diese Aufgabe, denn sie wird mich Monate beschäftigen.

Ich kann mir vorstellen, dass mehr Kenntnisse der digitalen Bildbearbeitung auch beruflich nützlich sind, wenn es um die Digitalisierung geht.

Ich lade meine Fotos auf Flickr hoch. Hier ist die URL zu meinen Fotos: http://www.flickr.com/photos/anette_s/. Allerdings sind nicht alle Fotos für alle sichtbar. Fotos mit Menschen, die ich kenne, drauf, veröffentliche ich nur als private Fotos. Wenn dies zufällig ein Bekannter oder Verwandter von mir liest und sich für die privaten Fotos interessiert, kann er mir schreiben und um einen Gästepass bitten.

Jäger und Bauern in der Bibliothekswelt

Seth Godin schreibt einen sehr interessanten Artikel in dem er Menschen in zwei Gruppen verteilt: Jäger und Bauern. Probleme entstehen, wenn Bauern einen Jäger wie einen Bauern behandeln und umgekehrt. Keine der beiden Gruppen ist besser als die andere. Es ist nur ein Versuch, die Mentalitätsunterschiede zwischen Menschen zu erklären.

Was sind Bibliothekare? Bauern oder Jäger? Ich würde mal sagen, dass viele Bibliothekare, wie z.B. Katalogisierer Bauern sind. Unermüdlich und in viel Kleinstarbeit bestellen sie das Feld der Informationen. Sind alle Bibliothekare Bauern? Wo sind die Jäger in unserer Welt? Auskunftsbibliothekare, die ihren Nutzern helfen sollen, so schnell wie möglich Information zu finden – sind sie nicht eher Jäger?

Und unsere Benutzer? Sind sie Bauern oder Jäger? Einerseits ist ein Wissenschaftler, der 200 Zeitschriftenartikel durchliest um dann etwas neues zu entwickeln wohl eher Bauer, oder? Aber wenn er nun genau den einen Artikel sucht, ist er Jäger, oder? Ich bin mir da nicht ganz sicher und benutze daher eher Fragezeichen.

Sind unsere Werkzeuge auf Bauern ausgerichtet oder auf Jäger? Ist Google eher ein Jäger-Werkzeug und der Opac eher ein Bauernwerkzeug? Man kann einen Jäger nicht mit einen Bauernwerkzeug beglücken und einen Bauern nicht mit einem Jägerwerkzeug. Kann man beides gleichzeitig anbieten? Wie?

Scantoweb hosted by hbz – Vortrag für Kunst- und Musikhochschulen

Gestern habe ich Vertretern von Kunst- und Musikhochschulen in NRW scantoweb hosted by hbz, unsere Digitalisierungsplattform vorgestellt. Hier meine Folien.

Powerpoint Bildschirmpräsentation (5,1 MB): 20091210-KuMus-Scan2.pdfWeb

PDF (4,9 MB)20091210-KuMus-Scan2Web.ppsx

Diigo und Delicious

Ich bin schon seit Jahren Delicious- (zum bookmarken) und Diigo-Nutzer (zum annotieren und highlighten). Nun habe ich mal die Bookmark-Funktion von Diigo untersucht und festgestellt, dass ich eigentlich alles mit Diigo machen könnte. In Firefox ist die Funktionalität vom Diigo-AddOn dem von Delicious sehr ähnlich, außer dass man damit eben auch Texte highlighten kann, etc.

Diigos Pluspunkte:

  • Ich kann es auch in Opera benutzen. Ich benutze Opera hauptsächlich als EMail-Client. Wenn ich aus dem EMail eine Website aufrufe, öffnet die sich natürlich in Opera und nicht in Firefox. Mir ist es nie gelungen, Delicious-Funktionalität in Opera zu installieren. Diigo ist in Opera zwar nicht ganz so einfach zu benutzen wie in Firefox, aber es geht.
  • Diigo kann nicht nur bookmarken. Mit Diigo kann ich Webseiten annotieren. Außerdem können diese Annotationen oder Textpassagen, die gehighlighted wurden extrahiert werden.
  • Die Kommunikation von Diigo zu Delicious ist einwandfrei. Nicht nur kann man Delicious-Bookmarks importieren, man kann Delicious automatisch updaten, wenn man Diigo updated. Da ich von diesem Blog auf meine Delicious-Bookmarks verlinke, es aber nicht zu Diigo machen kann, will ich Delicious nicht aufgeben. So habe ich beides: die Funktionalität von Diigo und Delicious. Leider kann man Diigo nicht von Delicious her updaten, denn in manchen Dingen ist Delicious (noch) besser als Diigo:

Diigos Minuspunkt:

  • Wenn man ein Bookmark erstellt/taggt, öffnet sich, wie bei Delicious ein kleines Fenster, in dem man Metadaten eingeben kann. Anders als in Delicious kann man aber nicht sehen, ob man diese URL schon mal gebookmarked hat, und wen ja, mit welchen Tags. Es kann also passieren, dass man dieselbe URL zweimal bookmarked und mit Tags versieht. Das ist nicht sehr schlimm – es entstehen keine zwei Bookmarks und wenn man denselben Tag zweimal vergibt, steht er am Ende nicht zweimal in dem Bookmark drinnen, aber es bedeutet doch, dass man unter Umständen mehr Zeit damit verwendet.

Was ich mir noch für Diigo wünschen würde, wäre Annotation von PDFs. Dieser Wunsch hat nichts mit einem Vergleich zwischen Delicious und Diigo zu tun, denn Delicious kann gar nicht annotieren. Aber wenn Diigo das könnte, und diese Annotationen, wie bei HTML auch noch extrahiert werden könnten, fände ich es richtig hilfreich. Hier kommt Mendeley wieder rein. Damit kann man seine Literatur verwalten und PDFs annotieren (aber die Highlights nicht extrahieren), aber schnell mal was bookmarken oder HTML annotieren ist nicht drin. Mein ultimatives Tool wäre also etwas womit man

  • Ganz schnell irgendeine URL bookmarken kann (wie Delicious oder Diigo)
  • Anspruchsvollere Metadaten vergeben kann – sprich Literaturverwaltung (wie Zotero oder Mendeley)
  • Alle möglichen Dateien (hauptsächlich HTML und PDF, aber auch Office-Formate, Textdateien, usw.) annotieren/highlighten und diese Annotationen extrahieren kann (wie Diigo für HTML)
  • Mit guten Schnittstellen um Information ohne Datenverlust aus anderen Applikationen zu laden oder zurückzugeben (wie Diigo)

Gibt es das? Wäre es möglich? Oder ist das die eierlegende Wollmilchsau? Vielleicht könnte man ja mit dem 4. Punkt meiner Wunschliste sowas wenigstens virtuell realisieren?