Skip to content

Digitalisierungsmetadaten

Wenn ich hier von “Digitalisierung” spreche, meine ich nicht “Scannen” oder “Fotografieren”, also nicht die Umwandlung von analoger Information in digitale Daten, sondern den ganzen Prozess, der bei Digitalisierung durchlaufen werden muss. Darunter fällt unter anderen die Selektion, Aushebung, Transport, Scannen, Qualitätsmanagement, Erschließung, Bereitstellung im WWW, usw.

Während dieses Prozesses fallen auf verschiedenen Ebenen verschiedene Metadaten an. Einige werden nur für einen eingeschränkten Zeitraum gebraucht, andere müssen für den ganzen Lebenszyklus eines Digitalisats zur Verfügung gestellt werden. Mir fallen spontan folgende Ebenen ein:

  • Institutionen (z.B. Policies, die für alle Digitalisierungsprojekte einer Institution gelten). Diese Metadaten dürfen allerdings nicht auf eine Institution beschränkt werden, da bei Digitalisierung viel Wert auf Kooperation zwischen Institutionen gelegt wert. Außerdem kommt es fast zwangsläufig zu einem Datenaustausch zwischen Institutionen.
  • Sammlungsebene. Nicht alle Digitalisierung findet im Sammlungskontext statt, aber oft doch. Vielleicht könnte man auch “Batches” als Sammlungen bezeichnen (?). Und natürlich gibt es Sammlungen von Sammlungen.
  • Stücke, z.B. ein Buch.
  • Images, z.B. von einer Seite eines Buches. Manchmal ist Stück mit Image identisch, z.B. bei Fotos

Das ist jetzt die Reihenfolge auf einer vertikalen Ebene. Diese Ebenen werden von

  • Strukturmetadaten miteinander verbunden.

Aber es gibt auch eine horizontale Ebene. Darunter könnte z.B. folgendes fallen:

  • Metadaten, wenn wir von Meta-Metadaten sprechen, z.B. den Erstellern der Metadaten
  • Geräte, z.B. Scanner oder Kameras
  • Aktionen/Workflows – was muss in welcher Reihenfolge getan werden?
  • Personen – wer macht was?
  • Rechte – wer darf was unter welchen Umständen?
  • Schnittstellen, zwischen Institutionen und/oder Sammlungen
  • Qualitätsmanagement, z.B. Qualitätskriterien, die wieder von
  • Zielen abhängig sind, z.B. will man für Webzugriff, für Volltextindexierung oder für die Archivierung digitalisieren? Das führt wiederum zu
  • Formaten
  • (Projekt)Management – all dies muss ja irgendwie verwaltet werden und auch dafür braucht es Metadaten

Metadaten kann man klassifizieren. Folgende Einteilung ist üblich:

  • Beschreibende / Bibliographische Metadaten
  • Administrative Metadaten
  • Technische Metadaten
  • Rechtsmetadaten
  • Strukturmetadaten

Diese Klassen sind allerdings nicht streng voneinander getrennt, sondern formen Schnittmengen, z.B. bei administrativen Metadaten und technischen Metadaten. Und auch nicht alle Metadatengruppen können in diese Klassen eingeteilt werden.

Wenn man also in der Digitalisierung an Metadaten denkt, so ist eine Klassifikation oder Hierarchie ein sehr eingeschränktes Ausdrucksmittel. Es handelt sich um Konzepte, die man irgendwie, manchmal hierarchisch miteinander verbinden kann, die anderseits aber auch eher als Netz miteinander verknüpft sind. Es werden Cluster, Mengen und Schnittmengen gebildet.

So viele Konzepte, so viele Strukturen, Beziehungen und Eigenschaften zwischen den Konzepten. Ein interessantes Thema, dass sich lohnt, genauer betrachtet zu werden.

Photoshop Elements nach Flickr – nicht so einfach, wenn man deutsch ist

So langsam lerne ich Photoshop Elements kennen. Der Organizer gefällt mir – dazu später mehr – und Fotos können gut bearbeitet werden.

Nun wollte ich Fotos nach Flickr hochladen und stand vor einem Problem. Nach der Adobe Website und anderen Quellen ist das möglich, aber so sehr ich den Instruktionen folgte und Einstellungen einstellte – bei mir funktionierte es nicht. Flickr stand für mich unter den Adobe Partner Services nicht zur Verfügung.

Heute fand ich dann diesen Tipp:

Für die USA liefert der Hersteller Adobe selbst ein Plug-in mit. Und da sowohl Photoshop Elements als auch flickr international gleich funktionieren, können Sie auch in Europa den direkten flickr-Export nutzen: Starten Sie den Organizer von Elements und wählen Sie unter „Voreinstellungen, Adobe Partner-Services“ den Standort „USA“ aus. Die Sprache können Sie weiterhin deutsch lassen. Nun stehen unter dem Reiter „Weitergabe“ die Einträge für die US-amerikanischen Dienstleister. Unter dem Button „Mehr Optionen“ finden Sie den flickr-Export. Hier müssen einmalig der flickr-Benutzername und das Passwort eingetragen werden. Der Rest (Bilder kleinrechnen, hochladen und Tags zuordnen) geht automatisch. Markus Linden

Und genau das funktioniert.

Die Anmeldung bei Flickr war unkompliziert. Auch das Auswählen der Daten, die man hochladen möchte ist einfach. Allerdings gab es dann eine Fehlermeldung, dass die Dateien zu groß oder in einem nicht-unterstützten Format seien. Ein Blick in die Flickr FAQs zeigt:

Wenn Sie einen Pro Account haben, können Sie Fotos bis zu 20 MB hochladen.

und

Flickr unterstützt offiziell JPEG-, nicht animierte GIF- und PNG-Dateien. Sie können auch TIFF-Dateien sowie einige andere Dateitypen hochladen, diese werden dann jedoch automatisch konvertiert und im JPEG-Format gespeichert.

Nun, die Bilder sind über 100 MB groß und im Adobe PNG-Format – also auf keinen Fall geeignet für Flickr. Ich habe in Adobe PS Elements keine Möglichkeit gesehen, mit der die PSD-Dateien für den Upload automatisch in JPG verwandelt werden könnten, also habe ich Kopien der PSD-Dateien in JPG verwandelt (mit der Dateigröße von 10 MB) und in Elements importiert. Man kann den Daten einem Flickr-Album zuordnen und Zugriffsbeschränkungen festlegen. Dann wird nochmal auf den Knopf zum Hochladen geklickt und los geht es. Die Ladegeschwindigkeit hängt sicher von der Internetanbindung ab. Hier bei uns auf dem Land ist es sehr langsam.

Aber anderseits: wenn ich etwas an Elements zu bemängeln habe, ist es die Langsamkeit. Oder liegt es einfach daran, dass ich mit PSD- und nicht mit JPG-Dateien als Default arbeite?

Getagged , ,

Digitale Bildbearbeitung

Ich möchte eine neue Kategorie in meinen Blog einführen, nämlich “Digitale Bildbearbeitung”. Damit verbindet sich berufliches (siehe die Kategorie “Digitalisierung”) und privates Interesse. Ich fotografiere nämlich recht gerne und möchte mich jetzt, wo ich wieder ein bißchen Zeit habe, ein bißchen in die Bildbearbeitung und Fotografie einarbeiten. Bis jetzt beschränkte sich meine Fotografie hauptsächlich darauf, auf etwas Interessantes zu zielen und abzudrücken. Ja klar, frau macht sich ein bißchen mehr Gedanken als das (z.B. über Bildaufbau und goldener Schnitt), aber das ist es oft schon. Wenn die Fotos nicht so werden, wie ich es gerne hätte, stehe ich ein bißchen hilflos da. Deshalb möchte ich mein Gerät, eine Fuji S9500 und Bildbearbeitung kennenlernen. Meine Grundausstattung ist, neben der Kamera und Stativ, folgendes:

  • ein Dell Studio XPS Notebook mit Windows 7
  • Adobe Photoshop Elements 8 – zum Ordnen und Bildbearbeiten
  • The GIMP zur Bildbearbeitung
  • XNView 1.97 – zum Anschauen (ich habe bei Photoshop Elements noch nicht denselben Komfort gefunden
  • s7raw - zum Umwandeln der RAF-Dateien (RAW-Format von Fuji) in PSD-Dateien (Adobe Photoshop-Format

Braucht man noch was anderes?

Außerdem habe ich noch einen großen Karton voller Fotos, die sich über die Jahrzehnte angesammelt haben. Irgendwann möchte ich die mal digitalisieren. Ich besitze einen HP-Scanner, den man wahrscheinlich dafür einsetzen könnte, aber noch scheue ich diese Aufgabe, denn sie wird mich Monate beschäftigen.

Ich kann mir vorstellen, dass mehr Kenntnisse der digitalen Bildbearbeitung auch beruflich nützlich sind, wenn es um die Digitalisierung geht.

Ich lade meine Fotos auf Flickr hoch. Hier ist die URL zu meinen Fotos: http://www.flickr.com/photos/anette_s/. Allerdings sind nicht alle Fotos für alle sichtbar. Fotos mit Menschen, die ich kenne, drauf, veröffentliche ich nur als private Fotos. Wenn dies zufällig ein Bekannter oder Verwandter von mir liest und sich für die privaten Fotos interessiert, kann er mir schreiben und um einen Gästepass bitten.

Jäger und Bauern in der Bibliothekswelt

Seth Godin schreibt einen sehr interessanten Artikel in dem er Menschen in zwei Gruppen verteilt: Jäger und Bauern. Probleme entstehen, wenn Bauern einen Jäger wie einen Bauern behandeln und umgekehrt. Keine der beiden Gruppen ist besser als die andere. Es ist nur ein Versuch, die Mentalitätsunterschiede zwischen Menschen zu erklären.

Was sind Bibliothekare? Bauern oder Jäger? Ich würde mal sagen, dass viele Bibliothekare, wie z.B. Katalogisierer Bauern sind. Unermüdlich und in viel Kleinstarbeit bestellen sie das Feld der Informationen. Sind alle Bibliothekare Bauern? Wo sind die Jäger in unserer Welt? Auskunftsbibliothekare, die ihren Nutzern helfen sollen, so schnell wie möglich Information zu finden – sind sie nicht eher Jäger?

Und unsere Benutzer? Sind sie Bauern oder Jäger? Einerseits ist ein Wissenschaftler, der 200 Zeitschriftenartikel durchliest um dann etwas neues zu entwickeln wohl eher Bauer, oder? Aber wenn er nun genau den einen Artikel sucht, ist er Jäger, oder? Ich bin mir da nicht ganz sicher und benutze daher eher Fragezeichen.

Sind unsere Werkzeuge auf Bauern ausgerichtet oder auf Jäger? Ist Google eher ein Jäger-Werkzeug und der Opac eher ein Bauernwerkzeug? Man kann einen Jäger nicht mit einen Bauernwerkzeug beglücken und einen Bauern nicht mit einem Jägerwerkzeug. Kann man beides gleichzeitig anbieten? Wie?

Scantoweb hosted by hbz – Vortrag für Kunst- und Musikhochschulen

Gestern habe ich Vertretern von Kunst- und Musikhochschulen in NRW scantoweb hosted by hbz, unsere Digitalisierungsplattform vorgestellt. Hier meine Folien.

Powerpoint Bildschirmpräsentation (5,1 MB): 20091210-KuMus-Scan2.pdfWeb

PDF (4,9 MB)20091210-KuMus-Scan2Web.ppsx

Getagged ,

Museale Daten als Linked Data

Für meine Masterarbeit schrieb ich über die Umwandlung musealer Metadaten in Linked Data und deren Veröffentlichung im Semantic Web. Diese Arbeit habe ich nun ein überarbeitet und möchte sie hier anderen zur Verfügung stellen.

Die Publikation musealer Daten als Linked Data

Diigo und Delicious

Ich bin schon seit Jahren Delicious- (zum bookmarken) und Diigo-Nutzer (zum annotieren und highlighten). Nun habe ich mal die Bookmark-Funktion von Diigo untersucht und festgestellt, dass ich eigentlich alles mit Diigo machen könnte. In Firefox ist die Funktionalität vom Diigo-AddOn dem von Delicious sehr ähnlich, außer dass man damit eben auch Texte highlighten kann, etc.

Diigos Pluspunkte:

  • Ich kann es auch in Opera benutzen. Ich benutze Opera hauptsächlich als EMail-Client. Wenn ich aus dem EMail eine Website aufrufe, öffnet die sich natürlich in Opera und nicht in Firefox. Mir ist es nie gelungen, Delicious-Funktionalität in Opera zu installieren. Diigo ist in Opera zwar nicht ganz so einfach zu benutzen wie in Firefox, aber es geht.
  • Diigo kann nicht nur bookmarken. Mit Diigo kann ich Webseiten annotieren. Außerdem können diese Annotationen oder Textpassagen, die gehighlighted wurden extrahiert werden.
  • Die Kommunikation von Diigo zu Delicious ist einwandfrei. Nicht nur kann man Delicious-Bookmarks importieren, man kann Delicious automatisch updaten, wenn man Diigo updated. Da ich von diesem Blog auf meine Delicious-Bookmarks verlinke, es aber nicht zu Diigo machen kann, will ich Delicious nicht aufgeben. So habe ich beides: die Funktionalität von Diigo und Delicious. Leider kann man Diigo nicht von Delicious her updaten, denn in manchen Dingen ist Delicious (noch) besser als Diigo:

Diigos Minuspunkt:

  • Wenn man ein Bookmark erstellt/taggt, öffnet sich, wie bei Delicious ein kleines Fenster, in dem man Metadaten eingeben kann. Anders als in Delicious kann man aber nicht sehen, ob man diese URL schon mal gebookmarked hat, und wen ja, mit welchen Tags. Es kann also passieren, dass man dieselbe URL zweimal bookmarked und mit Tags versieht. Das ist nicht sehr schlimm – es entstehen keine zwei Bookmarks und wenn man denselben Tag zweimal vergibt, steht er am Ende nicht zweimal in dem Bookmark drinnen, aber es bedeutet doch, dass man unter Umständen mehr Zeit damit verwendet.

Was ich mir noch für Diigo wünschen würde, wäre Annotation von PDFs. Dieser Wunsch hat nichts mit einem Vergleich zwischen Delicious und Diigo zu tun, denn Delicious kann gar nicht annotieren. Aber wenn Diigo das könnte, und diese Annotationen, wie bei HTML auch noch extrahiert werden könnten, fände ich es richtig hilfreich. Hier kommt Mendeley wieder rein. Damit kann man seine Literatur verwalten und PDFs annotieren (aber die Highlights nicht extrahieren), aber schnell mal was bookmarken oder HTML annotieren ist nicht drin. Mein ultimatives Tool wäre also etwas womit man

  • Ganz schnell irgendeine URL bookmarken kann (wie Delicious oder Diigo)
  • Anspruchsvollere Metadaten vergeben kann – sprich Literaturverwaltung (wie Zotero oder Mendeley)
  • Alle möglichen Dateien (hauptsächlich HTML und PDF, aber auch Office-Formate, Textdateien, usw.) annotieren/highlighten und diese Annotationen extrahieren kann (wie Diigo für HTML)
  • Mit guten Schnittstellen um Information ohne Datenverlust aus anderen Applikationen zu laden oder zurückzugeben (wie Diigo)

Gibt es das? Wäre es möglich? Oder ist das die eierlegende Wollmilchsau? Vielleicht könnte man ja mit dem 4. Punkt meiner Wunschliste sowas wenigstens virtuell realisieren?

Semantic Web in Bibliotheken – SWIB09

Am 24. und 25. November bietet das hbz und die ZBW eine Tagung zum Thema “Semantic Web in Bibliotheken” an. Das Programm ist vom Feinsten!

http://www.swib09.de

Das Semantic Web

Für mein Studium habe ich einen Aufsatz zum Thema Semantic Web geschrieben. Wer sich dafür interessiert, kann ihn hier downloaden.

Das Semantic Web

Mendeley als Alternative zu Zotero? Ein erster Überblick

Ich halte Zotero für eines der nützlichsten Programme in meinem Arbeits- und Studiumsleben. Aber ich bin nicht zu 100% glücklich mit Zotero. Mir fehlt z.B. so etwas wie ein Citation Key, eine ID für meine Metadaten zu einem bestimmten Dokument. Das kann irgendwas sein, z.B. eine laufende Nummer. (*) Es gibt auch andere, die sich sowas für Zotero wünschen. Unter ZoteroDev gibt es ein entsprechendes Ticket, aber das neuste Kommentar ist dort auch schon 20 Monate alt. Es steht in den Sternen, ob und wann es mal umgesetzt wird.

Wegen dieser Unzufriedenheit habe ich mir Mendeley installiert. Mendeley hat nämlich die Möglichkeit einen Citation Key zur bibliographischen Beschreibung anzulegen. Man kann diese Keys automatisch erstellen, indem man die Bibliographie als BibTex-Datei exportiert. Änderungen, die man per Hand vornimmt, bleiben bei einer weiteren automatischen Erzeugung erhalten. Und wenn man nach dem Citation Key sucht, findet man das entsprechende Katalogisat. Das ist genau, was ich brauche.

Auf dem ersten Blick ähnelt Mendeley Zotero in vielen Aspekten. Beim genaueren Hinschauen gibt es dann doch Unterschiede. Dazu kommt, dass Mendeley keinesfalls so stabil wie Zotero ist. Doch zu den Unterschieden:

Es ist einfach, eine Webseite in Zotero aufzunehmen: Ein Klick, eventuell ein bißchen Katalogisierung und fertig. Das funktioniert unter Mendeley nicht ohne weiteres. Es gibt eine Verknüpfung, die man in die Lesezeichen-Leiste ablegen kann. Wenn man aber nun z.B. einen Artikel aus dem Kölner Stadtanzeiger in seine Bibliothek aufnehmen möchte, geht das nicht. Der Mendeley Link funktioniert nur bei einigen ausgesuchten Websites wie arxiv oder World Cat, SpringerLink oder ScienceDirect. Wie bei Zotero werden COinS benutzt, aber im Gegensatz zu Zotero nur bei einigen, ausgewählten Websites. Bei den meisten akademischen Repositorien werden trotz eventuell vorhandener COinS diese nicht erkannt. Natürlich kann man dennoch Webseiten aufnehmen, aber das geht nur händisch. Nicht dass man bei Zotero nicht auch Hand anlegen muss – aber manchmal kann man die von Zotero extrahierte Information auch benutzen. Bei Mendeley wird nichts extrahiert. Bei PDF-Dateien gibt es Vorteile bei Mendeley: Das Programm versucht, die Metadaten aus PDF-Dateien zu extrahieren. Aus einem von mir geschriebenen Protokoll, dass ich testweise geladen habe, hat es den Titel erkannt. Bei Zotero war dies nicht möglich. (**)

Aber es gibt ja Abhilfe: man kann seine Zotero-Bibliothek in Mendeley synchronisieren. Das funktioniert nur in die Richtung Zotero nach Mendeley, nicht umgekehrt. Nur erweist sich Mendeley in der Hinsicht noch als sehr fehleranfällig. Ich bekomme zwar die Zotero-Dateien rüber, aber die Tatsache, dass ich mit Zotero synchronisieren möchte, wird nicht gespeichert. Nach der Synchronisation kommt meistens ein Absturz der die Daten zur Synchronisation aus den Optionen löscht.

Wenn man nun aber auf Zotero verzichtet? Dann muss man halt alle Metadaten selber eingeben. Der Katalogisierungsaufwand ist, vor allem wenn man auch Webseiten verwaltet, größer.

Was PDFs betrifft, ist Mendeley Zotero nicht nur in der Metadatenextraktion überlegen: Man kann die geladenen PDFs auf dem Mendeley-Desktop annotieren. Da könnte man es sich fast überlegen, einen PDF-Snapshot einer Website zu erstellen und diesen zu den Metadaten der Webseite dazuzuladen. Da Webseiten sich sehr schnell ändern können, ist eine solche Fixierung vielleicht keine schlechte Idee. Und diese PDF könnte ich dann in Mendeley annotieren.

Mendeley-Desktop ist nicht, wie Zotero, ein Plugin von Firefox, sondern ein separates Programm. Einige mögen das als Nachteil sehen, mich stört es nicht. Im Gegenteil: es macht mich nicht davon abhängig, Firefox zu benutzen. Und außerdem ist das eigenständige Programm übersichtlicher als Zotero. Wenn man Zotero in derselben Übersicht haben möchte, muss man es maximieren, aber dann ist der Browser nicht mehr nutzbar. Zotero als halbes Firefox-Fenster ist ein Kompromiss, der mir nicht wirklich gefällt.

Ein Argument gegen Mendeley ist, dass es ein proprietäres Programm ist. Man liefert sich zu einem gewissen Maße einer Firma aus. Während der Speicherplatz von Zotero nur durch die Größe der webdav-Partition begrenzt wird, ist das Maximum, das man bei Mendeley hochladen kann, 500 MB. Danach braucht man ein Premium-Paket. Im Augenblick bin ich mit meinen Zotero-Dateien bei 115 MB. Aber dieses Limit gilt nur, wenn man seine Daten auf die Mendeley-Website zwecks Synchronisation hochlädt. Man kann Mendeley Desktop auch eigenständig benutzen. Für mich, die ich von mehreren Rechnern an mehreren Orten auf meine bibliographischen Daten zugreifen möchte, geht es aber nicht ohne den Weg über die Mendeley-Website und damit nur mit der Einschränkung. Die Kosten für diese Premium-Pakete sind noch nicht bekannt.

Die Synchronisation zwischen Mendeley-Desktop und meinem Account ist noch nicht optimal. Die Metadaten und die dazugehörige Datei auf dem Desktop werden nicht auf die Website geladen. Es kommt immer wieder zu Fehlermeldungen. Die Metadaten der Website werden auf den Desktop übernommen. Es ist mir nicht möglich, über die Webschnittstelle eine PDF-Datei zu den Metadaten hochzuladen, etwas, was auf dem Desktop ohne weiteres möglich ist. Also brauche ich mir jetzt noch keine Gedanken über Premium-Pakete zu machen: die Dateien werden sowieso nicht synchronisiert.

Durch meine Versuche mit der Zotero- und Mendeley-Website-Synchronisation empfinde ich Mendeley als ziemlich buggy. Das ist nicht weiter verwunderlich, denn es handelt sich um die Programmversion 0.9.4. Da muss man mit Abstürzen und Problemen rechnen. Dennoch werde ich es mal in der nächsten Zeit ohne Zotero-Synchronisation ausprobieren. Mendeley ist es auf jeden Fall wert, dass man es richtig kennenlernt. Zotero werde ich, bei all den Bugs und Fehlermeldungen und Abstürzen jetzt noch nicht deinstallieren.

Fußnoten

(*) Der Grund: Ich mache mir oft einen Ausdruck des Artikels. (Ja, ich weiss, es ist nicht cool, Ausdrucke zu machen, aber ich lese sehr viel im Zug und besitze keinen E-Book-Reader) Da würde ich mir am liebsten den Citation Key draufschreiben, damit ich die zum Ausdruck gehörigen Daten schnell und problemlos in Zotero finden kann. Natürlich könnte ich auch nach Autor und Titel suchen, aber wenn man vom selben Autor mehrere Artikel oder Buchkapitel oder Bücher in Zotero beschreibt, ist das auch wieder umständlich. Und dann mache ich mir Notizen zu gelesenen Artikeln oder Webseiten in Word uns speicher sie als RTF ab – und dafür gibt es einen guten Grund: so kann ich nicht nur Textnotizen machen (wie Zotero es erlaubt), sondern auch Bilder. Und außerdem brauche ich die RTF-Dateien auch für andere Zwecke, auf die ich jetzt nicht eingehen möchte. Oder ich zeichne mir ein Bild zu dem Artikel und speicher es ans PNG ab. Als Dateinamen würde ich gerne diesen Citation Key benutzen, so dass ich sofort eine Beziehung zwischen meinem Eintrag in Zotero und zu diesen Dateien erstellen kann. Und auch auf Delicious gebe ich diesen Citation Key in meinen Notizen an und weiss so, dass ich mir die bestimmte URL schon genauer angeschaut habe.

(**) Ein Zitat aus den FAQs zu der Extraktion von Metadaten aus PDFs:

The automatic extraction of document details (authors, title, journal etc.) from a research paper works in several steps.

First, the full text is extracted from the article (currently, only text PDF documents are supported; OCR support for scanned image PDFs is coming soon).

Then, Mendeley Desktop generates a “fingerprint” from the article’s text. The fingerprint is anonymously sent to the Mendeley server (the server doesn’t store this information and no one can see which articles you are reading). The server checks whether correct document details already exists for this fingerprint and, if that’s the case, downloads it.

If no corresponding fingerprint is found, Mendeley Desktop searches the article’s text for a DOI (“Digital Object Identifier”) number. Should it detect a DOI, it queries the CrossRef database for the correct document details.

Finally, if no DOI is found either, Mendeley Desktop uses algorithms to analyze the full text extracted from the article and tries to “guess” the document details. Unfortunately, it won’t guess correctly 100% of the time. However, if you correct the recognition mistakes, other Mendeley users can benefit from this as well! Here’s how:

As you know, you can back up your Mendeley Desktop library to your account on Mendeley Web. When you do so, the aforementioned fingerprint and the document details which you corrected are uploaded to your account. The Mendeley server aggregates the document details + fingerprints across all user accounts into a completely anonymous common document details pool (also see What about privacy?). So the next time another user runs the same article through the automatic document details extraction, the document details you corrected can be retrieved from the Mendeley server via the fingerprint. In this way, every user benefits from the other users’ corrections.

Getagged ,