Mein digitales Portrait als kontrolliertes Voodoo

So sieht, nach http://personas.media.mit.edu/ mein digitales Portrait aus:

digitale Persoenlichkeit von Anette Seiler

(Klick auf das Bild um eine vergrößerte Version in einem neuen Fenster zu sehen)

Wie kam es zu dem Bild? Webseiten von oder über die angegebene Person werden angeschaut und mit Natural Language Processing bearbeitet. Auf der Website wird der Prozess wie folgt beschrieben:

Enter your name, and Personas scours the web for information and attempts to characterize the person – to fit them to a predetermined set of categories that an algorithmic process created from a massive corpus of data. The computational process is visualized with each stage of the analysis, finally resulting in the presentation of a seemingly authoritative personal profile.

Ich halte das Ergebnis für nicht gut. Natürlich schätzt man sich selbst anders ein als andere (und als Algorithmen), aber auch bei so objektiv wie möglicher Betrachtung, sehe ich viele Fragezeichen. Mein digitales Leben war bisher zweigeteilt: einerseits beschäftige ich mich beruflich als Bibliothekarin viel mit Repositorien, Digitalisierung, Semantic Web, Erschließung, Langzeitarchivierung, Programmierung usw. Anderseits habe ich einiges über Religion (in Zusammenhang mit Sexualität) im Web stehen. Dann noch ein ganz klein bißchen privates, wobei ich das, z.B. über Facebook, auch mehr oder weniger privat halte. Ich würde dem beruflichen 60%, dem religiösen 30% und dem privaten 10% geben.

Die Grafik kategorisiert Information über mich anders. Wenn man „online“, „books“, „education“, „media“ und „professional“ zusammen nimmt, kommt man vielleicht auf die Dinge, die ich als „beruflich“ einschätze. Zusammen würde es wahrscheinlich den größten Block ausmachen. Das religiöse wird nur sehr eingeschränkt wahrgenommen. Das private kann man eventuell mit „travel“ verbinden. Dann gibt es aber eine Menge Blöcke, und einige davon sehr große, mit denen ich gar nichts anfangen kann: „accident“, „education“, „management“, „legal“, „illegal“, „fame“, „medicine“, „movies“, „news“, „social“, „art“ und „sports“. Ja, ich interessiere mich für Film, Kunst, Sport und Nachrichten, aber ich äußere mich kaum dazu. Beruflich habe ich vielleicht mit Mangement, Education und legal/illegal (in der Form von Urheberrecht) zu tun, aber auch darüber habe ich nie was geschrieben. Die Kategorien „accident“ und „fame“ haben nichts mit meinem Leben zu tun. Noch weniger kann ich verstehen, warum „accident“ eine so große Rolle in der Grafik spielt.

Ich fühle mich also von dieser Grafik nicht richtig dargestellt. Woran könnte es liegen? Mir fallen folgende mögliche Gründe ein:

  1. Information über mich liegt hauptsächlich in deutsch vor. Laut der Erklärung unter „How it Works“ (http://personas.media.mit.edu/personasWeb.html) wird versucht, nicht-Englischen Text zu entfernen. Da bleibt nur sehr wenig übrig.
  2. Ich bin nicht die einzige Anette Seiler im Internet. Obwohl mein Vorname eher selten ist, gibt es meines Wissens, noch mindestens eine zweite „Anette Seiler“. Allerdings kann ich mich nicht erinnern über sie etwas wie „accident“ gesehen zu haben. Anderseits habe ich schon lange nicht mehr nach unser beider Namen gegoogelt. Jedenfalls kann ich mir vorstellen dass Namen wie „Michael Müller“ oder „John Smith“ kaum aussagekräftige Ergebnisse bringen können
  3. Wie bereits gesagt: nicht alle Information im Netz über mich ist allen zugänglich (Facebook). Das kann auch dazu führen, dass ein schiefes Bild von mir gezeichnet wird.

Das Experiment möchte zwei Ziele erreichen (siehe unter „Now what“):

  1. Es möchte den Prozess, der hinter den Web-Kulissen stattfindet, darstellen. Solche statistischen Berechnungen finden oft statt, z.B. auf Partnerschaftswebseiten. Erschreckend ist der Gedanke, dass meine Daten-Geschichte zukünftige Einschätzungen, die andere über mich treffen könnten, beeinflussen kann. Was wäre, wenn ein potentieller Arbeitgeber zum Beispiel bei den Bewerbern auf eine Stelle solche Mechanismen benutzen würde?
  2. Der Entscheidungsprozess im Ranking von Webseiten ist sehr undurchsichtig – vor allem wenn es darum geht, Geld damit zu verdienen. „Personas is meant to expose this black box process as controlled voodoo.“ heisst es unter „Now what“. Websites, die solche Mechanismen einsetzen, stellen sich selbst oft als sehr authoritativ dar, sind es aber gar nicht. Personas will also zeigen, dass Maschinen nicht so intelligent sind, wie wir es oft vermuten, auch wenn ihre Ergebnisse toll aussehen.

Nun, die Website hat bei mir vor allem das zweite Ziel erreicht. Ich gehöre eher zu den Verfechtern von Suchmaschinentechnologie für die Erschließung von Information. Zur Verfechterin wurde ich, als ich einige sehr überzeugende Ergebnisse demonstriert bekam. War das, was ich gesehen habe „controlled voodoo“? Vielleicht ja, vielleicht nein. Genau die Nachdenklichkeit wollte man erreichen. Wenn man dann sagt: „I am scared!“ so sagen die Entwickler: „Then we did our job!“

Dem Wissenschaftler ist es egal, aus welcher Bibliothek es kommt!

Bei der Verbundkonferenz des GBV wurde immer wieder ein Gedanke geäußert, der mich nachdenklich gemacht hat: dass Bibliotheken sich eher um sich selbst, als um ihre Kunden, z.B. die Wissenschaftler kümmern. Beispiel Digitalisierungsprojekte: eine Bibliothek digitalisiert und bringt diese Digitalisate auf ihre Website. Das ist natürlich sehr gut. Wissenschaftler auf der ganzen Welt können nun zur jeder Zeit darauf zugreifen.

Aber kann es nicht noch besser? Immer noch muss ein Wissenschaftler von Website zur Website springen, so wie er früher von Bibliothek zu Bibliothek reisen musste. Dem Wissenschaftler ist es letztendlich egal, aus welcher Bibliothek das Digitalisat kommt. Er wünscht sich einen Zugang zu allen ihm relevanten Digitalisate. Überregionale und themenübergreifende Portale sind also eine Antwort. Nur wird diese Antwort – und das ist nicht nur mein Gefühl, sonst hätte man bei der Konferenz nicht in verschiedenen Kontexten immer wieder davon gesprochen – von den Bibliotheken eher argwönisch betrachtet. Es gibt keine begeisterte Unterstützung dafür. Man kritisiert eher die Deutsche Digitale Bibliothek oder Europeana als dass man über die Chancen dieser Projekte redet.

Das ist einerseits verständlich. Durch ein Bibliotheksportal kann sich die Bibliothek profilieren. Sie kann zeigen: „Schaut her! Wir haben diese tollen Digitalisate! Wir sind eine tolle Einrichtung!“ Eine Bibliothek, die nicht Marketing in eigener Sache führt hat verloren. Gerade heute ist ein Artikel in der FAZ über Ressourcenmangel bei der Herzog August-Bibliothek in Wolfenbüttel. Auch hier wird auf die Digitalisierungsprojekte verwiesen, Projekte, die wissenschaftlich wirklich hochinteressant und wichtig sind, Projekte, die unbedingt gefördert werden müssen.

Diese Profilierung, gerade wenn es um das Lockermachen von Personal und Geld geht, geschieht, indem man sich von anderen Bibliotheken abgrenzt, indem man zeigt, dass man mehr macht, es besser macht als eine andere Institution, die auch im Konkurrenzkampf um die beschränkten Ressourcen steht.

Ich will gar nicht sagen, dass eine Bibliothek nicht ihre eigenen Digitalisate auf ihrer Website darstellen soll. Portalsoftware für Digitalisierungsprojekte, sei es Visual Library, sei es Goobi, sei es irgendeine andere Software, bieten diese Möglichkeit und es wäre dumm, sie nicht einzusetzen. Aber man kann und sollte mehr tun!

Es ist schön, wenn man sagen kann: „Wir haben diese tollen Digitalisate!“ Noch besser ist: „Auf unsere tollen Digitalisate wird n-mal zugegriffen!“ Was bringen die schönsten Digitalisate auf der Bibliothekswebsite, wenn keiner sie benutzt? Richtig unersetzlich macht man sich, wenn man beweisen kann, dass man tatsächlich genutzt wird. Also sollte man sich fragen: „Wie kann ich den Zugriff erhöhen? Wie kann ich mehr Leute dazu bewegen, auf die Digitalisate zuzugreifen?“

SEO gehört dazu. Natürlich will man in Google gefunden werden! Aber wenn es um die Wissenschaftler geht, muss mehr als SEO gemacht werden. Das lässt sich am besten realisieren, indem man dem Wissenschaftler etwas gibt, was er braucht: alles an einer Stelle mit wirklich sinnvollen Tools. Und dieses „alles an einer Stelle“ ist nur möglich, wenn man mit anderen Institutionen zusammenarbeitet. Das ist schwierig, wenn man gleichzeitig im Konkurrenzkampf ist und sich von anderen abgrenzen möchte.

Leider geht der Konkurrenzkampf weiter wenn es um diese Portale geht. Machtspielchen werden gespielt. Zum Beispiel werden die „Großen“, die mit den meisten Digitalisaten und Digitalisierungsprojekten bestimmen wollen, wie das Werkzeug für die Wissenschaftler auszusehen hat. Die anderen müssen es abnicken oder sie bleiben draußen. Und die, die gar nicht digitalisieren, aber sich mit Portalsoftware auskennen (z.B. Verbundzentralen) werden oft ignoriert oder gar bekämpft (denn Verbundzentralen sind ja auch Konkurrenten im Kampf um Ressourcen).

Ich will jetzt gar nicht anfangen von der Profilierungssucht mancher Bibliotheksdirektoren oder -Direktorinnen. Denn dann ist der Vergleich mit dem Dschungel nicht mehr weit.

Jedenfalls glaube ich, dass wenn man sich bei den Wissenschaftlern unersetzlich macht – und das kann keine Bibliothek alleine – viel mehr gewonnen wird, als wenn man erstmal an sich und die eigene Institution denkt.