Re-LektürenÜber Google-Print und das seltsame Vergnügen, alte Texte zu lesenAndreas Mertin |
Google-PrintSeit längerem erhitzt ein heftiger Streit um das Google-Projekt der Digitalisierung der Bücherwelten die europäischen Gemüter. Was sind die - nicht nur urheberrechtlichen - Folgen, wenn ein Suchmaschinenbetreiber hingeht, und Teilbestände amerikanischer Universitätsbibliotheken digitalisiert? Zunächst könnte man sich doch freuen, dass bisher ungehobene Schätze der Kulturgeschichte allmählich zugänglich werden und vor allem: für jedermann einsichtig werden. Aber natürlich ist das Gros der gescannten Werke angelsächsischer Herkunft - was die kulturgeschichtliche Datenlage scheinbar einseitig verzerrt. Sicherlich ist die alteuropäische Kultur in amerikanischen Bibliotheken vertreten, aber in Relation zu den dort befindlichen englischsprachigen Werken vermutlich unterrepräsentiert. Welch eine Schmach für den alteuropäischen Stolz. Nicht zuletzt die Franzosen fürchten um die globale Bedeutung ihrer Kultur - vermutlich zu Recht. Die deutsche kulturelle Überlieferung ist dagegen - das lassen erste Stichproben vermuten - etwas besser vertreten. Ob sich durch die Digitalisierung amerikanischer Bibliotheken allerdings die kulturgeschichtlichen Gewichte verlagern, scheint mir mehr als zweifelhaft. Noch pflegen Studenten allzuoft den Weg des geringsten Widerstands - bei einer möglichen Auswahl an Dokumenten werden sie zunächst die deutschsprachigen aus pragmatischen Gründen bevorzugen. Und deutschsprachige Dokumente finden sich - wie gleich noch zu zeigen sein wird - doch einige in den amerikanischen Bibliotheken. Vieles wird bei dieser Entwicklung von der Kooperation der Urheber und der Verlage mit Google abhängen. Und da ist offenkundig noch nichts entschieden, auch wenn Standardwerke wie die Theologische Realenzyklopädie (TRE) schon größtenteils erfasst sind. Und tatsächlich dürfte es vielen Autoren nur Recht sein, wenn ihre Schriften zumindest in Form von Auszügen auch jenen zugänglich werden, die ihre Publikationen sonst nicht zur Kenntnis genommen hätten. Und für vergriffene Bücher ist der Weg über Google-Print nicht das Schlechteste - vorausgesetzt, die Texte werden auch ordentlich aufbereitet für den Leser zur Verfügung gestellt. Oberflächlich und nicht den Bedürfnissen der Wissenschaft entsprechend sei die Erfassung der Werke durch Google, wird nun in Europa argumentiert. Tatsächlich entspricht die vorfindliche Erfassung der Bücher kaum europäischen Standards. Das würde allerdings auch die Zeit der Erfassung vervielfachen. Google scannt die Bücher vollautomatisch, erfasst sie mittels OCR und publiziert sie als PDF-Dateien. Wenn da mal eine Seite verrutscht, ist es egal und wenn ein Finger mit aufs Bild gerät auch. Hauptsache es wird Output generiert. Eine eigenständige Textrecherche im gescannten Material ist dem Nutzer verwehrt, da ihm die gescannten Seiten nur als PDF-Bilddokumente zur Verfügung gestellt werden. Wer das gefundene Textmaterial durchsuchen will, muss dies online bei Google-Print tun. Deren ORC-Resultate sind aber voller Fehler - kein Wunder, handelt es sich bei vielen der erfassten Texte doch um solche mit alter Frakturschrift, die schwer zu digitalisieren sind. Viele Jüngere können diese in Fraktur geschriebenen Dokumente heute schon gar nicht mehr lesen und sind deshalb auf eine OCR-Erfassung angewiesen. Eine Kontrolle der Texterkennung findet aber offensichtlich nicht statt. Wie immer man zum Google-Projekt der Digitalisierung der Bücherwelten stehen mag, unbestreitbar ist, dass man dadurch manch Interessantes und auch Lustiges und Pittoreskes auf die Festplatte herunter laden kann.
|