«eLuxemburgensia » ist die Fortsetzung des Digitalisierungsprojekts (2002-2008) der Nationalbibliothek Luxemburg, das gedruckte kulturelle Erbe in eine digitale Form zu überführen. Die Ergebnisse des Projekts sind im Bildmodus unter www.luxemburgensia.bnl.lu zugänglich.
Erste Ergebnisse des zweiten Digitalisierungsprojekts finden Sie ab 2009 unter www.eluxemburgensia.lu. Diese neue Website bietet dem Leser eine grafische Benutzeroberfläche, sowie die Möglichkeit einer Volltextsuche. Die digitalisierten Texte sind in ein Langzeitarchivierungssystem integriert worden.
Um die Volltextsuche zu ermöglichen sind die Buchstaben der Zeitungen maschinell erkannt worden. Deshalb treten auch Fehler auf. Die Gründe für diese Fehler sind vielfältig: schlechte Papierqualität des Originals, schlechter Druck und Verschlechterung der Originale durch die Zeit. Diese Gründe erklären dass das OCR - auf dem jetzigen Stand der Technik - nicht alle Buchstaben der Originale richtig erkennen kann.
Um die bestmöglichste Qualität beim Scannen erreichen zu können digitalisiert die Nationalbibliothek ihre eigene Papier-Exemplare die freundlicherweise von anderen für diese Digitalisierung bereitgestellt werden. Die Nationalbibliothek bedankt sich deshalb bei dem Nationalarchiv, dem Grand Séminaire - Centre Jean XXIII, der Gemeinde Grevenmacher, dem Centre national de littérature und den Privatsammlern.
Ziel des Digitalisierungsprogramms der Nationalbibliothek ist es,
- das gedruckte kulturelle Erbe einem breiteren Publikum zugänglich zu machen, ohne daß die Original-Dokumente Schaden nehmen, damit insbesondere fragile Einzelexemplare geschützt werden können;
- den Online-Zugang des Lesers zu diesem Erbe im Rahmen der Urheberrechtsbestimmungen zu erleichtern;
- die gleichzeitige Konsultierung der Dokumente durch mehrere Nutzer zu gewährleisten;
- die Recherche-Möglichkeiten innerhalb der digitalisierten Texte zu verbessern.
Technisch: Digitalisationsformat METS/ALTO
Die Nationalbibliothek benutzt, soweit wie möglich METS/ALTO für die Bilder und Metadaten die ihm Rahmen ihrer Digitalisationsprojekte entstehen.
METS
Das METS Format beschreibt die logische Struktur der Dokumente (Seiten, Artikel usw.). Es ist gleichzeitig auch ein Container für die technischen Metadaten die zur Langzeitarchivierung gebraucht werden.
ALTO
Die ALTO Metadaten beschreiben das Layout individueller Seiten und beinhalten auch das Resultat der automatischen Texterkennung (OCR - Optical Character Recognition) die das Suchen im Volltext der Dokumente ermöglicht. Die Kombination aus METS und ALTO erlaubt es eine spezifische Suche in den Dokumenten abzusetzen und dann gezielt auf die Textzonen zu springen wo die Resultate sind.
Mets / Alto-Daten im Rahmen der Open-Data-Initiative
Im Rahmen der Open-Data-Strategie der luxemburgischen Regierung hat die Nationalbibliothek Luxemburgs (BnL) ihre Daten über die Website data.bnl.lu der Öffentlichkeit zugänglich gemacht.
Jeder Benutzer kann Datensätze herunterladen und frei verwenden. Diese Initiative richtet sich an ein vielfältiges Fachpublikum (Datenwissenschaftler, Historiker, Linguisten, Forscher der Digital Humanities, Entwickler).
Die Daten- und Metadatensätze der Website data.bnl.lu sind Teil der Sammlung digitalisierter luxemburgischer Zeitschriften – und dementsprechend gemeinfrei. Die Datenvolumina reichen von 250 MG bis 257 GB und erlauben unterschiedliche Stufen der Auswertung – von geläufigeren Entwicklungsprojekten (Text Mining, automatische Namenserkennung, automatische Bilderkennung) bis hin zu künstlichen neuronalen Netzen.
Der Zeitungsviewer im Open Source
Der Viewer der von der Nationalbibliothek für eluxemburgenisa.lu entwickelt wurde ist auch als open source Version erhältlich. Die Projektseite auf sourceforge.net des bnlviewer enhält den Quellcode des Viewers, des Suchdienstes und einige Beispieldokumente im METS/ALTO Format.
Wenn Sie Fragen, Wünsche und Anregungen haben, sind wir gerne für Sie da.
Sie erreichen uns unter : eluxemburgensia@bnl.etat.lu