In Zusammenarbeit mit dem von TIB-Leibniz-Informationszentrum betreuten niedersächsischen Projekt „Landesinitiative Langzeitarchivierung“ (LiLa) werden derzeit Digitalisate aus dem KOSTIMA-Teilprojekt 2 ausgewählt und für die Langzeitarchivierung (LZA) vorbereitet. Dabei werden eine Reihe technischer Aspekte verhandelt, von denen hier exemplarisch zwei vorgestellt werden.
- Dateigrößen: Für die LZA ist ausschließlich unkomprimiertes Material geeignet, für Audiomaterial bedeutet dies WAV oder BWF/BWAV-Dateien in relativ hoher Auflösung (96kHz Abtastrate, 32 Bit Worttiefe). Eine Stunde Tonbandmaterial in diesem Format generiert circa 2,6 Gigabyte Daten, und ist daher für den Datentransfer auf Webseiten wenig geeignet. Auch Scans von Papierdokumenten schlagen im unkomprimierten TIFF-Format schnell mit 150 Megabyte für eine einzelne DIN-A4-Seite zu Buche.
- Metadaten: Beschreibende Daten zu den Audio- und Bilddigitalisaten werden in der Datenbank fylr in einer verschachtelten Datenbankstruktur gespeichert, bei der Datensätze (beispielsweise eine Audiodatei) mit zugehörigen Bilddaten (Fotos des Tonbandes) verknüpft und deren Inhalte möglichst detailliert beschrieben werden. Mehrere Tonbänder werden in der Regel zu umfassenderen Einheiten zusammengefasst. Diese Metadaten sind sowohl von Menschen als auch von Maschinen auslesbar, und liegen im sogenannten JSON-Format (Java Script Object Notation) vor. Vor der Langzeitarchivierung müssen diese Metadaten in ein vereinheitlichtes Format gebracht werden, das von der Langzeitarchivierungs-software Rosetta des Herstellers ExLibris dauerhaft ausgelesen werden kann.
Diese Prozesse wurden vor einigen Monaten angestoßen und werden Dank der Expertise der Kolleg:innen von der TIB im Austausch mit TP2-Personal ausgeführt.