LVR-Archivberatungs- und Fortbildungszentrum Logo Landschaftsverband Rheinland - zur Startseite

Archive
im Rheinland

Datei- und Metadatenformate in der digitalen Archivierung

Pause Button

Die Frage nach langzeitstabilen und damit archivfähigen Formaten ist eine, die Archivar*innen bereits seit den 1990er Jahren beschäftigt. Hier werden erste Informationen für den Einstieg und Überblick bereitgestellt.

Dateiformate

Um die langfristige Archivierung elektronischer Daten zu gewährleisten, bedarf es nicht nur des allgemeinen technischen Rahmens – einer Lösung für die dauerhafte digitale Archivierung. Vielmehr kommt es auch auf die Einzelheiten an: Dateiformate beispielsweise.

Wichtig ist für alle Formate zunächst einmal, dass es sich um entweder genormte Formate (z.B. als ISO, EN, DIN) oder Formate mit veröffentlichten Spezifikationen handelt. Ebenfalls als stabil gelten können viele Formate mit Markups – z.B. HTML, XML, oder viele Dateien aus LaTeX.

Verlustbehaftete Kompressionsverfahren oder bestimmte Containerformate sind hingegen zu vermeiden. Sie können grundsätzlich bei allen Formaten zur Anwendung kommen. So können Multi-Page-TIFF-Dateien komprimierte JPEG-Bilder enthalten. Auch die PDF-Erstellung ist genau in Augenschein zu nehmen. Es können z.B. bereits komprimierte JPEG-Daten bei der PDF-Erstellung mit dem JBIG2-Kompressionsverfahren erneut komprimiert werden. Daher wird das Format PDF/A in den Versionen PDF/A-1b bzw. auch PDF/A-2b von der Schweizer Koordinationsstelle für die dauerhafte Archivierung elektronischer Unterlagen (KOST) empfohlen.

Bisher sind nicht für alle Datentypen bereits Formate entwickelt wurden, die den benannten Kriterien genügen. Das gilt insbesondere für den Bereich der AV-Daten und -Medien.

Nähere Informationen erhalten Sie z.B. unter dem nachfolgenden Link, und bei uns. Für ein Beratungsgespräch stehen wir Ihnen gerne zur Verfügung.

Für Rückfragen kontaktieren Sie uns gerne.

Metadaten

Neben den Dateiformaten spielen auch die Metadaten zu diesen Primärdaten eine große Rolle für die digitale Archivierung. Zu unterscheiden sind hierbei verschiedene Typen von Metadaten, die häufig eigene Metadatenformate nach sich gezogen haben.

Nach dem Metadata Encoding and Transmission Standard (METS) werden folgende Metadatentypen definiert:

  • beschreibende Metadaten
  • administrative Metadaten
  • Datei-Informationen
  • Strukturinformationen zu den Dateien
  • Daten zur Referenzierung der Dateien
  • Verhaltensdaten

Diese Metadatentypen werden für verschiedene Szenarien benötigt; für den Transfer der Metadaten, für die digitale Archivierung und für die digitale Bestanderhaltung (Preservation Planning) in Ergänzung um den Standard PREMIS (Preservation Metadata: Implementation Standard). Die Metadatentypen lassen sich aber auch anders unterteilen.

So können unter beschreibenden Metadaten auch andere Informationen als die nach METS definierten zu verstehen sein: Informationen wie Dateiname, Herkunft, Autor/Ersteller, Erstellungsdatum, u.dgl.m. Viele solcher Metadaten zum Primärdatum Datei werden von Archivar*innen in der Erschließung bzw. Verzeichnung erfasst. Man spricht hier von den sog. Verzeichnungsmetadaten.

Ein Austausch dieser Verzeichnungsinformationen erfolgt innerhalb von Deutschland i.d.R. mit dem Quasi-Standard EAD im Dialekt DDB (EAD[DDB]). Er dient der Zurverfügungstellung der Verzeichnungsinformationen in den online-Rechercheportalen der Archive, bspw. im Archivportal-D und im Portal Archive.NRW.de. Das Portal Europeana hat wiederum einen eigenen Standard: das Europeana Data Model (EDM).

Neben solchen Metadaten stellt sich auch die Frage der die Primärdaten (Dateien) unmittelbarer betreffenden Metadaten, die z.B. eingebettet oder auch extern beigefügt in den XML-basierten METS- oder XMP-Dateien vorgehalten werden können: Formatinformationen (z.B. MIMEtype), Erstellungsdatum, Erstellungstechnik, oder auch Urheber.

Eingebetteten Metadaten (Tags) liegen wie extern vorgehaltene Metadaten verschiedene Standards zugrunde. Obwohl in den letzten Jahren erfolgreich ISO-Normungen im Bereich eingebetteter Metadaten erzielt werden konnten, ist die Frage der sog. Bitstream-Preservation nach wie vor eine ungleich komplexere. So können eingebettete Metadaten derzeit nicht ohne Weiteres von jedem in ein anderes beliebiges Format überführt werden.

Links zu den Metadatenstandards (Spezifikationen, Schemata):

Ihre Ansprechpartner*innen

Für Beratungsgespräche stehen wir Ihnen selbstverständlich auch zur Verfügung und können Ihnen Materialien zur Verfügung stellen.