Schwach strukturierte Daten, Grafik: Sarah Rudolf, LVR-AFZ
Mit dem Begriff der schwach strukturierten Daten werden Gruppen digitaler Objekte umschrieben, die sich in keiner oder in einer nur sehr rudimentär ausgeprägten, weder aktenmäßig oder ansonsten fest formierten Struktur befinden. Dabei kann es sich z. B. um Email-Ablagen, Fotosammlungen oder sonstige Dateisammlungen handeln. Der Begriff schwach strukturiert sollte dabei nicht darüber hinwegtäuschen, dass die Unterlagen u. U. durchaus in einer mehr oder weniger individuellen, durchaus komplexen Ordnerstruktur vorliegen können. Daher werden sie auch als „kreative digitale Ablagen“ oder sogar als „Quasi-DMS“ bezeichnet. Im analogen Bereich wären Handakten oder Nachlässe vergleichbare Unterlagengruppen. Je nach Dauer der Verwendung können schwach strukturierte Unterlagen einen erheblichen Umfang annehmen.
Die Bewertung schwach strukturierter Unterlagen bringt besondere Herausforderungen mit sich. Oft ist z. B. nicht der gesamte Schriftwechsel, sondern es finden sich nur eingehende Schreiben. Darüber hinaus kann nicht ohne Weiteres erschlossen werden, welche Bearbeitungsstufe eines Dokuments vorliegt. Der Kontext einer Datei oder Gruppe von Dateien ist nicht immer einfach zu erschließen. Hinzu kommen bisweilen kryptische oder zumindest nicht nachvollziehbare („sprechende“) Datei- bzw. Ordnernamen. Eine Autopsie der einzelnen Dateien kann daher im Einzelfall unumgänglich sein. Bei großen Datenmengen fällt diese sehr zeitintensiv aus, da sie im analogen Bereich einer Einzelblattkassation entspräche. Wichtige Hinweise zum Verständnis können auch in den Metadaten enthalten sein.
Um Bewertungsaufwand zu reduzieren, sollten zunächst allgemeine Aspekte, z. B. die formale Bedeutung der Provenienz, ihre Aufgaben bzw. Tätigkeitsfelder geprüft werden, die Hinweise auf den Inhalt geben können. Liegen Bewertungsdokumente wie Archivierungs- bzw. Bewertungsmodelle oder Dokumentationsprofile vor, dienen sie als Rahmen für die anschließende Bewertung. Letztendlich spielt auch die Archivfähigkeit eine Rolle, sollten passwortgeschützte Ordner oder Dateien oder obsolete bzw. proprietäre Dateiformate vorliegen. Zur Analyse von Dateisammlungen können darüber hinaus Tools eingesetzt werden, die die Ordnerstruktur auslesen und grafisch darstellen, Dateitypen und Entstehungs- sowie Bearbeitungszeiten auswerten, usw. Mit diesen Hilfsmitteln kann man sich einen Überblick verschaffen. Dateien, die mit relativ hoher Wahrscheinlichkeit nicht archivwürdig sind, lassen sich damit u. U. schon sehr früh ermitteln. Mit Hilfe einer geeigneten Dublettenprüfung lassen sich Redundanzen ermitteln und ggf. löschen. Eine Vollarchivierung bzw. eine Totalkassation sollten nur nach reiflicher Überlegung, die auch die Folgekosten einbezieht, durchgeführt werden.
Für Beratungsgespräche stehen wir Ihnen selbstverständlich auch zur Verfügung und können Ihnen Materialien zur Verfügung stellen.