LVR-Archivberatungs- und Fortbildungszentrum Logo Landschaftsverband Rheinland - zur Startseite
Die Fassade eines Gebäudes ist abgebildet.

Archive
im Rheinland

Webseitenarchivierung

Das world wide web hat sich nach seiner öffentlichen Bereitstellung sehr schnell zu einem eminent wichtigen Kommunikationsmedium entwickelt. Private wie öffentlich-rechtliche Akteure nutzen es in vielfältiger Weise zum (interaktiven) Informationsaustausch und als Wissensplattform. Dabei ist die einzelne Information – etwa eine Homepage – leicht veränderbar, vielgestaltig und flüchtig. Gleichzeitig werden immer größere Datenmengen ins Netz gestellt. Bibliotheken und Archive beschäftigten sich in Anbetracht der Bedeutung von Webressourcen schon bald mit der Frage, wie diese u. U. archivwürdigen Informationen dauerhaft gesichert werden könnten.

Neben rechtlichen Fragen, die sich aus dem (Kunst-)Urheberrecht ergeben können, treten weitere Herausforderungen auf. Eine Homepage kann sehr komplex aufgebaut sein und sehr heterogene Informationen oder Dateitypen umfassen. Dies erschwert die Festlegung der (signifikanten) Eigenschaften, die dauerhaft erhalten werden sollen – soweit dies derzeit technisch überhaupt möglich ist. Um die Datenmenge zu reduzieren, können unterschiedliche Maßnahmen ergriffen werden: So kann nur ein Teil einer Webseite statt der gesamten Präsenz übernommen werden. Schnitte, die in regelmäßigen festgelegten Intervallen sowie anlassbezogen vorgenommen werden, dokumentieren die Entwicklung zumindest in groben Zügen.

Ungeachtet dieser Besonderheiten unterliegen auch Webseiten der archivischen Bewertung. Oft erfolgt diese in der Art, dass der gesamte Auftritt einer Person oder Institution zu einem festgelegten Zeitpunkt möglichst vollständig erfasst wird. Grundsätzlich besteht daneben die Möglichkeit, eine Auswahl zu treffen. Inwieweit Links zu externen Quellen erfasst werden – und wenn ja, welche – ist ebenfalls eine Frage der archivischen Bewertung.
Für die Übernahme gibt verschiedene Formen der Webseitenarchivierung, die sich u.a. nach der Art der Übernahme, der Zielsetzung der Übernahme und den technischen Möglichkeiten der übernehmenden Stelle richten können. Grundlegend ist zu beachten, dass neben vereinfachten Zugängen zur digitalen Archivierung von Webcontents – z.B. im PDF- bzw. PDF/A-Format – auch ein fachlich differenzierteres Vorgehen für die ausgewählten Seiten denkbar und zu empfehlen ist.
Hier wird meist entweder ein sog. Harvester oder ein sog. Crawler eingesetzt, der alle ausgewählten Seiten nacheinander ansteuert, die dort vorgehaltenen Informationen abruft und speichert. Hierzu stehen derzeit mehrere Software-Alternativen zur Verfügung. Harvester ermöglichen es, punktuell einen definierten Webcontent in geeigneten Formaten zu sichern, ebenso in festgelegten Zyklen. Sog. Crawler unterstützen mit automatisierten Prozessen (Sicherungsturnus, festgelegte Seiten und Unterseiten oder Inhalte). Da sich die technischen Möglichkeiten rasant weiterentwickeln, müssen auch die Crawler ständig nachgerüstet werden.



Derzeit empfohlene Formate

nach oben


Ihre Ansprechpartner*innen

Für Beratungsgespräche stehen wir Ihnen selbstverständlich auch zur Verfügung und können Ihnen Materialien zur Verfügung stellen.