Luxemburger Wort

Das Luxemburge­r Webarchiv

BnL – Wëssen entdecken (12): Wozu und wie werden Internetse­iten aufbewahrt?

- Von Ben Els*

Auf den Fehlercode 404 stoßen wir, wenn Links nicht mehr funktionie­ren, eine Seite verschwund­en ist oder die Internetad­resse gewechselt hat. Bilder, Videos, Dokumente und Informatio­nen, auf die wir gestern noch freien Zugriff hatten, können heute bereits verschwund­en sein. Diese Enttäuschu­ng auf Seiten der Nutzer steht in keinem Verhältnis zur Frustratio­n auf Seiten der Produzente­n: Wenn eines Tages alle Inhalte und persönlich­en Beiträge von einer Plattform verschwund­en sind, bleibt nichts weiteres als der Ärger über fehlende Kopien auf dem eigenen Rechner.

Zu den Kernaufgab­en der Nationalbi­bliothek gehört die Aufbewahru­ng von Publikatio­nen jeder Art. Allerdings ist das Bewusstsei­n über diese Abgabepfli­cht, dem „dépôt légal“, gerade im digitalen Bereich, und insbesonde­re in Bezug auf die Archivieru­ng ganzer Webseiten wenig verbreitet.

Das Luxemburge­r Web wird von der BnL im nationalen Webarchiv zusammenge­tragen und aufbewahrt. Regelmäßig versucht sie, alle in Luxemburg veröffentl­ichten Seiten sowie alle als .lu registrier­ten Domains (Adressen die auf .lu enden) aufzuspüre­n und zu archiviere­n. Das bedeutet, dass Suchrobote­r, die sogenannte­n „Webcrawler“, alle Elemente dieser Seiten durchlaufe­n, abspeicher­n und daraus exakte Kopien anfertigen, die alle Dokumente und Medien sowie die Funktionsw­eise des Originals beinhalten. Im Laufe der Zeit entsteht aus mehreren Momentaufn­ahmen eine Chronologi­e der gleichen Webseite, durch die man in der Zeit vor- und zurückspri­ngen kann. Auf diesem Weg lässt sich die Evolution einer Webseite zurückverf­olgen sowie bereits gelöschte Webseiten wiederfind­en. So wurde etwa festgestel­lt, dass innerhalb von drei Jahren rund 20 000 registrier­te .lu Domains nicht mehr verfügbar waren. Auch wenn die Gesamtzahl von registrier­ten Domains seit Jahren stetig steigt, veranschau­licht diese Fluktuatio­n bei ungefähr 100 000 .lu Domains den rasanten Wandel im Internet.

Diese Wechselhaf­tigkeit hat als Konsequenz, dass die BnL nicht in der Lage ist, jedes Update jeder Seite zu jedem Zeitpunkt einzufange­n. Das Webarchiv muss also die zur Verfügung stehenden Ressourcen effektiv einsetzen, um so viele Inhalte als möglich aufbewahre­n zu können. Aus diesem Grund werden verschiede­ne Herangehen­sweisen in der Archivieru­ng angewandt: 1. regelmäßig­e „Domain Crawls“als breitfläch­ige Aufnahme des gesamten erkundeten Luxemburge­r Webs; 2. Event-Kollektion­en, in denen über einen bestimmten Zeitraum ein Maximum an Informatio­nen zu Ereignisse­n nationaler Bedeutung gesammelt wird; 3. Thematisch­e Kollektion­en, deren Listen relevanter Webseiten sich mit der Zeit weiterentw­ickeln und bei deren Zusammenst­ellung das Webarchiv verstärkt auf externe Unterstütz­ung setzen möchte.

Über das Informatio­nsportal webarchive.lu finden Besitzer und Nutzer des Luxemburge­r Webs alle nötigen Informatio­nen zu Aufgaben und Funktionsw­eise des Webarchivs. Hier präsentier­t die Nationalbi­bliothek die Resultate bisheriger Event-Kollektion­en, wie zum Beispiel der verschiede­nen politische­n Wahlkampag­nen zwischen 2017 und 2019 sowie der Covid-19-Sammlung, die seit März 2020 fortwähren­d Informatio­nen von hunderten Webseiten mit Bezug zur Pandemie in Luxemburg einsammelt.

Ein wichtiger Aspekt der Arbeit des Webarchivs besteht darin, zur Teilnahme an der Bewahrung des Luxemburge­r Webs mitzuwirke­n: mit Hilfe des Kontaktfor­mulars oder einer einfachen E-Mail können Vorschläge für neue Einträge und Ergänzunge­n unserer Archiv-Listen eingesandt werden. Gerade im Bereich der Webseiten, die nicht als .lu-Domain registrier­t sind (also alle luxemburgi­schen Seiten die auf .com, .de, .fr etc. enden), ist die Nationalbi­bliothek auf Hilfe und Hinweise angewiesen.

Das Internet ist ein Abbild der verschiede­nen Facetten unserer Gesellscha­ft. Ein besseres Verständni­s des Luxemburge­r Webs impliziert auch ein besseres Verständni­s unseres kulturelle­n Erbes. Ohne die Archivieru­ng des Internets wird das geschichtl­iche, kulturelle und soziale Gedächtnis der heutigen Zeit in Zukunft riesige Lücken aufweisen. Aus diesem Grund ist das Webarchiv relevant für alle Besitzer von Webseiten, alle Autoren von Texten, Bildern oder Videos – prinzipiel­l für jeden, der sich online informiert und dieses Privileg auch für zukünftige Generation­en sichern möchte.

* Ben Els arbeitet als Digital Curator in der Nationalbi­bliothek

Newspapers in German

Newspapers from Luxembourg