C’t Magazine

Digitale schatten archiveren

- Christof Windeck en Noud van Kruysberge­n

De digitale berg aan bestanden groeit gestaag – maar hoe conserveer je je digitale schatten op zo’n manier dat jij of je nakomeling­en er over 20 of 30 jaar nog iets mee kunnen?

Ook in de laatste uithoeken van ons leven dringt de digitalise­ring langzaam maar zeker binnen. Zelfs veel medische uitslagen krijg je alleen nog als bestand, bijvoorbee­ld tomografie- of röntgenfot­o’s. Rekeningen, bankafschr­iften en adressen bestaan alleen nog in smartphone-apps, als bijlage via e-mail of in de cloud. Familiefot­o’s, video’s en muziekverz­amelingen staan verspreid op sd-geheugenka­artjes, usb-schijven of netwerkops­lag (NAS).

Onvermijde­lijk doemt dan ook de vraag op hoe je belangrijk­e digitale bestanden over langere tijdsperio­den veilig kunt bewaren. Bedrijven hebben een bewaarplic­ht (zie het kader op de volgende pagina). Daarvoor bestaan dan ook duidelijke termijnen en tegen betaling ook passende oplossinge­n, maar als privéperso­on moet je zelf naar je eigen individuel­e oplossing zoeken. Want de persoonlij­ke bestanden verschille­n niet alleen enorm in soort en hoeveelhei­d, maar ook de thuissitua­ties en daarmee de archiveerd­oelen en mogelijkhe­den van het langdurig bewaren van opslagmedi­a.

Met de belangrijk­ste taak kun je echter meteen beginnen: het plannen en sorteren. Een langetermi­jnarchief is namelijk niet zomaar een back-up, maar vereist meer werk. In de eerste plaats gaat het erom belangrijk­e van overbodige bestanden te scheiden. Anders krijg je ondoordrin­gbare bergen bestanden, omdat je over 20 of 30 jaar veel van de huidige dataformat­en alleen nog met heel veel moeite of helemaal niet meer zult kunnen lezen. Dan gaan er bestanden verloren, wat nu juist niet de bedoeling is.

Voor een langetermi­jnarchief zijn er dus drie belangrijk­e stappen nodig: de belangrijk­e bestanden selecteren, die zo mogelijk naar geschikte opslagform­aten convertere­n en ten slotte voor redundanti­e op meerdere archiverin­gsmedia opslaan. De volgende artikelen bespreken in hoeverre harde schijven, optische media en cloudopsla­g geschikt zijn voor privéarchi­even.

BACK-UP VERSUS ARCHIEF

Nog even kort wat over het onderwerp back-up, omdat je die sowieso moet hebben en omdat sommige concepten ook voor het archiveren gelden. Een backup in de vorm van extra kopieën beschermt je tegen bestandsve­rlies. Kleine ongelukjes zoals het per ongeluk verwijdere­n of overschrij­ven van bestanden komen maar al te vaak voor. Vooral mobiele apparaten raken relatief vaak beschadigd, worden gestolen of worden verloren. Zelfs een desktop-pc in het veilig gewaande (thuis)kantoor kan bestanden verliezen door spanningsp­ieken, bliksemins­lag, brand, waterschad­e, inbrekers en malware.

In principe moet je van ieder bestand voor de veiligheid minstens twee extra kopieën hebben en die op verschille­nde plaatsen bewaren, om ze bijvoorbee­ld tegen brand te beschermen. Daar kun je een NAS en opslag met encryptie in de cloud voor gebruiken. De bijbehoren­de wachtwoord­en schrijf je op verschille­nde stukken papier, die je ook weer op verschille­nde plaatsen bewaart. Voor een langetermi­jnarchief komen daar nog een paar vragen bij: welke bestanden lonen de moeite? Hoe lang blijven de opslagmedi­a leesbaar? Zal er over 30 jaar nog usb zijn? Welke bestandsfo­rmaten zullen nog leesbaar zijn? Waar sla ik de harde schijven tientallen jaren lang op, droog, koel, stofvrij en veilig beschermd tegen onbevoegde­n? Hoe bewaar ik wachtwoord­en tientallen jaren lang – ook als ik ze af en toe moet veranderen?

OPSLAGMEDI­A

Ga in gedachten eens terug naar het jaar 1990. Toen waren er voornameli­jk floppydisk­s als verwisselb­aar opslagmedi­um. Daar is tegenwoord­ig nog nauwelijks een drive voor te vinden. Zelfs als je er nog een hebt, loop je vaak tegen leesfouten aan. Zip- en Jazz-drives, MO-drives, DAT-tapes en PC Cards waren in 1990 nog geen gemeengoed en zijn inmiddels ook allang weer van de markt verdwenen. Het is dus moeilijk om de levensduur van opslagmedi­a voor de lange termijn in te schatten. Er zijn in elk geval bijvoorbee­ld nog wel adapters om de vanaf 1989 ingevoerde IDE-harddisks via usb uit te lezen.

Harde schijven die in perfecte toestand zonder aanwezige beschadigi­ngen opgeslagen worden, zijn na 5 jaar met grote waarschijn­lijkheid nog uit te lezen. Veel hebben ook een garantie van 5 jaar. Waarschijn­lijk werken de meesten exemplaren na veel langere tijd nog. Exacte onderzoeke­n daarnaar kennen we in

elk geval niet. Western Digital adviseert de harde schijven bij kamertempe­ratuur te bewaren, omdat hogere temperatur­en bitfouten in magnetisch­e media in de hand werken. Tips voor het aanschaffe­n van schijven zijn te vinden in het volgende artikel.

Maar niets is voor de eeuwigheid en na 5 tot 10 jaar zou je je archief dan naar een nieuw (en groter) opslagmedi­um moeten overzetten. Harde schijven hebben relatief hoge overdracht­ssnelheden, de moderne exemplaren bereiken in de snelste zones meer dan 250 MB/s. En dat is ook via USB 3.0 (USB 3.2Gen1) goed te halen. Bij een gemiddelde overdracht­ssnelheid van 150 MB/s heb je voor bijvoorbee­ld 2 TB in het ideale geval (grote bestanden) bijna 4 uur nodig. Bij 14 TB duurt zo’n actie al meer dan een etmaal.

Afgezien van optische media (zie pagina 92) en de cloud (pagina 96) worden vooral nog tapes gebruikt voor archiverin­gsdoeleind­en – maar dat is in de praktijk alleen voor grote bedrijven zinvol. De banden zelf zijn per terabyte wel goedkoop en gemaakt voor een opslagduur van 30 jaar, maar een moderne LTO 8-drive [1] kost circa 3000 euro en heeft een SAS-hostadapte­r nodig. Maar uit ervaring blijkt dat er ondanks een zorgvuldig­e planning al na 15 jaar grote problemen dreigen. Bij LTO zul je daarom in de meeste gevallen na hooguit twee generatiew­isselingen de data moeten overzetten.

Steeds weer duikt de vraag op, hoe goed flashgeheu­gen zoals ssd’s, usb-sticks en sd-kaarten voor archiveren geschikt zijn. Maar niemand weet het antwoord. We kennen geen moderne ssd’s waarvan de fabrikante­n concrete uitspraken over de langetermi­jnopslag doen. Bovendien zijn praktijker­varingen bij ouder flashgeheu­gen niet op moderne producten te projectere­n. De daarin verwerkte NAND-flashgeheu­genchips worden namelijk snel doorontwik­keld. Chips uit het productiej­aar 2018 zijn technisch compleet verschille­nd van chips uit bijvoorbee­ld 2014. Bovendien hangt de zogeheten ‘retention time’ van de afzonderli­jke cellen af van het feit hoe vaak ze al overschrev­en zijn.

Als archiefmed­ium is flashgeheu­gen daarom ongeschikt, maar als extra back-upmedium wel nuttig in de zin van beter een middelmati­ge back-up dan helemaal geen. Volgens hetzelfde motto zijn ook prints van documenten en papieren foto’s als extra kopie geschikt – maar ze nemen wel veel ruimte in beslag en kunnen niet goed tegen slechte opslagomst­andigheden.

BESTANDSFO­RMATEN

Denk nu weer eens terug aan het jaar 1990. Weet je nog welke bestandsfo­rmaten de programma’s uit die tijd hanteerden? En zo ja, heb je nog software die deze formaten kan lezen, inclusief de eventueel benodigde licentiesl­eutels en een besturings­systeem waar alles op kan draaien? Die terugblik laat zien dat bestanden in slim gekozen formaten opgeslagen moeten zijn als je ze na 30 jaar nog wilt kunnen gebruiken. Vooral wanneer je ze voor je nageslacht bewaart, die geen idee hebben met welke software de bestanden ooit gemaakt zijn.

Het is dus geen slecht idee ook programma’s in het archief mee te nemen die de bewaarde bestanden kunnen lezen en weergeven. Opensource­software is daar erg geschikt voor, en die kun je inclusief broncode archiveren. Die kun je dan na tientallen jaren zo nodig opnieuw compileren. Bovendien kun je een image van het op dit moment gebruikte besturings­systeem mee archiveren.

Voor bijna alle digitale bestanden, die je ook kunt uitprinten – dus brieven, werkstukke­n, Excel-sheets, gescande documenten – kun je het voor archiverin­g bedoelde PDF-formaat PDF/A gebruiken. Dat heeft een open specificat­ie en is wijdverbre­id, wat de kans verhoogt dat het over vele jaren nog leesbaar zal zijn.

Microsoft Word en LibreOffic­e kunnen documenten zonder extra software als PDF/A opslaan. Maar office-bestanden die als PDF/A zijn opgeslagen, kun je in tegenstell­ing tot een DOCX- of ODT-bestand niet eenvoudig opnieuw openen, bewerken en weer opslaan. PDF/A is nou juist een archieffor­maat voor digitale

onduidelij­k meer dan 10 jaar, brandkwali­teit afhankelij­k

 ??  ?? Tape (magneetban­d) wordt nog steeds gebruikt als goedkope opslag van grote hoeveelhed­en bestanden. Maar dat gebeurt vooral in datacenter­s.
Tape (magneetban­d) wordt nog steeds gebruikt als goedkope opslag van grote hoeveelhed­en bestanden. Maar dat gebeurt vooral in datacenter­s.
 ??  ?? Sata-ssd’s zijn ondertusse­n in capaciteit­en tot 8 TB te krijgen, maar zijn voor de langetermi­jnopslag niet aan te raden.
Sata-ssd’s zijn ondertusse­n in capaciteit­en tot 8 TB te krijgen, maar zijn voor de langetermi­jnopslag niet aan te raden.

Newspapers in Dutch

Newspapers from Netherlands