Digitale schatten archiveren
De digitale berg aan bestanden groeit gestaag – maar hoe conserveer je je digitale schatten op zo’n manier dat jij of je nakomelingen er over 20 of 30 jaar nog iets mee kunnen?
Ook in de laatste uithoeken van ons leven dringt de digitalisering langzaam maar zeker binnen. Zelfs veel medische uitslagen krijg je alleen nog als bestand, bijvoorbeeld tomografie- of röntgenfoto’s. Rekeningen, bankafschriften en adressen bestaan alleen nog in smartphone-apps, als bijlage via e-mail of in de cloud. Familiefoto’s, video’s en muziekverzamelingen staan verspreid op sd-geheugenkaartjes, usb-schijven of netwerkopslag (NAS).
Onvermijdelijk doemt dan ook de vraag op hoe je belangrijke digitale bestanden over langere tijdsperioden veilig kunt bewaren. Bedrijven hebben een bewaarplicht (zie het kader op de volgende pagina). Daarvoor bestaan dan ook duidelijke termijnen en tegen betaling ook passende oplossingen, maar als privépersoon moet je zelf naar je eigen individuele oplossing zoeken. Want de persoonlijke bestanden verschillen niet alleen enorm in soort en hoeveelheid, maar ook de thuissituaties en daarmee de archiveerdoelen en mogelijkheden van het langdurig bewaren van opslagmedia.
Met de belangrijkste taak kun je echter meteen beginnen: het plannen en sorteren. Een langetermijnarchief is namelijk niet zomaar een back-up, maar vereist meer werk. In de eerste plaats gaat het erom belangrijke van overbodige bestanden te scheiden. Anders krijg je ondoordringbare bergen bestanden, omdat je over 20 of 30 jaar veel van de huidige dataformaten alleen nog met heel veel moeite of helemaal niet meer zult kunnen lezen. Dan gaan er bestanden verloren, wat nu juist niet de bedoeling is.
Voor een langetermijnarchief zijn er dus drie belangrijke stappen nodig: de belangrijke bestanden selecteren, die zo mogelijk naar geschikte opslagformaten converteren en ten slotte voor redundantie op meerdere archiveringsmedia opslaan. De volgende artikelen bespreken in hoeverre harde schijven, optische media en cloudopslag geschikt zijn voor privéarchieven.
BACK-UP VERSUS ARCHIEF
Nog even kort wat over het onderwerp back-up, omdat je die sowieso moet hebben en omdat sommige concepten ook voor het archiveren gelden. Een backup in de vorm van extra kopieën beschermt je tegen bestandsverlies. Kleine ongelukjes zoals het per ongeluk verwijderen of overschrijven van bestanden komen maar al te vaak voor. Vooral mobiele apparaten raken relatief vaak beschadigd, worden gestolen of worden verloren. Zelfs een desktop-pc in het veilig gewaande (thuis)kantoor kan bestanden verliezen door spanningspieken, blikseminslag, brand, waterschade, inbrekers en malware.
In principe moet je van ieder bestand voor de veiligheid minstens twee extra kopieën hebben en die op verschillende plaatsen bewaren, om ze bijvoorbeeld tegen brand te beschermen. Daar kun je een NAS en opslag met encryptie in de cloud voor gebruiken. De bijbehorende wachtwoorden schrijf je op verschillende stukken papier, die je ook weer op verschillende plaatsen bewaart. Voor een langetermijnarchief komen daar nog een paar vragen bij: welke bestanden lonen de moeite? Hoe lang blijven de opslagmedia leesbaar? Zal er over 30 jaar nog usb zijn? Welke bestandsformaten zullen nog leesbaar zijn? Waar sla ik de harde schijven tientallen jaren lang op, droog, koel, stofvrij en veilig beschermd tegen onbevoegden? Hoe bewaar ik wachtwoorden tientallen jaren lang – ook als ik ze af en toe moet veranderen?
OPSLAGMEDIA
Ga in gedachten eens terug naar het jaar 1990. Toen waren er voornamelijk floppydisks als verwisselbaar opslagmedium. Daar is tegenwoordig nog nauwelijks een drive voor te vinden. Zelfs als je er nog een hebt, loop je vaak tegen leesfouten aan. Zip- en Jazz-drives, MO-drives, DAT-tapes en PC Cards waren in 1990 nog geen gemeengoed en zijn inmiddels ook allang weer van de markt verdwenen. Het is dus moeilijk om de levensduur van opslagmedia voor de lange termijn in te schatten. Er zijn in elk geval bijvoorbeeld nog wel adapters om de vanaf 1989 ingevoerde IDE-harddisks via usb uit te lezen.
Harde schijven die in perfecte toestand zonder aanwezige beschadigingen opgeslagen worden, zijn na 5 jaar met grote waarschijnlijkheid nog uit te lezen. Veel hebben ook een garantie van 5 jaar. Waarschijnlijk werken de meesten exemplaren na veel langere tijd nog. Exacte onderzoeken daarnaar kennen we in
elk geval niet. Western Digital adviseert de harde schijven bij kamertemperatuur te bewaren, omdat hogere temperaturen bitfouten in magnetische media in de hand werken. Tips voor het aanschaffen van schijven zijn te vinden in het volgende artikel.
Maar niets is voor de eeuwigheid en na 5 tot 10 jaar zou je je archief dan naar een nieuw (en groter) opslagmedium moeten overzetten. Harde schijven hebben relatief hoge overdrachtssnelheden, de moderne exemplaren bereiken in de snelste zones meer dan 250 MB/s. En dat is ook via USB 3.0 (USB 3.2Gen1) goed te halen. Bij een gemiddelde overdrachtssnelheid van 150 MB/s heb je voor bijvoorbeeld 2 TB in het ideale geval (grote bestanden) bijna 4 uur nodig. Bij 14 TB duurt zo’n actie al meer dan een etmaal.
Afgezien van optische media (zie pagina 92) en de cloud (pagina 96) worden vooral nog tapes gebruikt voor archiveringsdoeleinden – maar dat is in de praktijk alleen voor grote bedrijven zinvol. De banden zelf zijn per terabyte wel goedkoop en gemaakt voor een opslagduur van 30 jaar, maar een moderne LTO 8-drive [1] kost circa 3000 euro en heeft een SAS-hostadapter nodig. Maar uit ervaring blijkt dat er ondanks een zorgvuldige planning al na 15 jaar grote problemen dreigen. Bij LTO zul je daarom in de meeste gevallen na hooguit twee generatiewisselingen de data moeten overzetten.
Steeds weer duikt de vraag op, hoe goed flashgeheugen zoals ssd’s, usb-sticks en sd-kaarten voor archiveren geschikt zijn. Maar niemand weet het antwoord. We kennen geen moderne ssd’s waarvan de fabrikanten concrete uitspraken over de langetermijnopslag doen. Bovendien zijn praktijkervaringen bij ouder flashgeheugen niet op moderne producten te projecteren. De daarin verwerkte NAND-flashgeheugenchips worden namelijk snel doorontwikkeld. Chips uit het productiejaar 2018 zijn technisch compleet verschillend van chips uit bijvoorbeeld 2014. Bovendien hangt de zogeheten ‘retention time’ van de afzonderlijke cellen af van het feit hoe vaak ze al overschreven zijn.
Als archiefmedium is flashgeheugen daarom ongeschikt, maar als extra back-upmedium wel nuttig in de zin van beter een middelmatige back-up dan helemaal geen. Volgens hetzelfde motto zijn ook prints van documenten en papieren foto’s als extra kopie geschikt – maar ze nemen wel veel ruimte in beslag en kunnen niet goed tegen slechte opslagomstandigheden.
BESTANDSFORMATEN
Denk nu weer eens terug aan het jaar 1990. Weet je nog welke bestandsformaten de programma’s uit die tijd hanteerden? En zo ja, heb je nog software die deze formaten kan lezen, inclusief de eventueel benodigde licentiesleutels en een besturingssysteem waar alles op kan draaien? Die terugblik laat zien dat bestanden in slim gekozen formaten opgeslagen moeten zijn als je ze na 30 jaar nog wilt kunnen gebruiken. Vooral wanneer je ze voor je nageslacht bewaart, die geen idee hebben met welke software de bestanden ooit gemaakt zijn.
Het is dus geen slecht idee ook programma’s in het archief mee te nemen die de bewaarde bestanden kunnen lezen en weergeven. Opensourcesoftware is daar erg geschikt voor, en die kun je inclusief broncode archiveren. Die kun je dan na tientallen jaren zo nodig opnieuw compileren. Bovendien kun je een image van het op dit moment gebruikte besturingssysteem mee archiveren.
Voor bijna alle digitale bestanden, die je ook kunt uitprinten – dus brieven, werkstukken, Excel-sheets, gescande documenten – kun je het voor archivering bedoelde PDF-formaat PDF/A gebruiken. Dat heeft een open specificatie en is wijdverbreid, wat de kans verhoogt dat het over vele jaren nog leesbaar zal zijn.
Microsoft Word en LibreOffice kunnen documenten zonder extra software als PDF/A opslaan. Maar office-bestanden die als PDF/A zijn opgeslagen, kun je in tegenstelling tot een DOCX- of ODT-bestand niet eenvoudig opnieuw openen, bewerken en weer opslaan. PDF/A is nou juist een archiefformaat voor digitale
onduidelijk meer dan 10 jaar, brandkwaliteit afhankelijk