Waarom worden de bestanden weer aangeboden in een archief formaat?

Om zoveel mogelijk onderzoekers de kans te geven de data te laten hergebruiken

Het oorspronkelijk bestand (native format) is gemaakt met een computerprogramma van een bepaalde software leverancier (proprietary software) en met een bepaalde versie van die software. Als die specifieke software niet meer op een (toekomstige) computer gedraaid kan worden, is het digitale gegevensbestand feitelijk onleesbaar geworden.

Om dit te voorkomen worden alle bestanden geconverteerd naar een bestandsformat waarvan de digitale duurzaamheid eenvoudiger kan worden gegarandeerd. Bij het e-depot is er voor gekozen zoveel mogelijk eenvoudige tekstuele bestanden te gebruiken als archief format.

Tekstuele (ASCII) bestanden kunnen eigenlijk altijd weer worden ingelezen. Zo kan een database tabel, die als comma seperated value (CSV) file is gearchiveerd in vrijwel elk database, spreadsheet, statistisch programma of GIS-systeem worden geïmporteerd. Dat geldt nu, maar waarschijnlijk ook voor toekomstige computers die een heel ander besturingssysteem en toepassingssoftware zullen kennen. Van de archiefformaten is de technische structuur in het e-depot beschikbaar, zodat in het ergste geval een toekomstig programmeur altijd een conversieprogramma kan maken.

Door een goed gekozen archiefformat wordt dus zowel de digitale duurzaamheid als de uitwisselbaarheid (interoperability) gediend.

Gerelateerde vraag: Waarom zou ik mijn bestanden bij het e-depot deponeren?

Milco Wansleeben, 14-11-2009