donderdag 4 december 2008

Digital information lasts forever...

Ik denk dat iedereen die iets met permanente toegankelijkheid te maken heeft het volgende citaat van Rothenberg wel eens gehoord en misschien gelezen heeft:
Digital information lasts forever — or five years, whichever comes first.

Toen ik een paar weken geleden in mijn boekenkast de dichtbundel STOA van Lucas Hüsgen vond, heb ik het artikel er nog maar eens bijgehaald.
Normaal gesproken is digitale duurzaamheid niet iets waar ik bij een dichtbundel als eerste aan denk, maar deze bundel is in 1997 niet op papier, maar op diskette verschenen. De uitgever dacht (waarschijnlijk terecht) dat bijna niemand een bundel van meer dan 300 pagina’s van een relatief onbekend dichter zou kopen en heeft toen besloten de bundel voor 15 gulden op diskette te verkopen.

Met het adagium van Jeff Rothenberg in het achterhoofd ging ik er van uit dat ik STOA als verloren moest beschouwen. Zeker gezien de ‘bewaarhistorie’ van de diskette: eerst een paar jaar in een permanent warme flat in Diemen, daarna ruim vijf jaar in een doos bij mijn moeder op een amper geïsoleerde zolder in Ulestraten en nu alweer een paar jaar ‘gewoon’ in mijn boekenkast in Meerssen. Ik verwachtte dat STOA een mooi ‘object’ zou zijn, dat de digitale duurzaamheidsproblematiek kon illustreren.

Maar, voorlopig is niets minder waar...

Toen ik een pc met diskettestation gevonden had (dit klinkt dramatischer dan het is, bij de provincie zijn alle pc’s hier nog mee uitgerust) bleek de diskette nog gewoon leesbaar. Sterker nog, foutcontrole van het schijfje leverde geen enkele fout op.
Op de diskette staan drie bestanden: STOA-2.DOC, STOAWORD.DOC en STOAWP51 en ik kan ze alledrie probleemloos openen met Word 2002.
Het enige wat me enig nadenken heeft gekost was STOA-2.DOC. De datum van dit bestand wijkt af van de datum van die andere twee. Uiteindelijk bedacht ik dat ik destijds nog heb bekeken of ik de bundel zou printen. Ik heb daarom de pagina-instelling en opmaak gewijzigd (landscape en twee kolommen), zodat het aantal te printen pagina’s gehalveerd zou worden.

Hoewel dit natuurlijk geen ‘wetenschappelijk’ experiment is, komen de uitkomsten wel overeen met iets waar Chris Rusbridge vorige maand en twee jaar geleden over schreef.

In “Excuse me…” uit 2006 bespreekt Rusbridge een zestal uitgangspunten die gangbaar zijn in de wereld van de digitale duurzaamheid.
  1. Digitale duurzaamheid is duur [omdat]
  2. bestandformaten heel snel verouderen [waardoor]
  3. Regelmatig acties ondernomen moeten worden, wat er voor zorgt dat de onderhoudskosten hoog blijven.
  4. E-depots moeten rekening houden met een heel verre toekomst
  5. “Internetverwachtingen” zijn zodanig dat ieder bewaard object makkelijk en direct in het “format de jour” moet kunnen worden geraadpleegd
  6. Het bewaarde object moet op alle onderdelen volledig gelijk zijn aan het origineel.
Rusbridge geeft aan dat er verschillende soorten bestandsformaten zijn en dat er, bijvoorbeeld bij SPSS-bestanden wel degelijk risico’s zijn, zeker als de benodigde metadata ontbreken. Maar, zegt hij, als het gaat om bestanden die gemaakt zijn of worden met commerciële, consumentenapplicaties, dan valt het alleszins mee.
Tot nu toe is hij nog geen bestanden tegen gekomen die volledig en totaal verloren waren gegaan. (In zijn bericht van 20 november 2008 vraagt Rusbridge trouwens om voorbeelden van volledig verloren informatie.Mijn STOA is helaas ook weer geen goed voorbeeld.)
Uiteraard zijn er wel voorbeelden waarin de informatie uit oude bestanden slechts gedeeltelijk te reproduceren is (zoals in Nederland bijvoorbeeld de driedimensionale opname van het beeld van Erasmus bij het Gemeentearchief Rotterdam).

Uiteindelijk herformuleert Rusbridge zijn zes stellingen als volgt:
  1. Digitale duurzaamheid is in vergelijking met bewaren op papier relatief goedkoop
  2. Bestandformaten verouderen veel langzamer dan we eerst dachten
  3. Preserveringsacties kunnen veel onregelmatiger worden uitgevoerd, waardoor de kosten te overzien blijven
  4. eDepots moeten een tijdhorizon hebben in lijn met hun bekostiging en moeten ingesteld zijn op ‘opvolging’
  5. Verwachtingen uit de internettijd kan meestal niet aan voldaan worden
  6. Alleen voor ‘afgeleide’ bestanden is het nodig om beschikbaar te zijn in het “format de jour”, maar de originelen dienen met metadata en documentatie bewaard te blijven voor “onderzoek.”
Waarschijnlijk valt er wel een en ander op “Excuse me…” af te dingen, maar het artikel dwingt in ieder geval tot nadenken over onze dogma's. En dat kan nooit kwaad.

NB
Ik pleit er natuurlijk niet voor om alles maar op 3.5" diskettes in WP5.1-formaat te archiveren. Maar ik hoop dat dat duidelijk is.

maandag 1 december 2008

Softwarearchief

In de e-data&research van 1 december 2008 pleiten Jeffrey van der Hoeven en Frank Houtman voor een softwarearchief. Zij stellen dat er in emulatie al een oplossing gevonden is voor het nabootsen van in onbruik geraakte hardware, maar dat dit alleen zinvol is als de oorspronkelijke software nog beschikbaar is. En daar zit een deel van het probleem, want er is geen enkele organisatie die nog beschikt over alle software die zij ooit heeft gebruikt.
Daarnaast zijn er nog wel wat problemen te noemen - en dat doen zij ook:
  1. Er zijn heel wat technische obstakels, zoals de complexiteit van een softwareomgeving. Het is niet voldoende om alleen een 'set-up' WP 5.1 te bewaren, je hebt onder andere ook allerlei drivers en lettertype-bestanden nodig.

  2. In het verlende daarvan ligt natuurlijk de vraag: Wat moet ik allemaal bewaren? En in welke configuraties? Neem bijvoorbeeld een website. Gebruikers kunnen die met verschillende versies van legio programma’s op diverse platforms benaderen. Moet je dan al die versies, programma’s, platforms en mogelijke configuraties bewaren?

  3. Derde probleem is een juridisch probleem: je hebt licenties nodig om applicaties te kunnen installeren. En licenties zijn vaak plaats (machine) en tijdgebonden.

  4. In het verlengde daarvan: soms kun je een set-up helemaal niet bewaren. DRM zorgt er bijvoorbeeld voor dat je bestanden niet kunt kopiëren van de DVD waar ze op staan. En aangezien DVD's niet geschikt zijn voor langdurige bewaring, kan dat heel snel problemen opleveren.

De oplossing die Van der Hoeven en Houtman aandragen is overigens wel heel makkelijk: de rijksoverheid moet het regelen, omdat zij als grote partij bij aanbestedingen de mogelijkheid heeft om licenties voor dit doel te reserveren. Uit de presentatie van Brian Mathews tijdens What to preserve? Significant properties of digital objects over de problemen bij het bewaren van software, blijkt echter dat licenties het minste probleem zijn!

Zijn oplossingsrichting is dan ook “Good software preservation is good software engineering.” Dit levert ook geen oplossing voor de oude en huidige software, maar kan wel meer garantie voor de toekomst bieden.

En ik vraag me nog altijd af of deze wijze van archivering (emulatie en softwaredepot) geen dure, doodlopende weg is, gezien de enorme hoeveelheid aan variabelen waar het om kan gaan.

Tenslotte: Van der Hoeven en Houtman verwijzen naar de verplichting in de Archiefwet om alle software-versies te bewaren. In het concept van de Archiefregelingen 2008 is deze verplichting niet meer zo expliciet opgenomen.

maandag 24 november 2008

eDepot in perspectief

Drie presentaties, drie stellingen en drie keer drie speeddates, dat stond afgelopen donderdag 20 november in Maastricht op het programma van het najaarscongres eDepot in Perspectief van SOD afdeling Zuid. De presentaties zullen waarschijnlijk binnenkort integraal op de website van de SOD verschijnen. Nu al een kort verslag.

Filip Boudrez was net op tijd in Maastricht om de ontwikkeling van het eDepot bij de stad Antwerpen te beschrijven. Deze keer viel me dit plaatje het meest op:

Antwerpen streeft ernaar om van het eDepot een generieke service te maken, die alle verantwoordingsinformatie uit de primaire applicaties zo vroeg mogelijk opneemt en beheert. Dat heeft echter ingrijpende consequenties voor het eDepot.
Allereerst moet er veel meer aandacht besteed worden aan de toegangsrechten. Overgebrachte, permanent te bewaren archiefstukken zijn in principe voor iedereen toegankelijk, terwijl actuele informatie uit een CRM of FMS-systeem dat uiteraard niet is! Filip gaf aan dat er in één specifiek Antwerps systeem een duizendtal authorisatieregels konden voorkomen.
Een ander punt is dat de ‘standaard’ archieftoegangen (lees: inventarissen) veel te grofmazig zijn. In een inventaris zouden we alle ontvangen facturen uit 2008 onder één nummer plaatsen: Ontvangen facturen 2008. Maar in de dagelijkse praktijk zoeken medewerkers een specifieke factuur, bijvoorbeeld aan de hand van een crediteurennaam, factuurnummer of ontvangstdatum. Die metadata moeten dus niet alleen in het depot opgenomen worden, maar moeten ook als zoeksleutel gebruikt kunnen worden.
Hier is de hele presentatie van Filip als mindmap.

Daarna beschreef Geert Luykx hoe lastig kan zijn om een project eDepot van de grond te krijgen. Het blijkt dat het voor een archiefdienst als Rijckheyt ingewikkeld is om de belangen van alle partijen te behartigen. Rijckheyt is gevestigd in Heerlen en was ‘vroeger’ het Stadsarchief Heerlen. Maar, sinds enkele jaren heeft Rijckheyt met een zevental omliggende gemeenten dienstverleningsovereenkomsten afgesloten en fungeert ook voor deze kleinere gemeenten als archiefdienst. Het verschil in schaalgrootte en nabijheid blijkt bij het opstarten van eDepot-project het nodige zand in de raderen te kunnen gooien.
Rijckheyt volgt nu een soort tweesporenbeleid. Aan de ene kant wordt afgewacht wat de Denktank eDepot van de Kring van Archivarissen in Limburg oplevert en aan de andere kant worden intern al voorbereidingen getroffen om een eigen depot(je) in te richten. Die Denktank is een paar maanden geleden opgericht om te onderzoeken welke rol het Limburgse archiefwezen kan, moet en wil spelen bij het inrichten van een “Limburgs eDepot”. De resultaten van dit onderzoek zullen in het voorjaar van 2009 gepresenteerd worden.
Dit is de mindmap van de presentatie van Geert:

Na een korte pauze mocht ik de tijd tot aan de lunch volpraten met onderstaande presentatie:

Hier zitten een paar nieuwigheidjes in. Allereerst de vertaling van het DCC Lifecyclemodel (sheet 14 t/m 20) om aan te geven welke activiteiten allemaal noodzakelijk zijn om bestanden permanent toegankelijk te houden (en dat je er dus niet bent met een computer alleen). Ik hoop hier binnenkort een langer stuk aan te wijden.
Daarnaast heb ik mijn “stokpaardje” bereden door een ED3 for Dummies te maken (sheet 42-44). Hierin heb ik, met hulp van Alan Ake beschreven wat particulieren moeten doen om hun digitale bestanden toegankelijk te houden.
Een andere nieuwigheid, waar ik binnenkort nog over wil schrijven, is onderstaand plaatje uit sheet 50.

Ik denk dat we de komende tijd moeten streven naar één overkoepelend normenkader voor het beheren van alle (B en V) digitale archiefbescheiden. Dit zal waarschijnlijk een combinatie zijn van allerlei bestaande normen, waaronder de Baseline, ED3 en NEN 2082.

Tenslotte werd na de lunch in verschillende groepen gediscussieerd over de volgende drie stellingen:
Filip: “Elke organisatie heeft zijn digitaal depot nodig.”
Geert: “De digitale archiefbescheiden uit de periode 1990 – 2020 moeten als verloren worden beschouwd.”
Ingmar: “De lokale overheden archiveren nog altijd alsof computers niet bestaan.”

donderdag 30 oktober 2008

Nieuw Digitaal Bewaar Depot Amsterdam

Het Stadsarchief Amsterdam (SAA) heeft 27 oktober een contract afgesloten met Data Matters voor de levering van een nieuw Digitaal Bewaar Depot.
Op dit moment beheert het SAA in zijn Digitaal Bewaar Depot (DBD) ongeveer 5 miljoen scans, die bij elkaar bijna 12 Terabyte beslaan. Omdat het huidige Bewaar Depot daarmee bijna vol was, is op 12 augustus een aanbesteding uitgeschreven voor een nieuw DBD. Hierin is expliciet gevraagd naar faciliteiten voor permanente controle op volledigheid en authenticiteit van alle opgenomen digitale archiefstukken. Het Programma van Eisen is hier te vinden.

Een paar dingen vallen me op:
1. Amsterdam verwijst in het PvE naar ED3 en wat nog mooier is: ze nemen de terminologie over!
2. Sterker nog, ze vullen de 'onze' terminologie aan met enkele nieuwe, elegante acroniemen:
Digitaal Ontvangst Depot (DOD)
Onderdeel van het E-Depot; is het geheel van opnamepakketten (ADA) met de daarbij behorende apparatuur, programmatuur, procedures, methoden, kennis en vaardigheden om deze opnamepakketten in te nemen en geschikt te maken voor het Digitaal Bewaar Depot.
Digitaal Bewaar Depot (DBD)
Onderdeel van het E-Depot; is het geheel van digitale archiefstukken (ODA) met de daarbij behorende apparatuur, programmatuur, procedures, methoden, kennis en vaardigheden om deze archiefstukken op lange termijn te beheren en beschikbaar te houden.
Digitaal Raapleeg Depot (DRD)
Onderdeel van het E-Depot; is het geheel van apparatuur, programmatuur, procedures, methoden, kennis en vaardigheden om de digitale informatiepakketten (BDA) beschikbaar te stellen.

3. Uit het PvE blijkt dat het DBD ook bedoeld is voor op termijn te vernietigen archiefbescheiden:
46. Voorziet in de mogelijkheid om op basis van bewaartermijnen uit scopeArchiv tot vernietiging van ODA’s over te gaan of een nieuwe bewaartermijn via ScopeArchiv in te geven en deze aan de ODA’s te koppelen (zie ook 47 en 48).


Ik ben zeer benieuwd naar het vervolg!

dinsdag 28 oktober 2008

Livre komt met wiki over digitale duurzaamheid

Vandaag is de Livre Wiki officieel gelanceerd, een groep van pagina's met als doel om kennis te delen en te ontwikkelen over digitale duurzaamheid.

Livre is een onafhankelijk nieuws- en kennisportal met als doel het ontwikkelen en delen van kennis over digitale duurzaamheid. Thema's waar Livre zich mee bezighoudt zijn onder meer: open source software (OSS), open standaarden (OS), open ICT architecturen, ICT keuzevrijheid, internet, 'web 2.0', open content, open access. Vooral de technische kant van de digitale duurzaamheid, dus.

In eerste instantie is bij de opzet van de Wiki, die qua ontwerp en functionaliteit sterk doet denken aan de veelgebruikte Wikipedia, afgetrapt met een tweetal thema's: open source software en open standaarden. Bij het thema open source software is gekozen voor een breed toegankelijk, zoveel mogelijk objectief geschreven Nederlandstalig overzicht.

De Livre Wiki bevat onder meer de Software Oriëntatiegids, een reeks van beschrijvingen van populaire open source pakketten (zoals Joomla!, TYPO3, OpenOffice.org, en Ubuntu). "Zie het als een begin", aldus Marco Theunissen, een van de initiatiefnemers van Livre. "Het is de bedoeling dat gebruikers zélf de informatie aanvullen, waardoor op den duur een uitvoerig naslagwerk ontstaat voor gebruikers en beslissers die zich willen oriënteren. Veel is daarvoor niet nodig. Met de gratis verkrijgbare inloggegevens kunnen ze eigenlijk zo aan de slag."

In de Software Oriëntatiegids zijn (als begin) de volgende onderwerpen te vinden:
Open Source Software
Open Source en Werkgevers
Open Source Licenties
Softwareselectie issues
Zimbra
Joomla!
TYPO3
Moodle
Ubuntu

Bron: http://www.livre.nl/200810202215/nieuws/livre/livre-lanceert-wiki-over-digitale-duurzaamheid.html

vrijdag 24 oktober 2008

De onbegrijpelijke piek


Deze weblog krijgt niet veel bezoekers, zo’n vier a vijf mensen per dag. Op momenten dat de weblog op een andere plek (bijvoorbeeld het Archiefforum of het Archievenblad) genoemd wordt, stijgt het aantal bezoekers eventjes, naar maximaal 45. Ik was dan ook zeer verbaasd toen ik afgelopen week bovenstaande grafiek in mijn Analytics-scherm zag.

86 bezoekers op 17 oktober, waarvan 95% via Blogger.com is binnengekomen.

En ze komen van de hele wereld: Spanje (10), Frankrijk, Italië (ieder 8), China en India (ieder 3), Roemenië, Iran, Indonesië, Brazilië (allemaal 2) en dan nog onder andere Zuid-Korea, de Filipijnen en Macau.

Ik heb geprobeerd te achterhalen waar we die piek aan te danken hebben, maar ik weet het nog niet.
Heeft iemand ideeën?

vrijdag 17 oktober 2008

ED3 of hoe toets je attent beheer

Onderstaand artikel van de hand van Lolke Folkertsma en mij staat deze maand in Od.

Op 4 juni 2008 ontving de directeur van het Nationaal Archief, de heer Berendse, het eerste exemplaar van ED3 – Eisen Duurzaam Digitaal Depot. ED3 is het kader waarmee het LOPAI de beheersomgeving van blijvend te bewaren digitale informatie zal gaan toetsen. In dit artikel beschrijven Ingmar Koch en Lolke Folkertsma de achtergronden en reikwijdte van dit eerste Nederlandstalige toetsingskader voor eDepots.

Attent beheer
Het bewaren van analoge archieven is redelijk eenvoudig. Als je zorgt voor goed papier, stabiele luchtvochtigheid en temperatuur, een zuurvrije map en een groene zippel (en er doen zich geen grote calamiteiten voor), dan kun je een papieren dossier vandaag de dag makkelijk honderd jaar negeren. De documenten zullen daarna nog net zo toegankelijk zijn als nu. Sterker nog, ondanks (of misschien juist dankzij) heilzame verwaarlozing (‘benign neglect’ in het Engels) zijn heel veel waardevolle analoge archieven aan ons overgeleverd. Denk bijvoorbeeld aan de Babylonische kleitabletten, die duizenden jaren onder de grond hebben gelegen en bij opgravingen zijn terug gevonden. Of, dichter bij huis, de 120 jaar oude brief van Multatuli die onlangs op een zolder in de Flevopolder gevonden is.

Het is voor velen geen nieuws meer dat heilzame verwaarlozing voor digitale documenten een heel slechte bewaarstrategie is. Ook als er een ‘goed’ bestandsformaat en een ‘goede’ drager gebruikt worden, verandert heilzame verwaarlozing heel snel in heilloos verzuim: digitale documenten die niet meer vindbaar, fotobestanden die niet meer bruikbaar of spreadsheets die niet meer interpreteerbaar zijn. Digitale duurzaamheid vereist continu attent beheer.

Op 4 juni 2008 presenteerde het Landelijk Overleg Provinciale Archiefinspecteurs tijdens de studiedagen van de KVAN zijn ED3 - Eisen Duurzaam Digitaal Depot. Hierin hebben de gezamenlijke provinciale archiefinspecties, in samenwerking met Het Expertisecentrum, beschreven aan welke aspecten aandacht besteed moet worden bij het inrichten en in stand houden van een eDepot. Aan de hand van de 75 eisen uit ED3 kunnen de archiefinspecties vaststellen of bij een organisatie sprake is van attent beheer of heilloos verzuim.

Wat is een eDepot?
In ED3 gaan we, in navolging van andere, internationale toetsingskaders, uit van een brede definitie van een eDepot. Het gaat niet enkel om de apparatuur en programmatuur die nodig is om digitale objecten veilig op te slaan [NOOT 1], het gaat vooral om alles wat om die machines en programma’s heen georganiseerd moet worden. Het LOPAI definieert een eDepot daarom als:
Het geheel van organisatie, beleid, processen en procedures, financieel beheer, personeel, databeheer, databeveiliging en aanwezige hard- en software, dat het duurzaam beheren van te bewaren digitale archiefbescheiden mogelijk maakt.[NOOT 2]
Deze brede definitie ligt om verschillende redenen voor de hand.
Allereerst omdat digitale duurzaamheid veel meer is dan alleen maar hard- en software. Zoals gezegd gaat het bij de permanente bewaring van digitale bestanden om attent beheer. Hardware is heel relevant, maar moet onvermijdelijk na verloop van tijd vervangen worden. Er zijn dus mensen nodig om de servers te beheren, er moet geld beschikbaar zijn om de machines te vervangen en de vervanging moet gepland worden. Ditzelfde geldt grosso modo ook voor software en gedeeltelijk zelfs voor de te beheren bestanden. Met alleen apparatuur en programmatuur ben je er dus niet.

Ten tweede toetst de provinciale archiefinspectie analoge archieven ook veel breder dan alleen op de kwaliteit van het papier en het klimaat in de archiefruimte of –bewaarplaats. Ook bij het toezicht op de analoge archivering spelen de vier p’s een cruciale rol: personeel, processen, procedures en pecunia. Het breder perspectief past dus perfect in het toezicht op de zorg zoals de archiefinspecties dat op basis van de archiefwetgeving uitoefenen.

In de derde plaats heeft de brede definitie ook een signaleringsfunctie: het eDepot bevindt zich op het snijvlak van ICT en archief en de archivaris dient zich er van bewust te zijn, dat hij zijn functie in het digitale tijdperk niet kan uitoefenen zonder kennis van ICT en samenwerking met ICT-ers.

Vijfenzeventig eisen in drie onderdelen
ED3 bestaat uit drie hoofdstukken: Inleiding, Terminologie en Criteria. In dit laatste hoofdstuk zijn vijfenzeventig eisen opgenomen, stuk voor stuk voorzien van een korte toelichting. Hierbij is het belangrijk om in het oog te houden dat ED3 geen blauwdruk is voor het bouwen van een eDepot. De criteria omvatten functionele eisen die ‘universeel’ zijn: voor het permanent bewaren van digitale archiefbescheiden moet aan deze voorwaarden voldaan worden. Het maakt voor het toezicht niet uit of ze zijn opgenomen in een ‘stand alone’ eDepot bij een archiefdienst of bewaard worden bij ‘de administratie.’

Zoals uit bijgaande mindmap blijkt, zijn de criteria onderverdeeld in drie hoofdcategorieën:
A. Organisatie, beleid en procedures
B. Beheer van digitale archiefbescheiden
C. Technologie, technische infrastructuur en beveiliging.

A. Organisatie, beleid en procedures
Omdat de kwaliteit van de organisatie die het depot beheert van grote invloed is op de kwaliteit van het langdurig digitaal beheer, zijn daarover in ED3 achttien eisen opgenomen. Hierbij gaat het bijvoorbeeld om eisen ten aanzien van de continuïteit van de organisatie (Wat heeft de organisatie geregeld voor het geval zij zelf ophoudt te bestaan?), de personeelsformatie en de financiën. Veel aandacht wordt hierbij ook besteed aan de manier waarop de organisatie haar procedures vastgelegd heeft en zelf toetst of er ook conform de procedures gewerkt wordt.

B. Beheer van digitale archiefbescheiden
Dit deel bestaat uit 39 eisen ten aanzien van functies, procedures en processen die nodig zijn voor de opname, het toegankelijk maken, de beschikbaarstelling en de lange termijn opslag van digitale archiefstukken met de bijbehorende metadata. Deze eisen zijn gebaseerd op de huidige archiefwetgeving en moeten vooral de kwaliteit van de digitale archiefbescheiden waarborgen. Archivistisch gezien is paragraaf B de kern van het digitaal depot.
De zes onderdelen van deze paragraaf komen ruwweg overeen met de entiteiten uit het functioneel model uit OAIS [NOOT 3].

Het gaat in deze paragraaf om de manier waarop digitale archiefbescheiden aangeboden worden aan het depot (B1), hoe ze daarna in het depot worden opgenomen (B2) en hoe de permanente opslag geregeld is (B4). Met name onder de kopjes bewaarstrategie en informatiemanagement komen de maatregelen die de organisatie genomen heeft om duurzame toegankelijkheid te garanderen aan bod. Omdat archiefstukken worden bewaard om ook weer geraadpleegd te kunnen worden, wordt in de laatste paragraaf bekeken hoe de organisatie dit geregeld heeft.

C. Technologie, technische infrastructuur en beveiliging
De achttien eisen uit onderdeel C gaan over de techniek van het eDepot zelf, vergelijkbaar met de regeling op basis van artikel 13 van het Archiefbesluit 1995 voor de bewaarplaatsen van analoge archiefbescheiden. In de praktijk zullen deze criteria grotendeels samenvallen met een uitgebreide ICT-audit, omdat er al vele standaarden voor een goed werkende digitale infrastructuur bestaan. Het gaat in deze paragraaf om zaken als een beschreven ICT-architectuur, informatiebeveiliging en calamiteitenplannen.

Tot slot
ED3 is natuurlijk niet zomaar uit de lucht komen vallen. Het is in feite een aanpassing van TRAC (Trustworthy Repositories Audit & Certification: Criteria and Checklist) [NOOT 4] aan de Nederlandse archiefwetgeving en –praktijk.
ED3 hangt ook niet in het luchtledige. Zoals gezegd is in onderdeel B de huidige Nederlandse archiefwetgeving en dan met name de Regeling geordende en toegankelijke staat archiefbescheiden geïncorporeerd. Verder zijn er ook duidelijke raakpunten met NEN-ISO 15489 en 23081, ISO 14271 (OAIS) en de net vastgestelde NEN 2082.
En ED3 is ook niet vacuüm getrokken en daarmee gestold tot een wet van Meden en Perzen. Op 4 juni 2008 hebben we de eerste versie gepresenteerd en deze zal uiteraard aangepast worden zodra de archiefwet en –regelgeving aangepast wordt. Maar, we gaan de komende maanden ook inspectie-ervaringen opdoen. We zullen dan bekijken of in ED3 de goede vragen gesteld worden, of we de antwoorden begrijpen en of we daarna in staat zijn om een oordeel te vellen over het onderzochte depot. De uitkomsten daarvan kunnen leiden tot een aanpassing of nadere toelichting van de eisen. En vanzelfsprekend kunnen ook opmerkingen uit ‘het veld’ aanleiding zijn om ED3 te verbeteren.

Aanvullende informatie
ED3 is analoog te verkrijgen bij de provinciale archiefinspecties of te downloaden via http://lopai.nl/pdf/ED3_v1.pdf
Aanvullende informatie wordt ook beschikbaar gesteld via de ED3-weblog: http://eisenduurzaamdigitaaldepot.blogspot.com/

Lolke Folkertsma is adjunct-archiefinspecteur bij de provincie Overijssel; Ingmar Koch is beleidsmedewerker archiefinspectie bij de provincie Noord-Brabant. Beiden zijn mede-opstellers van ED3.

Noten
1. P. Horsman, R. Spork, ‘E-depot Rotterdam 5: Hoe hard kun je lopen?’ In: Archievenblad, juli 2008, p. 30-31.
2. LOPAI, ED3, p.7-8. Deze definitie is een vertaling van de definitie uit TRAC (zie noot 4)
3. http:// public.ccsds.org/publications/archive/650x0b1.pdf
4. http://www.crl.edu/PDF/trac.pdf

Dit artikel is afkomstig uit Od 10-2008. Od is een uitgave van Sdu Uitgevers, Den Haag, www.sdu.nl

donderdag 16 oktober 2008

Studiedag Digitaal Depot Antwerpen

Gisteren vond in het prachtige Felixarchief in Antwerpen een studiedag over Nederlandse en Vlaamse e-depots plaats. Hoewel de opkomst groot was (ik schat dat er meer dan honderd mensen waren), gooide de stroomstoring in Rotterdam voor verschillende bezoekers (waaronder mijn collega’s Dick en Chido) roet in het eten.
Ik had me voorgenomen om (semi)live vanuit Antwerpen te bloggen, maar helaas bleken de accespoints vanuit de congresruimte niet bereikbaar.

Voor de liefhebbers heb ik van iedere presentatie een mindmap gemaakt. Hier zijn ondertussen de integrale presentaties te vinden.

Jacqueline Slats van het Nationaal Archief gaf aan dat het NA drie redenen zag om een e-depot te bouwen:
  1. om overgebracht digitale archiefbescheiden goed te kunnen beheren

  2. om het overbrengen van digitale archiefbescheiden te vereenvoudigen / verbeteren

  3. om de beschikbaarstelling van archiefbescheiden via internet te verbeteren
Ze beschreef daarna vijf scenario’s voor de positie die het e-depot van het nationaal archief in de toekomst kan innemen:
  1. De huidige situatie, waarbij zorgdragers na twintig jaar hun te bewaren digitale archiefbescheiden overbrengen.

  2. Scandinavisch model, waarbij zorgdragers hun te bewaren archieven vervroegd overbrengen

  3. Fins model, waarbij het NA als een Trusted Digital Repository gaat functioneren. Het Zorgdragers brengen dan al hun digitale archieven (te bewaren en te vernietigen) onder het e-depot. Zorgdragers blijven zelf verantwoordelijk voor selectie en vernietiging en overbrenging.

  4. Het NA gaat fungeren als TRD voor de RHC’s. Dit wil zeggen dat andere archiefdiensten e-depotruimte kunnen huren bij het NA.

  5. Service Oriented Architecture, waarbij het NA digitale archieven op of in de systemen van de zorgdrager gaat beheren.
Het NA legt sterk de nadruk op digitale toegankelijk via internet (in het project NA4All), waarbij Jacqueline wel aangaf dat alleen ‘openbare’ stukken beschikbaar gesteld worden.
Ik vroeg me daarbij af men zich bewust is van de volledige impact van de Wet Bescherming Persoonsgegevens en het oordeel van het College Bescherming Persoonsgegevens ten aanzien van het Bouwarchief van Nijmegen. Volgens het CBP is er namelijk een verschil tussen openbaarheid en actieve openbaarmaking op internet. Wat dat betreft verdient de Juridische Wegwijzer Archieven en Musea Online die de Taskforce Archieven heeft laten maken veel meer aandacht.

Daarna beschreven achtereenvolgens Inge Schoups van het Stadsarchief Antwerpen en Jantje Steenhuis van het Gemeentearchief Rotterdam (die door de stroomstoring net op tijd was) hoe het bouwen van een e-depot in hun organisatie is aangepakt.
Het grote verschil is waarschijnlijk de positionering van het Archief en het e-depot in de gemeentelijke organisatie. Antwerpen heeft er van begin af aan voor gezorgd dat het e-depot geen speeltje van de archiefdienst is. Er is continu nauw samengewerkt met de andere gemeentelijke afdelingen. In Rotterdam is het archief begonnen met het bouwen van een depot voor haar eigen digitale bestanden en pas later is besloten ook een “e-depot Concern” voor de rest van de gemeentelijke organisatie te bouwen.


Na de lunch besprak Josje Evers de manier waarop in Rotterdam de belangrijkste functies uit het OAIS-model werden geïmplementeerd. Enkele zaken vielen me daarbij op:
Metadatamanagement: GAR heeft heel veel tijd besteed aan het maken van één metadatamodel voor Archief, Atlas en Bibliotheek.
Preservation planning: In haar presentatie gaf Josje aan dat de uitvoering van de bewaarstrategie “per documentsoort” kan verschillen. Ik snapte eerst niet wat ze bedoelde met documentsoort, maar later begreep ik dat het om bestandsformaten ging. Misschien wreekt zich hier het gebruik van Engelse begrippen zonder daar een heldere en adequate Nederlandse vertaling naast te zetten?
Beleid: Een belangrijk onderdeel van OAIS is ‘Administration’ wat wij in ED3 vertaald hebben met beheer en gedefinieerd hebben als: “formuleren beleid, overleggen met archiefvormers, standaarden vastleggen, beheer digitaal depot, bijhouden documentatie, opvolgen technologische veranderingen” Dit waren niet de punten die Josje onder de noemer “beleid” opsomde en ik weet niet of en hoe deze aspecten nu geborgd zijn.


Het laatste woord was voor Filip Boudrez, die zoals gewoonlijk in een razend tempo, maar desondanks heel helder en begrijpelijk, vertelde hoe het Digitaal Depot van Antwerpen in elkaar steekt. En, zoals Peter Horsman ook opmerkte, we mochten in het depot kijken. Wat me verder zijn presentatie het meest bijgebleven is, is de nadruk die hij legt op het permanent controleren van alle stappen die gezet worden. Iedere transformatie, iedere beheershandeling moet minstens eenmaal, maar waarschijnlijk meerdere keren gecontroleerd worden.

woensdag 1 oktober 2008

iPRES 2008 (slot)

Nog een paar citaten van Chris Rusbridge.

Een hart onder de riem van 'ouderwetse' archivarissen:
Christian Keitel from Ludwigsburg quoted one Chris Rusbridge as saying that digital preservation was “easy and cheap”, and then comprehensively showed that it was at least complicated and difficult. He did suggest that sensible bringing together of digital preservation and non-digital archival approaches (in both directions) could suggest some improvements in practice that do simplify things somewhat.
En een relatieverende opmerking aan het eind:
In discussion, we felt that the point of David’s remarks was that we should understand that perfection was not achievable in the digital world, as it never was in the analogue world. We have never managed to keep all we wanted to keep (or to have kept) for as long as we wanted to keep it, without any damage.

Ik heb me voorgenomen om over twee weken in Antwerpen op een zelfde manier verslag te doen van de Studiedag Digitaal Depot.

dinsdag 30 september 2008

iPRES 2008

Gisteren en vandaag vond (en vindt) in de British Library voor de vijfde keer iPRES (international Conference on Preservation of Digital Objects) plaats. En het mooie van deze tijden is dat van de lezingen bijna live een verslag te volgen is. Zie bijvoorbeeld de bijdragen van Chris Rusbridge op de Digital Curation Blog.

Ik pik er nu even een paar interessante citaten uit.
Over kosten en risico's
Richard Wright talking about storage and the “cost of risk”. In early days dropping a storage device meant losing a few kilobytes, now it could be GBytes and years of work. Storage costs declining and capacity increasing exponentially roughly related to Moore’s law (doubling every 18 months). Usage is going up, too, and risk is proportionate to usage, so risk is going up too. Risk proportional to no of devices and to size and to use… plus the more commonly discussed format obsolescence, IT infrastructure obsolescence etc. So if storage gets really cheap, it gets really risky!
Reports work from Manfred Thaller of Koln: one bad byte affects only that byte of a TIFF (does this depend on selected compression?), 2% of a JPEG, and 17% of a JPEG2000. Demonstrated 5 errors on a PNG and a BMP: former illegible, latter has a few dots scattered about. Text files the best: one byte corruption affects only that byte! (...) Can’t emphasise how important this is: one of the most worrying preconceptions in digital preservation is that the bit preservation element is a solved problem. It isn’t!

Over emulatie
I’ve always had a problem with emulation; perhaps I’ve too long a memory of those early days of MS-DOS, when emulators were quite good at running well-behaved programs, but were rubbish at many common programs, which broke the rule-book and went straight into the interrupt vectors to get performance. OK, if you’re not that old, maybe emulation does work better these days, and is even getting trendy under the new name of virtualisation. My other problem is also a virtue of emulation: you will be presented with the object’s “original” interface, or look and feel. This sounds good, but in practice the world has moved on and most people don’t like old interfaces, even if historians may want them. I guess emulation can work well for objects which are “viewed”, in some sense; it’s not clear to me that one can easily interwork an emulated object with a current object.

Vooral die laatste twee opmerkingen vind ik interessant en moet ik nog eens over nadenken.

En tenslotte een presentatie van Brian Kelly over website-archivering. (Toevallig is dat nu heel actueel in mijn eigen organisatie, vandaar mijn belangstelling).

dinsdag 16 september 2008

Lezing bij SNAAI gaat niet door

Ik lees net dat de excursie van SNAAI naar Eindhoven, volgende week donderdag wegens te weinig animo niet doorgaat.
Dat is heel jammer, want ik had een hele mooie presentatie in voorbereiding, vond ik zelf.
Misschien dat ik de komende weken delen daarvan (onder andere over levenscyclus van digitaal beheer) dan maar hier publiceer.

maandag 15 september 2008

Vooruitblik op de komende maand

De komende weken wordt het druk:

  1. Eind deze week gaan we ED3 'testen' bij een werkend digitaal depot voor archiefstukken in het oosten van het land. Uiteraard zullen we in de weken daarna hier over onze ervaringen schrijven.

  2. Volgende week geef ik voor SNAAI in Eindhoven een presentatie over ED3, waarbij ik ook de eerste indrukken van de 'inspectie' uit de doeken zal doen. De presentatie zal hier volgende week ook te vinden zijn.

  3. In oktober verschijnt in de Od een artikel van de hand van Lolke Folkertsma en mij over ED3. Te zijner tijd zal dit artikel hier integraal te lezen zijn.

  4. 15 oktober zijn Chido en ik aanwezig bij de Studiedag Digitaal Depot in Antwerpen en op deze pagina's zullen onze impressies te lezen zijn.

donderdag 7 augustus 2008

Informatiebeveiliging

Een paar weken geleden schreef ik hier over digitale duurzaamheid voor de gewone man, waarbij het vooral ging om het voorkomen van ‘natuurlijk’ verval van digitale documenten. Analoge en digitale archiefbescheiden kunnen natuurlijk ook verloren gaan door calamiteiten, zoals brand of wateroverlast.

Afgelopen zondag heeft het in Zuid-Limburg flink geregend en in ieder geval één overheidsorganisatie heeft daar heel veel last van gehad:
"KvK ontruimd wegens wateroverlast

Het gebouw van de Kamer van Koophandel in Maastricht is ontruimd in verband met wateroverlast. In de kelder van het complex bij De Geusselt staat 40 centimeter water. Alle computersystemen zijn uitgevallen, waardoor er niet meer kan worden gewerkt.

Geprobeerd wordt om de kelder vandaag weer droog te krijgen, zodat het personeel morgen weer aan het werk kan. De dienstverlening wordt zolang waargenomen door de Kamer van Koophandel in Venlo."
Bron: Dagblad De Limburger en L1; foto Johannes Timmermans.

In ED3 zijn vier eisen om vast te stellen of het eDepot voldoende beveiligd is tegen dit soort calamiteiten:

C 3.1
De dienst doet aan een systematische risicoanalyse voor factoren als data, systemen, personeel, fysieke locatie en beveiligingseisen.
C 3.2 De dienst heeft voor iedere vastgestelde beveiligingseis adequate maatregelen getroffen.
C 3.3 Medewerkers hebben ten aanzien van wijzigingen in het systeem afgebakende rollen, verantwoordelijkheden en autorisaties.
C 3.4 De dienst beschikt over passende calamiteiten- en herstelplannen, bestaande uit minstens een back-up van alle opgeslagen informatie en een kopie van het herstelplan op een andere locatie.

Overigens, bij deze hoeveelheden water (40 cm) lijkt het er op dat de wettelijk verplichte drempel van 10 cm voor een archiefruimte en archiefbewaarplaats ook niet genoeg was geweest.

woensdag 9 juli 2008

Het ODA nader verklaard: toegankelijk en begrijpelijk (I)

In april was ik in de British Library in Londen bij What to preserve? Significant properties of digital objects, georganiseerd door JISC en DPC. Deze dag stond de vraag centraal welke eigenschappen van digitale bestanden bewaard moeten blijven om de toegankelijkheid en begrijpelijkheid van het digitaal bestand te verzekeren. Het leek soms een discussie tussen doven, omdat mensen er nog al verschillende definities op nahouden van wat ‘essentieel’ is. Dat zit natuurlijk ook al in de begrippen toegankelijk en begrijpelijk.
Toegankelijkheid lijkt mij vooral een technische aangelegenheid: bestanden moeten leesbaar zijn. Om dit mogelijk te maken, moet je bijvoorbeeld zorgen voor registers waarin de eigenschappen van bestandsformaten beschreven zijn, zodat je weet met welk programma je een bepaald bestand moet of kunt openen. Dit valt in ED3 onder de ‘representatie-informatie’ van een ODA en komt overeen met de eisen uit artikel 9 lid 1 sub a, b en c en sub d ten 5°, 6° en 8° uit de Regeling geordende en toegankelijke staat archiefbescheiden (RGTS).
Begrijpelijkheid blijkt een lastige term, omdat het per individu kan verschillen of hij iets begrijpt of niet. Dat hangt van de achtergrond van de ‘gebruiker’ af. Mede om die reden moet dus zo veel mogelijk van de ‘ontstaans- en gebruikscontext’ van de digitale objecten vastgelegd worden. In ED3 (en OAIS) zijn dit de gegevens die als de beheerinformatie bij een ODA moeten worden opgenomen.
De beheerinformatie bestaat uit vier onderdelen, die alle vier te herleiden zijn naar onderdelen uit de huidige RGTS:
Verwijzingsinformatie: de unieke kenmerken (“identifiers”) van de brongegevens, die het ODA identificeren in het depot. (In ED3 wordt hierbij verwezen naar RGTS artikel 9 lid 1 sub d ten 2°, 5° en 7°, maar dat lijkt me niet helemaal correct.)

Herkomstinformatie: informatie over de institutionele context van de brongegevens, waarin o.a. veranderingen qua inhoud, structuur en vorm en het beheersproces zijn opgenomen. Zie hiervoor ook RGTS artikel 8 lid 1 en 9 lid 1 sub d ten 1°, 3° en 7°.

Contextinformatie: informatie over de relaties tussen het ODA en zijn omgeving. Dit omvat naast de administratief-procedurele context ook de relaties met andere ODA’s. Zie ook RGTS artikel 9 lid 1 sub d ten 1°, 3° en 4°. Hier kan waarschijnlijk ook artikel 2 van de regeling bij betrokken worden, maar dit staat nu niet in ED3.

Integriteitsinformatie: informatie waarmee de fysieke integriteit van het ODA gecontroleerd kan worden. (De verwijzing in ED3 naar RGTS artikel 9 lid 1 sub d ten 2° en 7°, lijkt me bij nader inzien ook niet helemaal correct.)
En tenslotte is er ook nog de Verwijzingsinformatie, waarin gegevens uit de relatie-informatie (eventueel nog aangevuld met extra gegevens) zijn opgenomen, waardoor het mogelijk wordt de ODA’s in het depot te kunnen terugvinden. Dit komt grotendeels overeen met de ouderwetse inventaris en toegangen.

Ik vermoed dat er twee oorzaken zijn aan te wijzen voor de spraakverwarring in Londen (maar misschien ook wel eerder in Den Haag).
Allereerst het verschil tussen de technische en intellectuele essentie. In Londen besteedden de techneuten heel veel aandacht aan ‘technicalia,’ terwijl ik de indruk had dat de archivarissen zich in veel gevallen afvroegen of al die technicalia wel altijd relevant zijn. Hoe essentieel is het om te weten dat een Microsofts Word-bestand gekleurde letters kan bevatten, als er helemaal geen gekleurde letters in de tekst voor komen of als die kleur niet relevant is voor de begrijpelijkheid van het bestand?


En dan was er ook nog het verschil tussen archivarissen aan de ene kant en bibliothecarissen en ‘datamanagers’ aan de andere kant. Voor archivarissen ligt het zo voor de hand dat de context van een archiefstuk beschreven moet worden, dat we daar eigenlijk niet meer over nadenken (een ‘no brainer’, zoals Andrew Wilson zei). Dat doen we met 16e eeuwse akten, met een gemeentelijk archief uit de 20e eeuw en dus ook met digitale archieven. Het feit dat de RGTS ‘vol’ staat met dit soort eisen is in dit kader ook veelzeggend. Voor wetenschappers en bibliothecarissen lijkt dit beschrijven van de context een ‘nieuw’ concept te zijn. En dan blijkt ook dat archivarissen en ‘datamanagers’ verschillende termen voor het zelfde gebruiken of, wat misschien nog lastiger is, de zelfde termen voor verschillende begrippen hanteren. En het meest in het oog springend hierbij is misschien het begrip ‘authenticiteit.’ Hierop zal ik in een volgend bericht nog terugkomen.

In dit kader lijkt het introduceren van een nieuwe, specifiek op archieven gerichte terminologie, misschien niet het meest voor de hand liggend, maar ik denk dat Chido onze overwegingen duidelijk heeft uitgelegd.

Afbeelding: Michel Balasis

zondag 6 juli 2008

ED3 opgenomen in ICT-register voor het cultureel erfgoed van DEN

DEN (Digitaal Erfgoed Nederland) heeft ED3 als aanbeveling opgenomen in hun ICT-register voor het cultureel erfgoed.

Het ICT-register is onderdeel van het Kwaliteitszorgsysteem voor het digitaal erfgoed van DEN.
DEN heeft als hoofdtaak het bevorderen van kwaliteitszorg op het gebied van ICT in de erfgoedsector. DEN legt kwaliteitsnormen en aanbevelingen vast én onderhoudt deze in een sectoroverschrijdend ICT-register, toetst ontwikkelingen binnen de ICT-praktijk en organiseert erfgoedbrede kennisuitwisseling. Daarmee levert DEN een bijdrage aan de algemene consistentie van kwaliteitszorg bij de verschillende instellingen.

maandag 30 juni 2008

Terminologie ED3

Het is wellicht goed om nog eens extra aandacht te besteden aan de vertaalde Terminologie van ED3.

TRAC, het fundament van ED3, is een van OAIS (Open Archival Information Standard, ISO 14721:2003) afgeleid instrument en gebruikt dan ook de OAIS terminologie. Dat is in het Engels en niet alleen op de archivistiek gericht, al zou de naam anders suggereren. Wij hebben de termen vertaald en de beslissing om te vertalen met redenen omkleed.

Dan verschijnt er in de linker kantlijn van de blog Digitaal Duurzaam van Inge Angevaare (Coördinator van de Nationale Coalitie voor Digitale Duurzaamheid) het volgende:

SIPs, ADA's en andere afko's
In de marge van de GAR-bijeenkomst bleek dat er onder archivarissen weinig animo bestaat om de door het LOPAI in ED3 voorgestelde
Nederlandse vertalingen van de termen uit het OAIS-model te gaan hanteren. Jacqueline Schuurman Hess: 'De Engelse termen zijn zo ingeburgerd, die laten we zo.' Daarmee is ook het bezwaar ondervangen dat de term 'aangeboden digitaal archiefstuk (ADA)' wel heel specifiek is voor één sector en daarom de communicatie met andere instellingen zoals bibliotheken en de wetenschap kan bemoeilijken. Voorlopig houden we het onder vakgenoten dus op de OAIS 'information packages'.
Bij de eerste enigszins toonbare versie van ED3 hadden ook wij de engelse terminologie gehandhaafd, om dezelfde reden die Jacqueline Schuurman Hess in het citaat aangeeft.
Die inburgering bleek echter behoorlijk tegen te vallen en het was ook op advies van een aantal personen die de genoemde ED3-versie gelezen hadden, dat we besloten hebben de terminologie te vertalen. Zij hielden zich met inspectie, dan wel e-depot(terminologie) bezig en wezen ons er op vooral begrijpelijk voor de doelgroep te blijven: de gemiddelde archivaris.

We hebben toen de afweging gemaakt: gaan we de goegemeente opvoeden in de nieuwe, breedgedragen terminologie (want daar zijn we wel van overtuigd), of willen we in Nederland, onder de verantwoordelijken voor te bewaren archief, zo snel mogelijk begrip en acceptatie krijgen voor de eisen en normen voor een E-depot? Misschien is de vergelijking niet helemaal zuiver, maar wij hebben voor het laatste gekozen en als dat geholpen wordt door het vertalen van de terminologie naar herkenbare termen, dan is dat een geheiligd middel.

Want laten we twee dingen niet vergeten:

  1. De personen die op de GAR-Informatiedag aanwezig waren, zijn bovengemiddeld geïnteresseerd in digitale archivering en E-depots. Dat geldt zeker niet voor de hele beroepsgroep. Als ik als niet-ingelezen archivaris geconfronteerd wordt met de term 'information package', dan zal ik in eerste instantie denken aan iets van de afdeling Voorlichting of wellicht iets dat met bibliotheek of documentatie te maken heeft. In ieder geval niet mijn primaire verantwoordelijkheid. We lopen het risico vér voor de muziek uit te lopen, ergens een hoek om te slaan en de aansluiting met de rest van het orkest kwijt te raken. Overigens: ED3 refereert bij iedere term aan de originele TRAC/OAIS-term. Een link is dus zo gelegd en wellicht dat een latere versie van ED3 alleen de engelse terminologie zal gebruiken.
  2. ED3 is bedoeld voor het toetsen van een archiefwettelijk E-depot. Het is dus niet primair bedoeld voor het inrichten van een willekeurig E-depot (bibliothecair, wetenschappelijk, archivistisch enz.), zoals OAIS is. Zo van: iedere koe is een gewerveld zoogdier, maar niet ieder gewervelde is een koe. Of een zoogdier. De eisen van ED3 zijn wellicht universeel bruikbaar voor alle E-depots (alhoewel misschien niet volledig genoeg voor iedere situatie), de normeringen niet per sé. Die zijn specifiek gericht op de Nederlandse archiefwet en -regelgeving. Bedenk dat 'archief' een heel specifieke functie heeft die bij andere collectietypen niet voorkomt: de (juridische) verantwoordingsfunctie. Archiefstukken zijn in een niet onaanzienlijk aantal gevallen bewijsstukken in het openbare circuit. Om de juridische authenticiteit of openbaarheid te garanderen voldoen niet altijd de normeringen voor een 'duurzame' authenticiteit of toegankelijkheid. Vermoedelijk zijn veel van de ED3-normen te zwaar voor bijvoorbeeld het E-depot van de Koninklijke Bibliotheek. Inrichten naar deze normering zou dus onnodige investeringen met zich meebrengen. Het is nooit de bedoeling van het LOPAI geweest om een universele nederlandstalige inrichtingschecklist op te stellen; ED3 is een instrument voor het toezicht op een deel van de werkzaamheden van een beheerder van Nederlands overheidsarchief, het daar berustend materiaal met bijbehorende archiefbewaarplaats. En dan dus digitaal.
We zijn dus zeker niet tegen het gebruik van de OAIS-terminologie, het is alleen in de ED3-situatie, op dit moment, niet opportuun om het 1 op 1 over te nemen.

donderdag 26 juni 2008

Digitaal duurzaam voor de gewone man

Op weblog van de Long Now Foundation heeft Heather Louise Mae Bowden een bericht geplaatst over het veilig bewaren van digitale bestanden van de gewone man.

Ze geeft aan dat het vooral gaat om FMMM: Format, Media, Metadata, Multiple copies.

Format - gebruik altijd het meest gebruikte en meest 'open' formaat en probeer zo min mogelijk te comprimeren.
Media - gebruik NOOIT herschrijfbare discs (cd of dvd). De beste plek om je bestanden op te slaan is een externe harde schijf of online opslag.
Metadata - Beschrijf de bestanden die je hebt zo goed mogelijk.
Multiple Copies - Zorg dat je je bestanden op verschillende plekken bewaart. De ideale situatie is volgens haar eigenlijk dat je samen met familie en vrienden zorgt voor bestandsuitwisseling en back-up. Een particuliere variant van LOCKSS (Lots Of Copies Keep Stuff Safe).

Heel mooi vind ik hierbij de website van de Library of Congress, waar ze naar verwijst en waar het plaatje hiernaast vandaan komt.

Weet iemand of er ook een Nederlandse equivalent bestaat?
Bij het Nationaal Archief kan ik alleen een lekenhandleiding vinden over het bewaren van papieren documenten en foto's en bij de KB heb ik helemaal niets gevonden.

Verslagje Informatiedag E-depot Gemeentearchief Rotterdam

Op 19 juni 2008 organiseerde het Gemeentearchief Rotterdam (GAR) een informatiedag over het project E-depot. Deelnemers werden op de hoogte gebracht van de ontwikkelingen, de stand van zaken en de komende activiteiten bij het project E-depot GAR.

Aan de orde kwamen onder meer waarom het GAR een E-depot wil hebben, wat de stand van zaken is bij de verschillende onderdelen en de gevolgen van het E-depot voor de organisatie en de mensen die er werken.

Hieronder een kort verslagje van de twee programmaonderdelen die ik heb meegemaakt:
(Voor een uitgebreider verslag: blog Inge Angevaare.)

Metadata en authority files - Ronald Grootveld (download presentatie)
De noodzaak tot het inrichten van een E-depot en de ontwikkeling van een integraal metadatamodel. Hoe integreer je de ontsluitingsmethoden van archieven, bibliotheek en topografische atlas? Het nut en de noodzaak van authority records.

De presentatie gaf een beeld van hoe Rotterdam tot een metadatamodel (een metadatadatabase) voor het E-Depot is gekomen en wat de plannen voor de nabije toekomst zijn. Men heeft gebruik gemaakt van ISAD en ISAAR, waarbij een koppeling met XML-uitwisselingsformaten (EAD, EAC) mogelijk moest zijn. Het team van Ronald heeft zich beperkt tot de beschrijvende en administratieve metadata. De technische metadata is tot dusver buiten beschouwing gebleven. De metadata kwam uit vier binnen het GAR gebruikte systemen. De data moet uiteindelijk ook weer door die systemen gebruikt kunnen worden (én door de digitale balie), zonder dat de systemen aangepast moesten worden. Uiteindelijk wil men komen tot een centraal metadatasysteem met álle metadata op basis van ISAD en ISAAR, getoetst aan OAIS.
Bij een centraal systeem verwordt metadata tot een authority file (bijv: namen van personen en organisaties, geografische namen, trefwoorden enz.). Gezien de ervaringen en toekomstplannen is er voor gekozen om een “authority autoriteit” (vgl. trefwoordencommissie en onderhoud centrale taxonomie) in te stellen, die nieuwe authority files controleert en vergelijkt alvorens ze op te nemen. Tot dusver heeft het GAR alleen de eigen metadata gebruikt om een taxonomie te ontwikkelen. Het is de bedoeling dat de authority autoriteit ook gaat kijken naar bestaande taxonomieën uit de bibliotheekwereld of vakinhoudelijke taxonomieën (geografie, waterbeheer, belastingen enz.)


Preservering - Jacqueline Schuurman Hess, Jacob Takema en Mette van Essen (download presentatie)
Welke acties worden bij het GAR ondernomen om te komen tot een goed preserveringsbeleid: beleidsplan, technology watch, overdrachtsprotocol voor de archiefvormer. Het GAR kijkt in de toekomst met Planets en Plato.

De presentatie werd door drie personen gehouden. Allereerst begon Jacqueline met een algemeen verhaal over het preserveringsbeleid mbt het E-depot. Volgens het GAR is preservering voor het E-depot te omschrijven als: “Het geheel van activiteiten dat zorgt voor het technische en intellectuele behoud van digitale informatieobjecten” (door het GAR veracronimiseerd tot dio’s). Jacqueline bekeek het preserveringsbeleid vanuit een strategisch en vanuit een tactisch perspectief. Bij het eerste perspectief viel op dat er veel aandacht is voor de dienstverleningskant en bij het tweede was het interessant te zien dat er per bron een afweging van inhoud versus kosten werd gemaakt, alvorens te “preserveren”. Helaas was er geen tijd meer om te vragen om het GAR een rekenmodel had voor deze afweging.

Het volgende deel van de presentatie werd gehouden door Jacob en ging over Technology Watch (TW). Het doel van TW is om inzicht te krijgen in de technologische componenten die opgenomen (gaan) worden in het E-depot, op basis waarvan activiteiten ondernomen kunnen worden. Monitoring en actie, dus. Men wil door samenwerking deze kennis delen op zowel op nationaal, als op internationaal niveau.

Daarna werd een voorbeeldje van “digitale archeologie” gegeven door Mette. Het was het verhaal van de reconstructie van een aantal jaar geleden ontworpen driedimensionaal computermodel van het standbeeld van Erasmus, waarbij oude programma’s opgespoord, structuren herbouwd, gedrag opnieuw ingericht en verwijzingen opnieuw aangemaakt moesten worden. Er kon al weer een behoorlijk volledige Erasmus getoond worden. Wel leek het alsof er hier en daar "gaten" in de mantel gevallen waren, alsof de mot er in zat. De “restauratiewerkzaamheden” zijn dan ook nog in volle gang.
Een interessant voorbeeld van een situatie die je wil voorkomen. Dat was ook de conclusie van het preserveringsteam: voorkomen is beter dan genezen.

Zie de E-depot site van het GAR voor alle presentaties.

ED3
Josje Evertse was zo vriendelijk om op korte termijn te zorgen voor een gelegenheid voor het LOPAI om iets te vertellen over ED3. Tijdens de lunchpauze hield ik een korte presentatie over ED3 en het gebruik ervan door de Provinciale Archiefinspecties.

Ondanks het ongunstige tijdstip trok het toch nog een halve zaal en leverde ook wat discussie op:

  • Hoe kan het dat enkele provincies ‘breed toetsen’ en de meeste andere ‘beperkter’?
    Daarmee werd een verband gelegd tussen ED3 en de nieuwe Beleidsregel Vervanging (het vervangen van het papieren origineel door een digitaal origineel) van de provincies, die 2 varianten kent. De ene variant stopt bij het toetsen van de vervangingsprocedure zelf (het zgn. Handboek Vervanging), terwijl de andere het toetsen van de beheersomgeving meeneemt (waarbij ED3 gebruikt moet worden). Zie ook de opmerking van Ingmar op de blog van Inge Angevaare.
    De vragenstelster was overigens voor een brede toetsing, wat ook gehoor vond bij een groot deel van het publiek.

  • Zijn de gemeenten wel voldoende geëquipeerd om ED3 aan te kunnen pakken?
    Eén diensthoofd stelde dat als gemeenten of kleine archief­diensten een klimaatinstallatie kunnen beheren, dan kan men ook een E-Depot beheren. Een collega-inspecteur zei daarop dat menig gemeente al moeite heeft met het uitlezen en interpreteren van een datalogger, laat staan zoiets complex als een E-Depot kan opzetten. Samenwerking is de sleutel voor beheer. Dit zou ook het LOPAI graag zien: niet per organisatie een minimaal ingericht E-depot, maar een paar grote, goed ingerichte organisaties die dit oppakken.


Terminologie
Tot slot ben ik even ingegaan op het verschil in terminologie tussen ED3 en het door het GAR gehanteerde TRAC (zoals in de presentatie van Jacqueline te zien was). In eerste instantie hadden wij als LOPAI in de vertaling van TRAC de op OAIS gebaseerde engelse termen SIP, AIP en DIP gehandhaafd. OAIS is nog niet vertaald en toch niet meer weg te denken uit het elektronisch archiefbeheer. Op verzoek van onze "klankbordgroep" hebben we de termen toch maar wel vertaald (maar de originele TRAC/OAIS-term er wel steeds bij vermeld) om het draagvlak voor ED3 te verhogen in het veld. In goed Nederlands: wat de boer niet kent, dat eet hij niet. Dus zorg ervoor dat er iets herkenbaars op tafel komt.

vrijdag 20 juni 2008

Vergelijkende studie over e-Journal Archiving Solutions van JISC

Deze maand is er een interessante studie van het Britse Joint Information Systems Committee (JISC) uitgekomen op het gebied van repositories/e-depots in een wetenschappelijke/bibliothecaire omgeving.

Een paar citaten uit de inleiding en samenvatting:
This report is the result of a call by the JISC, issued in January 2008, for a Comparative Study of e-Journal Archiving Solutions. The report has been created by reviewing existing published work in this area, by consulting with key players including existing service providers, and by holding a one day workshop at the University of Manchester on 14th April.

Although there are many obvious benefits that accrue from publishing and accessing academic papers through the internet, there are costs and challenges associated with long term preservation and access which urgently need to be addressed. Finding solutions to these is the shared responsibility of all in the information chain, including authors, publishers, repository managers, librarians, subscription agents and aggregators.
En deze is heel interessant:
E-journal archiving solutions must demonstrate sound financial and organisational sustainability and technical insight and expertise, in order to earn the trust of, and acceptance by, librarians and the majority of academic publishers.
Dat lijkt erg op een uitgangspunt voor E-Depots, zoals ED3 dat stelt in, met name, de onderdelen A1, A2, A4 en C1.

Lees meer hierover op de blog van één van de schrijvers van de studie.

vrijdag 6 juni 2008

ED3 in de media

Even een 'linkdump' met websites die naar ED3 verwijzen:

LOPAI (uiteraard)
Archiefforum
de Volkskrant
Archieven en journalistiek
NCDD
Informatieprofessional
Digitaal Duurzaam (de andere Nederlandse weblog over digitale duurzaamheid)

Presentatie bij de KVAN

Afgelopen woensdag heb ik tijdens de studiedagen van de KVAN ED3 aangeboden aan Martin Berendse, de directeur van het Nationaal Archief.
De reacties van Berendse en de rest van de zaal waren zeer positief.
Hier de sheets van mijn presentatie:

maandag 19 mei 2008

Aanvulling op ED3: kan het PLATTER?

Eind maart heeft DigitalPreservationEurope (DPE) een tool geïntroduceerd die aanvullend moet zijn op de bestaande tools voor audit en certificatie van e-depots:

Planning Tool for Trusted Electronic Repositories (PLATTER)

PLATTER wordt als volgt beschreven:

...[it] is not in itself an audit or certification tool but is rather designed to complement existing audit and certification tools by providing a framework which will allow new repositories to incorporate the goal of achieving trust into their planning from an early stage. A repository planned using PLATTER will find itself in a strong position when it subsequently comes to apply one of the existing auditing tools to confirm the adequacy of its procedures for maintaining the long term usability of and access to its material.

(Download PLATTER in pdf.)

Als PLATTER aansluit op de eisen van ED3, kan het voor de Archiefinspectie een toetssteen zijn voor de vraag of de organisatie van het E-depot kan aantonen dat de bewaarstrategieën effectief zijn.

SD-SCDF

Afkortingen en acroniemen blijven toch essentieel bij digitale duurzaamheid.
Ik las vandaag dat SNIA (Storage Networking Industry Association) werkt aan een nieuwe standaard voor het langdurig bewaren van digitale informatie: SD-SCDF, wat staat voor Self-Describing Self-Contained Data Format.
De standaard combineert het AIP uit OAIS met XAM (eXtensible Acces Method). De demo voor XAM is erg Amerikaans, maar wel 'pakkend'. Vooral de vergelijking met een 'parking valet' vind ik mooi.

SD-SCDF definieert een logische container, die 'het bestand' en de bijbehorende metadata - zoals verwijzingsinformatie, integriteitsinformatie, audittrail en nog veel meer- omvat.

Dit lijkt op de ontwikkeling van een standaard ODA / AIP.
Zie verder ook 100 year archive task force

Via Records Mgmt & Archiving.

zaterdag 17 mei 2008

ADA-ODA-BDA


Omdat we per sé een Nederlandse 'checklist' wilden maken - dat wil zeggen Nederlandstalig en gebaseerd op de Nederlandse wetgeving - is een van de 'neveneffecten' van ED3 dat we ook geprobeerd hebben de OAIS-modellen te vertalen.
Het plaatje hiernaast is de vertaling (en een beetje een versimpelde weergave) van het beroemde functioneel-model uit OAIS.

Het meest controversieel zullen de termen ADA, ODA en BDA zijn, als 'vertaling' van SIP, AIP en DIP.


Aangeboden digitaal archiefstuk (ADA)
Digitaal archiefstuk (DA), zoals de archiefvormer het aanbiedt aan het depot. Hiertoe wordt het door de zorgdrager verwijderd uit zijn “gecontroleerde omgeving” en aangeleverd aan het depot. De bijbehorende (soorten) metadata worden door de dienst, in overleg met de zorgdrager vastgesteld.
Als de informatie afkomstig is van de overheid moet die voldoen aan de eisen van de archiefwetgeving. In de praktijk wordt dit gewaarborgd door de kwaliteit van de gebruikte RMA en de organisatie daar omheen. Bij de metadata worden onder meer de (institutionele) herkomst, gerelateerde bedrijfsprocessen, technische beperkingen en openbaarheidsbeperkingen vastgelegd. De controle van de kwaliteit van de RMA valt onder de verantwoordelijkheid van de archivaris en buiten de eigenlijke toetsing van ED3.
OAIS-term: Submission Information Package (SIP).

Overgedragen digitaal archiefstuk (ODA)
Aangeboden digitaal archiefstuk (ADA), zoals het in verschillende representaties in het depot wordt opgenomen en bewaard voor de lange termijn. Het archiefstuk met de bijbehorende metadata is zodanig vormgegeven en beschreven, dat het in goede, geordende en toegankelijke staat beheerd kan worden.

Bij de opname wordt gecontroleerd of het ADA voldoet aan de eisen van de archiefwetgeving. Indien dat nodig en mogelijk is, worden onvolkomenheden hersteld.
Daarnaast worden formaat en metadata aangepast aan duurzame opslag en beheer. Dit kan betekenen dat samengestelde informatie in onderdelen uiteen wordt genomen, waarbij de onderlinge relatie wordt geregistreerd, maar ook dat samenhangende informatie als één geheel wordt beheerd.
De verschillende representaties worden gezamenlijk als één logische eenheid samengebonden door de relatie-informatie en ontsloten en beheerd door middel van de ontsluitingsinformatie.
OAIS-term: Archival Information Package (AIP).

Beschikbaar digitaal archiefstuk (BDA)
Overgedragen digitaal archiefstuk (ODA) dat op aanvraag van gebruikers aangeboden wordt. Het bevat die metadata, die nodig zijn om de gebruikers vertrouwen te geven in de integriteit en authenticiteit van het archiefstuk én hen in staat te stellen om het te raadplegen. Vorm, structuur en metadata van het BDA hoeven niet identiek te zijn aan die van het ODA.
Het BDA bestaat feitelijk uit een authentieke kopie van het ODA, maar kan op basis van de vraagstelling ook als uittreksel of samengevoegde informatie worden aangeboden.
OAIS-term: Dissemination Information Package (DIP).

Het zou me niet verbazen als dit straks enige controverse gaat opleveren.

Binnenkort hopelijk meer over de finesses van het ODA.

vrijdag 16 mei 2008

ED3 nadert zijn eerste voltooiing

De afgelopen weken (voor en soms ook tijdens de vakantie) hebben we de voorlaatste hand gelegd aan versie 1 van ED3. De verwachting is dat voor het eind van mei de definitieve eerste versie opgeleverd kan worden.
Dat is mooi, want tijdens de KVAN studiedagen op 3 en 4 juni zal ik ED3 presenteren.
De komende weken gaan we nadenken over de manier waarop we ED3 willen verspreiden en gebruiken. Misschien kan deze weblog daar nog een rol in spelen.