FÅ HELE DOKUMENTET MED I MIGRERINGEN

Hvis vi skal migrere digitale dokumenter, er vi nødt til at være meget præcise om hvad et dokument er, så vi får det hele med. Risikoen ved ikke at være præcise er, at dokumenterne mister deres integritet under migreringen. Vi dykker ned i problemstillingen.

Migrere dokumenter eller data

Begrebet ustruktureret data bruges ofte om digitale dokumenter. Det dækker over at – modsat fx økonomidata – står informationen i dokumenterne ikke i tabeller i databaser, men er indlejret i tekst, og denne tekst er i filer som fx en Word-fil. De fleste vil derfor straks se for sig, at det at flytte strukturerede data og ustrukturerede data, er helt hvert sit. I første tilfælde flytter man data fra en tabel til en anden, mens i andet tilfælde flytter man nogle filer.

Der er bare mere til historien. Det vi i daglig tale kalder et dokument – altså for eksempel en Word-fil – er indholdet, eller på engelsk, som præger fagsproget på det her område, content. Et dokuments content (indhold) kan være alt muligt; Lyd, billeder eller video sågar sms’er eller tweets osv., og det kan i øvrigt bestå af flere komponenter (filer). Content  er altså indholdet af dokumentet.

Men når vi taler om migrering af digitale dokumenter, er det sædvanligvis fra et dokumentstyringssystem til et andet, og i et sådant system opbevarer man udover indholdsfilen også metadata. Metadata  kan beskrive dokumentet, beskrive den kontekst dokumentet er blevet til i, dokumentere dokumentets historik og meget andet. Metadata bruges i hverdagen også til at fremsøge dokumenter på men har altså en anden og dybere funktion, dom vi kigger dybere i, i næste afsnit.

Vi er nu i stand til at præcisere, hvad et dokument er:

Et dokument består både af content (indhold) og tilhørende metadata.

Dette betyder så, at når man skal flytte dokumenter, er der altså både filer og metadata at flytte. En dokumentmigrering er altså fundamentalt anderledes end en ”normal” datamigrering, idet den udover migreringen af metadata, der er strukturerede, også har indholdsfil(er) – og disse to komponenter har en sammenhæng, der skal bevares.

Mange kalder dokumentmigrering for datamigrering. Det kan man gøre som man vil – vi siger bare migrering. Man skal bare huske, at når det er dokumenter, man migrerer, så er der BÅDE filer OG metadata at migrere.

BETYDNINGEN AF METADATA

Metadata er det, der hjælper os med at fremsøge dokumenter i det nye dokumenthåndteringssystem. Fra et brugerperspektiv er det altså helt utroligt væsentligt at metadata er gode, ensartede og beskrivende for det forretningsområde, man nu beskæftiger sig med.

Det er utroligt væsentligt, men det er ikke den pointe vi vil frem til. Vi vil se på nogle andre typer metadata. Der er på alle dokumenter metadata, som er med til at give dokumentet kontekst og dermed autenticitet. Det kræver nærmere forklaring:

Når et dokument oprettes i et system, skaber de fleste systemer automatisk metadata som creation date og creator. Det kan man sædvanligvis ikke fifle med, og det tidsstempel kan altså bidrage til at bevise at dokumentet er lavet af denne person netop da. Det er altså med til at give dokumentet autenticiet.

Der er mange andre eksempler på metadata som har en tilsvarende central betydning ift. at sætte dokumentet formelt i den rette kontekst. Skulle dokumentet miste disse data ved migreringen eller hvis der migreres på en måde, så man kan betvivle bagefter om der er fiflet med disse data, så har dokumentet ikke længere samme pålidelighed. Man taler om at dokumentet har mistet sin integritet.

I nogle situationer er det træls – i andre situationer er det en katastrofe. Det er væsentligt at få afgjort hvilke metadata der er betydende for dokumentets integritet og sikre at de migreres ordentligt. Det er også centralt at gøre sig klart hvilke regulatoriske vilkår, man arbejder under. I nogle brancher risikerer man simpelthen at miste tilladelser til at drive dele af sin forretning.

Konklusion – OG OPRÅB

Det er den allermest basale forudsætning for at dokumentets integritet kan bevares ved en migrering, at vi forholder os til, hvad dokumentet helt præcist er.

Et dokument har altså to væsentlige komponenter, nemlig en (eller flere) indholdsfil(er) og tilhørende metadata. Indholdsfilerne skal identificeres. Og det samme skal metadata.

Blandt metadata skal vi identificere hvilke metadata, der er betydende ift. dokuments integritet, så vi kan være særligt påpasselige.

Det er desværre noget, der ganske ofte ikke sker inden en migrering påbegyndes. I værste fald får det den fuldstændigt katastrofale konsekvens, at dokumenterne efter operationen ikke længere har værdi.