ANNONSER

Sanna2

PDF/A- konvertering som blev omvandling

Konvertering till arkivbeständiga PDF/A har visat sig innehålla en del frågetecken. Susanna Winkler, expert på digital arkiv- och informationshantering rätar ut begreppen och blickar framåt.

PDF är ett populärt format för digitala dokument eftersom det tillåter flexibilitet i skapande, hantering, läsning och lagring av dokument. Det har vuxit fram ett behov av att utveckla PDF till att även omfatta ett beständigt format som passar för långtidslagring. PDF/A bevarar ett dokuments visuella utseende över tid, oberoende av de verktyg och system som används för att skapa, lagra och tolka filerna. Detta innebär att man kan öppna och läsa filen oberoende av om det är om 5, 50 eller 500 år.

PDF/A är ett begränsat filformat som bygger på Adobe PDF version 1.4. Förenklat sett kan man säga att PDF/A förbjuder vissa funktioner som finns i andra PDF-versioner som kan hindra långtidslagring. När det gäller PDF/A krävs en exceptionellt hög standard och innehållet måste alltid visas på exakt samma vis över en lång tid. Därför finns det begränsningar när det gäller funktioner som bilder, ljud, rörlig bild och fonter i PDF/A. På så vis är PDF/A en enklare version av PDF utan komplicerade element.
PDF/A finns som PDF/A-1, PDF/A-2 och PDF/A-3. De två sistnämnda tillåter fler funktioner än PDF/A-1 och passar väl för handlingar där man behöver ha med avancerade funktioner och som man vill bevara över en lång tid. A-2 och A-3 passar dock ännu inte för arkivering där man siktar på ett ännu mer långsiktigt bevarande. A-2 och A-3 är således inte PDF-format som utvecklats för att ersätta A-1, de lever parallellt med A-1 och erbjuder ett alternativ för företag och organisationer som vill bevara sin information för framtiden på ett bestående sätt. Riksarkivet har i nuläget endast godkänt formatet PDF/A-1 för långtidslagring men undersöker om även A-2 och A-3 kan godkännas i framtiden.
PDF/A-dokument kan uppfylla standarden till olika grad. Man talar om överensstämmelsenivåer eller kvalifikationsnivåer, nivå A och B. PDF/A-1a uppfyller alla krav i standarden och bibehåller dokumentets logiska och semantiska egenskaper och passar att använda när man själv har kontroll över det digitala skapandet. PDF/A-1b har en lägre grad av överenstämmelse och bibehåller utseende men inte de strukturella eller semantiska egenskaperna.

Det finns flera program på marknaden som konverterar från PDF till PDF/A, men de klarar av olika mycket. De fria program som finns klarar dessvärre ofta inte ens av att konvertera till nivå B. Hur bra ett konverteringsverktyg är beror på hur många förbjudna fel verktyget klarar av att omforma för att göra dokumentet kompatibelt med PDF/A utan att någon anmärkningsvärd informationsförslut sker. Vissa fel går inte att konvertera alls hur bra verktygen än är. Ibland kan viss manuell korrigering krävas, särskilt om grunddokumentet är komplicerat. Man kan dock undvika manuell hantering efter konvertering genom att känna till vilka förbjudna karakteristika som PDF/A inte tillåter och därmed från början skapa dokument som inte bryter mot förbuden. Kanske ska man tala om PDF/A-omvandling istället för konvertering då konverteringsverktygen faktiskt omvandlar icke-kompatibla element till kompatibla med förhoppningsvis endast en försumbar informationsförlust som följd.
Det råder en viss förvirring på marknaden vad gäller konvertering och validering. PDF/A-standarden har tolkats olika av leverantörer varför valideringsrapporter från konvertering ibland ger varierande eller olika resultat. ”Problemet är att det inte finns några objektiva kriterier för vad som är korrekt PDF/A, och därmed är alla framställningar av PDF/A en variation av PDF/A–specifikationen”, skriver Benjamin Yousefi på Riksarkivets webbplats. Det är därför inte helt enkelt att som konsument förstå vilka produkter som man ska använda.
Generellt gäller dock principen att leverantören ska ha deklarerat att de uppfyller kraven i PDF/A-standarden och att programmet klarar av konvertering med endast en försumbar informationsförlust. Genom att studera konverteringsrapporten och de visuella indikatorerna kan man kontrollera en del av konverteringen och på så vis avgöra om informationsförlust har skett eller inte. Indikatorerna pekar ut vad verktyget har hittat för fel i dokumentet och rapporten anger vilken åtgärd systemet har gjort. Hur rapporterna presenteras skiljer sig åt mellan olika system och en viss inläsning av den tekniska bakgrunden om PDF kan behövas för att förstå vad det är som man kontrollerar.

Flera frön till idéer kring ett objektivt valideringsverktyg finns inom projektet Preforma (http://www.preforma-project.eu/). Verktygen är ännu inte klara och kommer att ta ett par år att utveckla då projektet precis påbörjat en upphandling för att hitta leverantörer som vill utveckla sådana produkter. Ska vi då vänta med att ställa om vår digitala produktion tills objektiva verktyg finns? Nej, skulle jag svara. Idag är det svårt att hitta en myndighet som inte hanterar elektroniska handlingar och dokument. Därför ska vi inte undvika att redan nu använda oss av arbetsprocesser som innehåller moment av konvertering till arkivbeständiga format även om förutsättningarna kan komma att ändras i framtiden. 

”Det råder en viss förvirring på marknaden vad gäller konvertering och validering.”

Bildtext: Inom informationshantering har ”A” i PDF/A fått betydelsen ”archivable”

Text Susanna Winkler susanna.winkler@arkivit.se Foto ArkivIT

ANNONSER