PDF/A Format als Schlüssel zur Langzeitarchivierung digitaler Dokumente

Bereits vor einigen Wochen haben wir in unserem Blogartikel zu den Aufbewahrungsfristen in Deutschland festgestellt, dass sehr hohe Ansprüche an die Aufbewahrung von Dokumenten gestellt werden. In Paragraph 147 der Abgabenordnung ist dazu festgehalten, dass alle Unterlagen, die für die Besteuerung eines Steuerpflichtigen relevant sind, aufzubewahren sind. Je nach Inhalt können dies auch Dokumente im PDF-Format sein.

Das Portable Document Format (PDF) ist im Geschäftsumfeld seit Jahren als plattformunabhängiges Dateiformat gesetzt. Angebote, Verträge und Rechnungen erreichen Unternehmen täglich in einer Vielzahl in besagtem Format. Wenn es um die Langzeitarchivierung von Dokumenten geht, hat das einfache PDF-Format allerdings einen entscheidenden Nachteil: aufgrund der technischen Spezifikationen von PDFs, kann nicht sichergestellt werden, dass diese auch nach Jahren noch lesbar sind. Vor über 15 Jahren schlossen sich daher die AIIM (Association for Information and Image Management) und die NPES (National Printing Equipment Association) mit Ziel der Schaffung eines stabilen Standardformats für digital archivierte Dokumente zusammen. Das Ergebnis: das PDF/A Format.

Eine Schnellübersicht: diese PDF/A Formate gibt es

PDF/A ist ein Format zur Langzeitarchivierung digitaler Dokumente. Hinter dem Format verbirgt sich der ISO-Standard 19005 aus dem Jahr 2005. Obwohl die Nutzung von PDF/A nicht vorgeschrieben ist, hat sich das Format weltweit als Standard für die Langzeitarchivierung durchgesetzt. Im Laufe der Zeit wurde das Format in verschiedenen Normen weiter ausgearbeitet, um die Nutzbarkeit in der Praxis zu verbessern. Heute gibt es mit PDF/A-1, PDF/A-2 und PDF/A-3 daher insgesamt drei Ausprägungen der ursprünglichen ISO-Norm. Alle definieren mit einem unterschiedlich hohen Grad an Restriktion, welche Bestandteile eines PDFs für die Langzeitarchivierung zwingend erforderlich oder gar verboten sind.

PDF/A-1

Das PDF/A-1 Format wurde 2005 auf Basis von PDF 1.4 eingeführt und ist das restriktivste der drei Formate. Es besteht aus zwei Ebenen: PDF/A-1b für die visuelle Reproduzierbarkeit und PDF/A-1a für die visuelle Reproduzierbarkeit ergänzt um die Abbildbarkeit nach Unicode und die inhaltliche Strukturierung. Zentrale Eigenschaften sind:

  • Abbildung von Text nach Unicode (PDF/A-1b)
  • Einbettung von Zeichensätzen innerhalb des Dokuments
  • Einbettung von klar definierten Farbräumen
  • Keine aktiven Elemente (bspw. JavaScript)
  • Keine Einbettung von externen Dateien und Bildformaten (CCITT, JBIG2, JPEG)
  • Keine Transparenzen

PDF/A-2

PDF/A-2 wurde 2011 auf Basis von ISO Standard 32000-1/PDF 1.7 eingeführt. Ziel des Formats ist es, die Nutzbarkeit zu erhöhen ohne Einbußen bei der Reproduzierbarkeit hinzunehmen. Zentrale Erweiterung zu PDF/A-1 sind:

  • Einbettung von Bildformaten JPEG2000
  • Einbettung von A‐1 und A‐2 Dateien möglich
  • Transparenzen erlaubt
  • Einbettung von optionalen, PDF/A-konformen Inhalten möglich

PDF/A-3

Das PDF/A-3 Format wurde 2012 veröffentlicht. Grund für die Veröffentlichung ist die in Teilen umstrittene Möglichkeit auch nicht PDF/A konforme Inhalte wie Excel-, Word-, XML- Video- oder Audiodateien einzubetten. Die Möglichkeit beliebige Daten einzubetten ist die einzige wesentliche Änderung im Vergleich zum PDF/A-2 Format. Mit der Option auch XML-Dateien PDF/A-konform einzubetten hat die Norm die Grundlage für den ZUGFeRD Standard gelegt. ZUGFeRD ist ein Rechnungsformat für elektronische Rechnungen, das aus einer visuellen Darstellung im PDF/A-3 Standard und einer maschinenlesbar codierten XML-Datei besteht.

Welches Format nutze ich wann?

Alle drei PDF/A Formate sind gültig und in Kraft. Das PDF/A-3 Format sollte nur dann eingesetzt werden, wenn nicht PDF/A-konforme Inhalte eingebettet werden sollen. Falls dies nicht der Fall ist, reicht das PDF/A-2 Format aus. Ähnlich verhält es sich mit dem PDF/A-1 Format. Wenn Unternehmen auf die zusätzlichen Funktionen von PDF/A-2 verzichten können, ist das PDF/A-1 Format auch nach über 10 Jahren die passende Wahl für die Langzeitarchivierung von Dokumenten.

PDF/A oder TIFF: welches Format eignet sich besser für die Archivierung?

Für lange Zeit war TIFF das dominierende Dateiformat im Bereich der Langzeitarchivierung. Mit steigenden Anforderungen an den Aufbau der Dokumente haben sich allerdings schnell einige Nachteile des Formats herauskristallisiert. So garantierten TIFF-Archive zwar die Reproduzierbarkeit von Dokumenten, allerdings ist das Suchen über eine Volltextsuche nur mit nachträglicher Überarbeitung mit einer OCR-Maschine möglich. Hinzu kommt, dass TIFF-Dateien wesentlich größer sind als PDF-Dateien und daher ein Vielfaches an Speicherplatz benötigen. Letztendlich steckt hinter jeder PDF/A-Datei eine PDF-Datei. Durch die weltweit enorm große Akzeptanz des Formats, können Unternehmen daher auch auf eine Vielzahl von teils kostenlosen Tools und Lösungen zurückgreifen. Auch wenn TIFF-Archive weiterhin durchaus verbreitet sind, hat sich das PDF/A Format als absoluter Standard für die Langzeitarchivierung etabliert. Das Format bietet Unternehmen völlig unabhängig von Betriebssystemen oder eingesetzter Software die größtmögliche Compliance-Sicherheit und wird zudem regelmäßig weiterentwickelt.#

PDF/A Format
Migration von Dokumenten in das PDF/A Format im Überblick

PDF/A und Dokumentenmanagement: darauf gilt es zu achten

Die verschiedenen PDF/A Formate spielen auch im Umfeld des Dokumentenmanagements eine zentrale Rolle. Das Umwandeln von verschiedenen Dateitypen in das PDF/A Format gehört zu den zentralen Funktionen jeder professionellen DMS-Software. Doch PDF/A allein kann keine Langzeitarchivierung garantieren. Vielmehr schafft das Format durch spezielle Anforderungen an elektronische Dokumente die Grundlage für eine Langzeitarchivierung. Unternehmen müssen das Format dafür jedoch im Rahmen eines Archivierungskonzepts richtig einsetzen und in das Unternehmen integrieren. Aspekte, die es zu beachten gilt, sind beispielsweise interne Compliance Richtlinien, Abläufe von Geschäftsprozessen sowie die eingesetzte Hard- und Software. So hilft das PDF/A Format allein nur wenig, wenn die Dokumente im Endeffekt auf unverlässlichen Datenquellen abgelegt werden. Genauso wenig hilft das PDF/A Format allein, wenn die Dokumente nicht über eine Dokumentenmanagement-Software verwaltet, aufbewahrt und zu einem späteren Zeitpunkt bereitgestellt werden können. Wie gesagt: PDF/A schafft die Grundlage für die Langzeitarchivierung von Dokumenten, der Rest liegt bei Ihnen…und Ihrem DMS-Hersteller!

Mehr über Dokumentenmanagement erfahren