PDF/A Format: Das A und O der Langzeitarchivierung

Veröffentlicht 31.05.2024

Doreen Andrieu Werkstudentin Marketing d.velop

In der Welt der digitalen Dokumente ist das PDF-Format ein echter Star – aber kennst du auch sein weniger bekanntes, aber ebenso wichtiges Geschwisterchen: das PDF/A Format? 

Um Papier zu ersetzen, greifen viele auf die Digitalisierung in ein PDF-Format zurück. Das Portable Document Format (PDF) ist im Geschäftsumfeld seit Jahren als plattformunabhängiges Dateiformat gesetzt. Angebote, Verträge und Rechnungen erreichen Unternehmen täglich in einer Vielzahl in besagtem Format. PDF ist allgegenwärtig und bekannt für seine Formatkonsistenz – was bedeutet, dass das Layout und die Formatierung des Dokuments unabhängig von den verwendeten Werkzeugen oder Systemen bei der Erstellung, Speicherung und Reproduktion stets einheitlich bleiben. 

Welche Aufbewahrungsfristen gilt es zu beachten?

Doch auch bei der Digitalisierung darf die Einhaltung von Aufbewahrungsfristen nicht zu kurz kommen. In Deutschland werden sehr hohe Ansprüche an die Aufbewahrung von Dokumenten gestellt. In Paragraph 147 der Abgabenordnung ist dazu festgehalten, dass alle Unterlagen, die für die Besteuerung eines Steuerpflichtigen relevant sind, aufzubewahren sind. Je nach Inhalt können dies auch Dokumente im PDF-Format sein.

Während die Beliebtheit und Vertrautheit mit dem PDF-Format weit verbreitet sind, wird bei der Langzeitarchivierung von Dokumenten ein entscheidender Nachteil deutlich: Aufgrund der technischen Spezifikationen von PDFs kann nicht sichergestellt werden, dass sie auch nach Jahren noch lesbar sind. 

Was bedeutet der Zusatz „A“ im PDF/A-Format und wann ist der Einsatz ratsam?

Mit dem Ziel, ein stabiles Standardformat für digital archivierte Dokumente zu schaffen und das Problem der Langzeitlesbarkeit von herkömmlichen PDF-Dokumenten anzugehen, haben sich die AIIM (Association for Information and Image Management) und die NPES (National Printing Equipment Association) zusammengetan. Das Ergebnis war das PDF/A-Format. Das „A“ steht für „Archivable“, was darauf hinweist, dass die Dokumente den Anforderungen an die Langzeitarchivierung entsprechen müssen. 

PDF/A („Portable Document Format Archivable“) ist demnach ein Format zur Langzeitarchivierung digitaler Dokumente, das auf dem ISO-Standard 19005 aus dem Jahr 2005 basiert. Obwohl die Nutzung von PDF/A nicht vorgeschrieben ist, hat sich das Format weltweit als Standard für die Langzeitarchivierung durchgesetzt. Im Laufe der Zeit wurde das Format in verschiedenen Normen weiter ausgearbeitet, um die Nutzbarkeit in der Praxis zu verbessern. Heute gibt es mit PDF/A-1, PDF/A-2 und PDF/A-3 daher insgesamt drei Ausprägungen der ursprünglichen ISO-Norm. Alle definieren mit einem unterschiedlich hohen Grad an Restriktion, welche Bestandteile eines PDFs für die Langzeitarchivierung zwingend erforderlich oder gar verboten sind. 

Während herkömmliche PDFs aufgrund ihrer Abhängigkeit von externen Ressourcen, fehlender Archivierungsstandards, technologischer Veraltung und ungewisser Langzeitlesbarkeit für die Langzeitarchivierung problematisch sein können, wurde das PDF/A-Format speziell dafür entwickelt. Es erfüllt strikte Anforderungen, um die Lesbarkeit und Integrität von archivierten Dokumenten über lange Zeiträume hinweg sicherzustellen. 

Ein PDF/A eignet sich also besser, wenn es um die effektive und langfristige Archivierung elektronischer Dokumente geht. 

Entdecke die Vielfalt von PDF/A: Ausprägungen und Kernmerkmale im Überblick

PDF/A-1

Das Format wurde 2005 auf Basis von PDF 1.4 eingeführt und ist das restriktivste der drei Formate. Es besteht aus zwei Ebenen: PDF/A-1b für die visuelle Reproduzierbarkeit und PDF/A-1a für die visuelle Reproduzierbarkeit, ergänzt um die Abbildbarkeit nach Unicode und die inhaltliche Strukturierung. Zentrale Eigenschaften sind: 

  • Abbildung von Text nach Unicode (PDF/A-1b) 
  • Einbettung von Zeichensätzen innerhalb des Dokuments 
  • Einbettung von klar definierten Farbräumen 
  • Keine aktiven Elemente (bspw. JavaScript) 
  • Keine Einbettung von externen Dateien und Bildformaten (CCITT, JBIG2, JPEG) 
  • Keine Transparenzen 

PDF/A-2

PDF/A-2 wurde 2011 auf Basis von ISO Standard 32000-1/PDF 1.7 eingeführt. Ziel des Formats ist es, die Nutzbarkeit zu erhöhen, ohne Einbußen bei der Reproduzierbarkeit hinzunehmen. Zentrale Erweiterung bezogen auf den Vorgänger sind: 

  • Einbettung von Bildformaten JPEG2000 
  • Einbettung von A‐1 und A‐2 Dateien möglich 
  • Transparenzen erlaubt 
  • Einbettung von optionalen, PDF/A-konformen Inhalten möglich 

PDF/A-3

Das PDF/A-3 Format wurde 2012 veröffentlicht. Grund für die Veröffentlichung ist die in Teilen umstrittene Möglichkeit auch nicht PDF/A konforme Inhalte wie Excel-, Word-, XML- Video-oder Audiodateien einzubetten. Die Möglichkeit beliebige Daten einzubetten ist die einzige wesentliche Änderung im Vergleich zum PDF/A-2 Format. Mit der Option auch XML-Dateien PDF/A-konform einzubetten, hat die Norm die Grundlage für den ZUGFeRD Standard gelegt. ZUGFeRD ist ein Rechnungsformat für elektronische Rechnungen, das aus einer visuellen Darstellung im PDF/A-3 Standard und einer maschinenlesbar codierten XML-Datei besteht.

Inhaltliche Beschränkungen für PDF/A-Dateien, die du kennen solltest

Wie bereits erwähnt gibt es Bestandteile, die eine PDF/A-Datei nicht enthalten darf. Sogenannte nicht konforme Inhalte sind neben den bereits erwähnten Excel-, Word-, XML- Video- oder Audiodateien auch aktive Inhalte wie JavaScript, verschlüsselte Dateien und externe Verweise auf Ressourcen, die nicht in der PDF-Datei selbst enthalten sind. Diese Einschränkungen gelten hauptsächlich für PDF/A-1 und PDF/A-2 und dienen dazu, die langfristige Lesbarkeit und Integrität der Dokumente zu gewährleisten. 

Wann ist welches Format die beste Wahl?

Alle drei der zuvor genannten Formate sind gültig und in Kraft. Das PDF/A-3 Format sollte nur dann eingesetzt werden, wenn nicht PDF/A-konforme Inhalte eingebettet werden sollen. Falls dies nicht der Fall ist, reicht das PDF/A-2 Format aus. Ähnlich verhält es sich mit dem PDF/A-1 Format. Wenn Unternehmen auf die zusätzlichen Funktionen verzichten können, ist das Format auch nach über 10 Jahren die passende Wahl für die Langzeitarchivierung von Dokumenten.  

Infografik zeigt die Funktionen der verschiedenen PDF/A Formate

5 wichtige Vorteile des PDF/A-Formats

  1. Langfristige Erhaltung: PDF/A gewährleistet, dass Dokumente auch nach vielen Jahren noch lesbar und unverändert sind. Alle notwendigen Ressourcen und Elemente sind im Dokument selbst eingebettet, sodass es unabhängig von externen Links oder Dateien ist. 
  2. Zuverlässigkeit: Es handelt sich um ein standardisiertes Format, das von vielen Softwareanwendungen unterstützt wird. Durch die Einbettung der Ressourcen entfällt die Abhängigkeit von externen Links oder Dateien, was das Risiko des Verlusts wichtiger Informationen minimiert.
  3. Plattformunabhängigkeit: PDF/A-Dokumente können auf verschiedenen Plattformen und Betriebssystemen geöffnet und identisch angezeigt werden. Dies gewährleitet Konsistenz und Verlässlichkeit.  
  4. Integrität: Integrität und Authentizität von Dokumenten können gewährleistet werden. Dokumente in diesem Format sind unveränderlich, was ideal für die Einhaltung rechtlicher und Compliance-Anforderungen ist.
  5. Such- und Indexierbarkeit: PDF/A-Dokumente können textbasiert sein, was bedeutet, dass der Text innerhalb des Dokuments durchsuchbar und von Suchmaschinen sowie Datenbankanwendungen erfasst und katalogisiert werden kann. Dies erleichtert das Auffinden und Extrahieren von Informationen aus archivierten Dokumenten.
Infografik zeigt 5 PDF-Formate

5 PDF-Formate: PDF/X, PDF/A und PDF/E, PDF/UA, PDF/VT 

Konvertierung von Standard-PDFs in das PDF/A-Format

Wie verwandle ich eine gewöhnliche PDF-Datei in ein PDF/A? Diese Frage ist entscheidend für die Anwendung dieses speziellen Archivierungsformats. 

Dieser Prozess erfordert eine spezialisierte Software oder ein Tool, das diese Konvertierung unterstützt. Auch im Umfeld des Dokumentenmanagements spielen die verschiedenen Formate eine zentrale Rolle. Die Fähigkeit, verschiedene Dateitypen in das PDF/A-Format zu konvertieren, ist eine grundlegende Funktion jeder professionellen DMS-Software.  

Darüber hinaus stehen zahlreiche Online-Tools zur Verfügung, die als Konverter fungieren und das PDF-Dokument in das gewünschte Format umwandeln. Beim Einsatz derartiger Online-Tools zur Dateikonvertierung sollte jedoch auf Sicherheit und Qualität geachtet werden, gerade, wenn die Datei vertrauliche Informationen enthält. 

Digitales Dokumentenmanagement einfach erklärt

Entdecke Vorlagen, Best Practices und Tipps und Tricks für ein digitales Dokumentenmanagement-System

PDF/A vs. TIFF: Die optimale Wahl für langfristige Archivierungszwecke 

Vor der Etablierung von PDF/A als absoluter Standard für die Langzeitarchivierung elektronischer Dokumente, war TIFF lange Zeit das dominierende Dateiformat in diesem Bereich. Allerdings wurden mit steigenden Anforderungen an die Struktur der Dokumente schnell einige Nachteile des Formats deutlich. Während TIFF-Archive zwar die Reproduzierbarkeit von Dokumenten gewährleisteten, war eine Volltextsuche nur durch nachträgliche Bearbeitung mit einer OCR-Maschine möglich. Hinzu kommt, dass TIFF-Dateien wesentlich größer sind als PDF-Dateien und daher ein Vielfaches an Speicherplatz benötigen.  Dank der weltweit enormen Akzeptanz des PDF-Formats, auf dem das PDF/A basiert, haben Unternehmen außerdem Zugang zu einer Vielzahl von teilweise kostenlosen Tools und Lösungen. Obwohl TIFF-Archive weiterhin in Bereichen wie der Bildverarbeitung zum Einsatz kommen, bietet das PDF/A unabhängig von Betriebssystemen oder eingesetzter Software die höchstmögliche Compliance-Sicherheit und wird kontinuierlich weiterentwickelt.

Infografik zeigt PDF/A im Überblick

PDF/A und Dokumentenmanagement: worauf es ankommt 

Die verschiedenen Formate spielen auch im Umfeld des Dokumentenmanagements eine zentrale Rolle. Wie bereits erwähnt, ist Konvertierung in das PDF/A-Format eine essenzielle Komponente einer professionellen DMS-Software. 

Allerdings ist das Format allein keine Garantie für Langzeitarchivierung. Es legt vielmehr durch spezifische Anforderungen an elektronische Dokumente den Grundstein dafür. Unternehmen müssen das Format im Rahmen eines umfassenden Archivierungskonzepts richtig einsetzen und in ihre Abläufe integrieren. Aspekte, die es zu beachten gilt, sind beispielsweise interne Compliance Richtlinien, Abläufe von Geschäftsprozessen sowie die eingesetzte Hard- und Software. Die langfristige Lesbarkeit eines Dokuments ist dabei nur ein wichtiger Aspekt, ebenso wichtig ist die Einhaltung der Aufbewahrungsfrist, die Wiederauffindbarkeit sowie die revisionssichere Archivierung. Zusätzlich gehört die Verfahrensdokumentation dazu, um sämtliche Compliance-Anforderungen zu erfüllen.

So ist das PDF/A-Format für sich genommen wenig hilfreich, wenn die Dokumente letztlich auf unverlässlichen Datenquellen abgelegt werden oder nicht über ein Dokumentenmanagement-System verwaltet, aufbewahrt und zu einem späteren Zeitpunkt bereitgestellt werden können.  Es handelt sich also ein Lösungs-Baustein in einem ganzen Komplex von Anforderungen. 

Behalte den Durchblick im Compliance-Dschungel! Mit GoBD, DSGVO, ISO 27001 und Co zu mehr Sicherheit im Unternehmen.