OCR-Texterkennung: Technologie und Nutzen auf einen Blick

Was ist OCR Texterkennung?

OCR steht für „Optical Character Recognition“ steht. OCR Texterkennung findet nicht nur im Dokumentenmanagementsystem Anwendung, sondern begegnet uns auch im Alltag. Die PLZ von Briefen werden damit automatisch ausgelesen. Ebenso die Nummernschilder auf Radarbildern von Verkehrssündern.

Aber was genau tut diese Technologie der optischen Zeichenerkennung und was müssen Sie darüber wissen?
In diesem Artikel beantworten wir Ihnen kurz und knapp die wichtigsten Fragen zur OCR-Texterkennung, indem wir Funktionsweise und Nutzen schildern sowie unterschiedlichste Ausprägungen und deren Einsatzgebiete differenzieren.

Wie funktioniert OCR-Software?

Damit Informationen aus papierbasierten Dokumenten in IT-Systemen verarbeitet werden können, reicht es nicht, Dokumente einfach nur einzuscannen. Das digital vorliegende Dokument, wie der Scan oder das PDF, ist immer nur eine Bildkopie – die sogenannte Rastergrafik – eines Dokumentes. Nicht mehr und nicht weniger. Eine Ansammlung schwarzer, weißer oder farbiger Bildpunkte, die allerdings noch nicht “sprechen” können. Das vermag die sogenannte optische Zeichenerkennung zu ändern. Mit Hilfe einer mehrschrittigen Analyse erkennt OCR-Software dann einzelne Buchstaben und setzt diese zu Wörtern und anschließend zu logischen Sätzen zusammen – das Bild wird in Text übersetzt. Auf diese Weise wandelt die klassische OCR-Technologie unterschiedliche Dokumente zuverlässig in bearbeitbare und durchsuchbare Dateien (wie zum Beispiel Word- oder Exceldateien) um. Erst jetzt ist das elektronisch erstellte Dokumente voll durchsuchbar, wenn nötig weiter bearbeitbar und für die automatisierte Datenextraktion nutzbar.

Die OCR-Texterkennung als Herzstück des Dokumentenmanagementsystems

Die Fähigkeit der OCR, eine Textversion von gescannten Dokumenten zu erstellen, ermöglicht es Ihren Mitarbeitern eine Volltextsuche durchzuführen und somit jeden Teil eines Dokuments mit einer bestimmten Menge von Wörtern aufzufinden. Dokumente können auf diese Weise schnell und einfach im Archiv oder in der Cloud aufgerufen und dort mit einem Textverarbeitungsprogramm bearbeitet werden. Der Volltext der OCR ist auch für eine Klassifizierung von Dokumenten notwendig. Klassifizierung von unstrukturierten Dokumenten gelingt, indem die Software einzelne Kategorien, bestimmte Daten und Eigenschaften (Attribute) eines Dokumentes erkennt und anhand dieser Merkmale die Dokumentenart treffsicher und automatisch bestimmt. Wichtig sind diese Schritte beim Szenario des Posteingangs. Bei der Eingangsrechnung kann ein Prozess wie folgt aussehen:

  1. Eingehende Rechnungen werden eingescannt
  2. Kopf- und Positionsdaten werden dank OCR automatisch erkannt (und gegebenenfalls gegen Bestell- und Bewegdaten abgeglichen)
  3. Das Dokument sowie die erkannten Daten (Absender, Empfänger, Rechnungsnummer, Beträge) werden bereitgestellt.

OCR schafft hier die Grundlage für eine vereinfachte und automatisierte Erschließung und Verteilung von Dokumenten mithilfe des Dokumentenmanagementsystems. Unterm Strich sorgt die OCR-Software dafür, dass eine beschleunigte Sortierung, Zuordnung und Verarbeitung des täglichen Schriftverkehrs im Unternehmen stattfinden kann.

Je nach Anforderung existieren unterschiedliche Techniken der Erkennung.

Welche Technologie ist die Richtige für Ihre Anforderungen?

Zonale OCR

Zonale OCR ist eine spezielle Art von Optical Character Recognition, die nur bestimmte Textdatenfelder aus einem Dokument extrahiert. Denn in einigen Anwendungsfällen, wie beispielswiese bei Formularen, ist es nicht notwendig, den gesamten Text eines Dokumentes zu erfassen. Formulare können dabei fast alles sein – von Auftragsformularen bis hin zu Patienteninformationen, Lagerbeständen oder Frachtbriefen. Aus diesen Dokumenten werden häufig nur spezifische Informationen benötigt, sodass nicht das gesamte Dokument beim Scannen verarbeitet werden muss. Zonale OCR erlaubt grundsätzlich, nur die wichtigen Datenfelder aus einem PDF-Dokument zu extrahieren und diese Werte in einer strukturierten Datenbank zu speichern. Die Extraktion basiert demzufolge auf “Zonen”, die vor dem Scannen definiert werden. Dies kann entweder durch Vorkonfigurierung durch den Mitarbeiter geschehen oder es werden intelligente Softwarekomponenten eingesetzt, die auf regelbasierten Erkennungsmöglichkeiten zurückgreifen. Ziel und Vorteil der zonalen OCR im Vergleich zur Volltext-OCR ist es, bestimmte Daten noch schneller und mit einer höheren Genauigkeit erfassen zu können.

Planen Sie zum Beispiel ein DMS einzuführen und möchten Altdaten, wie beispielsweise Rechnungen archivieren? Und möchten diese möglicherweise einer entsprechenden Kreditorenakte zuordnen? Dann ist es ausreichend, an dieser Stelle lediglich die Rechnungsnummer über zonale OCR auszulesen. Andere Positionsdaten können vorerst außer Acht gelassen werden. Das macht die zeitintensivere Volltexterkennung überflüssig.

ICR (Intelligent Character Recognition)

Wer einen handgeschriebenen Brief einscannt und dann eine optische Texterkennung startet, erlebt sein blaues Wunder. OCR deckt nur den Bereich der Verarbeitung von gedruckten Schriftstücken in zufriedenstellender Weise ab. Der Prozess der Erkennung handschriftlicher Einträge ist allerdings technisch sehr viel anspruchsvoller. Aus diesem Grund wird hier die Intelligent Character Recognition – auch ICR – als eine Erweiterung der optischen Zeichenerkennung genutzt. Das funktioniert in den meisten Fällen am besten per Blockschrift und wenn die Blockschrift Begrenzungen aufweist. Bestes Beispiel ist hier der gute alte Überweisungsschein.

OMR (Optical Marc Recognition)

Mit der optischen Markierungserkennung können optische Markierungen in Formularen und Fragebögen besser als mit OCR oder ICR ausgelesen werden. Die Technik wird deswegen häufig zur automatischen Auswertung von Ankreuzfeldern in Formularen, wie bei Multiple-Choice-Tests, Wahlzetteln oder Datenprüfungen verwendet. Die OMR-Software wertet die markierten Formulare aus, wobei sie zwischen markierten und unmarkierten Feldern unterscheidet. Zu beachten ist hier, dass die Technik sehr sensibel auf den Zustand des Papiers reagiert.

Dokumentenmanagementsysteme kommen folglich nicht ohne OCR-Texterkennung aus. Dabei ist es ganz egal, welche Anforderungen Sie mitbringen. Stellen Sie bei der Auswahl eines geeigneten Systems immer sicher, dass optische sowie intelligente Erkennungstechnologien als Softwarekomponenten clever implementiert sind. Denn das macht Ihre digitalen Dokumentenprozesse noch schneller und leistungsfähiger.

OCR-Texterkennung als Bestandteil des Dokumentenmanagementssystems