Ein wesentlicher Schritt des Enterprise Content Management ist der Dokumenteneingang. Papierdokumente müssen digitalisiert, Metainformationen müssen extrahiert und – letztendlich – Dokumente abgelegt und an nachgelagerte Prozesse weitergeleitet werden. Klingt langweilig? Vermutlich, weil es das auch ist!
Die Aufnahme von Dokumenten ist eine zeitaufwändige, sehr monotone Tätigkeit. Meist werden hunderte von Stunden Arbeit für die manuelle Dateneingabe aufgewendet, um Informationen aus Papierdokumenten (wieder) zu erfassen, die ursprünglich ja mal digital erstellt wurden. Und wenn das für Sie absurd klingt, dann eben, weil es das ist.
Was können wir also dagegen tun?
Ganz einfach, aktuelle Entwicklungen auf dem Gebiet der künstlichen Intelligenz (KI) im Allgemeinen und im des Bereich Deep Learning im Besonderen haben einen gewaltigen Sprung im Hinblick auf die Fähigkeiten moderner KI-Verfahren gebracht. Die Spielstärke KI-basierter „Spieler“ in komplexen Brettspielen, z.B. Schach [DeepBlue] oder zuletzt Go [AlphaGo], haben für weitreichende Schlagzeilen gesorgt. Für jeden einzelnen von uns leichter greifbar haben diese technologischen Fortschritte zu innovativen Diensten geführt, die uns im täglichen Leben helfen, z.B. digitale Assistenten, mit denen wir uns auf natürliche Art und Weise unterhalten können [Siri, Alexa, Google Assistant].
Auf der einen Seite haben wir also eine mühsame Aufgabe, die wir gerne effizient abarbeiten würden, und auf der anderen Seite haben wir eine technologische Bewegung, die uns genau dabei helfen könnte.
So unterstützt Künstliche Intelligenz bei der Erfassung und Verarbeitung von Dokumenten
Bei der d.velop AG dient die App d.velop inbound scan als zentrale SaaS-Lösung für den Dokumenteneingang. Dabei handelt es sich um eine voll funktionsfähige Web-Anwendung, die Benutzer bei der Erfassung und Ablage eingehender Dokumente unterstützt. Hier lassen sich drei verschiedene Aufgaben identifizieren, die wir durch KI-Technologie unterstützen können: die Identifikation zusammenhängender Dokumenten, die Kategorisierung dieser Dokumente und Informationsextraktion. Diese sind wie folgt in einer sequentiellen Pipeline angeordnet.

Während des gesamten Arbeitsablaufs verfolgen wir den Ansatz “Teamwork statt Ersetzen”.
Offen gesagt, glauben wir nicht daran, hochqualifizierte Teammitglieder zugunsten eines ausgefallenen Computercodes zu ersetzen.
Stattdessen glauben wir an integrierte Abläufe, in denen jeder Teilnehmer – Mensch wie Maschine – seine Stärken ausspielen kann.
Dokumente identifizieren: Wo fängt dieses Schreiben an?
Das Ziel der Dokumentenidentifikation besteht darin, einen Stapel gescannter Seiten in logisch zusammenhängende Dokumente aufzuteilen. Stellen Sie sich vor, Sie erhalten Ihre tägliche Briefpost. Sie haben alles geöffnet und scannen es mit Ihrem großen Dokumentenscanner. Heraus kommt ein Stapel sortierter Seiten, der die heutige Briefpost in digitaler Form enthält. Der d.velop KI-Service hilft, logische Dokumentumbrüche in diesem Stapel zu finden. Er durchläuft hierfür den Stapel und analysiert ihn Seite für Seite. Er betrachtet sowohl das Layout der Seite als auch den Rohtext, der mittels Optical Character Recognition (OCR) ermittelt wurde. Vom Dienst identifizierte Dokumentumbrüche werden an die Benutzerschnittstelle zurückgemeldet. Auf diese Weise wird der Nutzer oder die Nutzerin dabei unterstützt, den gescannten Poststapel in einzelne Dokumente zu unterteilen. Gleichzeitig erhält er die Möglichkeit, die computergenerierten Vorschläge zu überprüfen und bei Bedarf zu korrigieren. Die automatische Splitting-Empfehlung kommt als „Plug&Play„-Lösung daher: Sie brauchen nichts zu konfigurieren; der Dienst ist sofort einsatzbereit. Und das Beste: mit der Zeit lernt der KI-Dienst automatisch dazu und wird besser. Jedes Mal, wenn Sie einen vorgeschlagenen Dokumentenumbruch korrigieren, erhält der Dienst ein Feedback und lernt aus seinen Fehlern.
Dokumente klassifizieren: Mit welchen Dokumenten habe ich es zu tun?
Sobald Sie einzelne Dokumente abgerufen haben, ist es an der Zeit, herauszufinden, um was für ein Dokument es sich handelt. Der erste, entscheidende Schritt besteht darin, die Dokumente zu klassifizieren, d.h. zu ermitteln, welcher Kategorie es sich zuordnen lässt. . Um dies herauszufinden verwendet der nächste KI-Dienst fortgeschrittene Natural Language Processing (NLP)-Technologie. Haben Sie gerade eine Rechnung vor sich? Oder einen Lieferschein? Oder eine Bestellung? Diese Dokumente sehen zwar ähnlich aus, aber die Geschäftsprozesse, die sie nachgelagert auslösen, sind sehr unterschiedlich. Daher ist die Hilfe, die Ihnen “Kollege KI” hier anbietet, auf jeden Fall willkommen. Auch dieses Addon kommt als plug&play Feature. Es ist einfach da. Es macht Vorschläge. Und Sie können diese übernehmen oder sie korrigieren, sollten Sie das Gefühl haben, dass eine Kategorie mal nicht richtig erkannt wurde. Das automatische Erkennen der Dokumentart wird Ihnen nicht nur helfen, den richtigen Workflow zu identifizieren und anzustoßen, sondern die Information, um welche Art von Dokument es sich handelt, wird direkt als Annotation zum Dokument gespeichert. Dies ermöglicht eine strukturierte Ablage (z.B. in digitale Akten) und – was am Wichtigsten ist – ein bequemes Wiederfinden zu einem späteren Zeitpunkt.
Dokumente auslesen: Was ist an meinen Dokumenten wichtig?
Jetzt wissen Sie also darüber Bescheid, wo Ihre Dokumente anfangen und was sie im Allgemeinen bedeuten. Aber wir sind noch nicht ganz fertig. Der bei weitem mühsamste Teil des Arbeitsablaufs liegt noch vor uns: die Informationsextraktion. In diesem Schritt wollen Sie die wesentlichen Daten aus jedem Dokument erfassen. Die Extraktion dieser Metadaten hilft dabei, die unstrukturierten Daten des Dokuments in ein prägnantes, strukturiertes Format umzuwandeln, das für die nachfolgende Verarbeitung geeignetist. Eine Rechnung muss beispielsweise bezahlt werden. Sie müssen also unter anderem herausfinden, wer für was bezahlt wird und wie hoch der fällige Betrag ist. All diese Daten werden in der Regel von Hand erfasst, d.h. jemand wird sie entweder aus dem Dokument kopieren und in einen Datenerfassungsdialog einfügen oder die Informationen Stück für Stück abtippen – offensichtlich eine mühsame und fehleranfällige Art und Weise, dies zu tun. Aber auch für diesen Schritt bieten wir Ihnen KI-basierte Unterstützung. Mit Hilfe moderner NLP-Techniken extrahiert unser kürzlich eingeführter Dienst d.velop document analysis automatisch die wichtigsten Informationen aus Ihren Dokumenten. Die einzelnen Elemente werden mit Hilfe einer Technik namens Named Entity Recognition markiert, d.h. der Dienst sucht gezielt nach Zeichenfolgen in Ihren Dokumenten, die eine bestimmte Bedeutung haben – wie z.B. eine Rechnungsnummer oder eine Gesamtsumme. Die Tatsache, dass es sich hierbei um generisch anwendbare Konzepte im Zusammenhang mit Geschäftsdokumenten handelt, erlaubt es uns, diese Modelle auf generische Weise zu trainieren und bereitzustellen.
Ihr Vorteil: Sie können den Dienst einfach nutzen, ohne dass eine manuelle Konfiguration oder ein vorheriges Training erforderlich ist. Darüber hinaus bietet unser d.velop document reader invoice die Vorteile von fast zwei Jahrzehnten Erfahrung in der automatischen Dokumentenverarbeitung, um noch zielgerichtet Informationen in Ihren Rechnungen zu finden. Zusammengenommen helfen Ihnen diese Lösungen , Ihre Daten kurz und prägnant zu annotieren.
Wie geht es weiter?
Sobald Sie diesen Schritt abgeschlossen haben, sind Sie bereit: Sie können Ihre Dokumente mit einem umfangreichen Satz von Metadaten ablegen. Diese Daten beinhalten die Kategorie der Dokumente und konkrete Schlüsselinformationen. Kollege KI hat Sie auf diesem Weg unterstützt. Die Informationen, die Sie extrahiert haben, sind in nachfolgenden Prozessen direkt verwendbar. Und daraus ergibt sich für Sei ein weiterer Mehrwert: In nachgelagerten Arbeitsabläufen wie der Posteingangsverteilung oder der Rechnungsverarbeitung können Sie direkt auf qualitativ hochwertige, vorab extrahierte Informationen zurückgreifen und so auch diese Prozesse effizienter gestalten. Alle oben genannten Dienste sind heute in d.velop Produkten verfügbar. Sollten wir Ihr Interesse geweckt haben, empfehlen wir Ihnen, sie sofort auszuprobieren. Am einfachsten geht das, in dem Sie d.velop documents ultimate edition ausprobieren. Hier sind finden Sie alle Lösungen nahtlos integriert. Wenn Sie Fragen haben, zögern Sie nicht, uns zu kontaktieren.
Referenzen
– [DeepBlue] https://www.ibm.com/ibm/history/ibm100/us/en/icons/deepblue/
– [AlphaGo] https://deepmind.com/research/case-studies/alphago-the-story-so-far
– [Siri] https://www.apple.com/de/siri/
– [Alexa] https://developer.amazon.com/de-DE/alexa
– [Google-Assistent] https://assistant.google.com/intl/de_de/