Alles Wissenswerte über SharePoint Metadaten und SharePoint Syntex

Auf Twitter nutzt man Hashtags und in Facebook markiert man Freunde oder Orte auf Fotos. Die Posts bekommen dadurch Eigenschaften zugewiesen, sind klassifiziert und kategorisiert. So lässt sich der Kontext besser zuordnen oder ein Social Media Beitrag schnell und einfach auffinden.

Was in Postings auf sozialen Netzwerken Normalität ist, bereitet uns im Umgang mit Dokumenten noch Schwierigkeiten und meistens auch weniger Spaß.
Durch die Nutzung des Windows Explorers haben wir gelernt, die Klassifizierung durch eine Ordnerstruktur abzubilden. Im Windows Explorer gibt es allerdings keine Hashtags oder Markierungen. Liegt das Dokument im Unterordner „Angebote“ unterhalb des Ordners mit dem Namen „Meier“, handelt es sich wohl um ein Angebot für unseren Kunden Meier.

SharePoint Ordner und SharePoint Metadaten

In Microsoft SharePoint habe ich die Wahl zwischen Ordnern und Metadaten. Als Metadaten werden die Eigenschaften bezeichnet, die ich in den Spalten setzen kann, um das Dokument zu klassifizieren und einzuordnen. Oftmals ist es jedoch einfacher, Ordner in einer Dokumentenbibliothek zu erstellen und die Dokumente dort so zu „klassifizieren“, wie ich es von meinem klassischen Netzlaufwerk kenne. So gibt es in der SharePoint-Gemeinde seit jeher die Diskussion: Ordner oder Metadaten?

Die Vorteile von Dokumenteigenschaften

Die Vorteile von Dokumenteigenschaften wissen viele zu schätzen. Ich kann damit neben der Volltextsuche auch ganz gezielt nach einzelnen Eigenschaften suchen: Zeige mir alle Dokumente in denen das Prüfdatum der 30.06.2021 ist.
Aufgrund von gesetzten Eigenschaften kann ein Flow einen Prüfprozess starten. Das Prüfergebnis kann wiederum als Eigenschaft am Dokument gesetzt werden. In der Dokumentenbibliothek können die Dokumente entsprechend ihres Status in flexiblen Ansichten gruppiert werden. In einer Ordnerstruktur hingegen müsste das Dokumente ständig verschoben werden.

(Fast) wie Magie: Klassifizierung und Metadatenextraktion mit SharePoint Syntex

Die Vorteile von Metadaten oder Dokument-Eigenschaften liegen auf der Hand. Nur ist es mitunter sehr aufwändig, die Klassifizierung manuell durchzuführen.

Man würde sich doch wünschen das Dokument einfach irgendwo abzulegen, dann erledigt die Künstliche Intelligenz ihre Arbeit und klassifiziert das Dokument. Mit SharePoint Syntex wird das zur neuen Normalität. Unter dem Namen „Project Cortex“ hat Microsoft verschiedene Funktionen zur Ergänzung ihrer Content Services Plattform entwickelt. Syntex war das erste Produkt aus dem Projekt und wurde auf der Ignite 2019 einem breiten Publikum vorgestellt.

SharePoint Syntex analysiert eingehende Dokumente anhand von trainierten Modellen, klassifiziert das Dokument und extrahiert auf Wunsch die Metadaten. Die Klassifizierung ist für unstrukturierte Dokumente wie z.B. Verträge, Bewerbungen oder Konzepte gedacht.

Im Gegensatz dazu ist es mit dem AI Builder möglich, strukturierte Dokumente zu erkennen.

Die Dokumentklassifizierung identifiziert dabei einen sogenannten Inhaltstypen. Dieser kann beispielsweise genutzt werden, um Compliance-Regeln zu aktivieren. Einem als Vertrag gekennzeichnetem Dokument könnte dadurch direkt eine Aufbewahrungsfrist zugeordnet werden.

Einem Inhaltstyp sind zudem noch weitere Eigenschaften zugeordnet. So hat ein Vertrag den Vertragspartner sowie eine Vertragsart. Diese Eigenschaften können mit Syntex aus dem klassifizierten Dokument ausgelesen werden.

Die Modelle werden in Syntex per „Asssited AI“ erstellt. Das bedeutet, dass Modelle nicht allein auf Basis von bestehenden Dokumenten durch eine künstliche Intelligenz erstellt werden, sondern durch eine:n Anwender:in unterstützt wird. Dies macht es möglich schon mit einer sehr geringen Menge von Musterdokumenten ein Modell zu erstellen.

Von 0 auf SharePoint Syntex in 4 Schritten

Ein Modell wird in Syntex in 4 Schritten erstellt:

1) Beispieldokumente bereitstellen

Beispieldokumente dienen in den weiteren Schritten als positive und negative Beispiele zur Erkennung von Dokumente. Pro Modell sollten mindestens 5 positive und 1 negatives Beispiel hochgeladen werden:

2) Dokumentklassifizierung

Zunächst werden Name und Beschreibung des neuen Modells festgelegt. Weiterhin kann eine Inhaltstyp zugeordnet werden und optional ein Retention Label ausgewählt werden, dass dem Dokument automatisch hinzugefügt wird.

Im nächsten Schritt werden die Dokumente vom Benutzer als positive oder negative Beispiele markiert.

In der Dokumentklassifizierung werden die Dokumente von Syntex analysiert und es wird abgeglichen, ob die AI auf die identischen Ergebnisse kommt. Durch sogenannte Explanations können Anwender:innen noch Hinweise geben. Das kann z.B. als Liste von Phrasen geschehen. In einem Vertrag steht mit hoher Wahrscheinlichkeit das Wort „Vertrag“.


Zum Abschluss kann noch ein Training mit weiteren Dokumenten erfolgen.

3) Metadatenextraktion

Im Teilschritt der Extraktion wird festgelegt, in welcher SharePoint Spalte das Ergebnis der Extraktion gespeichert wird. Man kann hier aus bestehenden Spalten auswählen oder eine neue Spalte erstellen.

Nachfolgend wird im Dokument der Text markiert, der als Eigenschaft extrahiert werden soll. Wie bei der Dokumentklassifizierung werden auch hier durch die Explanation Hinweise zur Erkennung geben.

In der Praxis ist dieser Teil aufwändiger als der Schritt 3.

Nachdem die Extrahierung konfiguriert wurde kann zum Abschluss ein Training mit weiteren Dokumenten erfolgen.

Unser Modell ist fertig.

4) Veröffentlichung des Modells

Im letzten Schritt wird der Modell veröffentlicht und mit einer Bibliothek verbunden. Wird ein Dokument in die verbundene Bibliothek geladen, so beginnt Syntex es zu analysieren.

Und jetzt? d.velop documents for Microsoft 365!

Am Anfang des Blogposts habe ich bereist einiges zu den Vorteilen von Dokumenteigenschaften geschrieben. Mit dem SharePoint Dokumentenmanagement von d.velop lässt sich noch mehr aus SharePoint-Inhalten herausholen. Klassifizierte Dokumente werden automatisch in Prozesse überführt und die extrahierten Metadaten sorgen für die richtige Zuordnung in eine digitale Aktenstruktur.

Vorteile am Beispiel des Vertragsmanagements:
Ein als Vertrag klassifiziertes Dokumente kann in d.velop contracts for Microsoft 365 in einen vollständigen Vertragslebenszyklus überführt werden. Neben weiteren ergänzenden Dokumenten können dem Vertrag Fristen und Aufgaben hinzugefügt werden. So ist eine vollständige Transparenz zu jedem Zeitpunkt garantiert.

Vorteile am Beispiel digitaler Akten:
Die Information zur Änderung von Stammdaten wird von Syntex treffsicher einem Lieferanten zugeordnet, startet einen Flow und das zugehörige Dokument wird automatisch in die Lieferantenakte in d.velop documents for Microsoft 365 hinterlegt.

Mehr zum Microsoft Syntex und d.velop for Microsoft 365 erfahren Sie außerdem im Webinar zum Thema “Wissenmanagement im Unternehmen mit SharePoint Syntex”.

Webinar Sharepoint Syntex


Foto von Sora Shimazaki von Pexels