Webinar: Posteingang digitalisieren mit KI

Wir zeigten in unserem Live-Webinar am 13. Februar 2024 verschiedene Szenarien für die erfolgreiche Automatisierung von Posteingangsprozessen mithilfe von KI. Unsere Demos beinhalten verschiedene Anwendungsszenarien für den Posteingangsprozess. Besonderes Augenmerk liegt dabei auf der Anbindung beliebiger KI-Services, von unserer DPS Klassifikation bis hin zum einem bekannten Sprachassistenten. Dank Business Process Management beliebig skalierbar und orchestrierbar. Das Webinar bietet praxisnahe Einblicke, wie mit KI und BPMN der Posteingang digitalisiert werden kann.

Aufzeichnung

Slides

Die im Webinar gezeigten Folien stehen hier zum Download bereit:

Fragen & Antworten

Die im Webinar gezeigten Folien stehen hier zum Download bereit:
Für die kaufmännischen Dokumenttypen können wir auf Wunsch zusätzlich zum DPS Classification Designer ein vortrainiertes Klassifikationsmodell ausliefern. Aber gerade für branchen- oder fachspezifische Posteingänge ist dies leider nicht ohne weiteres möglich. Allerdings unterstützen unsere Experten bei der Erstellung eines Klassifikationsmodells und dem Trainingsaufbau der Dokumentklassen mittels Beispieldokumenten (Bereitstellung durch den Kunden). Zudem bieten wir im Fall unbekannter Klassen auch die Möglichkeit eines automatischen Clustering, um diese zu identifizieren.
Fehlerhaft antrainierte Daten können gelöscht werden, indem die entsprechenden Dokumente aus den Klassifikationsdaten entfernt und anschließend noch einmal neu trainiert werden.
Bei der Verwendung von externen Services übergeben wir die Daten an der Schnittstelle im DPS-Prozess und erhalten diese dann auch wie vorkonfiguriert vom KI-Service zurück. Je nachdem, wo und wie die KI-Technologie verwaltet wird, werden die Daten also an den entsprechenden externen Service in der Cloud oder einen Docker im eigenen Netzwerk geschickt. Im Fall unserer DPS Classification Suite bleiben die Daten in der Regel auf demselben Server.
An der Stelle, an der wir die Daten an einen externen Service übergeben, endet auch unser Verantwortungs- und Einflussbereich. Das bedeutet vor der Anbindung eines externen Dienstes ist zu untersuchen, ob deren Rechenzentrum oder Cloud-Provider die Regeln der DSGVO auch einhält.
Wir können aus dem DPS Prozess insofern unterstützen, in dem wir gewisse Dokument- und Bildbereiche anonymisieren oder schwärzen, sodass diese gar nicht erst personenbezogen weitergegeben werden. Allerdings werden diese Stellen dann auch nicht zur Erkennung verwendet.
Es gibt verschiedene Anbieter für das Lesen von handschriftlichen Formularen, neben Lazarus haben wir auch schon Google Vision hierfür verwendet. Die Ergebnisse waren mit verschiedenartigen Schriften gut, auch mit Schreibschrift. Auch unsere eigene Handschrift-OCR bietet gute Ergebnisse, allerdings sind wir hier vom Stand der Technik der jeweiligen OCR-Technologie abhängig.
Grundsätzlich stören Linien eine OCR Engine erheblich, sobald sie Zeichen durchqueren. Bei manchen Formularen sind diese deshalb in Farben vorgedruckt oder entsprechend hell, so dass man die Linien beim Scannen störungsfrei ausblenden kann. Zeitgemäße OCR-Engines nutzen entsprechende Verfahren zur Minimierung der Einflüsse, können diese aber nicht vollständig ausschließen.
Hierfür bieten wir verschiedene Schnittstellen und oftmals kommt auch für den Export an Fach- und Folgesysteme unsere REST-Schnittstelle zum Einsatz. Für SAP haben wir eine eigene Aktivität im Portfolio, die genau für die Anbindung hierfür zugeschnitten ist. Auch an Archivsysteme können wir mit unseren generischen und individuellen Schnittstellen problemlos exportieren. Dabei werden meist das Originaldokument sowie ein XML mit den erforderlichen Daten übergeben.
Für unseren DPS Classification Designer gilt als grobe Daumenregel 50 bis 100 Dokumente einer Klasse. Allerdings kommt es sehr stark darauf an, wie klar die Unterscheidungsmerkmale sind. Für manche Klassen sind daher viel weniger Dokumente notwendig, um erste erfolgreiche Automatisierungsergebnisse zu erzielen. Was externe KI-Services betrifft, so kommt es ganz darauf an, um welche KI-Technologie es sich handelt und ob diese ausschließlich von Ihnen trainiert wird oder einer breiten Masse an Usern. Bei der Klassifikation mit LLM ist eine signifikant kleinere Menge an Trainingsbeispielen notwendig.
Man muss nur die Trainingsimages den jeweiligen Dokumentklassen zuordnen. Dann startet man das Trainieren aller Klassen. Dabei wird bei Bedarf eine OCR auf den Images ausgeführt. Nach Ende des Trainings hat sich das System “ein Bild davon gemacht”, welche Merkmale (Wörter oder Phrasen) besonders charakteristisch für die Dokumente einer Klasse sind und gleichzeitig diese eine Klasse von allen anderen maximal unterscheiden. Damit ist dieses Vorgehen komplett sprachenunabhängig.
Halluzinationen bei KI beziehen sich auf Fälle, in denen künstliche Intelligenzsysteme falsche oder irreführende Informationen generieren oder interpretieren. Es gibt einige Möglichkeiten, diese zu erkennen und zu vermeiden z.B. durch eine geeignete Auswahl der Trainingsdaten, Post-Processing Techniken, robuste Architekturen und natürlich auch menschliche Überprüfung. Gerne beraten wir in einem weiterführenden Gespräch dazu.
Unsere REST-Schnittstelle und teilweise auch die Schnittstellen, die wir als eigene Aktivität mit Technologiepartnern anbieten, warten wir selbst und bieten dafür eine Softwarepflege an. Diese wird bei Erwerb der Lizenz jährlich erneuert oder ist im Falle einer Subskription Teil des Mietumfangs der Software.
Dies ist vom jeweiligen Prozess abhängig. Es können sowohl Daten oder Dokumente von DPS an externe Dienste übertragen werden.

Jetzt registrieren und vollen Zugriff auf die Webinarunterlagen erhalten:

Kontaktieren Sie unsere Experten