Question 1

Wird das Produkt schon mit einer Basis an Trainingsdokumenten geliefert?

Accepted Answer

Für die kaufmännischen Dokumenttypen können wir auf Wunsch zusätzlich zum DPS Classification Designer ein vortrainiertes Klassifikationsmodell ausliefern. Aber gerade für branchen- oder fachspezifische Posteingänge ist dies leider nicht ohne weiteres möglich. Allerdings unterstützen unsere Experten bei der Erstellung eines Klassifikationsmodells und dem Trainingsaufbau der Dokumentklassen mittels Beispieldokumenten (Bereitstellung durch den Kunden). Zudem bieten wir im Fall unbekannter Klassen auch die Möglichkeit eines automatischen Clustering, um diese zu identifizieren.

Question 2

Kann ich im DPS Classification Designer falsch angelerntes Wissen korrigieren?

Accepted Answer

Fehlerhaft antrainierte Daten können gelöscht werden, indem die entsprechenden Dokumente aus den Klassifikationsdaten entfernt und anschließend noch einmal neu trainiert werden.

Question 3

Wo werden denn die Daten bei der Verwendung von externen Services verarbeitet?

Accepted Answer

Bei der Verwendung von externen Services übergeben wir die Daten an der Schnittstelle im DPS-Prozess und erhalten diese dann auch wie vorkonfiguriert vom KI-Service zurück. Je nachdem, wo und wie die KI-Technologie verwaltet wird, werden die Daten also an den entsprechenden externen Service in der Cloud oder einen Docker im eigenen Netzwerk geschickt. Im Fall unserer DPS Classification Suite bleiben die Daten in der Regel auf demselben Server.

Question 4

Wie sieht es bei der Anbindung von externen Services mit dem Schutz von personenbezogenen Daten gemäß DSGVO aus?

Accepted Answer

An der Stelle, an der wir die Daten an einen externen Service übergeben, endet auch unser Verantwortungs- und Einflussbereich. Das bedeutet vor der Anbindung eines externen Dienstes ist zu untersuchen, ob deren Rechenzentrum oder Cloud-Provider die Regeln der DSGVO auch einhält.

Question 5

Wie stellen Sie den Schutz von personenbezogenen Daten bei externen Web Services sicher?

Accepted Answer

Wir können aus dem DPS Prozess insofern unterstützen, in dem wir gewisse Dokument- und Bildbereiche anonymisieren oder schwärzen, sodass diese gar nicht erst personenbezogen weitergegeben werden. Allerdings werden diese Stellen dann auch nicht zur Erkennung verwendet.

Question 6

Funktioniert die gezeigte Handschrifterkennung auch mit Schreibschrift?

Accepted Answer

Es gibt verschiedene Anbieter für das Lesen von handschriftlichen Formularen, neben Lazarus haben wir auch schon Google Vision hierfür verwendet. Die Ergebnisse waren mit verschiedenartigen Schriften gut, auch mit Schreibschrift. Auch unsere eigene Handschrift-OCR bietet gute Ergebnisse, allerdings sind wir hier vom Stand der Technik der jeweiligen OCR-Technologie abhängig.

Question 7

Können bestehende Linien bei z.B. Formularen oder Bankverbindungen die Erkennung von KI-Services beeinflussen?

Accepted Answer

Grundsätzlich stören Linien eine OCR Engine erheblich, sobald sie Zeichen durchqueren. Bei manchen Formularen sind diese deshalb in Farben vorgedruckt oder entsprechend hell, so dass man die Linien beim Scannen störungsfrei ausblenden kann. Zeitgemäße OCR-Engines nutzen entsprechende Verfahren zur Minimierung der Einflüsse, können diese aber nicht vollständig ausschließen.

Question 8

Wie bekomme ich die analysierten Daten in mein ERP bzw. CMS-System?

Accepted Answer

Hierfür bieten wir verschiedene Schnittstellen und oftmals kommt auch für den Export an Fach- und Folgesysteme unsere REST-Schnittstelle zum Einsatz. Für SAP haben wir eine eigene Aktivität im Portfolio, die genau für die Anbindung hierfür zugeschnitten ist. Auch an Archivsysteme können wir mit unseren generischen und individuellen Schnittstellen problemlos exportieren. Dabei werden meist das Originaldokument sowie ein XML mit den erforderlichen Daten übergeben.

Question 9

Welche Anzahl an Dokumenten braucht die KI bis Sie angelernt ist?

Accepted Answer

Für unseren DPS Classification Designer gilt als grobe Daumenregel 50 bis 100 Dokumente einer Klasse. Allerdings kommt es sehr stark darauf an, wie klar die Unterscheidungsmerkmale sind. Für manche Klassen sind daher viel weniger Dokumente notwendig, um erste erfolgreiche Automatisierungsergebnisse zu erzielen. Was externe KI-Services betrifft, so kommt es ganz darauf an, um welche KI-Technologie es sich handelt und ob diese ausschließlich von Ihnen trainiert wird oder einer breiten Masse an Usern. Bei der Klassifikation mit LLM ist eine signifikant kleinere Menge an Trainingsbeispielen notwendig.

Question 10

Muss man vor dem Training der DPS Classification die Wörter definieren bzw. eine semantische Analyse durchführen?

Accepted Answer

Man muss nur die Trainingsimages den jeweiligen Dokumentklassen zuordnen. Dann startet man das Trainieren aller Klassen. Dabei wird bei Bedarf eine OCR auf den Images ausgeführt. Nach Ende des Trainings hat sich das System &#8220;ein Bild davon gemacht&#8221;, welche Merkmale (Wörter oder Phrasen) besonders charakteristisch für die Dokumente einer Klasse sind und gleichzeitig diese eine Klasse von allen anderen maximal unterscheiden. Damit ist dieses Vorgehen komplett sprachenunabhängig.

Question 11

Wie werden „Halluzinationen“ der KI vermieden?

Accepted Answer

Halluzinationen bei KI beziehen sich auf Fälle, in denen künstliche Intelligenzsysteme falsche oder irreführende Informationen generieren oder interpretieren. Es gibt einige Möglichkeiten, diese zu erkennen und zu vermeiden z.B. durch eine geeignete Auswahl der Trainingsdaten, Post-Processing Techniken, robuste Architekturen und natürlich auch menschliche Überprüfung. Gerne beraten wir in einem weiterführenden Gespräch dazu.

Question 12

Wie erfolgt die Pflege der Schnittstellen zu den KI Services? Bieten Sie einen Wartungsvertrag?

Accepted Answer

Unsere REST-Schnittstelle und teilweise auch die Schnittstellen, die wir als eigene Aktivität mit Technologiepartnern anbieten, warten wir selbst und bieten dafür eine Softwarepflege an. Diese wird bei Erwerb der Lizenz jährlich erneuert oder ist im Falle einer Subskription Teil des Mietumfangs der Software.

Question 13

Was wird bei der Nutzung externer Dienste übermittelt: der bereits von TCG erfasste Datensatz oder das Originalbild?

Accepted Answer

Dies ist vom jeweiligen Prozess abhängig. Es können sowohl Daten oder Dokumente von DPS an externe Dienste übertragen werden.

Webinar: Posteingang digitalisieren mit KI

Aufzeichnung

Slides

Fragen & Antworten

Webinar: Posteingang digitalisieren mit KI

Aufzeichnung

Slides

Fragen & Antworten

Jetzt registrieren und vollen Zugriff auf die Webinarunterlagen erhalten:

Für welche Stelle möchten Sie sich bewerben?

Kontaktieren Sie unsere Experten