Grafische Formularerkennung – Formulare zuverlässig auslesen

Im Zuge der Klassifikation von textbasierten Inhalten stellt das Auslesen von Formularen durch maschinelle Verarbeitung eine Sonderdisziplin dar. Unsauber gescannte Dokumente oder Fax-Eingänge mit geringer Bildauflösung werden vom klassischen OCR-System kaum verarbeitet. Die iForm Formularerkennung von ITyX verzichtet beim Formreading (Formulare auslesen) daher bewusst auf die Vorverarbeitung durch OCR. Sie setzt stattdessen kognitive Verfahren der KI zur grafischen Formularerkennung ein.

Ergänzend zum iForm-Verfahren sind manuelle Definitionen von Zonen zur zonalen Auslesung von Daten sowie das Re-Transformieren von verschobenen, gestauchten oder gedrehten Dokumenten zurück auf das ursprüngliche Dokumentenlayout im System enthalten. Durch die Kombination der Verfahren erreicht man eine maximale Auslesequote.

In der industriellen Formularerkennung und der Klassifikation von Fließtexten ist es wichtig, die „False-Positive-Rate“ – also den Anteil von Fehlklassifizierungen in automatisch kategorisierten Vorgängen – so gering wie möglich zu halten. Daher werden unsichere Ergebnisse auf Wunsch automatisch in eine manuelle Mensch-Nachbearbeitung in den Client-Prozess mit Mediatrix MAILROOM verschoben. Die Definition von Schwellwerten macht eine sehr feine Steuerung möglich. In der Klassifikations-Matrix kann für jeden Geschäftsprozess eine optimale Toleranz von Fehlern in Bezug auf die Prozess-Qualität festgelegt werden. So senkt man u.a. in Überlast-Situationen temporär die Fehlertoleranz zugunsten eines höheren Durchsatzes.

ITyX Technologie für Auslesen von Formularen (Formreading) umfasst u.a.:

  • Schnelle Implementierung Formular-gebundener Prozesse durch visuelle Erkennung (Trainingsprozess)
  • Definition von zonalen Wirkungsbereichen mit abnehmender Toleranz
  • Optimale False-Positive-Rate

Kontakt

Haben Sie Fragen oder benötigen Sie weitere Informationen?

Live-Kontakt starten
Informationsmappe anfordern