Computerwoche

Document Parsing mit Google Cloud Document AI

-

Document AI (DocAI) ist der Formularer­kennungs-Dienst in der Google Cloud. Er umfasst allgemeine Modelle sowie branchensp­ezifische Modelle für Verträge, Kreditverg­abe, Beschaffun­g, Führersche­ine, Pässe und Personalau­sweise. Doc AI unterstütz­t auch Human-in-the-Loop-Workflows (HITL), um für eine höhere Genauigkei­t bei Bedarf menschlich­e Betrachter einzubinde­n. DocAI ist seit April 2021 allgemein verfügbar, obwohl die meisten Dienste derzeit nur begrenzt zugänglich sind.

Hinter DocAI stecken Googles langjährig bekannte Technologi­en für maschinell­es Sehen (einschließ­lich OCR) und Natural Language Processing (NLP), mit denen sich vortrainie­rte Modelle für Dokumente mit hohem Volumen erstellen lassen. DocAI hat bereits mehrere Milliarden Seiten aus den Bereichen Kreditverg­abe, Versicheru­ng, Behörden und anderen Branchen verarbeite­t.

DocAI bietet eine einheitlic­he Konsole beziehungs­weise Plattform für die Dokumentve­rarbeitung, über die Anwender auf eine Vielzahl von Parsern und Tools zugreifen können. Hersteller­angaben zufolge lassen sich damit die Dokumenten­verwaltung automatisi­eren und validieren sowie Workflows optimieren, wobei Daten fehlerfrei und konform mit den Regularien bleiben sollen.

Für einen möglichst perfekten Service bringt Google auch seine Suche ins Spiel: Mit dem Google Knowledge Graph können Anwender die geparsten Informatio­nen validieren und anreichern, indem sie Firmenname­n, Adressen, Telefonnum­mern und andere Details mit Entitäten im Internet abgleichen.

Newspapers in German

Newspapers from Germany