Document Parsing mit Google Cloud Document AI
Document AI (DocAI) ist der Formularerkennungs-Dienst in der Google Cloud. Er umfasst allgemeine Modelle sowie branchenspezifische Modelle für Verträge, Kreditvergabe, Beschaffung, Führerscheine, Pässe und Personalausweise. Doc AI unterstützt auch Human-in-the-Loop-Workflows (HITL), um für eine höhere Genauigkeit bei Bedarf menschliche Betrachter einzubinden. DocAI ist seit April 2021 allgemein verfügbar, obwohl die meisten Dienste derzeit nur begrenzt zugänglich sind.
Hinter DocAI stecken Googles langjährig bekannte Technologien für maschinelles Sehen (einschließlich OCR) und Natural Language Processing (NLP), mit denen sich vortrainierte Modelle für Dokumente mit hohem Volumen erstellen lassen. DocAI hat bereits mehrere Milliarden Seiten aus den Bereichen Kreditvergabe, Versicherung, Behörden und anderen Branchen verarbeitet.
DocAI bietet eine einheitliche Konsole beziehungsweise Plattform für die Dokumentverarbeitung, über die Anwender auf eine Vielzahl von Parsern und Tools zugreifen können. Herstellerangaben zufolge lassen sich damit die Dokumentenverwaltung automatisieren und validieren sowie Workflows optimieren, wobei Daten fehlerfrei und konform mit den Regularien bleiben sollen.
Für einen möglichst perfekten Service bringt Google auch seine Suche ins Spiel: Mit dem Google Knowledge Graph können Anwender die geparsten Informationen validieren und anreichern, indem sie Firmennamen, Adressen, Telefonnummern und andere Details mit Entitäten im Internet abgleichen.