Vollversion:
Abtippen nicht notwendig: Den Inhalt aus PDF oder auf Fotos erkennt das Tool Ascomp Text-R und liest ihn gleich aus. Das erspart im Alltag viel Arbeit.
Text-R OCR
Sie haben ein Dokument gescannt und als PDF abgespeichert. Jetzt wollen Sie den Text extrahieren. Das klappt bei gescannten Dateien oft nicht. Hier springt die Jahresversion Ascomp Text-R von der Heft-DVD ein: Sie analysiert das PDF und holt den Text heraus – auch bei allen anderen PDF-Dateien. Das funktioniert auch mit Fotos, auf denen Sätze oder Begriffe stehen.
1.Ein PDF einlesen und den Text erkennen lassen Nach der Installation des Programms registrieren Sie sich mit Ihrem Namen und Ihrer E-Mail-Adresse. Dann erhalten Sie eine Ein-Jahres-Lizenz der Vollversion. Öffnen Sie das Programm. Nun wählen Sie, ob Sie den Text aus einem PDF oder von einem Bild auslesen lassen wollen. Klicken Sie zunächst auf das linke Feld für PDF-Dokumente. Im nächsten Fenster wählen Sie eine Datei aus. Entweder, Sie ziehen diese per Drag&Drop ins Programmfenster, oder Sie klicken auf Datei auswählen. Über den Scrollbalken rechts springen Sie direkt zu Seiten. Klicken Sie dann auf Nächster Schritt. Text-R beginnt, die Datei zu rendern. Als nächstes legen Sie die Einstellungen für die Texterkennung fest, indem Sie die Schalter auf
An oder Aus schieben. Sie können etwa entscheiden, ob das Tool ein Wörterbuch verwenden soll und ob schiefe oder gedrehte Dokumente erkannt werden sollen. Außerdem wählen Sie die Textsprache aus, indem Sie ein Häkchen setzen. Text-R erkennt das automatisch; Sie können aber eine Korrektur vornehmen. Klicken Sie auf Erkennung starten.
2.
Die extrahierten Texte anpassen und speichern Text-R scannt jede Seite eines Dokuments einzeln. Über das Auswahlfeld links oben neben Seite blättern Sie vor und zurück. Sobald sich die Seite im Vorschaufenster links öffnet, extrahiert das Tool den Inhalt und zeigt ihn rechts an. Sie können das Original und den herausgezogenen Text vergleichen und bei Bedarf direkt korrigieren. Die Lupen helfen, die Vorschau zu vergrößern oder zu verkleinern. Sind Sie zufrieden, klicken Sie auf Dokument speichern. Über das Auswahlfeld entscheiden Sie, ob Sie die Datei als PDF, als RTF, TXT oder XML Text-R ablegen wollen. Bei einem PDF bleibt die Formatierung des Originals weitgehend erhalten. Sie können aber den Text markieren und auf Wunsch herauskopieren.
3.
Text von einer Bilddatei auslesen und speichern Text-R kann auch mit Bilddateien umgehen, auf denen Sätze oder Wörter zu sehen sind – etwa von einer Einladungskarte. Das Programm kommt mit BMP, JPG, JPEG, TIF und PNG zurecht. Klicken Sie auf der Startseite auf das rechte Feld Text in Bilddatei erkennen. Im nächsten Fenster suchen Sie das Foto aus, oder ziehen es ins Fenster. Bestätigen Sie wieder mit Nächster Schritt. Nun passen Sie, wie bei der PDFErkennung, mit Häkchen und Schiebeschaltern die Sprache und die Einstellungen an. Bestätigen Sie mit Erkennung starten. Text-R zeigt links das Foto und im Fenster rechts den extrahierten Text an. Stimmt alles, klicken Sie auf Dokument speichern, und legen es im gewünschten Format auf der Festplatte ab. ■