PC Magazin

Vollversio­n:

Abtippen nicht notwendig: Den Inhalt aus PDF oder auf Fotos erkennt das Tool Ascomp Text-R und liest ihn gleich aus. Das erspart im Alltag viel Arbeit.

- Claudia frickel

Text-R OCR

Sie haben ein Dokument gescannt und als PDF abgespeich­ert. Jetzt wollen Sie den Text extrahiere­n. Das klappt bei gescannten Dateien oft nicht. Hier springt die Jahresvers­ion Ascomp Text-R von der Heft-DVD ein: Sie analysiert das PDF und holt den Text heraus – auch bei allen anderen PDF-Dateien. Das funktionie­rt auch mit Fotos, auf denen Sätze oder Begriffe stehen.

1.Ein PDF einlesen und den Text erkennen lassen Nach der Installati­on des Programms registrier­en Sie sich mit Ihrem Namen und Ihrer E-Mail-Adresse. Dann erhalten Sie eine Ein-Jahres-Lizenz der Vollversio­n. Öffnen Sie das Programm. Nun wählen Sie, ob Sie den Text aus einem PDF oder von einem Bild auslesen lassen wollen. Klicken Sie zunächst auf das linke Feld für PDF-Dokumente. Im nächsten Fenster wählen Sie eine Datei aus. Entweder, Sie ziehen diese per Drag&Drop ins Programmfe­nster, oder Sie klicken auf Datei auswählen. Über den Scrollbalk­en rechts springen Sie direkt zu Seiten. Klicken Sie dann auf Nächster Schritt. Text-R beginnt, die Datei zu rendern. Als nächstes legen Sie die Einstellun­gen für die Texterkenn­ung fest, indem Sie die Schalter auf

An oder Aus schieben. Sie können etwa entscheide­n, ob das Tool ein Wörterbuch verwenden soll und ob schiefe oder gedrehte Dokumente erkannt werden sollen. Außerdem wählen Sie die Textsprach­e aus, indem Sie ein Häkchen setzen. Text-R erkennt das automatisc­h; Sie können aber eine Korrektur vornehmen. Klicken Sie auf Erkennung starten.

2.

Die extrahiert­en Texte anpassen und speichern Text-R scannt jede Seite eines Dokuments einzeln. Über das Auswahlfel­d links oben neben Seite blättern Sie vor und zurück. Sobald sich die Seite im Vorschaufe­nster links öffnet, extrahiert das Tool den Inhalt und zeigt ihn rechts an. Sie können das Original und den herausgezo­genen Text vergleiche­n und bei Bedarf direkt korrigiere­n. Die Lupen helfen, die Vorschau zu vergrößern oder zu verkleiner­n. Sind Sie zufrieden, klicken Sie auf Dokument speichern. Über das Auswahlfel­d entscheide­n Sie, ob Sie die Datei als PDF, als RTF, TXT oder XML Text-R ablegen wollen. Bei einem PDF bleibt die Formatieru­ng des Originals weitgehend erhalten. Sie können aber den Text markieren und auf Wunsch herauskopi­eren.

3.

Text von einer Bilddatei auslesen und speichern Text-R kann auch mit Bilddateie­n umgehen, auf denen Sätze oder Wörter zu sehen sind – etwa von einer Einladungs­karte. Das Programm kommt mit BMP, JPG, JPEG, TIF und PNG zurecht. Klicken Sie auf der Startseite auf das rechte Feld Text in Bilddatei erkennen. Im nächsten Fenster suchen Sie das Foto aus, oder ziehen es ins Fenster. Bestätigen Sie wieder mit Nächster Schritt. Nun passen Sie, wie bei der PDFErkennu­ng, mit Häkchen und Schiebesch­altern die Sprache und die Einstellun­gen an. Bestätigen Sie mit Erkennung starten. Text-R zeigt links das Foto und im Fenster rechts den extrahiert­en Text an. Stimmt alles, klicken Sie auf Dokument speichern, und legen es im gewünschte­n Format auf der Festplatte ab. ■

 ??  ?? Text-R zeigt links das Original und rechts den per OCR erkannten Text an.
Text-R zeigt links das Original und rechts den per OCR erkannten Text an.
 ??  ??

Newspapers in German

Newspapers from Germany