Voll­ver­si­on:

Ab­tip­pen nicht not­wen­dig: Den In­halt aus PDF oder auf Fo­tos er­kennt das Tool As­comp Text-R und liest ihn gleich aus. Das er­spart im All­tag viel Ar­beit.

PC Magazin - - Inhalt - Claudia fri­ckel

Text-R OCR

Sie ha­ben ein Do­ku­ment ge­scannt und als PDF ab­ge­spei­chert. Jetzt wol­len Sie den Text ex­tra­hie­ren. Das klappt bei ge­scann­ten Da­tei­en oft nicht. Hier springt die Jah­res­ver­si­on As­comp Text-R von der Heft-DVD ein: Sie ana­ly­siert das PDF und holt den Text her­aus – auch bei al­len an­de­ren PDF-Da­tei­en. Das funk­tio­niert auch mit Fo­tos, auf de­nen Sät­ze oder Be­grif­fe ste­hen.

1.Ein PDF ein­le­sen und den Text er­ken­nen las­sen Nach der In­stal­la­ti­on des Pro­gramms re­gis­trie­ren Sie sich mit Ih­rem Na­men und Ih­rer E-Mail-Adres­se. Dann er­hal­ten Sie ei­ne Ein-Jah­res-Li­zenz der Voll­ver­si­on. Öff­nen Sie das Pro­gramm. Nun wäh­len Sie, ob Sie den Text aus ei­nem PDF oder von ei­nem Bild aus­le­sen las­sen wol­len. Kli­cken Sie zu­nächst auf das lin­ke Feld für PDF-Do­ku­men­te. Im nächs­ten Fens­ter wäh­len Sie ei­ne Da­tei aus. Ent­we­der, Sie zie­hen die­se per Drag&Drop ins Pro­gramm­fens­ter, oder Sie kli­cken auf Da­tei aus­wäh­len. Über den Scroll­bal­ken rechts sprin­gen Sie di­rekt zu Sei­ten. Kli­cken Sie dann auf Nächs­ter Schritt. Text-R be­ginnt, die Da­tei zu ren­dern. Als nächs­tes le­gen Sie die Ein­stel­lun­gen für die Tex­ter­ken­nung fest, in­dem Sie die Schal­ter auf

An oder Aus schie­ben. Sie kön­nen et­wa ent­schei­den, ob das Tool ein Wör­ter­buch ver­wen­den soll und ob schie­fe oder ge­dreh­te Do­ku­men­te er­kannt wer­den sol­len. Au­ßer­dem wäh­len Sie die Text­spra­che aus, in­dem Sie ein Häk­chen set­zen. Text-R er­kennt das au­to­ma­tisch; Sie kön­nen aber ei­ne Kor­rek­tur vor­neh­men. Kli­cken Sie auf Er­ken­nung star­ten.

2.

Die ex­tra­hier­ten Tex­te an­pas­sen und spei­chern Text-R scannt je­de Sei­te ei­nes Do­ku­ments ein­zeln. Über das Aus­wahl­feld links oben ne­ben Sei­te blät­tern Sie vor und zu­rück. So­bald sich die Sei­te im Vor­schau­fens­ter links öff­net, ex­tra­hiert das Tool den In­halt und zeigt ihn rechts an. Sie kön­nen das Ori­gi­nal und den her­aus­ge­zo­ge­nen Text ver­glei­chen und bei Be­darf di­rekt kor­ri­gie­ren. Die Lu­pen hel­fen, die Vor­schau zu ver­grö­ßern oder zu ver­klei­nern. Sind Sie zu­frie­den, kli­cken Sie auf Do­ku­ment spei­chern. Über das Aus­wahl­feld ent­schei­den Sie, ob Sie die Da­tei als PDF, als RTF, TXT oder XML Text-R ab­le­gen wol­len. Bei ei­nem PDF bleibt die For­ma­tie­rung des Ori­gi­nals weit­ge­hend er­hal­ten. Sie kön­nen aber den Text mar­kie­ren und auf Wunsch her­aus­ko­pie­ren.

3.

Text von ei­ner Bild­da­tei aus­le­sen und spei­chern Text-R kann auch mit Bild­da­tei­en um­ge­hen, auf de­nen Sät­ze oder Wör­ter zu se­hen sind – et­wa von ei­ner Ein­la­dungs­kar­te. Das Pro­gramm kommt mit BMP, JPG, JPEG, TIF und PNG zu­recht. Kli­cken Sie auf der Start­sei­te auf das rech­te Feld Text in Bild­da­tei er­ken­nen. Im nächs­ten Fens­ter su­chen Sie das Fo­to aus, oder zie­hen es ins Fens­ter. Be­stä­ti­gen Sie wie­der mit Nächs­ter Schritt. Nun pas­sen Sie, wie bei der PDFEr­ken­nung, mit Häk­chen und Schie­be­schal­tern die Spra­che und die Ein­stel­lun­gen an. Be­stä­ti­gen Sie mit Er­ken­nung star­ten. Text-R zeigt links das Fo­to und im Fens­ter rechts den ex­tra­hier­ten Text an. Stimmt al­les, kli­cken Sie auf Do­ku­ment spei­chern, und le­gen es im ge­wünsch­ten For­mat auf der Fest­plat­te ab. ■

Text-R zeigt links das Ori­gi­nal und rechts den per OCR er­kann­ten Text an.

Newspapers in German

Newspapers from Germany

© PressReader. All rights reserved.