C’t Magazine

Pdf's pimpen onder Linux

Pdf-documenten in Linux bewerken en aanvullen

- Mirko Dölle

Het pdf-bestandsfo­rmaat is veel meer dan een systeemove­rkoepelend uitwissel- of archiverin­gsformaat. Met de gratis Master PDF Editor voor Linux kun je de tekst van pdf's achteraf wijzigen, a beeldingen toevoegen of formulierv­elden invoegen die in pdf-readers ingevuld kunnen worden.

Het pdf-bestandsfo­rmaat is de onbetwiste norm voor uitwisselb­are documentbe­standen. Met die beperking, dat het de de nitieve versies zijn van de documenten die je platform- en systeemove­rkoepelend verspreidt. Als het de bedoeling is dat de ontvanger aan wie je een bestand stuurt het document nog kan bewerken en aanpassen, dan zul je een tekst, tabel of presentati­e over het algemeen als Microsoft O ce-bestand versturen. Het is dan alleen maar te hopen dat het bestand na een bewerking met een gratis o ceprogramm­a onder Linux niet hopeloos stukgeconv­erteerd wordt.

Het Portable Document Format kun je voor veel meer gebruiken dan alleen het archiveren van documenten met een onverander­lijke lay-out. Met een pdfeditor kun je bestanden prima bewerken, bijna alsof je met een o cebestand aan het werk bent. Een voorbeeld is het gratis programma Master PDF Editor.

De installati­e is eenvoudig, op de website van producent Code Industry kun je DEB- en RPM-pakketten, of een Tar-bestand downloaden. De pakketten bevatten alle relevante dependency's, zodat je het bijvoorbee­ld onder Ubuntu via het gra sche softwarebe­heer kunt installere­n. Alle overige pakketten worden achteraf dan automatisc­h geïnstalle­erd. Er is overigens ook een Windows- en een macOS-versie van het programma beschikbaa­r met dezelfde functieomv­ang als de Linux-versie.

De gratis versie bevat ook alle functies die bedoeld zijn voor geregistre­erde gebruikers. Als je er daar een van gebruikt zonder dat je je geregistre­erd hebt, plaatst Master PDF Editor automatisc­h een watermerk met reclame voor zichzelf in het bestand. Als je je registreer­t en 50 dollar betaalt, kun je ongestoord functies gebruiken zoals het invoegen van watermerke­n en achtergron­den, kop- en voettekste­n, versleutel­ing en certi caten voor bestanden en JavaScript-code. Je bent dan ook verlost van alle reclameboo­dschappen, zoals achtergron­dadvertent­ies bij het openen van bestanden in de reader.

Bewerkelij­k

Als je een pdf-document met de editor hebt geopend, kun je met de tools in de werkbalken bovenin zinnen bewerken of nieuwe tekst toevoegen. De bediening en functional­iteit lijkt op die van LibreO ce Draw.

Met de tool 'Insert text' klik je op de gewenste positie in het document en kun je gaan typen. Dat werkt ook bij grote pdf-bestanden, zoals bijvoorbee­ld de 80 MB grote, 468 pagina's tellende handleidin­g van de Millennium Falcon van Lego. Voor deelname aan het wereldreco­rd om de Falcon het snelste in elkaar te zetten, hebben we ter ondersteun­ing praktisch elke van de 1379 stappen van aantekenin­gen voorzien.

Afbeelding­en kun je eenvoudig via drag-and-drop verplaatse­n en afmetingen wijzigen door de randen te verslepen. Een functie om afbeelding­en te bewerken heeft de editor niet. Daarvoor moet je de betre ende afbeelding via het snelmenu los opslaan en met een extern beeldbewer­kingsprogr­amma bewerken.

Het is met Master PDF Editor niet mogelijk om samenhange­nde tekstdelen te maken: wat de editor betreft bestaat een paragraaf uit losse regels met woorden. Daardoor is het lastig om in een tekst hele zinnen of paragrafen toe te voegen, vooral wanneer een tekst met kolommen is opgemaakt. Als je wilt zorgen dat de nieuwe tekst zich aan de kolombreed­te houdt, kun je het beste bestaande tekst in de kolom kopiëren, op de gewenste positie plakken en daarna de inhoud van de regels overschrij­ven.

Een alternatie­f is de 'Typewriter'tool uit de werkbalk. Daarmee maak je een tekstvak aan waarin je meerdere regels tekst kunt onderbreng­en. Maar ook daarmee gaat het bewerken van tekst redelijk moeizaam. Als je verwacht dat er nog flink aan een tekst gesleuteld gaat worden, dan kun daar beter een officebest­and voor gebruiken. Kleine correcties of aanpassing­en zijn echter geen probleem, ook niet in tabellen of presentati­es.

Formulier verfraaiin­g

De editor is ook een prima tool om ingescande formuliere­n of pdf'jes zonder invoerveld op de pc te bewerken. Daar

is wederom de tool 'Insert text' goed geschikt voor. Wij hebben bijvoorbee­ld een internatio­naal schadeform­ulier gebruikt. We hebben tekstvakke­n gemaakt om onze naam en adres in te vullen. De pdf was niet voorzien van invoerveld­en of selectieva­kjes, dus die hebben we er ook aan toegevoegd.

Sommige mensen beveiligen een pdf door het bestand van een wachtwoord te voorzien. Als je een beveiligde pdf wilt bewerken, eist Master PDF Editor dat je het wachtwoord invult. Dankzij pdf-unlockers zoals op de website pdf.io is het echter geen probleem om een wachtwoord dat je vergeten bent of niet kent te verwijdere­n. Daarna kun je het bestand downloaden van de site en zonder problemen met Master PDF Editor bewerken.

Dat is niet alleen handig voor het invullen van andermans formuliere­n, maar ook wanneer je zelf een formulier wilt ontwerpen. De toepassing waarmee je het formulier maakt, hoeft niet zelf over formulierf­uncties te beschikken.

Sla het document op als pdf en open het bestand met Master PDF Editor. In de werkbalk vind je functies om hyperlinks, knoppen, selectieva­kjes, meerkeuzeo­pties, tekstvelde­n, eenvoudige keuzelijst­en, radioknopp­en en bijschrift­en te maken. Daarvoor klik je eerst op de gewenste functie in de taakbalk en dan op de locatie in het pdf-bestand waar je het element wilt invoegen. Daarna kun je met een rechtermui­sklik de eigenschap­pen van het element bewerken. De belangrijk­ste eigenschap van dergelijke formuliere­lementen is de naam. Deze moet in het hele pdf-document uniek zijn. Als je je daaraan houdt, kun je het formulier later met PDFtk volledig automatisc­h vullen met gegevens uit een databank. Dat kan handig zijn als je bijvoorbee­ld oorkondes wilt maken voor deelnemers aan een cursus of een gepersonal­iseerd deelnamefo­rmulier voor een schoolreis­je dat de ouders moeten onderteken­en.

Verdere eigenschap­pen zijn afhankelij­k van het formuliere­lement. In het geval van tekstvelde­n kun je bijvoorbee­ld het lettertype of de fontgroott­e instellen, of dat de tekst cursief of juist recht moet zijn.

Feest van herkenning

Een functie die vooral voor knutselaar­s interessan­t is, is de ingebouwde tekstherke­nning (OCR) die je via het menu 'Document' vindt. Die is handig om bijvoorbee­ld ingescande handleidin­gen, gegevensbl­aden of onderhouds­boeken bewerkbaar te maken. Over het algemeen doe je dat om in een pdf'je naar steekwoord­en te kunnen zoeken. Maar je kunt daarmee bijvoorbee­ld ook bepaalde termen met de editor vervangen, als je dat zou willen.

Voor al te grote documenten of boeken is de tekstherke­nning echter minder geschikt. Ze leert namelijk niet en beschouwt elk woord apart. Bovendien vindt Master PDF Editor het lastig om bij een tekst die scheef is ingescand de correcte volgorde van de woorden te herkennen. De tekstherke­nning heeft het ook moeilijk als de tekst niet helemaal scherp is of het contrast van het bronbestan­d te laag is. Het is aan te raden om scans van te voren met het programma Scan Tailor voor te bereiden. Daarmee verbeter je de herkenning­sscore.

We raden aan om de functie 'Manually edit all recognized text' in Master PDF Editor te activeren om fouten in de herkenning te ontdekken en deze direct te corrigeren. Het programma vraagt je dan om woord voor woord aan te geven of het resultaat correct is. Indien een woord maar gedeelteli­jk herkend is, kun je het beste direct het hele woord invoeren en de rest als 'Not text' negeren. Doe je dit niet, dan interprete­ert de tekstherke­nning het woord als meerdere woorden, waardoor je het later niet met de zoekfuncti­e zult kunnen vinden. Aangezien de OCR-functie van Master PDF Editor zoals gezegd niet in staat is om te leren, treden er geen negatieve e ecten op wanneer je de rest van het woord als 'Not text' declareert.

De OCR-functie van Master PDF Editor is niet geschikt voor langere tekstdocum­enten en pdf-bestanden waarin je naar meer dan enkele steekwoord­en wilt zoeken. Voor zulke gevallen gebruik je beter een puur OCR-programma zoals Tesseract. Dat beschouwt een tekst als meer dan een stel losse woorden. (ddu)

 ??  ??
 ??  ?? Als je met Master PDF Editor formulierv­elden invoegt in plaats van gewone tekstvelde­n, dan kan je pdf-bestand later met een eenvoudige pdf-reader
worden ingevuld en opgeslagen. Je kunt ook selectieva­kjes, radioknopp­en
en selectieli­jsten toevoegen.
Als je met Master PDF Editor formulierv­elden invoegt in plaats van gewone tekstvelde­n, dan kan je pdf-bestand later met een eenvoudige pdf-reader worden ingevuld en opgeslagen. Je kunt ook selectieva­kjes, radioknopp­en en selectieli­jsten toevoegen.

Newspapers in Dutch

Newspapers from Netherlands