Pdf's pimpen onder Linux
Pdf-documenten in Linux bewerken en aanvullen
Het pdf-bestandsformaat is veel meer dan een systeemoverkoepelend uitwissel- of archiveringsformaat. Met de gratis Master PDF Editor voor Linux kun je de tekst van pdf's achteraf wijzigen, a beeldingen toevoegen of formuliervelden invoegen die in pdf-readers ingevuld kunnen worden.
Het pdf-bestandsformaat is de onbetwiste norm voor uitwisselbare documentbestanden. Met die beperking, dat het de de nitieve versies zijn van de documenten die je platform- en systeemoverkoepelend verspreidt. Als het de bedoeling is dat de ontvanger aan wie je een bestand stuurt het document nog kan bewerken en aanpassen, dan zul je een tekst, tabel of presentatie over het algemeen als Microsoft O ce-bestand versturen. Het is dan alleen maar te hopen dat het bestand na een bewerking met een gratis o ceprogramma onder Linux niet hopeloos stukgeconverteerd wordt.
Het Portable Document Format kun je voor veel meer gebruiken dan alleen het archiveren van documenten met een onveranderlijke lay-out. Met een pdfeditor kun je bestanden prima bewerken, bijna alsof je met een o cebestand aan het werk bent. Een voorbeeld is het gratis programma Master PDF Editor.
De installatie is eenvoudig, op de website van producent Code Industry kun je DEB- en RPM-pakketten, of een Tar-bestand downloaden. De pakketten bevatten alle relevante dependency's, zodat je het bijvoorbeeld onder Ubuntu via het gra sche softwarebeheer kunt installeren. Alle overige pakketten worden achteraf dan automatisch geïnstalleerd. Er is overigens ook een Windows- en een macOS-versie van het programma beschikbaar met dezelfde functieomvang als de Linux-versie.
De gratis versie bevat ook alle functies die bedoeld zijn voor geregistreerde gebruikers. Als je er daar een van gebruikt zonder dat je je geregistreerd hebt, plaatst Master PDF Editor automatisch een watermerk met reclame voor zichzelf in het bestand. Als je je registreert en 50 dollar betaalt, kun je ongestoord functies gebruiken zoals het invoegen van watermerken en achtergronden, kop- en voetteksten, versleuteling en certi caten voor bestanden en JavaScript-code. Je bent dan ook verlost van alle reclameboodschappen, zoals achtergrondadvertenties bij het openen van bestanden in de reader.
Bewerkelijk
Als je een pdf-document met de editor hebt geopend, kun je met de tools in de werkbalken bovenin zinnen bewerken of nieuwe tekst toevoegen. De bediening en functionaliteit lijkt op die van LibreO ce Draw.
Met de tool 'Insert text' klik je op de gewenste positie in het document en kun je gaan typen. Dat werkt ook bij grote pdf-bestanden, zoals bijvoorbeeld de 80 MB grote, 468 pagina's tellende handleiding van de Millennium Falcon van Lego. Voor deelname aan het wereldrecord om de Falcon het snelste in elkaar te zetten, hebben we ter ondersteuning praktisch elke van de 1379 stappen van aantekeningen voorzien.
Afbeeldingen kun je eenvoudig via drag-and-drop verplaatsen en afmetingen wijzigen door de randen te verslepen. Een functie om afbeeldingen te bewerken heeft de editor niet. Daarvoor moet je de betre ende afbeelding via het snelmenu los opslaan en met een extern beeldbewerkingsprogramma bewerken.
Het is met Master PDF Editor niet mogelijk om samenhangende tekstdelen te maken: wat de editor betreft bestaat een paragraaf uit losse regels met woorden. Daardoor is het lastig om in een tekst hele zinnen of paragrafen toe te voegen, vooral wanneer een tekst met kolommen is opgemaakt. Als je wilt zorgen dat de nieuwe tekst zich aan de kolombreedte houdt, kun je het beste bestaande tekst in de kolom kopiëren, op de gewenste positie plakken en daarna de inhoud van de regels overschrijven.
Een alternatief is de 'Typewriter'tool uit de werkbalk. Daarmee maak je een tekstvak aan waarin je meerdere regels tekst kunt onderbrengen. Maar ook daarmee gaat het bewerken van tekst redelijk moeizaam. Als je verwacht dat er nog flink aan een tekst gesleuteld gaat worden, dan kun daar beter een officebestand voor gebruiken. Kleine correcties of aanpassingen zijn echter geen probleem, ook niet in tabellen of presentaties.
Formulier verfraaiing
De editor is ook een prima tool om ingescande formulieren of pdf'jes zonder invoerveld op de pc te bewerken. Daar
is wederom de tool 'Insert text' goed geschikt voor. Wij hebben bijvoorbeeld een internationaal schadeformulier gebruikt. We hebben tekstvakken gemaakt om onze naam en adres in te vullen. De pdf was niet voorzien van invoervelden of selectievakjes, dus die hebben we er ook aan toegevoegd.
Sommige mensen beveiligen een pdf door het bestand van een wachtwoord te voorzien. Als je een beveiligde pdf wilt bewerken, eist Master PDF Editor dat je het wachtwoord invult. Dankzij pdf-unlockers zoals op de website pdf.io is het echter geen probleem om een wachtwoord dat je vergeten bent of niet kent te verwijderen. Daarna kun je het bestand downloaden van de site en zonder problemen met Master PDF Editor bewerken.
Dat is niet alleen handig voor het invullen van andermans formulieren, maar ook wanneer je zelf een formulier wilt ontwerpen. De toepassing waarmee je het formulier maakt, hoeft niet zelf over formulierfuncties te beschikken.
Sla het document op als pdf en open het bestand met Master PDF Editor. In de werkbalk vind je functies om hyperlinks, knoppen, selectievakjes, meerkeuzeopties, tekstvelden, eenvoudige keuzelijsten, radioknoppen en bijschriften te maken. Daarvoor klik je eerst op de gewenste functie in de taakbalk en dan op de locatie in het pdf-bestand waar je het element wilt invoegen. Daarna kun je met een rechtermuisklik de eigenschappen van het element bewerken. De belangrijkste eigenschap van dergelijke formulierelementen is de naam. Deze moet in het hele pdf-document uniek zijn. Als je je daaraan houdt, kun je het formulier later met PDFtk volledig automatisch vullen met gegevens uit een databank. Dat kan handig zijn als je bijvoorbeeld oorkondes wilt maken voor deelnemers aan een cursus of een gepersonaliseerd deelnameformulier voor een schoolreisje dat de ouders moeten ondertekenen.
Verdere eigenschappen zijn afhankelijk van het formulierelement. In het geval van tekstvelden kun je bijvoorbeeld het lettertype of de fontgrootte instellen, of dat de tekst cursief of juist recht moet zijn.
Feest van herkenning
Een functie die vooral voor knutselaars interessant is, is de ingebouwde tekstherkenning (OCR) die je via het menu 'Document' vindt. Die is handig om bijvoorbeeld ingescande handleidingen, gegevensbladen of onderhoudsboeken bewerkbaar te maken. Over het algemeen doe je dat om in een pdf'je naar steekwoorden te kunnen zoeken. Maar je kunt daarmee bijvoorbeeld ook bepaalde termen met de editor vervangen, als je dat zou willen.
Voor al te grote documenten of boeken is de tekstherkenning echter minder geschikt. Ze leert namelijk niet en beschouwt elk woord apart. Bovendien vindt Master PDF Editor het lastig om bij een tekst die scheef is ingescand de correcte volgorde van de woorden te herkennen. De tekstherkenning heeft het ook moeilijk als de tekst niet helemaal scherp is of het contrast van het bronbestand te laag is. Het is aan te raden om scans van te voren met het programma Scan Tailor voor te bereiden. Daarmee verbeter je de herkenningsscore.
We raden aan om de functie 'Manually edit all recognized text' in Master PDF Editor te activeren om fouten in de herkenning te ontdekken en deze direct te corrigeren. Het programma vraagt je dan om woord voor woord aan te geven of het resultaat correct is. Indien een woord maar gedeeltelijk herkend is, kun je het beste direct het hele woord invoeren en de rest als 'Not text' negeren. Doe je dit niet, dan interpreteert de tekstherkenning het woord als meerdere woorden, waardoor je het later niet met de zoekfunctie zult kunnen vinden. Aangezien de OCR-functie van Master PDF Editor zoals gezegd niet in staat is om te leren, treden er geen negatieve e ecten op wanneer je de rest van het woord als 'Not text' declareert.
De OCR-functie van Master PDF Editor is niet geschikt voor langere tekstdocumenten en pdf-bestanden waarin je naar meer dan enkele steekwoorden wilt zoeken. Voor zulke gevallen gebruik je beter een puur OCR-programma zoals Tesseract. Dat beschouwt een tekst als meer dan een stel losse woorden. (ddu)