Online vertalers: DeepL is de winnaar
Computers hebben het altijd al moeilijk gevonden om teksten te vertalen. Tot het bedrijf DeepL een neuraal netwerk daarvoor ging trainen en daar verbluffend goede resultaten mee haalde. Ook professionele tools werken inmiddels met dat vertaalmiddel. Ger
Computervertalingen hebben niet voor niets een redelijk slechte reputatie. In de jaren negentig kreeg je na het invoeren van het Bijbelcitaat ‘The spirit is willing, but the flesh is weak’ bij een computervertaling van Engels naar Russisch te lezen dat de wodka prima was, maar het vlees was bedorven.
De vertaalkwaliteit van klassieke vertaalprogramma’s als Systran en Babylon was lange tijd bijzonder lachwekkend slecht. Als je de afgelopen tijd nog een handleiding van een gadget uit China hebt gelezen, is het duidelijk dat er nog wel wat werk valt te verzetten.
Slechts twee jaar terug ging de online vertaler DeepL van start met maar zeven talen en een vrij simpele interface. De onverwacht hoge kwaliteit van de vertalingen kwam al snel naar boven. Anders dan bij andere online vertalingen was je al blij als het resultaat ook maar een beetje te begrijpen was. DeepL kreeg het niet alleen voor elkaar om in veel situaties de juiste woorden te vinden, maar toverde ook een ongekend natuurlijk ogende tekst voor je ogen.
Als je je niet registreert, kun je maximaal 5000 tekens lang gratis vertalen. Als je meer wilt, moet je een abonnement op een van de Pro-versies aanschaffen.
BETER NEURAAL NETWERK
De online vertaaltools van Google en Microsoft werken net als DeepL met neurale netwerken. DeepL haalt alleen veel betere resultaten dan die twee. Waar
dat aan ligt, is een bedrijfsgeheim. Officieel wordt alleen gemeld dat de door DeepL ontwikkelde ‘nieuwe structuur van neuronen en hun verbindingen’ beter zijn met natuurlijke taal dan de tot nu toe bekende vertaalsystemen. Wel weten we dat het elektronische brein een fikse hoeveelheid rekenkracht heeft om mee te werken. DeepL zit in een supercomputer met een performance van 5,1 petaflops in een datacenter van het IJslandse Verne Global. DeepL ondersteunt inmiddels negen talen: Nederlands, Engels, Duits, Frans, Italiaans, Pools, Portugees, Russisch en Spaans. Japans en Mandarijn worden al een tijdje aangekondigd, maar hebben we tot nu toe nog niet gezien.
DeepL biedt sinds kort een programma voor macOS en Windows dat op de achtergrond wacht tot hij aan het vertalen mag slaan en dat met een sneltoets uitvoert. Dat programma heeft uiteraard een internetverbinding nodig en maakt gebruik van dezelfde diensten als de webversie.
Om duidelijker te maken wat er zo bijzonder is aan DeepL, hebben we DeepL vergeleken met zes andere online-vertalers: Babylon, Bing Microsoft Translator, Google Translate, Promt Online Translator, Systran en WorldLingo. Ze kregen allemaal dezelfde opdracht voor de kiezen: twee paragrafen met Engelse tekst met in totaal 728 tekens in 123 woorden (zie het kader).
Bij de taalkundige uitdagingen hoort een zin met een bijzin, veelvoorkomende spelfouten (apostrof op de verkeerde plek) en twee citaten – eentje uit de Christelijke bijbel en eentje uit de nerdbijbel (The Hitchhikers Guide to the Galaxy van Douglas Adams). Een zin met een geslachtsneutraal zelfstandig naamwoord wordt gebruikt om te zien hoe digitale vertaaltools het geslacht bepalen.
VERLIEZERS EERST
De hekkensluiters bij deze vergelijkende tekst waren Babylon Translator en WorldLingo. Babylon Translator kon maar een enkele bijzin per keer aan en struikelde al bij de samenvoegingen it’s en don’t. Zelfstandige naamwoorden werden niet herkend en de zinsbouw was continu verkeerd. Maar het was niet alleen maar kommer en kwel, het Bijbelcitaat en ‘gross misinterpretation’ werden wel goed vertaald.
WorldLingo kwam af en toe met een foutcode op de proppen. Net als bij Babylon Translator waren de zinnen erg krom en de gebruikte woorden vaak nogal gedateerd. Het is alsof de vertaler in het verleden is blijven hangen. Dan wordt een zinsdeel als ‘without gender-neutral equivalent’ vertaald als ‘zonder een niet sexistisch equivalent’.
De Promt Online Translator kwam er slechts minimaal beter vanaf. Ook daarbij kregen we vrijwel geen enkele zin die grammaticaal klopte. Het woord ‘genderneutral’ bleef zelfs onvertaald in de vertaling staan. Soms schoof een woord aan het eind van een zin door naar het begin van de volgende.
HET WORDT BETER
Systran Translate heeft op een wat onopvallende manier maar liefst vijf verschillende vertaalmodi beschikbaar gesteld. Na het invoeren van de tekst om te vertalen verschijnt in een wat klein uitgevallen font onder het vertaalde tekstblok (indien beschikbaar) de resultaten voor Generic_Formal, Generic, Finance, IT en Legal. De vijf varianten produceren afhankelijk van het soort tekst verschillende resultaten, maar je loopt ook een grote kans op verschillende fouten. Drie van de modi verslikten zich in een spatie.
Net als bij Bing en zelfs DeepL was de geest niet gewillig, maar ‘bereid’. Het maakt per taal ook nog uit of de verschillende modi verschillende resultaten laten zien.
DEEPL VERSUS GOOGLE
Systran liet zich niet compleet uit het veld slaan door schrijffouten, maar was wel verre van vlekkeloos. Het is wel leuk om de verschillende modi het tegen elkaar op te laten nemen, maar niemand zit te wachten om uit meerdere opties zelf nog een geheel in elkaar te moeten puzzelen.
De resultaten van Bing Microsoft Translator en Google Translate zijn acceptabel. Vergeleken met DeepL bieden de vertalers van de grote Amerikaanse bedrijven een flinke waslijst aan taalkeuzes. Google Translate kan overweg met 99 talen, en de Microsoft-dienst doet het ook netjes met 63 stuks. Bij Google staat zelfs Esperanto op de lijst. Microsoft biedt dan weer Klingon voor de liefhebbers.
Net als Systran laat ook Bing Microsoft Translator zich niet continu van de wijs brengen door schrijffouten. Wel wisselt de kwaliteit van de vertaling tussen soms wat oubollig en dan weer heel hip taalgebruik. Het Douglas Adams-citaat is het net niet, maar al met al krijg je wel een bruikbare vertaling. Als je met de vertaler van Microsoft zakelijke teksten vertaalt, zul je vrijwel nooit al te gekke dingen tegenkomen.
Google doet het niet onverdienstelijk. Net als bij Systran zit je bij Google niet vast aan een enkele soort vertaling. Als je je muis over een zin laat zweven, wordt de zin blauw en krijg je na een muisklik meer vertaalopties te zien – en via een link de vraag om de vertaling verder te verbeteren. Op die manier stuur je verbeterde vertalingen rechtstreeks naar Google.
In de basis is een alternatieve vertaling prima, maar bij veel tests met Google was het tweede voorstel slechter dan de oorspronkelijke vertaling. Dan lijkt Google ineens af te zakken naar het niveau van Babylon, WorldLingo en Promt.
De eerste poging met DeepL gaat gelijk op met de resultaten van Google en Microsoft. Als je de vertaling naar een editor kopieert, hangt er aan einde een regel met reclame voor DeepL. De Douglas Adams-quote kwam wel bijna foutloos over.
Pas als je op een willekeurig woord klikt laat DeepL z’n vertaalspieren zien. Een lang drop-downmenu toont je alle mogelijke alternatieve vertalingen. Met slechts een beetje werk pas je een vertaling aan tot die perfect is.
GESLACHT: HEEFT NOG WAT WERK NODIG
Het was opvallend dat een test voor het geslacht bij vrijwel alle vertalers hetzelfde resultaat gaf. De meeste vertalers hielden voet bij stuk bij ‘police officer’ en ‘politician’: dat bleef een agent en een politicus en ‘ nurse’ werd een verpleegster. Maar DeepL gaf ook netjes ‘verpleger’ als optie, en de ‘legal’ module van Systran maakte er verpleegkundige van. Bij ‘politician’ kwam bij DeepL de optie ‘politica’ als eerste andere suggestie in beeld na het klikken op de vertaling.
We hebben een half jaar geleden eens een keer een testrun gedaan met alle vertalers. Ze kregen een vergelijkbare set taken, maar met een andere tekst. Die tekst hebben we een tweede keer in de vertaaltools gestopt om op die manier te achterhalen of de algoritmes sindsdien veranderd zijn.
De vertalingen van Google, Microsoft en Systran waren anders dan een half jaar geleden. Systran leverde eerder nog een lachwekkend resultaat op, maar komt nu aardig in de buurt van Microsoft. Microsoft doet het ook een stuk beter dan de vorige keer, maar kreeg daar weer nieuwe fouten bij. De vertaaltool met de grootste kwaliteitssprong is Google. Bij Babylon, Promt, WorldLingo en – grote teleurstelling – DeepL was er geen vooruitgang. Zeker van DeepL hadden we
stiekem wel iets meer verwacht omdat he neurale netwerk sindsdien weer een tijdje heeft kunnen leren.
DUBBELZINNIGHEDEN
Zakelijke teksten komen bij DeepL, Google en Microsoft prima door de parser heen. Het citaat van Douglas Adams geeft al een beetje aan waar het wat begint te kraken. Het wordt nog een stuk lastiger als er dubbelzinnigheden om de hoek komen kijken.
We hebben de vertaaltools de opdracht gegeven om ‘Nergens is meer lawaai van kinderen te horen’ te vertalen naar het Engels. WorldLingo sloeg de plank sowieso mis met z’n ‘Nowhere more crash of children is hear’, wat nog slechter was dan de pogingen van Promt en Babylon. Systran houdt het kort en simpel op ‘Nowhere is more child noise’. Bing doet een dappere poging, maar alleen DeepL en Google Translate maken er een taalkundig juist stukje tekst van (‘Nowhere can more noise from children be heard’ respectievelijk ‘Nowhere can you hear more noise from children’).
DE GRENZEN VAN DEEPL
Bij technische teksten als handleidingen en documentatie is de eerste vertaalslag door DeepL vaak al prima om over te nemen. In de andere gevallen hoef je maar een aantal kleine wijzigingen door te voeren. Maar echte vertalers hoeven niet in paniek te raken dat ze minder boterhammen gaan verdienen dankzij DeepL. Want zelfs DeepL maakt het gebruik van menselijke vertalers op de korte termijn nog niet overbodig.
Integendeel zelfs: het kan zelfs een enorme verrijking zijn. In plaats van een vertaling vanuit een nulpunt te beginnen, kun je het voorwerk door DeepL als template gebruiken en met de drop-downmenu’s passende alternatieven kiezen. De rest corrigeer je handmatig, en daarna kopieer je het resultaat naar je tekstverwerker. Dat zorgt minimaal voor de helft minder werk. De tijd die je bespaart is te gebruiken voor verdere punten op de i’s of om wat meer op te schieten.
Maar dat alles geldt echter alleen voor teksten met een relatief simpele opbouw, bijvoorbeeld handleidingen en brieven. Bij fictie loopt DeepL tegen zijn grenzen aan. De proefvertalingen van Douglas Adams waren af en toe behoorlijk gebrekkig, zodat de tijd die we kwijt waren met herformuleren de oorspronkelijke besparing aan tijd weer ruim teniet werd gedaan.
Ook bij teksten die redelijk vlot geschreven zijn, moet je de ogen altijd nog openhouden. Af en toe maakt DeepL nog een misser, die dan wel via een van de eerste opties onder het drop-down correctiemenu recht te breien valt. We hebben onze opmerkingen naar DeepL gestuurd en kregen te horen dat het machinaal vertalen helaas nog lang niet helemaal perfect is en dus fouten maakt. Wel wordt er continu getraind om de vertalingen te verbeteren. Hoeveel er wordt getraind werd echter niet vermeld, we zagen een aantal fouten op een later tijdstip nog steeds terugkeren.
INTERACTIEF OF STATISCH
Als je DeepL wilt gebruiken, maar de hand op de knip moet houden, dan heb je twee manieren om het te gebruiken: interactief of statisch. De website en de app bieden de interactieve optie via het selecteren van alternatieve vertalingen via een drop-downmenu.
DeepL accepteert ook Office-documenten in de formaten.docx en .pptx. Nadat je het bestand hebt geüploadt, vraagt DeepL naar welke taal er vertaald moet worden. Er volgen een paar seconden denkwerk, en dan zet DeepL een vertaalde versie van het bestand klaar om te downloaden. DeepL verwerkt ook meertalige documenten en behoudt alle gebruikte opmaak, zoals cursief geschreven of dikgedrukte tekst, en vertaalt alle teksten, titels en zelfs voetnoten.
Bij het vertalen naar Engels wordt de apostrof vaak beter gebruikt dan door mensen die Engels als moedertaal hebben. Aan de andere kant krimpen gedachtestreepjes vaak in tot koppeltekens, die je dan achteraf weer naar hun oorspronkelijke formaat moet terugbrengen. Dat is gezien de chaos die de andere online vertalers er van maken een beetje muggenziften, maar voor professionele vertalers kan dat een gemis zijn.
Als je documenten gaat uploaden als gratis gebruiker, vervalt de limiet van 5000 tekens. Het gedownloade document is dan echter beveiligd met een wachtwoord en heeft een banner op de eerste pagina. Het is niet meteen te bewerken. Dat kan met een Pro-abonnement wel. De bescherming tegen bewerken is echter een wassen neus aangezien je de inhoud
compleet kunt kopiëren en inclusief alle opmaak in een nieuw bestand kunt zetten. Zelfs het openen met WordPad, die standaard in Windows 10 zit, heft de ‘schrijfbescherming’ al op.
Via de Proroute heb je wel een versnelde vertaling tot je beschikking: zelfs hele grote bestanden zijn in een paar seconden vertaald. De Profeatures bieden ook toegang tot de API en je teksten worden direct nadat je de vertaling hebt ontvangen weer gewist. De DeepLvertalingen zijn in elke tool voor Computer Aided Translation (CAT) op te nemen. Overigens staat het ondersteunen van extra bestandsformaten op de korte termijn op de planning. Het aantal documenten dat je per maand kunt laten vertalen is afhankelijk van het soort abonnement dat je kiest. Meer over de Proopties lees je verderop.
BLIJVEN OPLETTEN
Op dit moment kan DeepL z’n sterke kanten vooral laten zien via het interactieve gebruik via de website of de app. Als je in de rechterkolom op een woord klikt, verschijnt het dropdownmenu met alternatieve vertalingen. Dat menu stelt niet alleen een alternatief woord voor, maar doet ook een voorstel voor een andere manier om de zin voort te zetten.
De website zet onder de vertaalblokken een terugvertaling van het huidige geselecteerde woord. Dat is een handige optie als je in een taal aan het vertalen bent die je niet zo vloeiend beheerst.
De teksten in het linkeren rechterdeel van de pagina zijn allebei te editen. Op die manier kun je in het origineel een spelfout corrigeren, waar de vertaling dan meteen op reageert. Daarbij gaan alle tot dan toe toegepaste correcties op de vertaling wel de prullenbak in, dus let daar even goed op.
DEEPL PRO
Als je een betaalde versie van DeepL gebruikt, krijg je Officedocumenten die niet beschermd zijn tegen bewerken. Je kunt ook pure tekstbestanden (.txt) uploaden. DeepL Pro is een abonnement dat voor zowel individuen als teams in drie varianten wordt aangeboden: Starter, Advanced en Ultimate.
De goedkoopste versie voor individueel gebruik kost 6 euro per maand, de duurste 40 euro per maand. Teamlicenties zijn gebaseerd op 3+, 20+, 100+ of 500+ medewerkers; meer details daarover staan op de website van DeepL. Ontwikkelaars kunnen rechtstreeks toegang krijgen tot de RESTAPI van DeepL. Developertoegang (afhankelijk van aantal calls) kost 5 euro per maand plus 1 cent voor 500 vertaalde tekens.
De Starterversie van DeepL biedt slechts vijf documentvertalingen per maand en heeft geen koppeling met vertaalsystemen (Computer Aided Translation, CAT). De Advancedversie biedt 20 documentvertalingen per maand en de Ultimate 100 per maand. Voor een DeepLkoppeling met CATsoft ware, moet je minimaal de Advancedversie afnemen. Als je per jaar betaalt kost die 20 euro per maand.
Abonnementen die per maand worden afgerekend vallen opmerkelijk duurder uit: een Starterabonnement kost 9 euro, Advanced 30 euro en Ultimate een fikse 60 euro. DeepL Pro kun je 30 dagen uitproberen, maar als je ermee aan de slag gaat wordt er wel meteen om betaalgegevens gevraagd.
Een van de positieve punten van de Proversie van DeepL is privacy. De gratis versie van DeepL slaat alle originele teksten en vertalingen voor een ‘beperkte tijd’ op om het neurale netwerk te trainen. DeepL belooft bij het gebruik van een Proversie dat alle teksten meteen nadat ze zijn verwerkt in de prullenbak belanden.
Die belofte is wel mooi, maar het is ook aan de gebruiker om geen data die te herleiden is naar personen richting DeepL te sturen. Dat staat ook netjes vermeld in de privacyverklaring op de DeepLwebsite. In veel gevallen zorgt dat ervoor dat het laten vertalen van een document niet erg aanlokkelijk is. Als je bedrijfsinformatie eerst uit het document moet halen en dan later weer handmatig moet toevoegen, kun je net zo goed alleen de relevante passages via de webversie of app laten vertalen.
MEER VERTAALKRACHT
DeepL Pro biedt directe ondersteuning voor de CATtools Across Language Server, MemoQ en SDL Trados. We hebben de integratie van DeepL in Trados Studio 2019 uitgeprobeerd.
Net als DeepL Pro is er ook van SDL Trados Studio een testversie voor 30 dagen beschikbaar. Met de testversie heb je echter geen toegang tot de SDLappstore, en daardoor ook geen toegang tot de plugin voor SDL. De support van SDL was erg coulant en stuurde ons een downloadlink voor de DeepL Translation Provider.
Het koppelen van de DeepLplugin in Trados Studio is geen simpele klus. Daarom bieden DeepL en SDL een stapsgewijze handleiding (zie de link op de pagina hiernaast).
Nadat de koppeling van de Translation Provider succesvol is uitgevoerd, zagen we boven het vertaalvenster een vertalingsvoorstel van DeepL. Dat verscheen tijdens de test meestal vrijwel direct in beeld.
Voor de CATintegratie gelden grotendeels dezelfde vooren nadelen als bij het vertalen van Officedocumenten. Aan de ene kant blijft alle opmaak inclusief tags (bijvoorbeeld hyperlinks) behouden, aan de andere kant heb je geen optie voor het in kleinere delen finetunen van de vertaling via contextafhankelijke dropdownmenu’s.
Bij de inzet van CATtools komen wel weer andere voordelen naar voren, waaronder een consistente vertaling dankzij woordenlijsten en de optie om bij herhaalde vertalingen terug te grijpen op al bestaande vertalingen.
NOG WAT TIPS
Het hangt van je beoogde doel af welke versie van DeepL je het beste kunt gebruiken. Als je de huurders van je buitenlandse vakantiewoningen wilt aanschrijven, kopieer je een paar paragrafen in de webversie en voeg je eventueel nog een disclaimer toe dat het om een machinevertaling gaat en hoopt dat het tot een net resultaat heeft geleid.
Als je vaker moet vertalen, is het wellicht de moeite waard om de app te installeren. Als je DeepL in een zakelijke omgeving installeert, moet je er goed op letten geen persoonsgegevens door te sturen. Voor professionele vertalers is DeepL Pro met de vertaalengine in een CATtool op te nemen.
De conclusie is uiteindelijk dat machinaal vertalen als online dienst flinke sprongen voorwaarts heeft gemaakt. Dat is niet alleen handig voor amateurs, maar ook professionals hebben er zeker baat bij en besparen er tijd mee – en maken de vertalingen stap voor stap steeds beter.
De aanbieders verbeteren de kwaliteit van de vertaalresultaten continu, ook al mogen de rondes met verbeterslagen iets vaker worden uitgevoerd.