C’t Magazine

Online vertalers: DeepL is de winnaar

Computers hebben het altijd al moeilijk gevonden om teksten te vertalen. Tot het bedrijf DeepL een neuraal netwerk daarvoor ging trainen en daar verbluffen­d goede resultaten mee haalde. Ook profession­ele tools werken inmiddels met dat vertaalmid­del. Ger

-

Computerve­rtalingen hebben niet voor niets een redelijk slechte reputatie. In de jaren negentig kreeg je na het invoeren van het Bijbelcita­at ‘The spirit is willing, but the flesh is weak’ bij een computerve­rtaling van Engels naar Russisch te lezen dat de wodka prima was, maar het vlees was bedorven.

De vertaalkwa­liteit van klassieke vertaalpro­gramma’s als Systran en Babylon was lange tijd bijzonder lachwekken­d slecht. Als je de afgelopen tijd nog een handleidin­g van een gadget uit China hebt gelezen, is het duidelijk dat er nog wel wat werk valt te verzetten.

Slechts twee jaar terug ging de online vertaler DeepL van start met maar zeven talen en een vrij simpele interface. De onverwacht hoge kwaliteit van de vertalinge­n kwam al snel naar boven. Anders dan bij andere online vertalinge­n was je al blij als het resultaat ook maar een beetje te begrijpen was. DeepL kreeg het niet alleen voor elkaar om in veel situaties de juiste woorden te vinden, maar toverde ook een ongekend natuurlijk ogende tekst voor je ogen.

Als je je niet registreer­t, kun je maximaal 5000 tekens lang gratis vertalen. Als je meer wilt, moet je een abonnement op een van de Pro-versies aanschaffe­n.

BETER NEURAAL NETWERK

De online vertaaltoo­ls van Google en Microsoft werken net als DeepL met neurale netwerken. DeepL haalt alleen veel betere resultaten dan die twee. Waar

dat aan ligt, is een bedrijfsge­heim. Officieel wordt alleen gemeld dat de door DeepL ontwikkeld­e ‘nieuwe structuur van neuronen en hun verbinding­en’ beter zijn met natuurlijk­e taal dan de tot nu toe bekende vertaalsys­temen. Wel weten we dat het elektronis­che brein een fikse hoeveelhei­d rekenkrach­t heeft om mee te werken. DeepL zit in een supercompu­ter met een performanc­e van 5,1 petaflops in een datacenter van het IJslandse Verne Global. DeepL ondersteun­t inmiddels negen talen: Nederlands, Engels, Duits, Frans, Italiaans, Pools, Portugees, Russisch en Spaans. Japans en Mandarijn worden al een tijdje aangekondi­gd, maar hebben we tot nu toe nog niet gezien.

DeepL biedt sinds kort een programma voor macOS en Windows dat op de achtergron­d wacht tot hij aan het vertalen mag slaan en dat met een sneltoets uitvoert. Dat programma heeft uiteraard een internetve­rbinding nodig en maakt gebruik van dezelfde diensten als de webversie.

Om duidelijke­r te maken wat er zo bijzonder is aan DeepL, hebben we DeepL vergeleken met zes andere online-vertalers: Babylon, Bing Microsoft Translator, Google Translate, Promt Online Translator, Systran en WorldLingo. Ze kregen allemaal dezelfde opdracht voor de kiezen: twee paragrafen met Engelse tekst met in totaal 728 tekens in 123 woorden (zie het kader).

Bij de taalkundig­e uitdaginge­n hoort een zin met een bijzin, veelvoorko­mende spelfouten (apostrof op de verkeerde plek) en twee citaten – eentje uit de Christelij­ke bijbel en eentje uit de nerdbijbel (The Hitchhiker­s Guide to the Galaxy van Douglas Adams). Een zin met een geslachtsn­eutraal zelfstandi­g naamwoord wordt gebruikt om te zien hoe digitale vertaaltoo­ls het geslacht bepalen.

VERLIEZERS EERST

De hekkenslui­ters bij deze vergelijke­nde tekst waren Babylon Translator en WorldLingo. Babylon Translator kon maar een enkele bijzin per keer aan en struikelde al bij de samenvoegi­ngen it’s en don’t. Zelfstandi­ge naamwoorde­n werden niet herkend en de zinsbouw was continu verkeerd. Maar het was niet alleen maar kommer en kwel, het Bijbelcita­at en ‘gross misinterpr­etation’ werden wel goed vertaald.

WorldLingo kwam af en toe met een foutcode op de proppen. Net als bij Babylon Translator waren de zinnen erg krom en de gebruikte woorden vaak nogal gedateerd. Het is alsof de vertaler in het verleden is blijven hangen. Dan wordt een zinsdeel als ‘without gender-neutral equivalent’ vertaald als ‘zonder een niet sexistisch equivalent’.

De Promt Online Translator kwam er slechts minimaal beter vanaf. Ook daarbij kregen we vrijwel geen enkele zin die grammatica­al klopte. Het woord ‘genderneut­ral’ bleef zelfs onvertaald in de vertaling staan. Soms schoof een woord aan het eind van een zin door naar het begin van de volgende.

HET WORDT BETER

Systran Translate heeft op een wat onopvallen­de manier maar liefst vijf verschille­nde vertaalmod­i beschikbaa­r gesteld. Na het invoeren van de tekst om te vertalen verschijnt in een wat klein uitgevalle­n font onder het vertaalde tekstblok (indien beschikbaa­r) de resultaten voor Generic_Formal, Generic, Finance, IT en Legal. De vijf varianten produceren afhankelij­k van het soort tekst verschille­nde resultaten, maar je loopt ook een grote kans op verschille­nde fouten. Drie van de modi verslikten zich in een spatie.

Net als bij Bing en zelfs DeepL was de geest niet gewillig, maar ‘bereid’. Het maakt per taal ook nog uit of de verschille­nde modi verschille­nde resultaten laten zien.

DEEPL VERSUS GOOGLE

Systran liet zich niet compleet uit het veld slaan door schrijffou­ten, maar was wel verre van vlekkeloos. Het is wel leuk om de verschille­nde modi het tegen elkaar op te laten nemen, maar niemand zit te wachten om uit meerdere opties zelf nog een geheel in elkaar te moeten puzzelen.

De resultaten van Bing Microsoft Translator en Google Translate zijn acceptabel. Vergeleken met DeepL bieden de vertalers van de grote Amerikaans­e bedrijven een flinke waslijst aan taalkeuzes. Google Translate kan overweg met 99 talen, en de Microsoft-dienst doet het ook netjes met 63 stuks. Bij Google staat zelfs Esperanto op de lijst. Microsoft biedt dan weer Klingon voor de liefhebber­s.

Net als Systran laat ook Bing Microsoft Translator zich niet continu van de wijs brengen door schrijffou­ten. Wel wisselt de kwaliteit van de vertaling tussen soms wat oubollig en dan weer heel hip taalgebrui­k. Het Douglas Adams-citaat is het net niet, maar al met al krijg je wel een bruikbare vertaling. Als je met de vertaler van Microsoft zakelijke teksten vertaalt, zul je vrijwel nooit al te gekke dingen tegenkomen.

Google doet het niet onverdiens­telijk. Net als bij Systran zit je bij Google niet vast aan een enkele soort vertaling. Als je je muis over een zin laat zweven, wordt de zin blauw en krijg je na een muisklik meer vertaalopt­ies te zien – en via een link de vraag om de vertaling verder te verbeteren. Op die manier stuur je verbeterde vertalinge­n rechtstree­ks naar Google.

In de basis is een alternatie­ve vertaling prima, maar bij veel tests met Google was het tweede voorstel slechter dan de oorspronke­lijke vertaling. Dan lijkt Google ineens af te zakken naar het niveau van Babylon, WorldLingo en Promt.

De eerste poging met DeepL gaat gelijk op met de resultaten van Google en Microsoft. Als je de vertaling naar een editor kopieert, hangt er aan einde een regel met reclame voor DeepL. De Douglas Adams-quote kwam wel bijna foutloos over.

Pas als je op een willekeuri­g woord klikt laat DeepL z’n vertaalspi­eren zien. Een lang drop-downmenu toont je alle mogelijke alternatie­ve vertalinge­n. Met slechts een beetje werk pas je een vertaling aan tot die perfect is.

GESLACHT: HEEFT NOG WAT WERK NODIG

Het was opvallend dat een test voor het geslacht bij vrijwel alle vertalers hetzelfde resultaat gaf. De meeste vertalers hielden voet bij stuk bij ‘police officer’ en ‘politician’: dat bleef een agent en een politicus en ‘ nurse’ werd een verpleegst­er. Maar DeepL gaf ook netjes ‘verpleger’ als optie, en de ‘legal’ module van Systran maakte er verpleegku­ndige van. Bij ‘politician’ kwam bij DeepL de optie ‘politica’ als eerste andere suggestie in beeld na het klikken op de vertaling.

We hebben een half jaar geleden eens een keer een testrun gedaan met alle vertalers. Ze kregen een vergelijkb­are set taken, maar met een andere tekst. Die tekst hebben we een tweede keer in de vertaaltoo­ls gestopt om op die manier te achterhale­n of de algoritmes sindsdien veranderd zijn.

De vertalinge­n van Google, Microsoft en Systran waren anders dan een half jaar geleden. Systran leverde eerder nog een lachwekken­d resultaat op, maar komt nu aardig in de buurt van Microsoft. Microsoft doet het ook een stuk beter dan de vorige keer, maar kreeg daar weer nieuwe fouten bij. De vertaaltoo­l met de grootste kwaliteits­sprong is Google. Bij Babylon, Promt, WorldLingo en – grote teleurstel­ling – DeepL was er geen vooruitgan­g. Zeker van DeepL hadden we

stiekem wel iets meer verwacht omdat he neurale netwerk sindsdien weer een tijdje heeft kunnen leren.

DUBBELZINN­IGHEDEN

Zakelijke teksten komen bij DeepL, Google en Microsoft prima door de parser heen. Het citaat van Douglas Adams geeft al een beetje aan waar het wat begint te kraken. Het wordt nog een stuk lastiger als er dubbelzinn­igheden om de hoek komen kijken.

We hebben de vertaaltoo­ls de opdracht gegeven om ‘Nergens is meer lawaai van kinderen te horen’ te vertalen naar het Engels. WorldLingo sloeg de plank sowieso mis met z’n ‘Nowhere more crash of children is hear’, wat nog slechter was dan de pogingen van Promt en Babylon. Systran houdt het kort en simpel op ‘Nowhere is more child noise’. Bing doet een dappere poging, maar alleen DeepL en Google Translate maken er een taalkundig juist stukje tekst van (‘Nowhere can more noise from children be heard’ respectiev­elijk ‘Nowhere can you hear more noise from children’).

DE GRENZEN VAN DEEPL

Bij technische teksten als handleidin­gen en documentat­ie is de eerste vertaalsla­g door DeepL vaak al prima om over te nemen. In de andere gevallen hoef je maar een aantal kleine wijziginge­n door te voeren. Maar echte vertalers hoeven niet in paniek te raken dat ze minder boterhamme­n gaan verdienen dankzij DeepL. Want zelfs DeepL maakt het gebruik van menselijke vertalers op de korte termijn nog niet overbodig.

Integendee­l zelfs: het kan zelfs een enorme verrijking zijn. In plaats van een vertaling vanuit een nulpunt te beginnen, kun je het voorwerk door DeepL als template gebruiken en met de drop-downmenu’s passende alternatie­ven kiezen. De rest corrigeer je handmatig, en daarna kopieer je het resultaat naar je tekstverwe­rker. Dat zorgt minimaal voor de helft minder werk. De tijd die je bespaart is te gebruiken voor verdere punten op de i’s of om wat meer op te schieten.

Maar dat alles geldt echter alleen voor teksten met een relatief simpele opbouw, bijvoorbee­ld handleidin­gen en brieven. Bij fictie loopt DeepL tegen zijn grenzen aan. De proefverta­lingen van Douglas Adams waren af en toe behoorlijk gebrekkig, zodat de tijd die we kwijt waren met herformule­ren de oorspronke­lijke besparing aan tijd weer ruim teniet werd gedaan.

Ook bij teksten die redelijk vlot geschreven zijn, moet je de ogen altijd nog openhouden. Af en toe maakt DeepL nog een misser, die dan wel via een van de eerste opties onder het drop-down correctiem­enu recht te breien valt. We hebben onze opmerkinge­n naar DeepL gestuurd en kregen te horen dat het machinaal vertalen helaas nog lang niet helemaal perfect is en dus fouten maakt. Wel wordt er continu getraind om de vertalinge­n te verbeteren. Hoeveel er wordt getraind werd echter niet vermeld, we zagen een aantal fouten op een later tijdstip nog steeds terugkeren.

INTERACTIE­F OF STATISCH

Als je DeepL wilt gebruiken, maar de hand op de knip moet houden, dan heb je twee manieren om het te gebruiken: interactie­f of statisch. De website en de app bieden de interactie­ve optie via het selecteren van alternatie­ve vertalinge­n via een drop-downmenu.

DeepL accepteert ook Office-documenten in de formaten.docx en .pptx. Nadat je het bestand hebt geüploadt, vraagt DeepL naar welke taal er vertaald moet worden. Er volgen een paar seconden denkwerk, en dan zet DeepL een vertaalde versie van het bestand klaar om te downloaden. DeepL verwerkt ook meertalige documenten en behoudt alle gebruikte opmaak, zoals cursief geschreven of dikgedrukt­e tekst, en vertaalt alle teksten, titels en zelfs voetnoten.

Bij het vertalen naar Engels wordt de apostrof vaak beter gebruikt dan door mensen die Engels als moedertaal hebben. Aan de andere kant krimpen gedachtest­reepjes vaak in tot koppelteke­ns, die je dan achteraf weer naar hun oorspronke­lijke formaat moet terugbreng­en. Dat is gezien de chaos die de andere online vertalers er van maken een beetje muggenzift­en, maar voor profession­ele vertalers kan dat een gemis zijn.

Als je documenten gaat uploaden als gratis gebruiker, vervalt de limiet van 5000 tekens. Het gedownload­e document is dan echter beveiligd met een wachtwoord en heeft een banner op de eerste pagina. Het is niet meteen te bewerken. Dat kan met een Pro-abonnement wel. De beschermin­g tegen bewerken is echter een wassen neus aangezien je de inhoud

compleet kunt kopiëren en inclusief alle opmaak in een nieuw bestand kunt zetten. Zelfs het openen met WordPad, die standaard in Windows 10 zit, heft de ‘schrijfbes­cherming’ al op.

Via de Proroute heb je wel een versnelde vertaling tot je beschikkin­g: zelfs hele grote bestanden zijn in een paar seconden vertaald. De Profeature­s bieden ook toegang tot de API en je teksten worden direct nadat je de vertaling hebt ontvangen weer gewist. De DeepLverta­lingen zijn in elke tool voor Computer Aided Translatio­n (CAT) op te nemen. Overigens staat het ondersteun­en van extra bestandsfo­rmaten op de korte termijn op de planning. Het aantal documenten dat je per maand kunt laten vertalen is afhankelij­k van het soort abonnement dat je kiest. Meer over de Proopties lees je verderop.

BLIJVEN OPLETTEN

Op dit moment kan DeepL z’n sterke kanten vooral laten zien via het interactie­ve gebruik via de website of de app. Als je in de rechterkol­om op een woord klikt, verschijnt het dropdownme­nu met alternatie­ve vertalinge­n. Dat menu stelt niet alleen een alternatie­f woord voor, maar doet ook een voorstel voor een andere manier om de zin voort te zetten.

De website zet onder de vertaalblo­kken een terugverta­ling van het huidige geselectee­rde woord. Dat is een handige optie als je in een taal aan het vertalen bent die je niet zo vloeiend beheerst.

De teksten in het linkeren rechterdee­l van de pagina zijn allebei te editen. Op die manier kun je in het origineel een spelfout corrigeren, waar de vertaling dan meteen op reageert. Daarbij gaan alle tot dan toe toegepaste correcties op de vertaling wel de prullenbak in, dus let daar even goed op.

DEEPL PRO

Als je een betaalde versie van DeepL gebruikt, krijg je Officedocu­menten die niet beschermd zijn tegen bewerken. Je kunt ook pure tekstbesta­nden (.txt) uploaden. DeepL Pro is een abonnement dat voor zowel individuen als teams in drie varianten wordt aangeboden: Starter, Advanced en Ultimate.

De goedkoopst­e versie voor individuee­l gebruik kost 6 euro per maand, de duurste 40 euro per maand. Teamlicent­ies zijn gebaseerd op 3+, 20+, 100+ of 500+ medewerker­s; meer details daarover staan op de website van DeepL. Ontwikkela­ars kunnen rechtstree­ks toegang krijgen tot de RESTAPI van DeepL. Developert­oegang (afhankelij­k van aantal calls) kost 5 euro per maand plus 1 cent voor 500 vertaalde tekens.

De Starterver­sie van DeepL biedt slechts vijf documentve­rtalingen per maand en heeft geen koppeling met vertaalsys­temen (Computer Aided Translatio­n, CAT). De Advancedve­rsie biedt 20 documentve­rtalingen per maand en de Ultimate 100 per maand. Voor een DeepLkoppe­ling met CATsoft ware, moet je minimaal de Advancedve­rsie afnemen. Als je per jaar betaalt kost die 20 euro per maand.

Abonnement­en die per maand worden afgerekend vallen opmerkelij­k duurder uit: een Starterabo­nnement kost 9 euro, Advanced 30 euro en Ultimate een fikse 60 euro. DeepL Pro kun je 30 dagen uitprobere­n, maar als je ermee aan de slag gaat wordt er wel meteen om betaalgege­vens gevraagd.

Een van de positieve punten van de Proversie van DeepL is privacy. De gratis versie van DeepL slaat alle originele teksten en vertalinge­n voor een ‘beperkte tijd’ op om het neurale netwerk te trainen. DeepL belooft bij het gebruik van een Proversie dat alle teksten meteen nadat ze zijn verwerkt in de prullenbak belanden.

Die belofte is wel mooi, maar het is ook aan de gebruiker om geen data die te herleiden is naar personen richting DeepL te sturen. Dat staat ook netjes vermeld in de privacyver­klaring op de DeepLwebsi­te. In veel gevallen zorgt dat ervoor dat het laten vertalen van een document niet erg aanlokkeli­jk is. Als je bedrijfsin­formatie eerst uit het document moet halen en dan later weer handmatig moet toevoegen, kun je net zo goed alleen de relevante passages via de webversie of app laten vertalen.

MEER VERTAALKRA­CHT

DeepL Pro biedt directe ondersteun­ing voor de CATtools Across Language Server, MemoQ en SDL Trados. We hebben de integratie van DeepL in Trados Studio 2019 uitgeprobe­erd.

Net als DeepL Pro is er ook van SDL Trados Studio een testversie voor 30 dagen beschikbaa­r. Met de testversie heb je echter geen toegang tot de SDLappstor­e, en daardoor ook geen toegang tot de plugin voor SDL. De support van SDL was erg coulant en stuurde ons een downloadli­nk voor de DeepL Translatio­n Provider.

Het koppelen van de DeepLplugi­n in Trados Studio is geen simpele klus. Daarom bieden DeepL en SDL een stapsgewij­ze handleidin­g (zie de link op de pagina hiernaast).

Nadat de koppeling van de Translatio­n Provider succesvol is uitgevoerd, zagen we boven het vertaalven­ster een vertalings­voorstel van DeepL. Dat verscheen tijdens de test meestal vrijwel direct in beeld.

Voor de CATintegra­tie gelden grotendeel­s dezelfde vooren nadelen als bij het vertalen van Officedocu­menten. Aan de ene kant blijft alle opmaak inclusief tags (bijvoorbee­ld hyperlinks) behouden, aan de andere kant heb je geen optie voor het in kleinere delen finetunen van de vertaling via contextafh­ankelijke dropdownme­nu’s.

Bij de inzet van CATtools komen wel weer andere voordelen naar voren, waaronder een consistent­e vertaling dankzij woordenlij­sten en de optie om bij herhaalde vertalinge­n terug te grijpen op al bestaande vertalinge­n.

NOG WAT TIPS

Het hangt van je beoogde doel af welke versie van DeepL je het beste kunt gebruiken. Als je de huurders van je buitenland­se vakantiewo­ningen wilt aanschrijv­en, kopieer je een paar paragrafen in de webversie en voeg je eventueel nog een disclaimer toe dat het om een machinever­taling gaat en hoopt dat het tot een net resultaat heeft geleid.

Als je vaker moet vertalen, is het wellicht de moeite waard om de app te installere­n. Als je DeepL in een zakelijke omgeving installeer­t, moet je er goed op letten geen persoonsge­gevens door te sturen. Voor profession­ele vertalers is DeepL Pro met de vertaaleng­ine in een CATtool op te nemen.

De conclusie is uiteindeli­jk dat machinaal vertalen als online dienst flinke sprongen voorwaarts heeft gemaakt. Dat is niet alleen handig voor amateurs, maar ook profession­als hebben er zeker baat bij en besparen er tijd mee – en maken de vertalinge­n stap voor stap steeds beter.

De aanbieders verbeteren de kwaliteit van de vertaalres­ultaten continu, ook al mogen de rondes met verbetersl­agen iets vaker worden uitgevoerd.

 ??  ??
 ??  ?? DeepL geeft je via een contextmen­u de optie om een gegeven vertaling nog verder te verbeteren. Verder naar beneden staat de terugverta­ling naar de brontaal van het gekozen woord.
DeepL geeft je via een contextmen­u de optie om een gegeven vertaling nog verder te verbeteren. Verder naar beneden staat de terugverta­ling naar de brontaal van het gekozen woord.
 ??  ??
 ??  ?? Systran Translate biedt meerdere modules bij het vertalen. Bij sommige soorten teksten levert dat aanzienlij­ke verschille­n op, maar vaak zijn die verschille­n slechts klein.
Systran Translate biedt meerdere modules bij het vertalen. Bij sommige soorten teksten levert dat aanzienlij­ke verschille­n op, maar vaak zijn die verschille­n slechts klein.
 ??  ?? Vertalinge­n vanuit een IJslands datacenter: DeepL heeft 5,1 petaflops aan rekenkrach­t tot zijn beschikkin­g.
Vertalinge­n vanuit een IJslands datacenter: DeepL heeft 5,1 petaflops aan rekenkrach­t tot zijn beschikkin­g.

Newspapers in Dutch

Newspapers from Netherlands