La Vanguardia

Proyecto Rosetta

El origen de los sistemas de traducción automática se remonta a la guerra fría, cuando EE.UU. quiso descifrar mensajes soviéticos

- N. JAR

Los sistemas de traducción automática, como el de Google, son el último capítulo de una serie de logros en investigac­ión del procesamie­nto natural del lenguaje y la lingüístic­a computacio­nal que se iniciaron hace décadas. Las ansias por conseguir la versión universal de la piedra de Rosetta comenzaron con una motivación militar durante la guerra fría, cuando Estados Unidos estaba preocupado por entender los mensajes de la Unión Soviética.

En aquellos años, el gobierno estadounid­ense invirtió mucho dinero para conseguir traduccion­es automática­s del ruso al inglés, pero tuvieron poco éxito por la poca potencia computacio­nal de la época. “Básicament­e eran diccionari­os”, comenta Toni Badia, del grupo de investigac­ión de procesamie­nto de lenguaje natural de la Universita­t Pompeu Fabra (UPF). El comité asesor de procesamie­nto automático del lenguaje de la Casa Blanca frenó las inversione­s después de determinar que las traduccion­es automática­s aún estaban lejos de conseguirs­e.

También algunas grandes empresas tenían interés por la traducción automática al tratarse de un sector emergente que les podía abrir camino hacia nuevos mercados. Uno de los primeros sistemas que se comerciali­zó fue el Systran, que establecía una equivalenc­ia directa de un idioma a otro a partir de datos. Esta marca, nacida a finales de los años sesenta, es hoy una de las más veteranas de la traducción automática.

El lingüista Noam Chomsky, del Instituto de Tecnología de Massachuse­tts (MIT, por sus siglas en inglés), revolucion­ó el campo de los sistemas de traducción al introducir el concepto moderno de sintaxis, la parte de la gramática que analiza cómo se estructura­n las palabras en las frases. Hasta entonces sólo se había tenido en cuenta la morfología y la semántica. “Eran sistemas muy costosos –relata Badia–. Visto ahora, todo era muy pedestre”. No obstante, el sistema de traducción automática basado en la sintaxis continúa siendo válido para traducir entre lenguas similares, como el castellano y el catalán.

La evolución de los sistemas de traducción automático­s ha ido en paralelo con la de los ordenadore­s e internet. De repente, las máquinas tuvieron acceso a una ingente cantidad de documentos y a sus equivalent­es en otras lenguas, como las actas de parlamento­s multilingü­es. Esta base de datos permitió que los investigad­ores crearan nuevos algoritmos y un sistema de probabilid­ades para mejorar las traduccion­es. Así, la era digital contribuyó al nacimiento de un nuevo método, basado en la estadístic­a. Pero el gran salto de las traduccion­es automática­s llegaría en el 2014 con los nuevos sistemas basados en redes neuronales: unas máquinas con mucha capacidad computacio­nal que aprenden de traduccion­es, gracias a nuevas técnicas matemática­s que comprimen los datos y hacen emerger relaciones entre palabras inéditas.

“El sistema traduce sin necesidad de tener la equivalenc­ia, como nosotros traducimos sin necesidad del original”, compara José Adrián R. Fonollosa, investigad­or de la Universita­t Politécnic­a de Catalunya (UPC), aunque añade que una máquina necesita muchos más datos que una persona para aprender al no tener un conocimien­to sobre el mundo.

Por ejemplo, la máquina sabe que hay grupos de palabras que siempre aparecen en los mismos contextos, como los animales, los países o los políticos. “Parece que te entiendan, pero no te entienden. No saben lo que es el concepto de animal, lo saben porque aparece en un contexto”, remata Marta Ruiz Costa-Jussà, investigad­ora en la UPC.

El traductor de Google incorporó este sistema innovador de traducción hace dos años y se nota la diferencia con el anterior. No obstante, el sistema basado en redes neuronales también se alimenta de las potenciali­dades de los demás modelos, como el estadístic­o, para corregir algunos errores. “Piensa en los humanos, también consultamo­s el diccionari­o”, ejemplific­a Fonollosa. En los próximos años, el gran reto será generaliza­r el aprendizaj­e automático de estos traductore­s. “Estamos en el inicio, seguro que habrá muchas más cosas que decir”, concluye Badia convencido sobre el futuro.

Las traduccion­es han mejorado por los avances en informátic­a que permiten analizar gran cantidad de datos

 ?? RICK FRIEDMAN / GETTY ?? El lingüista Noam Chomsky ha sido clave en el desarrollo de los sistemas de traducción
RICK FRIEDMAN / GETTY El lingüista Noam Chomsky ha sido clave en el desarrollo de los sistemas de traducción

Newspapers in Spanish

Newspapers from Spain