ABC (Andalucía)

CAZAR A CRIMINALES POR LA LENGUA

- BRUNO Por PARDO PORTO

Todos tenemos un ADN lingüístic­o, una huella imborrable que dejamos cuando hablamos o escribimos. Los filólogos Javier Blasco y Cristina Ruiz Urbón utilizan el ‘big data’ para rastrear estas pruebas, y con sus informes ayudan a resolver casos de plagio, suplantaci­ones de identidad o denuncias de acoso laboral

Se empieza estudiando a Cervantes y se acaba cazando mentirosos. O criminales. Al menos ese es el extraño camino que han transitado dos profesores de la Universida­d de Valladolid, hoy metidos a peritos lingüistas, esto es, gente capaz de adivinar quién está detrás de un texto, ya sea una novela o una amenaza de muerte. O de saber la edad del autor de un anónimo. O su sexo. O lo que estaba sintiendo mientras escribía: ira, miedo, presión. Hay mucho subconscie­nte volcado en las palabras. Y hay personas capaces de revelarlo.

No son tahúres, sino expertos en datos. En los datos de la lengua.

Se llaman Javier Blasco y Cristina Ruiz Urbón. Él es catedrátic­o de Literatura, experto en el Siglo de Oro y en el Modernismo. Ella está a punto de doctorarse con una tesis dedicada a revisar las atribucion­es de obras de Cervantes. Fue en 2008 cuando descubrier­on la utilidad de la lingüístic­a forense para las investigac­iones filológica­s, y con tesón se hicieron expertos en la materia: aprendiero­n a trabajar con corpus de textos, a medir y cuantifica­r variables lingüístic­as, a programar en lenguaje R, a crear algoritmos. A analizar, al cabo, los cientos de datos que esconde cada frase.

Por ejemplo: calculan la frecuencia con la que pones un nombre específico después de un posesivo, o si antepones la oración principal a la condiciona­l. O si tienes tendencia a escoger palabras de tres sílabas cuando la anterior es de dos. Detectan hasta tus manías fonéticas: a este sonido le suele seguir este otro, etcétera. También miden tu densidad léxica. Tu abanico de adjetivos. Tu fraseo. Tus conectores predilecto­s. En fin, las posibilida­des son casi infinitas.

«Cada persona tiene su idiolecto, un estilo propio a la hora de escribir o de expresarse, que es individual e intransfer­ible», subraya Ruiz Urbón, en su despacho. A su lado, Blasco asiente: «El dialecto nos diferencia por regiones, el sociolecto por la clase social, el geolecto por la geografía, y el idiolecto es como nuestro ADN lingüístic­o, una suma de múltiples variables». Esta es la clave del asunto: la huella verbal, que es imposible de borrar, no como la dactilar.

«Dos personas pueden coincidir en el valor de su riqueza léxica, que es una variable, o en el uso de las palabras de función, pero si coinciden en varias empiezas a sospechar de que se trata, en realidad, de la misma persona», añade la filóloga.

Esas técnicas, tan novedosas, eran utilísimas para las pesquisas poli

ciales y judiciales. Así que en 2013, estos docentes, tras unos cuantos trabajos ocasionale­s, decidieron fundar Agilice Digital, una empresa de la Universida­d de Valladolid dedicada a resolver, en principio, conflictos de plagio, pero que ha terminado aceptando encargos muy diversos: desde situacione­s de acoso digital hasta suplantaci­ones de identidad, pasando por la detección de ambigüedad­es en contratos que confunden al personal o la elaboració­n de retratos robot a partir de los textos de un desconocid­o. «Al final usamos la lengua prácticame­nte para todo. En cualquier conflicto en el que interviene el lenguaje, un lingüista puede actuar desde un punto de vista científico», asevera Ruiz Urbón.

Ahí va un caso. Una pareja solicita sus servicios porque están recibiendo mensajes anónimos con informació­n delicada sobre ellos. Datos concretos, muy difíciles de saber, muy íntimos. Tienen sus sospechas, así que les entregan los correos electrónic­os en cuestión y varios textos de sus sospechoso­s. Ruiz Urbón y Blasco hacen sus cálculos, comparan y les dan un nombre: la exmujer del novio, que acaba confesando y pidiendo disculpas.

Y otro más. Un denunciado por pegar a un guardia civil afirma que la declaració­n de los dos testigos había sido manipulada por el agente de turno, así que acude a ellos. «Ahí lo que se veía es que dos testigos distintos habían declarado prácticame­nte lo mismo, con puntos y comas. Eso es absolutame­nte imposible», recuerda Ruiz Urbón, al borde de la risa. «Nunca dos personas distintas reproducen más de cinco palabras seguidas exactament­e iguales, salvo que sea un refrán, el nombre de una entidad o una expresión común. A eso lo llamamos ‘verbatim’», explica Blasco.

Múltiples variables

En sus trabajos pueden llegar a manejar hasta setenta y dos variables por texto, aunque hay estudiosos que dicen que esta cifra puede elevarse hasta las mil variables: ventajas de leer con ordenador. «En realidad las variables son las mismas de siempre, lo que ocurre es que claro, ponte a medir a mano, sin ayuda de un texto digitaliza­do, el número de artículos o el de adverbios de una determinad­a categoría. Sería imposible saber cuál es el porcentaje de veces que aparece una palabra en una novela, por ejemplo. O cuál es el verbo más frecuente en la narrativa de Delibes: es abrir, yo lo sé porque lo he cuantifica­do», comenta Blasco. «Lo que nos permiten estas tecnología­s es la ‘distant reading’: un trabajo con ‘big data’, con grandes cantidades de texto. Tradiciona­lmente estábamos condenados a la ‘close reading’, detenida en un texto. Eso nos permitía ver el árbol, pero no el bosque», apostilla.

A pesar de este nivel de detalle, precisan ambos, las afirmacion­es tajantes no son la norma en su profesión. «Nosotros nunca decimos sí o no. Nosotros trabajamos con escalas de probabilid­ad verbal», sentencian.

Ahí va otro suceso: un padre acude a ellos para demostrar que los correos que recibía de su hija adolescent­e, que se había marchado de casa, no eran de ella. Tras comparar los correos sospechoso­s con otros de los que no había dudas confirmaro­n que el progenitor estaba en lo cierto. ¿Es imposible engañar al sistema, fingir ser otro? «No. Si eres hábil puedes usar expresione­s de otro, sus frases, pero hay muchas otras cosas que se te escapan. O muchas veces te preocupas de imitar al otro y no de quitar lo tuyo. O usas sus palabras pero en distintas posiciones, en distintos contextos», responde Ruiz Urbón.

En ese caso, además, hicieron un perfil lingüístic­o del suplantado­r de la hija, que mandaron a la Interpol para ayudar a atraparlo. Estos perfiles los elaboran gra

Actúan en casos de todo tipo

«USAMOS LA LENGUA PARA TODO. CASI EN CUALQUIER CONFLICTO UN LINGÜISTA PUEDE ACTUAR DESDE UN PUNTO DE VISTA CIENTÍFICO»

cias a diccionari­os cargados de metadatos, porque hay palabras que se usan a determinad­a edad o en determinad­os lugares, y eso se mide, se clasifica. El reto ahora es generar mejores diccionari­os, exclusivos para el español y no basados en traduccion­es del inglés. De hecho, Blasco va a dedicar su año sabático a esto. Lleva ya diez mil palabras registrada­s. Y quiere llegar a las veinte mil.

«Yo no las defino, yo las clasifico, las preparo para que estos programas puedan funcionar», avisa. Cada palabra, por tanto, lleva una serie de etiquetas: qué clase de palabra es, a qué campo semántico pertenece o incluso si está asociada a sentimient­os positivos o negativos. Con esos datos es con los que logran cuantifica­r la sentimenta­lidad de un texto, las emociones que en él hay volcadas.

El diccionari­o que utilizan por ahora tiene unas ocho mil palabras, así que el salto es grande. «Cuando estudiamos un texto encontramo­s que cerca del 80 por ciento de las palabras están recogidas en el diccionari­o. Al multiplica­r por tres las voces del diccionari­o esperamos que ese porcentaje ascienda hasta el 90 por ciento… Así podremos sacar más conclusion­es. Por ejemplo, en el diccionari­o actual no existe la categoría de signo político. Nosotros ya hemos conseguido diferencia­r las palabras por su carga social, familiar o religiosa. Es todo un reto», remata Blasco.

Variedad

Con el paso de los años estos peritos lingüistas se han encontrado con situacione­s de todo tipo. Cazaron a un abogado que se había ido a la competenci­a y estaba incumplien­do el pacto de no concurrenc­ia: estaba participan­do en casos que involucrab­an a su anterior empresa, algo totalmente prohibido. También identifica­ron la mentira de una mujer que decía sufrir una situación de acoso sexual en el trabajo, porque había importante­s incoherenc­ias entre las conversaci­ones de la supuesta víctima con una amiga y con los correos que más tarde envió a su jefe para denunciarl­o. Incluso ayudaron a Fernando Trueba a demostrar que el guion de ‘La reina de España’ era exclusivam­ente suyo. Por hacer, hasta han corregido a la administra­ción pública más de una vez, en casos de ambigüedad lingüístic­a: la convocator­ia de un concurso público que por su redacción no dejaba claro cuándo finalizaba el plazo de solicitud, un cuestionar­io para detectar falsos autónomos totalmente sesgado…

«Al principio, la gran mayoría de casos que nos llegaban eran de plagio, tal vez por la difusión mediática que se dio a las acusacione­s de plagio de escritores como Camilo José Cela, Carlos Fuentes o Bryce Echenique, o a la del ministro alemán Karl Theodor zu Guttenberg, que dimitió de su cargo tras ser acusado de plagiar su tesis doctoral. Por no hablar de otros casos más cercanos. Pero de un tiempo a esta parte la gente está empezando a ser consciente de que usamos el lenguaje para todo, tanto en nuestras relaciones profesiona­les como personales», repasa Ruiz Urbón. Cada vez los llaman más, y cada vez su labor parece estar más reconocida. «Las primeras veces íbamos a juicio y decíamos que éramos lingüistas forenses, el propio juez nos miraba como diciendo ‘no sé ni lo que es’. Ahora empieza a haber un gran reconocimi­ento y en muchas de las sentencias se pone en valor nuestro trabajo», celebra Ruiz. Ya se sabe: todo pionero es un Quijote. Al principio.

 ??  ??
 ??  ??
 ?? // FRANCISCO J. DE LAS HERAS ?? DE ESTUDIAR A CERVANTES A PARTICIPAR EN JUICIOS
A la izquierda, Javier Blasco y Cristina Ruiz Urbón retratados en la Universida­d de Valladolid, donde han desarrolla­do su empresa de peritajes lingüístic­os, Agilice Digital
// FRANCISCO J. DE LAS HERAS DE ESTUDIAR A CERVANTES A PARTICIPAR EN JUICIOS A la izquierda, Javier Blasco y Cristina Ruiz Urbón retratados en la Universida­d de Valladolid, donde han desarrolla­do su empresa de peritajes lingüístic­os, Agilice Digital
 ?? ABC ?? Fuente: Agilice Digital
ABC Fuente: Agilice Digital

Newspapers in Spanish

Newspapers from Spain