BRUNO PARDO PORTO
Por
Se llaman Javier Blasco y Cristina Ruiz Urbón. Él es catedrático de Literatura, experto en el Siglo de Oro y en el Modernismo. Ella está a punto de doctorarse con una tesis dedicada a revisar las atribuciones de obras de Cervantes. Fue en 2008 cuando descubrieron la utilidad de la lingüística forense para las investigaciones filológicas, y con tesón se hicieron expertos en la materia: aprendieron a trabajar con corpus de textos, a medir y cuantificar variables lingüísticas, a programar en lenguaje R, a crear algoritmos. A analizar, al cabo, los cientos de datos que esconde cada frase.
Por ejemplo: calculan la frecuen
A la izquierda, Javier Blasco y Cristina Ruiz Urbón retratados en la Universidad de Valladolid, donde han desarrollado su empresa de peritajes lingüísticos, Agilice Digital lo mismo, con puntos y comas. Eso es absolutamente imposible», recuerda Ruiz Urbón, al borde de la risa. «Nunca dos personas distintas reproducen más de cinco palabras seguidas exactamente iguales, salvo que sea un refrán, el nombre de una entidad o una expresión común. A eso lo llamamos ‘verbatim’», explica Blasco.
Múltiples variables
En sus trabajos pueden llegar a manejar hasta setenta y dos variables por texto, aunque hay estudiosos que dicen que esta cifra puede elevarse hasta las mil variables: ventajas de leer con ordenador. «En realidad las variables son las mismas de siempre, lo que ocurre es que claro, ponte a medir a mano, sin ayuda de un texto digitalizado, el número de artículos o el de adverbios de una determinada categoría. Sería imposible saber cuál es el porcentaje de veces que aparece una palabra en una novela, por ejemplo. O cuál es el verbo más frecuente en la narrativa de Delibes: es abrir, yo lo sé porque lo he cuantificado», comenta Blasco. «Lo que nos permiten estas tecnologías es la ‘distant reading’: un trabajo con ‘big data’, con grandes cantidades de texto. Tradicionalmente estábamos condenados a la ‘close reading’, detenida en un texto. Eso nos permitía ver el árbol, pero no el bosque», apostilla.
A pesar de este nivel de detalle, precisan ambos, las afirmaciones tajantes no son la norma en su profesión. «Nosotros nunca decimos sí o no. Nosotros trabajamos con escalas de probabilidad verbal», sentencian.
Ahí va otro suceso: un padre acude a ellos para demostrar que los correos que recibía de su hija adolescente, que se había marchado de casa, no eran de ella. Tras comparar los correos sospechosos con otros de los que no había dudas confirmaron que el progenitor estaba en lo cierto. ¿Es imposible engañar al sistema, fingir ser otro? «No. Si eres hábil puedes usar expresiones de otro, sus frases, pero hay muchas otras cosas que se te escapan. O muchas veces te preocupas de imitar al otro y no de quitar lo tuyo. O usas sus palabras pero en distintas posiciones, en distintos contextos», responde Ruiz Urbón.
En ese caso, además, hicieron un perfil lingüístico del suplantador de la hija, que mandaron a la Interpol para ayudar a atraparlo. Estos perfiles los elaboran gra
0 200 400 600