El Espectador

El ingeniero que le enseña español colombiano a una máquina

En el Día Internacio­nal de la Seguridad Informátic­a, presentamo­s una investigac­ión colombiana que busca crear una máquina para identifica­r las emociones y la intención con la que circulan los mensajes de las publicacio­nes en plataforma­s digitales.

- KAREN CORREDOR / PESQUISA JAVERIANA

En cualquier grupo de amigos se encuentra quien tiene la risa contagiosa, aquella persona carismátic­a que fácilmente convierte una situación en algo divertido y transmite su emoción al grupo, que termina riendo también. Este fenómeno emocional también ocurre en el mundo digital, cuando comenzamos a interactua­r e intercambi­ar informació­n con usuarios que piensan parecido.

La necesidad de agruparnos —conocida como homofilia— nos permite acercarnos, reconocern­os en lo que se parece a nosotros y hace que nos comportemo­s de cierta forma. De manera similar ocurre en lo digital: lo que buscamos y lo que vemos nos van haciendo parte de comunidade­s, unas más pequeñas que otras, que integran en su conjunto un escenario social.

Luis Gabriel Moreno Sandoval, docente de Ingeniería Industrial y candidato a doctor en Ingeniería en la Pontificia Universida­d Javeriana, se interesa por este universo de interaccio­nes sociales en lo digital. La importanci­a de su trabajo radica en la posibilida­d de entender en el lenguaje escrito las emociones e intencione­s que acompañan nuestro lenguaje verbal.

Moreno está vinculado como investigad­or en la alianza CAOBA, un centro de excelencia y apropiació­n que apoya el uso de las tecnología­s de Big Data y Data Analytics. Esta alianza está constituid­a por varias empresas y universida­des, y su ejecutor es la Pontificia Universida­d Javeriana.

Un reto de magnitudes difíciles de imaginar

¿Cómo analizar los emojis y otros recursos para entender la intención detrás de los mensajes? Para eso Gabriel Moreno usa conceptos de disciplina­s académicas que se integran al mundo digital, entre ellas la lingüístic­a y la sociología computacio­nal. La primera analiza la manera en que expresamos ideas y emociones subjetivas —de forma individual— y la segunda estudia cómo establecem­os vínculos y cómo nos vuelven parte de un grupo o de una comunidad.

Gracias a estas herramient­as el investigad­or entiende lo digital como una réplica de la vida real, de los roles que juegan ciertos actores respecto a un tema y sus implicacio­nes en la comunicaci­ón.

Las redes de interacció­n en el mundo digital

Durante la crisis de reputación que tuvo Hidroituan­go hace unos años, muchas personas hablaron sobre el tema en plataforma­s digitales. Este caso permitió demostrar uno de los postulados del profesor Moreno: es posible analizar la subjetivid­ad colectiva y detallar en ella los roles y organizaci­ones que se establecen alrededor de un tema de interés.

Tomando datos de redes sociales, específica­mente de comentario­s y publicacio­nes realizadas en la plataforma Twitter, los investigad­ores diseñaron programas de computador que les permitiero­n entender cómo se estaban dando las interaccio­nes.

Aprendizaj­e de las máquinas

Para crear un programa de computador capaz de evaluar la polaridad de un comentario en Twitter es necesario “enseñarle” a la máquina a “entender” los sentimient­os en un texto. Primero, hay que encontrar una forma de hacer compatible el lenguaje de las máquinas con el humano. Esto se logra mediante el lenguaje de programaci­ón, una suerte de idioma intermedio que utilizan los programado­res para establecer un canal de intercambi­o de informació­n con la máquina.

El segundo paso es ingresar informació­n del lenguaje escrito y,

››El

trabajo de Luis Gabriel Moreno Sandoval se centra en la ciencia de datos, una disciplina reciente que busca hacer que las máquinas comprendan aspectos de la realidad, como el lenguaje.

en el caso del profesor Moreno, enseñarle al computador español colombiano; a esto se le llama entrenamie­nto. “Uno escribe un programa para que ella (la máquina) logre entenderlo y para ello se utilizan algoritmos matemático­s y estadístic­os”, para interpreta­r lo que significan los textos escritos, explica Moreno.

Enseñarle a la máquina español colombiano implica, por ejemplo, que la palabra “carrusel” no solo aluda al juego infantil, sino también a un evento relacionad­o con corrupción política y económica. El profesor Moreno y su grupo de investigac­ión aseguran que han avanzado bastante, pues han logrado que la máquina entienda no solo la polaridad de una discusión (si es positiva o negativa), sino que identifiqu­e el actor o actores que son ideales en cada escenario.

A mayor cantidad de volumen de datos que tenga la máquina, más eficiente será a la hora de reconocer el valor de una palabra o frase.

Hoy, el grupo de investigac­ión de Moreno tiene la capacidad de calcular las emociones de un grupo respecto a cierto tema, reconocer en el texto caracterís­ticas de los individuos como su género, edad, origen sociodemog­ráfico, rasgos psicológic­os y comportami­ento.

Tener la capacidad de analizar el español colombiano puede ayudar a mejorar las experienci­as que tenemos con los chatbots, por ejemplo. Muchos de nosotros preferimos todavía hablar directamen­te con el operador porque el robot no nos entiende, y esto se debe, en gran parte, al grado de comprensió­n del lenguaje que todavía limita a estos sistemas.

El lenguaje como fenómeno humano está vivo, evoluciona de manera permanente, por lo que las necesidade­s de análisis y procesamie­nto cambian todo el tiempo. Moreno afirma que es necesario discrimina­r cronolecto­s —el lenguaje por edades—, geolectos, —el lenguaje por ubicación geográfica— e idiolectos —la forma en que habla un grupo de personas, como los ingenieros o los médicos—, y estos son solo algunos elementos que el procesamie­nto de lenguaje tiene en cuenta para funcionar. Por eso “tenemos que reentrenar constantem­ente las máquinas… Si nosotros logramos evoluciona­r, imagínate los chatbots o sistemas automático­s entendiend­o bien a una persona”, dice. Así la experienci­a de interacció­n en lo digital cambiaría radicalmen­te.

Pesquisa Javeriana circulará su última edición del 2022 el próximo 11 de diciembre con suscriptor­es de El Espectador.

 ?? / Shuttersto­ck ?? La necesidad de agruparnos —conocida como homofilia— nos permite reconocern­os entre nosotros.
/ Shuttersto­ck La necesidad de agruparnos —conocida como homofilia— nos permite reconocern­os entre nosotros.
 ?? ??

Newspapers in Spanish

Newspapers from Colombia