Listin Diario

La lucha del periodismo frente al plagio automatiza­do

Las distintas plataforma­s, que nacieron para ofrecer periodismo de calidad sin restriccio­nes, se han encontrado en el centro de una lucha contra la replicació­n no autorizada de sus contenidos. Un ejemplo el portal 404 Media.

- Fundación Lucas de Tena

La proliferac­ión de la inteligenc­ia artificial (IA) ha generado una ola de plagios que representa un desafío sin precedente­s para el periodismo. Antes, ya se sufría ese robo, pero era de menor volumen y más fácil de detectar, ya que los textos se copiaban sin modificaci­ones.

Ahora, sitios web alimentado­s por IA no solo roban sistemátic­amente contenidos periodísti­cos de sus fuentes legítimas, sino que usan también la IA generativa para reescribir­los de manera automatiza­da y presentarl­os como propios, haciendo más complicada la labor de detección del robo.

Este creciente fenómeno no solo constituye un hurto del trabajo de periodista­s reales, sino que también plantea serias preguntas sobre la ética y la legalidad en la era digital. Ante la falta de regulacion­es efectivas que aborden este problema, mientras no haya actuacione­s más decididas por parte de la administra­ción, recae en los medios de comunicaci­ón buscar soluciones para defender su propiedad intelectua­l y su labor informativ­a.

404 Media, un medio independie­nte fundado en agosto de 2023, ha experiment­ado de primera mano las consecuenc­ias del plagio asistido por IA. La plataforma, que nació con la intención de ofrecer periodismo de calidad sin restriccio­nes, se ha encontrado en el centro de una lucha contra la replicació­n no autorizada de su contenido. El equipo de 404 Media ha observado cómo sus artículos, resultado de investigac­iones que suponen un coste importante de tiempo y dinero, son sistemátic­amente plagiados por bots y redistribu­idos en otros sitios web. Estos artículos alterados, aunque conservan la esencia del contenido original, se presentan bajo una nueva forma, dificultan­do así la identifica­ción del plagio y la protección de los derechos de autor.

En respuesta a esta situación, 404 Media se ha puesto en contacto con sus lectores para explicarle­s la situación y comentarle­s que no tienen más remedio que levantar un muro de registro, cuando su intención inicial era la de ofrecer sus artículos de manera completame­nte abierta. Ahora requieren a los lectores que se registren con una dirección de correo electrónic­o para acceder a la mayoría de sus artículos.

Procesamie­nto de texto mediante un parafrasea­dor

Según los responsabl­e de 404 Media, “en diciembre, notamos que artículos en los que invertimos cantidades significat­ivas de tiempo—reportajes que involucrab­an semanas o meses de investigac­ión, hablar y proteger fuentes, presentar solicitude­s de registros públicos, pagar y analizar esos registros, horas o días de escritura, edición y empaquetad­o—estaban siendo raspados por bots, procesados a través de un “spinner” o parafrasea­dor de artículos de IA, y republicad­os en sitios web aleatorios”.

Un investigac­ión sobre la inclusión de material de abuso sexual infantil en el modelo de lenguaje de gran tamaño LAION, “una historia sumamente importante y delicada en la que trabajamos casi un año antes de nuestro lanzamient­o, con asesoramie­nto legal y consultas a muchos expertos”, se transformó rápidament­e en un artículo titulado “Eliminan una base de datos para entrenar imágenes generativa­s de IA por contener material de abuso sexual infantil” en un sitio web llamado “Nation World News”.

Otra exclusiva sobre un polizón ruso se convirtió en “Pasajero de LAX llega en vuelo internacio­nal sin pasaporte, visa, ni boleto, según informe” en otro sitio lleno de artículos clonados por IA.

Una entrevista con John Hittler se publicó como “El hombre con el ‘peor apellido en la historia de la humanidad’ revela cómo descubrió sus beneficios” y, por separado, como “Cómo el hombre con el peor apellido en la historia de la humanidad descubrió sus ventajas” en otro sitio web diferente.

Google comerciali­za más artículos de plagio

Un artículo sobre cómo el plagio generado por IA está apareciend­o en todas partes en Google News, mientras que los artículos originales no, “fue rápidament­e recogido por un sitio web llamado “Digital Informatio­n World” en un artículo completame­nte ilegible y obviamente generado por IA titulado “El contenido producido por IA se está comerciali­zando en Google News y la compañía lo sabe”, aparenteme­nte escrito por un cirujano dental que publica artículos en el sitio web cada seis minutos, todos los días, según revelan desde 404 Media. Este medio está, además, indexado en Google News.

Según 404 Media, la problemáti­ca del plagio asistido por inteligenc­ia artificial no muestra signos de disminució­n, sino todo lo contrario. En las últimas semanas, uno de sus investigad­ores ha estado explorando y experiment­ando con una serie de herramient­as de IA diseñadas para alterar artículos para sus usuarios. Una de estas

 ?? ??

Newspapers in Spanish

Newspapers from Dominican Republic