La lucha del periodismo frente al plagio automatizado
Las distintas plataformas, que nacieron para ofrecer periodismo de calidad sin restricciones, se han encontrado en el centro de una lucha contra la replicación no autorizada de sus contenidos. Un ejemplo el portal 404 Media.
La proliferación de la inteligencia artificial (IA) ha generado una ola de plagios que representa un desafío sin precedentes para el periodismo. Antes, ya se sufría ese robo, pero era de menor volumen y más fácil de detectar, ya que los textos se copiaban sin modificaciones.
Ahora, sitios web alimentados por IA no solo roban sistemáticamente contenidos periodísticos de sus fuentes legítimas, sino que usan también la IA generativa para reescribirlos de manera automatizada y presentarlos como propios, haciendo más complicada la labor de detección del robo.
Este creciente fenómeno no solo constituye un hurto del trabajo de periodistas reales, sino que también plantea serias preguntas sobre la ética y la legalidad en la era digital. Ante la falta de regulaciones efectivas que aborden este problema, mientras no haya actuaciones más decididas por parte de la administración, recae en los medios de comunicación buscar soluciones para defender su propiedad intelectual y su labor informativa.
404 Media, un medio independiente fundado en agosto de 2023, ha experimentado de primera mano las consecuencias del plagio asistido por IA. La plataforma, que nació con la intención de ofrecer periodismo de calidad sin restricciones, se ha encontrado en el centro de una lucha contra la replicación no autorizada de su contenido. El equipo de 404 Media ha observado cómo sus artículos, resultado de investigaciones que suponen un coste importante de tiempo y dinero, son sistemáticamente plagiados por bots y redistribuidos en otros sitios web. Estos artículos alterados, aunque conservan la esencia del contenido original, se presentan bajo una nueva forma, dificultando así la identificación del plagio y la protección de los derechos de autor.
En respuesta a esta situación, 404 Media se ha puesto en contacto con sus lectores para explicarles la situación y comentarles que no tienen más remedio que levantar un muro de registro, cuando su intención inicial era la de ofrecer sus artículos de manera completamente abierta. Ahora requieren a los lectores que se registren con una dirección de correo electrónico para acceder a la mayoría de sus artículos.
Procesamiento de texto mediante un parafraseador
Según los responsable de 404 Media, “en diciembre, notamos que artículos en los que invertimos cantidades significativas de tiempo—reportajes que involucraban semanas o meses de investigación, hablar y proteger fuentes, presentar solicitudes de registros públicos, pagar y analizar esos registros, horas o días de escritura, edición y empaquetado—estaban siendo raspados por bots, procesados a través de un “spinner” o parafraseador de artículos de IA, y republicados en sitios web aleatorios”.
Un investigación sobre la inclusión de material de abuso sexual infantil en el modelo de lenguaje de gran tamaño LAION, “una historia sumamente importante y delicada en la que trabajamos casi un año antes de nuestro lanzamiento, con asesoramiento legal y consultas a muchos expertos”, se transformó rápidamente en un artículo titulado “Eliminan una base de datos para entrenar imágenes generativas de IA por contener material de abuso sexual infantil” en un sitio web llamado “Nation World News”.
Otra exclusiva sobre un polizón ruso se convirtió en “Pasajero de LAX llega en vuelo internacional sin pasaporte, visa, ni boleto, según informe” en otro sitio lleno de artículos clonados por IA.
Una entrevista con John Hittler se publicó como “El hombre con el ‘peor apellido en la historia de la humanidad’ revela cómo descubrió sus beneficios” y, por separado, como “Cómo el hombre con el peor apellido en la historia de la humanidad descubrió sus ventajas” en otro sitio web diferente.
Google comercializa más artículos de plagio
Un artículo sobre cómo el plagio generado por IA está apareciendo en todas partes en Google News, mientras que los artículos originales no, “fue rápidamente recogido por un sitio web llamado “Digital Information World” en un artículo completamente ilegible y obviamente generado por IA titulado “El contenido producido por IA se está comercializando en Google News y la compañía lo sabe”, aparentemente escrito por un cirujano dental que publica artículos en el sitio web cada seis minutos, todos los días, según revelan desde 404 Media. Este medio está, además, indexado en Google News.
Según 404 Media, la problemática del plagio asistido por inteligencia artificial no muestra signos de disminución, sino todo lo contrario. En las últimas semanas, uno de sus investigadores ha estado explorando y experimentando con una serie de herramientas de IA diseñadas para alterar artículos para sus usuarios. Una de estas