Medios y páginas web bloquean bot de OpenAI por miedo a “saqueo” de contenido

Varios medios de comunicación decidieron bloquear la herramienta de rastreo de páginas web usada por OpenAI, creador de ChatGPT, que busca mejorar sus modelos de inteligencia artificial.


FUENTE: AFP

The New York Times, CNN, la emisora australiana ABC y las agencias de prensa Reuters y Bloomberg bloquearon el acceso a GPTBot, el rastreador de páginas web lanzado el 8 de agosto.

Les siguieron otros medios de comunicación franceses, como France 24, RFI, Mediapart, Radio France y TF1. 

“Hay una cosa que no se va a tolerar: el saqueo no autorizado de contenidos”, declaró el lunes en rueda de prensa la presidenta de Radio France, Sibyle Veil.

La misión de GPTBot es recoger todos los datos y la información de páginas web para alimentar sus modelos de inteligencia artificial (IA) generativa.

Pero la start-up californiana, que ha hecho público la manera en que se puede impedir que su robot acceda a los datos de un sitio, se enfrenta a un creciente rechazo de las páginas digitales.

Según Originality.ai, una herramienta que detecta los plagios, casi un 10% de las páginas más importantes del mundo negaron el acceso a GPTBot dos semanas después de su lanzamiento.

Entre ellas Amazon.com, Wikihow.com, Quora.com o el banco de imágenes Shutterstock. Según Originality.ai, la proporción de sitios web que prohíben el acceso a GPTBot aumentará un 5% por semana.

– Remuneración y transparencia –

“No hay ninguna razón para que se beneficien de nuestros contenidos sin contraparte”, señaló Laurent Frisch, director de estrategia digital e innovación de Radio France, a la AFP.

Herramientas de IA como el robot conversacional ChatGPT o generadores de imágenes DALL-E 2, Stable Diffusion y Midjourney se hicieron muy populares el año pasado por su capacidad de generar una gran cantidad de contenidos a partir de breves mensajes de texto.

Pero las empresas responsables de estas herramientas, como OpenAI y Stability AI, se enfrentan ahora a una serie de demandas de artistas y autores que alegan que su trabajo ha sido robado.

“Basta ya de ser saqueados por estas empresas que obtienen beneficios a costa de nuestra producción”, se quejó Vincent Fleury, director digital de France Medias Monde, empresa matriz de France 24 y RFI.

Los directivos de algunos medios de comunicación franceses expresaron también su preocupación por la posibilidad de que sus contenidos sean asociados a información falsa. Exigen que se abran discusiones con OpenAI y otras empresas de IA.

“Los medios deben ser remunerados de manera justa. Nuestro deseo es obtener acuerdos de licencia y pago”, declaró Bertrand Gié, director de la división de noticias del diario Le Figaro.

– Primer paso –

La agencia de prensa Associated Press (AP) allanó el camino en Estados Unidos al firmar en julio un acuerdo con OpenAI que le autoriza a acceder a sus archivos desde 1985 a cambio de tener acceso a su tecnología y experiencia en IA.

OpenAI también se comprometió a entregar cinco millones de dólares al American Journalism Project, una organización que apoya a medios locales, y otros cinco millones en créditos para ayudar a implantar tecnologías de IA.

Un consorcio de medios de comunicación, entre ellos AFP, Associated Press y Gannett/USA Today, publicó en agosto una carta abierta para exhortar a los dirigentes de empresas de IA a pedir permiso antes de usar sus textos e imágenes para generar contenidos.