Escritores demandan a OpenAI y Meta por usar su contenido para entrenar sus IA

Tres escritores han demandado a OpenAI, la empresa creadora de ChatGPT, y a Meta, por una violación de sus derechos de autor. Si bien esto sorprende cuando hablamos de una IA generativa, no olvidemos que requiere de una serie de información existente para entrenarla. De ahí la frágil relación entre la inteligencia artificial y propiedad intelectual, algo que se ha convertido en un tema polémico recientemente.

No hay duda que las IA generativas están de moda, se utilizan para generar texto, imágenes e incluso vídeos de forma automática. Si bien estos distan mucho de llegar a la perfección o ser totalmente creíbles, poco a poco van mejorando sus capacidades. Sin embargo, inteligencia significa que tiene la capacidad de aprender y los algoritmos de IA aprenden con cantidades ingentes de datos. ¿Qué ocurre cuando la IA aprende de un contenido con derechos de autor? Pues lo que podemos ver hoy, que es el inicio de demandas legales por apropiarse de algo que no es suyo.

Tres escritores demandan a OpenAI y a Meta por derechos de autor

IA escritores demanda aprendizaje robot plagio contenido

Dos autores de libros estadounidenses se han sumado a la comediante Sarah Silverman en una serie querellas conjuntas contra OpenAI y Meta. Los tres acusan de que estas compañías usan su contenido para entrenar a sus respectivas inteligencias artificiales. En concreto, los autores acusan a la compañía de estar empleando sus libros sin autorización para crear los modelos de lenguaje, los cuales se utilizan para replicar el lenguaje natural de los seres humanos de la forma más creíble posible.

Las pruebas que han presentado se basan en información filtrada de Meta. Esta demostraría que el contenido de sus libros se encontraría entre la información utilizada por la empresa de Facebook para entrenar a su IA. En cuanto a la acusación a OpenAI, se basa en que los resúmenes dados por ChatGPT concuerdan con contenido que copyright, aunque en este caso, la querella es un poco más débil.

En cuanto a la compensación por los daños, por el momento no se sabe la cantidad de dinero que han pedido. Por otro lado, se ha de tener en cuenta que, en caso de que los demandantes ganen, esto podría sentar un precedente, donde los diferentes creadores de contenido podrían vetar a OpenAI, Meta y otras compañías similares a usar su contenido de cara a seguir desarrollando ChatGPT y otras soluciones similares.

La IA roba contenido, pero no voluntariamente

Robo Contenido IA

A la hora de entrenar una IA lo que le estamos enseñando es que aprenda una serie de patrones y qué soluciones son las correctas. Por lo que tarde o temprano, entre todas las permutaciones generadas terminará generando una que sea igual a los datos de entrada. La causa de ello no será otra que esos datos son los correctos y tendrán el visto bueno por parte de la supervisión del propio algoritmo de creación de contenido.

Es decir, las IA generativas suelen tener otra que hace de supervisor y se encarga de descartar los resultados incorrectos. Obviamente, si el resultado final es exactamente igual que un dato que se ha empleado para entrenarla, el supervisor le dirá que dicho dato es correcto. La lógica detrás de la demanda por parte de los escritores a OpenAI y a Meta es fácil de entender desde esa perspectiva, ya que tarde o temprano, sin saberlo esta misma, el contenido generado por las IA será el que se ha introducido con copyright

Simple y llanamente, si se saca el material con derechos de autor de la base de datos, entonces las posibilidades que la IA lo acabe replicando involuntariamente al generar contenido bajaran considerablemente, evitando así los plagios involuntarios. En todo caso, veremos qué sale de esta demanda y que precedentes legales puede sentar, en especial, en los Estados Unidos.