Microsoft también se enfrenta a una demanda por usar libros piratas para entrenar su modelo de IA
Hoy conocemos que Microsoft se enfrenta a una demanda colectiva dirigida por un grupo de autores que afirman que la compañía utilizó sus libros sin permiso para entrenar a su modelo de inteligencia artificial Megatron. Lo malo para estos autores, es que esta noticia llega apenas un día después de conocer que en Estados Unidos un Tribunal indicara que entrenar las IA con material protegido por derechos de autor era legal.
En concreto, estos autores alegal de que no solo entrenaron su IA con material protegido. Sino que todos los libros empleados eran versiones digitales pirateadas de sus libros para enseñar a su IA a responder a indicaciones humanas. Y el problema adicional, es que esta demanda también se está realizando en los Estados Unidos. Concretamente se presentó el pasado martes en el tribunal federal de Nueva York. Así que estamos ante un caso más, de bastantes, donde autores, medios de comunicación y otros titulares de derechos de autor han demandado a una empresa tecnológica por recurrir a su material para el entrenamiento de IA.
Microsoft es solo una compañía más que ha recurrido a libros para entrenar sus IA
Microsoft se une así al selecto grupo de compañías como Meta Platforms, Anthropic y OpenAI. Y es que todas ellas han sido demandadas por el presunto uso de material protegido por derechos de autor en el entrenamiento de IA. Meta (Facebook) tiene el placer de tener el caso más sonado de todos. Donde se mostró que, con el beneplácito de su propio CEO, Mark Zuckerberg, se descargaron más de 82 TB de libros pirateados por Torrent. La finalidad de estos libros fue entrenar su modelo de inteligencia artificial Llama. Si bien actualmente hay una demanda. Se dar por sentado de que Meta podrá esquivar cualquier multa reclamada por daños y perjuicios.
Volviendo al tema en cuestión. La demanda contra Microsoft por usar libros pirata, se presentó un día después de que un juez federal de California dictaminara que Anthropic hizo un uso legítimo. Eso, conforme a la ley estadounidense de derechos de autor, del material de los autores para entrenar sus sistemas de IA, pero que aún podría ser responsable de piratear sus libros. Fue la primera decisión en Estados Unidos sobre la legalidad del uso de materiales protegidos por derechos de autor sin autorización para el entrenamiento generativo de IA.
Reuters indica que los portavoces de Microsoft no respondieron de inmediato a una solicitud de comentarios sobre la demanda por el uso de los libros. Mientras que un abogado de los autores se negó a hacer declaraciones ligadas a esta disputa legal.
Cerca de 200.000 libros pirateados para entrenar el modelo de IA
En cuanto a la demanda de los autores, se indica que Microsoft hizo acopio de una colección de casi 200.000 libros pirateados para entrenar a Megatron. Si bien te puedes creer que hablan de un personaje de Transformers, realmente es un modelo de IA. En concreto, un algoritmo que proporciona respuestas textuales a las indicaciones del usuario. La denuncia afirma que Microsoft utilizó el conjunto de datos pirateados para crear un "modelo informático que no solo se basa en el trabajo de miles de creadores y autores, sino que también está diseñado para generar una amplia gama de expresiones que imitan la sintaxis, la voz y los temas de las obras protegidas por derechos de autor con las que se entrenó".
Todas las empresas tecnológicas ligadas a la IA han alegado que hacen un uso legítimo del material protegido por derechos de autor para crear contenidos nuevos y transformadores. Por lo que verse obligadas a pagar a los titulares de los derechos por su trabajo podría obstaculizar la floreciente industria de la inteligencia artificial.
Por su parte, en la demanda, se recoge que los autores de los libros están solicitando una orden judicial que bloquee la infracción de Microsoft. Y claro, una indemnización por daños y perjuicios de hasta 150.000 dólares por cada obra que Microsoft supuestamente haya utilizado indebidamente.