Cloudflare bloqueará los rastreadores por IA en todas las webs ¿Adiós al robo de información para entrenar la IA?

Cloudflare, el principal proveedor de arquitectura de internet, ha anunciado que bloqueará por defecto todos los crawlers (rastreadores) web por IA. ¿Qué significa esto? que webs como la nuestra reducirán enormemente la avalancha de rastreadores gestionados por una IA enfocados en robar el contenido generado para su uso en IA. Esto llega después del aclamo mundial de que las principales compañías de IA están accediendo a contenido sin permiso ni compensación para crear servicios de pago como los chatbot (ChatGPT, por ejemplo).

Con este cambio, Cloudflare empezará a preguntar a los nuevos propietarios de dominios si desean permitir los rastreadores de IA, e incluso permitirá que algunos editores implementen una tarifa de "Pago por Rastreo". Y es que claro, hay que recordar que Google pagará 60 millones de dólares al año a Reddit por utilizar el contenido generado por los usuarios para el entrenamiento de IA.

Cloudflare da un paso más en la ayuda de combatir (o monetizar) los rastreadores por IA

Cloudflare bloqueará los crawlers - rastradores web por IA

En concreto, el programa de Pago por Rastreo permitirá a los editores establecer un precio para que los rastreadores de IA accedan a su contenido. Las empresas de IA podrán consultar los precios y elegir si se registran en la tarifa de "Pago por Rastreo" o no. Por ahora, esto solo está disponible para "algunos de los principales editores y creadores de contenido". Pero Cloudflare afirma que garantizará que "las empresas de IA puedan usar contenido de calidad correctamente, con permiso y compensación".

De esta forma, es evidente que este incentivo se centrará, inicialmente, en los medios más relevantes. Entre ellos, estarán varias editoriales y plataformas en línea importantes, como The Associated PressThe AtlanticFortune, Stack Overflow y Quora. Las cuales han visto en Cloudflare no solo un gran aliado para restringir a los rastreadores de IA. Sino también para monetizar un contenido que hasta ahora estaba siendo robado.

Esto tiene sentido cuando son cada vez más las personas que buscan información a través de chatbots de IA. Desplazando así a los tradicionales motores de búsqueda. Pero claro, la información que refleja estos chatbot, como ChatGPT, proceden de las propias webs. Webs que están experimentando una merma en visitas por este cambio en la tendencia.

"La gente confía más en la IA en los últimos seis meses, lo que significa que no leen contenido original", declaró Matthew Prince, director ejecutivo de Cloudflare, durante el evento Axios Live la semana pasada.

También está trabajando en verificar estos rastreadores de IA

Microsoft demanda uso libros piratas entrenar IA

Cloudflare ha revelado que también se encuentra trabajando con estas empresas de IA para verificar sus rastreadores y permitirles especificar claramente su propósito. Por ejemplo, si utilizan el contenido para entrenamiento, inferencia o búsqueda. Los propietarios de sitios web pueden revisar esta información y determinar qué rastreadores permitir y cuales bloquear.

"El contenido original es lo que hace de Internet uno de los mayores inventos del siglo pasado, y tenemos que unirnos para protegerlo", dijo Matthew Prince en el comunicado de prensa. "Los rastreadores de IA han estado raspando contenidos sin límites. Nuestro objetivo es devolver el poder a los creadores, sin dejar de ayudar a las empresas de IA a innovar".