Grok añade un modelo de generación de imágenes con capacidades de renderizado de texto y rostros
La IA sigue avanzando, y xAI anunció la integración de la generación de imágenes más realistas en Grok. Por si aún no lo sabes, Grok es el chatbot de xAI que está integrado en X (Twitter). Por lo que sí, es una compañía más de Elon Musk. Añadir la capacidad de generar imágenes avanzadas a Grok supone un gran avance para la plataforma. Y más cuando es una característica limitada en soluciones muy populares como ChatGPT. Donde esta característica es exclusiva para los usuarios con una suscripción a ChatGPT Plus con un coste de 20 dólares al mes.
Para ser exactos, el nuevo sistema de generación de imágenes en Grok se impulsará por medio de un sistema autorregresivo avanzado que le permite reproducir texto, logotipos y rostros. Lo más interesante es que se indica que se implementará globalmente para los usuarios de X. Aunque desconociendo si existirá algún tipo de limitación en las cuentas que hasta ahora no pagaban por acceder a Grok, y que desde hace unas semanas han visto desbloqueado el acceso a la misma.
Aurora es el nombre que recibe este generador de imágenes para Grok
El nuevo generador de imágenes de Grok ha sido bautizado inicialmente como Aurora. Se indica que para hacer bien su trabajo se ha utilizado un sofisticado sistema autorregresivo de mezcla de expertos entrenado con miles de millones de ejemplos de Internet. Básicamente, puede predecir los siguientes bits de información combinando texto e imágenes, lo que le permite crear imágenes mucho más realistas que antes.
La gran mayoría de las IA son ya muy eficientes creando imágenes desde cero. Pero el problema llega cuando tienen que crear imágenes a partir de otras imágenes existentes. Por no hablar de pedirle recrear el logo de una compañía. O peor aún, el texto. La IA te crea imágenes ultra realistas pero en muchos casos se equivoca representando una palabra que le has dictado. Y este sería el punto fuerte de Grok gracias al nuevo generador de imágenes Aurora.
Es por ello que xAI afirma que el modelo hace un trabajo particularmente bueno en áreas en las que otros generadores tienen dificultades, como lograr que el texto, los logotipos y los rostros humanos queden perfectos.
Estas mejoras se implementarán tan pronto como la próxima semana
Según indica xAI en su blog oficial. Las nuevas capacidades de Grok ya están disponibles en la plataforma 𝕏 en países seleccionados. Siendo la próxima semana cuando se implemente para todos los usuarios. Adicionalmente, sabemos que Grok permitirá la edición de imágenes, ofreciendo a los usuarios un mayor control creativo y flexibilidad. Como no podía ser de otra forma, Grok te permitirá desde crear hasta texto artístico hasta memes y retratos realistas.
"Grok ya es capaz de generar imágenes de alta calidad en varios ámbitos en los que otros modelos de generación de imágenes suelen tener dificultades. Puede representar con precisión detalles visuales de entidades del mundo real, textos, logotipos y crear retratos realistas de personas.
Nuestro nuevo modelo de generación de imágenes ahora puede tomar imágenes como entrada, lo que ofrece a los usuarios un mayor control creativo y flexibilidad. Pronto pondremos esta función a disposición de los usuarios de la plataforma 𝕏".