Gemini 2.0 ya está aquí: así es el modelo de inteligencia artificial más potente de Google
Google anunció en la tarde de ayer su nuevo y más avanzado modelo de inteligencia artificial: Gemini 2.0. Como un rápido, muy rápido resumen, Gemini 2.0 ahora es capaz de generar imágenes y audio. Además de funcionar de una forma mucho más rápida, y es más eficiente en términos de costes. Si quieres la información más detallada, simplemente tendrás que seguir leyendo.
"La información está en el centro del progreso humano. Por eso nos hemos centrado durante más de 26 años en nuestra misión de organizar la información del mundo y hacerla accesible y útil. Y por eso seguimos ampliando las fronteras de la IA para organizar esa información en todas las entradas y hacerla accesible a través de cualquier resultado, de modo que pueda ser realmente útil para usted". Dijo Sundar Pichai, CEO de Alphabet (Google).
Breve descripción de las mejoras implementadas en Gemini 2.0
Gemini 2.0 llega prácticamente un año después de que Google anunciara Gemini 1.0. Desde entonces, el CEO de Alphabet indica que millones de desarrolladores construyen con Gemini. Gemini 2.0 es un nuevo avance para conseguir increíbles logros en la inteligencia artificial. Existirá una familia de modelos, siendo uno de ellos Gemini 2.0 Flash, una versión experimental enfocada a la baja latencia y rendimiento mejorado a la vanguardia de la tecnología de Google. Este se basa en Gemini 1.5 Flash, el cual indican que es el modelo más popular hasta el momento para los desarrolladores. Pero mejor centrémonos en el uso en general para los usuarios de a pie. Y es que, por ahora, esta será la única versión disponible.
Gemini 2.0 añade numerosas mejoras. Entre ellas el razonamiento multimodal, comprensión de contexto largo, y seguimiento y planificación de instrucciones complejas. También integra un sistema de llamada de funciones compositivas, de uso de herramientas nativas y latencia mejorada. Descuida, pasamos al castellano ahora.
Y ahora te explico en castellano, y de una forma entendible, sus mejoras
Mejor explayarnos explicando Gemini 2.0 de una forma fácil de entender y sin saturarte. Este modelo se ha diseñado para avanzar hacia una era "agente", donde los modelos son más capaces de comprender, planificar y actuar con supervisión humana. Los avances multimodalidad implica que ahora la IA soporta entradas y salidas nativas en texto, imágenes, audio y video. Siendo capaz de generar imágenes nativas y de texto a audio multilingüe personalizado.
Gemini 2.0 Flash ofrece respuestas más rápidas, con la mitad de latencia, que Gemini 1.5 Pro. Entiende mejor las instrucciones complejas y planificaciones. Tiene la habilidad de realizar acciones con supervisión humana, abriendo la puerta a agentes más autónomos. Se puede integrar en herramientas como Google Search, ejecución de código y funciones definidas por terceros. Es decir, que la versión actualmente disponible, la más básica, es mejor que la más avanzada de anterior generación. Siendo un Gemini 2.0 Pro, en un futuro cercano, su modelo más avanzado.
También se puede adoptar como un asistente virtual en dispositivos como móviles y gafas, dentro de un navegador web, un agente que ayude con flujos de trabajo en GitHub, como un asistente para videojuegos capaz de tomar estrategias en tiempo real, o simplemente para ayudarme mejor con tus deberes o trabajo. La idea de Google es también aplicar esta IA a prácticamente todas sus líneas de producto.
"Esta semana, hemos empezado a probar Gemini 2.0 en las descripciones generales de IA en la Búsqueda y, a principios del año que viene, ampliaremos Gemini 2.0 a más productos de Google".