Google lanza Gemini 1.0, la IA más avanzada para superar a GPT-4 y OpenAI
Desde que ChatGPT se lanzó a finales de noviembre de 2022, no hemos visto que ninguna compañía le pudiese hacer frente. Empresas como Microsoft invirtieron miles de millones en OpenAI y otras como Google diseñaron Bard para hacerle frente, pero no llegó a la altura. Google ha vuelto de nuevo y ha lanzado Gemini 1.0, el modelo de IA más grande que tienen para poder hacer frente a OpenAI y ChatGPT.
Cuando OpenAI lanzó ChatGPT hace algo más de un año, este llegó inicialmente con GPT-3.5. Ya en sus inicios, a todos nos sorprendió de lo que era capaz y a pesar de que no tenía realmente rivales, OpenAI continuó mejorándolo. Poco tiempo después vimos como ChatGPT se actualizó con GPT-4 y hasta ahora este ha sido el modelo de IA más avanzado que tiene la compañía. Era solo cuestión de tiempo que alguien intentase volverle a quitarle el trono a OpenAI y puede que Google sea quien se lo lleve.
Google muestra su nueva IA Gemini en acción
En el video adjunto podemos ver a Gemini, el modelo de IA que se enfrentará a GPT-4 de OpenAI y lo cierto es que las primeras impresiones que da son muy buenas. La demostración de la IA nos demuestra que es capaz de identificar objetos con precisión, describirlos con detalle y responder a todas nuestras preguntas por voz. Google considera que Gemini es el modelo de IA más capaz y general que han creado hasta ahora, tratándose de una IA multimodal. Esto significa que es capaz de generalizar, comprender y combinar distintos tipos de información, incluido texto, imágenes, audio, video e incluso de código de programación.
Además de esto, Gemini ofrece una gran flexibilidad, ya que podrá funcionar en todo tipo de dispositivos, desde smartphones hasta centros de datos de alto rendimiento. Para llevarlo a cabo, Google ha optimizado la IA Gemini en tres modelos distintos:
- Gemini Nano: Este es el modelo más eficiente destinado a ser usado en dispositivos como móviles
- Gemini Pro: El mejor modelo para escalar a una amplia gama de tareas
- Gemini Ultra: El modelo más grande capaz de realizar tareas muy complejas
Gemini tiene un mejor rendimiento que GPT-4 y se implementará en Bard y en el Pixel 8 Pro
Ahora es el momento de hablar del rendimiento de Google Gemini contra el modelo de IA más capaz del mercado actualmente, GPT-4 de OpenAI. Tal y como podemos ver, la nueva IA de Google logra vencer a GPT-4 en prácticamente todo. Si nos vamos al aparatado de textos, el modelo Gemini Ultra tiene un mejor rendimiento y precisión a la hora de compresión lectora, resolución de problemas matemáticos y generación de código en Python. Solo vemos que pierde en el benchmark de HellaSwag, el cual mide el razonamiento y sentido común.
Si ahora nos vamos a las pruebas multimodales, aquí vemos una victoria absoluta para Google. Gemini logra un mejor rendimiento a la hora de detectar y entender imágenes, documentos y matemáticas de manera visual. También es capaz de identificar textos y preguntas en videos y por último, logra una victoria a la hora de traducir automáticamente la voz. Uno de los puntos más fuertes de Gemini 1.0, es que la IA puede comprender texto, imágenes y audio a la vez. Esto le permite tener una mejor comprensión de todo lo que ocurre y así responder de forma más adecuada. A los programadores les interesará saber que Gemini puede comprender, explicar y generar código en Python, Java, C++ y Go.
Tras ver sus características y rendimiento, Gemini 1.0 se implementará en una gran variedad de productos y plataformas. Google indica que a partir de ahora, Bard usará una versión mejorada de Gemini Pro para una mejor comprensión y razonamiento. Estará disponible en inglés y llegará a más de 170 países inicialmente, aunque se expandirá a más territorios e idiomas en un futuro. Por otro lado, el móvil Google Pixel 8 Pro será el primero en emplear Gemini Nano. Esto le proporcionará una función de respuesta inteligente al usar Gboard y WhatsApp, además de poder resumir al grabar audio. En los próximos meses, Gemini se implementará en el buscador de Google, el navegador Chrome, en anuncios y en Duet AI.