OpenAI actualiza la IA de ChatGPT con reconocimiento de voz, imágenes y capacidad de hablar
Con el uso de la inteligencia artificial, podemos crear todo tipo de contenido pidiendo a las IA que nos lo hagan. La era de la IA generativa ya está presente desde hace un tiempo y ChatGPT se ha convertido en la más interesante de todas por su capacidad de ayudarnos y hacer tareas. A pesar de que ya lo vemos bastante avanzado, realmente tiene mucho espacio para mejorar, pues ahora ha recibido una actualización que le permite reconocer imágenes y voz, estando a un paso más de poder conversar con ChatGPT.
La llegada de la inteligencia artificial a nuestras vidas nos ha permitido hacer cosas en una fracción del tiempo. Desde crear arte, música, libros y todo tipo de contenido, la IA es capaz de generarlo con unos resultados cada vez mejores. De hecho, se han llegado a ver avances incluso en deepfakes, los cuales si recordamos eran bastante poco realistas hace unos años. Si bien Midjourney o Stable Diffusion se encargan de generar imágenes y son bastante populares, de nuevo tenemos que centrarnos en ChatGPT por ser el principal protagonista de esta era.
ChatGPT se actualiza: ahora la IA puede "ver, oír y hablar"
OpenAI, los creadores de ChatGPT están constantemente trabajando por mejorar su chatbot y llevarlo al siguiente nivel. A pesar de que no hay ninguna otra IA que pueda competir contra la suya, hay que recordar que el interés por la inteligencia artificial disminuye según pasa el tiempo. OpenAI tiene que estar constantemente innovando y más sabiendo que hay grandes expectativas sobre el futuro de la IA.
Ayer fue cuando OpenAI anunció una actualización de ChatGPT, la cual permitía a sus modelos GPT 3.5 y GPT-4 reconocer la voz y las imágenes. Esto se debe a que ChatGPT podrá analizar las imágenes y reaccionar a ellas, pudiendo formar parte de una conversación de texto. Por otro lado, la aplicación móvil de ChatGPT se actualiza con opciones de síntesis de voz, que se combinarán con el reconocimiento de voz. Según indican, esto podría permitirnos poder entablar una conversación con voz con la IA.
Tendremos 5 tipos de voces distintas a elegir en ChatGPT
Esta actualización de ChatGPT llegará a los suscriptores Plus y Enterprise de la plataforma dentro de un par de semanas. La síntesis de voz se limitará a únicamente iOS y Android, por lo que solo se podrá usar en la aplicación móvil. Por otro lado, el reconocimiento de imágenes se aplicará tanto a móvil como a la versión web. Sobre esto último, OpenAI asegura que podremos añadir una o varias imágenes en las conversaciones de texto con la IA. Como ejemplo que nos han puesto, si le pasamos una foto de lo que hay en nuestra nevera, nos podrá decir que comer.
En la aplicación móvil, podremos utilizar la pantalla táctil para hacer que se centre en alguna parte de las imágenes. Ahora, en cuanto a la síntesis de voz, OpenAI la describe como una forma de mantener conversaciones con ChatGPT, pasando de texto a voz. La IA será capaz de respondernos y tendrá 5 voces sintéticas a elegir: Ember, Breeze, Juniper, Cove y Sky. Estas voces han sido creadas en colaboración con actores de doblaje profesionales, pudiendo elegir entre ellas en cualquier momento.