La IA RT-2 de Google permite a los robots aprender sin entrenamiento
La velocidad a la que avanza la inteligencia artificial nos sorprende e impresiona, pues no hemos visto nada igual. Hace apenas unos años la IA la relacionábamos con algo como Siri o la cámara de nuestro teléfono a la hora de realizar enfoques. Ahora en cambio, podemos mandar órdenes en forma de texto y la inteligencia artificial nos genera el contenido que queremos. Pero esto ha ido a muchos otros sectores, pues el modelo de IA de Google llamado RT-2 ha demostrado como los robots pueden aprender más rápido y entender mejor su entorno sin entrenamiento.
Los seres humanos siempre hemos querido progresar a nivel tecnológico, haciendo que la vida se haga más sencilla. A lo largo de toda nuestra existencia, hemos creado herramientas que nos han facilitado nuestro trabajo y aumentado nuestra productividad. Si bien inicialmente estas herramientas eran físicas, luego han pasado a pertenecer al mundo digital. Utilizamos programas para acelerar estos procesos y desde hace poco, lo complementamos con IA que nos automatiza ciertas tareas.
Google muestra como RT-2 permite a los robots aprender sin entrenamiento
La inteligencia artificial y los robots están relacionados casi de forma directa y de hecho, normalmente visualizamos la IA como uno de estos. Soñamos en un futuro donde podamos ser capaces de diseñar robots humanoides y androides inteligentes, aunque aún estamos lejos de eso. Eso no significa que no hagamos progresos, pues ya hemos visto grandes avances en robots humanoides capaces de hablar, responder y expresar emociones.
Esta vez no nos centraremos en estos, sino más bien en máquinas más habituales en los espacios de trabajo, como los brazos robot. Google ha anunciado como su modelo IA Robotics Transformer 2 o RT-2, ha permitido a los robots aprender sin necesidad de un extenso entrenamiento. En todo caso, lo que se ha entrenado es el modelo de IA RT-2, el cual ha permitido transferir los conocimientos a acciones del robot. El equipo de Google DeepMind lo ha catalogado como un modelo de visión, lenguaje y acción (VLA), siendo el sucesor de RT-1.
Tras realizar 6.000 pruebas, RT-2 ha tenido una tasa de éxito del 62%
Entrenar este modelo de IA ha sido más complicado que entrenar un LLM como el que emplean los chatbots. Aquí se han tenido que emplear textos e imágenes provenientes de Internet que pudieran hacer que el robot cumpliera ciertas tareas. Algo similar lo vimos en un brazo robot "chef" que fue capaz de aprender a hacer varios platos de comida. No obstante, en el caso de Google lo que han conseguido es hacer que el robot posea un razonamiento más complejo sin sesiones de entrenamiento.
Según Google DeepMind, el robot que usa la IA RT-2, es capaz de manejar situaciones más complejas y cumplir con éxito las peticiones del ser humano, ya que entiende más conceptos. Para ver los resultados, el equipo realizó más de 6.000 pruebas robóticas y se comparó con el modelo anterior. Si bien con RT-1, el robot consiguió acabar sus tareas un 32% de las veces, con RT-2 este porcentaje se elevó casi hasta el doble, alcanzando un 62% de tasa de éxito. Para ver los resultados de estas pruebas e investigación, tenemos todo el proceso detallado y vídeos.