NVIDIA Computex 2024: presentación de las GPU Blackwell, nueva arquitectura Rubin, avances en IA y más

A lo largo de 2023, NVIDIA experimentó un gran crecimiento gracias a la IA y la elevada demanda de sus GPU. Fue en este año cuando vimos que la demanda superó la oferta y había que esperar semanas o meses para poder recibir estas gráficas. El apartado gaming quedó relevado a una importancia menor en cuanto a ingresos, pero seguía siendo relevante y dominaba con sus RTX 4090. Para averiguar que planea NVIDIA a lo largo de este año y en un futuro próximo, vamos a ver que presentan en su conferencia de la Computex 2024.

NVIDIA ha realizado un streaming en directo de su aportación en la Computex de este año, el cual podremos encontrar en YouTube y probablemente cuando leas la noticia ya habrá finalizado y serás libre de ir adelantando y centrarte en las partes que más te interesan. Este conferencia por parte de NVIDIA tiene una duración de unas dos horas, aunque no empieza hasta después de 15 minutos, así que vamos a tener que acelerar porque hay muchas cosas que comentar.

NVIDIA anuncia en el Computex 2024 todas las novedades de sus GPU Blackwell, mejoras en la IA, NiMs, robótica inteligente y más

Empezamos con Jensen Huang anunciando la importancia de la IA generativa y como su trabajo y productos están provocando un gran impacto positivo en la industria. Tras esto tenemos un resumen de sus tecnologías y aportaciones como trabajos realizados con la Cloud API de Omniverse o NVIDIA ACE NiM para NPC realistas. Una vez acabada, Jensen Huang empieza a contar como la industria solo tiene 60 años y lo mucho que hemos avanzado desde la llegada de las CPU. Pero ahora, las GPU son las que dominan en términos de rendimiento y si combinamos una CPU y una GPU, Huang asegura que podemos conseguir un sistema 100 veces más rápido, con solo 3 veces más consumo y un 50% más caro.

Como no, aquí no podía faltar la frase mítica de Huang que ha dicho en múltiples ocasiones refiriéndose a sus GPU: "Cuantas más compras... más ahorras". Tras esto, toca hablar de plataforma de computación CUDA, la cual se ha expandido y ahora disponemos de muchas librerías. Tenemos así, cuDNN para Deep Learning, Modulus para físicas por IA, Parabricks para secuenciación genética, cuDF para procesamiento de datos y muchas más. Hablando precisamente de cuDF, tenemos una colaboración con Google, donde con solo un clic podemos usar pandas en Google Colab (Google Cloud) consiguiendo 50 veces más rendimiento con GPU NVIDIA en RAPIDs cuDF.

Earth-2 es el gemelo digital de la Tierra y gracias a las GPU y la IA es posible crear simulaciones meteorológicas y pronósticos

NVIDIA Earth 2

Jensen Huang de NVIDIA ha mostrado en la Computex 2024 la hazaña de crear Earth-2, la que denomina como un "gemelo digital de la Tierra". Según el CEO de NVIDIA, podemos realizar simulaciones en esta Tierra virtual para poder predecir el futuro de nuestro planeta. Este proyecto se anunció hace unos años, pero esta vez traen algunas novedades, mostrando como se pueden hacer simulaciones de clima usando Omniverse.

Lo cierto es que los resultados son bastante realistas y viendo como lo han podido integrar en una noticia, se nota bastante verídico. Gracias al poder de la IA, es posible ver en las simulaciones como puede llegar a afectar un fenómeno meteorológico en cualquier lugar del planeta.

NVIDIA NiMs, modelos de IA para la nube y centros de datos que permiten crear agentes de IA realistas

NVIDIA ACE Human

Continuando con la conferencia de NVIDIA, esta presenta sus NiMs, una lista de servicios que incluyen modelos de IA para poder aplicar en la nube, centros de datos y workstations. Esto permitirá a 28 millones de desarrolladores poder crear aplicaciones con IA personalizadas que pueden ayudar a hacer todo tipo de tareas. NVIDIA ha mencionado como ya hay empresas líderes como Foxconn, Pegatron, VMware, Siemens y otras que se apuntan al uso de la IA generativa con NiM.

Una de las particularidades es que se podrán crear agentes IA personalizados especialistas en ciertas temáticas, algo que Meta ya mencionó el año pasado. Además, podemos interactuar con estos agentes con inteligencia artificial, pues NVIDIA ha mostrado que se pueden crear humanos digitales realistas con su personalidad y conocimientos. Estos serán útiles tanto como asistentes virtuales como en comercios o en videojuegos, donde ya vimos el potencial de NVIDIA ACE.

NVIDIA presenta oficialmente Blackwell: 1.000 veces más rendimiento en IA y 350 veces menos consumo que 8 años atrás con Pascal

NVIDIA Blackwell mejoras Computex 2024

Ahora toca ver la parte de la presentación oficial de NVIDIA Blackwell, la próxima generación de GPU que traerá nada menos que 208.000 millones de transistores. Esta traerá la segunda generación de su Transformer Engine, el cual permite cambiar dinámicamente a un nivel de precisión menor como FP4. También se dispone de Secure AI, pudiendo contactar con tus proveedores de servicios y proteger así la IA de robos. Otra mejora es que esta nueva generación de GPU hace uso de la quinta generación de NVLink, permitiendo alcanzar hasta 576 GB/s. El cuarto cambio es el añadido del RAS Engine, un sistema que permite comprobar cada transistor y chip para determinar en que falla.

Por último, tenemos el Decompresion Engine, logrando descomprimir a 800 GB/seg, 20 veces más rápido de lo que se consigue actualmente. Tras esto, llega el momento que muchos esperaban, la presentación oficial de NVIDIA Blackwell, donde nos llama la atención lo grande que es el chip. Tal y como indica Jensen, están en fase de producción y lo que muestra entre manos son dos chips de Blackwell unidos a una CPU Grace para crear el Superchip.

Podemos ver también las increíbles mejoras que ha dado NVIDIA, pues con Blackwell han conseguido 20.000 TFLOPs en FP4, 1000 veces más rendimiento en IA que lo que consiguieron hace 8 años con Pascal. Por otro lado, el consumo de energía de Blackwell es muchísimo menor, requiriendo 3 GWh para entrenar GPT4-1.8T, 350 veces menos que los más de 1.000 GWh que necesitaba Pascal. También podemos dar un vistazo a los racks para servidores con refrigeración líquida. Con la tecnología de interconexión de GPU, pueden crear un sistema que emplea hasta 72 de estas gráficas. Con esto, es posible crear centros de datos con 32.000 GPU con una enorme potencia.

NVIDIA Rubin, primeros detalles de la próxima generación de GPU para centros de datos con HBM4

Vera Rubin GPU Computex 2024

Tras ver Blackwell, NVIDIA ha sorprendido revelando la futura arquitectura de GPU durante esta misma Computex 2024, siendo esta denominada Rubin, en honor a la astrónoma estadounidense Vera Rubin que falleció en 2016. En la imagen podemos ver como tenemos una GPU Rubin con 8 capas de memoria HBM4, mientras que un año después llegará la GPU Rubin Ultra con 12 capas de memoria HBM4.

En cuanto a la plataforma Vera Rubin, en lugar de usar una CPU Grace como hemos tenemos actualmente, esta empleará una nueva CPU Vera y como no, llegarán nuevas mejoras. Tenemos así, NVLink 6 Switch, que multiplicará por 6,25 la velocidad de NVLink 5, llegando a 3.600 GB/segundo. También tendremos CX9 SuperNIC para alcanzar velocidades de 1.600 GB/segundo junto a un chip X1600 para Ethernet.

Los robots se vuelven más inteligentes con la implementación de NVIDIA Jetson Thor en su interior

Robots IA NVIDIA

Por último, se han anunciado novedades en la Computex 2024 sobre robótica y el uso de las IA con grandes modelos de LLM para poder acelerar el aprendizaje de estos robots. Así es como empiezan a crearse robots inteligentes que tienen integrados ordenadores como el NVIDIA Jetson Thor en su interior. Una de las cosas que más nos ha llamado la atención, es que la compañía ha enseñado como es posible crear una fábrica robótica donde se emplean robots que usan la plataforma NVIDIA Isaac con IA generativa para montar los superchips de NVIDIA.