NVIDIA GB200 Superchip con 2x GPU RTX 50 Blackwell: 30x más rápidas en IA y simulaciones, pero solo un 30% más de FP64, ¿adiós al HPC?
Cuando se trata de conseguir el mejor rendimiento en IA, NVIDIA tiene el liderazgo absoluto y esto es algo que no podemos negar. Sus GPU A100 y H100 han sido las más demandadas por parte de toda la industria y hace tiempo que la demanda superó a la oferta. En estos momentos donde adquirir una de estas GPU puede llevar tiempos de espera de meses, hay quienes han preferido aguantar y esperarse a la nueva generación. Queda poco tiempo para que las RTX 50 Blackwell aparezcan y NVIDIA ha aprovechado para mostrar su liderazgo en rendimiento una vez más, con su GB200 Superchip que contiene 2 GPU Blackwell y logra 30 veces más rendimiento en IA y simulaciones.
Este año promete mucho con la llegada de una nueva generación de GPU tanto por parte de NVIDIA como de AMD. De AMD sabemos que las RX 8000 con RDNA 4 no serán muy sorprendentes, debido a que no llegará una gama alta propiamente dicha y nos tendremos que conformar con una GPU media-alta, así que veremos una RX 8800 XT como máximo, probablemente. En cuanto a gráficas profesionales y para IA, la compañía de Lisa Su lanzó su MI300X hace poco, la cual compite contra las H100 de NVIDIA. Sin embargo, NVIDIA no solo lanzará sus RTX 5090 que no tendrán ningún rival en juegos, sino que además prepara las RTX 50 Blackwell para IA.
La NVIDIA GB200 Superchip tiene un rendimiento 30 veces superior en simulaciones e IA
Al igual que los jugadores esperan con ansias las RTX 50 para jugar, tenemos a toda la industria poniendo su atención en la arquitectura Blackwell. Hace unos meses hablamos de esto con las filtraciones de la NVIDIA B100 para IA, la cual tendría 192 GB de memoria HBM3E y con la B200 que llegaría hasta los 288 GB de memoria HBM3E. Precisamente ahora toca hablar sobre la GB200 Superchip, el cual incluye 2 GPU Blackwell junto con una CPU Grace. Aquí podemos ver que ofrece hasta 384 GB de memoria (por lo que tiene 2 GPU B100) y 16 TB/s de ancho de banda.
Podemos ver en la comparativa de rendimiento, como el GB200 Superchip aniquila todo lo que hemos visto hasta ahora. En cuanto a simulaciones, con SpectreX ofrece 13 veces más rendimiento, en Fidelity es 22 veces más rápida y en Reality es 30 veces más rápida. NVIDIA menciona que con Blackwell es posible realizar simulaciones meteorológicas con un coste 200 veces inferior y empleando 300 veces menos energía. Si hablamos de simulaciones de gemelos digitales, algo más relacionado con la IA que tanto interés genera, hablamos de tener un coste 65 veces más bajo gastando 58 veces menos energía.
Cada una de las GPU Blackwell ofrece 45 TFLOPs de FP64, inferior a lo esperado aunque en rendimiento no decepcionan
NVIDIA anuncia que Blackwell ofrecerá un 30% más de potencia de cálculo FP64 respecto a Hooper. Esto es lo que le permite llegar a 90 TFLOPs en FP64 utilizando el GB200 Superchip, por lo que una GPU como la B100 tendrá 45 TFLOPs FP64. Para que nos hagamos una idea, las AMD MI300X tienen 81,7 TFLOPs y la MI300A tiene 61,3 TFLOPs. En este apartado NVIDIA queda bastante por detrás y su H100 ofrecía 67 TFLOPs. Aun así, en rendimiento no decepciona, pues por ejemplo en la prueba de bases de datos, la GB200 es 18 veces más rápida que las CPU tradicionales.
En cuanto a rendimiento en pruebas de inteligencia artificial, NVIDIA vuelve a dominar, pues su GB200 NVL72 logra ganar a la H100 siendo 30 veces superior en GPT con 1,8 billones de parámetros. Además, consigue lograr este rendimiento con 25 veces más eficiencia y un coste total de explotación (TCO) 25 veces inferior. Todos estos resultados son sorprendentes, pero cabe destacar que con NVL72, NVIDIA hace referencia a su superordenador con 36 CPU Grace y 72 GPU Blackwell, por lo que no es una comparativa justa.