NVIDIA Blackwell: la GPU más grande del mundo que aumenta x5 el rendimiento en IA respecto a Hopper
NVIDIA anunció durante la GTC su nuevo chip gráfico tope de gama orientado a la Inteligencia Artificial, hablamos de Blackwell. Este no solo es el chip gráfico más grande del mundo, sino que consigue aumentar por cinco el rendimiento del que hasta ahora era la GPU más potente del mundo, Hopper (NVIDIA H100).
La GPU NVIDIA Blackwell también se trata del primer chip gráfico con diseño multichip (MCM) creado por NVIDIA. Y es que básicamente cada chip Blackwell son dos GPU Blackwell unidas entre sí. Ahora bien, la plataforma empleada para que cobre vida combina a dos chips Blackwell completos, junto a una CPU Arm Grace. Veamos más de cerca qué ofrece NVIDIA Blackwell a la industria.
NVIDIA Blackwell aumenta por 5 el rendimiento del mejor chip de IA actualmente existente
La GPU NVIDIA Blackwell se conforma por medio de 208.000 millones de transistores. Estos son 128.000 millones más respecto al chip NVIDIA Hopper. Este chip también incorpora cuatro veces más memoria integrada en el propio die, lo que se traduce en ofrecer hasta 192 GB de memoria HBM3e que, junto a una interfaz de 8.192 bits, arroja un ancho de banda de 8 TB/s.
Este chip está fabricado por TSMC empleando su litografía a 4nm 4NP, mientras que cada GPU que conforma el chip Blackwell se interconecta mediante una interfaz con un ancho de banda de 10 TB/s. NVIDIA Blackwell se conforma con un total de 20.480 CUDA Cores, emplea unos chips de memoria HBM3e de 8 capas, y es capaz de alcanzar un TDP de hasta 700W. Este TDP es el mismo que encontramos en las GPU NVIDIA H100 y H200.
NVIDIA Blackwell es capaz de arrojar un rendimiento en IA de 20 petaFLOPS, lo que se traduce en ser 5 veces más rápida respecto al chip NVIDIA H100. El chip Hopper tope de gama orientado a las cargas de trabajo relacionadas con la IA. Tal y como decíamos, dos de estos chips completos se ven acompañados de una CPU Grace para crear el superchip NVIDIA HB200.
Este superchip cuenta con una CPU con 72 núcleos Arm Neoverse V2 junto a las dos GPU Blackwell, el acceso a 384 GB de memoria HBM3e, y con una interconexión NVLink-C2C con un ancho de banda de 900 GB/s.
Rendimiento del chip NVIDIA Blackwell respecto a NVIDIA Hopper:
- 20 PFLOPS FP8 (2.5x veces más rápido Vs. Hopper)
- 20 PFLOPS FP6 (2.5x veces más rápido Vs. Hopper)
- 40 PFLOPS FP4 (5.0x veces más rápido Vs. Hopper)
- 740B Parameters (6.0x veces más rápido Vs. Hopper)
- 34T Parameters/sec (5.0x veces más rápido Vs. Hopper)
- 7.2 TB/s NVLINK (4.0x veces más rápido Vs. Hopper)
Estamos hablando del chip gráfico más potente del mundo
Gracias a estas mejoras, NVIDIA saca pecho de que Blackwell se trata del chip de IA más potente del mundo. Esta arquitectura emplea los Transformer Engine de 2ª Generación. Estos cuentan con un nuevo soporte de escalado de microtensores y los algoritmos avanzados de gestión del rango dinámico de NVIDIA integrados en los frameworks NVIDIA TensorRT™-LLM y NeMo Megatron.
Esto se traduce en que Blackwell admitirá el doble de tamaños de computación y modelos con nuevas funciones de inferencia de IA en coma flotante de 4 bits. Junto a la 5ª Generación de la interconexión NVIDIA NVLink, se alcanza un un rendimiento bidireccional de 1,8 TB/s por GPU. Esto garantiza una comunicación de alta velocidad sin interrupciones entre hasta 576 GPU para los LLM más complejos.
Las GPU NVIDIA Blackwell cuentan con un mantenimiento preventivo por IA. Esto garantiza la fiabilidad, disponibilidad y facilidad de mantenimiento. Esta IA ejecuta diagnósticos y le ayuda a prever problemas de fiabilidad. Esto maximiza el tiempo de actividad del sistema y mejora la capacidad de recuperación para que las implantaciones de IA a gran escala funcionen sin interrupciones durante semanas o incluso meses. Esto se traduce en reducir los costes operativos.
El GB200 es un componente clave del NVIDIA GB200 NVL72, un sistema multinodo a escala de bastidor con refrigeración líquida para las cargas de trabajo más exigentes. Combina 36 superchips Grace Blackwell, que incluyen 72 GPU Blackwell y 36 CPU Grace interconectadas mediante NVLink de quinta generación.
Además, el GB200 NVL72 incluye unidades de procesamiento de datos NVIDIA BlueField-3 para permitir la aceleración de la red en la nube, el almacenamiento componible, la seguridad de confianza cero y la elasticidad del cálculo en la GPU en nubes de IA a hiperescala. La GB200 NVL72 proporciona hasta 30 veces más rendimiento en comparación con el mismo número de GPU NVIDIA H100 Tensor Core para cargas de trabajo de inferencia LLM y reduce hasta 25 veces el coste y el consumo de energía.