NVIDIA cancela su GPU GB200 NVL36x2 de doble rack: los clientes no están interesados

Los retrasos que enfrentó NVIDIA con Blackwell por los problemas con TSMC y las máscaras para la fabricación de las GPU, donde más tarde las tuvieron con los diseños de HBM3e de Samsung, dieron como resultado algunos meses más para su lanzamiento y puesta en escena. En principio, NVIDIA dijo que habría tres opciones, tres modelos de GB200 para poder comprar de cara a trabajar con IA y HPC, pero por desgracia una filtración muy detallada afirma que la opción de doble rack será cancelada. Es decir, la NVIDIA GB200 NVL36x2 es historia, se cancela, y los motivos son curiosos.

No le están saliendo las cosas a NVIDIA, eso seguro, y en cambio, vende como pan caliente. Las previsiones con su GPU más rápida para IA han cambiado y la industria ahora tiene que adaptarse. Una vez más Ming-Chi Kuo da información privilegiada donde los verdes solo tendrán opciones de un rack para vender.

NVIDIA cancela su GB200 NVL36x2 al ser demasiado desafiante el enfoque a tres bandas

NVIDIA-GB200-NVL36x2

Y puede que no tenga que ver realmente con la empresa, sino con las opciones de fabricación, espacio, TDP y rendimiento. Los tres proyectos iniciales denominados como GB200 NVL36, GB200 NVL72 y GB200 NVL36x2 se desarrollaron de forma simultánea, pero este último se cancela por un DevDrop a partir del mes que viene.

¿Qué ocurre? Pues es sencillo de comprender. NVIDIA quería maximizar la producción de NVL36 y usarla para construir rack dobles sabiendo que NVL72 no solo es más cara, sino también más complicada de fabricar por TSMC. Por tanto, se pretendía ofrecer esta solución de dos rack para NVL36x2 con una potencia similar y un consumo solo un poco superior.

El problema es que la realidad ha dictado sentencia, y los clientes no ven ventajas en NVL36x2 frente a NVL72, sino inconvenientes. De hecho, Microsoft ya ha comunicado a NVIDIA que optará por NVL72 en exclusiva, por poner un ejemplo.

Más espacio, más consumo, menos rendimiento

NVIDIA-GB200-NVL72-en-GTC

Son las tres causas por las que NVIDIA ha decidido que su GB200 NVL36x2 se cancela. Los recursos de la compañía, aunque sea gigante, son limitados, y si los clientes no desean esta GPU a doble rack pues no tiene sentido seguir adelante, y tiene sentido.

La NVL72 ahorra espacio en los centros de datos al ser de solo un rack, enfrenta menos desafíos de refrigeración y aumenta la eficiencia de espacio dentro del complejo donde esté instalada. Además, según Kuo, NVL72 ha demostrado internamente tener una mejor eficiencia en inferencia por el diseño de software paralelizable. Sin embargo, en entrenamientos para LLM tanto GB200 NVL72 como GB200 NVL36x2 están muy parejas, lo cual no implica que NVIDIA cancela esta última por consumir algo más: 66 kW por cada rack frente a los 120 kW de la NVL72.

Igualmente, y para terminar, hay otra mala noticia. Kuo afirma que NVIDIA ha sido muy optimista diciendo que la GB200 NVL72 llegaría en la primera mitad del año que viene. El leaker y analista afirma que es más probable que se retrase hacia la segunda mitad del mismo año. Esto es un varapalo muy grande, porque la arquitectura Vera Rubin debería retrasarse casi un año e irse directamente a 2026, aunque sería presentada en 2025.

Será extraño que los clientes reciban su hardware cuando esté a punto de presentarse una nueva arquitectura, en teoría, muchísimo más rápida que Blackwell según vimos en las primeras filtraciones, pero así es NVIDIA, así es el sector de la IA.