NVIDIA en el Computex 2023: DGX GH200 para IA, MGX para servidores, Spectrum-4 con 800 Gbps y Hooper Next
En la presentación de NVIDIA en la Computex de 2023, la marca de las GPU más vendidas del mundo no se ha centrado en el mundo del PC para nada. Es más, no han presentado ningún producto nuevo para el mercado de ordenadores domésticos. Ni una sola mención a ningún modelo desconocido de GeForce RTX y tampoco para hablar de nuevas técnicas de IA para los juegos. Más bien se han centrado en un mercado al alza, la de los servidores en la nube y especialmente los que están pensados para aplicaciones de Deep Learning. Una disciplina en la que llevan años apostando y ahora les está dando sus frutos.
Decir que Jen-Hsun Huang fue visionario al mover NVIDIA más allá del mercado de tarjetas gráficas para juegos para apostar por la Inteligencia Artificial, hace unos años no es peloteo ni faltar a la verdad, su apuesta ha dado frutos y aunque para muchos cueste ver a la marca de verde no hablar de sus potentes tarjetas gráficas para gaming, se puede decir que el mercado más importante para ellos viro hace ya tiempo y estamos ante la constatación de ello.
Así ha sido la presentación de NVIDIA en la Computex 2023
Con el mercado doméstico en recesión por la actual situación económica y la creciente demanda de sistemas de alto rendimiento para la IA, no nos debería extrañar que NVIDIA en la Computex 2023 se haya centrado por completo en presentar productos que no vamos a ver jamás en un PC, pero que refuerzan su apuesta desde hace años en la computación de alto rendimiento y especial en el crecimiento del uso de la inteligencia artificial en esta y de los servicios en la nube. Por lo que no hemos visto a la misma empresa que la de los RTX en la conferencia, sino a la otra cara de la empresa de Jen-Hsun Huang, la que en la actualidad y dada la situación actual es la que le ha permitido llegar a valores en la estratosfera.
NVIDIA DGX GH200
Como ya bien es sabido, Grace Hopper Superchip es la combinación en una sola pieza de hardware, de la CPU Grace con 72 núcleos ARM y la GPU Hopper (H100) creando ambas un sistema completo. Pues bien, la solución que junta ambos chips en una misma placa común ha recibido el nombre de GH200. No se trata por cierto de ninguna revisión de la H100, sino más bien todo ello forma parte de un superordenador al que han bautizado como DGX GH200, el cual NVIDIA ha presentado en esta Computex.
Dicho superordenador estará compuesto por:
- 256 PCB GH200, cada una con una CPU Grace de
72 núcleos y una GPU GH100.
- Le permite llegar a 1 ExaFLOP de potencia, es decir, 1.000.000 de TFLOPS.
- 144 TB de memoria RAM en total.
- 36 NVSwitches para la intercomunicación.
Entre los primeros clientes de NVIDIA que montaran los DGX GH200 se encuentran Google Cloud, Meta y Microsoft. Extrañamente, Amazon Web Services no es uno de los clientes, pero tiene sentido desde el momento en que Grace compite con los chips Graviton. Sin embargo, este sistema presentado por NVIDIA en la Computex 2023 no está pensado para el mercado HPC, sino para el de la IA. Lo cual es una tendencia que puede indicar que en el futuro los de Jen-Hsun Huang separen ambos mercados con dos chips totalmente diferentes.
NVIDIA MGX
Ya a más pequeña escala, NVIDIA en la Computex 2023 también ha presentado su MGX, el cual no deja de ser el factor forma para los servidores de la marca a pequeña escala, es decir, el diseño de la caja que los albergará, así como el sistema de refrigeración, pero todo ello optimizado para los productos de la marca.
Es más, el chip Grace-Grace que engloba en una misma placa dos CPU de 72 núcleos, para un total de 144 se lanzará dentro de los NVIDIA MGX para quienes quieran tener un servidor basado en ARM en la nube. Con ello le declaran a Ampere Computing, Amazon y no nos extrañaría ver algo de la mano de Qualcomm en ese sentido.
Lo bueno del MGX es que no se ha pensado para ser vendido a grandes empresas solamente, sino también a negocios medianos que quieran apostar por un servidor en la nube de bajo coste. Ya sea usando la combinación GH200 o en su defecto una CPU doble. Con el boom de la IA generativa y los servicios que esta ofrece a muchas empresas, no es de extrañar que uno de los productos presentados por NVIDIA en la Computex sea un sistema de este tipo.
NVIDIA Spectrum 4 y Spectrum-X
Desde que compraron Mellanox que la marca verde se metió en el mercado de los controladores de red para servidores, los cuales son una pieza fundamental para el desarrollo de estos. Y en una presentación centrada en servidores de gran tamaño no podía faltar como no un producto de dicha división, en la presentación de NVIDIA en la Computex y más ahora que con el auge de la inteligencia artificial, los anchos de banda entre las diferentes partes de este potente sistema hacen necesarios controladores red que gestione los miles de elementos intercomunicados entre sí de forma eficiente.
Pensad que a los volúmenes que estamos hablando, tal carga de trabajo, solo para gestionar la red local, terminaría por saturar la capacidad de cualquier procesador.
Os podemos asegurar que los chips controladores de red en servidores se han convertido en verdaderos mastodontes, con chips tan grandes como una CPU e incluso a veces como una GPU y con consumos que no son aptos para el mercado doméstico.
Por ejemplo, el recién lanzado Spectrum-4 es un controlador de red capaz de gestionar una red de 800 Gbps x 64 o de 400 Gbps x 128 con un consumo de 500 W y montado en una caja que solo para gestionar la comunicación en un servidor al que han bautizado como Spectrum-X, consume 2000 W en total.
Lo que sorprende es que NVIDIA no haya apostado por Infiniband, pero los proveedores de servicios en la nube prefieren que sus servidores basados en Ethernet. En todo caso es una respuesta al Broadcom Tomahawk 4, otro mastodóntico chip controlador de red pensado para superordenadores y centros de datos de alta velocidad, que dejan a la tarjeta de red de tu PC en un juego de niños.
La cereza en el pastel para NVIDIA en la Computex 2023: nueva GPU HPC para 2024
Ya para terminar, NVIDIA en la Computex 2023 ha anunciado que Hopper tendrá sucesor en 2024, lo curioso es que no han mencionado el nombre en clave Blackwell, pero por el salto en rendimiento que han prometido con el nuevo chip, está claro que no hablamos de una versión refinada del actual H100 y, por tanto, se trata de dicho chip, pese a que lo han llamado Hopper Next.
En todo caso, lo que nos interesa saber es si por fin NVIDIA dará el salto a los Chiplets de una vez por todas. Todavía hemos de ver una configuración de NVIDIA que utilice 8 pilas HBM3, como ocurre con sus rivales de AMD. ¿Es posible que terminemos viendo una GPU compuesta por dos chips? El año que viene saldremos de dudas.