NVIDIA Grace será capaz de ofrecer 144 núcleos con un TDP de 500W
Se ha liberado más información del Hot Chips 34 ya podemos conocer a NVIDIA Grace con todo lujo de detalles. Por si no lo recuerdas, es la primera CPU de NVIDIA orientada al negocio de los servidores, y lo hace a lo grande, ofreciendo una gran potencia y el proceso de fabricación más avanzado de TSMC, los 4 nm.
Como era lógico de esperar, la compañía ha seguido con la tendencia del mercado, por lo que su CPU se basa en una arquitectura ARM que ha sido personalizada para la compañía para adaptarse a la perfección al mercado actual de servidores y la computación de alto rendimiento. Para ello, tendremos dos configuraciones posibles, que es el 'SUPERCHIP' de dos CPUs Grace, o combinar una CPU Grace con una GPU NVIDIA Hopper H100.
NVIDIA Grace ofrecerá hasta 144 núcleos ARMv9 con 234 MB de caché L3 y un TDP de 500W
Vamos a lo que interesa, los detalles, y estos pasan por ofrecer una configuración de hasta 144 núcleos ARMv9 combinando dos CPUs Grace. Cada CPU ofrece 72 de estos núcleos con acceso a 117 MB de memoria caché L3, a 68x líneas PCI-Express 4.0 y disponer de las instrucciones SVE2 además de varias extensiones de virtualización como Nested Virtualization y S-EL2.
También se trata del primer procesador del mundo que cuenta con soporte para el uso de memoria RAM LPDDR5X ECC para alcanzar un ancho de banda de 1 TB/s, cuenta con una interfaz coherente NVLINK C2C con un ancho de banda de hasta 900 GB/s en bruto de forma bi-direccional, que es 7 veces más rápido que la interfaz PCIe 5.0, mientras funciona con una interfaz de muy bajo consumo de sólo 1,3 pJ/bit, es decir, 5 veces más eficiente que el protocolo PCIe.
Ahondando en la información, será capaz de usar hasta 512 GB de LPDDR5X en 32 canales, lo que proporciona un ancho de banda de memoria de hasta 546 GB/s. NVIDIA afirma que la memoria LPDDR5X proporciona el mejor valor si se tiene en cuenta el ancho de banda total, el coste y la necesidad de energía.
Por ejemplo, la memoria DDR5 consume 8 veces más energía y ofrece un ancho de banda de hasta 358 GB/s, mientras que la HBM2e, aporta un ancho de banda de hasta 1,8 TB/s consumiendo la misma energía, pero 64 GB triplica el precio respecto a 512 GB LPDDR5X.
En lo que respecta a las 68 líneas PCIe 5.0, al menos dos de ellas se pueden usar para cuatro enlaces PCIe 5.0 x16 @ 128 GB/s, los restantes se aprovecha en otros menesteres. Dos de estos enlaces PCIe 5.0 x16 se pueden utilizar para dar vida a 12 líneas NVLINK.
la CPU NVIDIA Grace ya ofrece su rendimiento preliminar en benchmarks
En lo que respecta al consumo energético, se podría esperar que cada SUPERCHIP Grace tenga un TDP en torno a los 250W metiendo a la propia memoria LPDDR5X en la ecuación (500W con la GPU), lo que dio como resultado un rendimiento de 370 puntos en SPEC Integer Performance. Como referencia, 2x AMD EPYC 7742 suman un TDP de 450W (sin memoria) con un rendimiento de 667 puntos.
Dos CPUs NVIDIA Grace prometen alcanzar los 740 puntos con un TDP de 500W, cerca de los 861 puntos que alcanzan 2x AMD EPYC 7763 con un TDP combinado de 560W (a parte la memoria).
No es una gran diferencia de rendimiento, pero no tenemos que olvidarnos de que hablamos de procesadores ARM de bajo consumo frente a una de las mejores CPUs x86 del mercado para servidores. A esto se le suma que ocupan un menor espacio, esto también está ligado a su menor consumo energético (ahorro de dinero) y que requiere de soluciones de refrigeración más simples.