NVIDIA Grace CPU Superchip: 2,5x más rápido que 128 Cores de AMD
No pensemos que NVIDIA está mirando el mercado de CPU como algo a evitar, ni mucho menos. Su Grace Superchip es un intento muy serio de los de Huang por meterse de lleno en el sector de los servidores, y tras muchos meses después de la presentación resulta que ahora, finalizando enero, han decidido revelar parte de su rendimiento. Y este es superlativo, al menos bajo las condiciones de los test realizados, porque Grace CPU Superchip tiene un rendimiento superior a 128 núcleos de EPYC Zen 3 de AMD.
Teniendo en cuenta que Grace CPU Superchip es el primer procesador de la marca para centros de datos, la expectativa es máxima como tal. Siendo creado desde cero, y siendo por lo tanto primera generación, NVIDIA ha guardado con recelo su rendimiento, hasta hace solo unos días, donde en el máximo silencio ha mostrado cómo rinde realmente este procesador con dos SoC interconectados.
NVIDIA Grace CPU Superchip: mucho mejor de lo esperado
Antes de nada, un breve resumen para entender qué enfrentamos: Grace CPU Superchip está fabricado en el mejor proceso litográfico disponible para alto rendimiento de TSMC: 4N, exclusivo para NVIDIA y alberga dos SoC idénticos en un solo PCB conectados por NVLink C2C con hasta 900 GB/s de ancho de banda bidireccional.
En total, tenemos 144 núcleos con arquitectura Arm V9-A, dos conjuntos de instrucciones vectoriales SMID a modo de 128 bits, donde cada núcleo aporta 64 KB de L1I, 64 KB de L1D, además de 1 MB de caché L2 y nada menos que 234 MB de L3 a compartir. Estos datos logran una tasa de transferencia en memoria y E/S de nada menos que 3,2 TB/s, lo que unido a LPDDR5X con ECC (1 TB/s como máximo y 960 GB nada menos), nos da un TDP máximo de 500 vatios por unidad.
Visto esto, vamos con los datos de rendimiento, porque son realmente interesantes.
Más rápido que un rack de EPYC Zen 4, mucho más rápido que Zen 3
La tabla refleja solo datos de Grace CPU Superchip en cuanto a rendimiento comparativo con dos EPYC Milan 7763, así que las escalas de mejora son para velocidad y ahorro de energía frente a los datos de estos dos procesadores en doble socket.
Por ello, en OpenFOAM vemos un rendimiento de 2,5 veces con un ahorro de energía de 3,5x, los cuales representan los mejores datos posibles de toda la comparativa. De ahí, ya podemos bajar hasta los 2,4x en eficiencia que consigue en NEMO Y WRF, o el 1,8x que consigue endosarle Grace CPU Superchip en rendimiento en estos test.
Por último, en BWA tenemos un 1,5x de rendimiento y 2x en eficiencia. Teniendo en cuenta el objetivo del producto, está claro que NVIDIA ha conseguido ofrecer el mejor rendimiento por vatio y sin optar, lógicamente, por x86.
Habrá que ver qué es capaz de hacer cuando se le presenten opciones más adaptadas a la arquitectura bajo las propias API de NVIDIA, como son RTX, HPC, IA u Omniverse, pero todo apunta a que si consigue esas diferencias con Zen 3 en los EPYC, y lógicamente está por delante de Zen 4 ante tal despliegue de datos, bajo las mejores condiciones posibles es más que probable que NVIDIA arrebate cuota de mercado en HPC e IA a AMD e Intel. Este 2023 va a ser clave para ver eso, puesto que NVIDIA parte desde el 0% de cuota mundial y es líder ya con sus GPU en estos mismos sectores.