Intel muestra Gaudi2: casi tan rápida como la NVIDIA H100, debut en un superordenador y enfocados en Gaudi3

Intel Gaudi2 como tal no ha dado demasiado de qué hablar, y es que el proyecto se ha llevado bastante en secreto, hasta el día de ayer, donde la compañía azul ha lanzado bastantes datos. Además, no solo en lo que respecta al presente y al futuro más inmediato, sino al futuro más lejano, porque aunque los planes para Gaudi2 acaban de arrancar y parece tener un futuro brillante, Pat Gelsinger ha hablado ya de Gaudi3 y de Falcon Shores, los cuales sí que parecen poder enfrentarse de tú a tú con NVIDIA.

El primer plan tras la presentación de los datos de rendimiento frente a la todopoderosa H100 y la GH200 de los verdes, Gelsinger quiso dar a conocer el primer plan para su nueva era en IA: un Superordenador que estará diseñado por Stability AI y que integrará a Gaudi2 con procesadores Xeon Emerald Rapids.

Intel Gaudi2 dará vida al decimoquinto superordenador más rápido en IA del mundo

Intel-Gaudi2-specs

El TOP 15 y por el momento. Los planes de Stability AI para crear este superordenador no son demasiado ambiciosos de entrada, pero prometen actualizar y añadir más nodos con el paso del tiempo. De inicio, lo que han contratado con Intel es la venta de nada menos que 4.000 aceleradores Intel Gaudi2 para IA.

Si eres nuevo o no estás muy puesto en lo que entraña a Gaudi2, déjanos ponerte un poco al día para valorar lo que aquí se está hablando. El acelerador para IA de Intel está enfocado para ofrecer un precio-rendimiento en DL sin precedentes.

Intel-Gaudi2-MLPerf-Benchmarks

Por ello, hace acopio de los 7 nm de TSMC, baratos actualmente, y el chip está pensado para computación heterogénea a base de 24 Tensor Processors Cores, varios motores de multiplicación de matrices duales, 24 unidades de chips de redes 100 Gigabit, además de nada menos que 96 GB de HBM2E con 48 MB de SRAM.

Situados todos, los datos que ha presentado Intel son realmente espectaculares si tenemos en cuenta la potencia de la NVIDIA H100. Como vemos, en GPT-J Benchmark el rendimiento en inferencia está muy por delante de la A100 de NVIDIA, y al mismo tiempo, está realmente cerca de la H100. De hecho, Intel cifra la diferencia en 1.09x en servidor y 1,28x offline de la H100 sobre su Gaudi2, lo cual no está nada mal y sobre todo si el precio acompaña.

Intel Gaudi3 y Falcon Shores, para 2025 con otro salto increíble de rendimiento

Intel-Gaudi2-vs-Gaudi3

Por desgracia, no hay demasiado de qué hablar aquí más allá de lo que mencionó Intel en la presentación de la nueva arquitectura Gaudi de tercera generación.

Lo que tendremos será un rendimiento en BF16 multiplicado por cuatro, dos veces el poder de computación frente a Gaudi2, un impresionante aumento del 50% en el ancho de banda y otro 50% en la capacidad de HBM, que seguramente sea HBM3 por su precio, porque está a punto de salir oficialmente la HBM4 y para 2025 será el estándar TOP, dejando más barata la versión que usará Intel en Gaudi3.

Por último, parece que TSMC también se hará con los chips de esta generación, la cual estará fabricada a 5 nm. Esto es normal, pero es impresionante al mismo tiempo, porque Intel competirá con NVIDIA, otra vez, estando dos nodos por detrás. Veremos los primeros datos de Gaudi3 en IA a mediados del año que viene si todo va bien.