Intel muestra su estrategia para competir con NVIDIA en IA: Gaudi 3, Falcon Shores, software de migración y chips específicos para China

Si NVIDIA prepara un despliegue inmenso de hardware y software para este 2024, siendo la primera en llegar a esta nueva generación de hardware para IA, Intel dice que no se quedará atrás. Por ello, la compañía azul ha compartido gran parte de lo que será la actualización de hardware y software para este año destacando tres ramas en lo primero y dos en lo segundo. Lo más interesante sin duda es Gaudi 3 y Falcon Shores, así como software para atraer clientes mediante el paso del ecosistema de NVIDIA al suyo de manera sencilla y rápida. Así será la estrategia de Intel para el futuro de la IA.

La ventaja que tiene NVIDIA en su "estándar" de software para IA puede verse bastante tocada con lo que ha presentado Intel. La alternativa real a los de Huang es sin duda los de Gelsinger, al menos, mientras AMD coge ritmo de crucero en software y lanza su nuevo hardware a finales de año. Por eso es tan importante lo que acaban de mostrar los azules, porque son la única alternativa real a los verdes.

Intel divide su estrategia de hardware para IA en tres partes: Data Center, Networking y Client & Edge

Intel-estrategia-IA-en-tres-partes---Data-Center,-Networking-y-Client-and-Edge

Dejando a un lado el apartado del software, que como bien reza la diapositiva superior es más prioritario para Intel que el hardware en sí mismo, la estrategia en lo físico se divide en los tres grupos comentados de una manera bastante curiosa:

  • Data Center: Sistemas escalables y Aceleradores o CPU.
  • Networking: Estándares abiertos y altamente configurables con amplias infraestructuras de redes.
  • Client & Edge: PC con IA así como NPU, GPU y CPU.

En el primer punto se lanzan tres pesquisas: Segmentación, sistemas y software. Es la estrategia de Intel en IA para enfrentar a NVIDIA, y para ello vamos a puntualizarlos brevemente:

  1. Segmentación: Dos productos concretos, Gaudi 3 y Falcon Shores.
  2. Sistemas: Propios y externos con socios, ambos con el objetivo de competir con NVIDIA y sus GPU.
  3. Software: El más complejo de los tres. Se engloba dentro del programa Intel Gaudi TPC C-API y tiene múltiples apartados que desgranaremos más tarde.

Segmentación de los productos de IA en hardware: Gaudi 3 y Falcon Shores

Intel-roadmap-IA-2025-Gaudi-3-y-Falcon-Shores

Aunque Intel habla de sus CPU para IA mediante sus Xeon, estos realmente tienen su propio roadmap exclusivo y son una línea aparte que, lógicamente, tenía que ser nombrada, igual que lo será dentro del apartado de sistemas. El objetivo de Intel es crear su NVIDIA SuperChip, salvo que no lo incluirá en un solo producto como hacen los verdes.

De hecho, ya vimos que el plan original era así, y finalmente Falcon Shores se remodeló para quitar la CPU, la cual, queda de manera tradicional en la placa base. Por tanto, dentro de Data Center y su segmentación lo que encontramos en primer lugar es Gaudi 3.

Intel-Gaudi-3-rendimiento-general

Intel ha dado algunas métricas generales antes de su presentación en unos meses, y es muy prometedor. En primer lugar, se pasa a los 5 nm de TSMC, lo que añadirá una mayor densidad por mm2 y el número de unidades debe crecer bastante. Esto lo sabemos porque Intel ha confirmado que el rendimiento en computación BF16 o 2 x FP8 se incrementará por cuatro veces, es decir, será 4 veces más potente que Gaudi 2.

El ancho de banda crece al doble y en HBM se logrará aumentar un 50%. En cuanto a Falcon Shores, la gran promesa de los azules tras retrasos y modificaciones sustanciales, es un pequeño misterio. Lo que ha dicho Intel es que tendrá lo mejor de Gaudi AI como IP, pero al mismo tiempo, lo mejor de las GPU IP. También han recalcado otra vez que su llegada será en 2025 tanto en el sector Low como en High, lo que parece ser una serie de productos y no un producto único en sí mismo.

Nuevas SKU para China en curso

Según ha comentado la compañía, actualmente cumplen perfectamente con las regulaciones que pusieron sobre la mesa Gina Raimondo y Biden, y si estas cambian, adaptarán el hardware para ello:

Nos estamos centrando en asegurarnos de cumplir plenamente con los requisitos de exportación. Siempre lo hemos hecho y somos muy cercanos con el regulador en cuanto a que todo lo que ofrecemos a los clientes de la República Popular China cumple plenamente con las regulaciones. Ya vieron el anuncio de un SKU de Gaudí 2 el año pasado y, a medida que cambia la regulación, también conocemos la definición de los SKU que podemos ofrecer al mercado de la República Popular China.

Tenemos clientes importantes en China y nos estamos asegurando de seguir las regulaciones y esperamos introducir SKU que cumplan con las regulaciones utilizando el mismo hardware de Gaudí, pero con adopciones que los hagan exportables a China.

Por tanto, se puede entender que tanto Gaudi 3 como Falcon Shores tendrán versiones recortadas para China, compitiendo también con NVIDIA y AMD en el mercado más grande del mundo.

Intel Software Abstraction Level: Model Migration, la estrategia en IA se completa

Intel-Software-Abstraction-Level---Model-Migration-para-IA

Como el apartado Networking está más enfocado a las empresas, vamos con el último punto que es realmente novedoso e interesante para todos. Y es que Intel tiene la intención de conseguir un "Grand Chelem".

Para ello se marca 4 líneas de productos bajo el paraguas de su software: GPU, Gaudi 2, Gaudi 3 y Falcon Shores. Esto indica que acoge desde 2023 hasta 2025 en este primer tramo de migración. Porque sí, la palabra clave aquí es migración, para ser específicos y técnicos Intel ha denominado todo como "Model Migration" y consta de dos grandes grupos: High y Low.

Comenzando por Low, está enfocado a ser los puntos de entrada de la comunidad y pretende que los desarrolladores de kernel personalizados empleen el modelo de bajo nivel TPC-C para sus aceleradores Gaudi. En cambio, los desarrolladores del modelo Open AI y Triton deberán migrar a Falcon Shores o sus GPU como su mejor opción de hardware.

Para comprenderlo de forma más simple, Intel quiere ofrecer hardware específico para modelos específicos, no siendo generalistas como NVIDIA.

Las empresas podrán migrar desde NVIDIA hasta el ecosistema Intel con incluir apenas 3 o 5 líneas de código

Intel-migración-desde-NVIDIA-con-3-o-5-líneas-de-código

En el apartado High seguimos teniendo los puntos de entrada para la comunidad, pero se añaden los de Frameworks. Los puntos se dividen según el modelo y aquí sí, Intel es generalista como NVIDIA. Deepspeed y PyTorch estarán dentro del apartado Framework y Hogging Face y Mosaic ML dentro del apartado de la comunidad.

Para los 4 se podrá usar tanto GPU, como aceleradores y Falcon Shores. Los objetivos son claros, hacer que los desarrolladores y empresas de centros de datos migren de NVIDIA hacia Intel con solo añadir entre 3 y 5 líneas de código a los modelos nombrados.

Intel-ecosistema-de-software-para-IA-y-hardware

Esto es tremendamente sencillo para cualquier empresa o desarrollador, lo que añadiría una compatibilidad prácticamente total al hardware de Intel y ahorraría mucho tiempo a todas las empresas, donde solo tienen que gastarlo en la instalación y configuración del nuevo hardware como tal.

Por último, la compañía también dejó entrever que está preparándose para entrar dentro de los segmentos de capacitación (NVIDIA ya tiene su primera formación para desarrolladores oficial) e inferencia. Igualmente, no dieron más datos o fechas concretas.