Falcon Shores 2 llegará en 2026, pero Intel afirma que ya es competitiva frente a NVIDIA en GPU para IA, ¿es verdad?
En una entrevista a la CNBC, el CEO de Intel, Pat Gelsinger, fue preguntado sobre varios hechos en concreto, y sus declaraciones son sin duda sorprendentes, o al menos, interesantes. Y es que el magnate de los chips que lidera al equipo azul afirma que, actualmente, las GPU Intel para IA son competitivas frente a NVIDIA. Además, habló de su nodo Intel 20A como un "picasso".
La sucesión de hechos que se está dando con China, EE.UU. y NVIDIA de por medio ha sacado a relucir algo interesante y de lo que no se está hablando nada, y es de Intel. Volviendo un poco al pasado y analizando las declaraciones de Gelsinger, el 19 de septiembre de este año, es decir, hace poco más de un mes, la plataforma Gaudi2 y sus GPU hacían acto de presencia, lo cual incita varias preguntas al respecto.
¿Es Intel realmente competitiva frente a NVIDIA en GPU para IA?
Los resultados que mostró Intel eran realmente buenos para Gaudi2 y las declaraciones de Gelsinger van muy a la mano de esto. Para ser concretos, Intel afirmó que esta plataforma para IA es la alternativa en precio/rendimiento a la NVIDIA H100, y que es extremadamente atractiva por ello.
Dichos resultados fueron los siguientes:
- Gaudi2 logró un tiempo de entrenamiento impresionante en GPT-3 : 311 minutos con 384 aceleradores.
- Escalado casi lineal del 95% de 256 a 384 aceleradores en el modelo GPT-3.
- Excelentes resultados de entrenamiento en visión por computadora (aceleradores ResNet-50 8 y aceleradores Unet3D 8) y modelos de procesamiento de lenguaje natural (aceleradores BERT 8 y 64).
- Aumentos de rendimiento del 10% y 4%, respectivamente, para los modelos BERT y ResNet en comparación con la presentación de noviembre, evidencia de la creciente madurez del software Gaudi2.
- Los resultados de Gaudi2 se enviaron "listos para usar", lo que significa que los clientes pueden lograr resultados de rendimiento comparables al implementar Gaudi2 en sus instalaciones o en la nube.
Los resultados, por desgracia, no pueden ser comparados con NVIDIA, porque no se ofrecen las mismas configuraciones como tal. Pero vamos a suponer que, efectivamente, el rendimiento es muy similar y el precio es menor, entonces, ¿por qué todo el mundo se sigue lanzando a por NVIDIA? Pues porque el problema de Intel en IA no es el hardware como tal, no es el precio, el problema es la madurez del software y el ecosistema que lo rodea, el cual tiene que competir nada menos que con CUDA.
El problema del software OneAPI y cómo está siendo superado por el hardware
Realmente lo que está viviendo Intel es una descompensación en toda regla. Cuando se habla de la madurez del software de Gaudi2 la compañía tira balones fuera afirmando lo siguiente:
El soporte de software para la plataforma Gaudi continúa madurando y sigue el ritmo del creciente número de IA generativa y LLM en demanda popular.
- La presentación del GPT-3 de Gaudi2 se basó en PyTorch y empleó la popular biblioteca de optimización DeepSpeed (parte de Microsoft AI a escala), en lugar de software personalizado. DeepSpeed permite el soporte de paralelismo 3D (Datos, Tensor, Pipeline) simultáneamente, optimizando aún más la eficiencia del rendimiento de escalado en LLM.
- Los resultados de Gaudi2 en el punto de referencia 3.0 se enviaron en el tipo de datos BF16. Se espera un salto significativo en el rendimiento de Gaudi2 cuando se lance el soporte de software para FP8 y las nuevas funciones en el tercer trimestre de 2023.
¿Por qué es importante todo esto? Porque Intel en la entrevista con la CNBC desveló sus planes en gran parte. Afirmó que Gaudi3 llegará el año que viene, seguramente a principios de 2024, que Falcon Shores, la cual ha terminado como una GPU HPC e IA pura, lo hará para 2025 y además, ahora sabemos que Falcon Shores 2 llegará un año después, a principios de 2026.
Eliminación de productos por sorpresa y un futuro incierto
Hagamos memoria, porque los cambios de Falcon Shores de XPU a GPU (adiós CPU en ella) son la punta del iceberg. Rialto Bridge, sucesora de Ponte Vecchio ha dicho adiós, Lancaster Sound más de lo mismo y los FPGA... Se han desecho de ellos. Por eso, Falcon Shores 2 es la otra cara de la moneda de Gaudi3.
Es decir, Falcon Shores 2 ha pasado a ser la mano izquierda de Intel, siendo la derecha Gaudi3 para IA, y ambas convergen en el mismo problema: OneAPI como software general. Por ello, Gelsinger dijo el mes pasado lo siguiente:
“Simplemente ampliaremos la flexibilidad de esa pila de software. Estamos añadiendo el 8PM. Acabamos de agregar compatibilidad con PyTorch 2. A cada paso del camino, se obtienen casos de uso mejores y más amplios. Se admiten más modelos de lenguaje. La pila de software admite una mayor capacidad de programación.
Pero cada paso del camino mejora. Cada versión de software mejora. Cada versión de hardware mejora a lo largo del camino para cubrir una mayor parte del mercado general de aceleradores”
Si en esto tenemos en cuenta el impulso de la IA en los sectores de PC y portátiles, ahora vemos que el mayor problema de Intel es el software, no el hardware. Los atrasos excluyen a Intel de competir con NVIDIA por el ecosistema de software que tiene, y eso, por muy buen hardware que tengas, no te permite competir, o ser competitiva, contra tu gran rival, y por ello, la gran mayoría de empresas y países están optando por NVIDIA.
¿Podrá Intel darle la vuelta a la tortilla con Falcon Shores 2 en 2026 en HPC y Gaudi 3 para 2025? Pues todo depende de lo que evolucione OneAPI. El hardware, en este caso, está quedando en un segundo plano, mientras que NVIDIA no para de mejorarlo a pasos agigantados.