Los procesadores Intel Xeon pierden hasta 700 MHz si se usan con AMX

La arquitectura Sapphire Rapids está más cerca y lo sabemos por las filtraciones que se están sucediendo en estos últimos días. Aunque ya comentamos que la presentación sería el 10 de enero, hay todavía algunas dudas y rumores sobre lo contrario, pero los datos que vamos a ver hoy nos hacen pensar que sí que debería de darse, ya que son muy concretos. Lo importante es que Intel va a implementar las instrucciones AMX y con ello sus Xeon perderán mucho rendimiento en cuanto a frecuencia se refiere, algo que también pasará con otras instrucciones en distinta medida.

Sapphire Rapids y sus procesadores de 56 Cores y 60 Cores están al caer, ya lo vimos esta mañana con los malos datos arrojados en V-Ray 5 Benchmark, y ahora podremos entender, al menos, parte de los porqués.

Intel Xeon W9 3495X, lo mejor de Intel en servidores... Por ahora

CPU Núcleos / Hilos Freq. Base Caché L3 TDP
Xeon W9-3495X 56/112 1.90 GHz 105 MB 350W
Xeon W9-3475X 36/72 2.20 GHz 82,5 MB 300W
Xeon W7-3465X 28/56 2.50 GHz 75 MB 300W
Xeon W7-3455 24/48 2.50 GHz 67,5 MB 270W
Xeon W7-3445 20/40 2.60 GHz 52,5 MB 270W
Xeon W5-3435X 16/32 3.10 GHz 45 MB 270W
Xeon W5-3433 16/32 2.00 GHz 45 MB 220W
Xeon W5-3425 12/24 3.20 GHz 30 MB 270W
Xeon W5-3423 12/24 2.10 GHz 30 MB 220W

Partimos de la base de que hablamos de la CPU más rápida y potente de toda la serie Sapphire Rapids hasta que lleguen las versiones de 60 Cores y por lo tanto, lo que tenemos en vista es un procesador de 56 núcleos y 112 hilos con una frecuencia base de 1,9 GHz, 105 MB de L3 y un TDP de 350 vatios.

Pues bien, ahora sabemos las frecuencias Turbo en sus diferentes estados, los cuales y como viene siendo habitual en Intel, variarán la frecuencia del procesador en todos sus núcleos dependiendo del tipo de instrucción vectorial que se use. Esto se resume de la siguiente manera:

De 1,9 GHz en base pasamos a 2,9 GHz en Boost si no hay un uso de ninguna instrucción vectorial, pero, en cambio, cuando usamos AVX2 esta cae hasta los 2,8 GHz. Con la exigente AVX-512 la frecuencia cae nada menos que 400 MHz hasta los 2,5 GHz, pero es con AMX donde todo se complica, puesto que la caída aumenta hasta tocar los 700 MHz, consiguiendo solamente 2,2 GHz.

O lo que es igual, Intel solo ha podido aumentar en 300 MHz la frecuencia Boost para este procesador frente a la frecuencia Base al usar las instrucciones AMX. Hay que señalar que con TBM 3.0 se alcanzan los 4,8 GHz y con TBTM a un núcleo los 4,6 GHz, así que la caída es más que abrupta cuando se necesita usar los 56 Cores.

¿Por qué Intel no puede mantener el rendimiento y frecuencias más altas con AMX en los Xeon?

Intel-Xeon-Roadmap-AMX-Sapphire-Rapids

El problema es la limitación del consumo y el calor generado por las instrucciones AMX. La primera interacción de estas bajo x86 incluye nada menos que tres "feature set" con 12 sub-instrucciones, siendo dichas 3 principales AMX-BF16, AMX-Tile y AMX-INT8.

Es decir, Intel ahora puede trabajar con un procesador con instrucciones de punto flotante en 16 bits, con Enteros en 8 Bits y además usar las Tile Matrix Multiply o TMUL para operar con los llamados "mosaicos".

El objetivo aquí es acelerar las tareas de IA no necesitando de una GPU para ello, pero, a cambio, y usando la memoria HBM como tal, el consumo se dispara y esto rebaja la frecuencia para mantenerlo en los parámetros de PL2 estipulados por Intel.

¿Por qué es relevante esto? Porque a parte de los "problemas" descritos, Zen 4 y los AMD EPYC no integran AMX como tal y por lo tanto el gigante azul ha preferido optar por la estrategia de aceleración de IA con DL Boost mediante AMX en los entornos que así se exijan a costa de lo nombrado y de saber que lleva la delantera a su rival en este campo, ya que en número de núcleos tampoco puede competir de momento.

Por lo tanto, y siendo Sapphire Rapids la primera arquitectura en el mundo que va a integrar AMX, está por ver si esto representa un filón de ventas para Intel, o si en cambio, es irrelevante para sus compradores, porque el rendimiento de estos Xeon con AMX todavía no se ha mostrado en su mejor entorno.