Los procesadores Intel Xeon pierden hasta 700 MHz si se usan con AMX
La arquitectura Sapphire Rapids está más cerca y lo sabemos por las filtraciones que se están sucediendo en estos últimos días. Aunque ya comentamos que la presentación sería el 10 de enero, hay todavía algunas dudas y rumores sobre lo contrario, pero los datos que vamos a ver hoy nos hacen pensar que sí que debería de darse, ya que son muy concretos. Lo importante es que Intel va a implementar las instrucciones AMX y con ello sus Xeon perderán mucho rendimiento en cuanto a frecuencia se refiere, algo que también pasará con otras instrucciones en distinta medida.
Sapphire Rapids y sus procesadores de 56 Cores y 60 Cores están al caer, ya lo vimos esta mañana con los malos datos arrojados en V-Ray 5 Benchmark, y ahora podremos entender, al menos, parte de los porqués.
Intel Xeon W9 3495X, lo mejor de Intel en servidores... Por ahora
CPU | Núcleos / Hilos | Freq. Base | Caché L3 | TDP |
Xeon W9-3495X | 56/112 | 1.90 GHz | 105 MB | 350W |
Xeon W9-3475X | 36/72 | 2.20 GHz | 82,5 MB | 300W |
Xeon W7-3465X | 28/56 | 2.50 GHz | 75 MB | 300W |
Xeon W7-3455 | 24/48 | 2.50 GHz | 67,5 MB | 270W |
Xeon W7-3445 | 20/40 | 2.60 GHz | 52,5 MB | 270W |
Xeon W5-3435X | 16/32 | 3.10 GHz | 45 MB | 270W |
Xeon W5-3433 | 16/32 | 2.00 GHz | 45 MB | 220W |
Xeon W5-3425 | 12/24 | 3.20 GHz | 30 MB | 270W |
Xeon W5-3423 | 12/24 | 2.10 GHz | 30 MB | 220W |
Partimos de la base de que hablamos de la CPU más rápida y potente de toda la serie Sapphire Rapids hasta que lleguen las versiones de 60 Cores y por lo tanto, lo que tenemos en vista es un procesador de 56 núcleos y 112 hilos con una frecuencia base de 1,9 GHz, 105 MB de L3 y un TDP de 350 vatios.
Pues bien, ahora sabemos las frecuencias Turbo en sus diferentes estados, los cuales y como viene siendo habitual en Intel, variarán la frecuencia del procesador en todos sus núcleos dependiendo del tipo de instrucción vectorial que se use. Esto se resume de la siguiente manera:
W9 3495X (350W)
ALL Core Turbo
2.9Ghz Non-AVX
2.8Ghz AVX2
2.5Ghz AVX-512
2.2Ghz AMX https://t.co/cWePpS5uPq— HXL (@9550pro) January 2, 2023
De 1,9 GHz en base pasamos a 2,9 GHz en Boost si no hay un uso de ninguna instrucción vectorial, pero, en cambio, cuando usamos AVX2 esta cae hasta los 2,8 GHz. Con la exigente AVX-512 la frecuencia cae nada menos que 400 MHz hasta los 2,5 GHz, pero es con AMX donde todo se complica, puesto que la caída aumenta hasta tocar los 700 MHz, consiguiendo solamente 2,2 GHz.
O lo que es igual, Intel solo ha podido aumentar en 300 MHz la frecuencia Boost para este procesador frente a la frecuencia Base al usar las instrucciones AMX. Hay que señalar que con TBM 3.0 se alcanzan los 4,8 GHz y con TBTM a un núcleo los 4,6 GHz, así que la caída es más que abrupta cuando se necesita usar los 56 Cores.
¿Por qué Intel no puede mantener el rendimiento y frecuencias más altas con AMX en los Xeon?
El problema es la limitación del consumo y el calor generado por las instrucciones AMX. La primera interacción de estas bajo x86 incluye nada menos que tres "feature set" con 12 sub-instrucciones, siendo dichas 3 principales AMX-BF16, AMX-Tile y AMX-INT8.
Es decir, Intel ahora puede trabajar con un procesador con instrucciones de punto flotante en 16 bits, con Enteros en 8 Bits y además usar las Tile Matrix Multiply o TMUL para operar con los llamados "mosaicos".
El objetivo aquí es acelerar las tareas de IA no necesitando de una GPU para ello, pero, a cambio, y usando la memoria HBM como tal, el consumo se dispara y esto rebaja la frecuencia para mantenerlo en los parámetros de PL2 estipulados por Intel.
¿Por qué es relevante esto? Porque a parte de los "problemas" descritos, Zen 4 y los AMD EPYC no integran AMX como tal y por lo tanto el gigante azul ha preferido optar por la estrategia de aceleración de IA con DL Boost mediante AMX en los entornos que así se exijan a costa de lo nombrado y de saber que lleva la delantera a su rival en este campo, ya que en número de núcleos tampoco puede competir de momento.
Por lo tanto, y siendo Sapphire Rapids la primera arquitectura en el mundo que va a integrar AMX, está por ver si esto representa un filón de ventas para Intel, o si en cambio, es irrelevante para sus compradores, porque el rendimiento de estos Xeon con AMX todavía no se ha mostrado en su mejor entorno.