Intel Emerald Rapids aprieta: 64 Cores, 448 MB de caché y +10% de IPC

Intel está decidida a competir contra AMD en servidores tras los varapalos que ha estado sufriendo en los últimos años. Es cierto que en un sector como el de los servidores, donde se pone toda la carne en el asador en todos los conceptos y tecnologías posibles el hecho de tener un nodo ligeramente inferior se nota. Por ello, el empuje del equipo azul hasta que iguale a TSMC es notorio, y Emerald Rapids y sus cambios, como arquitectura, sí que parece un salto adelante de la compañía, que núcleo por núcleo parece que, ahora sí, estará a la altura.

Será la 5ª generación de Intel Xeon como tal, y tiene novedades interesantes, aunque nada realmente rompedor. Esta arquitectura es la consecución del afán de Intel por coger a AMD, y lo hará en la misma plataforma que los actuales Sapphire Rapids, así que es algo interesante para las empresas y los administradores de sistemas.

Intel Emerald Rapids, un salto interesante de rendimiento con cambios importantes

Emerald Rapids Tiles

Para que lo entendamos de forma simple, Emerald Rapids es el Raptor Lake de servidor, y por eso comparte socket con Sapphire Rapids como Alder Lake lo hace con su sucesor en escritorio. En definitiva, es un upgrade que, curiosamente, tiene cambios significativos.

El principal es que se pasa a la microarquitectura Raptor Cove como ya ocurrió en PC, y eso va a suponer, además, una optimización del nodo. Se pasa de los 10 nm+ (ahora Intel 7) a los 10 nm++ (también con Intel 7, salvo que ahora no se hace distinción alguna, curioso).

Intel-Emerald-Rapids-diagram-CPU

Esto, unido a la reestructuración de la caché L2 y L3 va a dar algo bastante curioso en lo físico. Y es que Emerald Rapids frente a Sapphire Rapids tendrá una configuración de chiplets duales, es decir, tendrá dos dies en vez de cuatro como hasta ahora.

Teniendo en cuenta que comparten socket y plataforma, es un cambio de diseño bastante arriesgado como tal. Parte de la culpa de esto es el hecho de que Raptor Cove implica un aumento de la L2 y la L3, así como una mejora del IPC por ellas, que sumado a los cambios de la propia microarquitectura en Front-End y Back End, se estima que el salto de rendimiento esté entre el 5% y el 10%, dependiendo de las frecuencias finales que se consigan.

Hasta 64 núcleos en el mejor SKU, 66 en total

Intel-Sapphire-Rapids-vs-Emerald-Rapids

Es otra de las novedades, aunque es un salto menor realmente. De 60 Cores en Sapphire Rapids se pasan a 64 núcleos en el SKU más alto, pero no será la configuración más potente que se puede diseñar. Resulta que cada die tiene habilitados 33 Cores, dando un total de 66, pero se reducen a 64 para mantener a raya el consumo, lo que implicará procesadores de hasta 128 hilos.

La caché L2 se mantiene en tamaño pero adquirirá un mayor número de registros, mientras que la L3 aumenta de forma increíble, pasando de 1,875 MB por núcleo en Sapphire Rapids a 3,75 MB, lo que implica un salto de 2,66X en tan solo una actualización de la plataforma.

Sumando L2 + L3 tendremos un total de 448 MB, mientras que AMD a mismo número de Cores con los EPYC Genoa obtiene 480 MB gracias a su L3, que es mayor que en Intel, mientras que los azules implementan más L2. Esto es crucial si tenemos en cuenta las diferencias del nodo, que aunque no sabemos exactamente cuánto han mejorado, sí que podemos hacernos una idea aproximada tomando las áreas de un núcleo y de la caché L3 por unidad.

Intel-Raptor-Cove-Emerald-Rapids

En Golden Cove la CPU era el 78% del área de cada núcleo, reservando un 22% para la L3 y teniendo un área total en el Tile de 11,95 mm2. Con Raptor Cove y su L3 de mayor tamaño las métricas cambian. El Core pasa a ocupar un 69,8% y la caché L3 un 30,2% siendo la superficie del Tile de 13,36%. Es decir, la caché ocupa un 8,2% más pese a haberse incrementado un 266%, mientras que la superficie total ha crecido un 11,79% por Tile.

Esto que parece poco incremento de tamaño realmente es mucho, porque implica un cambio en el diseño de las Tiles y su reducción debido a que el área total y los pines son los mismos, y 4 Tiles no es factible de incluir debido a las necesidades de interconexión entre dies, las cuales hacen perder área total.

Sapphire-Rapids-vs-Emerald-Rapids-áreamm

De hecho, Emerald Rapids con sus cambios, gracias a esto, ha conseguido reducir su área de 1.510 mm2 a 1.493 mm2 frente a Sapphire Rapids, además, con mayor proporción gastada en Tiles, FIVRs e interconexiones. Solo falta saber el rendimiento final, que parece ser estar muy cerca del de AMD a mismo número totales de Cores.