Los secretos de Meteor Lake, la arquitectura de los Intel Core Ultra llamada a dominar los portátiles

Los nuevos procesadores Core Ultra son una primera vez en muchas cosas para Intel, no solo se trata de la primera CPU disgregada de alcance comercial, sino también la primera vez que usan su litografía Intel 4. No obstante, este complejo chip esconde algunos secretos en su interior, y es por ello que os vamos a describir la arquitectura Intel Meteor Lake al detalle.

Intel ha decidido seguir la estela de AMD y empezar a fabricar microprocesadores para PC compuestos por varios chips distintos, pero al contrario que su rival, no han empezado a partir de las CPU de escritorio, sino que lo han hecho teniendo en cuenta una arquitectura que saldrá únicamente para portátiles, con excepciones en forma de algún que otro MiniPC de bajo consumo. No obstante, esto no es lo más destacable de Meteor Lake y su arquitectura, sino que está esconde algunos secretos en su interior.

Intel Meteor Lake, una arquitectura de CPU compuesta por varios chips

Meteor Lake con LPDDR5 integrada

Hemos de partir del hecho que Meteor Lake no busca ser la CPU más rápida del barrio, más que nada por el hecho que lo que se busca es demostrar la eficiencia de la litografía Intel 4, así como la viabilidad de tecnologías como Foveros para la creación de chips disgregados, donde cada una de las piezas encima del Base Chip recibe el nombre de tiles, que no son lo mismo que chiplets, porque necesitan el llamado Base Tile. 

Además, las conexiones de este implican entrega de energía independiente, así que sí que hay diferencias entre Tile y Chiplet, por eso Intel lo especifica.

Intel-Meteor-Lake-Tile-Diagram

Hay que partir de la base que los tiles  no dejan de ser chips incompletos que se encargan de una función de un procesador. Las ventajas de separarlos son varias, pero las más importantes son:

  • Permite superar el límite de la retícula de cara a hacer el procesador más grande posible, 26 x 33 mm de tamaño, sin embargo, no es el caso de Meteor Lake.
  • Muchas partes de no se benefician de una mejor litografía, esto permite fabricarlas en otras más baratas y mantener la producción activa de las viejas fábricas.

Intel-Meteor-Lake-Base-Tile-Interconexión

La mayor desventaja, en cambio, es la comunicación, el hecho de separar un chip de otro termina por aumentar la longitud del cableado interno, aumentando la resistencia eléctrica y con ello el consumo. ¿La solución estándar? Aumentar el número de pines, ya que con ello se pueden optar por velocidades de reloj más bajas y usar un nuevo sistema de interconexión llamado Foveros Die Interconnect o FDI.

Para ello se colocan conexiones en vertical de 56 micrómetros en el caso de la tecnología Foveros de Meteor Lake. ¿El encargado de la intercomunicación entre los tiles? El mismo base chip/interposer fabricado a 22 nm al que van montados.

Cada tile de la arquitectura Intel Meteor Lake tiene su función

Arquitectura Meteor Lake Organización

Una vez que ya conocemos cuál es la composición de la arquitectura Meteor Lake, hemos de aclarar que más de una CPU disgregada, lo que tenemos es un SoC disgregado, ya que algunas partes del chip son unidades de apoyo o especializadas en tareas concretas que no forman parte del procesador central, pero que son parte integral del procesador de Intel.

Es por ello que vamos a desgranar pieza por pieza los diferentes tiles que forman parte de este microprocesador al detalle.

Compute Tile

Si somos puristas, la Compute Tile es la parte donde se encuentra la CPU realmente, así como sus cachés. Manufacturada usando la litografía Intel 4, su configuración máxima son 6 núcleos de rendimiento o P-Core de arquitectura Redwood Cove, con soporte para multihilo y cachés L1 y L2 privadas. Todo ello sin olvidar a los 8 núcleos E-Core de arquitectura Crestmont, los cuales son más simples, de menor tamaño y unificados en grupos de 4, ya que estos comparten la caché L2, mientras que la L1 es local de cada uno de ellos.

Arquitecturalmente y en cuanto a rendimiento no son una gran mejora si los comparamos a igualdad de ciclos de reloj con sus antecesores, Raptor Cove y Gracemont. Si no más bien son versiones adaptadas a la nueva litografía y con una mayor eficiencia por vatio. Sin embargo, traen consigo algunas mejoras pequeñas, en especial en el Intel Thread Director. Una parte dentro de la Compute Tile, pero “externa” a ambos tipos de núcleos, ya que se encarga de asignar los diferentes procesos a los distintos núcleos e hilos de ejecución.

El Thread Director de Meteor Lake

El tener una arquitectura con núcleos de rendimiento dispar es un problema, si bien es una forma de aumentar la capacidad de computación multihilo bastante eficiente por área, te encuentras con que en PC durante décadas hemos tenido núcleos simétricos. Sin embargo, para solucionarlo, Intel ha creado una pieza de hardware que lleva entre nosotros desde Alder Lake en los Intel Core 12.

Dicha pieza recibe el nombre de Thread Director, y su función es ayudarle al sistema operativo a medir donde va a ir cada uno de los procesos que ha de ejecutar la CPU. Y es que la idea de tener a los E-Cores es asignarles esos pequeños trabajos que restan tiempo a los P-Cores, que aparentemente son menudencias, pero que de forma combinada lastran al rendimiento global.

Pues bien, todos y cada uno de los procesos se ejecutarán en los E-Cores dentro del SoC Tile, para luego moverse a los E-Cores y más tarde a los P-Cores. Es decir, en la arquitectura Meteor Lake, Intel ha invertido el camino. La idea del Thread Director es simple, medir el coste computacional de cada proceso para asignarlo al núcleo adecuado.

SoC Tile

SOC Tile Meteor Lake

¿Un SoC dentro de un SoC? Bueno, esto no es imposible, sino que digamos que esta es la parte central del mismo y la que van conectados los diferentes componentes, solo que en Meteor Lake se han disgregado algunas partes en tiles, mientras que otras siguen estando integradas en un mismo chip, el cual en el caso de la arquitectura Meteor Lake es el SoC Tile, ya que en su interior alberga varios componentes distintos en su interior.

Fabricado bajo el nodo de 5 nm de TSMC, el SoC Tile contiene las siguientes piezas indispensables en una CPU contemporánea:

  • El IMC o controlador de memoria integrado para comunicar al microprocesador con la RAM, sea esta DDR5 o LPDDR5.
  • Dos núcleos E-Cores, de arquitectura Crestmont, pero de muy, pero que muy bajo consumo.
  • Códecs por hardware de vídeo, audio y de pantalla con soporte para AV1 y estándares HDMI 2.1 y DisplayPort 2.1.
  • Controladores para las radios WiFi 6E y WiFi 7 que pueda haber en el portátil.

Además, el SoC Tile en la arquitectura Meteor Lake se encarga de manejar algunas interfaces de componentes o periféricos como:

  • Ethernet
  • Puertos USB y Thunderbolt 4
  • PCI Express

Pero la mayor novedad es la nueva NPU, o unidad de procesamiento neuronal que Intel ha integrado en la arquitectura Meteor Lake, así como la inclusión de un par de núcleos E-Core en su interior.

NPU

NPU Arquitectura Meteor Lake

En el 2016, Intel compró una empresa llamada Movidius, especializada en unidades de procesamiento neuronal de muy bajo consumo que con el tiempo han acabado integradas en la arquitectura Meteor Lake.

No obstante, no os esperéis una potencia enorme al nivel de una tarjeta gráfica para IA, sino que se trata de una pieza muy modesta, análoga a las unidades XIE en Ryzen AI y que especialmente puede acelerar Windows Studio Effects y dejar libre a CPU y GPU de dicha tarea, mientras lo hace mucho más eficientemente en cuanto a consumo.

Sin embargo, el objetivo es ir mucho más allá, y que las diferentes aplicaciones puedan aprovecharse de la NPU integrado en el SoC Tile, la cual puede hacer cosas, aparentemente sencillas, pero de uso cotidiano.

Si bien no son tan potentes para la IA generativa como una tarjeta gráfica especializada, es el primer paso a que las CPU de Intel tengan algo que decir en este mundo, y se ha diseñado para funcionar en todo tipo de API de Machine Learning y librerías, teniendo soporte para: WinML, DirectML y OpenVINO.

La NPU está compuesta por dos arrays sistólicos, las cuales pueden ejecutar 8 instrucciones en formato VLIW. ¿Su potencia? Disponen, colocadas en matriz 2048 unidades (32 x 64) con capacidad de hacer una instrucción MAC cada una por ciclo de reloj.

E-Cores en el SoC Tile: Low Power Cores o LPC

E-Cores SOC Tile

Intel ha decidido incluir dos núcleos adicionales en el SoC, los cuales se encuentran totalmente separados de la unidad principal, pero que se encuentran operativos en todo momento. Es más, todo nuevo proceso es enviado primero a estas unidades por parte del Thread Director para ver si requieren mucha más potencia antes de moverlos al Compute Tile.

Cuando encendemos el ordenador, son estos núcleos los encargados de ejecutar el arranque del sistema operativo para luego pasarle el testigo a los E-Cores, pero, al contrario de lo que se cree no solo sirven para situaciones de muy bajo consumo, sino que su trabajo real es evaluar el coste computacional de los diferentes procesos a ejecutar para una mejor distribución de las tareas.

I/O TILE

IO Tile Arquitectura Meteor Lake

Esta parte es más bien una extensión del SoC Tile más bien sería el equivalente al chipset de la placa base en un ordenador de sobremesa, pero dicha funcionalidad, aunque reducida, suele incluirse en los procesadores para portátiles en la misma CPU. El truco aquí consiste en que Intel ofrece diferentes tipos de I/O Tile en la arquitectura Meteor Lake, adaptados a las necesidades de cada fabricante de ordenadores portátiles, por si necesitan más o menos conexiones USB4 o Thunderbolt o más líneas PCI Express 5.0.

Y es que no olvidemos que cada uno de los Core Ultra irá a parar directamente a un ensamblador o fabricante de ordenadores, esto le permite a Intel crear una remesa con un I/O Tile distinto o incluso en algunos casos prescindir del mismo. Al igual que el SoC Tile se ha fabricado bajo el nodo N5 de TSMC.

GPU Tile

GPU Tile Meteor Lake

A día de hoy toda CPU para portátiles ha de tener su GPU integrada, y en este caso nos encontramos con que tiene su propio chip, pero no es discreta y tampoco “completa” y es que tal y como hemos visto antes, los códecs de vídeo y el controlador de pantalla se encuentran en el SoC Tile.

Al ser una iGPU, carece de su propio controlador de memoria, por lo que usa la RAM del sistema a la que accede a través del controlador de memoria integrado en el SoC Tile, por lo que al igual que el IO Tile es una extensión convertida en un chip aparte.

En cuanto a la arquitectura gráfica de Meteor Lake, esta se basa en ARC Alchemist, en una configuración de 2 Render Slices con 4 Xe Cores cada uno. Su mayor diferencia es el soporte para Ray Tracing y el añadido de las unidades XMX, pero a estos niveles de potencia es preferible el uso de una tarjeta gráfica dedicada.

Fuera de esto, es un 33% más ancha que la GPU integrada de la anterior generación y resulta un pequeño paso adelante, pero no coloca a Intel al mismo nivel que AMD, siendo esta una de sus tareas pendientes.