Intel presenta su arquitectura Lunar Lake: +14% de IPC, LPDDR5X a 8.533 MHz, sin HT y E-Cores con hasta cuatro veces el rendimiento

Estamos en plena Computex 2024 y siendo una de las ferias tecnológicas más importantes del mundo, ya podemos hacernos a la idea de que la mayoría de marcas importantes anunciarán sus novedades. Al igual que vimos a AMD por fin presentar oficialmente sus CPU Ryzen 9000 con Zen 5 y las APU Ryzen AI 300 Strix para portátiles, ahora es el turno de Intel. Intel Lunar Lake es la próxima generación de procesadores para portátiles, los cuales tendrán un IPC mayor, hasta 32 GB de memoria integrada y unos nuevos P-Core Lion Cove con un 14% de mejora de IPC.

Lunar Lake se ha presentado apenas unos meses después de que hayan lanzado Meteor Lake en portátiles. Intel se ha adelantado para poner sus cartas sobre la mesa sabiendo que AMD no se está durmiendo en los laureles. Con Meteor Lake, la compañía logró mejorar dos de los puntos más débiles de sus procesadores, los cuales eran los gráficos integrados y la eficiencia. Si bien Meteor Lake no ofrecía el mejor rendimiento posible, consumía menos energía y su GPU era mucho más rápida.

Intel presenta Lunar Lake, su nuevo SoC para portátiles con memoria integrada

Intel empieza fuerte con Lunar Lake, pues tenemos una familia de SoC altamente eficientes destinados a portátiles para IA compuestos por 7 componentes. Tal y como podemos ver en la imagen, tenemos una zona dedicada a la memoria, el módulo base (Base Tile) que emplea la interconexión Foveros para conectar el Compute Tile y el Platform Controller Tile. El Compute Tile se ha fabricado usando el nodo N3B de TSMC, mientras que el Platform Controller Die usa el nodo N6 de TSMC.

Dicho esto y como vimos en los componentes que tenía, este se trata de un SoC que incluye memoria, pudiendo ofrecer 16 GB o 32 GB de memoria LPDDR5X a 8.533 MHz. Esta memoria soporta el canal 16b x4, reduce el consumo PHY en hasta un 40% y permite ahorrar hasta 250 mm2 de espacio en el chip. Ahora toca hablar del resto de la CPU en términos generales, pues Intel Lunar Lake ofrece hasta 8 núcleos, compuestos por 4 P-Cores y 4 E-Cores. Los P-Cores mejoran su rendimiento (como veremos más adelante), ofrecen 2,5 MB de caché L2 por núcleo y 12 MB de caché L3 compartida.

En cuanto a los E-Cores, estos añaden 4 MB de caché L2 compartida y logran duplicar el rendimiento vectorial y de IA. Para acabar con la descripción general de Lunar Lake, tenemos la GPU, la cual ofrecerá 8 Xe Cores, 8 unidades de Ray Tracing, 8 MB de caché dedicado y compatibilidad con XMX. En total tenemos una potencia de 120 TOPS compuestos por los 48 TOPS de la NPU, 67 TOPS de la GPU y 5 TOPS de la CPU.

Detalles de los P-Cores y la arquitectura Lion Cove con una mejora del 14% de IPC frente a Redwood Cove

Ahora que hemos visto Intel Lunar Lake en términos generales, ahora toca centrarnos en los detalles de la arquitectura. Empezaremos por la arquitectura Lion Cove que dará vida a sus P-Cores. Esta es la sucesora de Redwood Cove que tenía Meteor Lake y tenemos una mejora del 14% del IPC, un poco por detrás de la que AMD mostró con sus Ryzen 9000.

Intel indica que esta se puede escalar a otros niveles de consumo y en el caso de hacer chips de muy bajo consumo, la mejora sería del 18%. Dicho esto, Intel ha anunciado que aunque SMT proporciona hasta un 30% más de rendimiento, decidieron descartarlo con Lunar Lake al ser destinado a portátiles de bajo consumo. Los P-Cores Lion Cove no incorporan HT ni SMT y aunque parezca que todo son pérdidas, no es así.

Intel anuncia que la eliminación de esto junto a la optimización de los núcleos les ha permitido obtener un 15% más de rendimiento por vatio, un 10% de rendimiento/área y un 30% de rendimiento/vatio/área comparado a una CPU sin HT tradicional. Además de esto, Lion Cove posee un controlador IA que se encarga de gestionar el chip frente a la temperatura adaptándose, permitiendo subirla si las condiciones lo permiten y bajarla en caso contrario.

Otro de los cambios es que Lion Cove trae 3 niveles de caché, incluyendo L0 (48 KB) además de L1 y L2. También se añaden más deep instructions (576 vs 512), 18 execution ports en lugar de 12, 6 integer ALU (vs 5 en Meteor) y otras mejoras que permiten un mayor rendimiento.

Los E-Cores Skymont ofrecen hasta 4 veces más rendimiento multinúcleo

Ahora es el turno de la arquitectura Skymont que da vida a los E-Cores. Según Intel, estos núcleos altamente eficientes logran una mejora del 38% en pruebas de enteros (integer) y un 68% en coma flotante frente a los E-Cores Crestmont de las CPU Meteor Lake actuales. Esto se traduce en que con un solo núcleo, pueden conseguir el mismo rendimiento usando un tercio del consumo y logran 2x más rendimiento a máximo consumo. Si hablamos de tareas multinúcleo, aquí mantienen ese mismo rendimiento con 1/3 del consumo, pero logran 4 veces más rendimiento a máximo consumo.

Si en lugar de Crestmont lo comparamos con Raptor Cove de PC, Skymont puede llegar a ofrecer su rendimiento con un 60% de su consumo, así que no está nada mal. Cada clúster de 4 E-Cores dispone de 4 MB de caché L2, con un ancho de banda que se duplica pasando de 64B a 128B/ciclo. Adicionalmente, Intel indica que ha añadido execution units adicionales en la CPU para mejorar el rendimiento en IA.

Intel Thread Director reduce el consumo en un 35% tras el añadido de OS Containment Zones

6

Ahora que hemos visto los núcleos en detalle pasamos a otra mejora de Lunar Lake, esta vez enfocada a Thread Director. Este se encarga de gestionar los núcleos para distintas tareas, poniendo a trabajar a los P-Cores en actividades exigentes y a los E-Cores en tareas sencillas. La diferencia es que ahora se han mejorado los algoritmos, se dispone de una granularidad más fina para un mayor control y se puede configurar para priorizar un consumo muy bajo de energía.

Intel está añadiendo las denominadas "OS Containment Zones" dentro de Windows para que el chip lea la tabla de inicialización y así use distintas configuraciones de núcleos (E-Core, P-Core o híbrido) optimizadas para dichas tareas. El añadido de las containment zones permitirá a Intel ahorrar hasta un 35% de energía.

Intel añade Wi-Fi 7 integrado dentro de Lunar Lake

Ahora toca hablar de la NPU 4, pues así es como han denominado a la que viene con Lunar Lake. Esta aceleradora de IA posee 48 TOPS por su cuenta, llegando casi a alcanzar a AMD con sus 50 TOPS. Sin embargo, es en el conjunto de CPU+NPU+GPU cuando se logran 120 TOPS. La NPU 4 es el doble de eficiente y es 4,36 veces más rápida que Meteor Lake con sus 11 TOPS. Esta logra una frecuencia más elevada de 1,95 GHz respecto a los 1,4 GHz de la generación anterior y su motor DMA logra el doble de ancho de banda. Como podemos ver en las pruebas, la NPU 4 de Lunar Lake puede finalizar la prueba de Stable Diffusion en 5.8 segundos en lugar de 20,9 segundos.

Por último, Intel añade Wi-Fi 7 integrado dentro del chip, reduciendo su tamaño en un 28% comparado con una tarjeta Intel Wi-Fi 7 BE 200. En comparación, Meteor Lake necesitaba de un módulo por separado para ofrecer la conexión inalámbrica.