La GPU Intel Xe Arctic Sound alcanza los 42 TFLOPs de potencia gracias a sus 16.384 núcleos
Durante el Architecture Day 2020, una de las grandes bombas está ligada a los gráficos Intel Xe con 4 Tiles (diseño chiplet), es decir, la GPU tope de gama de la compañía, la cual finalmente tendrá la asombrosa cifra de 16.384 núcleos frente a los 8.192 núcleos de la variante de 2 Tiles y de 4096 núcleos de la variante monolítica con 1 Tile. Estas GPUs pertenecen a la familia Arctic Sound y se basan en la arquitectura Xe HP.
Pese a que los drivers / controladores gráficos estén aún muy verdes, según los primeros benchmarks, un solo Tile Xe HP es capaz de transcodificar 10 fuentes de vídeo HEVC 4K @ 60 FPS en paralelo. Si sumamos mas Tiles, pues hablamos de gestionar 40 fuentes de vídeo 4K @ 60 FPS de forma simultánea.
Obviamente, no la esperes ver a esta GPU moviendo el Crysis o Minecraft con RayTracing, ya que esta GPU en particular será empleada en centros de datos y superordenadores. Las GPUs gaming llegarán bajo el nombre de Intel HPG (Intel High-Performance).
Si hablamos de rendimiento, esta GPU alcanzará los 42 TFLOPs de potencia, convirtiéndose así en la GPU más potente del mundo. De esta forma Intel ha aprendido de AMD y al menos le ha copiado el diseño chiplet para tomar la delantera tanto a Nvidia y AMD en el mercado gráfico.
Hemos aprovechado las innovaciones de empaquetado exclusivas de Intel para crear una arquitectura de alto rendimiento y altamente escalable de múltiples Tiles, la primera en la industria. Esta se llama XE HP. Echemos un vistazo a lo que puede hacer. XE HP fue creado para ser una superordenador multimedia en una tarjeta PCIe. Aquí nos verás transcodificando un vídeo de 4K en tiempo real, hasta 60 cuadros por segundo, en un solo stream, pero no nos detuvimos ahí.
Utilizando nuestra IP de medios líder en la industria y creando la arquitectura de medios más densa en una GPU con ffmpeg, podemos transcodificar hasta 10 stream completos de vídeo HEVC 4K de alta calidad a 60 fotogramas por segundo en una sola GPU y puedes ver la salida de ffmpeg en pantalla mostrando la progresión del transcodificador en tiempo real de cada fotograma.
Al optimizar la eficiencia de la tasa de bits y la densidad del stream, los clientes pueden realizar mejoras en el costo total de propiedad en el mundo real para la entrega de contenido de vídeo que se escalan junto con los medios. Nos colocamos con un rendimiento de computación de vanguardia gracias a la arquitectura Xe, aumentando el número total de Execute Units en más de 100 veces en comparación con el silicio XE LP. Viendo esto a través del objetivo de rendimiento FP32, el silicio XE HP cubre un rango dinámico de rendimiento de computación con una escalabilidad casi lineal de 1 Tile a 4 Tiles.