AMD revela datos de su bestial Instinct MI300 ¿2 ExaFLOPS de potencia?
Las tarjetas gráficas para computación de alto rendimiento o HPC de AMD están mutando a integrar en el mismo paquete sus procesadores. Una táctica para vender a los que montan superordenadores para aplicaciones científicas y militares. Es por ello que aspiran llegar con su futura Instinct MI300 a 2 ExaFLOPS. ¿Por fin tendremos un rival que le pueda toser a NVIDIA Hopper? Bueno, lo que sí que sabemos es que los de Lisa Su han dado nuevos detalles del que podríamos considerar hasta la fecha su APU más potente.
El tiempo en el que los que construían un superordenador tenían que buscar CPU y GPU por separado ha llegado a su fin. Aunque ayer Intel anunciaba que a Sierra Forest se le había caído el procesador por el camino, los planes de AMD con sus Instinct MI300 siguen su curso con el objetivo de batir a la dupla Grace Hopper de NVIDIA.
AMD revela la organización de su próxima bestia para superordenadores
De la mano de Mark Papermaster y en una conferencia en la ITF, hemos podido saber nuevos datos de su próximo chip para superordenadores. Lo primero que llama poderosamente la atención es el hecho que el AMD Instinct MI300, al contrario que sus predecesores, no es solo una GPU, sino que integra dentro de un mismo también una CPU de la familia Zen 4. En concreto, el diseño está compuesto por 4 APU, cada una de ellas integra una CPU y GPU en un mismo chip, pero se encuentran todas en una configuración 2.5DIC, lo que se traduce en que se encuentran en un interponer en común o Base die e intercomunicadas a través de una interfaz Infinity Fabric de cuarta generación.
Se ha de decir que la comunicación interna entre las cuatro APU para computación de alto rendimiento no se hace de chip a chip, sino usando el interposer que se encuentra debajo de ellos. Esto permite reducir el consumo energético de la comunicación, ya que el aumento por velocidad de reloj en este caso es cuadrático y la mejor forma de paliarlo es colocar más pines, cosa que se puede hacer fácilmente con una conexión en vertical. Por otro lado, bajo la misma base irá conectada también la memoria HBM, la cual será de uso frecuente tanto para todas las APU que forman parte del MI300.
Cada una de las APU del Instinct MI300 contiene 3 interfaces Infinity Fabric 4.0 diferentes para comunicarse con los otros 3 chips. En todo caso, hemos de tener en cuenta que el chip base que sirve para la intercomunicación podríamos verlo en otros proyectos de AMD. Como, por ejemplo, en una futura generación de las Radeon para la intercomunicación de los diferentes chiplets.
El objetivo de la AMD Instinct MI300 son los 2 ExaFLOPS
Pues sí, ese es el rendimiento al que quieren llegar y si no sabéis lo que es un 1 ExaFLOPS dejad que os digamos que es ni más ni menos que un millón de TeraFLOPS., pensad que la RX 7900 XT llega solo a 52 TFLOPS aproximadamente. Sin embargo, el hecho que la potencia del MI300 sea 2 ExaFLOPS se explica por el hecho de que esto es la potencia combinada de una gran cantidad de unidades funcionando en paralelo y al unísono en un superordenador llamado El Capitan que se encuentra en construcción en la ciudad de Autin, en Texas, Estados Unidos, para el cual AMD ha creado este poderoso procesador.
Un pequeño avance a su arquitectura
Por el momento desconocemos la potencia de cada uno de los MI300 que habrá en el interior de dicho superordenador, pero os podemos hacer un resumen de los datos que se conocen hasta el momento:
- La CPU y GPU de GPU no se encuentran realmente en un mismo
chip, sino apilados uno encima del otro utilizando tecnología de
interconexión en vertical a través de vías de silicio.
- 6 núcleos Zen 4 por APU, para un total de 24 núcleos.
- La arquitectura de la GPU es CDNA 3, por lo
que es diferente a las de las Radeon RDNA. Se trata de una versión
mejorada de la vieja arquitectura GCN que elimina las unidades
gráficas de función fija, la salida de vídeo y se limita a
computación científica. Pero a cambio agrega una potencia en FP64 a
la par de la de 32 bits y las Matrix Core Units, análogas a las
unidades tensoriales de NVIDIA.
- La nueva GPU soporta nuevos formatos de número respecto a CDNA 2.
- 128 GB de memoria HBM 3 divididos en 8 pilas distintas como memoria del sistema compartida entre CPU y GPU.
Por lo que nos queda por saber las velocidades de reloj de sus componentes. En todo caso, no os esperéis que sean muy alta, ya que las normas en estos sistemas son diferentes, por el hecho de que han de estar funcionando todo el tiempo sin cesar y además tenemos el hecho que CPU y GPU están una encima de la otra, lo que limita el calor que pueden generar cada uno de ellos. Con todo ello, queda claro es que AMD se ha adelantado varios años a Intel con su Instinct MI300 de 2 ExaFLOPS, aunque sea colocando cientos o miles de ellos en El Capitan.