AMD enseña como será su mejor GPU para Inteligencia Artificial

Ya vimos hace poco que Intel aprovechó la conferencia HotChips de 2022 para presentar sus futuras arquitecturas de CPU Intel Core 14, Core 15 y Core 16. AMD, por su parte, enseñó en esa conferencia una GPU de muy alto rendimiento para IA y HPC, la Instinct MI250X "Aldebaran".

La conferencia HotChips 34 celebrada en este 2022 era el momento perfecto para que las principales compañías del sector enseñasen sus futuros productos. Así pues, AMD apostó por el sector de las tarjetas gráficas, pero desgraciadamente no el de gaming. Y es que, se han enfocado en enseñar su GPU más rápida cuando hablamos de potencia bruta a la hora de realizar cálculos y trabajar con inteligencia artificial. Esta tarjeta, conocida como AMD Instinct MI250X, es un auténtico monstruo y ahora conocemos todos sus detalles.

La AMD Instinct MI250X usará arquitectura CDNA 2 y diseño MCM

AMD Instinct MI250X Aldebaran 2 Die MCM

La familia de GPU destinadas al cálculo y computación, las AMD Instinct MI200, bajo el nombre de Aldebaran, serán las sucesoras de las MI100, donde la MI250X será el modelo de más alta gama. Así pues, las tarjetas gráficas AMD Aldebaran usarán la arquitectura CDNA 2, ofreciendo hasta 4 veces más rendimiento FP64 respecto a la generación anterior. Además, emplearán una tecnología de empaquetado 2.5D Elevated Fanout Bridge, simplificada como EFB, que permitirá tener 1,8 veces más núcleos y 2,7x veces más ancho de banda, comparado con las MI100.

Con esto alcanzaría un increíble ancho de banda de 3,2 TB/s. Por último, las GPU MI200 utilizarán la tecnología AMD Infinity Fabric de 3ª generación, con hasta 8 enlaces Infinity Fabric. Estos conectarán las AMD Instinct MI200 con las CPU EPYC de tercera generación y otras GPU para lograr una memoria unificada y maximizar el rendimiento. Dicho esto, la AMD Instinct MI250X Aldebaran, serán el buque insignia de la compañía que hará uso de esta arquitectura. Esta destacará por ser la primera GPU de AMD diseñada con MCM, es decir, usará múltiples chips de GPU para dar vida a la MI250X.

La MI250X tendrá un total de 14.080 núcleos y 128 GB HBM2e

AMD Instinct MI250X Aldebaran MCM

Aquí tenemos un diagrama que nos muestra las especificaciones que tendrá esta auténtica bestia de GPU AMD. La MI250X gracias a su diseño MCM tendrá 2 GPU die y 8 pilas de memoria HBM2E, divididas en cuatro por cada chip de GPU. Estos dos chips estarán conectados internamente mediante Infinity Fabric a 400 GB/s. Mientras tanto, cada uno ofrecerá hasta 500 GB/s de ancho de banda para conexiones externas usando Infinity Fabric y usarán PCIe 4.0 x16 ESM (Extended Speed Mode) a 100 GB/s como bus para factores de forma AIC.

Así, el chip MCM completo de esta MI250X tendrá la friolera de 58.000 millones de transistores, fabricada con el nodo N6 a 6 nm de TSMC. Con esto, procedamos a listar las especificaciones de la AMD MI250X Aldebaran:

  • 2 x 7.040 dando un total de 14.080 núcleos, divididos en 220 CU y 880 Matrix Cores.
  • 1700 MHz de frecuencia de reloj
  • 128 GB de memoria HBM2e
  • Frecuencia de memoria de 3,2 Gbps
  • Bus de memoria de 8.192 bits
  • Ancho de banda de 3,2 TB/s
  • Refrigeración pasiva
  • TDP de 560W

Además, hay parece ser que hay una versión más potente que usará el chip al completo. Esta usará 224 CU, resultando en 7.168 núcleos por die gráfico y dando un total de 14.336 núcleos para el chip completo.

El TDP de 560W se refrigerará de forma pasiva con un gran disipador

Refrigeracion Pasiva MI250X TDP 560W

La AMD Instinct MI250X Aldebaran ofrecerá una mejora de rendimiento enorme, pues alcanzará los 47.9 TFLOPs en FP32/64 Vector y los 95,7 TFLOPs en FP32/64 Matrix. Esto significa que tendrá una mejora respecto a la anterior generación de GPU MI100 que será desde 2,1x en FP32 Vector hasta 8,3x en FP64 Matrix. Con estas cifras, AMD afirma que su MI250X tiene 3 veces más rendimiento que una NVIDIA A100.Pero toda esta potencia llegará con un gran consumo energético, pues posee un TDP de 560W.

Y es que, aunque la arquitectura CDNA 2 usada en la MI250X, ofrezca un rendimiento por vatio 2 veces superior a CDNA 1 de la MI100, el rendimiento conseguido implica una subida de vatios obligatoria. Lo sorprendente llega cuando esta GPU MI250X no emplea ventiladores ni refrigeración activa, sino lo contrario. Se refrigerará pasivamente usando un enorme disipador que nos recuerda a los de las CPU.

AMD anuncia su Instinct MI300, que será una APU impresionante

AMD Instinct MI300 APU EPYC

AMD también hizo una curiosa presentación en HotChips 34, pues dijo algunos detalles sobre el futuro de sus GPU Instinct destinadas a IA y cálculo. Esta vez tenemos la próxima generación de Instinct, con las MI300, que tendrán una particularidad, serán una APU. Y menuda APU, pues combinará la una CPU AMD EPYC con arquitectura Zen 4 junto a una GPU Instinct con arquitectura CDNA 3. Con esto conseguirá un gran ancho de banda, una menor latencia y una increíble subida de eficiencia.

De hecho, AMD asegura que con CDNA 3 se conseguirá un rendimiento por vatio 5 veces superior en IA comparándola con CDNA 2. Además, asegura tener un rendimiento 8x superior a la MI250X en entrenamiento por IA. Junto a esto, la APU usará memoria unificada y estará fabricada usando un nodo de 5 nm. AMD espera lanzarla a lo largo de 2023, sin especificar una fecha concreta.