Tesla D1: Chip dedicado a la IA con TDP de 400W y 50.000 millones de transistores

Este fin de semana, Tesla anunció su nuevo chip de Inteligencia Artificial que montará sus futuros vehículos inteligentes, hablamos del Tesla D1, fabricado por TSMC empleando un proceso de fabricación de 7nm y capaz de albergar 50.000 millones de transistores en un tamaño de 645 mm2.

En su interior nos topamos con cuatro núcleos de CPU superescalares de 64 bits con hasta 354 nodos de entrenamiento, específicamente para la multiplicación de 8×8, y admite varios formatos de instrucciones de datos como FP32, BFP64, CFP8, INT16 e INT8, todos ellos relevantes para el entrenamiento de IA.

Tesla D1

Tesla afirma que el chip D1 tiene un rendimiento de cálculo en coma flotante de precisión simple FP32 de 22,6 TFlops y un rendimiento de cálculo BF16/CFP8 de hasta 362 TFlops. Para respaldar la escalabilidad del entrenamiento de IA, cuenta con un asombroso ancho de banda de interconexión de hasta 10 TB/s. Esto es posible gracias a sus 576 carriles, cada uno con 112 Gbps de ancho de banda. Todo ello requiere de un TDP de 400W.

 1

Los chips Tesla D1 pueden interconectarse a través de DIP (Dojo Interface Processor), hasta 25 de ellos forman una unidad de entrenamiento (Training Tile), y se pueden seguir interconectando múltiples unidades de entrenamiento, con un único ancho de banda externo de hasta 36 TB/s y 9 TB/s en cada dirección. El consumo de energía y la generación de calor es de locura, con una corriente de 18.000 Amperios que cubre una solución de refrigeración rectangular con una capacidad de refrigeración de 15 kW (15.000W).

Adicionalmente, la compañía anunció que uniendo 3000 chips Tesla D1 con  un total de1.062.000 nodos de entrenamiento, tenemos el superordenador llamado ExaPOD, que es capaz de ofrecer un rendimiento computacional de 1.1 ExaFLOPS en FP16/CFP8. Respecto al superordenador usado actualmente, firmado por Nvidia, hablamos de 4x veces más potencia en entrenamiento de IA, un 30% más de rendimiento por vatio consumido, y ocupará 5x veces menos espacio.

Artículos relacionados