Categorías: Hardware

Tesla D1: Chip dedicado a la IA con TDP de 400W y 50.000 millones de transistores

Compartir

Este fin de semana, Tesla anunció su nuevo chip de Inteligencia Artificial que montará sus futuros vehículos inteligentes, hablamos del Tesla D1, fabricado por TSMC empleando un proceso de fabricación de 7nm y capaz de albergar 50.000 millones de transistores en un tamaño de 645 mm2.

En su interior nos topamos con cuatro núcleos de CPU superescalares de 64 bits con hasta 354 nodos de entrenamiento, específicamente para la multiplicación de 8×8, y admite varios formatos de instrucciones de datos como FP32, BFP64, CFP8, INT16 e INT8, todos ellos relevantes para el entrenamiento de IA.

Tesla afirma que el chip D1 tiene un rendimiento de cálculo en coma flotante de precisión simple FP32 de 22,6 TFlops y un rendimiento de cálculo BF16/CFP8 de hasta 362 TFlops. Para respaldar la escalabilidad del entrenamiento de IA, cuenta con un asombroso ancho de banda de interconexión de hasta 10 TB/s. Esto es posible gracias a sus 576 carriles, cada uno con 112 Gbps de ancho de banda. Todo ello requiere de un TDP de 400W

.

Los chips Tesla D1 pueden interconectarse a través de DIP (Dojo Interface Processor), hasta 25 de ellos forman una unidad de entrenamiento (Training Tile), y se pueden seguir interconectando múltiples unidades de entrenamiento, con un único ancho de banda externo de hasta 36 TB/s y 9 TB/s en cada dirección. El consumo de energía y la generación de calor es de locura, con una corriente de 18.000 Amperios que cubre una solución de refrigeración rectangular con una capacidad de refrigeración de 15 kW (15.000W).

Adicionalmente, la compañía anunció que uniendo 3000 chips Tesla D1 con  un total de1.062.000 nodos de entrenamiento, tenemos el superordenador llamado ExaPOD, que es capaz de ofrecer un rendimiento computacional de 1.1 ExaFLOPS en FP16/CFP8. Respecto al superordenador usado actualmente, firmado por Nvidia, hablamos de 4x veces más potencia en entrenamiento de IA, un 30% más de rendimiento por vatio consumido, y ocupará 5x veces menos espacio.

Borja Rodríguez

Los comentarios de Disqus están cargando....
Publicado por
Borja Rodríguez

Entradas recientes

Descubren un protocolo de carga que duplica la vida útil de las baterías usando un acelerador de partículas

Por muchos años que pasen, la batería de nuestros móviles y otros dispositivos parece que… Leer más

10 horas hace

Samsung confirma que la memoria HBM4 para las GPU llegará el año que viene con 16hi y fabricada en 3D

Micron dio el pistoletazo de salida a la nueva memoria que llegará, según su roadmap,… Leer más

11 horas hace

Llévate Windows 10/11 desde 9,5€ y Office desde 18€ con CDKeyoffer

Volvemos con las licencias más demandadas de la mano de CDKeyoffer, las licencias de Windows… Leer más

11 horas hace

El 63% de los trabajadores estadounidenses aceptaría un recorte salarial para poder trabajar a distancia

Hace unos años, el trabajo a distancia, trabajo remoto o teletrabajo, no era muy habitual,… Leer más

11 horas hace

China usa un chip Jetson TX2i de NVIDIA para lograr que un caza de combate hipersónico alcance una velocidad superior a 8.645 km/h

La dialéctica de "Seguridad Nacional" de EE.UU. sobre los chips destinados a llegar a China… Leer más

12 horas hace

ROCCAT desaparece como marca y es absorbida por Turtle Beach, la cual integrará todo el catálogo de productos

A la hora de comprar periféricos para ordenador, tenemos un gran número de marcas y… Leer más

13 horas hace

Esta web usa cookies.