Tesla enciende su nuevo Superordenador de 300 millones para IA con 10.000 gráficas NVIDIA H100
El mantra que ha repetido Elon Musk hasta la saciedad con su compañía sigue adelante: "Tesla vale lo que valga su sistema de conducción autónoma". Hasta ahora han estado por delante, pero hace muy poco fueron superados por Mercedes, y entre tanto, en silencio, preparaban un golpe que tendrá dos fases y será definitivo frente a cualquier fabricante de automóviles del mundo. Y es que ayer a última hora de la noche encendieron oficialmente su nuevo Superordenador para IA, de manera que este entrenará a su sistema de conducción autónoma FSD.
En mitad de decenas de denuncias, accidentes y muertes de personas a los "mandos" de sus coches, Elon Musk ha visto en la IA la oportunidad perfecta para marcar la diferencia futura, y esta llega con una estrategia muy ambiciosa y que refleja claramente una similitud con lo que está haciendo Amazon, pero en otros tiempos distintos.
Tesla enciende su superordenador de 300 millones para IA
Hay un dato clave que puede que se pase por alto aquí al saber que son 10.000 GPU H100 las que integra dicho superordenador. ¿Por qué no optar por A100 para un modelo más sencillo que un LLM? Pues porque aparte de la mayor potencia de las H100 (30 veces más rápidas), esta nueva GPU maneja mucho mejor y más rápido las cargas de gráficos al estar más capacitada para tratar vídeos, y claro, el sistema FSD de Tesla se basa prácticamente en imágenes y vídeos.
Con estas 10.000 GPU Tesla se ha colocado como la empresa con el cuarto Superordenador más rápido del mundo al conseguir nada menos que 340 PFLOPS en FP64. Por ello, la capacidad de entrenamiento será bestial, como bien explica Tim Zaman, gerente de ingeniería de plataforma AI e infraestructura de Tesla:
"Debido al entrenamiento por vídeo en el concepto de "real-World", es posible que tengamos los conjuntos de datos de entrenamiento más grandes del mundo, una capacidad de caché de nivel superior a 200 PB, varias órdenes de magnitud más que los LLM"
Dojo, ¿será el siguiente paso de Tesla?
El anuncio es un hito para la compañía que pone tierra de por medio con los fabricantes europeos y chinos, muy retrasados aquí y que seguro han visto venir la amenaza tarde. Aunque ahora quieran ponerse a la altura, al menos fabricantes como Volkswagen, Mercedes o BMW, que sí tienen acceso a las H100, como ya vimos, NVIDIA tiene serios problemas de oferta y una demanda sin precedentes en el sector.
Elon Musk comentó algo al respecto, porque de lo que puedan hacer los verdes se seguirá en Tesla hacia un camino u otro:
"Francamente... si ellos (NVIDIA) pudieran entregarnos suficientes GPU, es posible que no necesitemos Dojo"
Pero, ¿qué es Dojo? Pues es el nombre de su Superordenador enfocado a la misma tarea del que acaban de encender, es decir, es otro proyecto paralelo, y claro, te estarás preguntando para qué tener dos superordenadores al mismo tiempo, dos proyectos enfocados a lo mismo, la IA.
Pues tiene sentido desde el punto de vista de la independencia tecnológica, y aquí volvemos a citar a Amazon y sus SoC personalizados. El enfoque de Tesla es el mismo, con el problema de la nula oferta existente por parte de los verdes.
Con NVIDIA o sin ella, Tesla no se frenará en IA
El plan es trazar una hoja de ruta con NVIDIA y sin ella. La de hoy especifica la primera, la segunda se está haciendo en base a una planificación de más de mil millones de dólares en el desarrollo de dicho superordenador con SoC y GPU personalizadas, ultra optimizadas y diseñado a medida, desde 2021.
Dojo es la segunda opción por si NVIDIA falla, pero Tesla se ha dado cuenta de que, aunque esto no ocurra, tener su propia infraestructura específica a lo Amazon le otorgaría ventaja en algo tan simple como el procesamiento de los datos para toda la flota de vehículos, así que está dando vida poco a poco al proyecto Dojo.
Por ello, a los 2.000 millones de presupuesto para este año la compañía informó en su momento de que igualará la cifra para 2024. Con su nuevo Superordenador y Dojo unidos (conjunto llamado como Exapod), Tesla va a conseguir superar todos los problemas que están suponiendo los cuellos de botella computacionales de la actualidad para FSD.
Nadie en la industria ha apostado tan fuerte por la IA para automóviles, y aunque lo hiciesen ahora, ya van tarde, posiblemente más de un año tarde, justo para cuando Dojo pueda estar listo y ahí, de nuevo, volverán a estar por detrás. Dicho esto, quedará por ver si, efectivamente, tanto este Superordenador que ya está funcionando como Dojo pueden hacer de FSD el sistema más robusto y fiable de IA para coches, o si Mercedes, con mejores recursos actualmente, puede superarles en el futuro una vez más.