NVIDIA se enfada con Samsung y su HBM3e por culpa de TSMC: su memoria no pasó las verificaciones y se consideró defectuosa

Tres empresas, tres líderes de sus correspondientes sectores y un enfado. Las exigencias, los tiempos y los rendimientos están firmados y no se están cumpliendo, lo cual lleva a problemas morrocotudos en un momento de la IA donde todo debe empezar a fluir poco a poco a la normalidad del suministro, pero... Samsung ha tenido que ver cómo su nueva memoria HBM3e 8 Hi es considerada defectuosa por parte de NVIDIA, y el culpable parece ser TSMC, ¿qué está pasando?

Pues que como suele pasar en cualquier trabajo, más con asiáticos, el orgullo y ego hace acto de presencia cuando las cosas no van bien. NVIDIA no está contenta con Samsung, y los coreanos miran hacia TSMC, mientras que estos últimos citan a SK Hynix y su estándar HBM3e 8 Hi NCF, ¿complicado de entender? Bastante, así que vamos a explicarlo, porque esto va a dar de qué hablar si no hay soluciones con celeridad.

Samsung, NVIDIA y TSMC juegan al "tuya o mía" con las memorias HBM3e para las GPU de IA

Samsung-HBM3e

No hay nadie contento ahora mismo en el sector de las GPU para IA. La historia en su inicio ya la vimos y es sencilla, pero recapitulando brevemente para situarnos diremos que NVIDIA tenía una cantidad de pedidos descomunal hace poco menos de 6 meses y recurrió a Samsung tras estar trabajando con SK Hynix en HBM3e.

Los interposer para las GPU y las memorias los fabrica TSMC, que coge todos los chips y crea el encapsulado soldando todos los componentes según las especificaciones de NVIDIA y SK Hynix. Como Samsung llegó en último lugar con sus memorias HBM3e, TSMC tenía que crear una nueva implementación para estas, cosa que no pudo ser porque las líneas de fabricación de los interposer estaban hasta arriba y no se podían enfrentar cambios.

¿Solución? Samsung estaba entre la espada y la pared, puesto que TSMC no quería modificar lo que le había costado 2 Super Hot Run para NVIDIA, y NVIDIA no quería saber nada del tema al tener todo el estándar bien definido, y SK Hynix quedaba fuera al vender su producto en tanta cantidad como fuera posible. ¿Qué hizo Samsung?

El acuerdo a tres bandas que no ha salido bien

Samsung-NCF-HBM3e

NVIDIA necesitaba a Samsung, y Samsung no se entendía con TSMC, así que la solución era obvia antes la negativa de los de Taiwán: hablar con SK Hynix para aplicar a sus memorias HBM3e sus estándares, adaptándolos a lo que ya tenía TSMC en sus FAB de sustratos y packaging. Problema resuelto, ¿no?

Pues bien, volvemos al presente, y no, de eso nada, más bien todo lo contrario. Samsung y NVIDIA llegaron a las FAB de TSMC para la correspondiente inspección y trabajo de verificación entre todas las partes una vez que los coreanos se adaptaron al estándar de SK Hynix para la HBM3e 8 Hi, es decir, 8 stacks. El problema parece estar en la tecnología NCF (perteneciente a SK Hynix para el apilamiento vertical).

Pero el producto de Samsung, sus memorias, fueron calificadas de defectuosas y se necesitará una nueva verificación adicional, lo cual ha enfadado mucho a NVIDIA por la pérdida de dinero y retraso que supone. Samsung asegura que cumplía con los estándares de SK Hynix, y que estos tienen que estar siendo malinterpretados por TSMC, ya que son los taiwaneses los que son tozudos con no adaptar las líneas de producción para el estándar de Samsung.

Samsung dice que TSMC aplicó estándares de fabricación completamente diferentes a los de SK Hynix, y esto provocó los defectos en las GPU que probaron con NVIDIA. ¿Cómo deduce Samsung esto? Porque suministra a otros clientes esa misma HBM3e 8 Hi y ninguno tiene problemas. Por tanto, los tres se pasan la bola y entre todos "la casa sin barrer".

Veremos cuánto tiempo y dinero le cuesta a NVIDIA este error, sea de quién sea, pero lo que es seguro es que tienen que resolverlo cuanto antes si no quieren enfrentar una vez más escasez de GPU para IA.