NVIDIA investiga los problemas de las RTX 4090 tras otra GPU muerta
Los problemas de las RTX 4090 y el conector 12VHPWR están en boca de todo el mundo del hardware. Lo que en las RTX 30, incluida la RTX 3090 Ti, no fue un problema, el mayor consumo de la RTX 4090 está haciendo que sus conectores y adaptadores se derritan, literalmente hablando, tras ciertos casos y usos. El último un PC premontado de CyberPowerPC, un usuario frustrado y una investigación abierta de NVIDIA para su conector y los hechos que han llevado a este punto a su nueva serie RTX 40. ¿Cuáles son los verdaderos problemas en las RTX 4090 y su cable?
Está claro que el consumo desmesurado de la RTX 4090 es su talón de Aquiles, principalmente porque los 450 vatios de la RTX 3090 Ti no supusieron un problema, y eso teniendo en cuenta que el conector se atrasó un centímetro, lo cual debe beneficiar en principio a que el adaptador o cable esté menos tenso, pero...
NVIDIA abre investigación sobre la RTX 4090 y sus problemas con el cable 12VHPWR
Ha sido a través de Bryan Del Rizzo, portavoz oficial de NVIDIA, el cual ha ofrecido las primeras declaraciones oficiales sobre todo lo que está ocurriendo en la actualidad con las RTX 4090:
Estamos investigando los informes por el momento. Igualmente, estamos en contacto con el primer propietario y nos comunicaremos con el segundo para obtener información adicional.
No hay solución por el momento, pero lo que sabemos ahora es que hay un segundo usuario afectado, el cual ni siquiera montó su propio PC. Esto es debido a que este usuario, Hakam Salman, compró un PC premontado par gaming diseñado por CyberPowerPC, el cual incluía una RTX 4090. El conector de alimentación de la tarjeta gráfica se derritió literalmente y con motivo de ello este usuario devolvió el PC a la empresa donde lo compró.
Ya van dos casos en menos de 48 horas y todo parece girar, como bien apuntábamos ayer, a unos requerimientos por debajo de lo necesario, con márgenes de seguridad inferiores a lo deseable y sobre todo, a un conector y cables pequeños que no permiten demasiados movimientos o tensiones.
Los fabricantes reculan y comienzan a mostrar cables 12VHPWR a 90º
Seasonic 90° L-type 12VHPWR interfacehttps://t.co/fUfAtiFFjj pic.twitter.com/7J30Tt5B9N
— HXL (@9550pro) October 25, 2022
Así es, el primero ha sido Seasonic y seguramente le sigan muchos más después de anunciar la gran mayoría cables tradicionales rectos. Cablemod fue la primera tienda en ofrecer adaptadores de calidad a 90º para evitar estos problemas, los cuales curiosamente ya vio el PCI-SIG en su momento.
En concreto, el consorcio lanzó la siguiente afirmación:
El conector 12VHPWR ha demostrado una variación térmica, lo que podría generar problemas de seguridad en ciertas condiciones.
La imagen que mostramos ayer sobre este hecho hace referencia a 152 ºC, un cable derretido y una fuente de alimentación con el pin 11 del cable 12VHPWR quemado. Por ello, la recomendación es no girar el cable o adaptador hasta 35 mm desde la base del conector, algo que es totalmente surrealista en cualquier PC actual. Esa norma no se ha respetado nunca con los conectores de 8 pines y nadie la va a respetar ahora con los de 16 pines, principalmente porque dejar 35 mm rectos de cable para luego curvarlo es jugar con una física que se antoja imposible sin un soporte específico.
Molex ya no suministra el conector 12VHPWR
Así es, la empresa Molex no es la encargada de hacer llegar a los adaptadores o cables de los fabricantes el conector que se usa para el estándar. Es Amphenol con su Minitek PWR CEM-5 PCIe Connector System (así lo denominan) el que da vida a este 12VHPWR en todos los casos y como vemos en las especificaciones oficiales del mismo, los rangos de AWG van desde el 28 hasta el 16, pasando por el 18.
Esto es un problema por el diámetro de los cables y su ampacidad máxima a 75 ºC. Para hacernos una idea más clara de los estándares AWG:
- 28 AWG -> 0,321 mm y 1,4 amperios o 16,8 vatios
- 18 AWG -> 1,024 mm y 14 amperios o 168 vatios
- 16 AWG -> 1,291 mm y 17 amperios o 204 vatios
NEC exige que haya un margen de seguridad del 25% para los cables, así que cada amperaje debe ser multiplicado por 1,25x para llegar a la cifra que tiene que soportar como límite cada uno de ellos:
- 28 AWG -> 1,75 amperios o 21 vatios
- 18 AWG -> 17,5 amperios o 210 vatios
- 16 AWG -> 21,25 amperios o 255 vatios
Como ya adelantamos ayer, el conector Minitek PWR CEM-5 PCIe de Amphenol delimita una corriente nominal de hasta 9,5 amperios por cada uno de los 12 contactos que tiene, limitación que también extiende a los 4 pines de señal del mismo, pero a 1 amperio por pin. O lo que es igual, está a un nivel de cables 20 AWG para manejar un porcentaje de amperios muy superior.
En concreto, con margen de seguridad estamos hablando que el conector puede soportar un máximo de 11,875 amperios por cada pin, o lo que es igual, 142,5 vatios por unidad, mientras que los cables soportan desde 210 vatios hasta 255 vatios. Es decir, en el caso del los 18 AWG el cable puede transportar un 32% más de energía, y en el caso del 16 AWG un 44,11% más de lo que permite el conector de Amphenol.
¿Por qué es un problema doblar el cable 12VHPWR?
Pues por una sencilla razón, los márgenes mecánicos que especifica Amphenol:
- Fuerza de inserción -> máximo de 8 Newton.
- Fuerza de retirada-> mínima de 2,4 Newton.
- Durabilidad -> 30 ciclos (30 conexiones/desconexiones para que nos entendamos).
- Fuerza de extracción del cable -> Varía según el cable escogido.
- Temperatura máxima de funcionamiento -> desde -40 ºC hasta +105 ºC.
Estos datos, salvando el de durabilidad que se mantiene, son muy escasos para lo que se le presupone a un cable bastante limitado por norma general y un adaptador de NVIDIA que parece ser el que mayor calidad ha puesto de todos los fabricantes, aunque hay ciertas reservas con esto. Hasta el punto de que de los cuatro pines que se especifica en el estándar para la señal dos no sirven para nada, no se usan, al menos en el que suministra NVIDIA oficialmente.
El tema de la temperatura es obvio que en momentos puntuales de estrés la cifra de 105 ºC queda muy lejos de los 152 ºC que llegó a medir el PCI-SIG, aunque en honor a la verdad el cable ronda los 60 ºC, pero los límites térmicos están muy alejados, casi un 50% y esto lógicamente es un problema. En concreto, es el principal problema, porque es lo que está derritiendo los conectores y matando las RTX 4090, pero es solo la consecuencia.
Los márgenes mecánicos son bajos y los requerimientos de cables muy amplios, y esto es lo que provoca que al girar el cable en una postura que no le es cómoda se produzca una mayor resistencia en los pines o en el conector. Cuando los cables forzados encuentran mayor resistencia al paso de la corriente la fuente de alimentación por orden de la GPU balancea la carga y manda más corriente a los que tienen menor resistencia, sobrecalentándolos, porque como vemos en la siguiente imagen, el fabricante permite unas medidas AWG "inexplicables" para tarjetas de 600 vatios:
Lo que tenemos justo arriba son los requerimientos de cable para los terminales de climpado de cada tipo de pin, y como vemos, se permiten hasta 20 AWG, que es, justamente, el límite máximo que soporta el conector Minitek PWR CEM-5 PCIe de Amphenol como bien apuntábamos más arriba.
Es decir y para que se entienda, el cable mínimo permitido para climpar es el máximo permitido por el conector, un disparate para bien (pero realmente no como veremos más adelante) porque se pasa de 11 amperios a 17, o lo que es igual, 132 vatios vs 204 vatios. Si encima de esto algún fabricante, sea NVIDIA o cualquier otro, pone cables 16 AWG (que los hay y no son pocos) el usuario/técnico de montaje tensa el cable y fuerza la postura del mismo, lo que tenemos es una hecatombe como ya mostró el PCI-SIG y ahora los dos primeros usuarios en presentar problemas.
La situación es de tal calibre que, como apuntábamos más arriba, muchos fabricantes van a tener que dar marcha atrás y replantearse sus cables específicos para hacerlos a 90º o bien, engomarlos en sus extremos para permitir mayor flexibilidad como hizo NVIDIA en su adaptador.
Hay que remarcar que el estándar del Minitek PWR CEM-5 PCIe de Amphenol da 9,5 amperios por pin, que multiplicado por los 12 pines de energía nos da un resultado de 1.368 vatios en el cable 12VHPWR, que es más del doble de lo que consume una RTX 4090. El problema es que el mismo estándar deja un margen interesante desde 20 AWG hasta 16 AWG, por lo que al doblar el cable se transfiere más energía a los cables que presentan menor resistencia eléctrica y evidentemente hace que su temperatura suba en exceso y ya sabemos el resultado.
Conclusión sobre los problemas de las RTX 4090 y su cable/conector
El estándar es correcto, es de hecho demasiado correcto y permisivo. El problema no es eléctrico, los cables o adaptadores, en el peor de los casos con 20 AWG, van sobrados, el problema es el movimiento que permite el cable y que, como en la gran mayoría de estos los que se incluyen son de 18 AWG o 16 AWG, permiten más energía y por lo tanto terminan calentándose y colapsando el conector por temperatura, produciendo un fallo eléctrico en el climp.
Hubiese sido más inteligente, sabiendo que esto pasaba (que es lo más grave, y esto se evidencia en que NVIDIA en su adaptador engomó ciertos cables gracias al PCI-SIG y sus datos) que se fijase un límite eléctrico en la GPU donde no se pudiese exceder más de los 11,875 amperios (los 142,5 vatios comentados antes con 20 AWG + GAP de seguridad) por cable como dato máximo y medida de seguridad. O bien, que se instase a usar solo cables 20 AWG, donde el límite saltaría antes y el balanceo llegaría de forma más rápida repartiendo el calor entre cables.
En ese caso, la tarjeta debería entrar en modo "control de daños" y desviar la carga hacia otros cables mediante sus pines de señal (los dos vacíos se podrían haber usado para mejorar esto, aunque los dos que funcionan supuestamente hacen algo parecido y por eso pasa lo que pasa). El problema es que el balance no se hace bien y se sobrecarga uno de ellos en la mayoría de los casos, dos en los mejores, y esto produce el sobrecalentamiento al no haber mayor balance.
Si nos fijamos en las imágenes de los usuarios afectados, son los pines de la parte superior del conector y más pegados a los 4 pines de señal de control, cada uno en su extremo, son los que sufren, lo que evidencia que es de la tensión mecánica a la que está expuesto el conector y sobre todo el cable. Así que no es un problema eléctrico, es un problema de flexión del cable, que a su vez y ahora sí, produce el problema de sobretensión y sobrecalentamiento en ciertos pines en las RTX 4090.
Seguramente no veamos esto en las RTX 4080 e inferiores, pero sí que es un tema a tratar para la RTX 4090 Ti, porque lo que parece seguro es que los cables de nueva factura a 90º solo van a paliar el problema, pero no a solucionarlo hasta que engomen los conectores en su totalidad (y puede que ni aun así se solucione, uno de los usuarios usaba el adaptador oficial).
Igualmente, y aquí sí que falla el estándar: las fuerzas expuestas de tensión para inserción, retirada y extracción del cable parecen bastante justas y más viendo lo que está pasando. Además, el PCB entre las RTX 3090 Ti, RTX 4090 y RTX 4090 Ti no va a ser muy distinto, así que no podemos esperar cambios o movimientos de desplazamiento en el conector más de los que ya ha habido.
Se necesitaría repensar estos puntos para que doblar o girar el cable no supusiese tanto problema, ya que el conector sería mucho más sólido y seguramente más grande, no permitiendo que la resistencia en los pines bajase. Quizás veamos un PCIe 5.0 V2 en no demasiado tiempo, porque no se le puede pedir a millones de usuarios que mantengan 35 mm en horizontal dicho cable, cuando en muchas cajas precisamente este (el cable) está ya pegado al cristal porque son torres bastante justas en dimensiones y mucho más si tenemos en cuenta el tamaño actual de las GPU.