El problema del disipador en las RX 7900 solo afecta a unas pocas GPU
Seguimos descubriendo detalles sobre el problema de las tarjetas gráficas de AMD, el cual ya se está estudiando y, como era de esperar, no está siendo fácil de solventar. Cuando se realizaron las reviews no se apreció nada raro en temperaturas o uso con su disipador, pero las RX 7900, tanto la versión XTX como XT, han tenido muchas críticas con su Hotspot. Ahora parece que la búsqueda se acota, y dicho problema con el disipador solo afectaría a unas pocas RX 7900 como tal.
La realidad es que AMD ha dado un paso atrás en cuanto a rendimiento térmico, en concreto, a la disipación del mismo. El disipador como tal es mejor, es más avanzado en términos generales, las GPU son más eficientes en rendimiento por vatio, pero... Hay dos factores que parece están siendo decisivos y un tercero en discordia que sigue en el aire.
El problema del disipador en las RX 7900
Nadie da con la tecla, ni siquiera AMD. Por el momento hablamos de un "problema" muy entrecomillado, porque ya son varios los portales, usuarios y webs que intentan reproducir los inconvenientes sin éxito. De hecho, lo último que podemos ver en cuanto a pruebas y analistas llega desde Andreas Schilling, editor de Hardwareluxx, el cual ha probado una RX 7900 XTX en vertical y horizontal para intentar mostrar o reproducir el problema de la cámara de vapor del disipador de su GPU.
En vertical, su RX 7900 XTX dio una temperatura de 59º C con el Hotspot a 72º C y un Delta de 13K, mientras que en horizontal se dio un empeoramiento muy leve con 60º C, 74º C y un delta de 14K. Por lo tanto, los valores entran dentro de lo normal y son muy cercanos, no pudiendo reproducir los "fallos" que se han nombrado en días anteriores como veremos más abajo. Pero vayamos dos pasos más allá, ya que hay nuevas teorías al respecto de por dónde pueden venir los problemas.
La almohadilla térmica de Hitachi y su ausencia
Como decimos, hay factores a determinar. El primero tiene que ver con las tolerancias. Ya hemos comentado en muchas ocasiones lo caro que resulta ajustar a la centésima un disipador con todos sus puntos a refrigerar. Son muchos componentes, pequeños en su mayoría y hablamos de una superficie relativamente flexible como es un PCB.
Ajustar como ingeniero una cantidad de piezas tan pequeñas, calientes con otra sólida y nada flexible como un disipador o midplate es complejo, y por eso se opta por pads térmicos en VRAM, VRM, controladores de voltaje y, en definitiva, cualquier pieza a tratar de pequeño tamaño.
Pero el die, la GPU en sí misma, suele ser mucho más grande y por ello se puede optar por pasta térmica, pero en el caso de las RX 7900 con su arquitectura MCM con GCD y MCD todo se complica. Se han detectado diferencias de altura entre dies, muy leves y casi imperceptibles, que pueden ser solventadas con pasta térmica en gran medida, pero a esto hay que sumarle otro detalle más.
Y no es otra cosa que el sistema de anclaje y el disipador en sí mismo. En AMD el cold plate está fijo con la Vapor Chamber, es decir, no es una pieza móvil ajustable, es un bloque que se conecta con el midplate y el resto del disipador. Esto permite una tolerancia cero al atornillar, puesto que no se puede ejercer mayor presión o movimiento al anclar disipador y PCB mediante sus tornillos. ¿Qué ocurre? Pues que el torque máximo de apriete es el mismo en todos los puntos, pero al no ser superficies perfectas y tener tolerancias dicho ajuste no es bueno en ciertos modelos de RX 7900 al parecer.
Un problema que afecta solo a unas pocas unidades o lotes
Tried to recreate the flipping of the 7900 XTX:
1. Vertical installed: GPU: 59 °C Hot-Spot: 72 °C Delta: 13K
2. Tilted to horizontal during operation: GPU: 60 °C Hot Spot: 74 °C Delta: 14K
3. Tilted back to vertical during operation: GPU: 60 °C Hot Spot: 75 °C Delta: 15K pic.twitter.com/bQjadg1DrS— Andreas Schilling 🇺🇦 (@aschilling) January 2, 2023
Como no hay pad térmico de Hitachi y en cambio se ha optado por pasta térmica (menor rendimiento térmico y traspaso de calor, pero mucho más barato este sistema) a la menor imprecisión o curvatura del PCB de la tarjeta gráfica llegan los problemas. Al parecer y por lo que se está comentando, hay una partida de modelos que han salido con unas tolerancias fuera de parámetros, lo que está permitiendo que en idle todo permanezca más o menos bien, pero en full y ya con estrés el GAP térmico se vaya hasta los 110º C comentados días atrás.
También se ha visto cómo con dicha temperatura el PCB sufre mucho más en sus cuatro puntos de anclaje, permitiendo que haya una deformación mínima e inapreciable a la vista, pero no para un escáner 3D.
Esta curvatura también influye en las tolerancias y es uno de los motivos claros que, si bien la grandísima mayoría de gráficas no lo sufren, con el tiempo y los ciclos térmicos podrían afectarles.
Por ello, los fabricantes han aumentado en NVIDIA el número de capas del PCB, lo que además ayuda a los enrutamientos eléctricos del mismo hacia los distintos componentes. La investigación sigue abierta, porque son tan pocos casos que hacer un seguimiento es complejo y son los usuarios los que tienen que darse cuenta de esto y ponerse en contacto con AMD directamente, los cuales estudiarán el caso para ofrecer un reemplazo y poder hacer dicho seguimiento por número de serie. Hasta entonces, veremos si alguien puede reproducir con certeza los problemas y mostrar si la teoría se lleva a la práctica.