AMD habla sobre los 128 bits en su RX 7600 XT: «Infinity Cache es nuestra arma secreta, estamos más limitados por el Frame Buffer»
Esta generación de GPU, tanto de NVIDIA como de AMD, ha suscitado mucha crítica sobre el hecho de que los buses eran demasiado pequeños para lo que el usuario esperaba. Como siempre hemos defendido, las arquitecturas están bien balanceadas para el target objetivo que buscan por resolución y filtros, algo que representa un cambio de paradigma en el sector del hardware para gaming y encasilla las opciones del usuario. AMD, en el CES 2024, se ha referido a este respecto con su RX 7600 XT 16 GB, Infinity Cache y sus 128 bits, muy criticada, entre otras cosas, por lo comentado y la subida de precio. ¿Qué ha dicho AMD exactamente sobre esto?
Desde el canal de PCWorld, Keith pudo entrevistar a Aaron Steinman, el cual, como vimos ayer, estuvo muy amable ofreciendo entrevistas abiertas a todo el que le preguntaba. En el caso del día de hoy todo gira sobre la opción de dotar a la tarjeta de marras de 16 GB de VRAM y de por qué se ha mantenido el bus de 128 bits.
AMD RX 7600 XT 16 GB, ¿son suficientes los 128 bits?
Es la última GPU en llegar al mercado y, como comentamos hace unos días, está de actualidad porque la única diferencia con su hermana es el aumento de VRAM, mientras que el bus se mantiene intacto, lo que deja el mismo ancho de banda total porque la memoria no ha aumentado en velocidad.
En definitiva, es la misma tarjeta con el doble de memoria. Tras la presentación, Steinman ofreció su visión sobre su RX 7600 XT, sus 16 GB de VRAM y 128 bits, además de sobre las críticas que hemos comentado, las cuales han llegado a oídos de AMD fuerte y claro:
"Hay una pequeña preocupación que he escuchado sobre el ancho de banda de la memoria definido por el ancho del bus, aunque no estoy demasiado preocupado por eso. Tenemos algo para mitigar eso: Infinity Cache. Es nuestra salsa secreta para mitigar las restricciones de ancho de banda.
Por eso, normalmente encontramos que en realidad estamos más limitados por el frame buffer que por el ancho de banda de la memoria. Infinity Cache ayuda a aumentar ese ancho de banda efectivo para que el bus de memoria no se convierta en un limitante en la mayoría de los juegos."
¿Es realmente Infinity Cache la solución para la RX 7600 XT?
Realmente es la solución paliativa a un bus pequeño con gran frame buffer, como es el caso de esta RX 7600 XT. Ya lo vimos en el artículo de la arquitectura RDNA 3 poniendo el mejor ejemplo que había en ese momento, la RX 7900 XTX. La diferencia relevante que tenemos ahora es que la RX 7600 XT en sus dos versiones es un chip monolítico y no MCM.
Los principios son los mismos y como la arquitectura está supeditada a la versión de Infinity Cache (IC a partir de ahora) aunque la RX 7600 XT sea RDNA 3 Lite por sus menores registros, realmente usa la segunda generación de IC. Además, esta GPU tiene una ventaja que no presentan los modelos superiores, todos con arquitectura MCM: menor latencia.
Esto, unido a los 5,3 TB/s que puede alcanzar IC mediante sus controladores de memoria de 64 bits hacen que el ancho de banda menor, que es resultante del bus de 128 bits, quede paliado. Y lo está, porque reduce en un 33% el bus frente a RDNA 2, sí, es cierto, pero se multiplica por 2,7 el rendimiento de IC al pasar de 1,9 TB/s (máximo teórico en 1ª Gen, reales son 1,6 TB/s) a esos 5,3 TB/s.
En otras palabras, primas el rendimiento interno dentro del chip frente al rendimiento externo del bus para el frame buffer con la GDDR6.
¿Por qué usar 16 GB en un modelo y no 8 GB?
Hay dos motivos. El más obvio es no perder posición con NVIDIA y su RTX 4060 Ti 16 GB, no teniendo nada con que responder y a menor precio. El segundo, como bien apunta Steinman, es la necesidad de algunos jugadores y juegos de mayor VRAM, lo cual demostró jugando en directo a The Last of Us:
"Lo importante de este título es que es uno de los juegos más nuevos y modernos que realmente están enfatizando la demanda de frame buffer. Bueno. Y así, con The Last of Us, si realmente miramos las opciones de gráficos, nos muestra el uso de VRAM de la escena actual. Y puedes ver que estamos usando 9,4 gigas de VRAM.
Y entonces, con esta configuración, no podríamos reproducir esto en una GPU de ocho gigas. Entonces el hardware tiene los caballos de fuerza (potencia en cuanto a Shaders y unidades como ROP, TMU, etc) pero si te quedas sin VRAM, simplemente el juego no funcionará bien.
Y ahí es cuando realmente tendrás que volver a ir a través del bus PCI a la memoria del sistema y tomar prestada memoria de la memoria del sistema (RAM). No quieres hacer eso. Aumenta la latencia y reduce los fotogramas por segundo y eso no es bueno.
En cambio, es bueno verlo en acción, y en cierto modo, eso hace que quieras ese frame buffer adicional incluso si alguien no está preocupado por esa clase particular de tarjeta. Quiero decir, quieres más buffer de fotogramas, ¿verdad? Dura más en el futuro, como dijiste, da más longevidad a la tarjeta gráfica".
¿Es necesario 16 GB en una tarjeta con 128 bits?
Guste o no, esto no es estrictamente necesario y vamos a sintetizar la respuesta con parte del argumento de Steinman, porque un servidor no está de acuerdo en un punto en concreto. Cuando Steinman habla de Frame Buffer lo hace desde el punto de vista de los ingenieros, ya que para ellos es la propia VRAM, la GDDR6 en sí.
AMD internamente no distingue entre el frame buffer como framestore (anterior, de hace años) de la memoria en sí. Principalmente, porque desde el punto de vista de la arquitectura IC hace ese trabajo en gran medida. Es decir, IC hace de buffer de memoria como tal, así que el frame buffer para AMD recae sobre el aspecto de la VRAM en sí, y esto es importante comprenderlo.
¿Por qué? Porque como le pasa a Intel y sus Arc actualmente, AMD mediante Smart Access Memory (SAM a partir de ahora) maneja de forma inteligente lo que los desarrolladores de juegos denominan como RAMCache junto con la CPU.
Es cierto que SAM está enfocada a mejorar el rendimiento de la GPU con la CPU, pero es que esta reducción de latencia que se provoca entre ambas y el aumento del ancho de banda, al no estar limitados los paquetes a 256 MB, implica también que la CPU tiene que trabajar mucho más con la RAM y esta reservar más espacio para la VRAM.
La prueba más sencilla para comprobar esto es medir la capacidad usada de VRAM con SAM Off vs ON, y ver que, efectivamente, es así por lo comentado.
Esto es algo que los fabricantes de placas también usan, y en muchos casos tienen incluso software propio para la gestión, inclusive para los SSD (ASUS RAMCACHE y Samsung Rapid Mode).
A fin de cuentas, la RAM, sea DDR4 o DDR5 o anterior si se tiene una plataforma con muchos años, no deja de ser una memoria de acceso en la que se puede reservar (si se tiene suficiente capacidad libre, es decir, GB de sobra) un espacio virtual en ella para mover datos entre dispositivos.
Por eso, Steinman habla de que no quiere salir a la RAM a coger información directa en tiempo real, puesto que eso tiene un coste energético y, sobre todo, de rendimiento, de latencia, lo cual o se hace extremadamente bien, o aparecerá el famoso stuttering. Hasta ahí, todo bien, un servidor está totalmente de acuerdo, pero...
Shaders vs VRAM, ¿qué es más importante? ¿Cómo influye en la RX 7600 XT y su Infinity Cache?
Siempre defiendo, y me habréis leído muchas veces, que el balance de una tarjeta es lo realmente importante desde el punto de vista de la arquitectura y el rendimiento (el precio es otro tema, importante, sí, pero no estamos en eso, hay que saber separar, ya se harán ratios con él cuando se precise). A día de hoy con los buses internos que se tienen y la velocidad de la memoria que hay en el mercado, así como la latencia de la misma, sin olvidar las L2, el bus de datos no es tan relevante.
Pero, al mismo tiempo, fuerza a que el balance que diseña el creador de la GPU, sea AMD, NVIDIA o Intel, se enfoque a una resolución en concreto. En otras palabras, las GPU se enfocan hacia 1080p, 2K o 4K, con más o menos filtros, o lo que es igual, las GPU ya no son tan "todoterrenos".
Pero, aunque esto es más patente ahora que hace dos generaciones, lo realmente importante y que seguirá siendo así durante muchísimos años hasta que el renderizado sea sustituido por cálculos mediante Tensores con IA, total o parcialmente, es que a mayor número de Shaders, ROP y TMU, más rendimiento habrá y más importante se vuelve frente al bus.
De ahí que IC tome más relevancia que el bus de datos, ya que sin ella, AMD estaría obligado (ahí sí) a usar buses más grandes, ocupando de paso más silicio, no lo olvidemos. Silicio que, por otro lado, se tiene que destinar en gran parte a la L2, también más cara, pero ofreciendo más rendimiento.
La escalabilidad depende de ello, y no tanto de si tiene 128 bits o 192 o 256. Esto es equivalente a otro apartado que tiene la tarjeta, y donde apenas se ven críticas: PCIe 4.0 x8, y no x16 como el resto de sus hermanas.
Y no es que haya un problema, porque no es así, ya que la GPU no es capaz de colapsar la interfaz y su ancho de banda, y en cambio, permite a AMD ofrecer este modelo algunos dólares más barato al prescindir de la mitad de contactos en el PCB y su slot. ¿Hay alguna crítica al respecto que sea multitudinaria? No, solo alguna puntual en el momento de salida y no se volvió a escuchar nada, no había motivo, como tampoco lo debería haber con el bus, pero...
El balance es lo más importante en una GPU
Volviendo al tema principal, ¿qué tiene que ver la VRAM? Simple, puedes quedarte sin VRAM, puede que el juego recurra a la RAM del sistema como hemos explicado, pero la mayor merma de rendimiento llegados hasta ese punto recae en el número de SM o CU que tenga la tarjeta gráfica, y no tanto la VRAM.
O lo que es igual, sin músculo de poco te vale pesar menos en una carrera de atletismo en 100 metros lisos. Siguiendo este símil, se necesita más músculo que peso para acelerar y conseguir la máxima velocidad en un atleta, consiguiendo más Km/h también de paso. Pero todo tiene un límite, y de ahí el balance del que hablábamos, porque no veremos un corredor de 120 Kg de puro músculo sin apenas flexibilidad llegar primero en los 100 metros en la meta, igual que tampoco veremos un corredor de 50 Kg y muy flexible ganar este tipo de carrera.
Pero prima el músculo antes que el peso, y evidentemente van relacionados, pero el equilibrio de la masa muscular con la elasticidad, la altura, zancada y técnica es lo que definirán al velocista, como lo hace IC con los 128 bits y los 16 GB del modelo original frente a sus CU.
¿8 GB vs 16 GB? ¿Dónde está el problema?
Realmente en ningún sitio, salvo porque Steinman obvia algo que todos sabemos: se pueden bajar settings gráficos. Como primero se necesita un buen balance de Shaders (CU en general) antes que un bus más grande, añadir más GB solo es un beneficio extra, pero (ahora sí toca hablar de esto) también tendremos que desembolsar más dinero por norma general en el modelo de mayor capacidad.
La opción más simple, siempre que el juego lo permita, es bajar algún setting y quedarnos en el límite de la VRAM en cuanto a capacidad y sabiendo que hay una parte que se reserva para el driver y ciertas características, de los cuales ya hemos hablado en otras ocasiones.
Por tanto, si nos lo podemos permitir, Steinman lleva razón, más VRAM siempre es una ventaja, presente y futura, puesto que no tendremos que acceder a la RAM del sistema, o al menos, con menos asiduidad, escalando algunos FPS por el camino. Eso sí, no muchos, salvo que la demanda de VRAM sea increíble por resolución, filtros o simplemente porque el motor gráfico coge todo lo que le demos, sean 8 GB, 16 GB o 24 GB. Algo que también ocurre y no quiere decir que todo se esté usando.
Para discernir en estos casos, habría que comparar con un modelo como el de la RX 7600 XT de la que estamos hablando, mismo chip, distinta VRAM, y salir de dudas sobre cómo afecta realmente a los FPS en ese juego en concreto, porque si el rendimiento es exacto aun duplicando la memoria, entonces sabemos que simplemente el motor del juego hace acopio de toda la que le demos, aunque no la está usando a ese nivel.
Y hasta aquí la explicación extensa de todo lo relacionado con la RX 7600 XT 16 GB y sus 128 bits.