AMD se marca un «NVIDIA»: la RX 7600 es una RX 6650 XT con menor consumo

No ganamos para disgustos. Si ayer la RTX 4060 Ti nos dejó fríos por su escalada de rendimiento frente a su predecesora, ahora llega AMD con la RX 7600 y hace algo totalmente similar. Y es que las reviews han mostrado cómo a igualdad de condiciones y casi especificaciones la arquitectura RDNA 3 apenas ha supuesto un cambio drástico en el rendimiento Shader por Shader, MHz por MHz y bit por bit. ¿Qué ha pasado ahora?

No son buenas noticias, y aunque la RX 7600 se ha mostrado capaz, como también lo hizo la RTX 4060 Ti para la resolución a la que han sido concebidas, los datos mostrados por decenas de review van a dar bastantes titulares. Ambas tarjetas no compiten entre ellas, porque para eso estará la RTX 4060 Ti, pero, de media y a una resolución de 1080p se separan por más o menos un 25%. El problema viene con sus predecesoras...

AMD RX 7600, ¿es una RX 6650 XT con menor consumo?

AMD-RX-7600-XT-16-GB

Nos vamos a centrar en la review de TechPowerUp por ser la más completa en cuanto a datos, dado que AMD no ha tenido la cortesía de mandarnos una RX 7600 para poder analizarla (guiño, guiño). En cualquier caso, a diferencia de los datos que sí que pudimos comparar ayer en más de 10 reviews (RTX 4060 Ti 8 GB), estos sí muestran una paridad entre análisis (RX 7600), es decir, los datos son más homogéneos entre analistas y equipos.

Además, nos vamos a centrar solamente en la resolución 1080p, por dos motivos. El primero es que, como ha dicho AMD, es la resolución a la que va enfocada esta GPU, y en segundo motivo, conforme se asciende en resolución las diferencias se acortan.

El comentario más llamativo en el día de ayer era que el bus de la RTX 4060 Ti era el causante de que a mayor resolución se escogía, peor rendimiento ofrecía (no es cierto, es un tema comparativo de Shaders, ROPs y TMUs, es bus no es limitante como tal, aunque a mayor bus, igual que a mayor tamaño de VRAM, el rendimiento escala, en CUALQUIER GPU, y aquí habría que abrir matices como con la RTX 4090 y sus 24 GB etc, quizás en otro artículo explicativo de arquitectura) se repite hoy en la RX 7600. Dicho esto, vamos con los datos.

AMD-RX-7600-rendimiento-1080p

Lo que muestra TechPowerUp es una diferencia entre la RX 6650 XT y la nueva RX 7600 de solo un 4%, mientras a 2K y 4K la diferencia se reduce a solo un 2%. ¿Por qué comparar estas tarjetas y no con la RX 6600 que es a la que sustituye?

En primer lugar, porque TPU no ha metido en la comparativa esta tarjeta, y en segundo lugar, aunque es evidentemente más rápida la nueva RX 7600, sabemos la diferencia entre la RX 6600 vs RX 6600 XT: algo más del 10%, normalmente entre un 12% y un 13%. Así que lo que realmente consigue la RX 7600 es endosarle entre un 16% y un 17% a la RX 6600, algo por debajo del 20% o 25% que especulábamos (muy optimista por mi parte viendo los TFLOPS, pero son, o eran, "arquitecturas distintas", comillas que ahora matizaremos). Dicho esto, ¿por qué ha escalado tan mal?

Especificaciones casi clavadas, rendimiento demasiado parejo, ¿ha sido AMD conservadora?

RX 6600 RX 6600 XT RX 6650 XT RX 7600
Arquitectura RDNA 2 RDNA 2 RDNA 2 RDNA 3
Shaders 1792 2.048 2.048 2.048
Frecuencia Shaders 2.491 MHz 2.589 MHz 2.635 MHz 2.625 MHz
TMU 112 128 128 128
ROP 64 64 64 64
L0 32 KB por WGP 32 KB por WGP 32 KB por WGP 32 KB por WGP
L1 128 KB por Array 128 KB por Array 128 KB por Array 128 KB por Array
L2 2 MB 2 MB 2 MB 2 MB
L3 32 MB 32 MB 32 MB 32 MB
Bus 128 Bits 128 Bits 128 Bits 128 Bits
Frecuencia VRAM 1.750 MHz o 14 Gbps 2.000 MHz o 16 Gbps 2.190 MHz o 17,5 Gbps 2.250 MHz o 18 Gbps
VRAM 8 GB 8 GB 8 GB 8 GB
TBP 132W 160W 176W 165W

Nos volvemos a centrar en la comparativa RX 6650 XT vs RX 7600, y es que clavan sus especificaciones de manera casi perfecta, cosa que no suele pasar en este mercado. Ambas tienen 2.048 Shaders, 128 TMU, 64 ROP, 32 RT Cores, 32 KB de L0 por WGP, 128 KB de L1 por Array, 2 MB de L2 y 32 MB de L3, que salvando la nueva Infinity Caché (inexistente en este modelo, es monolítico con arquitectura RDNA 3) y las disparidades entre ellas, la ventaja estará del lado de la más nueva, o eso se presupone.

Y en el lado de las frecuencias, bus y ancho de banda, así como VRAM, tenemos 2.635 Mhz vs 2.625 MHz en Shaders, y 2.190 MHz vs 2.250 MHz en frecuencia de VRAM (17,5 Gbps vs 18 Gbps efectivos). Por lo tanto, a mismo bus de 128 Bits apenas tenemos diferencia en el ancho de banda, con 288 GB/s vs 280,3 GB/s, para los 8 GB de tamaño que disponen ambas.

El rendimiento en FP32, por lo tanto, es casi calcado, y no se debería de comparar, puesto que son, en teoría, dos arquitecturas totalmente diferentes, como hemos hablado bastantes veces, porque hay cambios importantes de diseño. Pero entonces ¿cómo es posible que a mismas características no haya una diferencia de rendimiento por pura arquitectura?

Un problema evidente de latencia en RDNA 3, pero ¿afecta a la RX 7600 y su rendimiento?

AMD-RDNA-3-Cache

Como ya sabemos, AMD ha separado la L3 del die principal en sus modelos tope de gama en RDNA 3, y como bien sabemos ha intentado paliar esto con la Infinity Caché de segunda generación a través de un ancho de banda de interconexión de 5,3 TB/s entre chiplets. El problema es que no se ha paliado del todo. El avance aquí es significativo, pero debido a las reducciones de buses por el aumento de las cachés, estas han tomado mucha más relevancia, tanto en AMD como en NVIDIA.

La diferencia es que los verdes no han sacado la caché fuera y, por lo tanto, cuando la misma se comienza a llenar obtienen un mejor rendimiento en términos de latencia. En concreto, en L0 NVIDIA lo hace mejor que AMD, en L1 y L2 los rojos tienen su fuerte, y en la L3 es donde RDNA 3 enfrenta problemas frente a RDNA 2. Los datos de los compañeros de Chips and Cheese así lo demuestran al comparar la RX 6900 XT vs RX 7900 XT vs RTX 4090.

AMD-RX-6900-XT-vs-RX-7900-XT-vs-RTX-4090-cache-escalar

A misma gama de tarjeta, RDNA 3 palidece a partir de los 8 MB en cuanto al tamaño de texturas, pero la escalada llega desde antes, desde los 4 MB que es donde comienza a sufrir la 6900 XT. También se aprecia cómo la RX 7900 XT tiene una subida mayor en cuanto llena los 6 MB de L2 y a partir de ahí se tiene que acceder a la L3, y claro, la latencia se dispara. ¿Cuánto? Pues casi un 25%, lo cual es mucho, demasiado como para no ver un impacto en el rendimiento final de una tarjeta gráfica.

Por lo tanto, todo nos hace pensar que los problemas de rendimiento de la RX 7600 no vienen desde ahí, porque a mismas especificaciones la mejora es nula, cuando por pura arquitectura deberían escalar frente a la RX 6650 XT.

AMD-RX-7600-PCB

Todo a pesar de que es un chip monolítico que presenta, curiosamente, los mismos problemas de latencia, aunque paliados por implementar la L3 en el mismo chip como la de su futura rival, RTX 4060.

Lo único que se aprecia aquí es, precisamente, que la escalada de rendimiento es prácticamente nula a pesar de tener una Pipeline gráfica totalmente nueva. ¿Acaso hay menos salto de rendimiento entre RDNA 3 vs RDNA 2 pese a los cambios? Al parecer, realmente sí.

Un problema fuera de los MCD

AMD-RDNA-3-Memory-Cache-Die

Es curioso cómo se esperaba un salto mayor y, en cambio, es apenas una mejora residual a mismas unidades de hardware. Las mejoras, que las hay, se están centrando en el consumo, que ha bajado, y entonces nos preguntamos, ¿podía haber apretado AMD más las frecuencias para obtener más rendimiento? Pues sí, en concreto, entre un 5% y un 10%, que es el máximo que consiguen las tarjetas en la actualidad subiendo frecuencias en VRAM y Shaders hasta tocar PL.

Por lo tanto, esquivado el tema comentado de caché y MCD con la RX 7600, este es el temido problema que enfrentaba AMD al presentar RDNA 3 como arquitectura y es el principal escollo a superar en RDNA 4, porque de no presentar este hecho en la gama RX 7000, estaríamos hablando de unas GPU mucho más capaces que pondrían en serios aprietos a NVIDIA.

Los verdes, inteligentes, han prescindido de chiplets. El problema es que dado el precio de la SRAM actualmente, los problemas de TSMC para implementar más transistores en caché y, sobre todo, el coste de esta, que está disparado, lo están pagando en forma de un mayor precio para los chips.

RDNA-3-CP,-Geometry-and-Pixel-Pipeline

En cambio, AMD y sus MCD son realmente baratos, pero a costa de rendimiento. No llueve a gusto de nadie igualmente, porque los precios siguen altos, pero por lo menos, ya entendemos el porqué del bajo rendimiento y precio de la RX 7600.

Conclusiones finales

Por lo tanto, y resumiendo, apenas hay mejora en la arquitectura como tal. El salto de rendimiento, como en el caso de NVIDIA, proviene más de TSMC que de mejoras reales, lo cual es interesante puesto que realmente hay cambios bajo el capó y hasta ahora, pensábamos que los problemas de latencia de RDNA 3 eran "la excusa" para no alcanzar a NVIDIA.

Ahora vemos que no, que a mismo chip monolítico el problema persiste, ya no hay excusa de latencia, simplemente la arquitectura no cumple lo que promete y parece más un salto adelante con cambios importantes pensando en RDNA 4, que realmente debe ser un paso hacia delante real. El rendimiento, como en el caso de los verdes, se consigue a base de Shaders, TMU y ROP, así que podríamos decir, sin riesgo a equivocarnos que tanto RDNA 3 como Ada Lovelace son "refritos" de forma oficial, salvando las distancias de la novedad de MCD y GCD (que no es para alabar precisamente y visto lo visto).

Y es que no es justificable un salto de rendimiento por pura arquitectura de un 4% a mismo chip monolítico, ya no hablemos de segmentar por chiplets. Al final, ambos necesitan meter más cantidad de unidades (Shaders, TMU y ROP) y más frecuencia, porque el aumento de caché para paliar el bus solo le vale de justificación a NVIDIA (AMD lo arrastra en parte desde RDNA 2). Aquí se ha visto perfectamente que los de Lisa Su tienen que mejorar, y mucho, porque Blackwell viene realmente fuerte.