Las RTX 5090 y RTX 5080 tienen la misma cantidad de caché L1 que sus predecesoras, la L2 volverá a ser un cuello de botella para el rendimiento
Los datos que se expusieron ayer desde HardwareLUXX están dando mucho juego, ya que la información es oficial de NVIDIA, y como tal, podemos sacar conclusiones a ciencia cierta. Y la realidad no está siendo la esperada por mucho, puesto que ahora sabemos que las RTX 5090 y RTX 5080 tendrán la misma cantidad de caché L1 y casi la misma L2 por SM que sus predecesoras RTX 4090 y RTX 4080. Como sabemos, esto supuso un claro cuello de botella en ambas para con el rendimiento en gaming, ¿vuelve NVIDIA a repetir el mismo "error"?
No hay duda que dado el tamaño de las matrices, la nula escalabilidad del nodo litográfico y por supuesto, el impresionante coste de la SRAM para cada GPU, NVIDIA ha decidido ser cauta en cuanto a las mejoras de la arquitectura. Como ya vimos, las RTX 50 parecen más un "refrito" que un avance real en hardware, y en cambio, son dos pasos adelante más en software. ¿Van a pagar los usuarios por algo intangible físicamente que por lo que realmente importa?
La L1 y L2 de las RTX 5090 y RTX 5080 a escena sin novedades, ¿refrito o upgrade más que innovación real?
RTX 5090 | RTX 5080 | RTX 5070 Ti | RTX 5070 | |
GPU | GB202-300-A1 | GB203-400-A1 | GB203-300 | GB205-300 |
Arquitectura | Blackwell | Blackwell | Blackwell | Blackwell |
SM | 170 | 84 | 70 | 48 |
Shaders | 21.760 | 10.752 | 8.960 | 6.144 |
Clock Base | 2.010 MHz | 2.300 MHz | 2.300 MHz | 2.160 MHz |
Clock Boost | 2.410 MHz | 2.620 MHz | 2.450 MHz | 2.510 MHz |
Caché L1 | 21.760 kB | 10.752 kB | 8.960 kB | 6.144 kB |
Caché L2 | 96 MB | 64 MB | 48 MB | 48 MB |
Bus de datos | 512 bits | 256 bits | 256 bits | 192 bits |
Tipo VRAM y velocidad | GDDR7 (28 Gbps) | GDDR7 (30 Gbps) | GDDR7 (28 Gbps) | GDDR7 (28 Gbps) |
Capacidad de VRAM | 32 GB | 16 GB | 16 GB | 12 GB |
Ancho de banda de memoria | 1.792 GB/s | 960 GB/s | 896 GB/s | 672 GB/s |
TGP | 575W | 360W | 300W | 250W |
Precio | 2.329€ | 1.169€ | 879€ | 649€ |
Es cierto que tenemos nueva generación de Tensor Cores y RT Cores, es cierto que hay más SM y Shaders en la misma área por unidad pese a una menor densidad de transistores, pero también es cierto que, ojo al dato, tenemos el mismo número máximo de FP32 por SM que se arrastra desde Pascal, aunque el doble de INT32 frente a Ada Lovelace (tabla inferior).
Blackwell, por tanto, con los motores otra vez unificados, representa el mismo número de FP32 e INT32 por unidad y SM desde hace casi 10 años, es decir, desde Pascal y las GTX 1000. Esto es relevante para poner en contexto que NVIDIA, por desgracia, lleva con el mismo tamaño de L1 desde Ampere (RTX 30), o lo que es igual, 128 KB por SM. Como se han limitado a meter más SM para lograr el salto de rendimiento en rasterización, también tenemos más L1 y L2, las cuales, están en entredicho en las RTX 5090 y RTX 5080.
Para muestra, la tabla que tenéis justo arriba. Resumiendo bastante, la RTX 5090 solo obtiene 5,4 MB más de L1 y 26,3 MB más de L2, lo que supone el esperado incremento del 33,12% para la primera y un 36,52% para la segunda, haciendo un total de 21.760 KB y 98.304 KB.
La RTX 5080 cada vez pinta peor, por desgracia
Corre el riesgo de ser un fracaso en ventas a este paso, como le ocurrió a la RTX 4080 en su día. Los 84 SM de la RTX 5080 dan como resultado una L1 de 10.752 KB y una L2 de 65.536 KB, o lo que es igual, 10,7 MB y 65 MB respectivamente. Teniendo en cuenta que las RTX 4080 y RTX 4080 SUPER tienen 9,7 MB y 64 MB respectivamente el salto es ínfimo: 1 MB de L1 y L2.
Si tenemos en cuenta el salto brutal en estos apartados que hubo entre las RTX 30 y RTX 40, el paso a las RTX 50 vuelve a demostrar que estamos ante un upgrade de la gama con algunas novedades en la arquitectura de menor calado enfocadas al Ray Tracing y al Deep Learning o la IA, pero en rasterización deberíamos ver saltos muy poco pronunciados por esta paupérrima escalabilidad por SM.
Este es uno de los motivos de la insistencia de NVIDIA con GDDR7: necesita más ancho de banda y menor latencia general, así como un menor consumo para paliar el aumento de Shaders y el mismo ratio de tamaño de cachés por SM, donde el consumo aumenta en todos los modelos por motivos obvios que solo se disimulan con el descenso de los vatios que aporta la nueva mejora.
En resumen, en rasterización las mejoras de rendimiento apenas superarán las dos cifras, donde solo la RTX 5090 destacará, pero en el resto de la gama se podrían ver mejoras de FPS de una sola cifra, y esto será decepcionante si tenemos en cuenta los precios oficiales a los que saldrá cada modelo frente al de sus predecesores.
Ahora se entiende mucho mejor la subida de precio de última hora de las RTX 40: NVIDIA quiere que compres su nuevo hardware y no el antiguo por su mejor relación rendimiento/consumo/precio. De momento, las RTX 50 se siguen desinflando, veremos si cuando las reviews hagan acto de presencia esta teoría basada en los datos de la propia NVIDIA es correcta o no, porque por mucho FG o DLSS que incluyan, al final el hardcore gamer quiere potencia en rasterización y no tanto frame generado o supersampling, aunque sea un nicho de usuarios, eso sí, fieles a la marca.