Las RTX 50 rebajan las expectativas de rendimiento: tendrían los mismos ROP que las RTX 40

Ojo cuidado porque el suflé comienza a desinflarse y bastante. Tras las configuraciones de las RTX 50 que vimos ayer a modo de confirmación por parte del mayor filtrador de NVIDIA ahora llegan otras anexas que, de ser ciertas, cambian el panorama de aumento de rendimiento de las nuevas GPU de NVIDIA. Y es que los ROP vuelven a escena para las RTX 50, ¿mantendrá NVIDIA los mismos en Blackwell?

Pues es la gran duda, pero la información de hoy da a entender que NVIDIA habría mantenido la misma estructura general en Blackwell que en Ada Lovelace, es decir, mantiene gran parte de lo visto en las RTX 40 en sus nuevas gráficas.

La disposición de los GPC puede cambiarlo todo

NVIDIA-Ada-Lovelace-GPC

Tenemos que partir de la información de ayer para entender a qué nos estamos refiriendo e igualmente, tocaremos cosas básicas para explicar todo. En primer lugar, comentar brevemente qué es un GPC (Graphic Processing Cluster): es el bloque dentro de la arquitectura de nivel más alto en NVIDIA, es la unidad que engloba todo el resto de unidades de procesamiento gráfico.

Normalmente, los cambios de arquitectura a nueva arquitectura modifican poco el dibujo general en ellos, pero para ser concretos, en Ada Lovelace (RTX 40) un GPC incluye un Raster Engine, dos particiones de ROP (Raster Operations) donde cada una tiene 8 unidades individuales, además, incluye los TPC, normalmente 6. 

Cada TPC incluye un motor polimórfico y dos SM, donde dentro de estos se encuentran las unidades menores. Sabiendo esto, veamos las configuraciones de ayer resumidas:

  • GB202 -> 12 GPC con 8 TPC y 2 SM cada uno con 128 Shaders por SM = 24.576 Shaders.
  • GB203 -> 7 GPC con 6 TPC y 2 SM por cada uno con 128 Shaders por SM = 10.752 Shaders.
  • GB205 -> 5 GPC con 5 TPC y 2 SM por cada uno con 128 Shaders por SM = 6.400 Shaders.
  • GB206 -> 3 GPC con 6 TPC y 2 SM por cada uno con 128 Shaders por SM = 4.608 Shaders.
  • GB207 -> 2 GPC con 5 TPC y 2 SM por cada uno con 128 Shaders por SM = 2.560 Shaders.

Estos datos nos dejarían un recuento de Shaders y ROP, si la normativa superior por unidades se cumple, bastante dantesca, por ser suaves.

Las RTX 50 podrían tener los mismos ROP que las RTX 40 GPU por GPU

NVIDIA-Ada-Lovelace-vs-Blackwell-Shaders-vs-ROP

La comparativa no deja lugar a dudas. Teniendo en cuenta que, salvo sorpresa, NVIDIA mantendría los ROP por cada GPC y viendo la estructura de estos en cada GPU de las RTX 50, lo que tendríamos es una mejora nula de esta parte tan clave entre las RTX 40 y las RTX 50.

Esto es clave, ya que los ROP (Raster Operations Pipeline) se encargan de cuatro tareas básicas en las GPU:

  • Composición de los píxeles procesados y su rasterización.
  • Determinan profundidad, combinación de colores o efectos de transparencias y antialiasing variados.
  • Se encargan de la compresión de color y profundidad si es necesario.
  • Escriben en el framebuffer los resultados, y por tanto, pueden mejorar la latencia hacia la memoria si hay más unidades disponibles (menos cuello de botella obtiene la menor latencia disponible por arquitectura)

Si lo que tenemos es un empeoramiento entre las RTX 40 y las RTX 50 donde el GB207 es el único que pierde rendimiento en este apartado al pasar de 48 ROP en el AD107 a 32 ROP, sabiendo que entre la RTX 5090 y RTX 4090 hay un 50% más de Shaders (+33% frente al AD102 completo), de cumplirse lo dicho, lo que estamos viendo es una nula mejora aquí. La GDDR7 compensará algo la latencia por sus menores timings generales y mayor velocidad, pero nunca será igual que obtener más ROP.

Pero sobre todo, un importante capado para la RTX 5090 al mantener esos 12 GPC. La configuración ideal en este caso hubiese sido 16 x 6, manteniendo con ello el número de Shaders totales, pero aumentando el número de ROP de 192 a 256, un cambio que impulsaría mucho más el rendimiento.

Lo que vimos entre la RTX 4070 Ti SUPER y la RTX 4080 dictamina la importancia de los ROP

RTX 4070 Ti SUPER RTX 4080 Diferencia porcentual
Shaders 8.448 9.728 -13,15%
SM 66 76 -13,15%
TMU 264 304 -13,15%
ROP 112 112 0%
Tensor Cores 264 304 -13,15%
RT Cores 66 76 -13,15%
L2 49 MB 64 MB -23,43%
Clock Base 2.340 2.205 MHz +6,12%
Clock Boost 2.610 2.505 MHz +4,19%
Bus 256 bits 256 bits 0%
Memoria GDDR6X 16 GB 16 GB 0%
Velocidad VRAM 21 Gbps 22,4 Gbps -6,25%
TGP 285 vatios 320 vatios -10,93%
Precio MSRP 799 dólares 1.199 dólares -33,36%

¿Por qué podemos afirmar esto? Porque ya lo vivimos entre la RTX 4070 Ti SUPER y la RTX 4080, aunque en ese caso era un downgrade, ya que ambas GPU tienen 112 ROP, pero en cambio, la menor de las hermanas tiene en casi todas sus características una bajada de prestaciones importante para adaptarla al segmento del mercado.

El resultado en rendimiento final es que la diferencia porcentual media entre ambas es de un 10% a favor de la mayor de las dos, y este GAP tan pequeño pese a las diferencias de prestaciones es fruto de los 112 ROP que tiene la RTX 4070 Ti SUPER, los cuales empujan el rendimiento pese al downgrade de la GPU.

En este caso, solo la RTX 5090 parece merecer la pena sobre el papel frente a sus hermanas como una GPU que sí ofrece un salto de rendimiento como Next Gen, pero el resto... Se van a intercalar de mala manera con las RTX 40, por encima de sus predecesores, es cierto, pero no parecen ser ningún salto pronunciado hacia delante (al menos en rasterización) lo cual es debido en parte a los ROP en estas RTX 50. Por tanto, y a modo de conclusión, será el precio una vez más el que ponga en liza lo interesantes, o no, que serán estas nuevas tarjetas gráficas, pero sin duda el suflé está bajando a ritmos forzados filtración tras filtración.