NVIDIA RTX 4060 Ti en Compubench vs RX 6650 XT y RTX 3060 Ti, ¿cuál es mejor?

Por fin tenemos los resultados de la RTX 4060 Ti en Compubench, es por ello que hemos decidido compararlos con los de su antecesora, la RTX 3060 Ti y la tarjeta gráfica de AMD más potente disponible en el mercado bajo su gama como es la RX 6650 XT a espera del lanzamiento de la RX 7600 XT. ¿Qué conclusiones podemos sacar de los resultados?

Si bien los juegos son la prueba de rendimiento definitiva para probar una tarjeta gráfica, estos tocan demasiados palos y nos dan una imagen generalizada. En cambio, si queremos tener una visión específica de cómo trabaja cada una de ellas en puntos concretos, la información que nos dan los benchmarks nos puede ser muy útil para localizar sus fortalezas y debilidades.

Así rinden las tarjetas gráficas NVIDIA RTX 4060 Ti en Compubench

RTX 4060 Ti

Cuando hablamos de computación en una GPU nos referimos al procesamiento de datos por parte de la misma, pero que no tienen, en principio, nada que ver con los gráficos. Sin embargo, cada vez son más los algoritmos usados en los motores gráficos que hacen uso del pipeline de computación para ejecutar ciertos algoritmos gráficos. Es por ello que es interesante saber el rendimiento de las RTX 4060 Ti en Compubench, para ver cuál es su rendimiento en ese aspecto.

En concreto, el benchmark mide la velocidad de las GPU en operaciones relacionadas con la manipulación de la geometría, así como de efectos de postprocesado, por lo que al contrario de OpenCL está más enfocado al uso de computación en videojuegos. De ahí a que nos interesa ver una comparativa en cuanto a rendimiento con otras tarjetas gráficas similares como pueden ser la RTX 3060 Ti de la propia NVIDIA y la RX 6650 XT de AMD, aunque echamos en falta la disponibilidad de la RX 7600 XT, pero todavía no se encuentra disponible en el mercado. En todo caso, hemos decidido reunir los números en la siguiente tabla para que los tengáis a mano con un solo vistazo.

RTX 4060 Ti RTX 3060 Ti RX 6650 XT
Level Set Segmentation – 128 15966.233 millones de vóxeles por segundo 12149.018 millones de vóxeles por segundo 15013.702 millones de vóxeles por segundo
Level Set Segmentation – 256 14913.081 mVoxels/s 13125.919 mVoxels/s 13358.163 mVoxels/s
Local Tone Mapping 2K Sin soporte Sin soporte 447.916 millones de píxeles por segundo
Local Tone Mapping 4K Sin soporte Sin soporte 536.269 millones de píxeles por segundo.
Ocean Surface Simulation 10275.88 Iteraciones por segundo 5250.609 Iteraciones por segundo 6259.151 Iteraciones por segundo
Catmull-Clark Subdivision Level 3 592.38 millones de triángulos por segundo 362.269 millones de triángulos por segundo 473.336 millones de triángulos por segundo
Catmull-Clark Subdivision Level 5 761.44 millones de triángulos por segundo 639.75 millones de triángulos por segundo 341.519 millones de triángulos por segundo
N-Body simulation – 128k Sin soporte 547.156 iteraciones por segundo Sin soporte
N-Body simulation – 1024k Sin soporte 100.386 iteraciones por segundo Sin soporte
Vertex Connection and Merging 21.587 millones de píxeles por segundo 12.838.986 millones de píxeles por segundo 8390.386 millones de píxeles por segundo
Subsurface Scattering 14320,289 millones de muestras por segundo 14320,289 millones de muestras por segundo 8136.244 millones de muestras por segundo
Subsurface Scattering multiple view 13332 millones de muestras por segundo 12080.566 millones de muestras por segundo 12080.566 millones de muestras por segundo
TV-L1 Optical Flow 118.349 millones de píxeles por segundo 85.788 millones de píxeles por segundo 81.57millones de píxeles por segundo

Cómo se puede ver, la más perjudicada de las tres es la RX 6650 XT; sin embargo, lo que nos interesa es la evolución de la RTX 3060 Ti a la RTX 4060 Ti. Más que nada por el hecho que la primera dispone de 38 núcleos SM y la segunda 34. La apuesta de NVIDIA con su nueva generación es clara, menos unidades y menos bus, pero a una muy mayor velocidad de reloj de GPU y memoria para compensar.

El cuello de botella en las RTX 40 es obvio

GPU VRAM PCB

Muchos os preguntaréis que sentido tienen estas pruebas de benchmarking, desde el lado punto de vista del usuario que instala su tarjeta gráfica en el PC para jugar, pues tienen poco valor. Aunque esto no significa que tengan poco valor, ya que al medir puntos diferentes de rendimiento de una GPU podemos saber que partes se han reforzado, cuáles se han mantenido iguales y donde hay deficiencias. En todo caso, los números de la RTX 4060 Ti en Compubench dejan por los suelos las afirmaciones de que existe un cuello de botella en estas tarjetas gráficas.

Son embargo, esto no significa que no tengan margen de mejora, pero se puede decir que de cara a tareas de computación, el hecho de aumentar 16 veces la caché L2 es, sin duda, una solución eficiente. Lo cual no quita que no exista un margen de mejora de cara a una próxima generación. Más que nada, por el que si tenemos en cuenta que su ratio de Bytes/s por FLOPS es mucho más bajo que en las RTX 30, pero eso es solo si tenemos en cuenta la memoria externa en la ecuación. En todo caso, veremos si la sucesora de esta tarjeta mantendrá el bus de 128 bits o, en cambio, volveremos a los 192 bits, pero manteniendo su enorme memoria caché de segundo nivel. Lo cual supondrá una enorme mejora en rendimiento.