NVIDIA RTX 4060 Ti en Compubench vs RX 6650 XT y RTX 3060 Ti, ¿cuál es mejor?
Por fin tenemos los resultados de la RTX 4060 Ti en Compubench, es por ello que hemos decidido compararlos con los de su antecesora, la RTX 3060 Ti y la tarjeta gráfica de AMD más potente disponible en el mercado bajo su gama como es la RX 6650 XT a espera del lanzamiento de la RX 7600 XT. ¿Qué conclusiones podemos sacar de los resultados?
Si bien los juegos son la prueba de rendimiento definitiva para probar una tarjeta gráfica, estos tocan demasiados palos y nos dan una imagen generalizada. En cambio, si queremos tener una visión específica de cómo trabaja cada una de ellas en puntos concretos, la información que nos dan los benchmarks nos puede ser muy útil para localizar sus fortalezas y debilidades.
Así rinden las tarjetas gráficas NVIDIA RTX 4060 Ti en Compubench
Cuando hablamos de computación en una GPU nos referimos al procesamiento de datos por parte de la misma, pero que no tienen, en principio, nada que ver con los gráficos. Sin embargo, cada vez son más los algoritmos usados en los motores gráficos que hacen uso del pipeline de computación para ejecutar ciertos algoritmos gráficos. Es por ello que es interesante saber el rendimiento de las RTX 4060 Ti en Compubench, para ver cuál es su rendimiento en ese aspecto.
En concreto, el benchmark mide la velocidad de las GPU en operaciones relacionadas con la manipulación de la geometría, así como de efectos de postprocesado, por lo que al contrario de OpenCL está más enfocado al uso de computación en videojuegos. De ahí a que nos interesa ver una comparativa en cuanto a rendimiento con otras tarjetas gráficas similares como pueden ser la RTX 3060 Ti de la propia NVIDIA y la RX 6650 XT de AMD, aunque echamos en falta la disponibilidad de la RX 7600 XT, pero todavía no se encuentra disponible en el mercado. En todo caso, hemos decidido reunir los números en la siguiente tabla para que los tengáis a mano con un solo vistazo.
RTX 4060 Ti | RTX 3060 Ti | RX 6650 XT | |
---|---|---|---|
Level Set Segmentation – 128 | 15966.233 millones de vóxeles por segundo | 12149.018 millones de vóxeles por segundo | 15013.702 millones de vóxeles por segundo |
Level Set Segmentation – 256 | 14913.081 mVoxels/s | 13125.919 mVoxels/s | 13358.163 mVoxels/s |
Local Tone Mapping 2K | Sin soporte | Sin soporte | 447.916 millones de píxeles por segundo |
Local Tone Mapping 4K | Sin soporte | Sin soporte | 536.269 millones de píxeles por segundo. |
Ocean Surface Simulation | 10275.88 Iteraciones por segundo | 5250.609 Iteraciones por segundo | 6259.151 Iteraciones por segundo |
Catmull-Clark Subdivision Level 3 | 592.38 millones de triángulos por segundo | 362.269 millones de triángulos por segundo | 473.336 millones de triángulos por segundo |
Catmull-Clark Subdivision Level 5 | 761.44 millones de triángulos por segundo | 639.75 millones de triángulos por segundo | 341.519 millones de triángulos por segundo |
N-Body simulation – 128k | Sin soporte | 547.156 iteraciones por segundo | Sin soporte |
N-Body simulation – 1024k | Sin soporte | 100.386 iteraciones por segundo | Sin soporte |
Vertex Connection and Merging | 21.587 millones de píxeles por segundo | 12.838.986 millones de píxeles por segundo | 8390.386 millones de píxeles por segundo |
Subsurface Scattering | 14320,289 millones de muestras por segundo | 14320,289 millones de muestras por segundo | 8136.244 millones de muestras por segundo |
Subsurface Scattering multiple view | 13332 millones de muestras por segundo | 12080.566 millones de muestras por segundo | 12080.566 millones de muestras por segundo |
TV-L1 Optical Flow | 118.349 millones de píxeles por segundo | 85.788 millones de píxeles por segundo | 81.57millones de píxeles por segundo |
Cómo se puede ver, la más perjudicada de las tres es la RX 6650 XT; sin embargo, lo que nos interesa es la evolución de la RTX 3060 Ti a la RTX 4060 Ti. Más que nada por el hecho que la primera dispone de 38 núcleos SM y la segunda 34. La apuesta de NVIDIA con su nueva generación es clara, menos unidades y menos bus, pero a una muy mayor velocidad de reloj de GPU y memoria para compensar.
El cuello de botella en las RTX 40 es obvio
Muchos os preguntaréis que sentido tienen estas pruebas de benchmarking, desde el lado punto de vista del usuario que instala su tarjeta gráfica en el PC para jugar, pues tienen poco valor. Aunque esto no significa que tengan poco valor, ya que al medir puntos diferentes de rendimiento de una GPU podemos saber que partes se han reforzado, cuáles se han mantenido iguales y donde hay deficiencias. En todo caso, los números de la RTX 4060 Ti en Compubench dejan por los suelos las afirmaciones de que existe un cuello de botella en estas tarjetas gráficas.
Son embargo, esto no significa que no tengan margen de mejora, pero se puede decir que de cara a tareas de computación, el hecho de aumentar 16 veces la caché L2 es, sin duda, una solución eficiente. Lo cual no quita que no exista un margen de mejora de cara a una próxima generación. Más que nada, por el que si tenemos en cuenta que su ratio de Bytes/s por FLOPS es mucho más bajo que en las RTX 30, pero eso es solo si tenemos en cuenta la memoria externa en la ecuación. En todo caso, veremos si la sucesora de esta tarjeta mantendrá el bus de 128 bits o, en cambio, volveremos a los 192 bits, pero manteniendo su enorme memoria caché de segundo nivel. Lo cual supondrá una enorme mejora en rendimiento.