Nvidia Turing TU102, TU104 y TU106, un vistazo a fondo
Una vez vistas las tecnologías que trae consigo Nvidia Turing, toca ver los 3 nuevos núcleos con los que darán vida a la nueva generación de gráficas: Turing TU102, TU104 y TU106.
Un primer vistazo al esquema de los 3 núcleos nos permite ver la proporcionalidad entre ellos, aunque mejor veamos la tabla de especificaciones técnicas con los componentes de cada uno de ellos.
RTX 2080 Ti | GTX 1080 Ti | RTX 2080 | GTX 1080 | RTX 2070 | GTX 1070 | |
Arquitectura | Turing | Pascal | Turing | Pascal | Turing | Pascal |
Núcleo | TU102 | GP102-350 | TU104 | GP104-400 | TU106 | GP104-200 |
GPCs | 6 | 6 | 6 | 4 | 3 | 3 |
TPCs | 36 | 28 | 24 | 20 | 18 | 15 |
SMs | 68 | 28 | 46 | 20 | 36 | 15 |
CUDA Cores / SM | 64 | 128 | 64 | 128 | 64 | 128 |
CUDA Cores Totales | 4352 | 3584 | 2944 | 2560 | 2304 | 1920 |
Tensor Cores /SM | 8 | - | 8 | - | 8 | - |
Tensor Cores Totales | 544 | - | 368 | - | 288 | - |
RT Cores | 68 | - | 46 | - | 36 | - |
ROPs | 88 | 88 | 64 | 64 | 64 | 64 |
Texture Units | 272 | 224 | 184 | 160 | 144 | 120 |
Transistores | 18.600M | 12.000M | 13.600M | 7.200M | 10.800M | 7.200M |
Memoria Cache L2 | 5.632 KB | 2.816 KB | 4.096 KB | 2.048 KB | 4.096 KB | 2.048 KB |
Tamaño del Die | 754 mm2 | 471 mm2 | 545 mm2 | 314 mm2 | 445 mm2 | 314 mm2 |
Proceso de manufactura | 12 nm FFN | 16 nm | 12 nm FFN | 16 nm | 12 nm FFN | 16 nm |
El Turing TU102 se compone de 6 clúster de procesamiento gráfico (Graphic Processing Clusters, GPC), al igual que el TU104, mientras que el TU106 solo cuenta con 3 GPC. Sin embargo, cada GPC de los chips TU102 y TU106 cuentan con 6 clúster de procesamiento de texturas (Texture Processing Clusters, TPC) cada uno, mientras que el TU104 cuenta con solo 4 TPCs por cada GPC. Es decir, de mayor a menor, cuentan con un total de 36, 24 y 18 TPCs cada uno.
Tras realizar el conteo de TPCs, toca volver a subdividir cada uno de ellos en 2 Streaming Multiprocessors (SM), por lo que cada una de ellas cuenta con 72, 48 y 36 SMs respectivamente.
Ahora es cuando la cosa se pone interesante. Cada SM está compuesto por un núcleo RT, 4 unidades de texturas (TU), 96 KB de memoria cache L1 compartida y 4 bloques de procesamiento. Cada uno de estos bloques, cuenta con 16 núcleos FP32, 16 núcleos INT32 y 2 Tensor Cores, así como un planificador, un despachador y un registro de 256 KB.
Por lo tanto, cada SM cuenta con un total de 64 núcleos FP32, 64 núcleos INT32 y 8 Tensor Cores, así como un núcleo RT y 4 TU.
Como imagino que la mayoría os quedareis igual tras leer todo esto, vamos unos números que todos entendamos y que definen mejor las posibilidades de la nueva generación de gráficas Nvidia Turing.
RTX 2080 Ti | GTX 1080 Ti | RTX 2080 | GTX 1080 | RTX 2070 | GTX 1070 | |
Arquitectura | Turing | Pascal | Turing | Pascal | Turing | Pascal |
CUDA Cores | 4.352 | 3.584 | 2944 | 2560 | 2304 | 1920 |
Tensor Cores | 544 | - | 368 | - | 288 | - |
Frecuencia Base | 1350 MHz | 1480 MHz | 1515 MHz | 1607 MHz | 1410 MHz | 1506 MHz |
Frecuencia Boost | 1545 – 1.635 MHz | 1582 MHz | 1710-1800 MHz | 1733 MHz | 1620 – 1710 MHz | 1683 MHz |
Memoria | 11 GB GDDR6 | 11 GB GDDR5X | 8 GB GDDR6 | 8 GB GDDR5X | 8 GB GDDR6 | 8 GB GDDR5 |
Interfaz de memoria | 352 bits | 352 bits | 256 bits | 256 bits | 256 bits | 256 bits |
Frecuencia memoria | 14 Gbps | 11 Gbps | 14 Gbps | 10 Gbps | 14 Gbps | 8 Gbps |
Ancho de banda | 616 GB/s | 484 GB/s | 448 GB/s | 320 GB/s | 448 GB/s | 256 GB/s |
Relleno de texturas | 420,2 – 444,7 GT/s | 354,4 GT/s | 314.6 – 331.2 GT/s | 277.3 GT/s | 233.3 – 246.2 GT/s | 202 GT/s |
TDP | 250W – 260W | 250W | 215W – 225W | 180W | 175W – 185W | 150W |
Multi-GPU | 2 x NVLink x8
100 GB/s bidireccionales |
SLI HB 2-way
O SLI 2/3/4-way |
1 x NVLink x8
50 GB/s bidireccionales |
SLI HB 2-way
O SLI 2/3/4-way |
- | SLI HB 2-way
O SLI 2/3/4-way |
Y para rematar, una foto del núcleo TU102 y las memorias GDDR6 pertenecientes a la EVGA GeForce RTX 2080 Ti XC Ultra que tenemos preparada para analizar.