Nvidia Turing TU102, TU104 y TU106, un vistazo a fondo

Una vez vistas las tecnologías que trae consigo Nvidia Turing, toca ver los 3 nuevos núcleos con los que darán vida a la nueva generación de gráficas: Turing TU102, TU104 y TU106.

 0

  1

Un primer vistazo al esquema de los 3 núcleos nos permite ver la proporcionalidad entre ellos, aunque mejor veamos la tabla de especificaciones técnicas con los componentes de cada uno de ellos.

 

RTX 2080 Ti GTX 1080 Ti RTX 2080 GTX 1080 RTX 2070 GTX 1070
Arquitectura Turing Pascal Turing Pascal Turing Pascal
Núcleo TU102 GP102-350 TU104 GP104-400 TU106 GP104-200
GPCs 6 6 6 4 3 3
TPCs 36 28 24 20 18 15
SMs 68 28 46 20 36 15
CUDA Cores / SM 64 128 64 128 64 128
CUDA Cores Totales 4352 3584 2944 2560 2304 1920
Tensor Cores /SM 8 - 8 - 8 -
Tensor Cores Totales 544 - 368 - 288 -
RT Cores 68 - 46 - 36 -
ROPs 88 88 64 64 64 64
Texture Units 272 224 184 160 144 120
Transistores 18.600M 12.000M 13.600M 7.200M 10.800M 7.200M
Memoria Cache L2 5.632 KB 2.816 KB 4.096 KB 2.048 KB 4.096 KB 2.048 KB
Tamaño del Die 754 mm2 471 mm2 545 mm2 314 mm2 445 mm2 314 mm2
Proceso de manufactura 12 nm FFN 16 nm 12 nm FFN 16 nm 12 nm FFN 16 nm

 

El Turing TU102 se compone de 6 clúster de procesamiento gráfico (Graphic Processing Clusters, GPC), al igual que el TU104, mientras que el TU106 solo cuenta con 3 GPC. Sin embargo, cada GPC de los chips TU102 y TU106 cuentan con 6 clúster de procesamiento de texturas (Texture Processing Clusters, TPC) cada uno, mientras que el TU104 cuenta con solo 4 TPCs por cada GPC. Es decir, de mayor a menor, cuentan con un total de 36, 24 y 18 TPCs cada uno.

Tras realizar el conteo de TPCs, toca volver a subdividir cada uno de ellos en 2 Streaming Multiprocessors (SM), por lo que cada una de ellas cuenta con 72, 48 y 36 SMs respectivamente.

 2

Ahora es cuando la cosa se pone interesante. Cada SM está compuesto por un núcleo RT, 4 unidades de texturas (TU), 96 KB de memoria cache L1 compartida y 4 bloques de procesamiento. Cada uno de estos bloques, cuenta con 16 núcleos FP32, 16 núcleos INT32 y 2 Tensor Cores, así como un planificador, un despachador y un registro de 256 KB.

Por lo tanto, cada SM cuenta con un total de 64 núcleos FP32, 64 núcleos INT32 y 8 Tensor Cores, así como un núcleo RT y 4 TU.

 

 3
EVGA GeForce RTX 2080 Ti XC Ultra

Como imagino que la mayoría os quedareis igual tras leer todo esto, vamos unos números que todos entendamos y que definen mejor las posibilidades de la nueva generación de gráficas Nvidia Turing.

RTX 2080 Ti GTX 1080 Ti RTX 2080 GTX 1080 RTX 2070 GTX 1070
Arquitectura Turing Pascal Turing Pascal Turing Pascal
CUDA Cores 4.352 3.584 2944 2560 2304 1920
Tensor Cores 544 - 368 - 288 -
Frecuencia Base 1350 MHz 1480 MHz 1515 MHz 1607 MHz 1410 MHz 1506 MHz
Frecuencia Boost 1545 – 1.635 MHz 1582 MHz 1710-1800 MHz 1733 MHz 1620 – 1710 MHz 1683 MHz
Memoria 11 GB GDDR6 11 GB GDDR5X 8 GB GDDR6 8 GB GDDR5X 8 GB GDDR6 8 GB GDDR5
Interfaz de memoria 352 bits 352 bits 256 bits 256 bits 256 bits 256 bits
Frecuencia memoria 14 Gbps 11 Gbps 14 Gbps 10 Gbps 14 Gbps 8 Gbps
Ancho de banda 616 GB/s 484 GB/s 448 GB/s 320 GB/s 448 GB/s 256 GB/s
Relleno de texturas 420,2 – 444,7 GT/s 354,4 GT/s 314.6 – 331.2 GT/s 277.3 GT/s 233.3 – 246.2 GT/s 202 GT/s
TDP 250W – 260W 250W 215W – 225W 180W 175W – 185W 150W
Multi-GPU 2 x NVLink x8

100 GB/s bidireccionales

SLI HB 2-way

O

SLI 2/3/4-way

1 x NVLink x8

50 GB/s bidireccionales

SLI HB 2-way

O

SLI 2/3/4-way

- SLI HB 2-way

O

SLI 2/3/4-way

 

Y para rematar, una foto del núcleo TU102 y las memorias GDDR6 pertenecientes a la EVGA GeForce RTX 2080 Ti XC Ultra que tenemos preparada para analizar.

 4

Artículos relacionados