Nvidia Turing TU102, TU104 y TU106, un vistazo a fondo

Una vez vistas las tecnologías que trae consigo Nvidia Turing, toca ver los 3 nuevos núcleos con los que darán vida a la nueva generación de gráficas: Turing TU102, TU104 y TU106.

Nvidia GeForce TU102 717x600 0

 Nvidia GeForce TU106 740x335 1

Un primer vistazo al esquema de los 3 núcleos nos permite ver la proporcionalidad entre ellos, aunque mejor veamos la tabla de especificaciones técnicas con los componentes de cada uno de ellos.

 

RTX 2080 TiGTX 1080 TiRTX 2080GTX 1080RTX 2070GTX 1070
ArquitecturaTuringPascalTuringPascalTuringPascal
NúcleoTU102GP102-350TU104GP104-400TU106GP104-200
GPCs666433
TPCs362824201815
SMs682846203615
CUDA Cores / SM641286412864128
CUDA Cores Totales435235842944256023041920
Tensor Cores /SM888
Tensor Cores Totales544368288
RT Cores684636
ROPs888864646464
Texture Units272224184160144120
Transistores18.600M12.000M13.600M7.200M10.800M7.200M
Memoria Cache L25.632 KB2.816 KB4.096 KB2.048 KB4.096 KB2.048 KB
Tamaño del Die754 mm2471 mm2545 mm2314 mm2445 mm2314 mm2
Proceso de manufactura12 nm FFN16 nm12 nm FFN16 nm12 nm FFN16 nm

 

El Turing TU102 se compone de 6 clúster de procesamiento gráfico (Graphic Processing Clusters, GPC), al igual que el TU104, mientras que el TU106 solo cuenta con 3 GPC. Sin embargo, cada GPC de los chips TU102 y TU106 cuentan con 6 clúster de procesamiento de texturas (Texture Processing Clusters, TPC) cada uno, mientras que el TU104 cuenta con solo 4 TPCs por cada GPC. Es decir, de mayor a menor, cuentan con un total de 36, 24 y 18 TPCs cada uno.

Tras realizar el conteo de TPCs, toca volver a subdividir cada uno de ellos en 2 Streaming Multiprocessors (SM), por lo que cada una de ellas cuenta con 72, 48 y 36 SMs respectivamente.

Nvidia GeForce SM Turing 352x600 2

Ahora es cuando la cosa se pone interesante. Cada SM está compuesto por un núcleo RT, 4 unidades de texturas (TU), 96 KB de memoria cache L1 compartida y 4 bloques de procesamiento. Cada uno de estos bloques, cuenta con 16 núcleos FP32, 16 núcleos INT32 y 2 Tensor Cores, así como un planificador, un despachador y un registro de 256 KB.

Por lo tanto, cada SM cuenta con un total de 64 núcleos FP32, 64 núcleos INT32 y 8 Tensor Cores, así como un núcleo RT y 4 TU.

 

EVGA GeForce RTX 2080 Ti XC Ultra 740x489 3
EVGA GeForce RTX 2080 Ti XC Ultra

Como imagino que la mayoría os quedareis igual tras leer todo esto, vamos unos números que todos entendamos y que definen mejor las posibilidades de la nueva generación de gráficas Nvidia Turing.

RTX 2080 TiGTX 1080 TiRTX 2080GTX 1080RTX 2070GTX 1070
ArquitecturaTuringPascalTuringPascalTuringPascal
CUDA Cores4.3523.5842944256023041920
Tensor Cores544368288
Frecuencia Base1350 MHz1480 MHz1515 MHz1607 MHz1410 MHz1506 MHz
Frecuencia Boost1545 – 1.635 MHz1582 MHz1710-1800 MHz1733 MHz1620 – 1710 MHz1683 MHz
Memoria11 GB GDDR611 GB GDDR5X8 GB GDDR68 GB GDDR5X8 GB GDDR68 GB GDDR5
Interfaz de memoria352 bits352 bits256 bits256 bits256 bits256 bits
Frecuencia memoria14 Gbps11 Gbps14 Gbps10 Gbps14 Gbps8 Gbps
Ancho de banda616 GB/s484 GB/s448 GB/s320 GB/s448 GB/s256 GB/s
Relleno de texturas420,2 – 444,7 GT/s354,4 GT/s314.6 – 331.2 GT/s277.3 GT/s233.3 – 246.2 GT/s202 GT/s
TDP250W – 260W250W215W – 225W180W175W – 185W150W
Multi-GPU2 x NVLink x8

100 GB/s bidireccionales

SLI HB 2-way

O

SLI 2/3/4-way

1 x NVLink x8

50 GB/s bidireccionales

SLI HB 2-way

O

SLI 2/3/4-way

SLI HB 2-way

O

SLI 2/3/4-way

 

Y para rematar, una foto del núcleo TU102 y las memorias GDDR6 pertenecientes a la EVGA GeForce RTX 2080 Ti XC Ultra que tenemos preparada para analizar.

Nvidia GeForce TU102 EVGA 642x600 4

Artículos relacionados