NVIDIA meterá 75 billones de transistores en el chip de la RTX 4090 Ti
En abril de este año un famoso leaker lanzó una encuesta para cualquier usuario donde preguntaba que cuántos billones de transistores tendría el nuevo chip de NVIDIA al completo. Con cuatro opciones para elegir, los usuarios dieron el mayor porcentaje a la respuesta de "entre 70 y 80 billones" por un 39,3% de los votos totales. Hoy, el mismo leaker, más de 5 meses después, pone luz a la cifra más cercana que se ha dado hasta la fecha. Y pensarás ¿ello que implica? Pues cambios bastante importantes sin lugar a dudas, ya que la RTX 4090 Ti será la GPU de PC con mayor número de transistores de la historia.
Hay que tener en cuenta que del nodo de Samsung al exclusivo nodo que ha diseñado TSMC para NVIDIA hay un salto muy grande en densidad. No podemos cuantificar cuánta diferencia es exactamente en millones de transistores por milímetro cuadrado porque ni los verdes ni los taiwaneses han publicado la cifra exacta, pero sí que sabemos que es algo mejor que el N5 para AMD. Por ello, el cálculo simple de mejora en billones de transistores es tan importante.
El chip AD102 al completo de la RTX 4090 Ti tendrá más de 75 BILLONES de transistores
Remember this. 😁Most people made the right choice. More than 75B.
— kopite7kimi (@kopite7kimi) September 13, 2022
Seguramente más cercanos a los 80 billones que a los 75 billones que marcaba el rumor de principios de año. Teniendo en cuenta de que hablamos sobre un chip destinado a escritorio y no a centros de datos o servidores de IA y DL, la diferencia contra uno que sí que será implementado en estos escenarios es realmente baja.
En concreto, la GPU comparativa a mismo nodo litográfico es la Hopper H100 y obtiene 80 billones redondos según la propia NVIDIA. Así que, en el peor de los casos, el AD102 Full tendrá solo 5 billones de transistores menos.
Comparativamente hablando, la GPU GH100 (H100 es su nombre comercial) es una bestia de 814 mm2 de área total con un TDP de 700W y 50 MB de L2, pero hay un pequeño inconveniente: tampoco es el chip al completo. Aquí solo hay rumores, pero estaríamos hablando de 60 MB de L2 y 144 SM por los 132 de GH100, pero ¿por qué es esto tan importante y qué tiene que ver con el AD102 y sus transistores?
Un cambio en la jerarquía de cachés y área
Pues muy sencillo, GH100 va implementado con memoria HBM3 y por lo tanto el requerimiento de cachés y su tamaño cambia. AD102 no llevará este tipo de memoria y lo fía todo a GDDR6X con mucho menor tamaño total: 24 GB vs 80 GB, así que al parecer y según los diagramas que hemos podido ver en estos meses, Ada Lovelace tendrá mucha más memoria L2.
Se habla de 50 MB de GH100 vs 96 MB de AD102, lo que implica que el área tiene que ser reestructurada para ello cogiendo gran parte de esos billones de transistores para este tipo de caché. Por si fuese poco, el aumento de los RT Cores en proporción por SM y posiblemente también el de los Tensor Cores hace correctas las ínfulas del AD102 sean más que correctas en referencia a los billones de transistores comentados.
No sabemos todos los cambios en la arquitectura, pero sin duda será un monstruo en tamaño y área total, lo que ayudará a disipar su alto consumo, del cual solo hay rumores (entre 800 y 600 vatios, seguramente más próximos al segundo valor). Por lo tanto y resumiendo, dar el salto de los 8 nm de Samsung al 4N de TSMC ha supuesto una mejora en recuento de transistores de 1,65x veces, es decir, un 165% más, pero también influirá en una mayor área total que debería estar cercana a los 800 mm2 (+-27% frente al GA102 actual).
Por pura lógica, la GPU que debería llevar este inmenso chip sería la RTX 4090 Ti, la cual será la GPU con mayor número de transistores, si es que finalmente llega al mercado, porque NVIDIA no ha lanzado todavía el GH100 completo para servidores, quizás estén esperando un mayor volumen de producción y seguramente una menor tasa de errores, porque si algo está claro, es que un chip con más de 800 mm2 no es nada, pero que nada barato.