Primeros detalles oficiales de Nvidia Pascal
Nvidia ha presentado hoy su libro blanco de la nueva arquitectura Pascal, la cual dará luz a la próxima generación de tarjetas gráficas gaming y profesionales. A continuación, sacaremos algunas conclusiones del extenso documento PDF de 50 páginas que podéis consultar al completo aquí.
Por desgracia solo nos centramos en el silicio GPU GP100, por ahora enfocado al sector profesional, donde podemos ver cómo está compuesta por 60 unidades SM, aunque algunos modelos pueden ver recortado el total de núcleos como es habitual.
Cada unidad SM está compuesta por 64 núcleos CUDA de precisión simple (FP32), algo que contrasta con los 128/192 núcleos de Maxwell/Kepler respectivamente, y que además están divididos en dos bloques, cada uno de ellos de 32 CUDAs, un buffer de instrucciones, un planificador de tareas y dos unidades de ejecución, por lo que se mantiene el resto de características frente a Maxwell.
Por otro lado, cada unidad SM dispone también de 32 núcleos de precisión doble (FP64), por lo que el silicio GP100 dispone de un total de 1920 núcleos CUDA de doble precisión, en un ratio 2:1 frente a los de precisión simple.
Por último, destacar los 4096 KB de cache L2 unificada que permiten una comunicación rápida y eficiente de los datos a través de la GPU. Comparados con os 1536 KB del núcleo GK110 o los 3072 KB del GM200, es un salto bastante importante que reduce el número de accesos a la memoria convencional, algo que se traduce en un menor consumo, una menor necesidad de ancho de banda y que en definitiva mejora el rendimiento. Alguno se preguntará por qué no se introduce entonces una mayor cache, pero la respuesta es fácil: es demasiado complejo y costoso, a la vez que aumenta las temperaturas.