Arquitectura Nvidia Maxwell GM107 al descubierto

Desde Videocardz nos hacemos eco de la nueva arquitectura GPU de Nvidia, hablamos de Maxwell, la cual, por ahora, no ofrece todo el rendimiento esperando, ya que han comenzado por la gama baja fabricada a un proceso de fabricación de 28 nm, y no del esperado proceso a 20 nm, el cual será exclusivo de la gama alta.

Las primeras GPUs Maxwell @ 28 nm que podemos encontrarnos son la GM107, la cual llega en una variante de 640 CUDA Cores (Nvidia GeForce GTX 750 Ti) y otra de 512 CUDA Cores (Nvidia GeForce GTX 750). Dicha GPU arroja un TDP de 60W, por lo que resulta ver extraño a ambas gráficas con un conector PCI-Express de 6 pines (75W) cuando no es necesario. El motivo de la adición de este conector sería ofrecer una mayor estabilidad a la tarjeta o permitir el incremento de overclocking.

Para que tengamos un ejemplo claro de consumo energético en Maxwell, la GPU GM107 llega para reemplazar a la GPU Fermi GK107. Una GeForce GTX 750 Ti ofrece el mismo rendimiento que una Nvidia GeForce GTX 480, con la salvedad de que consume 4 veces menos energía.

La segunda GPU Maxwell @ 28 nm es la GM108, la cual se encuentra enfocada para el sector móvil y dará vida a la Nvidia GeForce GT 840M. Por otro lado, las GPU Maxwell @ 20 nm son la GM206, GM204 y GM200.

nvidia gpu roadmap marzo 2013 maxwell volta

Maxwell introdujo una nueva arquitectura, no es exactamente revolucionaria, pero al fin y al cabo nueva. Los multiprocesadores Stream han recibido los mayores cambios visto desde Fermi y Kepler. Se esperaba que la arquitectura Maxwell introdujera más núcleos CUDA por cada multiprocesador, pero al final no ha sido así. De hecho, cada SMM se divide en cuatro bloques de unidades operaciones, cada uno de esos bloques integra 32 núcleos CUDA, por lo que un SMM completo tiene 4 x 32 = 128 CUDAs.

Ahora vemos por primera vez el diagrama de una GPU Maxwell, concretamente del silicio GM107, el cual integra un Graphics Processing Cluster, 5 SMM que arrojan un total de 640 CUDA Cores. Cada SMM tiene 8 TMUs, que es un total de 40, además de tener 16 ROPs y dos controladores de memoria (ambas de 64 bits).

Diagrama GPU Nvidia Maxwell

Pero... ¿Que hay de nuevo en Maxwell?

Vale, el SM ha sido rediseñado, pero, exactamente, ¿en qué ha mejorado Maxwell?

  • Una mayor caché L2.
    Esta es la principal diferencia entre Kepler y Maxwell. Una pequeña caché L2 limitará las consultas a la GPU. La GPU GM107 tiene 2MB de caché, frente a los 256 KB de la GPU GK107.
  • Equilibrio en la carga de trabajo y la programación basada en un compilador ha sido mejorada.
  • El número de instrucciones por ciclo de reloj ha sido aumentado.
  • El SM ha sido rediseñado en cuatro bloques de procesamiento (ya explicado arriba).
  • Maxwell introduce la codificación y decodificación H.264 más rápida vista (NVENC), algo usado en, por ejemplo, ShadowPlay.
  • Nuevo estado de energía GC5 (estado bajo suspensión).

Por último, el tamaño del die de la GPU GM107 es de 148mm2, por lo que la densidad de núcleos CUDA por mm2 crece un 30 por ciento, frente a un 15 por ciento de la densidad de los transistores.

Artículos relacionados