Así será la nueva memoria GDDR7 para las gráficas AMD, Intel y NVIDIA
La GDDR6 y GDDR6X han sido unos buenos intentos para acabar con el problema del ancho de banda en las tarjetas gráficas actuales. Como bien sabemos, en este sector hay dos cuellos de botella muy claros: los nodos litográficos que limitan la cantidad de unidades a incluir en los mismos, y el ancho de banda de la VRAM. El primero lo vamos solventando cada poco tiempo, el segundo cuesta bastante más para dar un salto cualitativo. Por ello, y tras el anuncio de Samsung del año pasado, ahora tenemos más datos relevantes de la nueva memoria GDDR7.
Realmente los cambios entre la GDDR5 y GDDR5X conforme a la GDDR6 y GDDR6X no han sido demasiado abultados, pero los resultados han sido realmente buenos. El problema es que todas van a llegar a su fin, si no lo están en estos momentos como EOL en los principales fabricantes, porque la nueva VRAM está tan cerca que quizás no seamos conscientes de lo que nos viene.
GDDR7, novedades y primeros detalles de los cambios para esta nueva VRAM
Los cambios más grandes y significativos, que influyen en varios aspectos clave de esta nueva memoria GDDR7 es sin duda el hecho de dar un paso atrás con PAM4, muy cara de implementar, de mantener estable y también de conseguir unos consumos bajos, por una más tradicional codificación de modulación de amplitud de pulso PAM3.
Eso sí, mantendremos NRZ con GDDR7. Los motivos son variados, pero lo que se busca es no recurrir a PAM4 por las limitaciones que esta supone, como la codificación de cuatro niveles, las PHY mucho más caras, los controladores de memoria mucho más complejos (y claro, caros) y por supuesto, la obligatoriedad de usar tecnologías muy avanzadas como la corrección de errores FEC.
Esto era necesario si lo que se buscaba era aumentar el ancho de banda que la memoria podía producir en base a un bus de datos "X" con una velocidad de VRAM "Y", pero con GDDR7 han conseguido lo mejor de ambos mundos.
En primer lugar, se usará una modulación de tres niveles (-1, 0, +1) que con los dos ciclos por segundo se convertirán en 3 bits por cada uno de ellos (realmente es 1,5 bits por ciclo, por dos ciclos que pueden emitirse).
La tendencia de los buses de VRAM va a menos
Lo hemos visto con AMD y con NVIDIA y en concreto en varios artículos como en el de la RTX 4070 Ti (en aquel momento RTX 4080 12 GB). El tan criticado bus de esta gráfica no es más que el producto de usar una memoria VRAM más rápida, igual que ha hecho AMD con la Infinity Cache. PAM3 tiene una ventaja frente a PAM4, y es una relación de señal y ruido más baja, menos exigente, pero al mismo tiempo permite una tasa de transmisión de datos más alta que NRZ.
Si se consigue aumentar la frecuencia final y efectiva de la memoria, lo que tenemos será un voltaje muy similar a la GDDR6X con un ancho de banda mayor que esta gracias a la GDDR7. Teniendo en cuenta que Samsung afirma haber conseguido velocidades de 36 Gbps... La mejora será evidente.
¿Por qué se busca esto? Pues porque un mayor ancho de banda de por sí con GDDR7 va a implicar menores buses de memoria para conseguir los resultados balanceados que requieren las nuevas GPU y sus arquitecturas. Por ello, la tendencia va a ser a la baja mientras la velocidad de las VRAM siga subiendo. De hecho, podríamos encontrarnos con gráficas TOP con buses de 256 bits o 192 bits sin ningún problema, consiguiendo superar los 1000 GB/s entre interfaces.
Esto ahorrará espacio en el die y además supondrá menor coste energético, por lo tanto, tendremos GPU más potentes al permitir mayor número de unidades y poder conseguir unas frecuencias más altas, o bien, conseguir mayor eficiencia, dependiendo de cómo estile NVIDIA, AMD e Intel cada arquitectura y GPU.
GDDR7 admite cuatro nuevos modos de Clock Read
Solo se habilitarán cuando sea necesario, pero en cualquier caso serán estos:
- Siempre en funcionamiento: Este modo mantiene el RCK siempre activo y solo se detiene durante los modos de suspensión.
- Deshabilitar: el RCK deja de funcionar.
- Start with RCK Start command: el host puede iniciar el RCK emitiendo el comando RCK Start antes de leer los datos y dejar de usar el comando RCK Stop cuando sea necesario.
- Start with Read: RCK comienza a ejecutarse automáticamente cuando la DRAM recibe cualquier comando que involucre la lectura de datos. Se puede detener usando el comando RCK Stop.
Además, a diferencia de GDDR6 y según ha especificado Cadence, en GDDR7 habrá comandos para filas y columnas con diferentes bits en el bus CA, a diferencia de GDDR6 que solo podía emitir un comando a la vez. Esto unido a que con PAM3 se pueden codificar y transferir 256 bits de datos en 8 ciclos WCK hace que lo comentado arriba tenga todo el sentido del mundo.
En definitiva, el futuro de las tarjetas gráficas va más vinculado a la VRAM de lo que podríamos pensar. RDNA 3 y Ada Lovelace son solo la muestra de que los buses irán a menos, obteniendo los mismos o mejores resultados en ancho de banda y latencia, dejando más margen a los diseños más potentes en GPU y siendo más eficientes por mm2.