AMD confirma las RX 8000 para 2025: mejor rendimiento en Ray Tracing y mejores capacidades de IA, ¿FSR 4 con Neural Supersampling y Denoising?
Como hemos visto hace un rato, AMD tiene luces y sombras en sus resultados financieros para el Q3 de 2024. Desde el punto de vista de la IA, la compañía va viento en popa, lejos de NVIDIA sí, pero está sacando la cabeza del agua en ingresos interanuales, pero en gaming... Cae un 69% y eso es preocupante. Por ello, Lisa Su le ha querido quitar hierro a este asunto confirmando algo que ya hemos tratado: las AMD RX 8000 llegarán en 2025 y traerán novedades interesantes, como, ¿FSR 4.0?
Es una transición según dijo Lisa Su, hacia algo nuevo, y como nuevo no nos referimos tanto al apartado del hardware, que también tendrá sus características avanzadas como novedad, sino que parece que esta vez AMD quiere enfocarse más en el apartado de software, así que veamos cómo podrían hacerlo.
AMD, mediante Lisa Su, confirma las RX 8000 para 2025
No dijo demasiado, fue bastante breve, ya que como sabemos AMD es muy cautelosa con lo que dice e intenta controlar por activa y por pasiva lo que se filtra. Por ello, el discurso de Su para apaciguar las aguas dentro del sector gaming es corto, pero directo:
En el área de gráficos para juegos, los ingresos disminuyeron en comparación con el año anterior, ya que nos preparamos para una transición a nuestras GPU Radeon de próxima generación basadas en nuestra arquitectura RDNA 4.
Además de un fuerte aumento en el rendimiento de los juegos, RDNA 4 ofrece un rendimiento de trazado de rayos significativamente mayor y agrega nuevas capacidades de IA. Estamos en camino de lanzar las primeras GPU RDNA 4 a principios de 2025.
Es decir, confirma todo lo que se ha filtrado hasta ahora, lo cual evidentemente no nos sorprende, pero deja en el aire varias cosas. En primer lugar, el mayor rendimiento en Ray Tracing podría darse por nuevas unidades o mejoras en la pipeline, pero, ¿y esas capacidades de IA? Puede que nos sea posible contestar, parcial o totalmente, a eso en estos momentos.
El software va a ser quizás más importante que el hardware para AMD
Puede ser un cambio de paradigma en los rojos, aunque no es una estrategia novedosa como tal, puesto que NVIDIA basa gran parte de su potencial precisamente ahí, en el software, y lo acompaña lógicamente de un hardware a la altura. La declaración de Lisa Su contrasta con lo último que mostró AMD desde GPUOpen, comentando y explicando un nuevo SuperSampling Neuronal y eliminación de ruido para Path Tracing en tiempo real.
Lo que comúnmente conocemos como Supersampling y Denoising, solo que ahora será en tiempo real gracias a redes neuronales.
El problema es que hasta ahora AMD usa los AI Matrix Accelerators dentro de los Vector Unit y gestionado por los Vector GPR (Vector General-Purpose Register), donde cada CU tiene dos, uno por cada grupo de VU y Scheduler. Es por este motivo que estas unidades, que son el equivalente lejano de los Tensor Cores de NVIDIA, no son tan potentes, ya que utilizan parte de la pipeline de los Shaders.
Para simplificar esto, muy rápido, y entender los cambios que vienen, es necesario entender que RDNA 3 está diseñada así para que estas unidades trabajen de manera integrada dentro del CU y aceleren las operaciones matriciales sin tener que usar una unidad de hardware específica separada.
Desde el punto de vista del rendimiento no es lo mejor, pero sí desde la reducción de la complejidad, flexibilidad y eficiencia. Y por este motivo, especulamos con el hecho de que los AI Matrix Accelerators podrían ser una unidad independiente en RDNA 4 como tiene NVIDIA actualmente, lo que se apoya por el comentado Neural SuperSampling y Denoising que vamos a ver.
AMD y el método Monte Carlo para lograr un Neural SuperSampling y Denoising por este tipo de redes de entrenamiento
El artículo de investigación que publica GPUOpen casa a la perfección con todo lo que hemos hablado y lo que ha dicho Lisa Su como "nuevas capacidades de IA". Para ello, la investigación hace una explicación básica de las matemáticas del renderizado y como se hace la integración, en este caso, con la técnica denominada como Monte Carlo, que AMD resume muy bien:
Es una técnica estocástica que se utiliza para estimar las integrales con muestras aleatorias en el dominio. El trazado de trayectorias utiliza la integración de Monte Carlo para estimar la integral en la ecuación de renderizado con muestras aleatorias de rayos proyectados desde el origen de la cámara virtual sobre todas las posibles trayectorias de luz dispersadas desde las superficies.
El trazado de trayectorias es conceptualmente simple, imparcial y ofrece efectos de renderizado complejos basados en la física, como reflejos, refracciones y sombras para una variedad de escenas.
El problema que tiene esta técnica es la aleatoriedad, puesto que produce ruido, mucho, y ahí está el problema a solventar para lograr el SuperSampling: hay que recurrir a un método de Denoising avanzado. ¿Objetivo final? Conseguir un Path Tracing en tiempo real reconstruyendo los píxeles con una mejor calidad, sin ruido, con un rendimiento muy optimizado enfocado a la resolución 4K, todo mediante SuperSampling, obviamente.
¿Cómo lo hacen exactamente? La explicación rápida y simple es con una única red neuronal que combina el upscaling con el denoising, es decir, muy parecido a lo que hace NVIDIA con DLSS y que requiere, lógicamente, Tensor Cores como unidad independiente en un motor aparte en el caso de las RTX.
¿Estamos siendo testigos del nacimiento de FSR 4 con AI Matrix Accelerators dedicados? Llega el Neural SuperSampling and Denoising
Pues es muy posible. Hay que tener en cuenta que FSR 3.0 como tal utiliza el Upscaling spatial y Temporal más Fluid Motion Frames, pero no usa IA como tal por lo explicado arriba del rendimiento dentro de los CU. La novedad aquí, sabiendo esto, es la explicación que ofrece AMD y que es compleja de desgranar en un principio:
Investigamos una técnica de supermuestreo y eliminación de ruido neuronal (NSSD) que genera imágenes de alta calidad sin ruido y superescaladas con una resolución de visualización más alta que la resolución de renderizado para el Path Tracing en tiempo real con una sola red neuronal.
Las entradas incluyen una imagen en color "noisy" renderizada con una muestra por píxel y algunos búferes guía que están disponibles en los motores de renderizado, como albedo, normal, roughness, deepth y distancia de impacto especular a baja resolución.
Los búferes de entrada "noisy" acumulados temporalmente aumentan las muestras efectivas por píxel de las imágenes ruidosas. El historial de output también se reproyecta mediante vectores de movimiento para la acumulación temporal. La red neuronal se entrena con una gran cantidad de imágenes de Path Tracing para predecir múltiples pesos de filtrado y decide cómo acumular, eliminar el ruido y mejorar temporalmente las imágenes de baja resolución extremadamente ruidosas.
Nuestra técnica puede reemplazar múltiples eliminadores de ruido utilizados para diferentes efectos de iluminación en el motor de renderizado eliminando todo el ruido en una sola pasada y a baja resolución. Según los casos de uso, se puede utilizar una salida que solo elimine el ruido, que es idéntica a la ampliación de escala 1x, ya que se omite el filtrado de ampliación de escala.
Resumiendo todo muy y mucho para hacerlo fácil: AMD está hablando de una técnica con redes neuronales mediante IA que mejorará la calidad de las imágenes con SuperSampling y Denoising para lograr Path Tracing en tiempo real. Se coge una imagen de baja calidad y con ruido con una muestra por píxel, se agrega a esta imagen materiales y escena, se acumulan más imágenes con el mismo procedimiento para ajustar los FPS según el movimiento en pantalla (menos potencia en renderizado necesaria) y se usa una red neuronal para reducir el ruido y escalar dicha resolución, todo en tiempo real.
¿Puede competir AMD con las RX 8000 y FSR 4.0 con NVIDIA DLSS 3.0 y las RTX 50 en 2025?
Buena pregunta que seguro te has hecho. La explicación de AMD es compleja y da dos opciones en cuanto al hardware e implementación, porque el rendimiento obtenido saldrá en gran medida de ahí:
- AI Matrix Accelerators dentro del Vector Unit: sería una evolución muy liviana frente a RDNA 3, pero si realmente se usa muy poca potencia de renderizado, simplifica muy y mucho el diseño de la arquitectura y baja los costes.
- AI Matrix Accelerators fuera del Vector Unit y junto a los Ray Accelerators: desde mi punto de vista es la opción más interesante y con mayor sentido, puesto que no solo puedes crear un grupo de trabajo exclusivo entre ambos, o dos independientes como tiene NVIDIA, sino que el rendimiento aumentará tanto para los Shaders como para el uso de este hipotético FSR 4.0.
Opciones contra NVIDIA, muchas realmente. NVIDIA busca el rendimiento con un escalado de calidad y una eliminación de ruido moderada a buena. El enfoque de AMD parece ser centrarse en eliminar el ruido ofreciendo más calidad de imagen, en una sola pasada, aumentando el rendimiento de los Shaders, lo que de nuevo apuntaría a la opción de sacar los AI Accelerators fuera del Vector Unit.
Además, hay otro dato que también nombra la compañía: se omite el filtrado del upscaling, lo que sugiere que la precisión debe ser muy buena, y esto solo se consigue con un rendimiento muy mejorado en los AI Accelerators. Al mismo tiempo, esto también sugiere el punto dos como posible opción dentro de las AMD RX 8000 de cara a 2025. Y hasta aquí todo lo que sabemos sobre las novedades de Lisa Su y AMD, ahora falta saber con qué sorprenderá NVIDIA en algo tan clave para ellos como la IA y los Tensor Cores.