Los problemas de rendimiento en los Ryzen 9000 son por su «mal» diseño de hardware y software: hasta el doble de latencia al saltar de CCD
La bomba estalló hace unas horas y conforme corre el tiempo vamos desvelando más y más detalles de lo que está pasando con AMD. Las reviews de los Ryzen 9 9950X y Ryzen 9 9900X han dejado datos muy reveladores, que sumados a los problemas con los drivers y Windows dejan un panorama como para asustarse. Y es que al parecer, la arquitectura Zen 5 destinada para los Ryzen 9000 presenta errores de hardware y software bastante incomprensibles, ¿o está hecho así a posta?
Salvo que AMD se proclame no lo sabremos nunca. Los detalles de latencias internas entre CCD dejan un panorama que se completa con la última información filtrada por el leaker más famoso del planeta, donde veremos qué está pasando en el seno de la compañía.
Los problemas de los Ryzen 9000 son claramente de latencia, ¿errores de hardware o diseño premeditado?
Sabiendo de ante mano que los Ryzen 9000 comparten IMC con los Ryzen 7000 era bastante claro que el rendimiento en la latencia de la memoria a misma RAM debería ser prácticamente idéntico. Lo que encontramos es un leve empeoramiento que achacamos a los cambios en Front-End y Back-End, que son muchísimos, los mayores desde que se lanzó la arquitectura Zen como tal.
Como ya dijimos también, pareciese que AMD está enfocando todo a los servidores, a crear una arquitectura que potencie el rendimiento en AVX512 y premie el escalado de Cores totales.
Pues bien, esto no solamente es así, sino que además podemos constatar que todo lo dicho en cuanto a cambios tiene un impacto directo en el rendimiento al saltar de CCD a CCD.
Sea por los drivers del chipset o porque la arquitectura perjudica dicho salto de la información y datos entre dies, lo que han mostrado ya varios compañeros es alarmante como poco. Para ser concretos, el salto de latencia entre Core y Core es 2,5 veces mayor en los Ryzen 9000 frente a los Ryzen 7000 cuando se cambia de CCD.
¿Error en hardware o software? ¿Ambos?
Primero supongamos que es un error, porque podría no serlo y simplemente es una consecuencia de algo tan simple como el Doble Decoder y una L1I más rápida. Hay que tener en cuenta que Zen 5 usa muchos "elementos" de Zen 4 más allá del IOD, como el mismo tamaño de CCX físicamente hablando, o la misma L3 en tamaño.
¿Podría ser que la L1I y su mejor latencia y ancho de banda estén perjudicando a la latencia entre CCD? ¿Quizás el hecho de que el Doble Decoder no esté funcionando en el microcódigo? No está nada claro y hacen falta más pruebas, pero las pocas que tenemos indican algo bastante curioso: el problema se repite tanto en Windows como en Linux.
Esto descartaría en gran parte errores de software en los Ryzen 9000 y lo enfoca todo a "errores" de hardware, siempre entre comillas, porque el diseño podría ser simplemente así. Lo que sí que sabemos es que los datos aportados muestran valores superiores a 100 ns, lo que equivale a latencias de servidores con dos procesadores, siendo este el tiempo medio que se tarda en enviar los datos de una CPU a otra, es decir, es una latencia demasiado alta, criminal para el rendimiento realmente.
El equipo de Zen 2 se encargó de Zen 5 y luego...
Más detalles sobre lo que parece un popurrí de equipos pasando por la arquitectura. Según MLID, tras preguntar a trabajadores cualificados de AMD estos han comentado que el microcódigo de Zen 5 no está listo, que los procesadores se han adelantado por motivos desconocidos y que se hubiese necesitado bastante más tiempo.
Que solo haya un decoder habilitado en él ya nos dejó contrariados, que muchos analistas hayan presentado inestabilidades, fallos o incluso CPU muertas indica que las placas base están teniendo problemas con estos procesadores y no con los Ryzen 7000.
Parece, a tenor de la información vertida, que el problema llega de base. Como sabemos, Zen 2 tuvo un problema similar al descrito hoy aquí, y ahora sabemos que fue curiosamente el equipo de Zen 2 el que se encargó de esta arquitectura Zen 5. Además, usaron el código original de Zen 2 para trabajar en esta nueva arquitectura y no usaron ninguna parte de Zen 4, ya que según dicen "estaban más familiarizados con el primero que con el último".
Retrasos, software sin terminar, microcódigo incompleto y más
Además, tras el desarrollo primigenio, la arquitectura pasó de un equipo a otro, se crearon retrasos y se repitieron ciertas partes de los procesos. Por último, como había retrasos, el software no se terminó a tiempo (microcódigo) y Microsoft al parecer tampoco lo tuvo para optimizar Windows para estas CPU. Además, los drivers parecen no ir del todo finos.
Por eso hace más de un año se dijo en una filtración que la arquitectura se estaba haciendo desde cero, porque la base no era Zen 4, era Zen 2, y parece que arrastra problemas similares. Por último, hay que tener en cuenta que los CCD trabajan de forma asíncrona con IF, ya que pueden mover 16B/Ciclo en escritura, pero 32B/Ciclo en lectura y 32B/Ciclo Bidireccional con el IMC.
Contado todo lo que se sabe hasta ahora, ¿la solución es factible por software? No hay respuesta. Parece que el rendimiento sí que podría aumentar algo, pero esos supuestos errores de hardware en los Ryzen 9000, o de diseño como tal, no van a ser subsanados de ninguna manera mediante software.
Dicho de otro modo, el problema de la latencia entre CCD podría paliarse, pero no desaparecerá. Lo que sí que podría darse es un leve aumento de FPS en juegos, que las CPU no mueran, y terminar con los problemas de estabilidad y de memorias, que ya es bastante, pero la arquitectura en sí, salvo nueva información que aporte luz sobre otros problemas anexos, es la que es y no mejorará donde flaquea.