AMD llevará ROCm a todas sus GPU y APU Radeon, pero antes deberá reducir el tamaño del driver para Linux al incluir 6 millones de líneas de código

Los compañeros de TechPowerUp lograron entrevistar a nada menos que Andrej Zdravkovic, uno de los principales ejecutivos de AMD en todo lo que tiene que ver con drivers, programas y estrategias, ya que es Vicepresidente Senior y Director de Software. En dicha entrevista dejó algunas perlas interesantes que vienen a propósito de un problema que presenta su compañía en Linux, ya que AMD quiere mover ROCm a todas sus GPU y APU Radeon, desde un nuevo centro en Serbia, pero además lidiará con más de 6 millones de líneas de código en sus drivers para el SO del pingüino, una tarea titánica.

AMD tiene grandes planes para la empresa, ROCm y los drivers de Linux. Como lleva tiempo recalcando la propia Lisa Su, están haciendo grandes esfuerzos en temas de software, principalmente para reducir la brecha con NVIDIA y para evitar que Intel se escape con oneAPI, que llegando más tarde está creciendo a un ritmo increíble. Por ello, van a llegar cambios e inversiones interesantes que conviene saber y recapitular.

AMD abrirá un centro de software en Serbia y dará prioridad a ROCm para las GPU Radeon

Andrej-Zdravkovic

¿Por qué Serbia y no la UE u otro país, por ejemplo? Zdravkovic alega disponibilidad de talento e ingenieros de software, contactos con universidades, y aunque no lo ha dicho, seguramente unos sueldos más bajos y unos costos en general inferiores.

Hay que tener en cuenta que el sueldo medio en Serbia es casi tres veces inferior a la UE, menos de la mitad de lo que tenemos en España, así que si tienen buenos ingenieros, motivados y capaces, con unos sueldos que pueden ser inferiores y el gobierno les da facilidades, poco más que comentar al respecto de esto.

Lo que sí dijo el Vicepresidente y Director de Software de AMD es el enfoque que tiene la empresa con todo lo que tiene que ver con ROCm:

Principalmente se trata de software para el equipo que tenemos ahora mismo. Gran parte del equipo está trabajando en la virtualización de nuestro procesador gráfico para los centros de datos. Tenemos un equipo que trabaja en compiladores. Tenemos un equipo que trabaja en protección y seguridad de contenido, que se ampliará a otros aspectos de seguridad.

AMD-centro-de-datos-e-I+D-en-Serbia

Y tenemos un equipo que trabaja en tecnologías de IA para centros de datos desarrollando nuestro subsistema ROCm para ellos. El nuevo equipo, que acabamos de formar, está trabajando en ROCm para Radeon. Estamos ampliando nuestro subsistema ROCm a los productos gráficos Radeon, para que todos puedan usar IA en las APU de AMD y las GPU Radeon. Yendo más allá, no estamos limitando al equipo de Serbia a estas tecnologías.

Será un centro de diseño completo, tendremos diseño RTL, verificación de hardware y muchas otras tecnologías de hardware y software como opción. Realmente dependerá del talento disponible y de la capacidad de vincularse con universidades [locales]. Creando talento virtualmente.

Con esto claro, AMD tiene mucho trabajo que hacer, porque los problemas en Linux llevan tiempo, y ahora mismo necesitan atajarlos de una manera casi radical.

AMD debe reducir el tamaño del driver para GPU lo antes posible

Linux ROCm 6.13

Según sabemos, y es algo que ya lleva tiempo encima de la mesa, AMD debe atajar el tamaño del driver de sus GPU para Linux. Y es que actualmente dicho driver tiene casi 6 millones de líneas de código, aunque algunos dicen que la cifra está algo por encima de ese número realmente. Lo que sí que sabemos es que actualmente la mayoría de esas líneas de código no son usadas porque pertenecen a encabezados de cada GPU que es compatible con dicho driver.

Con esto en mente, la primera idea funcional sería coger esas líneas de código y moverlas a un repositorio dedicado que sea independiente al completo del driver. No se perdería nada, todo seguiría funcionando tras las optimizaciones y el peso se reduciría bastante, donde además, el trabajo de AMD se simplificaría también.

Es posible que desde este nuevo complejo en Serbia se termine dando solución a este problema, ya que si AMD quiere dar soporte de ROCm a toda GPU y APU Radeon, tienen que mejorar detalles como estos antes, sobre todo de cara a implementar mejoras para la IA, principal objetivo de los de Lisa Su de cara a 2025 sin duda.