Un error en algunas CPU Xeon Sapphire Rapids obliga a Intel a parar su producción
Al igual que los programas, los chips también tienen bugs, pequeños errores de diseño que se suelen comprobar durante el periodo de preproducción, pero a veces ocurre que alguno llega a la versión final de los mismos. Cómo fue el caso que os contamos hace unas semanas del EPYC Rome de AMD. Pues bien, Intel se ha encontrado con un bug en Sapphire Rapids que le ha obligado a parar temporalmente la producción del procesador. ¿Cuáles son las causas y qué modelos se han visto afectados por esto?
Intel ha confirmado que ha paralizado algunos modelos de su última generación de CPU Intel Xeon con arquitectura Sapphire Rapids, el cual afecta a una configuración y a una serie de modelos y no a toda la amplia gama de productos. En concreto, el bug ha sido encontrado por la propia compañía y convierte a Sapphire Rapids en uno de los diseños que más problemas le ha dado a la empresa dirigida hoy por Pat Gelsinger. Recordemos que sufrió un retraso importante en su lanzamiento y que ha tenido ni más ni menos que 12 revisiones distintas antes de su versión final.
Un bug obliga a Intel a parar la producción de sus Intel Xeon Sapphire Rapids
En palabras de la propia Intel, los motivos son los siguientes:
Hemos descubierto un problema en un subconjunto de los procesadores Intel Xeon Medium Core Count de cuarta generación (SPR-MCC) que puede interrumpir al sistema bajo ciertas condiciones y que estamos investigando activamente. No hemos observado dicho problema cuando se ejecuta software comercialmente disponible y otros procesadores de los Intel Xeon de cuarta generación (XCC) y HBM no han mostrado el mismo problema. Debido a ello, y como medida de prevención, hemos decidido parar algunos envíos de los SPR MCC hasta que no tengamos la confianza de tener una mitigación por firmware, pero, esperamos reanudar nuestra producción pronto.
Por lo que este bug en Sapphire Rapids solo afecta a las versiones más modestas de la CPU, las que usan un empaquetado mucho más sencillo debido a su menor número de núcleos. Si bien no se trata del producto estrella, sí que son por precio las versiones más demandadas en el mercado. En todo caso, por el momento no sabemos cuál es el origen del error. Por otro lado, no se trata de un problema de diseño, ya que desde el momento en que el problema se puede reparar con una simple actualización de firmware no supone volver a la mesa de diseño.
Sapphire Rapids, un dolor de cabeza para Intel
Tal y como os hemos comentado antes, los bugs en Sapphire Rapids se han convertido en todo su desarrollo en un cúmulo de problemas para Intel. Y es que el chip tuvo que volver hasta 12 veces a la mesa de diseño por diferentes errores, lo que retrasó hasta en más de un año entero la salida de estas CPU para servidor al mercado. Si bien, Intel afirma que lo van a solucionar con una actualización de firmware, la cual debían lanzar para todos los Xeon SPR-MCC que hay en el mercado tarde o temprano. Desconocemos por el momento si se tratará de un futuro step del procesador.
En todo caso, estas mejoras sobre las CPU que ya se encuentran en el mercado son completamente normales y se suelen hacer para corregir pequeños fallos. Ya para terminar, el hecho de que Intel haya afirmado que no es un problema relacionado con las aplicaciones comerciales puede indicar un conflicto con alguna función en el núcleo del sistema operativo. En todo caso, no se trata de un problema por el que llevarse las manos a la cabeza, desde el momento en que como se ha visto en otros casos, son problemas que ocurren de forma más común de lo que se cree. Lo bueno es que Intel lo ha detectado a tiempo.