Los Intel Sapphire Rapids estrenarán la función ‘In-Field Scan’ para la comprobación de fallos de hardware

Gracias a unos nuevos controladores de código abierto lanzados por Intel para Linux, se ha dado a conocer la existencia de 'In-Field Scan', una función de hardware desconocida hasta la fecha que permitirá realizar una comprobación de fallos de hardware. En concreto, permite ejecutar pruebas a nivel de circuito en un núcleo de la CPU para detectar problemas de hardware no detectados por las comprobaciones de paridad o ECC.

La intención de Intel In-Field Scan (que utiliza el acrónimo "IFS") tiene enganches de hardware para realizar pruebas por núcleo e informar de cualquier fallo a nivel de silicio que se produzca en dichas pruebas. Intel In-Field Scan está diseñado para que los proveedores de la nube, los fabricantes de equipos originales y otros hiperescaladores lo utilicen para ejecutar pruebas y encontrar cualquier fallo en el campo debido al envejecimiento del silicio u otros problemas de hardware que, de otro modo, no serían detectados por las comprobaciones de hardware existentes, como los errores de memoria ECC u otras excepciones de comprobación de la máquina.

Debido a ello, esta tecnología debutará en la próxima familia de procesadores Intel Sapphire Rapids.

CPUs Intel Sapphire Rapids

Por otro lado, se indica que cuando se ejecuta en procesadores Intel compatibles con un controlador que tiene el controlador Intel IFS y tiene las imágenes IFS de prueba disponibles, las pruebas se pueden cargar a través de /sys/devices/system/cpu/ifs/reload. La activación de las pruebas IFS para que se ejecuten en todos los núcleos de la CPU disponibles puede llevarse a cabo escribiendo en /sys/devices/system/cpu/ifs/run_test. El controlador IFS también permite probar núcleos de CPU específicos individuales a través de sysfs.

Después de llevar a cabo una prueba de escaneo en campo, los resultados se escriben en /sys/devices/system/cpu/ifs/status para informar si todos los núcleos de la CPU pasaron o fallaron. También hay archivos sysfs para informar de los núcleos específicos de la CPU que han pasado/fallado las pruebas o no han sido probados.

vía: Phoronix

Artículos relacionados