DeepSeek revela Fire-Flyer File System (3FS), su sistema de archivos paralelo optimizado para IA de código abierto

Estados Unidos quería asegurarse la supremacía en el sector de la inteligencia artificial y debido a esto, decidió acabar con su principal rival, China, antes de que fuese demasiado tarde. Para hacerlo, se encargó de prohibir que China pudiera comprar chips avanzados de IA y que tampoco tuviese acceso a maquinaría para crear sus propios chips. Con esto, vimos que el gigante asiático se aislaba a nivel tecnológico y no podía dar la talla. Sin embargo, China logró conseguir comprar hardware para IA a través de otros países y así es como logró avanzar. A día de hoy es un peligro para EE.UU. con empresas como DeepSeek AI, la cual ha revelado su sistema de archivos paralelos optimizados para IA llamado 3FS.

La mayoría de empresas tecnológicas más importantes del mundo se encuentran en Estados Unidos. Allí tenemos a Google, Microsoft, Meta, NVIDIA, AMD, Intel y un montón de empresas más que todos conocemos por sus avances en hardware, software o inteligencia artificial. De hecho, en esta era de la IA, las inversiones multimillonarias las suelen realizar estas grandes compañías, ya que tienen muchos más recursos.

DeepSeek revela su sistema de archivos optimizado para IA denominado 3FS

A pesar de todos los avances realizados en IA y la competencia entre OpenAI, Google, Anthropic y otras empresas, resulta que al final China, la que nadie se esperaba que pudiera competir, acabó siendo el rival que más fuerte golpeó. Esto ocurrió cuando DeepSeek lanzó su modelo de IA R1 que no solo funcionaba al nivel de OpenAI, sino que lo hacía utilizando mucho menos hardware. Esta noticia fue un duro golpe para dicha compañía, aunque la que más sufrió fue NVIDIA, la cual vio unas pérdidas históricas en un solo día.

DeepSeek R1 se puede utilizar de forma local y no solo eso, sino que además es Open Source. Esto último es lo que más nos llama la atención de la compañía china y su visión de tener todo de código abierto, hasta el punto que han empezado a revelar sus secretos de cómo pudieron conseguir R1 con menos hardware, por ejemplo usando FlashMLA. Ahora es el turno de otra revelación más, pues esta vez han hablado de su sistema de archivos paralelo optimizado para IA denominado Fire-Flyer File System (abreviado como 3FS), el cual es Open Source. En el tweet de X tenemos todos los detalles, como el hecho de que este sistema usa todo el ancho de banda de los SSD modernos y redes RDMA para alcanzar un rendimiento de lectura agregado de 6,6 TiB/s (7,25 TB/s) en un clúster de 180 nodos.

Con 3FS consiguen un rendimiento de lectura superior y aprovechan al máximo los SSD

DeepSeek chips IA

DeepSeek asegura que ha estado utilizando 3FS desde el año 2019 en sus servidores y este es un sistema de archivos paralelo basado en Linux y que se centra en operaciones de IA y HPC. Así pues, esto lo hace perfecto en servidores y centros de datos que emplean GPU para entrenar LLMs y para computación. Este sistema se centra en ofrecer la mayor velocidad posible y deja de lado otros aspectos como el almacenamiento en caché de lectura.

Gracias a esto, consiguen 3,66 TiB/minuto en el benchmark GraySort en un clúster de 25 nodos y logran más de 40 GiB/s (43 GB/s) de rendimiento máximo por nodo en búsqueda KVCache. DeepSeek menciona como 3FS fue empleado en sus entrenamientos de IA para conseguir resultados fantásticos en menos tiempo. De hecho, dicen que con su HPC Fire-Flyer 2 consiguieron el 80% del rendimiento de un servidor NVIDIA DGX-A100 por un 50% del precio y con un 60% del consumo.