DeepSeek R2 está en fase de desarrollo: se entrenará con chips Ascend de Huawei y tendrá un coste un 97% inferior a GPT-4o

OpenAI se convirtió en la startup de inteligencia artificial más relevante cuando lanzó ChatGPT años atrás, captando la atención de decenas de millones de usuarios. Durante un tiempo permaneció como el único chatbot con tales capacidades y ni siquiera Google pudo estar a la altura. Esto cambió cuando las compañías lanzaron sus propios modelos de IA que podían competir al mismo nivel que GPT-4 en el que se basaba ChatGPT. Sin embargo, la que proporcionó el mayor golpe de OpenAI fue China con DeepSeek R1. Ahora llegan rumores de su sucesor, DeepSeek R2, el cual será aún más eficiente, pues en cuestión de costes dicen que será un 97% más barato que GPT-4o.

En el momento en el que nos encontramos, tenemos un gran número de modelos de inteligencia artificial para escoger. Pudiendo elegir entre algo popular como ChatGPT, Google Gemini, Anthropic Claude, Meta Llama y muchos otros. Depende de lo que busquemos vamos a tener varias opciones a elegir y si optamos por algo que sea como un asistente de inteligencia artificial, incluso Copilot que viene con Windows nos puede servir.

DeepSeek R2 será mucho más barato y utilizará 1.200 millones de parámetros

Ya no estamos en ese inicio de la inteligencia artificial donde teníamos que depender de solo uno o dos modelos de IA que destacaban sobre los demás, pues en la actualidad hay muchas empresas que compiten entre ellas y cada cierto tiempo sale algo mejor. A pesar de toda la competencia, OpenAI sigue manteniéndose entre las mejores, pues en cuanto sale algo que las supere, suelen lanzar ellos también algo. Cuando DeepSeek demostró que podían hacer algo comparable a ellos sin necesidad de usar tantas gráficas NVIDIA y recursos, OpenAI contraatacó con modelos de IA mejores.

En cuanto a reducción de costes no han podido avanzar tanto como esperaba, pero lo cierto es que ahí DeepSeek tiene una gran ventaja, pues en este caso han optimizado el proceso de inferencia y entrenamiento con metodologías propias que han ido revelando con el tiempo. Si ya con DeepSeek R1 destacaron, con R2 lo harán aún mejor y ahora llegan los nuevos detalles sobre esta nueva versión. Empezando por su coste, este será un 97,3% menor a GPT-4o, con solo 0,07 dólares por cada millón de tokens de entrada y 0,27 dólares por millón de tokens de salida. DeepSeek R2 será un modelo de IA aún más grande, llegando a usar 1,2T (1.200 millones) de parámetros. Para que nos hagamos una idea, esto sería casi el doble que tiene actualmente el modelo más grande de DeepSeek R1.

El 82% de los chips que usa DeepSeek para entrenar su nueva IA serán Huawei Ascend

Huawei-Ascend-910C-GPU-de-IA-para-China-en-2025

R2 utilizará nada menos que 5,2 PB (Petabytes: 1.024 TB) de datos y un 89,7% son de C-Eval 2.0. Otra cosa que nos llama la atención es que se han empleado un 82% de chips Huawei Ascend para IA, por lo que DeepSeek está abandonando a NVIDIA en gran parte y quiere depender solo de los chips producidos en China.

Se espera que R2 sea capaz de competir contra Google Gemini 2.0 Pro y OpenAI GPT-4 Turbo, con la gran ventaja de que será mucho más económico en funcionamiento. Sobre esto no lo dudamos, pues con R1 ya anunciaron que tenía una relación coste-beneficio muy positiva para la empresa. Por el momento todo esto son filtraciones y no hay nada confirmado por la compañía, por lo que hay que coger la información con pinzas.