DeepSeek R1 se actualiza: la IA mejora desde un +8,5% hasta un +100% con su versión 0528 para seguir en la lucha con OpenAI y Google
La inteligencia artificial se ha impuesto como uno de los sectores más importantes en la industria moderna y como tal, muchas empresas han dedicado sus esfuerzos en esto o incluso han cambiado su enfoque y sector para dedicarse a la IA. No es de extrañar que veamos grandes inversiones realizadas para poder mejorar los modelos de IA actuales o desarrollar nuevos. DeepSeek no es una excepción, pues a pesar de que con R1 demostraron que podían tener resultados similares o mejores que la competencia, la empresa china no se rinde ante las americanas y han lanzado una actualización para R1 que le permite lograr resultados más precisos y menos alucinaciones.
A día de hoy tenemos múltiples empresas que compiten entre ellas por ver que IA es la mejor de todas. Aquí tenemos desde startups a compañías de renombre conocidas en todo el mundo como Google. Precisamente Google no tuvo el mejor de los inicios con Bard, pero con Gemini si empezó a hacer las cosas bien. De hecho, Gemini 2.5 Pro ha puesto las cosas difíciles a la competencia, aunque como suele pasar, OpenAI la ha superado.
DeepSeek actualiza su IA: R1-0528 mejora en todas las pruebas respecto a la original
Con todas las IA que van saliendo a la luz es difícil ponerse al día, pero si nos centramos en las conocidas y populares, no podemos dejar de lado a DeepSeek. Esta apareció con su modelo R1 a principios de año y demostró que era posible competir contra la mismísima OpenAI utilizando solo una fracción de sus recursos y hardware. Con R1 impactaron al mundo entero y con R2 esperan lograr una IA aún mejor con un coste un 97% inferior a GPT-4o de OpenAI y todo esto entrenándola con chips Huawei Ascend más económicos que las GPU de NVIDIA.
Antes de que llegue R2 tenemos una actualización de R1 bajo el nombre de DeepSeek-R1-0528 la cual logra mejores resultados. Podemos ver en la gráfica la diferencia entre R1 base y la nueva versión del 28 de mayo. Empezando con AIME 2024, tenemos un 91,4% de éxito para la nueva versión y un 79,8% para R1 estándar. En AIME 2025 seguimos el mismo camino, pero con mayor mejora, pues pasamos de un 70 a un 87,5%.
Las mejoras van de un 13% a hasta más de un 100%, pero sigue por detrás de OpenAI-o3
La siguiente prueba en la lista es GPQA Diamond, donde R1-0528 logra un 81% mientras que R1 consiguió un 71,5% originalmente. En LiveCodeBench pasamos de un 63,5 a un 73,3% y en Aider de un 57 a un 71,6%. Por último, en Humanity's Last Exam alcanza un 17,7%. Las mejoras de precisión son notables, pues tenemos como mínimo, una mejora de un 13% en AIME 2024 y como máximo un increíble aumento del doble de éxito en los resultados de Humanity's Last Exam.
Aun teniendo esto en cuenta, DeepSeek R1 sigue por detrás de OpenAI-o3 en todas las pruebas y respecto a Google Gemini 2.5 Pro vemos que la supera en 3 benchmarks: AIME 2024, AIME 2025 y LiveCodeBench. Aun así, se trata de una mejora increíble y también viene acompañado de una reducción de las alucinaciones, por lo que la IA china dará menos respuestas falsas.