DeepSeek V3.1 es la nueva versión del modelo de IA chino DeepSeek, lanzado por la startup del mismo nombre. Este modelo híbrido combina la respuesta rápida de DeepSeek V3 con el razonamiento de DeepSeek R1. Según los benchmarks publicados, DeepSeek V3.1 muestra mejoras en áreas como la programación y las pruebas matemáticas respecto a sus predecesores.
Sin embargo, usuarios han reportado un desempeño pobre en seguir instrucciones y en su soporte multimodal. La startup ha diseñado este modelo para funcionar óptimamente con chips de IA chinos de próxima generación, utilizando precisión FP8. Esta estrategia podría alinearse con las prioridades del gobierno chino de utilizar modelos locales para chips locales.
DeepSeek R1, que causó impacto a principios de año, ya no aparece en la sección de 'pensamiento profundo' de la empresa, generando dudas sobre su sucesor, DeepSeek R2. La empresa ha perdido relevancia, con su cuota de mercado en modelos de IA Open Source en la plataforma PPIO cayendo del 99% en el primer trimestre al 80% en el segundo trimestre.
La competencia feroz proviene de modelos como Qwen de Alibaba y Kimi-K2-Instruct de MoonShot AI. El retraso en DeepSeek R2 se debe a problemas al entrenar el modelo con chips de Huawei, por lo que ahora usan chips de NVIDIA.
Crítica:
El artículo cumple parcialmente con las expectativas, ofreciendo una explicación razonable pero no extremadamente detallada sobre la desaparición temporal de DeepSeek. La calidad informativa es buena aunque con algunos toques sensacionalistas al hablar de 'desaparición'. Faltan fechas exactas de los lanzamientos de DeepSeek R1 y DeepSeek V3.1.
Comentarios