DeepSeek presenta nuevo modelo de IA para competir con rivales como Google y Anthropic
- El modelo V4 promete mayor rendimiento y menor costo
- Inversores apuestan a mayor demanda de chips locales
DeepSeek lanzó versiones preliminares de un nuevo modelo insignia de inteligencia artificial un año después de sacudir Silicon Valley, calificándolo como la plataforma de código abierto más poderosa en un desafío a rivales desde OpenAI hasta Anthropic PBC.
La startup china presentó las series V4 Flash y V4 Pro, destacando un rendimiento de primer nivel en pruebas de programación y grandes avances en tareas de razonamiento y agentes. Incluyen mejoras en la arquitectura y optimización, según indicó la empresa en la plataforma Hugging Face. DeepSeek destacó una técnica denominada Hybrid Attention Architecture, que, según afirmó, mejora la capacidad de una plataforma de IA para recordar consultas a lo largo de conversaciones extensas. También impulsó una ventana de contexto de 1 millón de tokens, un salto que permite enviar bases de código completas o documentos largos como una sola instrucción.