Por muito tempo, a divisão era clara: modelos proprietários como GPT e Claude entregavam o melhor desempenho, enquanto os open source ficavam um ou dois passos atrás. Em abril de 2026, o DeepSeek V4 tornou essa linha difícil de enxergar.
O que é o DeepSeek V4
Lançado em 24 de abril de 2026 pela empresa chinesa DeepSeek, o V4 chegou em duas versões: o V4-Pro, com 1,6 trilhão de parâmetros totais e 49 bilhões ativos por inferência, e o V4-Flash, com 284 bilhões totais e 13 bilhões ativos. Ambos usam arquitetura Mixture of Experts, licença MIT e suportam contexto de 1 milhão de tokens.
Licença MIT significa: pode ser usado comercialmente, modificado, redistribuído. Sem royalties. Sem restrições de uso por tamanho de empresa. Essa combinação — capacidade de fronteira com licença totalmente aberta — é o que torna o V4 diferente de qualquer lançamento anterior.
Arquitetura: Inovações Técnicas Reais
O DeepSeek V4 não é apenas um modelo maior. A equipe introduziu três inovações arquiteturais significativas:
A primeira é o mecanismo de atenção híbrida, combinando Compressed Sparse Attention (CSA) e Heavily Compressed Attention (HCA). O resultado prático: no contexto de 1 milhão de tokens, o V4-Pro requer apenas 27% dos FLOPs de inferência de token único e 10% do KV cache em comparação com o DeepSeek V3. Isso é relevante para quem opera infraestrutura — custo e memória caem de forma expressiva.
A segunda é o Manifold-Constrained Hyper-Connections (mHC), que substitui as conexões residuais convencionais. O objetivo é melhorar a propagação de sinal entre camadas sem sacrificar a expressividade do modelo — uma das tensões clássicas em arquiteturas profundas.
A terceira é o uso do otimizador Muon no treinamento, que proporciona convergência mais rápida e maior estabilidade. O modelo foi pré-treinado em mais de 32 trilhões de tokens.
Benchmarks: Números que Importam
O V4-Pro-Max marca 80,6% no SWE-Bench Verified — o benchmark de engenharia de software que testa a capacidade do modelo de resolver issues reais do GitHub. Para referência, o Claude Opus 4.6 marca 80,8% no mesmo benchmark. A diferença é estatisticamente irrelevante.
No LiveCodeBench, específico para programação competitiva, o V4-Pro-Max chega a 93,5 — liderando todos os modelos abertos disponíveis. Em GPQA Diamond, benchmark de raciocínio científico avançado, o modelo alcança 90,1%.
Em capacidades agênticas — execução de tarefas de múltiplos passos, uso de ferramentas, workflows de código — o V4 lidera o open source e empata na prática com os principais modelos fechados.
O Que Muda para Quem Constrói Sistemas
A combinação de benchmarks no nível fechado, licença MIT, contexto de 1 milhão de tokens e custo de US$ 0,30 por milhão de tokens de entrada via API muda o cálculo para desenvolvedores e empresas.
Até o V4, escolher um modelo open source de alto desempenho implicava em tradeoffs reais de qualidade. Agora, para a maioria dos casos de uso — coding, análise, agentes — o tradeoff desapareceu. A decisão entre fechado e aberto vira uma questão de governança e compliance, não de capacidade técnica.
Para operações de datacenter, isso tem implicações diretas. Rodar o V4-Flash (284B, 13B ativos) em infraestrutura própria é hoje uma opção viável para workloads de alto volume onde o custo por token importa. O V4-Pro exige mais hardware — mas a escolha existe.
O Contexto Geopolítico
É impossível discutir o DeepSeek sem mencionar o contexto. A empresa opera sob restrições de exportação americanas que limitam o acesso a chips de última geração. O fato de que o V4 alcança paridade com modelos treinados com orçamentos de hardware muito superiores é, por si só, um dado técnico relevante.
A eficiência de treinamento e inferência do V4 não é acidental — é consequência direta de operar com restrições que forçam inovação arquitetural. O HCA e o mHC são respostas engenhosas a limitações de compute, não features de marketing.
Open Source Atingiu a Fronteira
O DeepSeek V4 não é o único responsável por essa mudança — Llama 4, Qwen 3.5 e Gemma 4 também contribuem para o ecossistema. Mas é o modelo que mais diretamente eliminou a distinção de qualidade entre aberto e fechado nos benchmarks que importam para produção.
Em 2024, a pergunta era: "quando o open source vai chegar ao nível dos modelos proprietários?" Em 2026, com o V4, a pergunta mudou: "por que pagar pelo fechado quando o aberto já chegou lá?"
A resposta pode existir — suporte empresarial, SLAs, integrações nativas, casos específicos de uso. Mas a resposta não é mais qualidade técnica. E isso muda o mercado.