A Microsoft finalmente cortou o cordão umbilical
Treze bilhões de dólares. Esse foi o cheque que a Microsoft passou para a OpenAI nos últimos anos, numa aposta que parecia genial em 2023. Integrar o GPT no Copilot, no Bing, no Windows, no Office — a Microsoft virou sinônimo de IA sem ter treinado um único modelo. Mas a conta chegou.
Com mais de 30 milhões de usuários no GitHub Copilot, cada sugestão de código gerada pela OpenAI custava tokens. Cada autocomplete, cada explicação de código, cada review de PR — tudo passando pela API da OpenAI, com a Microsoft pagando a conta. Bilhões por ano em custos de inferência que comprimiam as margens de um produto que deveria ser a galinha dos ovos de ouro.
A solução? Construir seus próprios modelos. E foi exatamente isso que a Microsoft acabou de fazer.
MAI-Code-1-Flash: o modelo que substitui a OpenAI no Copilot
No Build 2026, a Microsoft anunciou a família MAI — Microsoft AI — um conjunto de modelos treinados inteiramente in-house, sem depender de nenhum parceiro externo. O primeiro a chegar ao público é o MAI-Code-1-Flash, um modelo de código otimizado especificamente para workflows de desenvolvedor.
Não é um modelo genérico adaptado para código. É um modelo construído do zero para entender repositórios, navegar entre arquivos, interpretar diffs, gerar PRs e resolver issues. A Microsoft treinou o MAI-Code-1-Flash com dados limpos e devidamente licenciados — um detalhe que vale destacar numa era onde quase todo mundo treina com dados raspados sem permissão.
O modelo já está sendo distribuído para usuários do GitHub Copilot no VS Code, tanto no seletor de modelos quanto no modo automático. Se você usa Copilot Free, Pro, Pro+ ou Max, é possível que já esteja usando o MAI-Code-1-Flash sem saber.
Os benchmarks que importam
| Benchmark | MAI-Code-1-Flash | Claude Haiku 4.5 | Diferença | |
|---|---|---|---|---|
| ———– | —————– | ——————- | ———– | |
| SWE-Bench Pro | 51.2% | 35.2% | +16 pontos | |
| IF Bench (instruction following) | — | — | +28.9 pontos | |
| Adversarial reasoning | 85.8% | — | — | |
| Tokens por tarefa (SWE-Bench Verified) | -60% | baseline | 60% menos |
Os números são interessantes por dois motivos. Primeiro, o SWE-Bench Pro mede capacidade real de resolver bugs em repositórios open source — não é um benchmark sintético. Segundo, a redução de 60% no uso de tokens significa que a Microsoft consegue entregar resultados equivalentes ou melhores gastando drasticamente menos em inferência.
Mas repare numa coisa: a Microsoft escolheu comparar o MAI-Code-1-Flash com o Claude Haiku 4.5, não com o Claude Opus, não com o GPT-5.5. Haiku é o modelo mais barato da Anthropic. A comparação é deliberada — a Microsoft está posicionando o MAI-Code-1-Flash como um modelo eficiente, não como o melhor modelo de código do mercado. A real é que eles não precisam ser os melhores. Precisam ser bons o suficiente para parar de pagar a OpenAI.
A pensée adaptativa do MAI-Code-1-Flash
Um recurso que merece atenção é o que a Microsoft chama de adaptive thinking. Em vez de aplicar o mesmo nível de raciocínio para todas as tarefas, o modelo calibra automaticamente quanto esforço dedicar.
Pediu um autocomplete simples? Resposta rápida, poucos tokens. Pediu para debugar um race condition num sistema distribuído? O modelo aloca mais “orçamento de raciocínio”, gastando mais tempo pensando antes de responder.
Isso não é exatamente novo — o Claude Sonnet já fazia algo similar com o extended thinking. Mas a implementação da Microsoft tem um foco prático: otimizar o custo por tarefa no Copilot. Se 80% das interações são autocompletes triviais, não faz sentido queimar tokens com raciocínio profundo em cada uma delas.
// Tarefa simples → resposta rápida
function sum(a, b) {
return a + b; // MAI gera isso com ~20 tokens
}
// Tarefa complexa → raciocínio estendido
// "Refatore este módulo de 500 linhas para usar
// o padrão Observer sem quebrar os 47 testes"
// MAI gasta 2000+ tokens planejando antes de agir
MAI-Thinking-1: o modelo de raciocínio
Junto com o MAI-Code-1-Flash, a Microsoft também apresentou o MAI-Thinking-1 — seu primeiro modelo de raciocínio proprietário. Os specs:
- 35 bilhões de parâmetros ativos (mid-sized)
- 128K de contexto
- Treinado sem destilação (não é uma versão comprimida de um modelo maior)
- Dados de treinamento limpos e com licença comercial
Em testes cegos, avaliadores independentes preferiram o MAI-Thinking-1 ao Claude Sonnet 4.6. No SWE-Bench Pro, o modelo empata com o Claude Opus 4.6 em tarefas de código — o que é notável para um modelo de 35B parâmetros competindo com modelos muito maiores.
O MAI-Thinking-1 está em preview privado no Microsoft Foundry por enquanto. Mas a mensagem é clara: a Microsoft não quer depender de ninguém para raciocínio complexo.
A família completa: não é só código
A família MAI vai além de modelos de código:
| Modelo | Função | Status | |
|---|---|---|---|
| ——– | ——– | ——– | |
| MAI-Code-1-Flash | Código para GitHub Copilot | Disponível | |
| MAI-Thinking-1 | Raciocínio geral | Preview privado | |
| MAI-Transcribe-1 | Speech-to-text para Teams | Integrado | |
| MAI-Voice-1 | Síntese de voz | Integrado | |
| MAI-Image-2 | Geração de imagem | Integrado |
A Microsoft está construindo um stack vertical completo: Azure na infra, MAI nos modelos, GitHub nas ferramentas de dev, Office na produtividade, Windows no OS. É o mesmo playbook do Google com o Gemini — controlar tudo de ponta a ponta.
Por que $13 bilhões não criaram dependência
Eu já vi gente argumentando que o investimento da Microsoft na OpenAI foi um erro. Discordo. O investimento comprou tempo. A Microsoft conseguiu se posicionar como líder em IA corporativa antes de ter modelos próprios. Agora que tem, pode gradualmente substituir os modelos da OpenAI sem que os clientes percebam.
E esse é o detalhe mais revelador: a troca acontece de forma invisível. O GitHub Copilot não mandou um e-mail avisando “ei, trocamos seu modelo”. O roteamento acontece silenciosamente no backend. Se o resultado é bom, ninguém reclama. Se o resultado é melhor E mais barato, a Microsoft lucra duas vezes.
“Microsoft is constructing vertical integration across cloud, developer tools, productivity software, OS-level AI, and foundation models — mirroring Google’s Gemini stack approach.” — FAQ.com
Para a OpenAI, isso é um sinal preocupante. Seu maior cliente e investidor está ativamente construindo substitutos para seus modelos. A exclusividade já caiu. A Amazon já está na jogada. E agora os modelos próprios da Microsoft estão competindo diretamente no produto mais importante: o Copilot.
O que isso significa para quem usa o Copilot
Se você é desenvolvedor usando o GitHub Copilot, a notícia é boa:
1. Preços devem cair (ou pelo menos não subir)
Com modelos internos custando menos para rodar, a Microsoft tem margem para manter ou reduzir preços. Lembra que o Copilot recém mudou para cobrança por token? Com o MAI-Code-1-Flash usando 60% menos tokens por tarefa, cada dólar rende mais.
2. Você ainda pode escolher o modelo
Enterprise customers podem fixar versões específicas via Azure AI Foundry. E o VS Code continua oferecendo o seletor de modelos — você pode usar MAI, GPT, Claude ou o que preferir. A multi-model flexibility está mantida.
3. A qualidade tende a melhorar
Quando a Microsoft controla o modelo e o produto, o feedback loop é mais rápido. Bug no Copilot? O time de modelos recebe o report direto. Feature request? Vai para o roadmap do MAI, não para um parceiro externo.
# No VS Code, o seletor de modelos agora inclui:
# - MAI-Code-1-Flash (padrão)
# - GPT-5.5
# - Claude Sonnet 4.6
# - Claude Opus 4.6
# Acesse: Ctrl+Shift+P → "Copilot: Select Model"
A corrida dos modelos proprietários acelerou
O que a Microsoft está fazendo não é inédito. O Google tem o Gemini, a Apple tem modelos on-device, a Amazon treina o Titan. Mas o timing é significativo. Em menos de 3 anos, passamos de “todo mundo usa GPT via API” para “todo grande player tem seus próprios modelos”.
A implicação para startups de IA é brutal. Se até a Microsoft — que investiu $13 bilhões na OpenAI — decidiu que precisa de modelos próprios, qual o moat de uma empresa que só faz wrapper de API? A resposta, cada vez mais, é: nenhum.
Para a OpenAI especificamente, o cenário complica. Eles acabaram de fazer o IPO. O maior cliente está se desconectando gradualmente. A Anthropic está lucrativa. O DeepSeek e o Qwen oferecem modelos open source competitivos. E agora a Microsoft, que era o canal de distribuição garantido, tem seus próprios modelos no Copilot.
Sam Altman provavelmente sabia que esse dia chegaria. A pergunta é se a OpenAI tem produto próprio forte o suficiente para sobreviver sem o subsídio implícito de distribuição que a Microsoft oferecia.
Os dados de treinamento: uma vantagem silenciosa
Um aspecto que passou despercebido nos anúncios: a Microsoft treinou os modelos MAI com “dados limpos e devidamente licenciados”. Num momento em que New York Times, Getty Images e dezenas de criadores processam empresas de IA por uso indevido de dados, ter modelos treinados com licenciamento limpo é uma vantagem competitiva real.
A Microsoft tem acesso a um volume absurdo de dados proprietários: GitHub (190+ milhões de repositórios), LinkedIn, Bing, Xbox Game Pass, Office 365. Tudo isso com termos de serviço que permitem uso para treinamento. Não é raspagem de web — é dado de primeiro partido.
Para empresas que se preocupam com compliance (bancos, governo, saúde), usar um modelo que garante limpeza nos dados de treinamento pode ser o fator decisivo. E a Microsoft sabe disso.
O elefante na sala: o MAI-Code-1-Flash é bom de verdade?
Benchmarks são uma coisa. Uso real é outra. O MAI-Code-1-Flash bate o Claude Haiku, mas Haiku é o modelo “baratinho” da Anthropic. Como ele se compara com o Claude Sonnet 4.6, que é o que a maioria dos devs usa no Copilot?
A Microsoft não divulgou essa comparação. E a ausência fala mais que qualquer benchmark.
Minha aposta: o MAI-Code-1-Flash é excelente para tarefas simples e medianas (autocomplete, geração de testes, documentação) e provavelmente inferior aos top models para tarefas complexas (refatoração de arquitetura, debugging multi-file, coding agents). A estratégia é clara — usar o modelo interno para 80% do volume barato e reservar os modelos premium (Opus, GPT-5.5) para os 20% de tarefas complexas.
É a mesma lógica que qualquer infra de produção usa: CDN para o conteúdo estático, servidor pesado só quando precisa.
O impacto no mercado de dev tools
Existe um efeito cascata aqui que pouca gente está discutindo. Se a Microsoft consegue rodar o Copilot com modelos internos a custo dramaticamente menor, isso muda a equação competitiva de todas as dev tools de IA.
O Cursor, que acabou de ser avaliado em $60 bilhões, depende de modelos da Anthropic e OpenAI. O Windsurf, o Cody da Sourcegraph, o Codeium — todos dependem de modelos de terceiros. Nenhum deles tem o luxo de treinar modelos próprios. Cada sugestão de código que geram vem com um custo de API embutido.
A Microsoft acabou de eliminar esse custo para si mesma. Isso significa que pode oferecer o Copilot mais barato, ou com mais features no mesmo preço, ou com limites de uso mais generosos. Qualquer uma dessas opções pressiona a concorrência.
# A matemática é cruel para quem depende de API externa:
#
# Cursor (usando Claude Sonnet via API):
# custo_por_sugestao = tokens_input + tokens_output
# margem = preco_assinatura - custo_api_mensal
#
# Copilot (usando MAI-Code-1-Flash):
# custo_por_sugestao = custo_infra_azure # sem middleman
# margem = preco_assinatura - custo_infra
#
# Quando tokens custam 60% menos E não tem markup de API,
# a diferença de margem é brutal.
Para startups de dev tools, a lição é clara: se sua única inovação é colocar uma interface bonita em cima de uma API de LLM, você tem um problema. A Microsoft pode copiar sua interface e rodar com custo zero de modelo.
O paradoxo da OpenAI
Talvez o aspecto mais irônico dessa história seja o papel da OpenAI em tudo isso. A empresa que democratizou o acesso a modelos de linguagem agora vê seu maior investidor e distribuidor construindo alternativas.
A timeline é quase cômica:
- 2023: Microsoft investe $10B na OpenAI, coloca GPT em tudo
- 2024: OpenAI remove exclusividade da Microsoft, abre para AWS e Google Cloud
- 2025: Microsoft começa a treinar modelos próprios silenciosamente
- 2026: Microsoft lança família MAI, substitui OpenAI no Copilot
Cada movimento da OpenAI em direção à independência (abrir para outros clouds, lançar produtos próprios que competem com o Office, considerar hardware) acelerou a decisão da Microsoft de não depender dela. É um ciclo que se auto-reforça.
A OpenAI ainda tem o ChatGPT, que é um produto consumer fortíssimo. Mas no enterprise — onde o dinheiro de verdade está — a Microsoft acaba de mostrar que pode jogar sozinha.
O que observar nos próximos meses
Três coisas vão revelar se a estratégia MAI é real ou se é vapor:
1. Adoção silenciosa no Copilot: Se a Microsoft começar a rotear a maioria das requisições para o MAI-Code-1-Flash sem reclamações de qualidade, é sinal de que o modelo aguenta produção. Fique de olho nos fóruns — se devs começarem a notar queda de qualidade, vamos saber rápido.
2. Pricing do Copilot: Se a Microsoft reduzir preços ou aumentar limites de uso, é porque as margens melhoraram com modelos internos. Se mantiver os preços, está embolsando a diferença.
3. Expansão do MAI-Thinking-1: O modelo de raciocínio está em preview privado. Quando sair para o público e aparecer como opção no Azure AI Foundry, a Microsoft terá um stack completo que compete diretamente com GPT e Claude em todas as categorias.
A corrida de IA não é mais sobre quem tem o melhor modelo. É sobre quem controla a stack inteira — do data center ao autocomplete no VS Code. E hoje, depois de gastar $13 bilhões aprendendo com o melhor, a Microsoft decidiu que prefere ser o melhor ela mesma.
Fonte de inspiração: Introducing MAI-Code-1-Flash — Microsoft AI













