GitHub Copilot Cobra por Token a Partir de Hoje — E Devs Estão Pagando 50x Mais

Aquela conta fixa de $10 por mês no GitHub Copilot? Acabou. A partir de hoje, 1 de junho de 2026, a Microsoft trocou a previsibilidade por um medidor de tokens que gira a cada chat, a cada sessão de agente, a cada code review. E os primeiros relatos são assustadores: devs que pagavam $50 agora projetam contas de $3.000.

O Que Mudou (e Por Quê a Microsoft Fez Isso)

O GitHub Copilot sempre funcionou como Netflix: você pagava um valor fixo por mês e usava à vontade. O plano Pro custava $10, o Pro+ $39, e as organizações pagavam $19 ou $39 por desenvolvedor. Dentro desse valor, cada plano incluía uma cota de “premium requests” — chamadas a modelos mais pesados como Claude Sonnet ou GPT-5.5. Estourou a cota? O Copilot caía automaticamente para um modelo mais barato, tipo o GPT-4.1 mini, e a vida seguia.

Esse modelo morreu hoje.

A partir de agora, o sistema funciona com GitHub AI Credits. Cada plano ainda custa o mesmo valor nominal — $10, $19, $39 — mas esse dinheiro vira crédito. Quando você usa o chat, o agente, o CLI, ou qualquer feature que envolva um LLM, tokens são consumidos e convertidos em créditos na proporção de 1 crédito = $0.01 USD.

A justificativa da Microsoft é razoável no papel: “uma pergunta rápida no chat e uma sessão autônoma de código de várias horas custam o mesmo valor ao usuário” no modelo antigo. Com o agentic coding — onde o Copilot navega entre arquivos, roda terminal, cria branches — as sessões se tornaram ordens de magnitude mais caras. A Microsoft alega que o modelo antigo era insustentável, com custos operacionais quase dobrando semana a semana desde janeiro de 2026.

Faz sentido? Do ponto de vista da Microsoft, sim. Do ponto de vista de quem usava o produto todos os dias sem se preocupar com a conta? É um choque.

A Tabela de Preços que Ninguém Queria Ver

Aqui está o que cada modelo custa por milhão de tokens no novo sistema:

Modelo	Input (1M tokens)	Cached	Output (1M tokens)
GPT-5 mini	$0.25	$0.025	$2.00
GPT-5.4 nano	$0.20	$0.02	$1.25
GPT-5.4 mini	$0.75	$0.075	$4.50
GPT-4.1	$2.00	$0.50	$8.00
GPT-5.2 / Codex	$1.75	$0.175	$14.00
GPT-5.4	$2.50	$0.25	$15.00
GPT-5.5	$5.00	$0.50	$30.00
Claude Haiku 4.5	$1.00	$0.10	$5.00
Claude Sonnet 4/4.5/4.6	$3.00	$0.30	$15.00
Claude Opus 4.5-4.8	$5.00	$0.50	$25.00
Gemini 3 Flash	$0.50	$0.05	$3.00
Gemini 2.5 Pro	$1.25	$0.125	$10.00
Gemini 3.1 Pro	$2.00	$0.20	$12.00
Gemini 3.5 Flash	$1.50	$0.15	$9.00

A pegada é simples: quem usa modelos baratos como GPT-5 mini ou o Raptor mini ($0.25 input / $2.00 output), gasta quase nada. Quem usa Claude Sonnet no modo agente — que era exatamente o que a Microsoft incentivava — queima créditos na velocidade de um jato.

Uma sessão agentic com um modelo frontier que consome 30.000 tokens? São 30 a 40 créditos. Isso é $0.30 a $0.40 por sessão. Parece pouco? Faça 50 sessões por dia, 5 dias por semana, e são $400 a $800 por mês. E 50 sessões para quem usa o agente ativamente não é exagero nenhum.

O Fallback Silencioso que Morreu

Esse é o detalhe que mais dói e que muita gente ainda não percebeu.

No modelo antigo, quando você estourava suas premium requests, o Copilot silenciosamente trocava para um modelo mais barato. Você continuava trabalhando, talvez com respostas um pouco piores, mas sem interrupção e sem custo extra.

Essa rede de segurança não existe mais.

Agora, quando seus créditos acabam, acabou. Sem fallback, sem modelo alternativo. Ou você compra mais créditos, ou espera o próximo ciclo de faturamento. Para um desenvolvedor que está no meio de um debug às 3 da manhã, isso é o equivalente a ter a luz cortada.

Os Números do Desespero

A thread de discussão no GitHub Community (#192948) virou um campo de batalha. Última contagem: 904 downvotes contra 22 upvotes e mais de 435 comentários. É a reação mais lopsided que a comunidade do GitHub já teve a um anúncio oficial.

Alguns relatos que circulam nas redes:

Um dev individual projetou que sua conta iria de $29/mês para $750/mês mantendo o mesmo padrão de uso
Uma empresa calculou aumento de $50 para $3.000/mês por desenvolvedor
Freelancers que usavam o modo agente pesado estimam que o crédito de $39 do Pro+ dura menos de uma semana

A defesa que aparece nos fóruns? “Se você está gastando tanto assim, está usando errado.” Eu já vi esse argumento antes — geralmente vem de quem nunca precisou debugar um monorepo de 2 milhões de linhas com urgência às 22h de uma sexta.

Quem Está Protegido (Por Enquanto)

Nem tudo é caos. Alguns pontos importantes:

Code completions continuam ilimitados. Aquele autocomplete inline que aparece enquanto você digita? Zero créditos. O Next Edit Suggestions também. Isso é crítico porque é a feature mais usada do Copilot e a razão pela qual a maioria assina.

Assinantes anuais mantêm o modelo antigo até o fim do contrato. Se você pagou anual, as premium requests continuam até a renovação. Depois disso, migra para créditos.

Bônus promocional de junho a agosto. Para suavizar a transição, a Microsoft está dando créditos extras temporários: $30/mês para Business (ao invés de $19) e $70/mês para Enterprise (ao invés de $39). É um band-aid, mas ajuda nos primeiros três meses.

Budget controls no nível enterprise. Admins podem definir limites de gasto por usuário, cost center ou organização. Isso evita sustos na fatura, mas também significa que um dev pode ter o Copilot cortado no meio do mês se o admin for conservador com os limites.

Por Que Isso Era Inevitável

Vou ser honesto: qualquer pessoa que acompanha o mercado de IA sabia que isso ia acontecer. O modelo flat-rate para ferramentas que consomem LLMs caros nunca foi sustentável a longo prazo. A Anthropic cobra por token. A OpenAI cobra por token. O Google cobra por token. A ideia de que a Microsoft ia absorver esses custos indefinidamente era otimismo demais.

O que pegou mal foi a execução. A Microsoft passou dois anos incentivando o uso pesado do Copilot, adicionando features agentic cada vez mais poderosas, fazendo marketing agressivo de “deixe a IA fazer o trabalho por você” — e agora manda a conta. Como alguém colocou no Reddit: “O único culpado aqui é a Microsoft. Eles forneceram esse modelo de cobrança e fizeram cada vez mais fácil queimar quantidades massivas de tokens.”

É o clássico playbook de plataforma: subsidie até dominar, depois monetize. Só que dessa vez foi rápido demais — menos de dois anos entre “ilimitado” e “pague por token”.

As Alternativas Já Estão de Olho

Com a mudança, os concorrentes estão se posicionando:

Cursor ($20/mês com tier gratuito) continua sendo a escolha mais popular para quem quer edição multi-arquivo com Claude Sonnet ou GPT-4. O Composer já faz o que o modo agente do Copilot faz, e o preço ainda é flat.

Claude Code (incluído no Claude Pro por $20/mês) é a melhor opção para quem prefere CLI. Roda direto no terminal, sem editor, e a Anthropic não cobra por token para assinantes Pro — pelo menos por enquanto.

Cody da Sourcegraph ($9 a $19/mês) brilha em codebases gigantes. Se o seu problema é entender código legado de 500k linhas, é a melhor opção.

Cline (gratuito, open source) é uma extensão Apache-2.0 para VS Code que transforma o editor num agente autônomo. Suporta mais de 30 provedores de LLM, e você paga direto ao provedor que escolher — sem intermediário.

A ironia é que a mudança pode empurrar devs justamente para os modelos da Anthropic e Google via acesso direto, ao invés de consumir pela Microsoft como intermediária. Se você vai pagar por token de qualquer jeito, por que não ir direto na fonte?

O Impacto no Ecossistema

Essa mudança tem implicações que vão além da conta mensal individual.

Startups e empresas pequenas vão sentir mais. Uma equipe de 10 devs que pagava $190/mês ($19 × 10 no Business) agora precisa monitorar quanto cada pessoa usa. O orçamento previsível virou variável, e isso complica planejamento financeiro.

O “vibe coding” vai ficar caro. Aquela prática de jogar um prompt vago pro Copilot e deixar ele iterar até acertar? Cada iteração consome tokens. Quem usa o Copilot como um pair programmer paciente que aceita 47 tentativas vai levar um susto na fatura.

Devs juniores são os mais afetados. Quem está aprendendo usa mais o chat, faz mais perguntas, precisa de mais iterações. São justamente as pessoas que mais se beneficiam da ferramenta — e que agora vão pensar duas vezes antes de perguntar algo ao Copilot.

Enterprises vão migrar para self-hosted. Grandes empresas já estavam testando deployments locais de modelos open source (Qwen, DeepSeek, Llama). Essa mudança de preço é o empurrão que faltava para justificar o investimento em infraestrutura própria.

O Que Fazer Agora

Se você é assinante do Copilot, aqui vai um plano prático:


# 1. Verifique seu uso atual (se tiver acesso ao billing)
# GitHub Settings → Billing → Copilot Usage

# 2. Use modelos baratos para tarefas simples
# No chat do Copilot, selecione GPT-5 mini ao invés de GPT-5.5
# para perguntas rápidas e refatorações simples

# 3. Reserve modelos caros para trabalho complexo
# Claude Sonnet/Opus e GPT-5.5 só quando realmente precisar
# de raciocínio profundo ou geração de código complexo

# 4. Considere o plano anual SE ainda estiver disponível
# Assinantes anuais mantêm premium requests até renovação

Outra dica: code completions continuam gratuitos. Se você usa o Copilot principalmente para autocomplete inline (que é o uso #1 da ferramenta), sua experiência não muda. O impacto é no chat, no agente e no code review.

Para quem usa pesado, vale a conta: pegue seu histórico de premium requests do último mês, multiplique pelos custos por token do modelo que você mais usa, e veja se fica abaixo do seu crédito mensal. Se estourar, é hora de avaliar alternativas.

A Pergunta de $3.000

Será que essa mudança vai matar o Copilot? Não. A base de usuários é grande demais, a integração com VS Code é profunda demais, e para o uso casual (completions + chat leve) a experiência não muda.

Mas vai redistribuir o mercado. Os power users — justamente os evangelistas que fizeram o Copilot crescer — são os mais penalizados. E power users ressentidos têm o costume de arrastar times inteiros para a concorrência.

A Microsoft apostou que a maioria dos usuários não vai notar a diferença. Para 80% deles, provavelmente está certa. Mas os 20% que notarem são os que escrevem blog posts, gravam vídeos, falam em conferências e influenciam decisões de compra em empresas de 10.000 devs.

Se eu fosse a Anthropic ou o time do Cursor, estaria preparando uma campanha de marketing para esta semana. O timing não poderia ser melhor.

Como Monitorar Seus Gastos

A Microsoft criou um painel de billing dentro do GitHub Settings, mas vale montar seu próprio controle. Um script simples que roda no cron do seu CI pode alertar quando os créditos de um time estão acabando:


# Exemplo: verificar créditos restantes via GitHub API
# (endpoint disponível para admins de organização)
gh api /orgs/{org}/copilot/billing -q '.ai_credits_remaining'

# Configurar alerta no Slack quando créditos caírem abaixo de 20%
CREDITS=$(gh api /orgs/{org}/copilot/billing -q '.ai_credits_remaining')
TOTAL=$(gh api /orgs/{org}/copilot/billing -q '.ai_credits_total')
PERCENT=$((CREDITS * 100 / TOTAL))

if [ "$PERCENT" -lt 20 ]; then
  curl -X POST "$SLACK_WEBHOOK" \
    -d "{\"text\":\"⚠️ Copilot credits at ${PERCENT}% — ${CREDITS} remaining\"}"
fi

Para uso individual, a extensão GitHub Copilot Usage Tracker (já disponível no VS Code Marketplace) mostra um badge na status bar com seus créditos restantes em tempo real. Recomendo instalar antes de levar o primeiro susto.

Outra abordagem que tenho visto equipes adotando: criar presets de modelo por tipo de tarefa. Chat rápido? GPT-5 mini. Refatoração complexa? Claude Sonnet. Debugging profundo? Aí sim, GPT-5.5 ou Opus. A diferença de custo entre usar GPT-5 mini ($0.25/$2.00 por 1M tokens) e GPT-5.5 ($5.00/$30.00) é de 20x no input e 15x no output. Escolher o modelo certo para cada tarefa não é otimização prematura — é sobrevivência financeira.

A real é que o mercado de ferramentas de IA para devs está entrando na fase de monetização agressiva. O Copilot foi o primeiro a quebrar o pacto do flat-rate, mas não vai ser o último. Quem depende de uma única ferramenta está se colocando numa posição vulnerável. Diversificar seu toolkit — ter o Copilot para completions, o Cursor ou Claude Code para agente, e um modelo local para tarefas sensíveis — pode ser a estratégia mais inteligente daqui pra frente.

Shopping cart

Recent Posts

transcribe.cpp: O llama.cpp da Voz

Monitores LG Instalam Software Escondido

Stack Overflow Caiu 78%: a