Google Cortou o Gemini da Meta: Nem US$ 135 Bilhões Compram IA Suficiente

A Meta Gasta US$ 135 Bilhões em IA — e Ainda Assim Precisa Pedir Computação Emprestada

Quando a empresa que comprou 1,3 milhão de GPUs Nvidia precisa comprar capacidade de IA da concorrência, algo de muito errado está acontecendo no mercado.

O Financial Times revelou hoje que o Google cortou o acesso da Meta ao Gemini. Não por motivos políticos, não por violação de termos de uso, não por espionagem corporativa. O motivo é quase cômico: o Google simplesmente não tem computação suficiente para atender a demanda da Meta — nem a dos outros clientes.

E se nem a Meta, com seus US$ 135 bilhões em investimentos de infraestrutura só em 2026, consegue computação suficiente… o que sobra pra você?

O Que Aconteceu Exatamente

Por volta de março de 2026, o Google avisou a Meta que não conseguiria entregar toda a capacidade de Gemini que a empresa tinha solicitado. Sem negociação. Sem alternativa. “Não temos o suficiente.”

O resultado? Projetos internos de IA da Meta foram atrasados. A empresa começou a pedir para os funcionários economizarem tokens de IA — basicamente racionamento de inteligência artificial dentro de uma das maiores empresas de tecnologia do planeta.

Pensa na ironia: a Meta, que investiu mais em infraestrutura de IA do que o PIB de 140 países, precisou mandar e-mail interno pedindo pra galera “usar menos IA”. Como se fosse energia elétrica em horário de pico.

Por Que a Meta Compra Gemini do Google?

Essa é a pergunta que todo mundo faz. A Meta tem o LLaMA, tem data centers próprios, tem 1,3 milhão de GPUs. Por que precisa do Gemini?

A resposta é mais pragmática do que parece:

Recurso	Infra Própria (Meta)	Google Cloud (Gemini)
Modelos	LLaMA (treinamento interno)	Gemini (acesso via API)
Tempo de deploy	Semanas a meses	Minutos
Escala	Limitada pela construção de data centers	Elástica (em teoria)
Custo fixo	Altíssimo (capex)	Variável (opex)
Flexibilidade	Baixa — hardware comprado é hardware fixo	Alta — sobe e desce conforme demanda

A Meta usa seus próprios data centers para treinar o LLaMA e rodar inferência nos produtos principais (feed do Instagram, recomendações do Facebook, WhatsApp). Mas para experimentação rápida, prototipagem, e certos workloads internos que não justificam alocar hardware próprio, ela compra computação do Google Cloud.

É o mesmo motivo pelo qual a Netflix roda na AWS em vez de ter data centers próprios pra tudo. Às vezes, alugar é mais rápido e mais barato do que construir.

US$ 725 Bilhões: O Capex Que Não Basta

Segundo analistas citados pela Tom’s Hardware, os quatro gigantes — Google, Microsoft, Meta e Amazon — vão gastar US$ 725 bilhões em capex só em 2026. Isso é 77% mais do que gastaram no ano anterior.

Só a Meta vai queimar entre US$ 115 e US$ 135 bilhões. O Google Cloud, mesmo com US$ 20 bilhões de receita num único trimestre, admitiu que limitações de capacidade impediram um crescimento ainda maior. O backlog de pedidos quase dobrou de um trimestre pra outro.

Investimento em IA (2026, estimativa):
├── Meta:      US$ 115-135 bi
├── Microsoft: US$ 150-170 bi
├── Google:    US$ 130-150 bi
├── Amazon:    US$ 120-140 bi
└── Total:     ~US$ 725 bi

Mesmo com três quartos de trilhão de dólares jogados em GPUs, data centers e energia, a demanda por IA cresce mais rápido do que a infraestrutura consegue acompanhar.

Sundar Pichai, CEO do Google, foi claro no último earnings call: as limitações de computação impediram resultados melhores. Traduzindo do corporativês: “a gente deixou dinheiro na mesa porque não tinha GPU suficiente.”

O Muro da GPU: Depois da Energia, o Silício

Lembra quando o gargalo era energia? Data centers não conseguiam abrir porque não tinham eletricidade suficiente. Pois é — resolveram parte disso (com gás natural, nuclear, e até contratos com a SpaceX pra montar data centers em locais remotos). Mas agora o problema mudou.

O novo gargalo é o silício.

A cadeia de produção de GPUs depende de:

TSMC (fabricação dos chips) — operando a capacidade máxima
SK Hynix e Samsung (memória HBM) — demanda 3x maior que a oferta
Nvidia (design e software CUDA) — monopolista de fato

E cada link dessa cadeia tem seus próprios limites. A TSMC não consegue construir fábricas rápido o suficiente. A SK Hynix tem waitlist de 18 meses para chips HBM4. A Nvidia vende tudo que fabrica antes mesmo de sair da linha de produção.

O resultado é um efeito cascata: quem tem GPUs, acumula. Quem não tem, espera. E quem precisa de mais, como a Meta, descobre que até a concorrência (Google) está racionando.

O Google Está Vendendo Capacidade que Ele Mesmo Precisa?

Aqui mora o conflito de interesses mais interessante dessa história.

O Google vende Gemini via Cloud para empresas como a Meta. Mas o Google também usa o Gemini internamente — no Search, no YouTube, no Android, no Workspace, no Maps. Cada nova feature de IA do Google consome a mesma capacidade que ele aluga para clientes externos.

Quando a demanda interna cresce mais rápido que a capacidade total, algo tem que ceder. E quem cede são os clientes. A reportagem do FT não diz isso explicitamente, mas a lógica é clara: o Google está priorizando seus próprios produtos sobre clientes como a Meta.

Isso cria um problema de confiança enorme para o Google Cloud. Se você é uma startup ou uma empresa midsize e sabe que o Google pode cortar sua capacidade quando precisar priorizar o Search ou o YouTube… por que construir em cima do Google Cloud?

A AWS e a Azure provavelmente estão adorando essa notícia.

O Que a Meta Pode Fazer?

A Meta não é exatamente uma empresa que aceita depender dos outros. Mark Zuckerberg aprendeu essa lição da pior forma com a Apple — quando o iOS 14.5 destruiu o modelo de anúncios do Facebook com o App Tracking Transparency, a Meta perdeu US$ 10 bilhões em receita num único ano.

Desde então, a estratégia é vertical: controlar tudo, da GPU ao modelo.

E é exatamente isso que está acontecendo:

1. Compra massiva de GPUs
A Meta assinou um acordo com a Nvidia para comprar milhões de chips adicionais, incluindo os novos Grace CPUs — os primeiros a serem deployados standalone em data centers.

2. Chip próprio (MTIA)
O Meta Training and Inference Accelerator já está na segunda geração. Não substitui a Nvidia ainda, mas reduz a dependência para workloads específicos.

3. Financiamento criativo
A Meta levantou US$ 27 bilhões com a Blue Owl Capital especificamente para construir data centers. Essa é a maior operação de financiamento de infraestrutura de IA da história.

4. Otimização de modelos
O LLaMA 4 é significativamente mais eficiente que versões anteriores. Modelos menores como o LLaMA 4 Scout rodam em hardware mais modesto, reduzindo a necessidade de GPUs top de linha.

E Se Você Não É a Meta?

Essa é a parte que realmente importa.

Se a Meta — com US$ 135 bilhões de orçamento, 1,3 milhão de GPUs e acordos bilionários com a Nvidia — não consegue computação suficiente, imagine uma startup com US$ 5 milhões de funding tentando treinar um modelo.

A realidade para empresas menores:

Waitlists de meses para instâncias GPU em qualquer cloud provider
Preços inflacionados — o custo por hora de GPU H100 subiu 40% desde 2025
Contratos mínimos — provedores estão exigindo compromissos de 1-3 anos para garantir capacidade
Alternativas limitadas — AMD ROCm melhorou, mas o ecossistema CUDA da Nvidia ainda domina 85% do mercado

Algumas empresas estão tomando caminhos alternativos:

# Opções para startups em 2026:
# 1. Modelos menores (3B-8B params) que rodam em hardware consumer
# 2. Quantização agressiva (INT4/INT8) para reduzir uso de GPU
# 3. Provedores menores (Lambda, CoreWeave, Together AI)
# 4. Inferência na edge (smartphones, laptops com NPU)
# 5. Fine-tuning em vez de training from scratch

A era de “basta colocar na cloud e escalar” acabou. A cloud não é infinita. Essa ilusão morreu quando o Google disse “não” para a Meta.

A Verdade Sobre a Escassez

O mais irônico de tudo é que os próprios provedores de cloud criaram esse problema. Google, Microsoft e Amazon gastaram anos vendendo a narrativa de que a cloud é elástica, infinita, que você pode escalar pra cima sem limites. “Pay as you go”, lembra?

Agora essa promessa está quebrando.

A demanda por IA cresceu exponencialmente, mas data centers levam 2-3 anos para construir. GPUs levam 12-18 meses para fabricar. Memória HBM tem lead time de quase 2 anos. Nenhuma dessas curvas acompanha o crescimento da demanda, que dobra a cada 6 meses.

O resultado é um mercado onde:

Grandes empresas acumulam hardware como se fosse petróleo
Cloud providers racionam capacidade como se fosse água em seca
Startups ficam espremidas, pagando mais por menos
Desenvolvedores são forçados a otimizar cada token, cada byte, cada ciclo de GPU

O Mercado Já Reagiu

Os investidores entenderam o recado. O Nasdaq caiu 2,21% numa única sessão quando ficou claro que as big techs não conseguem entregar toda a IA que prometeram. O mercado de previsões colapsou as chances de lançamento do GPT-5.6 em junho — de 83% para 18%. Todos os modelos frontier que deveriam sair em junho (GPT-5.6, Gemini 3.5 Pro, Grok 5) escorregaram para julho.

Não é coincidência. Se até o Google está racionando computação, lançar modelos cada vez maiores fica cada vez mais caro e mais lento.

A corrida da IA está batendo no limite da física. Não da inteligência — do hardware.

Quem Ganha Com Isso?

Se você quer saber quem vai surfar essa onda, olhe para quem resolve o gargalo:

Nvidia — continua sendo a empresa mais importante do mundo enquanto a demanda por GPUs superar a oferta
TSMC — fábrica de chips com fila de espera de anos. Cada wafer vale ouro
Empresas de energia — data centers precisam de gigawatts. Quem fornece energia nuclear e gás natural está nadando em contratos
Provedores de infraestrutura menores — CoreWeave, Lambda, Together AI capturam clientes que as big clouds não conseguem atender
Desenvolvedores de modelos eficientes — quem faz mais com menos GPU (quantização, distilação, modelos pequenos) tem vantagem competitiva real

E quem perde? Quem apostou que a cloud é infinita e agora precisa repensar toda a arquitetura.

O Recado do Google Para o Mundo

Quando o Google diz “não” para a Meta, o recado não é só para Zuckerberg. É para todo o mercado: a infraestrutura de IA tem um teto, e nós já batemos nele.

US$ 725 bilhões em capex não resolveram o problema. 1,3 milhão de GPUs não resolveram o problema. A demanda por IA está crescendo mais rápido do que qualquer empresa, qualquer governo, qualquer cadeia de suprimentos consegue acompanhar.

A próxima fase da corrida da IA não vai ser sobre quem tem o melhor modelo. Vai ser sobre quem tem o melhor hardware. E nesse jogo, até a Meta está perdendo.

Fonte de inspiração: Google limits Meta’s use of its Gemini AI models, FT reports — CNBC

Shopping cart

Recent Posts

Google Cortou o Gemini da

23 Exploits em Um Repositório:

IBM Criou um Chip de

23 Exploits em Um Repositório: A Conta Anônima que Despejou 0-Days no GitHub

Lucas Dalcolmo

Leave a Reply Cancelar resposta

Google Cortou o Gemini da

23 Exploits em Um Repositório:

Popular Tags