A Meta Gasta US$ 135 Bilhões em IA — e Ainda Assim Precisa Pedir Computação Emprestada
Quando a empresa que comprou 1,3 milhão de GPUs Nvidia precisa comprar capacidade de IA da concorrência, algo de muito errado está acontecendo no mercado.
O Financial Times revelou hoje que o Google cortou o acesso da Meta ao Gemini. Não por motivos políticos, não por violação de termos de uso, não por espionagem corporativa. O motivo é quase cômico: o Google simplesmente não tem computação suficiente para atender a demanda da Meta — nem a dos outros clientes.
E se nem a Meta, com seus US$ 135 bilhões em investimentos de infraestrutura só em 2026, consegue computação suficiente… o que sobra pra você?
O Que Aconteceu Exatamente
Por volta de março de 2026, o Google avisou a Meta que não conseguiria entregar toda a capacidade de Gemini que a empresa tinha solicitado. Sem negociação. Sem alternativa. “Não temos o suficiente.”
O resultado? Projetos internos de IA da Meta foram atrasados. A empresa começou a pedir para os funcionários economizarem tokens de IA — basicamente racionamento de inteligência artificial dentro de uma das maiores empresas de tecnologia do planeta.
Pensa na ironia: a Meta, que investiu mais em infraestrutura de IA do que o PIB de 140 países, precisou mandar e-mail interno pedindo pra galera “usar menos IA”. Como se fosse energia elétrica em horário de pico.
Por Que a Meta Compra Gemini do Google?
Essa é a pergunta que todo mundo faz. A Meta tem o LLaMA, tem data centers próprios, tem 1,3 milhão de GPUs. Por que precisa do Gemini?
A resposta é mais pragmática do que parece:
| Recurso | Infra Própria (Meta) | Google Cloud (Gemini) |
|---|---|---|
| Modelos | LLaMA (treinamento interno) | Gemini (acesso via API) |
| Tempo de deploy | Semanas a meses | Minutos |
| Escala | Limitada pela construção de data centers | Elástica (em teoria) |
| Custo fixo | Altíssimo (capex) | Variável (opex) |
| Flexibilidade | Baixa — hardware comprado é hardware fixo | Alta — sobe e desce conforme demanda |
A Meta usa seus próprios data centers para treinar o LLaMA e rodar inferência nos produtos principais (feed do Instagram, recomendações do Facebook, WhatsApp). Mas para experimentação rápida, prototipagem, e certos workloads internos que não justificam alocar hardware próprio, ela compra computação do Google Cloud.
É o mesmo motivo pelo qual a Netflix roda na AWS em vez de ter data centers próprios pra tudo. Às vezes, alugar é mais rápido e mais barato do que construir.
US$ 725 Bilhões: O Capex Que Não Basta
Segundo analistas citados pela Tom’s Hardware, os quatro gigantes — Google, Microsoft, Meta e Amazon — vão gastar US$ 725 bilhões em capex só em 2026. Isso é 77% mais do que gastaram no ano anterior.
Só a Meta vai queimar entre US$ 115 e US$ 135 bilhões. O Google Cloud, mesmo com US$ 20 bilhões de receita num único trimestre, admitiu que limitações de capacidade impediram um crescimento ainda maior. O backlog de pedidos quase dobrou de um trimestre pra outro.
Investimento em IA (2026, estimativa):
├── Meta: US$ 115-135 bi
├── Microsoft: US$ 150-170 bi
├── Google: US$ 130-150 bi
├── Amazon: US$ 120-140 bi
└── Total: ~US$ 725 bi
Mesmo com três quartos de trilhão de dólares jogados em GPUs, data centers e energia, a demanda por IA cresce mais rápido do que a infraestrutura consegue acompanhar.
Sundar Pichai, CEO do Google, foi claro no último earnings call: as limitações de computação impediram resultados melhores. Traduzindo do corporativês: “a gente deixou dinheiro na mesa porque não tinha GPU suficiente.”
O Muro da GPU: Depois da Energia, o Silício
Lembra quando o gargalo era energia? Data centers não conseguiam abrir porque não tinham eletricidade suficiente. Pois é — resolveram parte disso (com gás natural, nuclear, e até contratos com a SpaceX pra montar data centers em locais remotos). Mas agora o problema mudou.
O novo gargalo é o silício.
A cadeia de produção de GPUs depende de:
- TSMC (fabricação dos chips) — operando a capacidade máxima
- SK Hynix e Samsung (memória HBM) — demanda 3x maior que a oferta
- Nvidia (design e software CUDA) — monopolista de fato
E cada link dessa cadeia tem seus próprios limites. A TSMC não consegue construir fábricas rápido o suficiente. A SK Hynix tem waitlist de 18 meses para chips HBM4. A Nvidia vende tudo que fabrica antes mesmo de sair da linha de produção.
O resultado é um efeito cascata: quem tem GPUs, acumula. Quem não tem, espera. E quem precisa de mais, como a Meta, descobre que até a concorrência (Google) está racionando.
O Google Está Vendendo Capacidade que Ele Mesmo Precisa?
Aqui mora o conflito de interesses mais interessante dessa história.
O Google vende Gemini via Cloud para empresas como a Meta. Mas o Google também usa o Gemini internamente — no Search, no YouTube, no Android, no Workspace, no Maps. Cada nova feature de IA do Google consome a mesma capacidade que ele aluga para clientes externos.
Quando a demanda interna cresce mais rápido que a capacidade total, algo tem que ceder. E quem cede são os clientes. A reportagem do FT não diz isso explicitamente, mas a lógica é clara: o Google está priorizando seus próprios produtos sobre clientes como a Meta.
Isso cria um problema de confiança enorme para o Google Cloud. Se você é uma startup ou uma empresa midsize e sabe que o Google pode cortar sua capacidade quando precisar priorizar o Search ou o YouTube… por que construir em cima do Google Cloud?
A AWS e a Azure provavelmente estão adorando essa notícia.
O Que a Meta Pode Fazer?
A Meta não é exatamente uma empresa que aceita depender dos outros. Mark Zuckerberg aprendeu essa lição da pior forma com a Apple — quando o iOS 14.5 destruiu o modelo de anúncios do Facebook com o App Tracking Transparency, a Meta perdeu US$ 10 bilhões em receita num único ano.
Desde então, a estratégia é vertical: controlar tudo, da GPU ao modelo.
E é exatamente isso que está acontecendo:
1. Compra massiva de GPUs
A Meta assinou um acordo com a Nvidia para comprar milhões de chips adicionais, incluindo os novos Grace CPUs — os primeiros a serem deployados standalone em data centers.
2. Chip próprio (MTIA)
O Meta Training and Inference Accelerator já está na segunda geração. Não substitui a Nvidia ainda, mas reduz a dependência para workloads específicos.
3. Financiamento criativo
A Meta levantou US$ 27 bilhões com a Blue Owl Capital especificamente para construir data centers. Essa é a maior operação de financiamento de infraestrutura de IA da história.
4. Otimização de modelos
O LLaMA 4 é significativamente mais eficiente que versões anteriores. Modelos menores como o LLaMA 4 Scout rodam em hardware mais modesto, reduzindo a necessidade de GPUs top de linha.
E Se Você Não É a Meta?
Essa é a parte que realmente importa.
Se a Meta — com US$ 135 bilhões de orçamento, 1,3 milhão de GPUs e acordos bilionários com a Nvidia — não consegue computação suficiente, imagine uma startup com US$ 5 milhões de funding tentando treinar um modelo.
A realidade para empresas menores:
- Waitlists de meses para instâncias GPU em qualquer cloud provider
- Preços inflacionados — o custo por hora de GPU H100 subiu 40% desde 2025
- Contratos mínimos — provedores estão exigindo compromissos de 1-3 anos para garantir capacidade
- Alternativas limitadas — AMD ROCm melhorou, mas o ecossistema CUDA da Nvidia ainda domina 85% do mercado
Algumas empresas estão tomando caminhos alternativos:
# Opções para startups em 2026:
# 1. Modelos menores (3B-8B params) que rodam em hardware consumer
# 2. Quantização agressiva (INT4/INT8) para reduzir uso de GPU
# 3. Provedores menores (Lambda, CoreWeave, Together AI)
# 4. Inferência na edge (smartphones, laptops com NPU)
# 5. Fine-tuning em vez de training from scratch
A era de “basta colocar na cloud e escalar” acabou. A cloud não é infinita. Essa ilusão morreu quando o Google disse “não” para a Meta.
A Verdade Sobre a Escassez
O mais irônico de tudo é que os próprios provedores de cloud criaram esse problema. Google, Microsoft e Amazon gastaram anos vendendo a narrativa de que a cloud é elástica, infinita, que você pode escalar pra cima sem limites. “Pay as you go”, lembra?
Agora essa promessa está quebrando.
A demanda por IA cresceu exponencialmente, mas data centers levam 2-3 anos para construir. GPUs levam 12-18 meses para fabricar. Memória HBM tem lead time de quase 2 anos. Nenhuma dessas curvas acompanha o crescimento da demanda, que dobra a cada 6 meses.
O resultado é um mercado onde:
- Grandes empresas acumulam hardware como se fosse petróleo
- Cloud providers racionam capacidade como se fosse água em seca
- Startups ficam espremidas, pagando mais por menos
- Desenvolvedores são forçados a otimizar cada token, cada byte, cada ciclo de GPU
O Mercado Já Reagiu
Os investidores entenderam o recado. O Nasdaq caiu 2,21% numa única sessão quando ficou claro que as big techs não conseguem entregar toda a IA que prometeram. O mercado de previsões colapsou as chances de lançamento do GPT-5.6 em junho — de 83% para 18%. Todos os modelos frontier que deveriam sair em junho (GPT-5.6, Gemini 3.5 Pro, Grok 5) escorregaram para julho.
Não é coincidência. Se até o Google está racionando computação, lançar modelos cada vez maiores fica cada vez mais caro e mais lento.
A corrida da IA está batendo no limite da física. Não da inteligência — do hardware.
Quem Ganha Com Isso?
Se você quer saber quem vai surfar essa onda, olhe para quem resolve o gargalo:
- Nvidia — continua sendo a empresa mais importante do mundo enquanto a demanda por GPUs superar a oferta
- TSMC — fábrica de chips com fila de espera de anos. Cada wafer vale ouro
- Empresas de energia — data centers precisam de gigawatts. Quem fornece energia nuclear e gás natural está nadando em contratos
- Provedores de infraestrutura menores — CoreWeave, Lambda, Together AI capturam clientes que as big clouds não conseguem atender
- Desenvolvedores de modelos eficientes — quem faz mais com menos GPU (quantização, distilação, modelos pequenos) tem vantagem competitiva real
E quem perde? Quem apostou que a cloud é infinita e agora precisa repensar toda a arquitetura.
O Recado do Google Para o Mundo
Quando o Google diz “não” para a Meta, o recado não é só para Zuckerberg. É para todo o mercado: a infraestrutura de IA tem um teto, e nós já batemos nele.
US$ 725 bilhões em capex não resolveram o problema. 1,3 milhão de GPUs não resolveram o problema. A demanda por IA está crescendo mais rápido do que qualquer empresa, qualquer governo, qualquer cadeia de suprimentos consegue acompanhar.
A próxima fase da corrida da IA não vai ser sobre quem tem o melhor modelo. Vai ser sobre quem tem o melhor hardware. E nesse jogo, até a Meta está perdendo.
Fonte de inspiração: Google limits Meta’s use of its Gemini AI models, FT reports — CNBC













