Claude Mythos: A IA Perigosa Demais Para Ser Lançada ao Público

A Anthropic criou uma IA que hackeia qualquer sistema operacional, qualquer navegador, qualquer software crítico — e decidiu que o mundo não está pronto para usá-la. O Claude Mythos Preview encontrou milhares de vulnerabilidades zero-day que ninguém detectou por até 27 anos, incluindo bugs em Windows, Linux, macOS, Chrome, Firefox, Safari e dezenas de outros programas que você usa todo dia.

E a parte mais assustadora? Ele não só encontra os bugs. Ele escreve os exploits sozinho.

O Que Exatamente o Claude Mythos Consegue Fazer

Vamos direto ao ponto: o Claude Mythos Preview é um modelo de linguagem de propósito geral — não é uma ferramenta de pentest especializada. Ele é o próximo modelo frontier da Anthropic, e acontece que suas capacidades de código e raciocínio cruzaram um limiar onde ele supera todos os humanos, exceto os mais habilidosos, na tarefa de encontrar e explorar vulnerabilidades de software.

Os números são impressionantes:

Benchmark	Claude Mythos Preview	Claude Opus 4.6	Diferença
SWE-bench Verified	93.9%	~72%	+21.9 pp
GPQA Diamond	94.6%	~78%	+16.6 pp
CyberGym	83.1%	66.6%	+16.5 pp

Esse salto de 16.5 pontos percentuais no CyberGym — o benchmark que mede especificamente capacidades de cibersegurança — não é incremental. É um salto de paradigma. É a diferença entre um modelo que “ajuda a encontrar bugs” e um modelo que autonomamente descobre, analisa e explora vulnerabilidades zero-day em software real.

Milhares de Zero-Days: Os Números Que Ninguém Esperava

Nas últimas semanas antes do anúncio em 7 de abril de 2026, a Anthropic usou o Mythos Preview para vasculhar o código-fonte de sistemas críticos. O resultado foi devastador:

Milhares de vulnerabilidades zero-day identificadas
Bugs encontrados em todos os principais sistemas operacionais (Windows, Linux, macOS, FreeBSD, OpenBSD)
Bugs encontrados em todos os principais navegadores (Chrome, Firefox, Safari, Edge)
Vulnerabilidades em bibliotecas fundamentais como o FFmpeg
Muitos bugs com 10, 15, 20+ anos de existência

Para contextualizar: o programa de bug bounty do Google pagou mais de $40 milhões em recompensas desde 2010. Equipes inteiras de pesquisadores de segurança, ferramentas de fuzzing automatizado rodando 24/7, auditorias formais — e mesmo assim, o Mythos encontrou falhas que todos esses esforços combinados não conseguiram detectar.

Os Casos Mais Absurdos

O Bug de 27 Anos no OpenBSD

O OpenBSD é literalmente famoso por segurança. O projeto tem como lema “Only two remote holes in the default install, in a heck of a long time!” — e leva isso a sério. O código passa por auditorias rigorosas, revisões constantes, e tem uma das menores superfícies de ataque de qualquer OS.

O Mythos Preview encontrou uma vulnerabilidade de integer overflow na implementação TCP SACK do OpenBSD que existia desde 1998. Um atacante remoto poderia crashar qualquer máquina OpenBSD que respondesse via TCP. 27 anos. Décadas de auditoria humana. Ninguém viu.

O Bug de 16 Anos no FFmpeg

O FFmpeg é onipresente. Ele está por trás de praticamente todo software que processa vídeo — do VLC ao YouTube, do OBS ao Netflix. Uma vulnerabilidade no codec H.264 foi introduzida num refactor em 2010 e passou despercebida por 16 anos.

O detalhe mais perturbador: ferramentas automatizadas de fuzzing executaram 5 milhões de testes nesse trecho de código sem nunca acionar o bug. O Mythos encontrou na primeira análise.

A Execução Remota de Código no FreeBSD

Talvez o caso mais grave: o Mythos Preview identificou e explorou autonomamente uma vulnerabilidade de execução remota de código (RCE) no FreeBSD que tinha 17 anos. Qualquer máquina rodando NFS podia ser comprometida — um atacante ganhava root sem autenticação.

Pensa nisso por um segundo. Servidores de produção rodando FreeBSD com NFS exposto na rede, vulneráveis por quase duas décadas. E ninguém sabia.

A Façanha Técnica Mais Impressionante: O Exploit de Navegador

Eu já vi demos de exploits automatizados antes. Mas o que o Mythos fez com navegadores web é de outro nível.

Navegadores modernos são fortalezas. O Chrome, por exemplo, tem:

Sandbox do renderer — isola o processo de renderização
Sandbox do OS — camada adicional de isolamento
Compilador JIT com hardening — proteções específicas contra manipulação de memória
CFI (Control Flow Integrity) — impede redirecionamento de execução
ASLR, DEP, stack canaries — as proteções clássicas

Para escapar de tudo isso, você precisa encadear múltiplas vulnerabilidades de forma precisa. É o tipo de trabalho que equipes especializadas levam meses para fazer — quando conseguem.

O Mythos Preview fez isso autonomamente. Ele:

Descobriu 4 vulnerabilidades distintas em um navegador
Identificou primitivas de leitura e escrita arbitrárias
Encadeou as vulnerabilidades numa sequência lógica
Escreveu um JIT heap spray complexo que escapou tanto o sandbox do renderer quanto o sandbox do OS

Para quem não é da área: isso é o equivalente a uma IA encontrar sozinha a planta de um cofre de banco, identificar 4 falhas diferentes no sistema de segurança, e construir uma ferramenta que explora todas elas em sequência para abrir o cofre. Sem ajuda humana.

Por Que a Anthropic Decidiu Não Lançar

A resposta é simples: o risco é grande demais.

Se o Mythos Preview fosse lançado como um chatbot público — da mesma forma que o Claude Opus está disponível hoje — qualquer pessoa poderia pedir para ele encontrar e explorar vulnerabilidades em qualquer software. Não estamos falando de ataques teóricos. Estamos falando de exploits funcionais, testados, prontos para uso.

A Anthropic publicou um relatório de risco detalhando a decisão. O modelo representa aquilo que a indústria chama de “capability overhang” — quando as capacidades de um sistema ultrapassam significativamente a infraestrutura de segurança disponível para contê-las.

É um momento inédito na história da IA. Pela primeira vez, uma empresa optou por não lançar um modelo comercialmente porque suas capacidades ofensivas são perigosas demais nas mãos erradas.

Project Glasswing: A Alternativa

Em vez de lançar o modelo ao público, a Anthropic criou o Project Glasswing — uma iniciativa de cibersegurança que cede acesso ao Mythos Preview para organizações que mantêm software crítico.

Os Parceiros

Empresa	Área
Amazon Web Services	Cloud / Infraestrutura
Apple	Sistemas operacionais / Navegadores
Broadcom	Hardware / Firmware
Cisco	Redes / Infraestrutura
CrowdStrike	Segurança endpoint
Google	Navegadores / Cloud / Android
JPMorgan Chase	Fintech / Infraestrutura financeira
Linux Foundation	Open source
Microsoft	Windows / Azure / Edge
Nvidia	Drivers / GPU / IA
Palo Alto Networks	Firewalls / Segurança de rede

Além desses 11 parceiros principais, mais de 40 organizações adicionais receberam acesso. A Anthropic está oferecendo mais de $100 milhões em créditos de uso para o projeto.

O Foco em Open Source

Uma decisão estratégica interessante: o Project Glasswing tem ênfase especial em software open source. E faz sentido. Bibliotecas como OpenSSL, FFmpeg, curl, zlib e o próprio kernel Linux formam a base de praticamente toda a infraestrutura digital moderna — de data centers a smartphones.

Historicamente, mantenedores de projetos open source não têm acesso a ferramentas sofisticadas de segurança. Muitos são voluntários trabalhando no tempo livre. O Glasswing quer mudar isso, democratizando o acesso a capacidades de análise de segurança que antes só existiam em agências de inteligência.

As Regras do Jogo

Os participantes do Glasswing têm obrigações:

Divulgação responsável — vulnerabilidades encontradas devem ser reportadas aos mantenedores antes de qualquer publicação
Compartilhamento de descobertas — os resultados devem ser compartilhados com a indústria
Uso exclusivamente defensivo — o modelo não pode ser usado para desenvolver capacidades ofensivas

O Contexto: IA e Hacking Já Estavam Convergindo

O Mythos não surgiu do nada. Já existiam sinais claros de que a IA estava se aproximando desse ponto.

Em 2024, pesquisadores da UIUC demonstraram que o GPT-4, quando configurado como agente autônomo, conseguia explorar 87% das vulnerabilidades conhecidas (CVEs com descrição pública). O detalhe importante: sem acesso à descrição do CVE, a taxa caía para 7%.

Outros pesquisadores foram além. Usando uma técnica chamada HPTSA (Hierarchical Planning with Task-Specific Agents) — basicamente uma equipe de agentes de IA coordenados — conseguiram hackear 8 de 15 vulnerabilidades zero-day reais em aplicações web. 550% mais eficiente que um único LLM trabalhando sozinho.

A diferença do Mythos é escala e autonomia. Ele não precisa de frameworks externos, não precisa de coordenação entre agentes, não precisa de CVEs como ponto de partida. Ele lê código, entende a lógica, identifica padrões vulneráveis, e escreve exploits — tudo internamente, num único fluxo de raciocínio.

O Que Isso Significa Para Desenvolvedores

Se você escreve código — qualquer código que roda em produção — o Mythos Preview muda o cálculo de risco fundamentalmente.

1. Fuzzing Não É Mais Suficiente

O caso do FFmpeg prova isso de forma definitiva. 5 milhões de execuções de fuzzing não encontraram o bug. O Mythos encontrou porque ele não está apenas testando inputs aleatórios — ele está entendendo a lógica do código e raciocinando sobre estados que um fuzzer jamais alcançaria.

2. Revisão de Código Humana Tem Limites

27 anos de auditoria no OpenBSD. Décadas de olhos humanos treinados. E um integer overflow passou despercebido. Não é uma crítica aos auditores — é um reconhecimento de que a complexidade do software moderno excede a capacidade humana de revisão completa.

3. A Janela de Divulgação Vai Encolher

Historicamente, quando um pesquisador encontra uma vulnerabilidade, ele tem meses para notificar o vendedor antes da divulgação pública. Mas se modelos como o Mythos se proliferarem (e vão, eventualmente), a probabilidade de múltiplas entidades descobrirem o mesmo bug simultaneamente aumenta drasticamente.

4. Bug Bounties Vão Mudar

Quanto vale um zero-day que uma IA pode encontrar em minutos? O mercado de bug bounty vai precisar se adaptar. Provavelmente veremos uma bifurcação: recompensas menores para vulnerabilidades que IAs conseguem encontrar facilmente, e prêmios muito maiores para bugs que resistem à análise automatizada.

As Perguntas Que Ninguém Está Respondendo

Eu tenho algumas preocupações que o anúncio da Anthropic não aborda adequadamente:

Se a Anthropic conseguiu fazer isso, quem mais consegue? O Mythos não usa nenhuma técnica secreta de hacking. Ele é um modelo de linguagem com capacidades excepcionais de código. A OpenAI, Google DeepMind, e possivelmente atores estatais como China e Rússia provavelmente têm (ou terão em breve) modelos com capacidades similares. O Project Glasswing é uma corrida contra o tempo.

O que acontece quando modelos open source atingem esse nível? Llama, Mistral, Qwen — modelos open source estão sempre 6-12 meses atrás dos modelos frontier. Quando atingirem o nível do Mythos, não haverá como restringir o acesso. Qualquer pessoa com uma GPU poderá rodar um scanner de zero-days.

Os $100 milhões em créditos são suficientes? A quantidade de código open source que precisa ser auditada é astronômica. O kernel Linux sozinho tem mais de 30 milhões de linhas. Adicione todas as dependências de um stack web moderno e você está falando de centenas de milhões de linhas de código.

O Elefante na Sala: Corrida Armamentista

O Project Glasswing é, essencialmente, a primeira iniciativa organizada de cibersegurança ofensiva-defensiva movida a IA em escala industrial. E embora o objetivo declarado seja defensivo, a realidade é mais complexa.

Cada vulnerabilidade encontrada pelo Mythos é simultaneamente:

Uma oportunidade de correção (uso defensivo)
Uma oportunidade de exploração (uso ofensivo)

A diferença entre os dois é puramente uma questão de quem chega primeiro. E agora, pela primeira vez, ambos os lados da equação estão usando a mesma arma.

Governos já prestaram atenção. O Nextgov (publicação do governo americano) levantou questões sobre as implicações do Glasswing para operações cibernéticas dos EUA. Se a Anthropic está encontrando zero-days em todos os sistemas operacionais, isso inclui os sistemas que agências como a NSA dependem para operações ofensivas.

É um paradoxo fascinante: corrigir vulnerabilidades é bom para a segurança global, mas também elimina vetores de ataque que agências de inteligência consideram ativos estratégicos.

O Que Vem Agora

A Anthropic deixou claro que o plano eventual é tornar modelos da classe Mythos disponíveis para uso em cibersegurança de forma mais ampla. Mas não deu prazo — e provavelmente não dará tão cedo.

No curto prazo, o que veremos é:

Uma onda de patches — conforme os parceiros do Glasswing processam as descobertas, expect atualizações de segurança em cascata para Windows, Linux, macOS, Chrome, Firefox e dezenas de outros projetos
Competidores correndo atrás — Google, OpenAI, e outros vão tentar demonstrar capacidades similares. A pressão competitiva é imensa.
Reguladores prestando atenção — o Mythos é o primeiro caso concreto de um modelo de IA que é genuinamente perigoso demais para lançar. Isso vai alimentar o debate sobre regulamentação de IA por anos.
O mercado de cibersegurança se transformando — empresas como CrowdStrike e Palo Alto Networks (ambas parceiras do Glasswing) provavelmente integrarão capacidades similares em seus produtos. O SOC do futuro terá agentes de IA como analistas de primeira linha.

Enquanto isso, os mantenedores de software open source ao redor do mundo estão provavelmente olhando para seus repositórios com uma mistura de esperança e terror. Esperança de que o Mythos encontre e corrija bugs antes que alguém os explore. Terror de quantos bugs existem esperando para serem encontrados.

A IA não veio substituir os hackers. Veio mostrar que todos nós estamos vivendo em casas de vidro — e que as pedras ficaram muito mais fáceis de encontrar.

👉 Leia também: Apple Vazou Arquivos do Claude Code no App de Suporte

Related Tags:

Comments (2)

abril 11, 2026
Modelos De IA De US$0,11 Encontram Os Mesmos Bugs Que O Claude Mythos - CodeInsider

[…] dois dias, eu escrevi aqui no CodeInsider sobre o Claude Mythos — o modelo da Anthropic que encontrou vulnerabilidades críticas em sistemas operacionais como […]

maio 11, 2026
Mythos Analisou 178 Mil Linhas Do Curl — Só 1 Bug Era Real - CodeInsider

[…] do Mythos em abril, a frase de Stenberg bate forte. A Anthropic apresentou o modelo como uma revolução na segurança cibernética — uma IA capaz de encontrar e encadear vulnerabilidades zero-day em sistemas operacionais, […]

Shopping cart

Recent Posts

Postgres para Startups: 9 Erros

GPT-5.6 Escapou do Sandbox, Achou

Google Soltou 3 Geminis de