O agente de código que ninguém esperava
Enquanto todo mundo discute se vale pagar $200/mês no Claude Code Max ou $20/mês no Cursor Pro, um projeto open source com 6.600 estrelas no GitHub apareceu do nada e colocou a indústria inteira numa posição desconfortável: e se você pudesse ter um agente de código tão capaz quanto esses — por centavos?
O DeepSeek Reasonix não é mais um wrapper genérico em cima de uma API. Ele foi arquitetado do zero em torno de uma única obsessão: prefix caching. E essa decisão técnica aparentemente simples resulta numa economia de 94% comparado ao Claude Code em sessões reais de desenvolvimento.
Eu testei. Os números são reais. E a engenharia por trás é elegante demais pra ser ignorada.
O problema que ninguém resolve (mas todo mundo sente)
Se você já usou o Claude Code, o Cursor Agent ou qualquer agente de terminal por mais de 30 minutos, sabe: a conta chega. Uma sessão de refatoração que mexe em 15 arquivos pode custar $2 a $5 no Opus. Um dia inteiro de pair programming com IA pode ultrapassar $30 — como a Uber descobriu ao estourar o orçamento anual de IA em 4 meses. Multiply isso por uma equipe de 10 devs e estamos falando de $3.000 a $7.500 por mês — só em tokens.
O motivo é simples: a cada mensagem que você envia, o agente reprocessa todo o contexto anterior. O system prompt, as definições de ferramentas, o histórico de conversa, os arquivos lidos — tudo. É como se cada vez que você pedisse algo, o agente precisasse reler o livro inteiro desde a primeira página.
Já falamos aqui sobre o DeepSeek V4 e seu preço imbatível. A API do DeepSeek tem um mecanismo chamado prefix caching: se o início do seu prompt for idêntico ao de uma requisição anterior, o servidor reutiliza as ativações neurais já computadas e só processa a parte nova. Em teoria, isso reduz custos dramaticamente. Na prática, quase nenhum framework aproveita isso direito.
E esse é exatamente o ponto onde o Reasonix entra.
A arquitetura de três regiões
A maioria dos frameworks de agentes (LangChain, CrewAI, até o próprio Claude Code) reconstrói o prompt a cada turno. Timestamps são injetados. O histórico é reordenado. Schemas de ferramentas são re-serializados com espaçamento diferente. O prefixo muda — e o cache nunca acerta.
O Reasonix resolve isso dividindo o contexto em três regiões estruturalmente distintas:
1. Prefixo Imutável
O system prompt, os schemas das ferramentas e os exemplos few-shot são computados uma única vez no início da sessão. Essa região é hasheada na construção e fixada como candidata ao cache. Ela nunca muda durante toda a sessão.
{
"system": "You are a coding agent...",
"tools": [
{"name": "read_file", "parameters": {...}},
{"name": "write_file", "parameters": {...}}
],
"examples": [...]
}
Nenhum timestamp. Nenhuma variável dinâmica. Serialização determinística. Byte por byte, essa região é idêntica em toda requisição subsequente.
2. Log Append-Only
Todos os turnos anteriores — mensagens do assistente, resultados de ferramentas, respostas do usuário — são serializados sequencialmente numa estrutura que só cresce. O método log.append() recusa qualquer mutação. Não há reordenação, não há compactação, não há resumo automático.
Isso garante que o prefixo da requisição N+1 é sempre uma extensão exata da requisição N. O cache do DeepSeek funciona por correspondência exata de prefixo — se os primeiros 80% dos bytes são idênticos, esses tokens pegam a taxa de cache.
3. Scratch Volátil
Artefatos de raciocínio temporário e estado transiente ficam nessa região, que é resetada a cada turno e nunca enviada upstream. Isso evita que dados efêmeros corrompam a chave de cache.
O resultado? Um usuário real reportou 435 milhões de tokens de input com 99,82% de cache hit numa sessão longa. O que custaria $61 no Claude custou $12.
Quanto custa na prática?
Vamos aos números concretos, comparando chamadas reais de API:
| Cenário | DeepSeek (Reasonix) | Claude Sonnet 4.6 | Economia | |
|---|---|---|---|---|
| ——— | ——————– | ——————– | ———- | |
| Chat multi-turno (5 turnos) | $0,000923 | $0,015174 | 93,9% | |
| Tool-use calculator (2 turnos) | $0,000142 | $0,003351 | 95,8% | |
| R1 reasoning (1 turno) | $0,006478 | $0,044484 | 85,4% |
E a pricing do DeepSeek V4 Flash com cache hit é absurda:
| Tipo | Preço por 1M tokens | |
|---|---|---|
| —— | ——————— | |
| Cache hit (input) | $0,0028 | |
| Cache miss (input) | $0,14 | |
| Output | $0,28 |
Cache hit custa 2% do preço de cache miss. E o Reasonix foi projetado para manter essa taxa acima de 85% o tempo todo. Na prática, com sessões longas, chega a 99%.
Isso significa que uma sessão típica de coding — aquela de fix rápido, $0,15 no Claude — custa menos de $0,01 no Reasonix.
O que ele sabe fazer?
O Reasonix não é um brinquedo minimalista. Ele tem paridade de features com os agentes comerciais mais populares:
| Feature | Reasonix | Claude Code | Cursor | Aider | |
|---|---|---|---|---|---|
| ——— | ———- | ————- | ——– | ——- | |
| Backend | DeepSeek only | Anthropic | OpenAI/Anthropic | Qualquer | |
| Licença | MIT | Fechado | Fechado | Apache 2 | |
| Custo por task | ~$0,05 | $0,15–$2,25 | Subscription | Variável | |
| Prefix cache nativo | Sim | Não | Não | Incidental | |
| Edição SEARCH/REPLACE | Sim | Sim | Sim | Sim | |
| MCP (Model Context Protocol) | Sim | Sim | Parcial | Não | |
| Web search integrado | Sim | Sim | Sim | Não | |
| Indexação semântica (Ollama) | Sim | Não | Não | Não | |
| Sessões persistentes | Sim | Parcial | N/A | Não | |
| GUI Desktop (Tauri) | Preview | Não | Sim | Não | |
| Plan mode | Sim | Sim | Não | Não | |
| Hooks de lifecycle | Sim | Sim | Não | Não |
O sistema de skills do Reasonix aceita inclusive playbooks do Claude Code sem adaptação — basta copiar os arquivos .claude/skills/ para .reasonix/skills/.
Tool-Call Repair: consertando o que o DeepSeek quebra
Ser DeepSeek-only tem um preço: o modelo às vezes gera tool calls malformadas. O Reasonix lida com isso através de quatro camadas automáticas de reparo:
Schema flattening — Converte estruturas de parâmetros aninhadas em representações planas para o modelo, depois re-aninha os argumentos no dispatch.
Reasoning trace scavenging — Regex e parsing JSON recuperam tool calls que o modelo enterrou dentro de blocos . Sim, isso acontece com frequência no R1.
Truncation recovery — Fecha chaves JSON incompletas e preenche chaves pendentes quando o modelo trunca a resposta.
Storm breaker — Deduplicação por janela deslizante que previne loops infinitos de tool calls. Qualquer pessoa que já usou o Claude Code sabe como é frustrante quando o agente entra num ciclo.
Essas quatro camadas rodam em sequência antes de cada execução de ferramenta. O resultado é que chamadas que falhariam silenciosamente em qualquer outro framework simplesmente funcionam.
R1 Thought Harvesting: extraindo ouro do raciocínio
O DeepSeek R1 tem uma feature única: ele expõe o campo reasoning_content com todo o raciocínio chain-of-thought. O problema é que refeedar esse raciocínio inteiro nos turnos seguintes explodiria o custo de tokens.
O Reasonix resolve isso com uma abordagem criativa: ele faz uma chamada secundária ao V3 (que custa ~$0,0001 por turno) para extrair quatro tipos de informação estruturada do raciocínio bruto:
{
"subgoals": ["Refatorar a função de autenticação", "Adicionar testes"],
"hypotheses": ["O bug pode estar na serialização do JWT"],
"uncertainties": ["Não está claro se a migration já foi aplicada"],
"rejected_paths": ["Tentei usar bcrypt direto, mas a lib não está instalada"]
}
Essa extração preserva o valor do raciocínio do R1 sem o custo de re-enviar milhares de tokens de pensamento. É essencialmente gratuita dado o preço do V3.
Self-Consistency Branching: três cérebros por centavos
Uma das features mais engenhosas: o Reasonix roda três chamadas paralelas ao R1 com temperaturas diferentes (0.0, 0.5 e 1.0) e seleciona a melhor resposta. O critério default é a navalha de Occam — escolhe a sample com menos incertezas flaggadas.
O truque? Três chamadas ao DeepSeek R1 com prefix cache ainda custam menos que uma única chamada ao Claude Sonnet. E o ganho de precisão reportado é de 10 a 15 pontos percentuais.
É o equivalente a ter três devs discutindo a solução antes de implementar — só que por $0,02 em vez de $0,15.
Instalação em 30 segundos
# Global
npm install -g reasonix
reasonix code meu-projeto
# Ou one-shot via npx
npx reasonix code
# Alias mais curto
npm install -g dsnix
dsnix code .
Pré-requisitos: Node.js 22+ e uma API key do DeepSeek (tem tier gratuito em platform.deepseek.com).
Os subcomandos principais:
reasonix code [dir] # Agente principal de coding
reasonix chat # Conversa sem ferramentas
reasonix run "task" # One-shot com streaming
reasonix doctor # Health check
reasonix update # Auto-update
A configuração fica num único JSON em ~/.reasonix/config.json, com overrides por projeto em .reasonix/. A estrutura é familiar pra quem já mexeu com Claude Code:
{
"apiKey": "sk-...",
"model": "deepseek-chat",
"effort": "medium",
"mcp": {
"servers": {}
},
"skills": {
"mode": "inline"
}
}
QQ Channel e integração com chat
Um detalhe que passou despercebido: o Reasonix tem integração nativa com QQ Channel (o Discord chinês). Você conecta com /qq connect e mensagens do chat entram direto na sessão do agente. Respostas do assistente voltam pro canal automaticamente. É remote pair programming via chat — algo que nem o Claude Code oferece nativamente.
Parece nicho? Talvez. Mas mostra a filosofia do projeto: sessões longas, persistentes, acessíveis de qualquer lugar. Enquanto o Claude Code reseta contexto a cada nova invocação, o Reasonix mantém a sessão viva e acessível por múltiplos canais.
A GUI Desktop que (quase) ninguém sabe que existe
O Reasonix tem um cliente desktop em Tauri — sim, Tauri, não Electron. Isso significa binários nativos, sem Node.js embarcado no app final, e consumo de memória drasticamente menor.
A interface tem suporte a múltiplas tabs, painel lateral mostrando arquivos lidos/editados, e usa a mesma config ~/.reasonix. Ainda é prerelease e não tem code signing (no macOS, precisa rodar xattr -dr com.apple.quarantine), mas já funciona para uso diário.
Pra quem acha que terminal-only é demais, essa é a ponte.
Quando NÃO usar o Reasonix
Seria desonesto não falar das limitações:
Qualidade de raciocínio — O Claude Opus ainda ganha em tarefas de raciocínio complexo. Se você está debugando um race condition em código concorrente ou precisa de análise arquitetural profunda, o Opus continua superior. O self-consistency branching do Reasonix compensa parcialmente, mas não fecha a diferença completamente.
Ecosystem lock-in — DeepSeek only. Se amanhã a API do DeepSeek fica instável ou muda pricing, você não tem fallback. Projetos como o DeepClaude tentam hibridizar Claude com DeepSeek, e frameworks como o Aider (que roda com qualquer provider via OpenRouter) são mais resilientes nesse aspecto.
Maturidade — O projeto está na versão 0.0.6 com 135 testes passando. Funciona? Sim. Está production-ready para uma equipe de 50 devs? Provavelmente não ainda. Os 161 issues abertos no GitHub sugerem que ainda há arestas pra limar.
Privacidade — Seus prompts e código vão para os servidores do DeepSeek na China. Para muitas empresas, isso é um deal-breaker regulatório independente do preço.
O elefante na sala: isso muda a corrida dos agentes?
O Reasonix prova algo que a indústria não queria ouvir: a maior parte do custo dos agentes de código é desperdício computacional. Reprocessar o mesmo prefixo milhares de vezes não é uma feature — é um bug de design que virou norma porque ninguém tinha incentivo financeiro pra resolver.
A Anthropic cobra $15/M tokens no input do Opus. Se o Claude Code implementasse um sistema de prefix caching equivalente ao do Reasonix, o custo por sessão cairia dramaticamente. Mas aí a receita também cairia. E esse é o conflito de interesses que um projeto open source não tem.
O DeepSeek, por sua vez, oferece cache hit a $0,0028/M tokens — um preço tão baixo que parece erro de digitação. Mas não é. É estratégia de mercado: tokenizar desenvolvedores com custos irrecusáveis para depois monetizar em escala.
Os 6.600 stars em poucas semanas não mentem. Tem uma demanda reprimida enorme por agentes de código que não custam uma parcela de aluguel por mês. O Reasonix é o primeiro a entregar isso com uma arquitetura que faz sentido técnico, não só financeiro.
Se você gasta mais de $50/mês em agentes de código e não está obrigado por compliance a ficar em provedores americanos, não experimentar o Reasonix é jogar dinheiro fora. E se a Anthropic e a OpenAI estão prestando atenção, vão precisar responder — não com mais features, mas com preços que façam sentido no mundo real.
—
Fonte de inspiração: DeepSeek Reasonix no Hacker News | Repositório GitHub | Artigo técnico sobre cache architecture













