Archon: o framework open-source que transforma Claude Code e Codex em pipelines determinísticos

O repositório github.com/coleam00/Archon cruzou 14 mil stars no GitHub neste mês de abril de 2026 — e o timing não é à toa. A comunidade estava com um problema crescente nas mãos: agentes de código como Claude Code e OpenAI Codex CLI são poderosos, mas operam num modo essencialmente freeform. Você dá um prompt, o agente faz o que acha melhor, e reproduzir o resultado na próxima rodada é uma questão de sorte. O Archon resolve isso.

O que é o Archon

Archon é um harness de workflows para agentes de código. O projeto se autodefine como o primeiro benchmark builder para AI coding agents, mas o que ele realmente faz é mais prático: transforma interações freeform com agentes em pipelines YAML versionados, determinísticos e auditáveis.

Em vez de você abrir o Claude Code e mandar um prompt livre, você define um workflow que o Archon orquestra:

# exemplo de workflow archon
workflow:
  name: feature-implementation
  steps:
    - name: planning
      agent: claude-code
      prompt_template: prompts/planning.md
      outputs: [plan.md]

    - name: implementation
      agent: claude-code
      depends_on: planning
      prompt_template: prompts/implement.md
      inputs: [plan.md]

    - name: validation
      agent: codex-cli
      depends_on: implementation
      prompt_template: prompts/validate.md

    - name: code-review
      agent: claude-code
      depends_on: validation
      prompt_template: prompts/review.md

    - name: create-pr
      agent: codex-cli
      depends_on: code-review
      prompt_template: prompts/pr.md

O YAML não é complicado — é exatamente o que você já faz mentalmente quando trabalha com esses agentes, só que formalizado e versionável num repositório.

A sacada dos git worktrees

O detalhe de arquitetura que mais me chamou atenção: cada execução de workflow roda em seu próprio git worktree. Isso não é cosmético.

Sem isso, rodar duas instâncias de Claude Code em paralelo no mesmo repo é uma receita para conflito de merge. Com worktrees isolados, o Archon consegue executar múltiplos workflows em paralelo sem que as instâncias pisem umas nas outras. Cada feature branch de agente vive no seu próprio diretório de trabalho enquanto o worktree principal permanece limpo.

# o archon cria algo como:
.git/worktrees/
  archon-run-abc123/   # feature A
  archon-run-def456/   # feature B (rodando em paralelo)
  archon-run-ghi789/   # bugfix C (também em paralelo)

Isso abre caminho para um padrão que eu vejo cada vez mais necessário em times que usam agentes de código a sério: pipelines paralelos sem coordenação manual. Você define os workflows, o Archon gerencia o isolamento.

O que o Archon cobre

Os workflows out-of-the-box do Archon cobrem o ciclo completo de desenvolvimento com agentes:

Etapa	Descrição
planning	Agente quebra a tarefa em subtarefas, gera plano em markdown
implementation	Agente escreve o código seguindo o plano
validation	Executa testes, lint, verifica outputs esperados
code review	Segunda passagem do agente revisando o próprio código
PR creation	Abre pull request com descrição gerada automaticamente

Esse ciclo inteiro é rastreável porque cada step gera artefatos (arquivos markdown, logs de execução, diffs) que ficam no git junto com o código.

Como rodar na prática

A instalação é direta:

git clone https://github.com/coleam00/Archon
cd Archon
pip install -r requirements.txt

# configure seus agentes
cp config.example.yaml config.yaml
# edite config.yaml com suas API keys

Para rodar um workflow:

python archon run --workflow workflows/feature.yaml \
                  --task "implementar endpoint POST /users com validação pydantic"

O Archon cria o worktree, injeta o prompt no agente configurado (Claude Code ou Codex CLI), executa os steps em sequência, e no final você tem um PR aberto ou um diff pronto para revisar. Toda a execução fica logada num diretório .archon/runs/ dentro do worktree.

Uma coisa que eu gosto: você pode mixar agentes por step. Usar Claude Code para planning e implementation (onde o raciocínio mais longo ajuda) e Codex CLI para validation e PR creation (onde você quer execução rápida de comandos). O Archon não te força a escolher um único agente.

Comparação com alternativas

Justo comparar com o que existe. O espaço de “orchestration for AI coding agents” ainda é jovem, mas já tem algumas peças:

Ferramenta	Modelo	Determinismo	Isolamento	Open-source
Archon	Workflow YAML	Alto	git worktrees	Sim
LangGraph	Grafo de estados	Médio	Nenhum nativo	Sim
CrewAI	Multi-agent roles	Médio	Nenhum nativo	Sim
Devin/Swe-agent	End-to-end autônomo	Baixo	Sandbox Docker	Parcial
Copilot Workspace	Interface GitHub	Baixo	GitHub nativo	Não

O Archon ocupa um nicho específico: você quer controle de processo sem abrir mão dos modelos mais capazes (Claude Code, Codex). LangGraph e CrewAI são mais flexíveis para multi-agent genérico, mas não pensam especificamente em coding workflows com isolamento de worktree. Devin e similares tentam fazer tudo sozinhos — o que funciona para casos simples, mas quebra quando você precisa de reproducibilidade ou auditoria.

Limitações e o que ainda não funciona

Sendo honesto sobre o estado atual do projeto:

Maturidade: com 14k stars em abril de 2026, o Archon está em crescimento acelerado, mas não é production-hardened no mesmo nível de um Airflow ou Prefect. Para casos críticos, espere alguns meses de estabilização.
Modelos suportados: por ora, o foco é em Claude Code e OpenAI Codex CLI. Se você usa outros agentes de código (Gemini Code Assist, por exemplo), vai precisar escrever um adapter.
Paralelismo com limites de API: rodar vários workflows em paralelo consome tokens na mesma velocidade. Se você tem rate limits apertados nas APIs, o paralelismo vai esbarrar nisso.
YAML verboso: workflows mais complexos ficam grandes. Falta uma abstração de composição — poder importar sub-workflows de um arquivo central, por exemplo.
Observabilidade: o logging existe, mas não há integração nativa com ferramentas de MLOps como MLflow ou Weights & Biases. Você vai querer adicionar isso se estiver rodando em escala.

Abri uma issue sobre o último ponto no repo. A comunidade está ativa — as respostas chegam rápido.

Por que isso importa para times brasileiros

Aqui tem uma observação prática que vai além do hype: times de desenvolvimento no Brasil raramente têm orçamento para tooling enterprise de AI engineering. Plataformas como GitHub Copilot Workspace, Replit Ghostwriter ou as ofertas gerenciadas de automação de código custam por seat de um jeito que não escala para squads menores.

O Archon é open-source, roda local ou na sua própria infra, e usa diretamente as APIs de Claude Code e Codex — que você já está pagando de qualquer forma. O overhead de infraestrutura é zero: um processo Python, git nativo e suas API keys.

Para um time de quatro pessoas em São Paulo que quer workflows reproduzíveis para geração de código, o Archon é a diferença entre “a IA às vezes funciona assim” e “toda execução segue o mesmo processo e está versionada”. Isso é especialmente relevante quando você precisa auditar o que o agente fez — seja para debug, seja para compliance interno.

Veredito

O Archon preenche um gap real: determinismo em workflows de agentes de código. Não é magia — é engenharia de processo aplicada a ferramentas que nasceram como interfaces interativas. A ideia de usar git worktrees para isolamento é elegante e barata. O formato YAML é verboso mas versionável.

Se você está usando Claude Code ou Codex CLI de forma ad hoc e precisa escalar isso para um processo repetível, o Archon é o lugar óbvio para começar. Não está pronto para produção crítica sem monitoramento adicional, mas está bom o suficiente para ser a base do seu CI pipeline de AI-assisted development.

Repo: github.com/coleam00/Archon. Clona, define um workflow simples, roda duas vezes e compara os artefatos. Se os outputs são idênticos, você acabou de ter determinismo em agente de código. Vale o teste.