Tres versoes de CLAUDE.md para o mesmo projeto: (1) vazia, (2) 500+ linhas com excesso de detalhes, (3) ~150 linhas bem estruturada. Executar a mesma tarefa com cada versao. Documentar: diferenca de qualidade, correcoes necessarias, tokens consumidos.
Pegar um repositorio open source e escrever CLAUDE.md do zero: (1) arquitetura em 5 frases, (2) comandos essenciais (setup, test, build), (3) restricoes de estilo, (4) armadilhas do projeto ("nunca modifique X diretamente"), (5) testar com 5 tarefas e medir correcoes necessarias.
Monorepo com frontend, backend e infra: mapear quais contextos isolar, criar CLAUDE.md por pasta vs. raiz, comparar qualidade de output com e sem contexto desnecessario injetado.
Construir mecanismo de memoria persistente: arquivo memory.md com fatos do projeto, script que atualiza apos sessoes importantes, testar se a memoria melhora tarefas subsequentes.
Mesma tarefa de coding: sem contexto (prompt puro) vs. com CLAUDE.md completo. Cronometrar e documentar a diferenca real em tempo, qualidade e iteracoes.