Usar tokenizadores (tiktoken, Anthropic tokenizer) para contar tokens de trechos de codigo em Python, TypeScript e Go. Comparar: por que o mesmo codigo tem contagens diferentes? Quanto custa processar 1000 linhas?
Executar o mesmo prompt de geracao de codigo 10 vezes com temperatura 0, 0.3, 0.7 e 1.0. Em qual temperatura o codigo e mais previsivel? Em qual e mais criativo? Em qual quebra?
5 tarefas de engenharia (refatorar funcao, escrever teste, explicar bug, gerar SQL, documentar API) executadas em 3 modelos. Tabela comparativa: qualidade, velocidade, custo, tokens usados.
Calcular custo de API para: 100 code reviews/semana, 50 geracoes de teste/dia, 20 refatoracoes/sprint. Comparar com assinatura de ferramentas (Cursor Pro $20, Claude Max $100, Copilot $10).