Hasta el 80% del gasto de tokens en Claude Code viene de comportamientos por defecto que nadie configuró: respuestas largas sin pedirlas, lectura completa de archivos cuando solo se necesitan 3, y contexto que se acumula sin control. Estos cinco repositorios open-source atacan cada una de esas fugas con instalaciones de un solo comando, sin cambiar el flujo de trabajo. Útil para cualquier desarrollador con plan Pro o Team que siente que el límite llega antes de tiempo.
Claude Code consume tokens de maneras que no siempre son visibles: escribe explicaciones que no pediste, lee archivos completos cuando solo necesita tres funciones, imprime 200 líneas de output de terminal aunque solo te importara una, y acumula contexto sesión tras sesión hasta que el límite aparece a los 20 minutos. El problema no es Claude — es que los defaults están calibrados para ser útiles en general, no para ser eficientes en tu proyecto específico. Estos cinco repositorios corrigen eso.
Repositorio: drona23/claude-token-efficient
Stars: 4,522
El enfoque más directo: un archivo CLAUDE.md preconfigurado con instrucciones que le dicen a Claude exactamente qué no hacer. Sin explicaciones de pasos obvios, sin prefacio antes de responder, sin resúmenes al final de cada respuesta. El resultado documentado es un 63% de reducción en el largo de las respuestas sin pérdida de calidad técnica.
Instalación:
curl -o CLAUDE.md https://raw.githubusercontent.com/drona23/claude-token-efficient/main/CLAUDE.md
Si ya tenés un CLAUDE.md en el proyecto, fusioná las instrucciones manualmente en lugar de sobreescribir. Las instrucciones de este archivo actúan como filtro de comportamiento: Claude las lee al inicio de cada sesión y ajusta su modo de respuesta.
Prompt para instalar via Claude Code:
Instálame el skill de Claude Token Efficient en este proyecto
Repositorio: JuliusBrussee/caveman
Stars: 39,330
Plugin para Claude Code que comprime las respuestas a su forma más directa. Donde Claude normalmente devolvería un párrafo de contexto seguido de código seguido de explicación del código, Caveman devuelve solo el código con comentarios mínimos cuando eso es suficiente. La reducción documentada es del 65% en tokens por respuesta.
Instalación:
/plugin marketplace add JuliusBrussee/caveman
Prompt para instalar:
Instálame el plugin Caveman en Claude Code
La diferencia con Claude Token Efficient es de nivel: Token Efficient opera via instrucciones en CLAUDE.md (más fácil de personalizar), Caveman opera como plugin que modifica el pipeline de respuesta (más consistente, menos configurable manualmente).
Repositorio: mksglu/context-mode
Stars: 8,107
El problema más costoso en sesiones largas no es el largo de cada respuesta — es que el contexto acumulado crece sin límite. Cada respuesta de Claude incluye, implícitamente, todo lo que se dijo antes. A los 40 minutos de trabajo, Claude está procesando el equivalente de un documento de 50 páginas en cada mensaje.
Context Mode comprime el contexto acumulado sin perder información relevante. La compresión documentada llega al 98% en contextos maduros, lo que en la práctica significa sesiones 6 veces más largas antes de alcanzar el límite.
Instalación:
/plugin marketplace add mksglu/context-mode
Prompt para instalar:
Instálame el plugin Context Mode en Claude Code
Activalo después de la primera hora de trabajo en una sesión larga, o cuando notes que las respuestas empiezan a perder contexto de decisiones tomadas al inicio.
Repositorio: rtk-ai/rtk
Stars: 30,219
Cuando Claude ejecuta comandos de terminal — tests, builds, instalaciones — el output completo entra al contexto. Un npm install puede generar 300 líneas. Un test suite fallido puede generar 500. RTK actúa como filtro entre el terminal y el contexto de Claude: pasa solo las líneas relevantes (errores, warnings, resultados finales) y descarta el ruido.
Instalación:
brew install rtk
Prompt para instalar:
Instálame RTK en esta máquina
La reducción documentada es del 80% en tokens gastados en output de terminal en media hora de trabajo con builds o tests activos. Es particularmente útil en proyectos con pipelines de CI lentos o test suites verbosas.
Repositorio: tirth8205/code-review-graph
Stars: 11,552
El comportamiento por defecto de Claude ante una pregunta sobre código es leer los archivos que parecen relevantes. En un proyecto de 200 archivos, eso puede significar leer 40 archivos cuando la respuesta estaba en 3. Code Review Graph genera un mapa de dependencias del proyecto y lo usa para dirigir a Claude directamente a los archivos involucrados en cada tarea.
La reducción promedio documentada es de 6.8 veces menos tokens por tarea. En tareas que tocan partes centrales del proyecto (cambios en la capa de datos, refactors de módulos compartidos), el ahorro puede llegar a 49 veces.
Instalación:
pip install code-review-graph && code-review-graph install
Prompt para instalar:
Instálame Code Review Graph en este proyecto
Generá el mapa una vez al inicio y actualizalo cuando la estructura del proyecto cambie significativamente. No necesita correrse en cada sesión.
| Herramienta | Cuándo instalarla | Impacto |
|---|---|---|
| Claude Token Efficient | Primer día | 63% menos largo de respuestas |
| Caveman | Primer día | 65% menos tokens por respuesta |
| Context Mode | Cuando las sesiones duran +1h | Sesiones 6x más largas |
| RTK | Si usás terminal activamente | 80% menos tokens de output |
| Code Review Graph | En proyectos con +50 archivos | Hasta 49x menos tokens por tarea |
El orden importa porque los primeros dos son instalaciones inmediatas con impacto inmediato — sin configuración adicional. Context Mode y RTK requieren un poco más de criterio sobre cuándo activarlos. Code Review Graph es el de mayor impacto en proyectos medianos y grandes, pero requiere que el proyecto tenga suficiente estructura para que el mapa sea útil.
Instalá los primeros dos hoy. El resto, según tu flujo de trabajo.