Cuando Claude responde lento o consume tokens de forma ineficiente, el problema suele ser el modelo seleccionado, no la tarea. Cambiar al modelo correcto según el tipo de trabajo mejora la velocidad y reduce el gasto de tokens al mismo tiempo. Esta guía cubre los tres métodos para hacerlo: desde la app, desde la terminal con Claude Code, y en la configuración de subagentes.
Cuando Claude responde con más lentitud de lo habitual, la reacción automática es esperar o atribuirlo a la conexión. Pero hay una causa más concreta: los modelos más recientes se saturan. En momentos de alta demanda, el modelo que usas por defecto puede estar procesando miles de solicitudes simultáneas, y eso degrada tanto la velocidad como la calidad de las respuestas.
El movimiento correcto no es esperar — es cambiar de modelo.
Hay un beneficio doble que no es obvio a primera vista: los modelos anteriores no solo son más rápidos en momentos de saturación, sino que también gastan menos tokens por tarea equivalente. Eso se traduce en ahorro real si pagas por uso o si administrás una cuenta con límite mensual.
La familia de modelos de Claude incluye versiones con distintos perfiles de costo-rendimiento. El modelo más nuevo no siempre es el correcto para cada tarea — es el más capaz en razonamiento complejo, pero para código, documentación, clasificación o tareas estructuradas, versiones anteriores o más ligeras dan el mismo resultado con menos gasto.
Los tres modelos relevantes para alternar:
La regla práctica: si la tarea no requiere razonamiento encadenado complejo, Haiku o Sonnet hacen el trabajo en menos tiempo y con menor gasto.
Para quienes usan Claude directamente en el navegador:
Los identificadores que aparecen en la interfaz corresponden a versiones específicas. Si la interfaz muestra que estás en el modelo más nuevo y la respuesta es lenta, bajar a Sonnet 4.5 o Haiku es el movimiento inmediato.
Claude Code permite cambiar el modelo en cualquier momento de la sesión sin salir ni reiniciar.
Durante una sesión activa, usar el comando /model seguido del identificador:
/model claude-sonnet-4-5-20250929
/model claude-opus-4-5-20251101
/model claude-haiku-4-5-20251001
El cambio es inmediato. La respuesta siguiente ya usa el modelo indicado.
Al iniciar una sesión nueva, pasarlo como flag:
claude --model claude-sonnet-4-5-20250929
claude --model claude-opus-4-5-20251101
claude --model claude-haiku-4-5-20251001
Para confirmar qué modelo está activo, revisar la barra de estado inferior de la terminal. Muestra el modelo actual junto al tamaño del contexto y el porcentaje de uso. Ejemplo de lo que aparece:
sonnet-4 · 1M ctx · 67%
Si el porcentaje de contexto es alto y la respuesta se siente degradada, cambiar de modelo y abrir un nuevo contexto es la solución más efectiva.
Para quienes usan Claude Code con subagentes definidos en archivos .claude/agents/*.md, el modelo se puede fijar directamente en el frontmatter de cada agente:
---
model: sonnet
---
Esto elimina la variabilidad — el agente siempre usa el modelo especificado sin importar qué esté configurado como default en la sesión principal.
La lógica de asignación recomendada:
| Tipo de tarea | Modelo |
|---|---|
| Documentación, clasificación, listas | Haiku |
| Código, análisis, edición, revisión | Sonnet |
| Arquitectura de sistemas, investigación compleja | Opus |
Fijar el modelo por agente tiene una ventaja adicional: los costos son predecibles. Si un agente de documentación siempre usa Haiku, el gasto de tokens para esa tarea es constante y bajo.
/model durante la sesión, o --model al arrancar si ya sabés qué modelo querés.El principio que une los tres: modelo nuevo lento significa cambiar al anterior. En casi todos los casos el resultado mejora y el gasto de tokens baja. No hay razón para quedarse esperando.