Guía

Cambia de Modelo Cuando Claude Se Siente Lento

Cuando Claude responde lento o consume tokens de forma ineficiente, el problema suele ser el modelo seleccionado, no la tarea. Cambiar al modelo correcto según el tipo de trabajo mejora la velocidad y reduce el gasto de tokens al mismo tiempo. Esta guía cubre los tres métodos para hacerlo: desde la app, desde la terminal con Claude Code, y en la configuración de subagentes.

1 fuente30 de junio de 2026

Cambia de Modelo Cuando Claude Se Siente Lento

Cuando Claude responde con más lentitud de lo habitual, la reacción automática es esperar o atribuirlo a la conexión. Pero hay una causa más concreta: los modelos más recientes se saturan. En momentos de alta demanda, el modelo que usas por defecto puede estar procesando miles de solicitudes simultáneas, y eso degrada tanto la velocidad como la calidad de las respuestas.

El movimiento correcto no es esperar — es cambiar de modelo.

Hay un beneficio doble que no es obvio a primera vista: los modelos anteriores no solo son más rápidos en momentos de saturación, sino que también gastan menos tokens por tarea equivalente. Eso se traduce en ahorro real si pagas por uso o si administrás una cuenta con límite mensual.

Por Qué Funciona

La familia de modelos de Claude incluye versiones con distintos perfiles de costo-rendimiento. El modelo más nuevo no siempre es el correcto para cada tarea — es el más capaz en razonamiento complejo, pero para código, documentación, clasificación o tareas estructuradas, versiones anteriores o más ligeras dan el mismo resultado con menos gasto.

Los tres modelos relevantes para alternar:

  • Sonnet: equilibrio entre velocidad y capacidad. Sólido para código, edición, análisis. El punto de partida para la mayoría de tareas.
  • Opus: razonamiento profundo, arquitectura de sistemas, investigación. Más lento y más caro — justificado solo cuando la complejidad lo exige.
  • Haiku: ultra rápido, mínimo consumo de tokens. Para tareas simples: documentar una función, clasificar items, generar listas, resumir texto corto.

La regla práctica: si la tarea no requiere razonamiento encadenado complejo, Haiku o Sonnet hacen el trabajo en menos tiempo y con menor gasto.

Método 1: Cambiar desde la App (claude.ai)

Para quienes usan Claude directamente en el navegador:

  1. Abrir claude.ai y entrar a cualquier chat (nuevo o existente)
  2. Localizar el selector de modelo en la esquina superior derecha del chat
  3. Desplegar "Más modelos" para acceder a las versiones disponibles
  4. Seleccionar el modelo según el perfil de la tarea

Los identificadores que aparecen en la interfaz corresponden a versiones específicas. Si la interfaz muestra que estás en el modelo más nuevo y la respuesta es lenta, bajar a Sonnet 4.5 o Haiku es el movimiento inmediato.

Método 2: Cambiar desde la Terminal (Claude Code)

Claude Code permite cambiar el modelo en cualquier momento de la sesión sin salir ni reiniciar.

Durante una sesión activa, usar el comando /model seguido del identificador:

/model claude-sonnet-4-5-20250929
/model claude-opus-4-5-20251101
/model claude-haiku-4-5-20251001

El cambio es inmediato. La respuesta siguiente ya usa el modelo indicado.

Al iniciar una sesión nueva, pasarlo como flag:

claude --model claude-sonnet-4-5-20250929
claude --model claude-opus-4-5-20251101
claude --model claude-haiku-4-5-20251001

Para confirmar qué modelo está activo, revisar la barra de estado inferior de la terminal. Muestra el modelo actual junto al tamaño del contexto y el porcentaje de uso. Ejemplo de lo que aparece:

sonnet-4 · 1M ctx · 67%

Si el porcentaje de contexto es alto y la respuesta se siente degradada, cambiar de modelo y abrir un nuevo contexto es la solución más efectiva.

Método 3: Fijar Modelo en Subagentes

Para quienes usan Claude Code con subagentes definidos en archivos .claude/agents/*.md, el modelo se puede fijar directamente en el frontmatter de cada agente:

---
model: sonnet
---

Esto elimina la variabilidad — el agente siempre usa el modelo especificado sin importar qué esté configurado como default en la sesión principal.

La lógica de asignación recomendada:

Tipo de tarea Modelo
Documentación, clasificación, listas Haiku
Código, análisis, edición, revisión Sonnet
Arquitectura de sistemas, investigación compleja Opus

Fijar el modelo por agente tiene una ventaja adicional: los costos son predecibles. Si un agente de documentación siempre usa Haiku, el gasto de tokens para esa tarea es constante y bajo.

Cuándo Aplicar Cada Uno

  • Saturación inmediata en la app: Método 1. Cambiar en el selector y continuar.
  • Sesión de trabajo en Claude Code: Método 2 con /model durante la sesión, o --model al arrancar si ya sabés qué modelo querés.
  • Workflows automatizados con subagentes: Método 3. Fijar en frontmatter para que cada agente opere con el modelo correcto sin intervención manual.

El principio que une los tres: modelo nuevo lento significa cambiar al anterior. En casi todos los casos el resultado mejora y el gasto de tokens baja. No hay razón para quedarse esperando.

📎