Herramienta

Agent Browser: Navegación Web Eficiente para Claude Code

Las herramientas de navegación web tradicionales queman tokens a un ritmo insostenible — enviar capturas de pantalla completas consume hasta 3,000 tokens por acción. Agent Browser de Vercel Labs resuelve esto enviando solo una lista numerada de elementos interactivos, reduciendo el consumo a ~300 tokens por acción. Ideal para founders y equipos técnicos que automatizan auditorías, scraping de referencias o pruebas de flujos de compra.

1 fuente30 de junio de 2026

Agent Browser: Navegación Web Eficiente para Claude Code

El Problema que Resuelve

Las herramientas anteriores de navegación con IA (Playwright, Claude for Chrome) funcionan enviando capturas de pantalla completas de la página en cada acción. Cada paso consume ~3,000 tokens. En 10-15 minutos de uso real, el presupuesto de tokens se agota. Las páginas largas ni siquiera caben completas.

Agent Browser cambia el modelo: en lugar de enviar una imagen, envía una lista estructurada y numerada de los elementos interactivos de la página (botones, links, inputs). Eso reduce el consumo a ~300 tokens por acción — un orden de magnitud menor — y permite sesiones de automatización de horas, no minutos.

Dimensión Herramientas anteriores Agent Browser
Tokens por acción ~3,000 ~300
Duración práctica 10-15 min Horas
Velocidad Lento (procesa píxeles) Rápido (procesa texto)
Páginas largas No caben completas Cualquier longitud
Modo de operación Captura de pantalla Lista de elementos

Instalación

Opción recomendada — Decirle a Claude Code directamente:

"Quiero que instales Agent Browser de Vercel Labs. Lee el README, identifica el método de instalación correcto y verifica que funciona con una prueba en example.com."

Claude lee el repositorio, ejecuta los pasos e informa el resultado.

Opción manual:

npx skills add https://github.com/vercel-labs/agent-browser

Verificación: Pedirle a Claude que abra https://example.com y devuelva el título de la página. Si responde "Example Domain", la instalación fue exitosa.

Cinco Prompts Listos para Usar

1. Resumir un artículo o recurso

Usa Agent Browser para abrir [URL]. Devuelve 3 bullets con los puntos clave,
3 ítems accionables y marca cualquier exageración de marketing.

Útil para evaluar contenido sin copiar manualmente, procesar documentos internos en Google Docs o Notion, o monitorear blogs de competidores.

2. Auditoría de landing page

Entra a mi landing [URL] como visitante nuevo.
¿Qué entendés en los primeros 3 segundos? ¿Qué rompe?
Dame los 3 cambios concretos con mayor impacto en conversión.

No requiere acceso al código fuente. Funciona sobre cualquier URL pública.

3. Descarga de imágenes de referencia

Extrae la imagen hero y las imágenes de features de [URL].
Guardalas en /public/references/ con nombres descriptivos.

Sirve para recolectar referencias visuales de competidores o inspiración de diseño sin descargar manualmente una por una.

4. Llenado de formularios complejos

Completá este formulario [URL].
Antes de empezar, hacé un snapshot de todos los campos.
Completalos uno por uno y verificá cada uno.
No envíes hasta que yo confirme.

El paso de confirmación es importante: Agent Browser pausa antes de acciones irreversibles.

5. Testing de checkout

Completá el proceso de compra en [URL del producto].
Usá la tarjeta de prueba Stripe: 4242 4242 4242 4242.
Pausá antes del pago final y reportá todos los valores del resumen.

Permite verificar flujos de pago completos sin ejecutar transacciones reales.

Casos de Uso Prácticos

  • Automatización de paneles admin — Shopify, WordPress, Webflow: actualizaciones masivas que normalmente requieren clics manuales repetitivos
  • QA y debugging — Reproducir bugs navegando como usuario real, con reporte automático de cada paso
  • Monitoreo competitivo — Revisar precios, ofertas o cambios en landing pages de competidores de forma programática
  • Lectura de documentos internos — Acceder a Google Docs o Notion sin necesidad de exportar
  • Recolección de assets — Descargar imágenes, logos o recursos de sitios de referencia

Lo que NO Es

  • No es una extensión de Chrome — Opera un browser separado, no accede a las cookies ni sesiones del navegador personal
  • No reemplaza a Claude for Chrome — Para navegación pasiva y lectura casual, Claude for Chrome sigue siendo adecuado
  • No es magia con CAPTCHAs ni 2FA — Cuando encuentra estos bloqueos, pausa y le pide al usuario que resuelva manualmente

Contexto Técnico

  • Licencia Apache 2.0, código abierto
  • Creado por Vercel Labs, el mismo equipo que produce skills oficiales para Claude Code
  • Controla una instancia de browser separada, no el navegador activo del usuario
  • Funciona nativamente dentro del ecosistema de Claude Code, sin configuración adicional de APIs

Combinación con Otras Herramientas

La potencia real aparece cuando se combina con otras skills del ecosistema Vercel Labs. Ejemplos de flujos completos:

  • Auditoría continua de landing — Agent Browser extrae el contenido actual → otra skill analiza métricas → se genera reporte automático
  • Debugging end-to-end — El agente navega el flujo completo del usuario → detecta errores → reporta con contexto de cada paso
  • Monitoreo competitivo automatizado — Revisión periódica de URLs de competidores con alerta ante cambios

La combinación elimina tareas que antes requerían trabajo manual o integración de APIs dedicadas.

📎