30+ APIs, agentes en paralelo, flujos de trabajo autónomos y la arquitectura detras de un negocio nativo de IA
| Término | En palabras simples |
|---|---|
| Orquestador | El Claude principal con el que hablas - planifica, delega en agentes e integra resultados |
| Subagente | Una instancia de Claude creada para trabajar en una tarea específica y devolver resultados al orquestador |
| Worktree | Una copia aislada de una rama de git - los agentes pueden trabajar sin conflictos de archivos |
| Hooks | Comandos de shell que se ejecutan automáticamente antes/después de que Claude use una herramienta (pre/post) |
| Cron | Una tarea programada que se ejecuta en un temporizador (por ejemplo, cada día a las 9am) |
| Webhook | Una URL que recibe datos cuando ocurre un evento (por ejemplo, un nuevo lead activa a Claude) |
| Servidor MCP personalizado | Un plugin que construyes tu mismo para dar a Claude acceso a cualquier sistema externo |
| Compresión de contexto | Cuando tu conversación se alarga, Claude resume los mensajes antiguos para liberar espacio |
| Enrutamiento de modelos | Usar diferentes modelos de IA para diferentes tareas: Haiku para volumen económico, Sonnet zona intermedia, Opus para planificación |
| Haiku / Sonnet / Opus | Los 3 niveles de Claude: Haiku = rápido y económico, Sonnet = equilibrado, Opus = más capaz y costoso |
| Fan-out / Fan-in | Crear muchos agentes en paralelo (fan-out) y luego recopilar todos los resultados (fan-in) |
| Pipeline | La salida del Agente A alimenta al Agente B, que alimenta al Agente C - cadena secuencial |
| R2 (Cloudflare) | Almacenamiento de objetos - aloja imágenes, archivos, clones de voz. Sin costos de salida |
| Workers (Cloudflare) | Funciones sin servidor en el borde - receptores de webhooks, proxies de API, activadores cron |
| KV Store | Almacenamiento clave-valor en Cloudflare - configuración rápida y almacenamiento de estado para Workers |
| LLM local | Un modelo de IA que se ejecuta en tu propia máquina - sin internet, sin costos de API, privacidad total |
La Guía de Inicio te dio 1-2 conexiones de API. Este módulo muestra lo que ocurre cuando conectas 30+. Cada conexión no es solo una función - es un multiplicador de capacidades. Claude deja de ser un chatbot y se convierte en un sistema operativo completo para tu negocio.
Genera copy, crea visuales, programa en múltiples plataformas, obtiene analíticas - todo desde un solo prompt en la terminal.
Seguimiento de palabras clave, análisis de backlinks, rastreo de sitios, verificación de citaciones - conectalos y una auditoría completa toma 90 segundos.
Encuentra prospectos, verifica emails, envía secuencias, gestiona tratos, agenda reuniones y extrae elementos de acción de llamadas.
Gestión de proyectos, mensajería de equipo, base de datos, facturación, disparadores de flujos de trabajo y notificaciones SMS.
Claude como cerebro, GPT para búsqueda/visión, Perplexity para citaciones, clonación de voz, video con IA, despliegues en el edge, funciones serverless.
Crea un .env en la raíz de tu workspace. Asegúrate de que esté en .gitignore. El orden no importa - Claude los lee todos:
Luego en cualquier sesión: source .env carga todo. Claude ahora puede llamar a cualquiera de estas.
Claude de un solo hilo es poderoso. Claude multi-agente es un equipo. No esperas a que una tarea termine antes de empezar la siguiente - estas ejecutando 5, 10 o 13 agentes en paralelo, cada uno siendo dueño de una parte diferente del trabajo.
| Concepto | Lo que Significa |
|---|---|
| Orquestador | El Claude principal con quien hablas. Planifica, delega, integra. |
| Subagente | Un Claude iniciado que trabaja en una tarea específica. Devuelve resultados al orquestador. |
| Agente en segundo plano | Un subagente que corre sin bloquearte. Recibes una notificación cuando termina. |
| Agente en primer plano | Un subagente que bloquea hasta completarse. Usalo cuando necesitas resultados antes del siguiente paso. |
| Agente en worktree | Un agente trabajando en una rama de git aislada. Sin conflictos de archivos con otros agentes. |
Aquí está cómo encajan las piezas visualmente. Tú hablas con el orquestador. El orquestador delega a agentes especializados, cada uno ejecutando el modelo adecuado para el trabajo:
Inicia N agentes para tareas independientes, espera a que todos retornen, integra resultados.
La salida del Agente A alimenta al Agente B, que alimenta al Agente C. Secuencial pero cada agente está especializado.
Agentes rápidos y económicos exploran opciones (Haiku), el orquestador decide la dirección (Sonnet/Opus), los agentes de ejecución construyen el producto final (Sonnet).
Claude Code responde a instrucciones de lanzamiento en lenguaje natural. Estos son los prompts que desencadenan la ejecución multi-agente:
No todas las tareas merecen el mismo cerebro. Enruta por costo y complejidad:
| Modelo | Nivel de Costo | Usar Para | Punto Optimo en Paralelo |
|---|---|---|---|
| Haiku | Más bajo | Transformaciones masivas, extracción, formato, limpieza de datos, resumenes | 10+ agentes |
| Sonnet | Medio | Escritura de calidad, auditorías, contenido para clientes, depuración | 3-5 agentes |
| Opus | Más alto | Estrategia, arquitectura, planificación compleja, razonamiento en múltiples pasos | 1-2 agentes |
Ajusta los valores para ver tu gasto estimado, el plan recomendado y la proyección de retorno.
Cuando tienes presupuesto de cómputo y una lista de trabajo desbloqueado, el modo plough maximiza la producción en paralelo:
| Agente | Tarea | Destino de Salida | Resultado |
|---|---|---|---|
| A | Documentos legales v2 | output/agent-a/ | Politica de privacidad (235 líneas) |
| B | Manual de operaciones | docs/ops-runbook.md | Fallo a mitad |
| C | Biblioteca de pitches | docs/pitch-library.md | 1.443 líneas, 10 secciones |
| D | Calendario de contenido v2 | output/agent-d/ | Plan de 30 días (711 líneas) |
| E | Script semana 1 | docs/week1-script.md | Fallo a mitad |
3 de 5 produjeron salida limpia. 2 fallaron. Ese es el riesgo del paralelo - y por eso commiteas por agente. Los 3 que aterrizaron = 2.389 líneas de contenido entregable en una sola sesión.
Los skills convierten tareas repetitivas en flujos de trabajo de un solo comando. En vez de explicar lo que quieres cada vez, escribes /weekly-report y Claude ejecuta todo el playbook. Un workspace maduro tiene 30-55+ skills que cubren cada tarea recurrente.
| Campo | Lo que Hace | Ejemplo |
|---|---|---|
name | El disparador del slash command | /weekly-report |
description | Se muestra al explorar los skills disponibles con / | "Genera un resumen semanal de rendimiento del cliente" |
model | Qué modelo ejecuta el skill al momento de correrlo | claude-haiku-4-5-20251001 |
Los skills pueden llamar a otros skills. Un skill de reporte mensual podría llamar internamente al skill de extracción de datos, luego al de formato, luego al de entrega:
El modelo en el frontmatter determina que Claude ejecuta el skill al correrlo. Ajusta el modelo a la complejidad de la tarea:
| Tipo de Skill | Modelo | Por que |
|---|---|---|
| Extracción de datos, formato, limpieza | Haiku | Rápido, económico, no requiere criterio |
| Auditorías, reportes, contenido para clientes | Sonnet | Requiere criterio de calidad |
| Estrategia, arquitectura, planificación compleja | Opus | Se necesita razonamiento profundo |
| Transformaciones masivas (100+ elementos) | Haiku | Control de costos a escala |
Antes de construir algo complejo, usa /plan para que Claude elabore un plan estructurado antes de ejecutar. El modo plan obliga a Claude a pensar antes de actuar:
Claude producira un plan numerado con destinos de archivos, dependencias y pasos estimados. Revisalo, apruebalo y luego Claude ejecuta. Esto evita gastar cómputo en construcciones en la dirección equivocada.
Los hooks te permiten ejecutar comandos de shell o scripts automáticamente antes o después de que Claude use cualquier herramienta. Se configuran en .claude/settings.json y se ejecutan al nivel del harness, lo que significa que corren independientemente del skill o conversación activa.
| Tipo de Hook | Cuando se Ejecuta | Uso de Ejemplo |
|---|---|---|
PreToolUse | Antes de que Claude llame a cualquier herramienta | Registrar lo que Claude está por hacer |
PostToolUse | Después de que Claude llama a cualquier herramienta | Auto-commitear después de cada escritura de archivo |
Stop | Cuando Claude termina una respuesta | Enviar notificación a Slack cuando una tarea se completa |
Notification | Cuando Claude tiene una actualización en segundo plano | Alertar cuando un agente de larga ejecución termina |
PostToolUse en Write que prepara archivos automáticamente después de que Claude los escribe. Combinalo con un hook de commit periódico y nunca volverás a perder trabajo. Configuralo una vez y protege cada sesión desde ese momento.
Aquí es donde Claude pasa de ser una "herramienta que usas" a "un sistema que opera". Los flujos de trabajo autónomos se ejecutan sin que estes observando, reportan cuando terminan y pueden dispararse desde eventos del mundo real.
Hay tres patrones principales para el trabajo autónomo. Cada uno se adapta a un tipo diferente de tarea:
El comando /loop le dice a Claude que repita una tarea en un horario. Claude establece su propio ritmo: elige el intervalo correcto entre iteraciones según lo que está esperando.
Entender cuándo usar agentes en primer plano vs segundo plano es la diferencia entre trabajo eficiente y trabajo desperdiciado.
| Modo | Comportamiento | Usar Cuando |
|---|---|---|
| Primer plano | Bloquea tu chat - esperas hasta que termina | Necesitas el resultado antes de tu siguiente paso. Dependencias secuenciales. |
| Segundo plano | Corre independientemente - te notifica cuando termina | Tienes otro trabajo que hacer en paralelo. Sin dependencia de la salida ahora mismo. |
Los agentes en segundo plano pueden y de hecho fallan. Los tres modos de falla más comunes:
Las automatizaciones más poderosas no están programadas - son disparadas. Algo sucede, Claude responde.
| Disparador | Lo que Hace Claude | Ejemplo |
|---|---|---|
| Nuevo prospecto en CRM | Ejecuta análisis, construye pitch deck, redacta email de alcance | Webhook de HubSpot → pipeline de Claude |
| Email de cliente recibido | Resumir, categorizar, redactar respuesta | Watch de Gmail → skill de triaje de Claude |
| Envío de formulario | Extraer datos, actualizar rastreador, enviar confirmación | Webhook de Typeform → Sheets + Gmail |
| Cron programado (9am diario) | Obtener métricas de ayer, marcar anomalias, enviar resumen | Cron → Claude → Slack |
| Archivo agregado a Drive | Procesar, etiquetar, mover a la ubicación correcta | Watch de Drive → organizador de Claude |
| Pago recibido | Actualizar registro de cliente, disparar secuencia de onboarding | Webhook de Stripe → Claude → CRM |
Para sistemas de agentes con muchos componentes, construye un monitor de heartbeat. Cada agente escribe una marca de tiempo en su registro de seguimiento. Un monitor verifica: si el último heartbeat tiene más de 5 minutos, alertar.
Si la tasa de errores supera un umbral en una ventana de tiempo, pausar todas las operaciones automatizadas y notificar. Esto evita costos descontrolados y fallos en cascada.
Si una fuente de datos premium falla, produce la salida con los datos disponibles. Marca claramente los vacios en lugar de fallar toda la tarea. Cadenas de respaldo de API: si la fuente A está caída, intenta con la B, luego con la C.
La memoria es lo que hace que Claude se sienta como un socio, no como una herramienta. A lo largo de cientos de sesiones, Claude recuerda tus preferencias, tus proyectos, tus decisiones, tus restricciones - todo almacenado como pequeños archivos markdown que se cargan al inicio de cada conversación.
| Tipo | Lo que Almacena | Ejemplo |
|---|---|---|
| Usuario | Quien eres, tu rol, preferencias | "Consultor senior, prefiere respuestas concisas, español latinoamericano, no le gusta la jerga" |
| Retroalimentación | Que hacer / no hacer (correcciones y confirmaciones) | "Nunca simular la base de datos en pruebas de integración" · "Siempre usar rutas absolutas de archivos" |
| Proyecto | Trabajo activo, decisiones, plazos | "Dashboard V1 en vivo, V2 planeado para el próximo sprint" · "Congelación de merges hasta el viernes" |
| Referencia | Donde encontrar cosas en sistemas externos | "Bugs del pipeline rastreados en Linear proyecto INGEST" · "Todas las claves API listadas en reference_apis.md" |
Estos cuatro tipos cubren diferentes alcances. Aquí está cómo se relacionan con las tres capas de contexto que Claude realmente usa:
MEMORY.md se carga en cada conversación. Es un índice, no contenido - cada entrada enlaza a un archivo detallado. Mantenlo bajo 200 líneas (cualquier cosa más alla se trunca por el cargador de contexto).
| Archivo | Proposito | Frecuencia de Cambio |
|---|---|---|
| CLAUDE.md | Identidad permanente del workspace y reglas | Raramente - solo cuando cambia el modelo de negocio |
| Archivos de memoria | Contexto en evolución, decisiones, estado | Semanalmente - actualizado a medida que los proyectos avanzan |
| Archivos de plan | Plan de ejecución de la tarea actual | Por sesión - desechable una vez completada la tarea |
No guardes detalles específicos de tareas en memoria - esos pertenecen al plan. La memoria es para cosas que importan entre sesiones.
| Zona | Quien la Ve | Que Va Aquí |
|---|---|---|
| Solo | Tu + Claude unicamente | Estrategia de negocio, finanzas, metas personales, decisiones sensibles |
| Compartida con socio | Tu + colaborador específico | Estado de proyecto compartido, decisiones conjuntas, entregables |
| Cara al cliente | Cualquiera que lea la salida | Solo contenido profesional y depurado - sin notas internas |
Una instancia de Claude puede jugar muchos roles. Pero una instancia de Claude con una persona específica - con experiencia en el dominio, estilo de comunicación y marcos de decisión integrados - produce una salida dramaticamente mejor que un prompt genérico. Piensa en ello como tener un equipo de especialistas, cada uno ajustado para su dominio.
Personalidad: metódico, minucioso, ligeramente escéptico. Presenta hallazgos con fuentes. Indica niveles de confianza en cada afirmación. Por defecto va a "esto es lo que dicen los datos" sobre "esto es lo que creo."
Usar para: investigación de mercado, análisis competitivo, auditorías basadas en datos, verificación de hechos, revisión de literatura, análisis de tendencias.
Personalidad: contundente, directo, alérgico al relleno. Escribe para el lector, no para el escritor. Varía el tono según el contexto - formal para propuestas, conversacional para emails, urgente para CTAs. Cada oración gana su lugar.
Usar para: secuencias de email, landing pages, propuestas, copy para redes sociales, copy de anuncios, estudios de caso, presentaciones.
Personalidad: pragmático, estructurado, piensa en sistemas y dependencias. Considera los casos extremos antes de construir. Prefiere soluciones simples que escalen sobre soluciones ingeniosas que fallan. Documenta las decisiones.
Usar para: decisiones de arquitectura, integraciones de API, diseño de automatización, esquema de base de datos, pipelines de despliegue, revisiones de código.
Personalidad: empático pero comercial. Piensa en términos de puntos de dolor, objeciones y disparadores de decisión. Enmarca todo desde la perspectiva del comprador. Nunca presiona - pero siempre avanza hacia una decisión.
Usar para: propuestas, manejo de objeciones, estrategia de precios, emails de ventas, preparación de llamadas de descubrimiento, secuencias de upsell, posicionamiento competitivo.
Las personas se implementan como prompts de sistema dentro de skills o como archivos de persona independientes:
También puedes cambiar de persona a mitad de la conversación:
MCP (Model Context Protocol) es el sistema de plugins nativo de Claude Code. Cada servidor MCP le da a Claude un nuevo conjunto de herramientas - leer Google Sheets, buscar en Drive, enviar mensajes de Slack, obtener páginas web - sin salir de la terminal.
Sin MCP, Claude lee y escribe archivos en tu workspace. Con MCP:
| Servidor MCP | Proveedor | Lo que Hace |
|---|---|---|
| Google Drive | Anthropic (integrado) | Leer/buscar archivos de Drive, Docs, Slides |
| Google Sheets | Anthropic (integrado) | Leer/escribir celdas y rangos de hojas de cálculo |
| Web Fetch | Integrado | Obtener cualquier URL, extraer contenido |
| Web Search | Integrado | Buscar en internet en tiempo real |
| Firecrawl | Comunidad | Rastreos profundos de sitios, extracción estructurada |
| Slack | Comunidad | Leer/enviar mensajes a canales |
| GitHub | Comunidad | Issues, PRs, búsqueda de código vía API |
Cada servidor MCP tipicamente necesita: un paquete npm o script local, autenticación (flujo OAuth o clave API) y una aprobación única cuando Claude lo usa por primera vez.
Los MCPs integrados cubren aproximadamente el 80% de los casos de uso comunes. Pero cuando necesitas que Claude hable con un sistema que no tiene un MCP existente - tu CRM, tus herramientas internas, una base de datos personalizada - construyes el tuyo. Un servidor MCP es simplemente un programa pequeno que expone herramientas a Claude vía un protocolo estándar.
La IA en la nube (Claude, GPT) es el motor principal. Pero hay escenarios donde ejecutar un modelo en tu propia máquina tiene sentido - privacidad, costo, trabajo sin conexión, o procesamiento masivo donde la calidad no es crítica. Esta sección cubre cuándo usar local, que herramientas usar y con que modelos comenzar.
| Escenario | Usar Local | Usar Nube (Claude) |
|---|---|---|
| Datos sensibles (médicos, legales, financieros) | Si | No |
| Trabajo sin conexión (vuelos, lugares remotos) | Si | No |
| Procesamiento masivo, bajo costo (miles de elementos) | Si | Tal vez |
| Razonamiento complejo y lógica de múltiples pasos | No | Si |
| Flujos de trabajo de múltiples pasos con uso de herramientas | No | Si |
| La calidad importa (cara al cliente, propuestas, estrategia) | No | Si |
Cada herramienta tiene un punto fuerte diferente. Elige según si prefieres la terminal, una interfaz visual, o la instalación más ligera posible:
| Herramienta | RAM Necesaria | GPU | Mejor Para |
|---|---|---|---|
| Ollama | 8GB+ | Opcional (ayuda) | Terminal primero, configuración simple, scripts |
| LM Studio | 8GB+ | Opcional | GUI, amigable para principiantes, explorar modelos |
| GPT4All | 4GB+ | No necesaria | Ligero, corre en casi cualquier máquina |
| Modelo | Tamaño | RAM | Bueno Para |
|---|---|---|---|
| Llama 3.1 8B | 4.7GB | 8GB | Tareas generales, resumen |
| Qwen 2.5 7B | 4.4GB | 8GB | Código, salida estructurada |
| Mistral 7B | 4.1GB | 8GB | Inferencia rápida, chat |
| Phi-3 Mini | 2.3GB | 4GB | Ultra ligero, respuestas rápidas |
| Gemma 2 9B | 5.4GB | 12GB | Mejor calidad a este tamaño |
Antes de Claude Code, una mañana típica lucía así: abrir Chrome, iniciar sesión en analíticas, cambiar a la plataforma de anuncios, abrir el rastreador de proyectos, revisar Slack, abrir el email, cambiar al CRM, abrir una hoja de cálculo, alt-tab 47 veces. Para las 10am no has hecho trabajo real.
Con Claude Code, todo el stack es accesible desde una sola ventana de terminal. Escribes lenguaje natural, Claude llama a las APIs y los resultados aparecen donde los necesitas. Sin cambio de pestañas. Sin cambio de contexto. Sin dashboards de SaaS compitiendo por tu atención.
Estos atajos hacen el flujo de trabajo en la terminal aún más rápido. Memoriza los que más uses:
| Acción | Mac | Windows |
|---|---|---|
| Captura de pantalla (completa) | Cmd+Shift+3 | Win+Shift+S |
| Captura de pantalla (área) | Cmd+Shift+4 | Win+Shift+S |
| Dictado por voz | Fn+Fn | Win+H |
| Historial de portapapeles | Instala Maccy o Raycast | Win+V |
| Lanzador de apps | Cmd+Space | Win+S |
| Selector de emoji | Cmd+Ctrl+Space | Win+. |
| Cambiar ventanas | Cmd+Tab | Alt+Tab |
| Pegar en terminal | Cmd+V | Ctrl+Shift+V |
| Limpiar terminal | Cmd+K | Ctrl+L |
Cloudflare es la capa de infraestructura que hace que todo lo que construyes sea accesible al mundo. Cinco servicios manejan el 90% de lo que necesitas - y todos funcionan desde la terminal vía wrangler, la herramienta CLI de Cloudflare.
Cloudflare Pages aloja sitios estáticos globalmente con HTTPS automático, dominios personalizados e invalidación de cache instantanea. Un comando despliega tu sitio en 300+ ubicaciones edge en todo el mundo.
Eso es todo. Tu sitio está en vivo. Pages detecta automáticamente la salida del build, la sube, asigna una URL .pages.dev y puedes adjuntar un dominio personalizado en el dashboard de Cloudflare o vía la API.
main dispara un nuevo despliegue automáticamente.Workers ejecuta JavaScript/TypeScript en el edge - sin servidores que gestionar, sin cold starts importantes. Perfecto para receptores de webhooks, proxies de API, disparadores cron y backends ligeros.
R2 es la respuesta de Cloudflare a S3 - sin tarifas de salida. Almacena imágenes, clones de voz, archivos grandes, activos de clientes, datos de respaldo. Accede vía Workers o URL directa.
El DNS de Cloudflare es el DNS autoritativo más rápido de internet. Una vez que tus dominios esten en Cloudflare, puedes gestionar registros desde la terminal, automatizar la creación de subdominios y obtener HTTPS automático en todo.
KV es un almacén de clave-valor global accesible desde Workers. Usalo para almacenar configuración, flags de funciones, estado de sesión, respuestas de API en cache, o cualquier dato pequeno que necesite ser rápido y disponible globalmente.
wrangler lo despliega, Cloudflare lo ejecuta globalmente. Esa es toda la capa de infraestructura para la mayoría de los negocios nativos de IA.
Cada pieza de trabajo sigue el mismo pipeline de 5 etapas, del código a la URL en vivo. Entender este pipeline significa que nunca volverás a preguntarte "cómo pongo esto frente a alguien."
El mismo pipeline aplica ya sea que estes lanzando un sitio de cliente, un dashboard interno, un reporte HTML o un deck de presentación. Aquí están los detalles de cada etapa:
| Etapa | Herramienta | Lo que Ocurre |
|---|---|---|
| Construir | Claude Code | Escribe el código, HTML o activos |
| Versionar | Git | Commit + push al repositorio |
| Desplegar | CF Pages o GH Pages | Auto-despliegue en push o manual wrangler pages deploy |
| Verificar | curl | Verificación HTTP 200 - no terminado hasta confirmar en vivo |
| Compartir | URL en Vivo | Enviar al cliente, interesado, o publicar |
curl devuelve HTTP 200 en la URL en vivo. Desplegar sin verificar es como se envian enlaces rotos a los clientes. Integra la verificación con curl en cada flujo de trabajo de despliegue.
Cada conversación de Claude Code tiene una ventana de contexto de aproximadamente 200.000 tokens (~150.000 palabras). Esto es enorme - pero no infinito. Entender cómo funciona y cuando se llena es la diferencia entre una sesión productiva de 3 horas y perder tu trabajo por compactación.
Todo en tu conversación ocupa contexto: tus mensajes, las respuestas de Claude, contenidos de archivos, llamadas a herramientas, resultados de herramientas, archivos de memoria, CLAUDE.md. A medida que la conversación crece, los mensajes más antiguos se comprimen o resumen para hacer espacio para los nuevos. Este proceso se llama compactación.
Una tarea por chat. No uses una sola conversación para la revisión de la campaña de anuncios de la mañana y el deck de pitches de la tarde. Comienza un nuevo chat para cada tarea distinta. Esto mantiene el contexto fresco y enfocado.
Cualquier cosa que necesite sobrevivir entre conversaciones va en un archivo de memoria. Cuando comienzas una nueva sesión, Claude recarga automáticamente todos los archivos de memoria. El estado persiste incluso si la conversación no.
CLAUDE.md carga primero en cada conversación. Pon tus reglas e identidad más importantes ahí. Es lo último que se compacta. Los archivos de memoria cargan después. Estructura tu sistema para que el contexto más crítico cargue primero.
Cuando Claude lee un archivo vía @file, procesa el contenido eficientemente. Cuando pegas el mismo contenido en el chat, ocupa contexto dos veces (tu mensaje + el contenido). Siempre referencia archivos en lugar de pegarlos.
Si el contexto se comprime y Claude pierde el rastro de lo que construyó, los archivos siguen seguros en disco (y en git). Los commits frecuentes significan que nunca pierdes trabajo, incluso si la conversación se degrada.
Antes de terminar una sesión, captura el estado actual: que se hizo, que está pendiente, decisiones clave tomadas, rutas de archivos importantes. Guarda esto como un archivo de reflexión en memoria. La próxima sesión retoma exactamente donde está término.
El movimiento realmente poderoso no es una conversación con Claude - son 5-6 ejecutandose simultaneamente, cada una trabajando en una pieza diferente del mismo proyecto. Así es como construyes en horas lo que tardaría días de forma secuencial.
Etiqueta cada chat para identificación instantanea: Chat-A: Datos, Chat-B: Diseño, Chat-C: Despliegue, Chat-D: Contenido, Chat-E: QA. El nombre clave va en el primer mensaje de cada chat para que puedas identificarlo desde la pestaña de VS Code.
Antes de lanzar chats en paralelo, asigna propiedad de archivos. Chat-A escribe en output/data/. Chat-B escribe en output/design/. Chat-C maneja deploy/. Sin excepciones.
Un chat es el orquestador. No produce archivos directamente - revisa la salida de otros chats, integra resultados, maneja superficies compartidas (MEMORY.md, plan maestro, commits de git) y resuelve conflictos.
Comienza el primer mensaje de cada chat paralelo con el nombre clave y la descripción para que las pestañas de VS Code sean inmediatamente identificables:
Cada chat produce sus propios commits. Si Chat-B falla, el trabajo de Chat-A y Chat-C ya está commiteado y seguro. Nunca agrupes todo el trabajo paralelo en un solo commit al final.
| Chat | Nombre Clave | Posee | Produce |
|---|---|---|---|
| A | DATOS | knowledge/, output/data/ | Perfiles de clientes, métricas extraidas, exportaciones CSV |
| B | DISENO | output/design/, templates/ | Plantillas HTML, CSS, activos visuales |
| C | DESPLIEGUE | deploy/, dist/ | Scripts de build, configs de wrangler, despliegues en vivo |
El chat principal (tu) revisa la salida de cada chat, ejecuta la etapa de integración y maneja el commit final + despliegue.
Los buenos prompts producen buena salida. Los grandes prompts producen salida que puedes lanzar sin editar. Estos 5 patrones son la diferencia entre "casi bien" y "exactamente correcto."
Apila rol + tarea + restricciones + formato de salida en un solo prompt estructurado. Cada capa estrecha el espacio de salida.
Obliga a Claude a mostrar su razonamiento antes de dar una respuesta. Esto atrapa errores que los prompts que saltan a la respuesta pierden.
Hace que Claude escriba un primer borrador, lo critique contra criterios específicos y luego produzca la versión final. El paso de crítica atrapa el 80% de los problemas de calidad.
Cuando necesitas salida legible por máquina o con formato consistente, específica la estructura exacta en el prompt.
En lugar de escribir el prompt tu mismo, pide a Claude que escriba el prompt. Esto funciona especialmente bien para flujos de trabajo complejos de múltiples pasos donde sabes el resultado deseado pero no la mejor forma de instruir a Claude.
La teoría es barata. Aquí hay 6 patrones reales que hemos ejecutado - generalizados pero con números reales.
Auditamos 9 clientes activos en visibilidad, salud técnica, backlinks y contenido en un solo sprint. Cada cliente recibio un deck completo de reportes HTML interactivos desplegado en una URL en vivo.
Desde una descripción de negocio de un parrafo hasta un sitio web completamente desplegado y responsivo con URL en vivo. Sin HTML manual. Sin FTP. Sin configuración de alojamiento.
curl devuelva 200 en la URL en vivoConstruimos un pipeline completo de contenido para una cadena de restaurantes: marco de estrategia, plantillas de carrusel, biblioteca de captions, calendario de publicación y skills de generación reutilizables. La ejecución semanal toma un prompt.
Construimos un pipeline local de clonación de voz con múltiples motores. Una muestra de audio de 60 segundos se convierte en una voz de marca reutilizable para landing pages, audio de onboarding y narración de video.
Generación de prospectos de extremo a extremo: identificación de prospectos, verificación de email, creación de secuencias personalizadas, carga de campañas y monitoreo de respuestas. El humano solo interviene cuando un prospecto responde positivamente.
Ingestamos masivamente una biblioteca profesional completa en una base de conocimiento estructurada y con búsqueda. Libros transcritos, cursos extraidos, feeds de podcasts monitoreados - todos alimentando un sistema de seguimiento con auto-sincronización.
Todos se topan con los mismos muros. Estos son los 7 errores más comunes - la mayoría los descubren de la manera difícil.
Lo que ocurre: Lanzaste 5 agentes Opus y quemaste tu presupuesto mensual en una tarde. Los agentes están ejecutandose, el trabajo está ocurriendo, y luego todo se detiene sin nada commiteado en disco.
Solución: doctrina de enrutamiento de modelos. Haiku para tareas masivas, Sonnet para juicios, Opus solo para planificación profunda y arquitectura. Antes de lanzar una sesión paralela, estima el costo mentalmente: cuántos agentes, que modelo, cuánto tiempo correra cada uno.
Establece un presupuesto mental por sesión antes de lanzar agentes. Si Opus cuesta 15x más que Haiku, preguntate si realmente necesitas ese nivel de razonamiento para esta tarea específica - la mayoría de las veces, no.
Lo que ocurre: El último en escribir gana. El Agente B termina y escribe su salida en el mismo archivo en que trabajaba el Agente A. Todo lo que produjo el Agente A es silenciosamente sobreescrito. No lo notas hasta que ves el archivo y te preguntas donde fue la mitad del contenido.
Solución: cada agente tiene un archivo o directorio de salida único. Antes de lanzar agentes en paralelo, asigna a cada uno una ruta de salida explícita y sin solapamiento. El Agente A escribe en output/agent-a/. El Agente B escribe en output/agent-b/. Nunca se solapan.
El Claude principal posee todas las superficies compartidas: el índice de memoria, el archivo de plan maestro, el índice de entregables, todos los commits de git. Los subagentes solo poseen sus directorios de salida designados.
Lo que ocurre: Abres Claude, comienzas a escribir tareas y obtienes salida competente pero genérica. Claude está escribiendo para un usuario hipotético, no para ti y tu negocio específico. Cada sesión comienza desde cero de contexto.
Solución: CLAUDE.md + memoria antes que cualquier cosa. La primera hora que inviertes en configurar tu identidad de workspace - quien eres, que haces, cuáles son tus restricciones, cuáles son tus preferencias - se paga de vuelta en cada conversación a partir de ese momento.
Escribe tu CLAUDE.md. Comienza tus archivos de memoria. Captura retroalimentación cuando Claude haga algo bien o mal. En una semana de uso consistente, la diferencia de calidad de salida entre un workspace configurado y uno sin configurar es notoria.
Lo que ocurre: Escribes preguntas, Claude las responde, copias las respuestas. Sin archivos. Sin memoria. Sin skills. Estas usando una interfaz de línea de comandos como un navegador web ligeramente más rápido.
Solución: construye skills para tareas recurrentes, usa referencias @file, deja que Claude lea tus documentos reales. El poder de Claude Code es que vive dentro de tu sistema de archivos. Puede leer tus perfiles de clientes, tus plantillas, tus datos - sin que pegues nada. Puede escribir archivos directamente en las carpetas correctas. Puede ejecutar scripts.
Si te encuentras copiando y pegando las mismas instrucciones en Claude más de dos veces, eso es un skill esperando ser escrito. Si te encuentras pegando contenido de documentos en el chat, esa es una referencia @file esperando ser usada.
Lo que ocurre: VS Code se cuelga. La ventana de contexto se comprime y el agente pierde el rastro de lo que construyó. Un agente en segundo plano agota el tiempo. Cierras la terminal por accidente. Si no has commiteado, se fue - o en el mejor caso, disperso en buffers sin guardar.
Solución: commitea después de cada salida significativa. Commits pequeños y frecuentes superan a un commit gigante al final de una sesión. Después de que un agente produzca un archivo, commitelo. Después de un hito clave, commitelo. Después de que un lote paralelo se complete, commitea la salida de cada agente por separado.
La regla general: si perder el trabajo desde tu último commit te haría frustrar, es hora de commitear ahora.
Lo que ocurre: Le das a un agente un prompt que intenta hacer todo: "construye el flujo de onboarding, actualiza el CRM, redacta la secuencia de bienvenida, crea la hoja de seguimiento y documenta el proceso." El agente produce salida mediocre en las 10 tareas y excelente en ninguna.
Solución: un entregable claro por agente. Estrecha el alcance, eleva la calidad. "Construye la secuencia de emails de bienvenida para nuevos clientes, 3 emails, guardado en templates/emails/onboarding/" es un mejor prompt que "maneja todo el tema del onboarding."
Si tienes 10 tareas, lanza 10 agentes con 10 briefs estrechos. Obtendras mejor salida en todas ellas que un agente intentando hacer malabarismos con todo a la vez.
Lo que ocurre: El agente dice "listo." Marcas la tarea como completada. Tres días después, un colega intenta acceder a la URL en vivo y obtiene un 404. O envias un reporte que aún tiene texto de marcador de posición. O el script desplegado tiene un error silencioso que solo aparece con datos reales.
Solución: "listo" significa desplegado y confirmado funcionando, no "el agente dijo que término." Haz curl a cada URL. Busca en cada archivo texto de marcador de posición. Verifica cada salida contra sus criterios de aceptación antes de marcar la tarea como completa.
Integra la verificación en tus flujos de trabajo: agrega un paso de QA después de cada despliegue, agrega un paso de verificación de marcadores después de cada generación de documento, agrega una verificación HTTP 200 después de cada lanzamiento de sitio. Que el agente termine no es la línea de meta - la salida verificada si lo es.
Todo lo anterior es lo que está funcionando hoy. Esto es lo que viene - y cómo posicionarte para usarlo en el momento en que llegue.
El Agent SDK de Anthropic te permite construir agentes personalizados que corren fuera de Claude Code. Piensa en ello como Claude-como-librería - escribes Python o TypeScript, llamas a la API de Claude y construyes agentes que:
Un enjambre es el estado final: una red de agentes donde la salida de cada agente es la entrada de otro. Sin humanos en el ciclo para operaciones de rutina.
Cuando el HTML plano no es suficiente pero Next.js es excesivo, Astro es el punto medio ideal. Es el framework que mejor se adapta a como Claude Code construye las cosas - limpio, rápido y configuración mínima.
| Framework | Mejor Para | Compatibilidad con Claude Code |
|---|---|---|
| Astro | Sitios de contenido, landing pages, blogs | Excelente - limpio, rápido, simple |
| Next.js | Apps web complejas, dashboards | Bueno - más sobrecarga de configuración |
| HTML Plano | Páginas puntuales, decks de presentación | Excelente - sin dependencias |
npm create astro@latest. Genera HTML estático por defecto (perfecto para Cloudflare Pages), soporta componentes cuando los necesitas y Claude Code genera código Astro limpio con alucinación mínima. Usa HTML plano para cosas puntuales, Astro para cualquier cosa que vayas a mantener o expandir.
| Hoy | 6 Meses | 12 Meses |
|---|---|---|
| Indicas a Claude que haga tareas | Los agentes manejan tareas de rutina autonomamente | Los enjambres ejecutan todo tu pipeline de entrega |
| Revisas cada salida | Solo revisas excepciones | Solo revisas la estrategia |
| 1 ventana de Claude a la vez | 5-6 chats en paralelo como rutina | Flota de agentes corriendo 24/7 |
| APIs llamadas manualmente | Pipelines disparados por eventos | Sistemas auto-reparables con cadenas de respaldo |
| Memoria entre sesiones | Memoria compartida entre equipos de agentes | Grafo de conocimiento organizacional |
Las herramientas existen hoy. La pregunta no es "podemos construir esto?" - es "que tan rápido podemos conectarlo?"
Todo en esta guía es una herramienta. Las herramientas no hacen dinero. Tu haces dinero aplicando herramientas a problemas que las personas pagarán para resolver. Aquí está cómo encontrar tu ventaja y monetizarla.
Tu ventaja injusta no es Claude Code - es tu experiencia en el dominio combinada con Claude Code. Un técnico puro puede construir la herramienta. Un experto en la industria pura puede identificar el problema. Tú puedes hacer ambos. Esa combinación es rara y valiosa.
Los servicios se venden más rápido que los productos. No construyas un SaaS el primer día. Empaqueta tu experiencia + IA en un servicio listo para usar primero:
Si Claude Code te permite entregar en 2 horas lo que solía tomar 20, no cobres por 2 horas. Cobra en función del valor que recibe el cliente. Un análisis competitivo que te toma 90 segundos generar (pero tardaría un día completo para un consultor) vale lo que el consultor cobra - o más, porque lo entregas más rápido.
Las personas que ganan con IA no son las que aprenden más herramientas. Son las que aplican la herramienta correcta a un problema real, rápido, y cobran por ello. Todo en esta guía existe para hacer ese ciclo - identificar problema, construir solución, entregar resultado, cobrar - tan corto como sea posible.
Agenda una llamada con Donal. En 30 minutos, obtendras una hoja de ruta personalizada para integrar Claude Code en tu negocio específico - incluyendo qué APIs conectar, que skills construir primero y cómo alcanzar el retorno en tu primer mes.
Agenda Tu Llamada de Plan Personalizado →Comienza con las guias gratuitas:
De Cero a Peligroso (Guía de Inicio) · Calculadora de Migración desde ChatGPT