La barrera para convertirse en AI engineer no es el precio de un bootcamp de $2,000 — es saber qué construir y cómo demostrarlo. Cinco repositorios de GitHub cubren exactamente la misma ruta de aprendizaje: modelo local, framework de integración, RAG con documentos propios, equipos de agentes y portafolio real. Esta guía detalla la instalación, los primeros scripts y una ruta de cinco semanas para llegar de cero a un asistente funcional publicado.
Un AI engineer no es lo mismo que un ML engineer. El que entrena modelos desde cero necesita matemáticas avanzadas y hardware caro. El AI engineer agarra modelos que ya existen — Llama, Claude, GPT — y los conecta con apps, datos y procesos reales. Es ensamblar piezas, no fabricarlas.
El trabajo diario es escribir prompts, conectar APIs, meter documentos a un sistema de búsqueda, armar agentes que automatizan tareas y ajustar reglas. La mayoría es código que pega cosas — y eso se aprende rápido con los repos correctos.
En salarios: las vacantes de AI engineer en Latinoamérica para trabajo remoto empiezan entre $2,000 y $4,000 USD al mes. Roles junior en empresas de Estados Unidos arrancan en $100,000 al año. La barrera real no es el dinero del bootcamp — es tener algo funcionando para mostrar.
La progresión replica la de cualquier curso pago: primero ejecutas un modelo, después lo conectas con código, después le metes tus datos, después armas equipos de agentes, y al final tienes ejemplos reales para tu portafolio.
| Repo | Estrellas | Función |
|---|---|---|
| Ollama | 170k | Tu modelo corriendo en tu computadora |
| LangChain | 135k | El pegamento entre el modelo y tus apps |
| LlamaIndex | 48k | RAG: responde con tus propios documentos |
| CrewAI | 49k | Equipos de agentes con roles distintos |
| Awesome LLM Apps | 107k | +100 apps listas para clonar |
LLM — Un cerebro entrenado con millones de textos. Le hablas en texto y responde en texto. ChatGPT, Claude, Llama y Gemini son todos LLMs.
RAG (Retrieval-Augmented Generation) — Truco para que el modelo responda con tus documentos en vez de inventar. Primero busca en tus archivos, después responde citando lo que encontró.
Agente — Un modelo con un objetivo y herramientas. No solo responde — actúa. Manda correos, abre páginas, ejecuta comandos.
Embedding — Traducción del texto a números que permite comparar significados entre fragmentos. Es la base técnica de RAG.
Framework — Un estuche con piezas estándar para no empezar desde cero. LangChain es un framework: te da los bloques que casi todos los proyectos de IA necesitan.
MCP (Model Context Protocol) — El estándar para conectar modelos con herramientas externas: Gmail, Notion, bases de datos. Relevante cuando combines varios repos.
Token — La unidad mínima del texto para el modelo. Equivale a unas 4 letras. Las APIs cobran por tokens; con Ollama en local no pagas nada.
Qué hace: instala y corre modelos abiertos como Llama 3, Mistral o Qwen directamente en tu máquina. Sin tarjeta, sin renta mensual, sin internet siquiera una vez descargado el modelo.
El problema que resuelve: antes, para tu primera línea de código con IA, tenías que pagar una API o configurar un servidor en la nube. Ollama te entrega el modelo en tu disco y le hablas como si fuera ChatGPT — pero gratis y privado.
Qué construyes: tu primer chatbot offline, un asistente que vive en la terminal, o el motor que después conectas con el resto del stack.
Instalación:
curl -fsSL https://ollama.com/install.sh | sh && ollama run llama3.2
Primer prompt para probar el modelo:
Explícame, como si tuviera 8 años, qué es un modelo de lenguaje
y por qué puedes correrme en una computadora normal sin pedir
permiso a nadie.
Qué hace: te da los bloques estándar para conectar cualquier LLM con cualquier fuente de datos, herramienta externa o lógica de negocio. Aparece como requisito en casi todas las vacantes de AI engineer.
El problema que resuelve: sin LangChain, tu código queda amarrado a un solo modelo. Cuando mañana sale uno mejor, empiezas de cero. Con LangChain, cambias un import y listo.
Qué construyes: asistentes que leen tu calendario, agentes que llaman APIs, chatbots con memoria que recuerdan toda la conversación, automatizaciones que mezclan texto y datos reales.
Instalación:
pip install langchain langchain-community langchain-ollama
Primera cadena funcional — guarda como primer_chain.py y corre con python primer_chain.py:
from langchain_ollama import OllamaLLM
from langchain_core.prompts import ChatPromptTemplate
modelo = OllamaLLM(model="llama3.2")
prompt = ChatPromptTemplate.from_template(
"Explica {tema} en una frase simple, como para un niño."
)
cadena = prompt | modelo
print(cadena.invoke({"tema": "qué es una API"}))
Qué hace: lee tus archivos (PDF, Word, Markdown, Notion, bases de datos), los rebana en pedazos pequeños, los indexa como embeddings y se los pasa al modelo cuando le preguntas algo relacionado. Esto es RAG.
El problema que resuelve: los modelos no conocen tus documentos privados. Sin RAG, inventan respuestas que suenan bien pero son falsas. Con LlamaIndex, responden con datos reales tuyos.
Qué construyes: un chat sobre los contratos de tu empresa, un asistente que busca en tu wiki interna, un buscador inteligente sobre una carpeta de PDFs, soporte que responde con tu base de conocimiento.
Instalación:
pip install llama-index llama-index-llms-ollama llama-index-embeddings-ollama
RAG sobre una carpeta de PDFs — crea la carpeta mis_pdfs con tus documentos antes de correr:
from llama_index.core import VectorStoreIndex, SimpleDirectoryReader, Settings
from llama_index.llms.ollama import Ollama
from llama_index.embeddings.ollama import OllamaEmbedding
Settings.llm = Ollama(model="llama3.2", request_timeout=60)
Settings.embed_model = OllamaEmbedding(model_name="nomic-embed-text")
documentos = SimpleDirectoryReader("./mis_pdfs").load_data()
indice = VectorStoreIndex.from_documents(documentos)
motor = indice.as_query_engine()
respuesta = motor.query("Resume el documento principal en 5 puntos.")
print(respuesta)
Qué hace: permite definir varios agentes especializados, pasarles una meta común y dejar que se entreguen información entre sí hasta cerrar la tarea. Un agente investiga, otro escribe, un tercero revisa.
El problema que resuelve: un solo agente se ahoga con tareas grandes. Cinco agentes especializados terminan en minutos lo que tú harías en horas.
Qué construyes: equipos que escriben artículos enteros (busca, redacta, corrige), agentes de soporte que escalan tickets, equipos de análisis financiero, ciclos completos de creación de contenido.
Instalación:
pip install 'crewai[tools]'
Primer equipo: investigador + escritor de noticias:
from crewai import Agent, Task, Crew, LLM
llm_local = LLM(model="ollama/llama3.2", base_url="http://localhost:11434")
investigador = Agent(
role="Investigador",
goal="Encontrar las 3 noticias más recientes sobre IA",
backstory="Eres un periodista experto en tecnología.",
llm=llm_local,
)
escritor = Agent(
role="Escritor",
goal="Convertir las noticias en un resumen breve para principiantes",
backstory="Escribes claro y sin jergas.",
llm=llm_local,
)
tarea_invest = Task(
description="Busca y lista 3 noticias frescas de IA con su fuente.",
expected_output="Lista de 3 noticias con titular y fuente.",
agent=investigador,
)
tarea_redaccion = Task(
description="Redacta un resumen de 200 palabras con esas 3 noticias.",
expected_output="Resumen de 200 palabras en español sencillo.",
agent=escritor,
)
equipo = Crew(agents=[investigador, escritor], tasks=[tarea_invest, tarea_redaccion])
print(equipo.kickoff())
Qué hace: más de 100 aplicaciones de IA completas y listas para usar, agrupadas por categoría — agentes, RAG, multi-agente, voz, finanzas, salud y más. Cada una tiene su código e instalación.
El problema que resuelve: saber programar con IA pero no tener nada que enseñar es lo que frena en una entrevista. Este repo entrega 100 ideas con código completo.
Qué construyes: tu portafolio. Clonas una app, la personalizas con tu nicho, la subes a GitHub, la publicas en LinkedIn.
Clonar el repo:
git clone https://github.com/Shubhamsaboo/awesome-llm-apps.git
Prompt para que Claude Code te recomiende qué clonar — pégalo en Claude Code abierto dentro de la carpeta del repo:
Acabo de clonar el repo awesome-llm-apps en esta carpeta. Lee el README
principal y la lista de categorías. Luego recomiéndame las 3 apps más
fáciles de adaptar para alguien que recién empieza, considerando que mi
nicho es [TU NICHO — ejemplo: bienes raíces, fitness, consultoría].
Para cada una, dime:
1) qué hace en una frase simple
2) qué cambios mínimos necesito para que se vea de mi marca
3) qué tan rápido la puedo subir a mi portafolio
La trampa de cualquier bootcamp es ir demasiado rápido. La alternativa: una semana por repositorio, con una tarea concreta. Al cierre, tienes cinco repos públicos en tu GitHub — uno por herramienta — y un proyecto final que las junta a todas.
Semana 1 — Ollama Instala Ollama, baja Llama 3.2, hazle 10 preguntas distintas. Anota cómo responde, qué tan rápido y qué errores comete. El objetivo es perderle el miedo al modelo.
Semana 2 — LangChain Escribe 3 cadenas distintas: una que traduce, una que resume y una que responde preguntas con un prompt template. Súbelas a un repo nuevo en tu GitHub.
Semana 3 — LlamaIndex Mete 5 PDFs en una carpeta (manual, libro, notas, contratos, lo que sea). Indéxalos con LlamaIndex y arma un mini chat por consola que responda con base en ellos.
Semana 4 — CrewAI Define un equipo de 3 agentes (investigador, escritor, revisor) que produzca un artículo de blog completo sobre cualquier tema. Publica el artículo en LinkedIn como demo.
Semana 5 — Awesome LLM Apps Clona 2 apps del repo, personalízalas con tu nicho (cambia textos, colores y logo), súbelas a tu GitHub. Escribe un post en LinkedIn explicando qué hacen y qué aprendiste.
Consejo sobre visibilidad: cada viernes publica en LinkedIn lo que aprendiste esa semana — aunque sea una imagen del modelo respondiendo en tu terminal. Quien te va a contratar se entera de ti porque te ve construir, no porque te ve estudiar.
En la semana 6 combinas todo en un proyecto único: un asistente que corre 100% en tu computadora, lee tus documentos, responde con base en ellos y propone una próxima acción.
Paso 1 — Motor: corre ollama run llama3.2 en tu terminal y déjalo abierto en segundo plano.
Paso 2 — Datos: crea mis_pdfs con archivos de tu nicho e indéxalos con el snippet de LlamaIndex.
Paso 3 — Conexión: usa LangChain para encadenar pregunta del usuario → búsqueda en LlamaIndex → respuesta del modelo.
Paso 4 — Equipo: define tres agentes con CrewAI — uno busca en los documentos, otro responde, un tercero propone una próxima acción (cita, correo, agenda). Así dejas de ser un chat y te conviertes en un asistente que actúa.
Paso 5 — Interfaz: clona la app de chat más simple de Awesome LLM Apps (suelen ser Streamlit), pégale tu lógica de los pasos anteriores y reemplaza colores, logo y textos.
Paso 6 — Publicar: git init, primer commit, push. Después escribe un post en LinkedIn contando qué construiste, qué aprendiste y a quién le sirve. Eso es lo que ven los reclutadores.
La ruta no es lineal — úsala para identificar tu siguiente paso: