Definición
RAG (Retrieval Augmented Generation) es una técnica que combina un LLM con una base de conocimiento externa: antes de responder, el sistema recupera documentos relevantes (de un vector store) y los pasa como contexto al LLM. Esto permite que el agente responda con datos privados o actualizados sin reentrenar el modelo. Es el patrón estándar para chatbots empresariales, soporte técnico y asistentes legales.
Ejemplo
Un chatbot de soporte que recupera manuales internos y responde con citas exactas.
Seguir leyendo
Términos relacionados.
IA
LLM
Modelo de lenguaje entrenado para entender y generar texto humano.
IA
Embeddings
Vectores que representan el significado de texto, imágenes o datos.
IA
Vector store
Base de datos optimizada para buscar vectores (embeddings) similares.
IA
Agente de IA
Sistema autónomo que usa un LLM para razonar y ejecutar tareas.
