RUMAZA Studio
IA para empresas

RAG: que la IA responda con tus documentos, citando la fuente

Sin RAG, el modelo inventa. Con RAG bien hecho, busca en tu conocimiento, cita el párrafo y dice «no lo sé» cuando no hay evidencia.

El problema

Tu empresa tiene años de documentación: manuales técnicos, contratos, propuestas comerciales, procedimientos internos, actas y políticas. Pero encontrar la respuesta correcta sigue siendo buscar en carpetas, preguntar en Slack o interrumpir al compañero que «lo sabe».

Los LLM genéricos responden con seguridad aunque no tengan tus datos. Piden a ChatGPT algo sobre tu producto y obtienen una respuesta plausible pero falsa. Eso en soporte externo genera reclamaciones; en legal o compliance, riesgo real.

Los buscadores clásicos devuelven enlaces, no respuestas. El empleado abre diez PDFs para encontrar un párrafo. El tiempo perdido se multiplica por cada consulta repetida en ventas, soporte e ingeniería.

Subir todos los PDFs a un chat «enterprise» sin arquitectura suele fallar: documentos desactualizados, permisos mal configurados, respuestas sin cita y sin forma de auditar qué fragmento usó el modelo.

RAG no es magia. Mal implementado —chunks cortos, embeddings baratos, sin control de acceso— sigue alucinando o filtra información confidencial al usuario equivocado.

El coste de «no encontrar» también es medible: propuestas comerciales que tardan días porque naden localiza el caso similar, ingenieros que reimplementan soluciones ya documentadas, auditorías que fallan por versión incorrecta del procedimiento.

Muchas empresas intentaron «subir PDFs a ChatGPT». Funciona para una prueba; en producción falla por límites de contexto, sin permisos granulares y sin forma de saber si la respuesta viene del manual de 2021 o del 2024.

El cambio organizativo importa: soporte, IT y negocio deben acordar qué se automatiza y qué requiere criterio humano. Sin ese acuerdo, el proyecto genera fricción interna aunque la tecnología funcione.

Conocimiento tribal en Slack o Teams no está indexado: decisiones importantes nunca llegaron al PDF oficial. RAG sin cultura de documentar sigue incompleto.

Multilingüe: manuales en inglés y consultas en español exigen embeddings y reranking que no asuman un solo idioma.

Documentos escaneados con mala calidad bajan precisión de forma brutal. Invertir en digitalización nativa o OCR de calidad antes de RAG ahorra frustración.

RUMAZA no vende licencias: construye sistema que puedes medir, mantener y ampliar. Si el núcleo del problema no es automatizable con datos disponibles, te lo decimos en la primera reunión —ahorro de meses y de presupuesto.

Propiedad intelectual y confidencialidad: contratos con cláusulas de no divulgación exigen que el índice viva en infra controlada y con cifrado en reposo.

Respuestas contradictorias entre dos documentos: el sistema debe señalar conflicto o priorizar versión vigente por metadata de fecha.

Comparar tres presupuestos sin especificación común es inútil: alcance, integraciones y métricas de aceptación deben ser idénticos para decidir con criterio.

Sin dueño del corpus documental, el índice se pudre en seis meses. Designar responsable por área que valide altas y bajas de documentos.

Iteración con datos reales de la primera quincena en producción: ajuste de umbrales, prompts y reglas con métricas del cliente, no suposiciones del laboratorio.

El éxito del proyecto se define en la reunión de kickoff: volumen base, tiempo actual por caso, tasa de error manual y coste hora —con eso calculamos ROI antes de escribir una línea de código.

Formación al cierre: no entregamos software que solo IT entiende. El usuario de negocio sabe usar, escalar y reportar incidencias con capturas y ejemplos reales de su día a día.

Qué es RAG (sin humo)

RAG (Retrieval Augmented Generation) es una arquitectura: cuando llega una pregunta, el sistema busca los fragmentos más relevantes en tu base documental, los inyecta como contexto al modelo de lenguaje y este redacta la respuesta basándose solo en ese material.

El flujo técnico: ingestión de documentos → troceo (chunking) → embeddings → índice vectorial → búsqueda semántica → reranking → prompt con contexto → respuesta con citas.

La clave no es el modelo más caro. Es la calidad del índice: documentos actualizados, metadatos (versión, departamento, permisos), chunking adecuado y evaluación continua de precisión.

RAG permite decir «según el manual v3.2, sección 4.1…» con enlace al PDF original. Si no hay evidencia suficiente, el sistema responde que no encuentra información —comportamiento que hay que diseñar explícitamente.

Se combina con control de acceso: un comercial no ve contratos de RRHH; un externo no ve nada interno. Los permisos viven en el índice, no solo en la interfaz.

Componentes que marcan la diferencia: reranking (reordenar fragmentos recuperados), híbrido keyword + vectorial, metadata filtering por departamento y evaluación continua con preguntas de usuarios reales.

RAG no sustituye al experto en temas críticos; le quita fricción en la búsqueda. El ingeniero senior sigue validando; pero encuentra la sección relevante en segundos en lugar de abrir quince PDFs.

Coste operativo: embeddings + almacenamiento + consultas. En corpora de miles de documentos sigue siendo órdenes de magnitud más barato que horas de salario buscando mal.

Despliegue gradual: piloto con un canal o un tipo de consulta, medición dos semanas, ampliación por datos —no big bang que satura al equipo y al cliente.

Chunking inteligente respeta secciones, tablas y listas numeradas. Trocear a ciegas parte tablas de precios y genera respuestas incorrectas.

Cache de consultas frecuentes reduce coste y latencia sin sacrificar actualización cuando cambia el documento fuente.

Grounding estricto: el prompt obliga a citar fragmento o responder que no hay información. Configuración por defecto en RUMAZA, no opcional.

Criterio RUMAZA: problema concreto, dato accesible, métrica de éxito y alcance cerrado. Sin esos cuatro pilares, no hay proyecto —hay experimento que factura bien al consultor y mal al cliente.

Tablas y figuras en PDF requieren extracción especial; a veces híbrido con búsqueda por página y caption para no perder números críticos.

API para terceros: otros sistemas consumen búsqueda semántica sin pasar por chat —útil para portales internos.

El mantenimiento evolutivo —nuevos intents, proveedores, idiomas— se presupuesta aparte del MVP para que no haya sorpresas ni proyecto zombie.

Búsqueda híbrida lexical + vectorial mejora recall en códigos de producto, SKU y referencias legales exactas.

Soporte post-lanzamiento con canal directo y SLA acordado: incidencias críticas en horario laborable resueltas en el día —no ticket eterno.

Documentamos supuestos, límites conocidos y plan de ampliación en la entrega —transparencia total sobre qué hace el sistema hoy y qué queda para una fase dos si los números lo justifican.

Arquitectura preparada para ampliar: nuevos canales, idiomas o documentos sin rehacer desde cero —extensión modular, no monolito frágil.

Alineación con seguridad y legal desde el diseño: DPIA cuando aplica, registro de actividades de tratamiento y cláusulas con subencargados de modelos cloud.

Cuándo tiene sentido

Criterios
  • Más de 100 documentos que el equipo consulta a diario
  • Respuestas incorrectas por información desactualizada o inexistente
  • Onboarding lento porque «está en algún sitio»
  • Soporte técnico con manuales extensos y versiones múltiples
  • Necesitas citar fuente por compliance o auditoría
  • Quieres un copiloto interno antes de un agente con acciones

Qué se puede construir

01

Asistente de documentación técnica

Ingenieros preguntan en lenguaje natural; el sistema busca en manuales y fichas, responde con citas y enlaza al PDF. Incluye logs, umbrales de confianza y revisión humana en la fase inicial hasta calibrar métricas en producción.

02

Copiloto comercial

Busca en propuestas ganadas, casos de éxito y pricing interno. Acelera borradores sin inventar condiciones. Incluye logs, umbrales de confianza y revisión humana en la fase inicial hasta calibrar métricas en producción.

03

FAQ inteligente para soporte

Agentes consultan políticas y procedimientos; respuesta unificada con versión vigente del documento. Incluye logs, umbrales de confianza y revisión humana en la fase inicial hasta calibrar métricas en producción.

04

Buscador semántico corporativo

Reemplaza o complementa búsqueda por keywords con comprensión de intención y filtros por área y fecha. Incluye logs, umbrales de confianza y revisión humana en la fase inicial hasta calibrar métricas en producción.

Cómo lo construiría RUMAZA

01
Inventario documental
Qué fuentes, formatos, frecuencia de actualización y quién puede ver qué. Entregable documentado y revisado contigo antes del siguiente paso.
02
Pipeline de ingestión
Extracción de texto, limpieza, chunking, metadatos y versionado. Entregable documentado y revisado contigo antes del siguiente paso.
03
Índice vectorial
Embeddings, base vectorial (pgvector, Pinecone, etc.) y reranking para precisión. Entregable documentado y revisado contigo antes del siguiente paso.
04
Capa de permisos
Filtrado por usuario, rol y sensibilidad antes de llegar al modelo. Entregable documentado y revisado contigo antes del siguiente paso.
05
Interfaz y citas
Chat o búsqueda con fragmentos citados y enlace al documento fuente. Entregable documentado y revisado contigo antes del siguiente paso.
06
Evaluación
Set de preguntas reales, métricas de precisión y revisión de respuestas fallidas. Entregable documentado y revisado contigo antes del siguiente paso.

Tecnologías posibles

  • Python
  • LangChain / LlamaIndex
  • OpenAI / Anthropic embeddings
  • PostgreSQL + pgvector
  • Pinecone / Weaviate
  • Unstructured / PyMuPDF
  • FastAPI
  • Redis

Escenarios de aplicación

Escenario 1

Documentación interna difícil de encontrar

Manuales, políticas, contratos tipo y procedimientos en carpetas o PDFs. RAG ayuda a buscar por significado, no solo por nombre de archivo.

Escenario 2

Versiones mezcladas del mismo documento

Varias personas guardan «la plantilla buena» en sitios distintos. Encaja indexar solo fuentes oficiales y marcar vigencia antes de responder.

Escenario 3

Onboarding lento de nuevos empleados

Preguntas repetidas sobre cómo hacer X en la empresa. Un asistente sobre documentación interna reduce dependencia de una sola persona experta.

Errores habituales

Evitar
  • Indexar todo sin limpiar versiones obsoletas
  • Chunks demasiado pequeños o grandes que pierden contexto
  • No evaluar con preguntas reales del negocio
  • Ignorar permisos: mismo índice para todos los roles
  • Confiar en la respuesta sin mostrar citas al usuario
  • No planificar reindexado cuando cambian documentos críticos
  • No revisar el proyecto a los 90 días con métricas reales y ajustar o cerrar lo que no aporta.

Preguntas frecuentes

¿RAG sustituye a entrenar un modelo propio?

En la mayoría de casos empresariales, sí. Es más barato, actualizable y auditable que fine-tuning para conocimiento documental. Esto lo definimos en alcance según tus sistemas, volumen y restricciones legales —sin prometer cifras genéricas.

¿Funciona con PDF escaneados?

Sí con OCR de calidad. Aumenta coste de ingestión y puede bajar precisión. Priorizamos fuentes con texto nativo. Esto lo definimos en alcance según tus sistemas, volumen y restricciones legales —sin prometer cifras genéricas.

¿Qué precisión puedo esperar?

Depende de la calidad documental. Con buen pipeline, 70–85 % en preguntas bien acotadas. Lo medimos en evaluación, no se promete al 99 %. Esto lo definimos en alcance según tus sistemas, volumen y restricciones legales —sin prometer cifras genéricas.

¿Los datos salen de mi servidor?

Podemos usar modelos cloud con DPA o modelos locales si la política lo exige. El índice vectorial puede vivir en tu infraestructura. Esto lo definimos en alcance según tus sistemas, volumen y restricciones legales —sin prometer cifras genéricas.

¿Cuánto tarda en estar operativo?

MVP con un corpus acotado: 4–6 semanas. Incluye ingestión, índice, interfaz básica y evaluación inicial. Esto lo definimos en alcance según tus sistemas, volumen y restricciones legales —sin prometer cifras genéricas.

¿Se integra con SharePoint o Google Drive?

Sí. Conectores para sincronizar y reindexar cuando cambian archivos. Esto lo definimos en alcance según tus sistemas, volumen y restricciones legales —sin prometer cifras genéricas.

Guías relacionadas

Actualizado: 2026-06-29 · Autor: Rubén Maestre

¿Tu equipo pierde horas buscando en documentos?

Cuéntame qué fuentes tienes y quién pregunta qué. Te propongo arquitectura RAG con alcance medible.