Arquitectura del sistema
Descripción técnica de la infraestructura que impulsa el ecosistema Casa Islamica, conectando la ingeniería de datos con las aplicaciones del usuario final.
Motor de IA conversacional (v3.1)
Pipeline de Retrieval-Augmented Generation (RAG) multi-paso con routing semántico, fallback de precisión a fuente primaria y reranking con Cohere.
- ◆ Recibe la consulta del usuario vía Webhook e inicia la gestión de sesión.
- ◆ El Query Rewriter con LLM traduce y expande los términos de búsqueda.
- ◆ Detector de coincidencia exacta vía regex activa el routing especializado.
- ◆ Aplica filtros de dimensión dinámicos (ej. Marco legal, Teología, Filosofía).
- ◆ Búsqueda paralela en Pinecone y consulta directa al índice de manuscritos primarios.
- ◆ El Reranker de Cohere optimiza los Top K resultados para mayor precisión contextual.
- ◆ Formatea el contexto recuperado aplicando jerarquía de fuentes por tier.
- ◆ Inyecta el buffer de memoria de LangChain para contexto de conversaciones multi-turno.
- ◆ GPT-4o genera la respuesta respetando guardrails estrictos por dominio temático.
- ◆ Retorna el payload a la interfaz de usuario.
- ◆ Registra métricas de recuperación (F1, Precisión) en Google Sheets.
- ◆ Envía datos de interacción a Supabase y dispara notificaciones en Slack.
Clasificación automática del corpus (v3)
Sistema de procesamiento por lotes para ingestar PDFs sin estructura, extraer texto y aplicar etiquetado de metadatos con LLM para vectorización.
Itera sobre los PDFs en Google Drive. Descarga los archivos y ejecuta OCR/extracción de texto para generar los payloads de texto crudo.
Gemini 2.5 Flash analiza los textos completos para determinar la estrategia de chunking, el tier de fuente, las etiquetas de categoría y los patrones regex estructurales.
Parsea el output JSON, lo formatea en un schema estandarizado, agrega los metadatos al repositorio central y envía alertas de finalización.
Sistema de observabilidad y evaluación
Arquitectura de 4 capas construida para IA con alta exigencia de precisión. Separa la infraestructura transaccional del chat de la telemetría analítica, convirtiendo las revisiones de expertos en un dataset de entrenamiento RLHF.
N8N escribe el contexto completo de recuperación (18+ campos, incluyendo scores de reranking y snippets) en una tabla OLAP, permitiendo diagnóstico de causa raíz entre fallos de generación y de recuperación.
El frontend React captura feedback estructurado. La distinción estricta entre 'no útil' (fallo de UX) y 'error' (desinformación teológica) envía los casos de alta severidad a una cola prioritaria.
Panel de administración con scoring aislado por administrador. Utiliza un rubric de 4 categorías donde un score ternario de 'Corrección' controla automáticamente el veredicto final, evitando etiquetas de entrenamiento contradictorias.
Agrega los logs revisados en un dataset de 30 campos. Preserva los metadatos de recuperación, la identidad del anotador y los detalles completos del rubric para entrenar futuros reward models.
Lógica de orquestación
Ejecución a nivel de nodo, mapeada directamente desde las capas de orquestación n8n. Organizada por etapa arquitectural para destacar los gates de decisión, la gestión de restricciones y la mutación de datos.