Arquitectura del sistema

Descripción técnica de la fábrica automatizada de contenido EdTech. Estos pipelines ingestan PDFs sin estructura y generan cursos de micro-aprendizaje bilingües, estructurados y validados.

Fábrica de contenido 0-a-1

Generación y traducción automática de cursos

Una arquitectura LLM multi-agente y adversarial diseñada para convertir textos académicos densos en micro-aprendizaje estructurado — atacando directamente la parálisis del ¿ por dónde empiezo?.

< $7

Costo por libro

30–90m

De inicio a fin

1. Clasificación de libros

Gemini 2.5 Flash procesa el PDF completo (usando la ventana de contexto de 1M tokens) para categorizar niveles de fuente, definir etiquetas y establecer la estrategia de chunking estructural.

2. Generación adversarial

Claude Sonnet 4.5 genera las secciones del curso, que son validadas de inmediato por un prompt adversarial de Sonnet 4. Las secciones con puntaje < 4/5 activan reparaciones retroactivas puntuales.

3. Estructuración de datos

Regex determinista elimina títulos culturales inconsistentes (ahorrando tokens), mientras Claude reorganiza el contenido en un schema relacional estricto de 4 tablas.

4. Traducción multi-agente

Arbitraje de costo por modelo: Haiku realiza la traducción masiva, Sonnet 4 valida 4 dimensiones de calidad, y Sonnet 4.5 repara únicamente las filas que no cumplen los estándares terminológicos.

Bajo el capó

Lógica de orquestación

Ejecución a nivel de nodo, mapeada directamente desde las capas de orquestación de n8n. Destaca los gates de calidad adversariales, los fallbacks deterministas y el routing de modelos optimizado por costo.

Pipeline 1: Generación de Micro-Aprendizaje (v6.2)

111 nodos · 4 pipelines secuenciales enlazados

Etapa 1: Generación de contenido

Iteración de secciones

Itera por las secciones del PDF chunkeado. Pasa el texto crudo al prompt de generación.

Claude Sonnet 4.5

Genera las partes estructuradas de la lección y preguntas de opción múltiple basadas en el texto fuente.

Etapa 2: Validación adversarial

Validador de fidelidad (Sonnet 4)

Un modelo independiente critica el contenido generado contra el PDF fuente. La separación de modelos evita puntos ciegos compartidos.

Lógica de routing de reparación

IF score = 4 or 5 → PASA A LA SIGUIENTE ETAPA
IF score < 4 → ACTIVA PROMPT DE REPARACIÓN

El contenido educativo no puede “sonar plausiblemente correcto”. ~20% de las secciones requieren reparación automática.

Etapa 3: Pulido determinista

Auto-corrección estructural

Nodos regex eliminan títulos honoríficos culturales para estandarizar el tono académico. Decisión: hecho por código, no por LLM, para ahorrar tokens y eliminar latencia.

Etapa 4: Output relacional

Generación de schema

Genera 4 CSVs distintos que reflejan directamente el schema relacional de Supabase (Unidades → Lecciones → Partes → Preguntas).

Buffer HITL

Escribe en Google Drive/Sheets. Gate obligatorio de revisión humana de 20-40 min antes de importar a producción.

Pipeline 2: Traducción Multi-Agente (v1.4)

Optimización de costo · EN a ES (LATAM)

Arquitectura de arbitraje de costo

Producir español LATAM culturalmente resonante y terminológicamente preciso requiere extrema precisión, pero pasar 400 filas a Sonnet 4.5 cuesta ~$0.50+/libro.

Solución: usar modelos más baratos para el trabajo masivo, y reservar los modelos costosos solo para reparaciones puntuales. Reduce el costo a $0.14/book.

Etapa 1: Traducción masiva

Claude 3 Haiku

Traducción base de alta velocidad y bajo costo de las filas CSV en inglés. Maneja el 80-90% del texto instructivo estándar de forma perfecta.

Etapa 2: Gate de 4 dimensiones

Gate de calidad Sonnet 4

Puntuúa la traducción del 1 al 5 en cuatro dimensiones independientes: Tono, Precisión, Resonancia cultural y Terminología teológica.

Trigger de reparación estricto

IF ANY_DIMENSION < 3 → REPAIR

Decisión de producto: no promediamos los puntajes. Un 5/5 en gramática con un 1/5 en teología oculta fallos terminológicos críticos.

Etapa 3: Reparación de precisión

Claude Sonnet 4.5

Actúa solo en el 10-20% de las filas que no pasan el gate. Recibe instrucciones específicas sobre qué dimensión falló para ejecutar una reparación puntual sin reescribir la fila completa.