Saltar al contenido principal
TAV
  • Inicio
  • Calendario
  • Más
Español - México ‎(es_mx)‎
Deutsch ‎(de)‎ English ‎(en)‎ Español - Internacional ‎(es)‎ Español - México ‎(es_mx)‎ Esperanto ‎(eo)‎ Français ‎(fr)‎ Italiano ‎(it)‎ Latin ‎(la)‎ Português - Brasil ‎(pt_br)‎ Português - Portugal ‎(pt)‎ Română ‎(ro)‎ Ελληνικά ‎(el)‎ Русский ‎(ru)‎ العربية ‎(ar)‎ 日本語 ‎(ja)‎ 简体中文 ‎(zh_cn)‎
En este momento está usando el acceso para invitados
Ingresar
TAV
Inicio Calendario
Expandir todo Colapsar todo
  1. PLN-AVZ-LCD
  2. RAG Avanzado
  3. RAG en español con RagQuAS

RAG en español con RagQuAS

Requisitos de finalización
Abrió: martes, 5 de mayo de 2026, 00:00
Cierre: jueves, 14 de mayo de 2026, 14:00
Objetivo

Implementar y evaluar un sistema RAG en español usando LangChain y el dataset RagQuAS. La tarea busca practicar las tres etapas principales de RAG: indexación, recuperación y generación, así como la evaluación del recuperador y del generador.

Dataset

Usarán RagQuAS: Retrieval-Augmented-Generation and Question-Answering in Spanish.

Deberán seleccionar al menos 30 ejemplos. Para cada ejemplo usarán:

  • la pregunta;
  • la respuesta de referencia;
  • el campo text_i como fuente documental.

El índice debe construirse únicamente con text_i. No deben indexar respuestas de referencia ni otros campos que puedan introducir fuga de información.

Actividades
1. Adaptar el notebook de clase

Partan del notebook de la práctica y modifiquen el pipeline para trabajar con RagQuAS:

text_i → chunks → embeddings → índice vectorial → recuperación → generación
 

Pueden usar FAISS o ChromaDB como base vectorial.

2. Construir el índice

A partir de text_i, construyan los documentos que se van a indexar.
Reporten brevemente en el notebook:

  • número de ejemplos usados;
  • número de textos indexados;
  • número de chunks generados;
  • modelo de embeddings;
  • base vectorial;
  • configuración de chunking.
3. Recuperar evidencia

Para cada pregunta, recuperen los fragmentos más relevantes. Prueben al menos dos valores de k, por ejemplo: 3 y 5. Guarden los fragmentos recuperados y la posición en la que aparece el primer fragmento relevante.

4. Generar respuestas

Construyan una cadena RAG con LangChain. El prompt debe indicar que el modelo responda solo con base en el contexto recuperado.

Ejemplo:

Responde la pregunta usando únicamente el contexto proporcionado.
Si la respuesta no está en el contexto, responde:
"No hay suficiente información en los documentos recuperados".
 

Generen respuestas para las preguntas seleccionadas.

5. Evaluar el recuperador

Calculen: Precision@k, Recall@k, MRR. Incluyan una tabla con los resultados por pregunta y el promedio general.

6. Evaluar el generador

Comparen la respuesta generada con la respuesta de referencia de RagQuAS. Calculen las métricas: Token F1, ROUGE-L, BERTScore. Agreguen una breve evaluación cualitativa: si la respuesta es fiel al contexto, si omite información importante o si agrega información no sustentada.

7. Experimento comparativo

Realicen un experimento comparativo sencillo. Pueden comparar:

  • k=3 vs. k=5;
  • dos tamaños de chunks;
  • dos modelos de embeddings;
  • RAG vs. generación sin RAG;
  • consulta original vs. consulta reescrita.

Incluyan una tabla de resultados y una breve interpretación.

Entregable

Entregar un solo notebook. El notebook debe contener:

  1. Breve descripción de RagQuAS.
  2. Carga y selección de ejemplos.
  3. Construcción del índice usando text_i.
  4. Implementación del pipeline RAG.
  5. Evaluación del recuperador.
  6. Evaluación del generador.
  7. Experimento comparativo.
  8. Análisis crítico y conclusiones.

No incluyan claves de API directamente en el código.

Logotipo de la DGTIC

Dirección de Innovación en
Tecnologías para la Educación - EDUCATIC - DGTIC - UNAM

  • Aviso de privacidad simplificado
  • Avisos de privacidad de la DGTIC
  • Código de ética de la UNAM

Atención a usuarios de Tu Aula Virtual

Chat del centro de atención a usuarios xm.manu.citacude@aduya 55 5622 8595 55 5622 8855


Ubicación

Circuito exterior s/n, Ciudad Universitaria,
Alcaldía Coyoacán, Ciudad de México, México, C.P. 04510.
Mapa de ubicación.
475 años, Universidad de México

Hecho en México, Universidad Nacional Autónoma de México (UNAM). Todos los derechos reservados © 2010-2025. Esta página puede ser reproducida con fines no lucrativos, siempre y cuando no se mutile, se cite la fuente completa y su dirección electrónica. De otra forma, requiere permiso previo por escrito de la institución.

Sitio web administrado en la Dirección de Innovación en Tecnologías para la Educación (DITE) de la DGTIC - UNAM.

En este momento está usando el acceso para invitados (Ingresar)
Resumen de conservación de datos