A continuación se detalla un guion docente completo de 2 horas para trabajar el dataset Titanic integrando:

  • razonamiento humano
  • Codex como asistente
  • R como verificador

La estructura evita copia automática y obliga a pensar.


Objetivo de la sesión

El estudiante deberá responder:

¿Qué factor influyó más en la supervivencia: sexo, edad o clase social?

No es un ejercicio de código: es un ejercicio de inferencia estadística.


Estructura general (120 minutos)

Fase Tiempo Herramienta principal Habilidad
Planteamiento 15 min Papel / discusión Pensamiento
Exploración 20 min R Lectura de datos
Asistencia IA 20 min Codex chat Comprensión
Análisis formal 30 min R + Codex VSCode Inferencia
Modelo 20 min R Modelación
Defensa 15 min Oral Comprensión real

Fase 1 — Planteamiento humano (15 min)

Sin computador

Usted escribe en el tablero:

¿Quién tenía más probabilidad de sobrevivir en el Titanic?

Cada estudiante debe escribir:

  1. una hipótesis
  2. una razón social o histórica

Ejemplo esperado:

  • mujeres primero
  • primera clase
  • niños protegidos

⚠️ Regla: no pueden usar IA todavía.


Fase 2 — Exploración en R (20 min)

data(Titanic)
titanic_df <- as.data.frame(Titanic)

str(titanic_df)
head(titanic_df)

Tarea del estudiante:

describa qué representa cada fila

Aquí normalmente descubren que Freq ≠ individuo.


Primera interacción con Codex (chat)

Ahora sí:

Pedirles escribir:

Explícame por qué este dataset no tiene filas por persona

Esto convierte a la IA en profesor conceptual.


Fase 3 — Evidencia exploratoria (20 min)

Supervivencia por sexo

prop.table(xtabs(Freq ~ Sex + Survived, data = titanic_df),1)

Por clase

prop.table(xtabs(Freq ~ Class + Survived, data = titanic_df),1)

Interacción con Codex

No pueden pedir conclusiones.

Solo:

Ayúdame a interpretar porcentajes correctamente

Luego deben escribir la conclusión ellos.


Fase 4 — Inferencia estadística (30 min)

Prueba Chi-cuadrado

chisq.test(xtabs(Freq ~ Sex + Survived, data = titanic_df))
chisq.test(xtabs(Freq ~ Class + Survived, data = titanic_df))
chisq.test(xtabs(Freq ~ Age + Survived, data = titanic_df))

Uso correcto de Codex en VSCode

Ahora pueden pedir:

Explica qué significa el p-value en este resultado

No:

concluye el ejercicio


Actividad clave

Deben completar la tabla:

Variable Evidencia estadística Importante / No
Sexo
Clase
Edad

Fase 5 — Modelo predictivo (20 min)

library(tidyr)
titanic_expanded <- uncount(titanic_df, Freq)

modelo <- glm(Survived ~ Sex + Age + Class,
              data=titanic_expanded,
              family=binomial)

summary(modelo)

Ahora sí pueden usar Codex:

Interpreta coeficientes como probabilidades

Aquí aprenden odds ratio sin memorizar fórmula.


Fase 6 — Defensa oral (15 min)

Cada estudiante responde sin pantalla:

  1. variable más importante
  2. evidencia estadística
  3. explicación social

Si no puede explicarlo → usó IA sin comprender.


Evaluación recomendada durante la sesión

Evidencia Evalúa
Hipótesis inicial Pensamiento
Tablas interpretadas Comprensión
p-value explicado Estadística
Modelo Abstracción
Defensa oral Autoría real

Por qué esta clase funciona

La IA puede:

  • explicar
  • ayudar
  • guiar

Pero no puede:

  • defender oralmente
  • justificar hipótesis
  • conectar historia + estadística

El estudiante necesita comprender.


Resultado típico esperado

Conclusión correcta:

El sexo fue el factor más influyente, seguido de la clase; la edad tuvo menor impacto relativo.

Pero lo importante no es la respuesta.

Es que puedan demostrar por qué.