A continuación se detalla un guion docente completo de 2 horas para trabajar el dataset Titanic integrando:
La estructura evita copia automática y obliga a pensar.
El estudiante deberá responder:
¿Qué factor influyó más en la supervivencia: sexo, edad o clase social?
No es un ejercicio de código: es un ejercicio de inferencia estadística.
| Fase | Tiempo | Herramienta principal | Habilidad |
|---|---|---|---|
| Planteamiento | 15 min | Papel / discusión | Pensamiento |
| Exploración | 20 min | R | Lectura de datos |
| Asistencia IA | 20 min | Codex chat | Comprensión |
| Análisis formal | 30 min | R + Codex VSCode | Inferencia |
| Modelo | 20 min | R | Modelación |
| Defensa | 15 min | Oral | Comprensión real |
Sin computador
Usted escribe en el tablero:
¿Quién tenía más probabilidad de sobrevivir en el Titanic?
Cada estudiante debe escribir:
Ejemplo esperado:
⚠️ Regla: no pueden usar IA todavía.
data(Titanic)
titanic_df <- as.data.frame(Titanic)
str(titanic_df)
head(titanic_df)
Tarea del estudiante:
describa qué representa cada fila
Aquí normalmente descubren que Freq ≠ individuo.
Ahora sí:
Pedirles escribir:
Explícame por qué este dataset no tiene filas por persona
Esto convierte a la IA en profesor conceptual.
prop.table(xtabs(Freq ~ Sex + Survived, data = titanic_df),1)
prop.table(xtabs(Freq ~ Class + Survived, data = titanic_df),1)
No pueden pedir conclusiones.
Solo:
Ayúdame a interpretar porcentajes correctamente
Luego deben escribir la conclusión ellos.
chisq.test(xtabs(Freq ~ Sex + Survived, data = titanic_df))
chisq.test(xtabs(Freq ~ Class + Survived, data = titanic_df))
chisq.test(xtabs(Freq ~ Age + Survived, data = titanic_df))
Ahora pueden pedir:
Explica qué significa el p-value en este resultado
No:
concluye el ejercicio
Deben completar la tabla:
| Variable | Evidencia estadística | Importante / No |
|---|---|---|
| Sexo | ||
| Clase | ||
| Edad |
library(tidyr)
titanic_expanded <- uncount(titanic_df, Freq)
modelo <- glm(Survived ~ Sex + Age + Class,
data=titanic_expanded,
family=binomial)
summary(modelo)
Ahora sí pueden usar Codex:
Interpreta coeficientes como probabilidades
Aquí aprenden odds ratio sin memorizar fórmula.
Cada estudiante responde sin pantalla:
Si no puede explicarlo → usó IA sin comprender.
| Evidencia | Evalúa |
|---|---|
| Hipótesis inicial | Pensamiento |
| Tablas interpretadas | Comprensión |
| p-value explicado | Estadística |
| Modelo | Abstracción |
| Defensa oral | Autoría real |
La IA puede:
Pero no puede:
El estudiante necesita comprender.
Conclusión correcta:
El sexo fue el factor más influyente, seguido de la clase; la edad tuvo menor impacto relativo.
Pero lo importante no es la respuesta.
Es que puedan demostrar por qué.