El objetivo de este estudio es predecir si un paciente masculino tiene un diagnóstico de fertilidad “normal” (N) o “alterado” (O), a partir de factores personales, antecedentes médicos y hábitos de vida.
Este análisis permitirá:
diagnóstico
: Factor con dos niveles ("N"
=
normal, "O"
= alterado)estación
: variable numérica que codifica la estación
del año:
edad
: edad normalizada del individuo (entre 18 y 36
años)enfermedades infantiles
:
accidente
:
intervención quirúrgica
:
fiebre alta
:
alcohol
: frecuencia de consumo de alcohol:
Hábito de fumar
:
horas sentado
: cantidad normalizada de horas sentado al
día:
Estas variables están respaldadas por fundamentos médicos y epidemiológicos (según la OMS), como factores potencialmente asociados a la fertilidad. Además, son adecuadas para el análisis estadístico por ser numéricas y binarias.
edad
, alcohol
, horas sentado
)
mediante histogramas.En muchas instituciones educativas, los docentes y orientadores carecen de herramientas tempranas para identificar a los estudiantes que podrían tener un bajo rendimiento académico al final del periodo escolar. Generalmente, las alertas solo se activan después de observar calificaciones bajas (como G1 o G2), cuando ya es tarde para intervenir efectivamente.
Por tanto, es necesario contar con un modelo que permita anticipar posibles dificultades académicas desde el inicio del año escolar, utilizando variables disponibles desde el primer día (como hábitos de estudio, entorno familiar y motivación). Esto facilitaría la detección temprana de estudiantes en riesgo, permitiendo diseñar intervenciones preventivas y personalizadas para mejorar su rendimiento.
El objetivo de este estudio es predecir si un estudiante aprobará o reprobará la materia a partir de características personales, escolares y familiares, sin utilizar las calificaciones intermedias (G1 y G2).
Este análisis permitirá:
Identificar los factores más influyentes en la probabilidad de aprobar.
Construir un modelo de clasificación para anticipar el desempeño académico.
Proponer recomendaciones para reducir el riesgo de reprobación desde etapas tempranas.
G3_binaria: Nueva variable creada a partir de
G3
:
1 = aprobado (nota ≥ 3)
0 = reprobado (nota < 3)
Estas variables combinan factores académicos, familiares y sociales que pueden influir en el riesgo de reprobación. El modelo ayudará a detectar patrones tempranos que indiquen mayor probabilidad de fracaso académico, lo que permite intervenir de forma oportuna.
Análisis exploratorio:
Visualizar la proporción de estudiantes aprobados vs. reprobados (G3_binaria).
Examinar la distribución de variables cualitativas nominales (higher y famsup) según el estado de aprobación.
Revisar diagramas de caja para ver la relación entre las variables cuantitativas discretas (studytime y failures) y la nueva variable binaria.
Modelado (Clasificación):
Construir un modelo de regresión logística para predecir la probabilidad de aprobación.
Interpretar los coeficientes para entender el peso de cada variable.
Evaluación del modelo:
Medir desempeño con métricas como:
Precisión
Sensibilidad (recall)
Especificidad
Matriz de confusión
Interpretación y conclusiones:
Identificar las variables más influyentes.
Analizar qué factores aumentan o reducen la probabilidad de aprobación.
Sugerir intervenciones educativas: por ejemplo, fomentar hábitos de estudio más intensos o fortalecer el apoyo familiar.