¿Cuáles son los principales determinantes económicos y académicos del desempeño académico (promedio) de los estudiantes beneficiarios del programa ASES en la Universidad del Valle?
Hipótesis: El promedio académico de los estudiantes está positivamente relacionado con las horas de estudio, el nivel educativo de los padres y el ingreso del hogar, y negativamente relacionado con las horas de trabajo y el número de materias matriculadas.
#Tipo de datos: Cross-section (datos transversales de 800 estudiantes).
#Variable dependiente: promedio (promedio académico, 0-5).
##Variables explicativas:
#horas_estudio (+): Capital humano del estudiante.
#horas_trabajo (-): Efecto de la doble jornada.
#ingresos_hogar (+): Recursos disponibles para educación.
#educ_padre y educ_madre (+): Capital humano del hogar.
#um_materias (-): Sobrecarga académica.
#valor_matricula (-): Posible efecto de estrés financiero.
#indice_dependencia (-): Mayor carga familiar.
#tipo_colegio_cont (+): Calidad educativa previa.
## Warning: package 'readxl' was built under R version 4.4.3
## Warning: package 'tidyverse' was built under R version 4.4.3
## Warning: package 'ggplot2' was built under R version 4.4.3
## Warning: package 'readr' was built under R version 4.4.3
## Warning: package 'purrr' was built under R version 4.4.3
## Warning: package 'dplyr' was built under R version 4.4.3
## Warning: package 'stringr' was built under R version 4.4.3
## Warning: package 'forcats' was built under R version 4.4.3
## Warning: package 'lubridate' was built under R version 4.4.3
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr 1.1.4 ✔ readr 2.1.5
## ✔ forcats 1.0.0 ✔ stringr 1.6.0
## ✔ ggplot2 3.5.2 ✔ tibble 3.2.1
## ✔ lubridate 1.9.4 ✔ tidyr 1.3.1
## ✔ purrr 1.2.2
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag() masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
## Warning: package 'corrplot' was built under R version 4.4.3
## corrplot 0.95 loaded
##
## Please cite as:
##
## Hlavac, Marek (2022). stargazer: Well-Formatted Regression and Summary Statistics Tables.
## R package version 5.2.3. https://CRAN.R-project.org/package=stargazer
# 1. Importar datos
datos <- read_excel("C:/Users/diego/OneDrive/Imagenes1/Escritorio/univalle/8 SEMESTRE/ECONOMETRIA/datos_ases.xlsx")
# 2. Análisis descriptivo
summary(datos)## promedio num_materias valor_matricula ingresos_hogar
## Min. :1.250 Min. :3.000 Min. : 300000 Min. : 441710
## 1st Qu.:2.649 1st Qu.:4.000 1st Qu.: 300000 1st Qu.:1325176
## Median :3.132 Median :5.000 Median : 300000 Median :1808309
## Mean :3.150 Mean :5.447 Mean : 400407 Mean :2041011
## 3rd Qu.:3.597 3rd Qu.:7.000 3rd Qu.: 463759 3rd Qu.:2505897
## Max. :5.000 Max. :8.000 Max. :1277092 Max. :9100293
## educ_padre educ_madre indice_dependencia tipo_colegio_cont
## Min. : 3.00 Min. : 3.00 Min. :0.000 Min. :0.2024
## 1st Qu.: 9.00 1st Qu.:10.00 1st Qu.:1.000 1st Qu.:0.3955
## Median :11.00 Median :12.00 Median :2.000 Median :0.5931
## Mean :11.09 Mean :11.97 Mean :1.982 Mean :0.5937
## 3rd Qu.:13.00 3rd Qu.:14.00 3rd Qu.:3.000 3rd Qu.:0.7963
## Max. :20.00 Max. :20.00 Max. :5.000 Max. :0.9988
## departamento_score horas_estudio horas_trabajo
## Min. :0.3001 Min. : 5.000 Min. : 0.00
## 1st Qu.:0.4779 1st Qu.: 8.199 1st Qu.:21.77
## Median :0.6574 Median :12.324 Median :25.98
## Mean :0.6442 Mean :12.844 Mean :25.70
## 3rd Qu.:0.8095 3rd Qu.:17.034 3rd Qu.:30.18
## Max. :0.9998 Max. :35.623 Max. :45.68
##
## Estadísticas Descriptivas
## =================================
## Statistic N Mean St. Dev. Min Max
## =================================
A continuación se presenta un resumen estadístico de las principales variables:
| Variable | Media | Mediana | Mínimo | Máximo | Interpretación |
|---|---|---|---|---|---|
| promedio | 3.150 | 3.132 | 1.250 | 5.000 | El promedio académico de los estudiantes es 3.15, cercano a la mediana, lo que sugiere una distribución relativamente simétrica. |
| horas_estudio | 12.844 | 12.324 | 5.000 | 35.623 | Los estudiantes dedican en promedio 12.8 horas semanales al estudio. |
| horas_trabajo | 25.70 | 25.98 | 0.00 | 45.68 | Alta dedicación laboral: promedio de 25.7 horas semanales. |
| ingresos_hogar | 2,041,011 | 1,808,309 | 441,710 | 9,100,293 | Ingreso mensual promedio del hogar es de $2.041.011. Alta dispersión (algunos hogares con ingresos muy altos). |
| educ_padre | 11.09 | 11.00 | 3.00 | 20.00 | El padre tiene en promedio 11.1 años de educación. |
| educ_madre | 11.97 | 12.00 | 3.00 | 20.00 | La madre tiene en promedio 11.97 años, ligeramente superior al padre. |
| num_materias | 5.447 | 5.000 | 3.000 | 8.000 | Los estudiantes matriculan en promedio 5.45 materias. |
| valor_matricula | 400,407 | 300,000 | 300,000 | 1,277,092 | La matrícula promedio es de $400.407, aunque la mediana es de $300.000 (distribución sesgada a la derecha). |
| indice_dependencia | 1.982 | 2.000 | 0.000 | 5.000 | En promedio hay 2 personas dependientes por hogar. |
| tipo_colegio_cont | 0.5937 | 0.5931 | 0.2024 | 0.9988 | Calidad promedio del colegio de procedencia es 0.59 (en una escala de 0 a 1). |
Desempeño académico: El promedio general es de 3.15, lo cual indica un desempeño moderado. Hay estudiantes con muy bajo rendimiento (1.25) y otros con excelente rendimiento (5.0). Doble jornada: Los estudiantes dedican en promedio más horas al trabajo (25.7) que al estudio (12.8). Esto sugiere una fuerte restricción de tiempo, que probablemente afecta su rendimiento académico. Capital humano del hogar: Tanto el padre como la madre tienen en promedio alrededor de 11-12 años de educación (bachillerato completo), lo que es consistente con una población de estratos medios-bajos. Condiciones económicas: Existe gran heterogeneidad en los ingresos del hogar (desde $441 mil hasta más de $9 millones). La matrícula también muestra dispersión, aunque la mayoría paga cerca de $300.000. Distribución de variables: La mayoría de las variables presentan una distribución razonablemente simétrica (media ≈ mediana). ingresos_hogar y valor_matricula muestran sesgo positivo (media > mediana), es decir, hay algunos valores muy altos que jalan la media hacia arriba.
Variabilidad: Hay suficiente variación en casi todas las variables (especialmente en horas_estudio, horas_trabajo, ingresos_hogar y tipo_colegio_cont), lo que es favorable para el análisis econométrico.
# Estimar el modelo
modelo <- lm(promedio ~ horas_estudio + horas_trabajo + ingresos_hogar +
educ_padre + educ_madre + num_materias +
valor_matricula + indice_dependencia + tipo_colegio_cont,
data = datos)
# Resultados detallados
summary(modelo)##
## Call:
## lm(formula = promedio ~ horas_estudio + horas_trabajo + ingresos_hogar +
## educ_padre + educ_madre + num_materias + valor_matricula +
## indice_dependencia + tipo_colegio_cont, data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.27905 -0.27168 -0.00369 0.27015 1.21740
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 2.275e+00 1.954e-01 11.644 < 2e-16 ***
## horas_estudio 3.993e-02 3.794e-03 10.525 < 2e-16 ***
## horas_trabajo -2.307e-02 3.643e-03 -6.332 4.05e-10 ***
## ingresos_hogar 1.756e-07 2.151e-08 8.162 1.30e-15 ***
## educ_padre 2.780e-02 4.828e-03 5.758 1.22e-08 ***
## educ_madre 4.334e-02 4.775e-03 9.076 < 2e-16 ***
## num_materias -4.954e-02 9.790e-03 -5.060 5.21e-07 ***
## valor_matricula 1.287e-08 1.200e-07 0.107 0.915
## indice_dependencia -1.292e-01 1.530e-02 -8.443 < 2e-16 ***
## tipo_colegio_cont 4.882e-01 6.165e-02 7.919 8.12e-15 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.4016 on 790 degrees of freedom
## Multiple R-squared: 0.6757, Adjusted R-squared: 0.672
## F-statistic: 182.9 on 9 and 790 DF, p-value: < 2.2e-16
# Tabla bonita para el taller
stargazer(modelo, type = "text", title = "Resultados del Modelo",
digits = 4, report = "vc*t")##
## Resultados del Modelo
## ===============================================
## Dependent variable:
## ---------------------------
## promedio
## -----------------------------------------------
## horas_estudio 0.0399***
## t = 10.5251
##
## horas_trabajo -0.0231***
## t = -6.3321
##
## ingresos_hogar 0.000000***
## t = 8.1615
##
## educ_padre 0.0278***
## t = 5.7584
##
## educ_madre 0.0433***
## t = 9.0762
##
## num_materias -0.0495***
## t = -5.0601
##
## valor_matricula 0.0000
## t = 0.1072
##
## indice_dependencia -0.1292***
## t = -8.4427
##
## tipo_colegio_cont 0.4882***
## t = 7.9189
##
## Constant 2.2753***
## t = 11.6442
##
## -----------------------------------------------
## Observations 800
## R2 0.6757
## Adjusted R2 0.6720
## Residual Std. Error 0.4016 (df = 790)
## F Statistic 182.8633*** (df = 9; 790)
## ===============================================
## Note: *p<0.1; **p<0.05; ***p<0.01
El modelo estimado explica de manera adecuada el desempeño académico de los estudiantes del programa ASES. A continuación se presenta el análisis de los resultados: Bondad de Ajuste
R² = 0.6757: El modelo explica el 67.57% de la variabilidad del promedio académico de los estudiantes. R² Ajustado = 0.6720: Después de penalizar por el número de variables, el modelo mantiene un buen poder explicativo. El estadístico F (182.86) es altamente significativo (p-value < 2.2e-16), lo que indica que el modelo en su conjunto es estadísticamente significativo.
El error estándar residual es de 0.4016, valor razonable considerando que el promedio académico oscila entre 0 y 5.
| Variable | Coeficiente | Signo | Significancia | Interpretación Económica |
|---|---|---|---|---|
| horas_estudio | 0.03993 | + | *** | Por cada hora adicional semanal dedicada al estudio, el promedio académico aumenta en 0.040 puntos, manteniendo constantes las demás variables. Es uno de los factores con mayor impacto positivo. |
| horas_trabajo | -0.02307 | - | *** | Por cada hora adicional de trabajo semanal, el promedio disminuye en 0.023 puntos. Esto evidencia el alto costo de oportunidad que representa el trabajo para los estudiantes. |
| ingresos_hogar | 0.000000176 | + | *** | Por cada peso adicional en el ingreso mensual del hogar, el promedio aumenta en 0.000000176 puntos. Aunque significativo, el efecto es muy pequeño en términos prácticos. |
| educ_padre | 0.02780 | + | *** | Por cada año adicional de educación del padre, el promedio del estudiante aumenta en 0.028 puntos. |
| educ_madre | 0.04334 | + | *** | Por cada año adicional de educación de la madre, el promedio aumenta en 0.043 puntos. El efecto de la madre es notablemente mayor que el del padre. |
| num_materias | -0.04954 | - | *** | Por cada materia adicional matriculada, el promedio disminuye en 0.050 puntos. Refleja los efectos negativos de la sobrecarga académica. |
| valor_matricula | 0.000000013 | + | No significativo | No tiene un efecto estadísticamente significativo sobre el promedio. |
| indice_dependencia | -0.1292 | - | *** | Por cada persona dependiente adicional en el hogar, el promedio disminuye en 0.129 puntos. Es uno de los efectos negativos más fuertes del modelo. |
| tipo_colegio_cont | 0.4882 | + | *** | Pasar de la peor calidad de colegio (0) a la mejor calidad (1) aumenta el promedio en 0.488 puntos. Este es uno de los efectos más grandes del modelo. |
Signif. codes: *** p<0.01, ** p<0.05, * p<0.1
Los resultados confirman la importancia del capital humano (tanto del estudiante como del hogar) y la restricción de tiempo como determinantes clave del desempeño académico:
Factores positivos más relevantes: Las horas dedicadas al estudio y la calidad del colegio de procedencia son los principales impulsores del buen rendimiento. La educación de los padres (especialmente de la madre) muestra una clara transmisión intergeneracional de capital humano. Factores negativos más relevantes: El trabajo remunerado y la carga de dependientes en el hogar afectan fuertemente el promedio, lo que refleja las dificultades que enfrentan los estudiantes de estratos vulnerables para combinar estudio y responsabilidades familiares/económicas. El ingreso del hogar tiene un efecto positivo pero marginal, sugiriendo que en este grupo de estudiantes ASES, el tiempo y la calidad educativa previa son más determinantes que los recursos monetarios directos.
En conclusión, el modelo sugiere que las políticas públicas orientadas a mejorar el desempeño académico de estudiantes beneficiarios de programas de apoyo deberían priorizar:
Programas que fomenten más tiempo de estudio. Apoyo para reducir la carga laboral de los estudiantes. Fortalecimiento de la preparación académica previa.