PLANTEAMIENTO DEL PROBLEMA (PUNTO 1)

¿Cuáles son los principales determinantes económicos y académicos del desempeño académico (promedio) de los estudiantes beneficiarios del programa ASES en la Universidad del Valle?

Hipótesis: El promedio académico de los estudiantes está positivamente relacionado con las horas de estudio, el nivel educativo de los padres y el ingreso del hogar, y negativamente relacionado con las horas de trabajo y el número de materias matriculadas.

ESPECIFICACIÓN DEL MODELO (PUNTO 2)

#Tipo de datos: Cross-section (datos transversales de 800 estudiantes).

#Variable dependiente: promedio (promedio académico, 0-5).

##Variables explicativas:

#horas_estudio (+): Capital humano del estudiante.

#horas_trabajo (-): Efecto de la doble jornada.

#ingresos_hogar (+): Recursos disponibles para educación.

#educ_padre y educ_madre (+): Capital humano del hogar.

#um_materias (-): Sobrecarga académica.

#valor_matricula (-): Posible efecto de estrés financiero.

#indice_dependencia (-): Mayor carga familiar.

#tipo_colegio_cont (+): Calidad educativa previa.

ESTIMACIÓN E INTERPRETACIÓN EN R (PUNTO 3)

Importanción de las librerias y de los datos

library(readxl)
## Warning: package 'readxl' was built under R version 4.4.3
library(tidyverse)
## Warning: package 'tidyverse' was built under R version 4.4.3
## Warning: package 'ggplot2' was built under R version 4.4.3
## Warning: package 'readr' was built under R version 4.4.3
## Warning: package 'purrr' was built under R version 4.4.3
## Warning: package 'dplyr' was built under R version 4.4.3
## Warning: package 'stringr' was built under R version 4.4.3
## Warning: package 'forcats' was built under R version 4.4.3
## Warning: package 'lubridate' was built under R version 4.4.3
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr     1.1.4     ✔ readr     2.1.5
## ✔ forcats   1.0.0     ✔ stringr   1.6.0
## ✔ ggplot2   3.5.2     ✔ tibble    3.2.1
## ✔ lubridate 1.9.4     ✔ tidyr     1.3.1
## ✔ purrr     1.2.2     
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
library(corrplot)
## Warning: package 'corrplot' was built under R version 4.4.3
## corrplot 0.95 loaded
library(stargazer)
## 
## Please cite as: 
## 
##  Hlavac, Marek (2022). stargazer: Well-Formatted Regression and Summary Statistics Tables.
##  R package version 5.2.3. https://CRAN.R-project.org/package=stargazer
# 1. Importar datos 
datos <- read_excel("C:/Users/diego/OneDrive/Imagenes1/Escritorio/univalle/8 SEMESTRE/ECONOMETRIA/datos_ases.xlsx")



# 2. Análisis descriptivo
summary(datos)
##     promedio      num_materias   valor_matricula   ingresos_hogar   
##  Min.   :1.250   Min.   :3.000   Min.   : 300000   Min.   : 441710  
##  1st Qu.:2.649   1st Qu.:4.000   1st Qu.: 300000   1st Qu.:1325176  
##  Median :3.132   Median :5.000   Median : 300000   Median :1808309  
##  Mean   :3.150   Mean   :5.447   Mean   : 400407   Mean   :2041011  
##  3rd Qu.:3.597   3rd Qu.:7.000   3rd Qu.: 463759   3rd Qu.:2505897  
##  Max.   :5.000   Max.   :8.000   Max.   :1277092   Max.   :9100293  
##    educ_padre      educ_madre    indice_dependencia tipo_colegio_cont
##  Min.   : 3.00   Min.   : 3.00   Min.   :0.000      Min.   :0.2024   
##  1st Qu.: 9.00   1st Qu.:10.00   1st Qu.:1.000      1st Qu.:0.3955   
##  Median :11.00   Median :12.00   Median :2.000      Median :0.5931   
##  Mean   :11.09   Mean   :11.97   Mean   :1.982      Mean   :0.5937   
##  3rd Qu.:13.00   3rd Qu.:14.00   3rd Qu.:3.000      3rd Qu.:0.7963   
##  Max.   :20.00   Max.   :20.00   Max.   :5.000      Max.   :0.9988   
##  departamento_score horas_estudio    horas_trabajo  
##  Min.   :0.3001     Min.   : 5.000   Min.   : 0.00  
##  1st Qu.:0.4779     1st Qu.: 8.199   1st Qu.:21.77  
##  Median :0.6574     Median :12.324   Median :25.98  
##  Mean   :0.6442     Mean   :12.844   Mean   :25.70  
##  3rd Qu.:0.8095     3rd Qu.:17.034   3rd Qu.:30.18  
##  Max.   :0.9998     Max.   :35.623   Max.   :45.68
stargazer(datos, type = "text", title = "Estadísticas Descriptivas")
## 
## Estadísticas Descriptivas
## =================================
## Statistic N Mean St. Dev. Min Max
## =================================

Análisis descriptivo

A continuación se presenta un resumen estadístico de las principales variables:

Variable Media Mediana Mínimo Máximo Interpretación
promedio 3.150 3.132 1.250 5.000 El promedio académico de los estudiantes es 3.15, cercano a la mediana, lo que sugiere una distribución relativamente simétrica.
horas_estudio 12.844 12.324 5.000 35.623 Los estudiantes dedican en promedio 12.8 horas semanales al estudio.
horas_trabajo 25.70 25.98 0.00 45.68 Alta dedicación laboral: promedio de 25.7 horas semanales.
ingresos_hogar 2,041,011 1,808,309 441,710 9,100,293 Ingreso mensual promedio del hogar es de $2.041.011. Alta dispersión (algunos hogares con ingresos muy altos).
educ_padre 11.09 11.00 3.00 20.00 El padre tiene en promedio 11.1 años de educación.
educ_madre 11.97 12.00 3.00 20.00 La madre tiene en promedio 11.97 años, ligeramente superior al padre.
num_materias 5.447 5.000 3.000 8.000 Los estudiantes matriculan en promedio 5.45 materias.
valor_matricula 400,407 300,000 300,000 1,277,092 La matrícula promedio es de $400.407, aunque la mediana es de $300.000 (distribución sesgada a la derecha).
indice_dependencia 1.982 2.000 0.000 5.000 En promedio hay 2 personas dependientes por hogar.
tipo_colegio_cont 0.5937 0.5931 0.2024 0.9988 Calidad promedio del colegio de procedencia es 0.59 (en una escala de 0 a 1).

Comentarios relevantes sobre el análisis descriptivo:

Desempeño académico: El promedio general es de 3.15, lo cual indica un desempeño moderado. Hay estudiantes con muy bajo rendimiento (1.25) y otros con excelente rendimiento (5.0). Doble jornada: Los estudiantes dedican en promedio más horas al trabajo (25.7) que al estudio (12.8). Esto sugiere una fuerte restricción de tiempo, que probablemente afecta su rendimiento académico. Capital humano del hogar: Tanto el padre como la madre tienen en promedio alrededor de 11-12 años de educación (bachillerato completo), lo que es consistente con una población de estratos medios-bajos. Condiciones económicas: Existe gran heterogeneidad en los ingresos del hogar (desde $441 mil hasta más de $9 millones). La matrícula también muestra dispersión, aunque la mayoría paga cerca de $300.000. Distribución de variables: La mayoría de las variables presentan una distribución razonablemente simétrica (media ≈ mediana). ingresos_hogar y valor_matricula muestran sesgo positivo (media > mediana), es decir, hay algunos valores muy altos que jalan la media hacia arriba.

Variabilidad: Hay suficiente variación en casi todas las variables (especialmente en horas_estudio, horas_trabajo, ingresos_hogar y tipo_colegio_cont), lo que es favorable para el análisis econométrico.

Estimación del modelo (usando lm())

# Estimar el modelo
modelo <- lm(promedio ~ horas_estudio + horas_trabajo + ingresos_hogar + 
                       educ_padre + educ_madre + num_materias + 
                       valor_matricula + indice_dependencia + tipo_colegio_cont, 
             data = datos)
# Resultados detallados
summary(modelo)
## 
## Call:
## lm(formula = promedio ~ horas_estudio + horas_trabajo + ingresos_hogar + 
##     educ_padre + educ_madre + num_materias + valor_matricula + 
##     indice_dependencia + tipo_colegio_cont, data = datos)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -1.27905 -0.27168 -0.00369  0.27015  1.21740 
## 
## Coefficients:
##                      Estimate Std. Error t value Pr(>|t|)    
## (Intercept)         2.275e+00  1.954e-01  11.644  < 2e-16 ***
## horas_estudio       3.993e-02  3.794e-03  10.525  < 2e-16 ***
## horas_trabajo      -2.307e-02  3.643e-03  -6.332 4.05e-10 ***
## ingresos_hogar      1.756e-07  2.151e-08   8.162 1.30e-15 ***
## educ_padre          2.780e-02  4.828e-03   5.758 1.22e-08 ***
## educ_madre          4.334e-02  4.775e-03   9.076  < 2e-16 ***
## num_materias       -4.954e-02  9.790e-03  -5.060 5.21e-07 ***
## valor_matricula     1.287e-08  1.200e-07   0.107    0.915    
## indice_dependencia -1.292e-01  1.530e-02  -8.443  < 2e-16 ***
## tipo_colegio_cont   4.882e-01  6.165e-02   7.919 8.12e-15 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.4016 on 790 degrees of freedom
## Multiple R-squared:  0.6757, Adjusted R-squared:  0.672 
## F-statistic: 182.9 on 9 and 790 DF,  p-value: < 2.2e-16
# Tabla bonita para el taller
stargazer(modelo, type = "text", title = "Resultados del Modelo", 
          digits = 4, report = "vc*t")
## 
## Resultados del Modelo
## ===============================================
##                         Dependent variable:    
##                     ---------------------------
##                              promedio          
## -----------------------------------------------
## horas_estudio                0.0399***         
##                             t = 10.5251        
##                                                
## horas_trabajo               -0.0231***         
##                             t = -6.3321        
##                                                
## ingresos_hogar              0.000000***        
##                             t = 8.1615         
##                                                
## educ_padre                   0.0278***         
##                             t = 5.7584         
##                                                
## educ_madre                   0.0433***         
##                             t = 9.0762         
##                                                
## num_materias                -0.0495***         
##                             t = -5.0601        
##                                                
## valor_matricula               0.0000           
##                             t = 0.1072         
##                                                
## indice_dependencia          -0.1292***         
##                             t = -8.4427        
##                                                
## tipo_colegio_cont            0.4882***         
##                             t = 7.9189         
##                                                
## Constant                     2.2753***         
##                             t = 11.6442        
##                                                
## -----------------------------------------------
## Observations                    800            
## R2                            0.6757           
## Adjusted R2                   0.6720           
## Residual Std. Error      0.4016 (df = 790)     
## F Statistic          182.8633*** (df = 9; 790) 
## ===============================================
## Note:               *p<0.1; **p<0.05; ***p<0.01

INTERPRETACIÓN DE LOS RESULTADOS (PUNTO 4 )

El modelo estimado explica de manera adecuada el desempeño académico de los estudiantes del programa ASES. A continuación se presenta el análisis de los resultados: Bondad de Ajuste

R² = 0.6757: El modelo explica el 67.57% de la variabilidad del promedio académico de los estudiantes. R² Ajustado = 0.6720: Después de penalizar por el número de variables, el modelo mantiene un buen poder explicativo. El estadístico F (182.86) es altamente significativo (p-value < 2.2e-16), lo que indica que el modelo en su conjunto es estadísticamente significativo.

El error estándar residual es de 0.4016, valor razonable considerando que el promedio académico oscila entre 0 y 5.

Interpretación de los Coeficientes

Variable Coeficiente Signo Significancia Interpretación Económica
horas_estudio 0.03993 + *** Por cada hora adicional semanal dedicada al estudio, el promedio académico aumenta en 0.040 puntos, manteniendo constantes las demás variables. Es uno de los factores con mayor impacto positivo.
horas_trabajo -0.02307 - *** Por cada hora adicional de trabajo semanal, el promedio disminuye en 0.023 puntos. Esto evidencia el alto costo de oportunidad que representa el trabajo para los estudiantes.
ingresos_hogar 0.000000176 + *** Por cada peso adicional en el ingreso mensual del hogar, el promedio aumenta en 0.000000176 puntos. Aunque significativo, el efecto es muy pequeño en términos prácticos.
educ_padre 0.02780 + *** Por cada año adicional de educación del padre, el promedio del estudiante aumenta en 0.028 puntos.
educ_madre 0.04334 + *** Por cada año adicional de educación de la madre, el promedio aumenta en 0.043 puntos. El efecto de la madre es notablemente mayor que el del padre.
num_materias -0.04954 - *** Por cada materia adicional matriculada, el promedio disminuye en 0.050 puntos. Refleja los efectos negativos de la sobrecarga académica.
valor_matricula 0.000000013 + No significativo No tiene un efecto estadísticamente significativo sobre el promedio.
indice_dependencia -0.1292 - *** Por cada persona dependiente adicional en el hogar, el promedio disminuye en 0.129 puntos. Es uno de los efectos negativos más fuertes del modelo.
tipo_colegio_cont 0.4882 + *** Pasar de la peor calidad de colegio (0) a la mejor calidad (1) aumenta el promedio en 0.488 puntos. Este es uno de los efectos más grandes del modelo.

Signif. codes: *** p<0.01, ** p<0.05, * p<0.1

INTERPRETACIÓN ECONOMICA GENERAL (PUNTO 5)

Los resultados confirman la importancia del capital humano (tanto del estudiante como del hogar) y la restricción de tiempo como determinantes clave del desempeño académico:

Factores positivos más relevantes: Las horas dedicadas al estudio y la calidad del colegio de procedencia son los principales impulsores del buen rendimiento. La educación de los padres (especialmente de la madre) muestra una clara transmisión intergeneracional de capital humano. Factores negativos más relevantes: El trabajo remunerado y la carga de dependientes en el hogar afectan fuertemente el promedio, lo que refleja las dificultades que enfrentan los estudiantes de estratos vulnerables para combinar estudio y responsabilidades familiares/económicas. El ingreso del hogar tiene un efecto positivo pero marginal, sugiriendo que en este grupo de estudiantes ASES, el tiempo y la calidad educativa previa son más determinantes que los recursos monetarios directos.

En conclusión, el modelo sugiere que las políticas públicas orientadas a mejorar el desempeño académico de estudiantes beneficiarios de programas de apoyo deberían priorizar:

Programas que fomenten más tiempo de estudio. Apoyo para reducir la carga laboral de los estudiantes. Fortalecimiento de la preparación académica previa.