Introducción

En Guatemala, menos del 40% de estudiantes ganan el examen de matemáticas realizado por el Ministerio de Educación a los graduandos de todas las carreras que existen a lo largo de todo el país. Existen ciertas variables significativas que se pueden comprobar estadísticamente que afectan el rendimiento de un estudiante guatemalteco. Para el estudio se utilizó la base de datos del Ministerios de Educación del año 2015 en donde se estudian 10 variables significativas que provocan un efecto marginal en la probabilidad de un estudiante guatemalteco de aprobar o reprobar el examen de matemáticas realizado el último año de diversificado.

En este estudio se utilizaron las herramientas econométricas para analizar el efecto de cada variable que afecta el logro de una estudiante guatemalteco en el examen realizado por el Ministerio de Educación. Hay dos preguntas principales en este estudio. La primera, qué variables son realmente significativas en el momento de estudiar el logro de un estudiante en el examen de matemáticas del MINEDUC y la segunda, cómo se ve reflejada la educación de los estudiantes guatemaltecos en los datos obtenidos.

El enfoque de este estudio no es para proporcionar detalles o descripciones sobre la base de datos que manejan en el MINEDUC, sino que es explorar los datos para obtener resultados econométricos que permitan analizar y brindar soluciones para mejorar la educación de Guatemala.

Este estudio esta organizado en seis partes, la primera muestra estudios hechos con anterioridad sobre el tema, la segunda explica los datos que se utilizaron y cómo están definidas las variables, la tercera es un análisis completo de la regresión, explicación del modelo y de la significancia de las variables y pruebas de hipótesis, la cuarta son gráficas y tablas para entender los datos, la quinta son los resultados que se obtuvieron por medio de la regresión y por último las conclusiones.


Revisión de la literatura

Se han realizado diversos estudios para analizar las carencias de la educación en Guatemala.

Asociación de Investigación y Estudios Sociales

Uno de estos estudios es el que realizado la Asociación de Investigación y Estudios Sociales (ASIES) en el que se pudo determinar que la educación en Guatemala presenta muchas carencias debido a múltiples causas. Este estudio dejó en evidencia el déficit de la educación, ya que se encuentra como una causa principal la falta de cobertura educativa en el nivel medio y deficiencia en la calidad y cumplimiento de días efectivos de clase. El nivel de aprendizaje está relacionado con los días que asisten a la escuela según el reporte, los alumnos en promedio reciben 136 días de clase y el MINEDUC planificó 180 días en el 2013. Además las estadísticas del reporte dicen que la tasa de escolaridad actual en el nivel primario es de 85%, mientras que en el nivel básico o medio alcanza solo el 44%. Hay datos muy importantes que muestran que la zona rural del país posee el fracaso mayor, ya que solo la mitad de los egresados de primaria continúan con el básico y de estos solo la mitad llega al diversificado. Otros datos son los siguientes:

UNICEF

Otro estudio es de UNICEF que muestran ciertos datos:

Se estima que 657.233 niños y niñas no asisten a la escuela primaria, correspondiendo al 26% de la población total entre los 7 y los 14 años de edad.

Cada año 204.593 niños y niñas abandonan la escuela (12% de matriculados).

A pesar de los rezagos de Guatemala en materia de educación, es uno de los países que menos invierte en esta importante área. El gasto en educación como porcentaje del Producto Interno Bruto, PIB, de Guatemala es de aproximadamente 2,4%, en comparación al 4,4% del promedio en América Latina.

UNESCO

Esta es una gráfica que ayudará a entender la siguiente investigación en donde se muestra la cantidad de estudiantes inscritos de cada año y la proporción que representan en cada tipo de escuela:

Sin titulo


Datos y variables

La base de datos que se utilizó es la que proporciona en su página Web el Ministerio de Educación, los datos son del año 2015 y posee información de todos los estudiantes guatemaltecos que cursaron el último año de diversificado, se tienen 149,652 observaciones con 205 variables.

setwd("C:/Users/MariaLourdes/Desktop/QUINTO SEMESTRE/ECONOMETRIA I/PROYECTO FINAL")
library("foreign", lib.loc="C:/Program Files/R/R-3.2.2/library")
graduandos<-read.spss("GRADUANDOS2015.sav", to.data.frame = TRUE)

Inicialmente se comenzó la investigación utilizando 16 variables que estaban relacionadas con el logro en matemáticas pero por temas de significancia fueron eliminadas, siendo las variables que se utilizaron las siguientes:

Variable dummy

Son variables cualitativas, tambien conocidas como indicativas, binarias, categóricas y dicotómicas. Sólo pueden asumir los valores 0 y 1, indicando respectivamente ausencia o presencia de una cualidad o atributo.

Variable categórica

Las variables categóricas también se denominan variables cualitativas o variables de atributos. Los valores de una variable categórica se pueden colocar en un número contable de categorías o grupos diferentes. Los datos categóricos pueden tener o no algún orden lógico.
Variable Nombre Tipo de variable Datos que posee
\[y\] Logro matemáticas dummy Logro=1, No logro=0

Sin titulo

Variable Nombre Tipo de variable Datos que posee
\[x_1\] Género dummy Masculino=1, Femenino=0
\[x_2\] Área dummy Urbana=1, Rural=0
\[x_3\] Papá asistió a la escuela dummy Si=1, No=0
\[x_4\] Mamá asistió a la escuela dummy Si=1, No=0
\[x_5\] Trabaja actualmente dummy Si=1, No=0
\[x_6\] Posee servicio de internet dummy Si=1, No=0
\[x_7\] Repitió algún grado en primaria dummy Si=1, No=0
\[x_8\] Domina otro idioma dummy Si=1, No=0
\[x_9\] Periodos de matemáticas a la semana categórica Ninguno=0 , 1 Periodo=1
2 Periodos=2 , 3 Periodos=3
4 Periodos=4, 5 Periodos=5
6 Periodos=6 , Más de 6 periodos=7
\[x_{10}\] Edad del estudiante categórica 16 años o menos= 0, 17 años=1
18 años=2, 19 años=3
20 años=4, Más de 20 años=5
graduandos$GENERO<-as.factor(graduandos$GENERO)
graduandos$AREA<-as.factor(graduandos$AREA)
graduandos$FM_ASISTIO_ESCUELA_PAPA<-as.factor(graduandos$FM_ASISTIO_ESCUELA_PAPA)
graduandos$FM_ASISTIO_ESCUELA_MAMA<-as.factor(graduandos$FM_ASISTIO_ESCUELA_MAMA)
graduandos$ED_TRABAJA_ACTUALMENTE<-as.factor(graduandos$ED_TRABAJA_ACTUALMENTE)
graduandos$CC_SERVICIO_INTERNET<-as.factor(graduandos$CC_SERVICIO_INTERNET)
graduandos$MAT_PERIODOS_MATEMATICAS_SEMANA_Recodificada<-as.factor(graduandos$MAT_PERIODOS_MATEMATICAS_SEMANA_Recodificada)
graduandos$ED_REPITIO_ALGUN_GRADO_PRIMARIA<-as.factor(graduandos$ED_REPITIO_ALGUN_GRADO_PRIMARIA)
graduandos$IE_DOMINA_OTRO_COMO_SEGUNDO_IDIOMA<-as.factor(graduandos$IE_DOMINA_OTRO_COMO_SEGUNDO_IDIOMA)
graduandos$EDAD_Recodificada<-as.factor(graduandos$EDAD_Recodificada)

Análisis de la regresión

La regresión que se quiere estimar es:

\[ y = \beta_0 +\beta_1x_1+\beta_2x_2+\beta_3x_3+\beta_4x_4+\beta_5x_5+\beta_6x_6+\beta_7x_7+\beta_8x_8+\beta_9x_9+\beta_{10}x_{10}\]

Para estimar la probabilidad que un estudiante posee para ganar o fracasar en un examen de matemáticas del MINEDUC, se utilizó el modelo probit y en RStudio se utiliza el comando glm() diciéndole que se quiere estimar un modelo probit.

Modelo Probit

Este modelo es utilizado para el análisis de muchos fenómenos que se explican con respuesta binomiales en muchos campos. La inversa de la distribución normal de la probabilidad es modelada como una combinación lineal de estimadores. 
Este modelo estima una relación de probabilidad con una variable dependiente discreta.
Hay dos salidas en este modelo: 
* Éxito (prob P)
* Fracaso (prob 1-P)
Casos:
P>1-P, más probabilidad de ganar. 
0< P/P-1<1, el fracaso es más probable.
P=½, el éxito o el fracaso son igualmente probables. 
mylogit<-glm(as.factor(LOGRO_MATEMÁTICAS)~GENERO+AREA+FM_ASISTIO_ESCUELA_PAPA+FM_ASISTIO_ESCUELA_MAMA+ED_TRABAJA_ACTUALMENTE+CC_SERVICIO_INTERNET+ED_REPITIO_ALGUN_GRADO_PRIMARIA+IE_DOMINA_OTRO_COMO_SEGUNDO_IDIOMA+MAT_PERIODOS_MATEMATICAS_SEMANA_Recodificada+EDAD_Recodificada, data=graduandos,family=binomial(link = "probit"))
summary(mylogit)
## 
## Call:
## glm(formula = as.factor(LOGRO_MATEMÁTICAS) ~ GENERO + AREA + 
##     FM_ASISTIO_ESCUELA_PAPA + FM_ASISTIO_ESCUELA_MAMA + ED_TRABAJA_ACTUALMENTE + 
##     CC_SERVICIO_INTERNET + ED_REPITIO_ALGUN_GRADO_PRIMARIA + 
##     IE_DOMINA_OTRO_COMO_SEGUNDO_IDIOMA + MAT_PERIODOS_MATEMATICAS_SEMANA_Recodificada + 
##     EDAD_Recodificada, family = binomial(link = "probit"), data = graduandos)
## 
## Deviance Residuals: 
##     Min       1Q   Median       3Q      Max  
## -1.3271  -0.4408  -0.2531  -0.1200   4.1316  
## 
## Coefficients:
##                                                               Estimate
## (Intercept)                                                   -2.54897
## GENEROMASCULINO                                                0.45670
## AREAURBANA                                                     0.17843
## FM_ASISTIO_ESCUELA_PAPASI                                      0.26053
## FM_ASISTIO_ESCUELA_PAPANO SABE                                 0.21875
## FM_ASISTIO_ESCUELA_MAMASI                                      0.26629
## FM_ASISTIO_ESCUELA_MAMANO SABE                                 0.10862
## ED_TRABAJA_ACTUALMENTESI                                      -0.21985
## CC_SERVICIO_INTERNETSI                                         0.49086
## ED_REPITIO_ALGUN_GRADO_PRIMARIASI                             -0.55180
## IE_DOMINA_OTRO_COMO_SEGUNDO_IDIOMASI                           0.35848
## MAT_PERIODOS_MATEMATICAS_SEMANA_Recodificada1 PERÍODO         -0.03649
## MAT_PERIODOS_MATEMATICAS_SEMANA_Recodificada2 PERÍODOS         0.10100
## MAT_PERIODOS_MATEMATICAS_SEMANA_Recodificada3 PERÍODOS         0.16652
## MAT_PERIODOS_MATEMATICAS_SEMANA_Recodificada4 PERÍODOS         0.21645
## MAT_PERIODOS_MATEMATICAS_SEMANA_Recodificada5 PERÍODOS         0.41520
## MAT_PERIODOS_MATEMATICAS_SEMANA_Recodificada6 PERÍODOS         0.56279
## MAT_PERIODOS_MATEMATICAS_SEMANA_RecodificadaMÁS DE 6 PERÍODOS  0.72578
## EDAD_Recodificada17 AÑOS                                       0.02786
## EDAD_Recodificada18 AÑOS                                      -0.13030
## EDAD_Recodificada19 AÑOS                                      -0.30352
## EDAD_Recodificada20 AÑOS                                      -0.42422
## EDAD_RecodificadaMAYOR DE 20 AÑOS                             -0.36615
##                                                               Std. Error
## (Intercept)                                                      0.03951
## GENEROMASCULINO                                                  0.01134
## AREAURBANA                                                       0.01997
## FM_ASISTIO_ESCUELA_PAPASI                                        0.02505
## FM_ASISTIO_ESCUELA_PAPANO SABE                                   0.03357
## FM_ASISTIO_ESCUELA_MAMASI                                        0.01966
## FM_ASISTIO_ESCUELA_MAMANO SABE                                   0.03957
## ED_TRABAJA_ACTUALMENTESI                                         0.01418
## CC_SERVICIO_INTERNETSI                                           0.01140
## ED_REPITIO_ALGUN_GRADO_PRIMARIASI                                0.01795
## IE_DOMINA_OTRO_COMO_SEGUNDO_IDIOMASI                             0.01110
## MAT_PERIODOS_MATEMATICAS_SEMANA_Recodificada1 PERÍODO            0.02429
## MAT_PERIODOS_MATEMATICAS_SEMANA_Recodificada2 PERÍODOS           0.02589
## MAT_PERIODOS_MATEMATICAS_SEMANA_Recodificada3 PERÍODOS           0.02512
## MAT_PERIODOS_MATEMATICAS_SEMANA_Recodificada4 PERÍODOS           0.02167
## MAT_PERIODOS_MATEMATICAS_SEMANA_Recodificada5 PERÍODOS           0.01936
## MAT_PERIODOS_MATEMATICAS_SEMANA_Recodificada6 PERÍODOS           0.02533
## MAT_PERIODOS_MATEMATICAS_SEMANA_RecodificadaMÁS DE 6 PERÍODOS    0.02588
## EDAD_Recodificada17 AÑOS                                         0.01814
## EDAD_Recodificada18 AÑOS                                         0.01902
## EDAD_Recodificada19 AÑOS                                         0.02429
## EDAD_Recodificada20 AÑOS                                         0.03322
## EDAD_RecodificadaMAYOR DE 20 AÑOS                                0.02829
##                                                               z value
## (Intercept)                                                   -64.513
## GENEROMASCULINO                                                40.270
## AREAURBANA                                                      8.936
## FM_ASISTIO_ESCUELA_PAPASI                                      10.398
## FM_ASISTIO_ESCUELA_PAPANO SABE                                  6.517
## FM_ASISTIO_ESCUELA_MAMASI                                      13.547
## FM_ASISTIO_ESCUELA_MAMANO SABE                                  2.745
## ED_TRABAJA_ACTUALMENTESI                                      -15.503
## CC_SERVICIO_INTERNETSI                                         43.068
## ED_REPITIO_ALGUN_GRADO_PRIMARIASI                             -30.748
## IE_DOMINA_OTRO_COMO_SEGUNDO_IDIOMASI                           32.283
## MAT_PERIODOS_MATEMATICAS_SEMANA_Recodificada1 PERÍODO          -1.502
## MAT_PERIODOS_MATEMATICAS_SEMANA_Recodificada2 PERÍODOS          3.900
## MAT_PERIODOS_MATEMATICAS_SEMANA_Recodificada3 PERÍODOS          6.629
## MAT_PERIODOS_MATEMATICAS_SEMANA_Recodificada4 PERÍODOS          9.987
## MAT_PERIODOS_MATEMATICAS_SEMANA_Recodificada5 PERÍODOS         21.450
## MAT_PERIODOS_MATEMATICAS_SEMANA_Recodificada6 PERÍODOS         22.216
## MAT_PERIODOS_MATEMATICAS_SEMANA_RecodificadaMÁS DE 6 PERÍODOS  28.049
## EDAD_Recodificada17 AÑOS                                        1.536
## EDAD_Recodificada18 AÑOS                                       -6.849
## EDAD_Recodificada19 AÑOS                                      -12.497
## EDAD_Recodificada20 AÑOS                                      -12.772
## EDAD_RecodificadaMAYOR DE 20 AÑOS                             -12.942
##                                                               Pr(>|z|)    
## (Intercept)                                                    < 2e-16 ***
## GENEROMASCULINO                                                < 2e-16 ***
## AREAURBANA                                                     < 2e-16 ***
## FM_ASISTIO_ESCUELA_PAPASI                                      < 2e-16 ***
## FM_ASISTIO_ESCUELA_PAPANO SABE                                7.18e-11 ***
## FM_ASISTIO_ESCUELA_MAMASI                                      < 2e-16 ***
## FM_ASISTIO_ESCUELA_MAMANO SABE                                 0.00606 ** 
## ED_TRABAJA_ACTUALMENTESI                                       < 2e-16 ***
## CC_SERVICIO_INTERNETSI                                         < 2e-16 ***
## ED_REPITIO_ALGUN_GRADO_PRIMARIASI                              < 2e-16 ***
## IE_DOMINA_OTRO_COMO_SEGUNDO_IDIOMASI                           < 2e-16 ***
## MAT_PERIODOS_MATEMATICAS_SEMANA_Recodificada1 PERÍODO          0.13298    
## MAT_PERIODOS_MATEMATICAS_SEMANA_Recodificada2 PERÍODOS        9.61e-05 ***
## MAT_PERIODOS_MATEMATICAS_SEMANA_Recodificada3 PERÍODOS        3.37e-11 ***
## MAT_PERIODOS_MATEMATICAS_SEMANA_Recodificada4 PERÍODOS         < 2e-16 ***
## MAT_PERIODOS_MATEMATICAS_SEMANA_Recodificada5 PERÍODOS         < 2e-16 ***
## MAT_PERIODOS_MATEMATICAS_SEMANA_Recodificada6 PERÍODOS         < 2e-16 ***
## MAT_PERIODOS_MATEMATICAS_SEMANA_RecodificadaMÁS DE 6 PERÍODOS  < 2e-16 ***
## EDAD_Recodificada17 AÑOS                                       0.12465    
## EDAD_Recodificada18 AÑOS                                      7.42e-12 ***
## EDAD_Recodificada19 AÑOS                                       < 2e-16 ***
## EDAD_Recodificada20 AÑOS                                       < 2e-16 ***
## EDAD_RecodificadaMAYOR DE 20 AÑOS                              < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 84132  on 140407  degrees of freedom
## Residual deviance: 66619  on 140385  degrees of freedom
##   (9244 observations deleted due to missingness)
## AIC: 66665
## 
## Number of Fisher Scoring iterations: 6

Interpretación de coeficientes

Variable Coeficiente Interpretación
Género Masculino 0.4567 El género masculino comparado con el femenino posee una mayor probabilidad de ganar el examen de matemáticas.
Área Urbana 0.1784 Ser del área rural representa tener mayor probabilidad de ganar el examen de matemáticas.
Papá asistió a la escuela Si 0.2605 Si el papá del estudiante asistió a la escuela representa tener mayor probabilidad de ganar el examen de matemáticas.
Mamá asistió a la escuela Si 0.2662 Si la mamá del estudiante asistió a la escuela representa tener mayor probabilidad de ganar el examen de matemáticas.
Trabaja actualmente Si -0.2199 Si el estudiante trabaja actualmente disminuye su probabilidad de ganar el examen de matemáticas.
Posee servicio de internet Si 0.4908 Si el estudiante posee servicio de internet tiene mayor probabilidad de ganar el examen.
Repitió grado en primaria Si -0.5518 Si el estudiante repitió algún grado en primaria su probabilidad disminuye para ganar el examen.
Domina otro idioma Si 0.3584 Si el estudiante domina otro idioma posee mayor probabilidad de ganar el examen.
Periodos de matemáticas 1 periodo -0.0365 Si el estudiante solamente recibe 1 periodo de matemáticas a la semana posee menos probabilidad de ganar el examen de matemáticas.
Periodos de matemáticas 2 periodos 0.101 Si el estudiante recibe 2 periodos de matemáticas a la semana posee mayor probabilidad de ganar el examen de matemáticas.
Periodos de matemáticas 3 periodos 0.1665 Si el estudiante recibe 3 periodos de matemáticas a la semana posee mayor probabilidad de ganar el examen de matemáticas
Periodos de matemáticas 4 periodos 0.2165 Si el estudiante recibe 4 periodos de matemáticas a la semana posee mayor probabilidad de ganar el examen de matemáticas
Periodos de matemáticas 5 periodos 0.4152 Si el estudiante recibe 5 periodos de matemáticas a la semana posee mayor probabilidad de ganar el examen de matemáticas
Periodos de matemáticas 6 periodos 0.5628 Si el estudiante recibe 6 periodos de matemáticas a la semana posee mayor probabilidad de ganar el examen de matemáticas
Periodos de matemáticas más de 6 periodos 0.7258 Si el estudiante recibe más de 6 periodos de matemáticas a la semana posee mayor probabilidad de ganar el examen de matemáticas
Edad del estudiante 17 años 0.0278 Si el estudiante tiene 17 años de edad posee mayor probabilidad de ganar el examen.
Edad del estudiante 18 años -0.1303 Si el estudiante tiene 18 años de edad posee menor probabilidad de ganar el examen.
Edad del estudiante 19 años -0.3035 Si el estudiante tiene 19 años de edad posee menor probabilidad de ganar el examen.
Edad del estudiante 20 años -0.4242 Si el estudiante tiene 20 años de edad posee menor probabilidad de ganar el examen.
Edad del estudiante Mayor de 20 años -0.366 Si el estudiante tiene más de 20 años de edad posee menor probabilidad de ganar el examen.

Significancia de las variables

El Valor de P para el Modelo prueba si el añadir las variables reduce significativamente la desviación comparada con un modelo que contiene sólo un término constante. Un Valor de P pequeño (menor de 0.05 si se trabaja con un nivel de significancia del 5%) indica que el modelo ha reducido significativamente la desviación y es así útil para predecir la probabilidad del resultado estudiado.

Hipótesis nula:

\[\beta_0 = 0\]

Observar que los p-valores asociados a los coeficientes \[\beta_n \] son inferiores a 0.05. Por tanto, para un nivel de significación \[\alpha = 0.05\], rechazaremos la hipótesis nula de que dichos coeficientes son nulos (que la variable asociada a los mismos no es relevante en el modelo).

En esta regresión todas las variables son significativas y explican los efectos marginales en la regresión (probabilidad de ganar el examen de matemáticas del MINEDUC).


Gráficas y tablas

#genero
prop.table(table(graduandos$LOGRO_MATEMÁTICAS,graduandos$GENERO),1)
##           
##             FEMENINO MASCULINO
##   NO LOGRO 0.5062375 0.4937625
##   LOGRO    0.3540865 0.6459135
#area
prop.table(table(graduandos$LOGRO_MATEMÁTICAS,graduandos$AREA),1)
##           
##            RURAL           URBANA         
##   NO LOGRO      0.10430635      0.89569365
##   LOGRO         0.06885452      0.93114548
#Asistio PAPA
prop.table(table(graduandos$LOGRO_MATEMÁTICAS,graduandos$FM_ASISTIO_ESCUELA_PAPA),1)
##           
##                    NO         SI    NO SABE
##   NO LOGRO 0.14337765 0.78452215 0.07210020
##   LOGRO    0.03230636 0.92041604 0.04727760
#Asistio MAMA
prop.table(table(graduandos$LOGRO_MATEMÁTICAS,graduandos$FM_ASISTIO_ESCUELA_MAMA),1)
##           
##                    NO         SI    NO SABE
##   NO LOGRO 0.22365500 0.74059801 0.03574699
##   LOGRO    0.06176332 0.91977055 0.01846613
#Trabaja actualmente
prop.table(table(graduandos$LOGRO_MATEMÁTICAS,graduandos$ED_TRABAJA_ACTUALMENTE),1)
##           
##                   NO        SI
##   NO LOGRO 0.5961772 0.4038228
##   LOGRO    0.8317500 0.1682500
#Si tiene servicio de internet
prop.table(table(graduandos$LOGRO_MATEMÁTICAS,graduandos$CC_SERVICIO_INTERNET),1)
##           
##                   NO        SI
##   NO LOGRO 0.7085671 0.2914329
##   LOGRO    0.3270984 0.6729016
#Repitio algun grado
prop.table(table(graduandos$LOGRO_MATEMÁTICAS,graduandos$ED_REPITIO_ALGUN_GRADO_PRIMARIA),1)
##           
##                    NO         SI
##   NO LOGRO 0.67949224 0.32050776
##   LOGRO    0.93507105 0.06492895
#Habla otro idioma
prop.table(table(graduandos$LOGRO_MATEMÁTICAS,graduandos$IE_DOMINA_OTRO_COMO_SEGUNDO_IDIOMA),1)
##           
##                   NO        SI
##   NO LOGRO 0.6918513 0.3081487
##   LOGRO    0.5202109 0.4797891
#Periodos de mate
prop.table(table(graduandos$LOGRO_MATEMÁTICAS,graduandos$MAT_PERIODOS_MATEMATICAS_SEMANA_Recodificada),1)
##           
##               NINGUNO  1 PERÍODO 2 PERÍODOS 3 PERÍODOS 4 PERÍODOS
##   NO LOGRO 0.17077143 0.23616285 0.10343719 0.08270885 0.13184919
##   LOGRO    0.07207349 0.06006124 0.05370181 0.07144540 0.14485358
##           
##            5 PERÍODOS 6 PERÍODOS MÁS DE 6 PERÍODOS
##   NO LOGRO 0.20607096 0.03890033        0.03009919
##   LOGRO    0.36342938 0.11219282        0.12224229
#Edad del estudiante
prop.table(table(graduandos$LOGRO_MATEMÁTICAS,graduandos$EDAD_Recodificada),1)
##           
##            16 AÑOS Ó MENOS    17 AÑOS    18 AÑOS    19 AÑOS    20 AÑOS
##   NO LOGRO      0.05866454 0.20955171 0.27639028 0.16119418 0.09144832
##   LOGRO         0.14077098 0.44830023 0.28059983 0.07058177 0.02190469
##           
##            MAYOR DE 20 AÑOS
##   NO LOGRO       0.20275097
##   LOGRO          0.03784251
#marginal effects
require(effects)
## Loading required package: effects
#Plot marginal effects
mod.cowles <- mylogit
eff.cowles <- allEffects(mod.cowles)

# the following are equivalent:
par(mfrow=c(2,2))
plot(eff.cowles, 'GENERO', ylab="Prob(Logro matematicas)")

plot(eff.cowles, 'AREA', ylab="Prob(Logro matematicas)")

plot(eff.cowles, 'FM_ASISTIO_ESCUELA_PAPA', ylab="Prob(Logro matematicas)")

plot(eff.cowles, 'FM_ASISTIO_ESCUELA_MAMA', ylab="Prob(Logro matematicas)")

plot(eff.cowles, 'ED_TRABAJA_ACTUALMENTE', ylab="Prob(Logro matematicas)")

plot(eff.cowles, 'CC_SERVICIO_INTERNET', ylab="Prob(Logro matematicas)")

plot(eff.cowles, 'ED_REPITIO_ALGUN_GRADO_PRIMARIA', ylab="Prob(Logro matematicas)")

plot(eff.cowles, 'IE_DOMINA_OTRO_COMO_SEGUNDO_IDIOMA', ylab="Prob(Logro matematicas)")

plot(eff.cowles, 'MAT_PERIODOS_MATEMATICAS_SEMANA_Recodificada', ylab="Prob(Logro matematicas)")

plot(eff.cowles, 'EDAD_Recodificada', ylab="Prob(Logro matematicas)")


Resultados

Calculo de \[Pseudo R^2\]

Sin titulo

Logaritmo natural de la probabilidad del modelo que tiene el intercepto como estimador. 
Logaritmo natural de la probabilidad del modelo con todos los estimadores (variables independientes).
La suma de los cuadrados de los residuos es más grande de lo habitual debido a la forma específica en que se distribuye. El calculado en la estimación es más pequeño de lo que realmente debería ser.
Muestra el mejor modelo. 
Entre 0.20 y 0.40 indica un buen ajuste del modelo.
#calculo R2 

probit0<-update(mylogit, formula=as.factor(LOGRO_MATEMÁTICAS)~1)

McFadden<-1- as.vector(logLik(mylogit)/logLik(probit0))
McFadden
## [1] 0.2353202
#Valores entre 0.2 a 0.4 estan considerados altamente satisfactorios. 

Consideraciones en el modelo probit:

Multicolinealidad

Heteroscedasticidad

Conclusiones

prop.table(table(graduandos$LOGRO_MATEMÁTICAS))
## 
##   NO LOGRO      LOGRO 
## 0.91488864 0.08511136

Importante:

Buscar nuevas maneras de fomentar la educación en nuestro país, capacitar a los maestros para que se brinde una educación de calidad y lograr un mejor futuro. 

“Live as if you were to die tomorrow. Learn as if you were to live forever.” - Mahatma Gandhi

Referencias Bibliográficas

  1. Uso de latex: http://metodos.fam.cie.uva.es/~latex/apuntes/apuntes3.pdf

  2. Investigaciones sobre este tema:

  1. Instructivos de paquetes utilizados: