U2A3

Angélica Payán Serna, Karen Gutiérrez Velásquez y Andrea Higuera Chávez

07/05/2021

“Educación en México”

La educación siempre ha sido importante para el desarrollo, pero ha adquirido mayor relevancia en el mundo de hoy que vive profundas transformaciones, motivadas en parte por el vertiginoso avance de la ciencia y sus aplicaciones, así como por el no menos acelerado desarrollo de los medios y las tecnologías de la información. En México, más 4 millones de niños, niñas y adolescentes no asisten a la escuela, mientras que 600 mil más están en riesgo de dejarla por diversos factores como la falta de recursos, la lejanía de las escuelas y la violencia. Además, los niños y niñas que sí van a la escuela tienen un aprovechamiento bajo de los contenidos impartidos en la educación básica obligatoria.

Deserción escolar por COVID-19

Educación en tiempos de pandemia

Fuente: https://www.eluniversal.com.mx/cartera/por-covid-y-pobreza-9-millones-de-alumnos-dejan-la-escuela

La pandemia del COVID-19 (coronavirus) representa una amenaza para el avance de la educación en todo el mundo debido a que produce dos impactos significativos:

El cierre de los centros escolares en casi todo el mundo.

La recesión económica que se produce a partir de las medidas tendientes a controlar la pandemia.

Si no se realizan esfuerzos importantes para contrarrestar sus efectos, el cierre de escuelas provocará una pérdida de aprendizajes, un aumento en la deserción escolar (también conocida como abandono escolar) y una mayor inequidad. La crisis económica que afecta a los hogares, agravará el daño, pues vendrá acompañada de menor oferta y demanda educativa. Estos dos impactos tendrán, en conjunto, un costo a largo plazo sobre el capital humano y el bienestar.

Fuente: http://pubdocs.worldbank.org/en/143771590756983343/Covid-19-Education-Summary-esp.pdf

Acerca de este documento

Datos obtenidos de: https://inegi.org.mx/temas/educacion/

Descarga de este código

xfun::embed_file("U2A4.Rmd")

Download U2A4.Rmd

Importación de datos

setwd("~/estadistica")
library(readxl)
library(tidyverse)
## -- Attaching packages --------------------------------------- tidyverse 1.3.0 --
## v ggplot2 3.3.3     v purrr   0.3.4
## v tibble  3.0.5     v dplyr   1.0.4
## v tidyr   1.1.2     v stringr 1.4.0
## v readr   1.4.0     v forcats 0.5.1
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()
library(prettydoc)
library(readr)
library(DT)
library(pacman)
library(psych)
## 
## Attaching package: 'psych'
## The following objects are masked from 'package:ggplot2':
## 
##     %+%, alpha
p_load("base64enc","htmltools","mime","xfun","prettydoc","readr","knitr","DT","dplyr","ggplot2","plotly","gganimate","gifski","scales", "MASS", "class")

Descarga de datos

tasa <- read.csv("EducacionTasa.csv") #Datos que se usaran como antecedentes (1990-2017)
xfun::embed_file("EducacionTasa.csv") #Descarga de datos

Download EducacionTasa.csv

mex.ab <- read_excel("aband.mex.xlsx") #Abandono escolar en México (2019-2020)
xfun::embed_file("aband.mex.xlsx") #Descarga de datos

Download aband.mex.xlsx

son.ab <- read_excel("abandono.xlsx") #Abandono escolar en Sonora (2019-2020)
xfun::embed_file("abandono.xlsx") #Descarga de datos

Download abandono.xlsx

Tabla de datos: Antecedentes de educación (1990-2017)

datatable(tasa)

Regresión lineal simple

El objetivo de un modelo de regresión es tratar de explicar la relación que existe entre una variable dependiente y un conjunto de variables independientes. En un modelo de regresión lineal simple tratamos de explicar la relación que existe entre la variable respuesta Y y una única variable explicativa X.

Preescolar

modelo_lineal <- lm(periodo ~ preescolar, tasa)
summary(modelo_lineal)
## 
## Call:
## lm(formula = periodo ~ preescolar, data = tasa)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -4.6066 -0.8491 -0.1697  1.6563  3.3913 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 1966.4766     1.8841 1043.75   <2e-16 ***
## preescolar     0.6408     0.0319   20.09   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 2.063 on 26 degrees of freedom
## Multiple R-squared:  0.9395, Adjusted R-squared:  0.9371 
## F-statistic: 403.4 on 1 and 26 DF,  p-value: < 2.2e-16
ggplot(data = tasa, mapping = aes(x = periodo, y = preescolar)) +
  geom_point(color = "firebrick", size = 2) +
  labs(title  =  'Periodo ~  Preescolar', x  =  'Periodo') +
  geom_smooth(method = "lm", se = FALSE, color = "black") +
  theme_bw() +
  theme(plot.title = element_text(hjust = 0.5))
## `geom_smooth()` using formula 'y ~ x'

Primaria

modelo_lineal <- lm(periodo ~ primaria, tasa)
summary(modelo_lineal)
## 
## Call:
## lm(formula = periodo ~ primaria, data = tasa)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -9.5512 -6.1197 -0.6804  6.5138 14.1202 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 1622.952    156.811  10.350 1.03e-10 ***
## primaria       3.854      1.588   2.427   0.0225 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 7.569 on 26 degrees of freedom
## Multiple R-squared:  0.1847, Adjusted R-squared:  0.1533 
## F-statistic:  5.89 on 1 and 26 DF,  p-value: 0.02246
ggplot(data = tasa, mapping = aes(x = periodo, y = primaria)) +
  geom_point(color = "firebrick", size = 2) +
  labs(title  =  'Periodo ~  Primaria', x  =  'Periodo') +
  geom_smooth(method = "lm", se = FALSE, color = "black") +
  theme_bw() +
  theme(plot.title = element_text(hjust = 0.5))
## `geom_smooth()` using formula 'y ~ x'

Secundaria

modelo_lineal <- lm(periodo ~ secundaria, tasa)
summary(modelo_lineal)
## 
## Call:
## lm(formula = periodo ~ secundaria, data = tasa)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -2.586 -1.415  0.039  1.036  4.669 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 1.958e+03  1.899e+00 1031.21   <2e-16 ***
## secundaria  6.422e-01  2.647e-02   24.26   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.724 on 26 degrees of freedom
## Multiple R-squared:  0.9577, Adjusted R-squared:  0.9561 
## F-statistic: 588.7 on 1 and 26 DF,  p-value: < 2.2e-16
ggplot(data = tasa, mapping = aes(x = periodo, y = secundaria)) +
  geom_point(color = "firebrick", size = 2) +
  labs(title  =  'Periodo ~  Secundaria', x  =  'Periodo') +
  geom_smooth(method = "lm", se = FALSE, color = "black") +
  theme_bw() +
  theme(plot.title = element_text(hjust = 0.5))
## `geom_smooth()` using formula 'y ~ x'

Normalidad

Las pruebas de normalidad más formales son las pruebas de Shapiro-Wilk y de Kolmogorov-Smirnov (Dalgaard 2008; Zar 2010). En las pruebas de normalidad se busca aceptar la H0 dado que la mayoría de los métodos estadísticos es necesaria la suposición de la distribución normal de la variable de interés. Púes siendo así es posible conocer los parámetros que describen por completo (la media, su desviación estándar). Un valor de P≥ 0.05 en los tests de normalidad indican que no hay prueba suficiente para rechazar la normalidad de la variable.

par(mfrow = c(1, 2))
hist(tasa$preescolar, breaks = 10, main = "", xlab = "Preescolar", border = "darkred")
hist(tasa$primaria, breaks = 10, main = "", xlab = "Primaria",
     border = "blue")

qqnorm(tasa$preescolar, main = "Preescolar", col = "darkred")
qqline(tasa$preescolar)

qqnorm(tasa$primaria, main = "Primaria", col = "darkred")
qqline(tasa$primaria)

qqnorm(tasa$secundaria, main = "Secundaria", col = "darkred")
qqline(tasa$secundaria)

Comprobación de hipótesis

Valor de significancia: P>0.05

shapiro.test(tasa$preescolar)
## 
##  Shapiro-Wilk normality test
## 
## data:  tasa$preescolar
## W = 0.85964, p-value = 0.001472
shapiro.test(tasa$primaria)
## 
##  Shapiro-Wilk normality test
## 
## data:  tasa$primaria
## W = 0.9491, p-value = 0.1881
shapiro.test(tasa$secundaria)
## 
##  Shapiro-Wilk normality test
## 
## data:  tasa$secundaria
## W = 0.92022, p-value = 0.03513

Interpretación: En base a las gráficas y las pruebas realizadas, nos podemos dar cuenta que a nivel primaria, los datos se encuentran más dispersos al pasar los años, en cambio, en secundaria, conforme pasan los años, la tasa aumenta.

Gráficas sobre la tasa de educación en el periodo 2019-2020

Como resultado de las medidas de confinamiento implementadas por el gobierno mexicano tras el inicio de la pandemia por COVID-19 en 2020, millones de niños se vieron obligados a seguir sus estudios desde casa. Además, a pesar de las alternativas proporcionadas por las instituciones escolares, una gran cantidad de niños abandonaron la escuela. Se estimó que la deserción escolar superó los 2,5 millones de estudiantes desde el nivel preescolar a bachillerato entre abril y agosto de ese mismo año. Esto representa un 10% del total de alumnos de nivel preescolar, primario, secundario y bachillerato. En el caso de la educación superior, el 8% de los estudiantes dejaron de asistir a las clases.-Publicado por J. Mendoza, 22 ene. 2021

Fuente: https://es.statista.com/estadisticas/1196796/desercion-escolar-nivel-educativo-covid-mexico/

Tasa de abandono escolar en México (2019-2020)

ggplotly(ggplot(mex.ab, aes(fill=Nivel, y=Tasa, x=Entidad))+
  geom_bar(position="dodge", stat="identity")+
  labs(x="Entidad", y="Tasa de abandono (%)", title="Tasa de abandono escolar en México (2019-2020)", subtitle="Fuente: SEP")+
      theme(axis.text.x = element_text(angle=90,hjust=1),axis.text.y =element_text(size = 6)))

Distribución de la tasa de abandono para los distinstos niveles escolares en México (2019-2020)

ggplot(mex.ab) + 
  geom_histogram(bins = 50, aes(x = Tasa, fill = Nivel), color = 'black') + 
  facet_grid(Nivel~., scales = 'free') +
  xlab("Tasa de abandono") + 
  ylab("Frecuencia") + 
  ggtitle("Distribución de la Tasa de abandono para los distintos Niveles escolares") +
  theme_minimal()

Es el porcentaje de alumnos que abandonan la escuela de un nivel educativo, respecto a la matrícula de inicio de cursos del mismo nivel. Es el porcentaje de alumnos que abandonan las actividades escolares durante el ciclo escolar y al finalizar éste, respecto al total de alumnos inscritos en el ciclo escolar. Cuando el indicador es positivo es probable que la deserción sólo ocurra a un grado de un ciclo determinado; en ocasiones el porcentaje puede resultar negativo, debido a que durante el ciclo escolar en estudio existieron más alumnos que se inscribieron como ‘’altas’’ que los que enunciaron como ‘’bajas’’ escolares. Los datos que se presentan en ceros no son absolutos, sino no significativos.

El nivel educativo Media superior incluye Profesional técnico y Bachillerato; el Superior incluye licenciatura en Educación Normal, Universitaria y Tecnológica, y excluye Posgrado.

Fuente: SEP. Principales Cifras del Sistema Educativo Nacional 2019-2020 (versión bolsillo). http://www.planeacion.sep.gob.mx/estadisticaeindicadores.aspx (Consulta: 07 de octubre de 2020).

Regresión Lineal Múltiple

datos <- as.data.frame(tasa)
round(cor(x = datos, method = "pearson"), 3)
##            periodo preescolar primaria secundaria
## periodo      1.000      0.969    0.430      0.979
## preescolar   0.969      1.000    0.342      0.958
## primaria     0.430      0.342    1.000      0.397
## secundaria   0.979      0.958    0.397      1.000
multi.hist(x = datos, dcol = c("blue", "red"), dlty = c("dotted", "solid"),
           main = "tasa")

cor.test(datos$periodo, datos$secundaria, method = "pearson")
## 
##  Pearson's product-moment correlation
## 
## data:  datos$periodo and datos$secundaria
## t = 24.264, df = 26, p-value < 2.2e-16
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.9537714 0.9901832
## sample estimates:
##       cor 
## 0.9786243

1.Analizar la correlación entre cada par de variables cuantitativas y diferencias del valor promedio entre las categóricas

  • Primaria
ggplot(data = datos, mapping=aes(x = primaria, y = periodo, color=primaria)) +
geom_boxplot() +
geom_jitter(width = 0.1) +
theme_bw() + theme(legend.position = "none")
## Warning: Continuous x aesthetic -- did you forget aes(group=...)?

2.Generar el modelo lineal múltiple

modelo <- lm(periodo ~ preescolar + primaria + secundaria  , data = datos)
summary(modelo)
## 
## Call:
## lm(formula = periodo ~ preescolar + primaria + secundaria, data = datos)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -2.4727 -0.5926 -0.1704  0.3847  4.2634 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 1.902e+03  3.135e+01  60.663  < 2e-16 ***
## preescolar  2.762e-01  7.622e-02   3.624  0.00136 ** 
## primaria    6.100e-01  3.248e-01   1.878  0.07257 .  
## secundaria  3.620e-01  7.744e-02   4.674  9.5e-05 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.407 on 24 degrees of freedom
## Multiple R-squared:  0.974,  Adjusted R-squared:  0.9707 
## F-statistic: 299.7 on 3 and 24 DF,  p-value: < 2.2e-16
confint(modelo)
##                     2.5 %       97.5 %
## (Intercept) 1837.02597028 1966.4279299
## preescolar     0.11888242    0.4335133
## primaria      -0.06035506    1.2804508
## secundaria     0.20215479    0.5217972
confint(lm(formula = periodo ~ preescolar + primaria + secundaria, data = datos))
##                     2.5 %       97.5 %
## (Intercept) 1837.02597028 1966.4279299
## preescolar     0.11888242    0.4335133
## primaria      -0.06035506    1.2804508
## secundaria     0.20215479    0.5217972

Condiciones para la regresión múltiple lineal

library(ggplot2)
library(gridExtra)
## 
## Attaching package: 'gridExtra'
## The following object is masked from 'package:dplyr':
## 
##     combine

1.Relación lineal entre los predictores numéricos y la variable dependiente:

plot1 <- ggplot(data = datos, aes(preescolar, modelo$residuals)) +
    geom_point() + geom_smooth(color = "firebrick") + geom_hline(yintercept = 0) +
    theme_bw()
plot2 <- ggplot(data = datos, aes(primaria, modelo$residuals)) +
    geom_point() + geom_smooth(color = "firebrick") + geom_hline(yintercept = 0) +
    theme_bw()
plot3 <- ggplot(data = datos, aes(secundaria, modelo$residuals)) +
    geom_point() + geom_smooth(color = "firebrick") + geom_hline(yintercept = 0) +
    theme_bw()
grid.arrange(plot1, plot2, plot3)
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

2.Distribución normal de los residuos:

qqnorm(modelo$residuals)
qqline(modelo$residuals)

shapiro.test(modelo$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  modelo$residuals
## W = 0.9172, p-value = 0.0296

3.Variabilidad constante de los residuos:

ggplot(data = data.frame(predict_values = predict(modelo),
                         residuos = residuals(modelo)),
       aes(x = predict_values, y = residuos)) +
    geom_point() +
    geom_smooth(color = "firebrick", se = FALSE) +
    geom_hline(yintercept = 0) +
    theme_bw()
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

library(lmtest)
## Loading required package: zoo
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
bptest(modelo)
## 
##  studentized Breusch-Pagan test
## 
## data:  modelo
## BP = 9.6099, df = 3, p-value = 0.02219
library(corrplot)
## corrplot 0.84 loaded
corrplot(cor(dplyr::select(datos, preescolar, primaria, secundaria)),
         method = "number", tl.col = "black")

Conclusión

Se determino mediante las gráficas obtenidas anteriormente que el nivel educativo donde hubo mayo deserción escolar en México durante el ciclo escolar 2019-2020 fue el nivel Superior, y en segundo lugar el nivel educativo Media Superior. Uno de los principales factores es el impacto de la COVID-19 en el índice de educación, en donde esulta necesario identificar las consecuencias que tendrá la pandemia en el sector educativo, con el fin de reformular acciones que puedan contribuir a enfrentar de mejor manera otras emergencias.

El Gobierno de México previó inicialmente el regreso a las escuelas en junio de 2020; sin embargo, el poco retroceso de las tasas de contagio llevó a que se decidiera prolongar este regreso hasta el siguiente año escolar, con el fin de reiniciar actividades en agosto de 2020.

Uno de los impactos que puede causar la deserción escolar en México son las consecuencias sociales por deserción escolar,por ejemplo, se pueden suscitar: menor probabilidad de participar en actividades cívicas, vivir en gran medida de la beneficencia y asistencia pública, ganar menor sueldo y contribuir menos a la economía del país, baja productividad laboral y vulnerabilidad social (desempleo, delincuencia, consumo de sustancias tóxicas, problemas de salud como depresión y ansiedad). Una de las acciones propuestas a tomar es que cada institución cree proyectos de apoyo para que los estudiantes concluyan exitosamente su carrera; y ponerle la atención necesaria la comunidad estudiantil, con programas como becas, tutorías, material didáctico, recursos dentro de la escuela como biblioteca, salón de informática o laboratorios especializados, así como también atender la salud mental.

Referencias

Statista. (2021, 31 marzo). México: deserción escolar durante la pandemia de COVID-19, por nivel. https://es.statista.com/estadisticas/1196796/desercion-escolar-nivel-educativo-covid-mexico/

Por Covid y pobreza, 9 millones de alumnos dejan la escuela. (2021, 24 marzo). El Universal. https://www.eluniversal.com.mx/cartera/por-covid-y-pobreza-9-millones-de-alumnos-dejan-la-escuela

Geografia, E. D. N. I. Y. (s. f.). Caracteristicas educativas de la población. INEGI. https://inegi.org.mx/temas/educacion/

DGPPYEE-SEP. (s. f.). SEP. http://www.planeacion.sep.gob.mx/estadisticaeindicadores.aspx