Introducción

Antecedentes

Gertel (2006) comparación del rendimiento en Lengua con datos del ONE 2000 por regiones:

Aquellas de menor riqueza relativa presentan un mayor peso de las variables asociadas a las escuelas, mientras que en las de mayor riqueza ocurre lo contrario.

  • La escuela contribuiría con una parte importante a las políticas de igualación de oportunidades en las regiones pobres.

León (2016) meta-análisis de la relación entre el nivel socioeconómico de las familias y rendimiento académico de los estudiantes peruanos entre 2000 y 2014:

En inicial se observa mayor tamaño del efecto del nivel socioeconómico de las familias a diferencia de primaria y secundaria.

  • Las escuela harían aporte a la reducción del efecto del nivel socioeconómico sobre los resultados.

El problema

¿Cómo puede la escuela mitigar la desigualdad originada por las condiciones familiares?

Fuente de datos y Método

Componentes del índice de NSE (Ministerio de Educación)

Los tres componentes tienen posibilidad de incidir

Los datos muestran que esa relación existe sobre los resultados de la pruebas

# descarga de los datos de https://www.argentina.gob.ar/sites/default/files/bases_usuarias_aprender_2021_csv_act.zip

argentina_2021 <- read.csv2("G:/Mi unidad/2023/AEPA/educacion/Base estudiantes 6 grado primaria 2021.csv")



# retener casos válidos de nse
argentina_2021<-subset(argentina_2021, is.na(argentina_2021$NSE_nivel)==F)

#  llevarla factor y rotular
argentina_2021$NSE_nivel<-as.factor(argentina_2021$NSE_nivel)
levels(argentina_2021$NSE_nivel)<-c("bajo", "medio", "alto")

# lo mismo para los desempeños
argentina_2021$ldesemp<-as.factor(argentina_2021$ldesemp)
levels(argentina_2021$ldesemp)<-c("Por debajo del básico",
                                  "Básico", "Satisfactorio",
                                  "Avanzado")
argentina_2021$mdesemp<-as.factor(argentina_2021$mdesemp)
levels(argentina_2021$mdesemp)<-c("Por debajo del básico",
                                  "Básico", "Satisfactorio",
                                  "Avanzado")

# gráficos
library(ggplot2)
library(ggthemes)
library(gridExtra)
library(kableExtra)
bp_lengua<-ggplot(argentina_2021, aes(NSE_nivel, lpuntaje, fill=NSE_nivel))+geom_boxplot()+
  xlab("Nivel socioeconómico")+ylab("Puntaje en la prueba de lengua")+
  theme_calc(base_family="serif")+theme(legend.position = "none")
bp_mate<-ggplot(argentina_2021, aes(NSE_nivel, mpuntaje, fill=NSE_nivel))+geom_boxplot()+
  xlab("Nivel socioeconómico")+ylab("Puntaje en la prueba de matemática")+
  theme_calc(base_family="serif")+theme(legend.position = "none")
bp_lengua

bp_mate

Con los puntajes categorizados

Lengua

kable(round(100*addmargins(prop.table(table(argentina_2021$NSE_nivel, argentina_2021$ldesemp),1),2),1)) %>% 
  kable_styling(latex_options="scale_down")
Por debajo del básico Básico Satisfactorio Avanzado Sum
bajo 42.5 28.3 22.6 6.6 100
medio 18.7 22.1 37.3 22.0 100
alto 8.4 13.0 36.1 42.5 100
  • \(\chi^2_{(6)}=74413\), \(p<.001\), \(V \ de \ Cramer=.26\)

Matemática

kable(round(100*addmargins(prop.table(table(argentina_2021$NSE_nivel, argentina_2021$mdesemp),1),2),1)) %>% 
  kable_styling(latex_options="scale_down")
Por debajo del básico Básico Satisfactorio Avanzado Sum
bajo 41.4 26.6 24.9 7.1 100
medio 20.1 22.9 42.2 14.9 100
alto 10.3 14.9 46.2 28.7 100
  • \(\chi^2_{(6)}=52296\), \(p<.001\), \(V \ de \ Cramer=.22\)
argentina_2021$nse<-(argentina_2021$NSE_puntaje-min(argentina_2021$NSE_puntaje, na.rm = T))/
  (max(argentina_2021$NSE_puntaje, na.rm = T)-min(argentina_2021$NSE_puntaje, na.rm = T))

modelo_0_lengua<-lm(lpuntaje ~ nse, data = argentina_2021)
modelo_0_mate<-lm(mpuntaje ~ nse, data = argentina_2021)

Modelo cero

\(puntajes=\beta_0+\beta_1*nse\)

Lengua \(AIC=\) 6691823.7462

library(tidycat)
library(dplyr)
library(broom)
lm(modelo_0_lengua) %>% 
   tidy() %>% 
   kable()
term estimate std.error statistic p.value
(Intercept) 339.4 0.4214 805.4 0
nse 267.2 0.8042 332.2 0

Matemática \(AIC=\) 6633414.1031

modelo_0_mate %>% 
   tidy() %>% 
   kable()
term estimate std.error statistic p.value
(Intercept) 374.7 0.4536 826.1 0
nse 225.0 0.8645 260.2 0

Hipótesis

Expresión sintética de la valoración subjetiva de los vínculos

Ítems del cuadernillo complementario

  • ¿Te gusta ir a la escuela?

  • ¿Te llevás bien con tus compañeros y compañeras?

  • Grado de acuerdo

    • En la escuela tengo amigos/as
    • Me siento parte de la escuela
    • En la escuela siento que me excluyen
    • En la escuela me siento incómodo y fuera de lugar
    • En la escuela me siento solo/a
  • Frecuencia con que otros/as estudiantes:

    • me dejaron de lado a propósito
    • se burlaron de mí
    • me quitaron mis cosas o las rompieron
    • me insultaron
    • me agredieron físicamente
    • pidieron a mis compañeros/as que no se junten conmigo
    • dijeron mentiras sobre mí
    • me amenazaron o insultaron a través de las redes sociales

“Índice de bienestar”

# asignar como perdidos los negativos
argentina_2021$ap32[argentina_2021$ap32<0]<-NA
argentina_2021$ap33[argentina_2021$ap33<0]<-NA
argentina_2021$ap34a[argentina_2021$ap34a<0]<-NA
argentina_2021$ap34b[argentina_2021$ap34b<0]<-NA
argentina_2021$ap34c[argentina_2021$ap34c<0]<-NA
argentina_2021$ap34d[argentina_2021$ap34d<0]<-NA
argentina_2021$ap34e[argentina_2021$ap34e<0]<-NA
argentina_2021$ap35a[argentina_2021$ap35a<0]<-NA
argentina_2021$ap35b[argentina_2021$ap35b<0]<-NA
argentina_2021$ap35c[argentina_2021$ap35c<0]<-NA
argentina_2021$ap35d[argentina_2021$ap35d<0]<-NA
argentina_2021$ap35e[argentina_2021$ap35e<0]<-NA
argentina_2021$ap35f[argentina_2021$ap35f<0]<-NA
argentina_2021$ap35g[argentina_2021$ap35g<0]<-NA
argentina_2021$ap35h[argentina_2021$ap35h<0]<-NA

# para que más puntaje sea más bienestar, invierto todas las que asignan números más grandes a malestar
# 34 c, d y e son las únicas positivas
argentina_2021$bienestar<- 3-argentina_2021$ap32+6-argentina_2021$ap33+4-argentina_2021$ap34a+4-argentina_2021$ap34b+
  argentina_2021$ap34c+argentina_2021$ap34d+argentina_2021$ap34e+4-argentina_2021$ap35a+
  4-argentina_2021$ap35b+4-argentina_2021$ap35c+4-argentina_2021$ap35d+4-argentina_2021$ap35e+
  4-argentina_2021$ap35f+4-argentina_2021$ap35g+4-argentina_2021$ap35h
# estandarización
argentina_2021$bienestar<-(argentina_2021$bienestar-min(argentina_2021$bienestar, na.rm=T))/(
  max(argentina_2021$bienestar, na.rm=T)-min(argentina_2021$bienestar, na.rm=T))
# modelos1
modelo_1_lengua<-lm(lpuntaje ~ nse+bienestar, data = argentina_2021)
modelo_1_mate<-lm(mpuntaje ~ nse+bienestar, data = argentina_2021)

Modelo 1

\(puntaje=\beta_0+\beta_1*nse+\beta_2*bienestar\)

Lengua \(AIC=\) 3659178.6881

modelo_1_lengua %>% 
   tidy() %>% 
   kable()
term estimate std.error statistic p.value
(Intercept) 333.65 1.107 301.45 0
nse 236.52 1.271 186.12 0
bienestar 48.84 1.059 46.14 0

Matemática \(AIC=\) 3639952.3386

modelo_1_mate %>% 
   tidy() %>% 
   kable()
term estimate std.error statistic p.value
(Intercept) 353.99 1.176 301.10 0
nse 181.02 1.350 134.10 0
bienestar 75.67 1.124 67.29 0
# modelos 2
modelo_2_lengua<-lm(lpuntaje ~ nse+bienestar+nse*bienestar, data = argentina_2021)
modelo_2_mate<-lm(mpuntaje ~ nse+bienestar+nse*bienestar, data = argentina_2021)

Modelo 2

\(puntaje=\beta_0+\beta_1*nse+\beta_2*bienestar+\beta_3*nse*bienestar\)

Lengua \(AIC=\) 3659180.6881

modelo_2_lengua %>% 
   tidy() %>% 
   kable()
term estimate std.error statistic p.value
(Intercept) 333.6448 4.003 83.346 0.0000
nse 236.5325 7.189 32.904 0.0000
bienestar 48.8520 4.766 10.249 0.0000
nse:bienestar -0.0172 8.532 -0.002 0.9984

Modelo 2

\(puntaje=\beta_0+\beta_1*nse+\beta_2*bienestar+\beta_3*nse*bienestar\)

Matemática \(AIC=\) 3639911.9701

modelo_2_mate %>% 
   tidy() %>% 
   kable()
term estimate std.error statistic p.value
(Intercept) 327.37 4.254 76.954 0
nse 229.95 7.636 30.114 0
bienestar 107.81 5.065 21.287 0
nse:bienestar -58.98 9.062 -6.509 0

Conclusión