IDH: IE

Cálculo del indicador de Educacion en el contexto del calculo del IDH para todas las comunas de Chile en un rango de años

Equipo DS DI

DataIntelligence
08-12-2021

1 Introducción

Nuestro objetivo es determinar el IDH por comuna en Chile y su evolución en el tiempo, según lo calcula el PNUD:

\[ HDI = (LEI \cdot EI \cdot II) ^\frac{1}{3} \] Donde:

  • Índice de esperanza de vida (LEI)
  • Índice de educación (IE)
  • Índice de ingresos (II)

En éste informe establecemos la metodología para el cálculo del IE para el año 2020, la cual es extensible a todos los años:

2 IDH: Educación

La educación es un componente importante del bienestar y se utiliza en la medida del desarrollo económico y la calidad de vida. Es un factor clave para determinar si un país es desarrollado, en desarrollo o subdesarrollado.

\[ EI = \frac{\frac{EYS}{18}+\frac{MYS}{15}}{2} \]

Desde 2010, el índice de educación se ha medido combinando el promedio de años de escolaridad de los adultos con los años de escolaridad esperados para los estudiantes menores de 25 años, cada uno de los cuales recibe una ponderación del 50%.

Antes de 2010, el índice de educación se medía mediante la tasa de alfabetización de adultos (con una ponderación de dos tercios) y la tasa bruta combinada de matrícula primaria, secundaria y terciaria (con una ponderación de un tercio).

2.1 EYS

EYS: La esperanza de vida escolar a los seis años es el número medio de años de escolarización previsible en el sistema educativo desde los seis años, según la tasa neta de escolarización que existe en cada edad.

Es la suma de las tasas netas de escolarización entre 6 y 25 años1, siendo la Tasa neta de escolaridad la relación entre los efectivos escolares de cada nivel a un específico grupo de edad y la población de dicho grupo de edad.

Los años esperados de educación es el un cálculo de la cantidad de años que se espera que un estudiante asista a la escuela o la universidad. En la mayoría de los países, un título de maestría representa el nivel de educación más alto que se puede obtener, y obtenerlo refleja 18 años de educación. Esto significa que si todos los estudiantes de un país se matriculan en una maestría, el índice EYS de ese país sería 1.0.

Es el número de años de escolarización que un niño en edad de ingresar a la escuela puede esperar recibir, si los patrones predominantes en las tasas de matrícula específicas por edad persisten a lo largo de la vida escolar del niño.

El Método para calcular EYS:

Tomamos grupos de edad entre los 6 y los 25 años. Por ejemplo, en el grupo de los de 6 años, tomamos a todos los matriculados y los dividimos por la población total de esa edad y así hasta los 25.

Sumamos todos éstos valores y los dividimos por 18.


2.2 MYS

MYS: la media de años de educación, es el cálculo del número promedio de años de educación que un persona mayor de 25 años ha recibido realmente . Se basa en los niveles de logro educativo de la población convertidos en años de escolaridad en función de la duración teórica de cada nivel educativo al que asiste. 15 años es el máximo proyectado de este indicador para 2025 y, por lo tanto, se utiliza como el máximo para el índice. Esto significa que un país cuyos ciudadanos hayan todos alcanzado los 15 años de educación a la edad de 25 años, tendría un índice MYS de 1.0.

Se asocia a la pregunta Censo-Casen: Cuántos años de escolaridad tiene? aplicado sólo a los mayores de 25 años.

casen_2020 <<- readRDS("C:/Users/chris/Desktop/archivos grandes/casen_2020_c.rds")

casen_2020 <- mutate_if(casen_2020, is.factor, as.character)

Para trabajar, se aplica un subset sobre los primeros 10000 registros y ya tenemos MYS:

prome_educ <- casen_2020[,c("comuna","edad","esc2")]
prome_educ <- filter(prome_educ, edad > 25)
prome_educ <- prome_educ[!is.na(prome_educ[,c("esc2")]),]

comunas <- unique(prome_educ$comuna)

MYS <- data.frame()

for (i in comunas) {

  filtro <- filter(prome_educ, comuna == i)
  calculo_prom <- data.frame(
  comuna = i,
  prom_educ = mean(filtro$esc2)
)
MYS <- rbind(MYS,calculo_prom)
}

# datatable(promedios)
head(MYS,6)
##          comuna prom_educ
## 1       Iquique 12.483921
## 2 Alto Hospicio 10.968391
## 3  Pozo Almonte 11.097345
## 4        Camiña  6.914894
## 5         Huara  8.731707
## 6          Pica 11.106557
# casen_2017 <<- readRDS("C:/Users/chris/OneDrive/Documentos/archivos_grandes/casen_2017_c.rds")
# casen_2017 <<- readRDS("C:/Users/enamo/Desktop/Shiny-R/Casen_en_pandemia_2020/casen/casen_2017_c.rds")
# casen_2017 <- mutate_if(casen_2017, is.factor, as.character)

Factor

Subset de variables

prueba_cat <- casen_2020[,c("expc","comuna","edad","asiste2")]
prueba_cat <- xtabs(expc~comuna+edad+asiste2, data = prueba_cat)
prueba_cat <- as.data.frame(prueba_cat)
prueba_cat$edad_f <- as.numeric(prueba_cat$edad)-1  
prueba_cat$asiste2 <- as.character(prueba_cat$asiste2)
prueba_cat <- filter(prueba_cat, edad_f >= 6 & edad_f <= 25)
head(prueba_cat,6)
##            comuna edad asiste2 Freq edad_f
## 1       Algarrobo    6  Asiste  304      6
## 2           Alhué    6  Asiste  141      6
## 3     Alto Biobío    6  Asiste    0      6
## 4 Alto del Carmen    6  Asiste  144      6
## 5   Alto Hospicio    6  Asiste 2125      6
## 6           Ancud    6  Asiste  422      6

Calculo de proporción por edad 6 a 25

EYS <- data.frame()
for (j in unique(prueba_cat$comuna)) {
  prueba <- filter(prueba_cat, comuna == j & asiste2 == "Asiste") 
  pob_edad <- filter(prueba_cat, comuna == j) 
  
  tb2 <- data.frame()
  for (i in prueba$edad_f) {
    filtro <- filter(prueba, edad_f == i)
    filtro2 <- filter(pob_edad, edad_f == i)
    
    
    tabla <- data.frame(
      comuna = j,
      edad = i,
      prop = filtro$Freq/sum(filtro2$Freq)
    )
    
    tb2 <- rbind(tb2,tabla)
    
  }
 EYS <- rbind(EYS,tb2)
}
# datatable(EYS, extensions = 'Buttons', escape = FALSE, rownames = FALSE,
#           options = list(dom = 'Bfrtip',
#           buttons = list('colvis', list(extend = 'collection',
#           buttons = list(
#           list(extend='copy'),
#           list(extend='excel',
#             filename = 'tabla'),
#           list(extend='pdf',
#             filename= 'tabla')),
#           text = 'Descargar')), scrollX = TRUE))

3 Prueba

filter(EYS, comuna == "Valdivia")
##      comuna edad      prop
## 1  Valdivia    6 0.9671485
## 2  Valdivia    7 0.9496222
## 3  Valdivia    8 0.9476041
## 4  Valdivia    9 0.9277537
## 5  Valdivia   10 0.8976109
## 6  Valdivia   11 0.9617117
## 7  Valdivia   12 0.9553116
## 8  Valdivia   13 0.7419718
## 9  Valdivia   14 0.8594882
## 10 Valdivia   15 1.0000000
## 11 Valdivia   16 0.9603457
## 12 Valdivia   17 0.8867925
## 13 Valdivia   18 0.6723947
## 14 Valdivia   19 0.6014260
## 15 Valdivia   20 0.6349331
## 16 Valdivia   21 0.6828135
## 17 Valdivia   22 0.5133183
## 18 Valdivia   23 0.5023810
## 19 Valdivia   24 0.3832033
## 20 Valdivia   25 0.4031570
prueba_edad <- casen_2020[,c("expc","comuna","edad","asiste2")]
prueba_edad <- filter(prueba_edad, comuna == "Valdivia", edad == 17)
prueba_edad <- xtabs(expc~comuna+edad+asiste2, data = prueba_edad)
prueba_edad <- as.data.frame(prueba_edad) 
prueba_edad
##     comuna edad   asiste2 Freq
## 1 Valdivia   17    Asiste 1457
## 2 Valdivia   17 No asiste  186
1457    /(1457  +186)
## [1] 0.8867925

4 Calculo de EI

EYS_2 <- data.frame()
for (l in unique(EYS$comuna)) {
  filter <- filter(EYS, comuna == l) 
  filter <- filter[!is.na(filter[,c("prop")]),]
  
  tabla <- data.frame(
    comuna = l,
    prop = sum(filter$prop)
  )
  EYS_2 <- rbind(EYS_2,tabla)
}
datatable(EYS_2)
EI_2 <- data.frame()
comunas_c <- unique(EYS$comuna)
for (l in 1:length(comunas_c)) {
  filter <- filter(EYS, comuna == comunas_c[l])  
  
  tabla <- data.frame(
  comuna = comunas_c[l],
  EI = (((EYS_2$prop[l]/18) + (MYS$prom_educ[l]/15)) / 2)
  )
  EI_2 <- rbind(EI_2,tabla)
  # print(tabla)
}
datatable(EI_2)
((EYS_2$prop[l]/20) + (MYS$prom_educ[l]/15)) / 2
## [1] 0.6647068