date: 06-10-2021

1 ETNIA

1.1 Leemos las bases de datos para construir etnia

casen_2006 <- readRDS(file = "C:/Users/chris/OneDrive/Documentos/archivos_grandes/casen_2006_c.rds")
casen_2006 <- mutate_if(casen_2006, is.factor, as.character)
casen_2009 <- readRDS(file = "C:/Users/chris/OneDrive/Documentos/archivos_grandes/casen_2009_c.rds")
casen_2009 <- mutate_if(casen_2009, is.factor, as.character)
casen_2011 <- readRDS(file = "C:/Users/chris/OneDrive/Documentos/archivos_grandes/casen_2011_c.rds")
casen_2011 <- mutate_if(casen_2011, is.factor, as.character)
casen_2013 <- readRDS(file = "C:/Users/chris/OneDrive/Documentos/archivos_grandes/casen_2013_c.rds")
casen_2013 <- mutate_if(casen_2013, is.factor, as.character)
casen_2015 <- readRDS(file = "C:/Users/chris/OneDrive/Documentos/archivos_grandes/casen_2015_c.rds")
casen_2015 <- mutate_if(casen_2015, is.factor, as.character)
casen_2017 <- readRDS(file = "C:/Users/chris/OneDrive/Documentos/archivos_grandes/casen_2017_c.rds")
casen_2017 <- mutate_if(casen_2017, is.factor, as.character)
casen_2020 <- readRDS(file = "C:/Users/chris/OneDrive/Documentos/archivos_grandes/casen_2020_e1.rds")
casen_2020 <- mutate_if(casen_2020, is.factor, as.character)

1.2 Extraccion

Extraemos un subset solo con los campos que nos interesan:

casen_2006 <- casen_2006[,c("EXPC", "COMUNA","EDUC","T4","SEXO","E1")]
casen_2009 <- casen_2009[,c("EXPC", "COMUNA","EDUC","T5","SEXO","E1")]
casen_2011 <- casen_2011[,c("expc_full", "comuna","e6a","r6","sexo","e1","r2p_cod")]
casen_2013 <- casen_2013[,c("expc", "comuna","e6a","r6","sexo","e1","r2_p_cod")]
casen_2015 <- casen_2015[,c("expc_todas", "comuna","e6a","r3","sexo","e1","r2espp_cod")]
casen_2017 <- casen_2017[,c("expc", "comuna","e6a","r3","sexo","e1","r2_p_cod")]
casen_2020 <- casen_2020[,c("expc", "comuna","e6a","r3","sexo","e1","r2_pais_esp")]

variable_etnia <- function(dataset){
  
variable <- switch(i,"T4","T5","r6","r6","r3","r3","r3")
  
dataset[,variable][dataset[,variable] == "Aimara" ]  <- "Aymara"
dataset[,variable][dataset[,variable] == "No pertenece a ninguno de estos pueblos indígenas" ]  <-  "No pertenece a ningún pueblo indígena" 
dataset[,variable][dataset[,variable] == "Mapuche"]  <- "Mapuche"
dataset[,variable][dataset[,variable] == "Diaguita"]  <- "Diaguita"
dataset[,variable][dataset[,variable] == "Atacameño (Likan-Antai)" ]  <- "Atacameño"
dataset[,variable][dataset[,variable] == "Atacameño (Likán Antai)" ]  <- "Atacameño"
dataset[,variable][dataset[,variable] == "Atacameño (Likán-Antai)" ]  <- "Atacameño"
dataset[,variable][dataset[,variable] == "Yámana o Yagán" ]  <- "Yagán"
dataset[,variable][dataset[,variable] == "Yagan" ]  <- "Yagán"
dataset[,variable][dataset[,variable] == "Yagán (Yámana)" ]  <- "Yagán"
dataset[,variable][dataset[,variable] == "Rapa-Nui o Pascuenses"]  <- "Pascuense"
dataset[,variable][dataset[,variable] == "Rapa-Nui"]  <- "Pascuense"
dataset[,variable][dataset[,variable] == "Rapa Nui (Pascuense)"]  <- "Pascuense"
dataset[,variable][dataset[,variable] == "Collas"]  <- "Coya"
dataset[,variable][dataset[,variable] == "Kawashkar o Alacalufes" ]  <- "Alacalufe"
dataset[,variable][dataset[,variable] == "Kawashkar" ]  <- "Alacalufe"
dataset[,variable][dataset[,variable] == "Kawésqar (Alacalufes)" ]  <- "Alacalufe"
dataset[,variable][dataset[,variable] == "Kawésqar" ]  <- "Alacalufe"
dataset[,variable][dataset[,variable] == "Kawaskar" ]  <- "Alacalufe"
dataset[,variable][dataset[,variable] ==  "Sin dato"]  <- NA
dataset[,variable][dataset[,variable] ==  "NS/NR"   ]  <- NA
dataset[,variable][dataset[,variable] == "No sabe/no responde" ]  <- NA 

    switch(i,
        case =  casen_2006 <<- dataset,
        case =  casen_2009 <<- dataset,
        case =  casen_2011 <<- dataset,
        case =  casen_2013 <<- dataset,
        case =  casen_2015 <<- dataset,
        case =  casen_2017 <<- dataset,
        case =  casen_2020 <<- dataset 
)
}

for (i in 1:7) {
  
  switch(i,
        case = casen <- casen_2006,
        case = casen <- casen_2009,
        case = casen <- casen_2011,
        case = casen <- casen_2013,
        case = casen <- casen_2015,
        case = casen <- casen_2017,
        case = casen <- casen_2020
)
  
  variable_etnia(casen)
  
}

Homologación de alfabetismo

variable_alfa <- function(dataset){
    
variable <- switch(i,"E1","E1","e1","e1","e1","e1","e1")   
    
dataset[,variable][dataset[,variable] == "No sabe /Sin dato" ]  <- NA
dataset[,variable][dataset[,variable] == "Sí, lee y escribe" ]  <- "Sí"  
dataset[,variable][dataset[,variable] == "No, sólo lee" ]  <- "No"
dataset[,variable][dataset[,variable] == "No, ninguno" ]  <-"No"
dataset[,variable][dataset[,variable] == "No, sólo escribe" ]  <- "No"
#dataset_1 <<- dataset
 
  switch(i,
        case =  casen_2006 <<- dataset,
        case =  casen_2009 <<- dataset,
        case =  casen_2011 <<- dataset,
        case =  casen_2013 <<- dataset,
        case =  casen_2015 <<- dataset,
        case =  casen_2017 <<- dataset,
        case =  casen_2020 <<- dataset 
)
}

for (i in 1:6) {
  
  switch(i,
        case = casen <- casen_2006,
        case = casen <- casen_2009,
        case = casen <- casen_2011,
        case = casen <- casen_2013,
        case = casen <- casen_2015,
        case = casen <- casen_2017,
        case = casen <- casen_2020
)
  variable_alfa(casen)
}

Homologación de variable

variable_en_estudio <- function(dataset){
    
variable <- switch(i,"EDUC","EDUC","e6a","e6a","e6a","e6a","e6a")       
    
dataset[,variable][dataset[,variable]== 'BASICA COMPL.' ] <-    'basica'
dataset[,variable][dataset[,variable]== 'BASICA INCOM.' ] <-    'basica'
dataset[,variable][dataset[,variable]== 'Básica Incompleta' ] <-    'basica'
dataset[,variable][dataset[,variable]== 'Básica Completa'   ] <-    'basica'
dataset[,variable][dataset[,variable]== 'Primaria/Preparatoria (sistema antiguo)'   ] <-    'basica'
dataset[,variable][dataset[,variable]== 'Educación Básica'  ] <-    'basica'
dataset[,variable][dataset[,variable]== 'Primaria o Preparatoria (Sistema Antiguo)' ] <-    'basica'
dataset[,variable][dataset[,variable]== 'Primaria o Preparatoria (Sistema antiguo)' ] <-    'basica'
dataset[,variable][dataset[,variable]== 'Educación especial (diferencial)'  ] <-    'diferencial'
dataset[,variable][dataset[,variable]== 'Educación Especial (Diferencial)'  ] <-    'diferencial'
dataset[,variable][dataset[,variable]== 'Kinder/Pre-kinder' ] <-    'kinder'
dataset[,variable][dataset[,variable]== 'Jardín infantil/Sala cuna' ] <-    'kinder'
dataset[,variable][dataset[,variable]== 'Prekinder / Kinder (Transición menor y Transición Mayor)'  ] <-    'kinder'
dataset[,variable][dataset[,variable]== 'Jardín Infantil (Medio menor y Medio mayor)'   ] <-    'kinder'
dataset[,variable][dataset[,variable]== 'Sala cuna' ] <-    'kinder'
dataset[,variable][dataset[,variable]== 'Prekinder/Kinder (Transición menor y Transición Mayor)'    ] <-    'kinder'
dataset[,variable][dataset[,variable]== 'Prekínder / Kínder (Transición menor y Transición Mayor)'  ] <-    'kinder'
dataset[,variable][dataset[,variable]== 'M.HUM. INCOMPLETA' ] <-    'media'
dataset[,variable][dataset[,variable]== 'M.TEC COMPLETA'    ] <-    'media'
dataset[,variable][dataset[,variable]== 'M.TEC.PROF. INCOMPLETA'    ] <-    'media'
dataset[,variable][dataset[,variable]== 'M.HUM. COMPLETA'   ] <-    'media'
dataset[,variable][dataset[,variable]== 'Media Humanista Completa'  ] <-    'media'
dataset[,variable][dataset[,variable]== 'Media Humanista Incompleta'    ] <-    'media'
dataset[,variable][dataset[,variable]== 'Media Técnico Completa'    ] <-    'media'
dataset[,variable][dataset[,variable]== 'Media Técnico Profesional Incompleta'  ] <-    'media'
dataset[,variable][dataset[,variable]== 'Humanidades (sistema antiguo)' ] <-    'media'
dataset[,variable][dataset[,variable]== 'Educación Media Científico-Humanista'  ] <-    'media'
dataset[,variable][dataset[,variable]== 'Educación Media Técnica Profesional'   ] <-    'media'
dataset[,variable][dataset[,variable]== 'Humanidades (Sistema Antiguo)' ] <-    'media'
dataset[,variable][dataset[,variable]== ''  ] <-    'NA'
dataset[,variable][dataset[,variable]== 'SIN EDUC. FORMAL'  ] <-    'NA'
dataset[,variable][dataset[,variable]== 'SIN DATO'  ] <-    'NA'
dataset[,variable][dataset[,variable]== 'Sin Educación Formal'  ] <-    'NA'
dataset[,variable][dataset[,variable]== 'Nunca asistió' ] <-    'NA'
dataset[,variable][dataset[,variable]== 'NS/NR' ] <-    'NA'
dataset[,variable][dataset[,variable]== 'sin dato'  ] <-    'NA'
dataset[,variable][dataset[,variable]== 'No sabe/no responde'   ] <-    'NA'
dataset[,variable][dataset[,variable]== 'TECNICA  O UNIV. COMPLETA' ] <-    'superior'
dataset[,variable][dataset[,variable]== 'TEC. O UNIV.  INCOMPLETA.' ] <-    'superior'
dataset[,variable][dataset[,variable]== 'Técnica o Universitaria Completa'  ] <-    'superior'
dataset[,variable][dataset[,variable]== 'Técnica ó Universitaria Incompleta'    ] <-    'superior'
dataset[,variable][dataset[,variable]== 'Profesional'   ] <-    'superior'
dataset[,variable][dataset[,variable]== 'Técnico Nivel Superior'    ] <-    'superior'
dataset[,variable][dataset[,variable]== 'Postgrado' ] <-    'superior'
dataset[,variable][dataset[,variable]== 'Técnica, Comercial, Industrial o Normalista'   ] <-    'superior'
dataset[,variable][dataset[,variable]== 'Técnico Nivel Superior (carreras de 1 a 3 años)'   ] <-    'superior'
dataset[,variable][dataset[,variable]== 'Profesional (carreras de 4 o más años)'    ] <-    'superior'
dataset[,variable][dataset[,variable]== 'Técnica, Comercial, Industrial o Normalista (sistema antiguo)' ] <-    'superior'
dataset[,variable][dataset[,variable]== 'Profesional Completo (Carreras 4 ó más años)'  ] <-    'superior'
dataset[,variable][dataset[,variable]== 'Técnico Nivel Superior Completo (Carreras 1 a 3 años)' ] <-    'superior'
dataset[,variable][dataset[,variable]== 'Profesional Incompleto (Carreras 4 ó más años)'    ] <-    'superior'
dataset[,variable][dataset[,variable]== 'Técnica, Comercial, Industrial o Normalista (Sistema Antiguo'  ] <-    'superior'
dataset[,variable][dataset[,variable]== 'Técnico Nivel Superior Incompleto (Carreras 1 a 3 años)'   ] <-    'superior'
dataset[,variable][dataset[,variable]== 'Postgrado Completo'    ] <-    'superior'
dataset[,variable][dataset[,variable]== 'Postgrado Incompleto'  ] <-    'superior'
dataset[,variable][dataset[,variable]== 'Profesional Incompleto (Carreras 4  o más años)'   ] <-    'superior'
dataset[,variable][dataset[,variable]== 'Profesional Completo (Carreras 4 o más años)'  ] <-    'superior'
dataset[,variable][dataset[,variable]== 'Técnica Comercial, Industrial o Normalista (Sistema Antiguo)'  ] <-    'superior'


  switch(i,
        case =  casen_2006 <<- dataset,
        case =  casen_2009 <<- dataset,
        case =  casen_2011 <<- dataset,
        case =  casen_2013 <<- dataset,
        case =  casen_2015 <<- dataset,
        case =  casen_2017 <<- dataset,
        case =  casen_2020 <<- dataset 
)
}

for (i in 1:7) {
  
  switch(i,
        case = casen <- casen_2006,
        case = casen <- casen_2009,
        case = casen <- casen_2011,
        case = casen <- casen_2013,
        case = casen <- casen_2015,
        case = casen <- casen_2017,
        case = casen <- casen_2020
)
 variable_en_estudio(casen)
}

for (i in unique(casen_2020$r2_pais_esp)) {
  pais <- gsub("(^[[:space:]]+|[[:space:]]+$)", "", i)
  pais <- tolower(pais)
  casen_2020$r2_pais_esp[casen_2020$r2_pais_esp == i] <- str_to_title(pais) 
} 

casen_2011$r2p_cod[casen_2011$r2p_cod == "No contesta"] <- "NS/NR"
casen_2013$r2_p_cod[casen_2013$r2_p_cod == "No contesta"] <- "NS/NR"
casen_2015$r2espp_cod[casen_2015$r2espp_cod == "No contesta"] <- "NS/NR"
casen_2017$r2_p_cod[casen_2017$r2_p_cod == "No Bien Especificado"] <- "NS/NR"
casen_2017$r2_p_cod[casen_2017$r2_p_cod == "No Responde"] <- "NS/NR"
casen_2020$r2_pais_esp[casen_2020$r2_pais_esp == "No Bien Especificado"] <- "NS/NR"
casen_2020$r2_pais_esp[casen_2020$r2_pais_esp == ""] <- NA
casen_2020$r2_pais_esp[casen_2020$r2_pais_esp == "No Responde"] <- "NS/NR"

1.2.1 2006

ab <- casen_2006

b <- ab$COMUNA
c <- ab$EDUC
d <- ab$T4
e <- ab$SEXO
f <- ab$E1

cross_tab =  xtabs(ab$EXPC ~   unlist(b) + unlist(c)  + unlist(d) + unlist(e)  + unlist(f),aggregate(ab$EXPC ~  unlist(b) + unlist(c) + unlist(d) + unlist(e) + unlist(f) ,ab,mean))
tabla <- as.data.frame(cross_tab)
d <-tabla[!(tabla$Freq == 0),]
d$anio <- "2006"
      
names(d)[1] <- "comuna"
names(d)[2] <- "Estudios"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Sabe leer?"
names(d)[6] <- "Frecuencia"
names(d)[7] <- "Año"

d_2006 <- d

1.2.2 2009

Generamos las tablas de contingencia tal como acostumbramos:

ab <- casen_2009

b <- ab$COMUNA
c <- ab$EDUC
d <- ab$T5
e <- ab$SEXO
f <- ab$E1

cross_tab =  xtabs(ab$EXPC~   unlist(b) + unlist(c)  + unlist(d) + unlist(e)  + unlist(f),aggregate(ab$EXPC ~  unlist(b) + unlist(c) + unlist(d) + unlist(e) + unlist(f) ,ab,mean))

tabla <- as.data.frame(cross_tab)

d <-tabla[!(tabla$Freq == 0),]
d$anio <- "2009"

names(d)[1] <- "comuna"
names(d)[2] <- "Estudios"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Sabe leer?"
names(d)[6] <- "Frecuencia"
names(d)[7] <- "Año"

d_2009 <- d

1.2.3 2011

Generamos las tablas de contingencia tal como acostumbramos:

ab <- casen_2011

b <- ab$comuna
c <- ab$e6a
d <- ab$r6
e <- ab$sexo
f <- ab$e1

cross_tab =  xtabs(ab$expc_full ~   unlist(b) + unlist(c)  + unlist(d) + unlist(e)  + unlist(f),aggregate(ab$expc_full ~  unlist(b) + unlist(c) + unlist(d) + unlist(e) + unlist(f) ,ab,mean))
tabla <- as.data.frame(cross_tab)
d <-tabla[!(tabla$Freq == 0),]
d$anio <- "2011"
      
names(d)[1] <- "comuna"
names(d)[2] <- "Estudios"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Sabe leer?"
names(d)[6] <- "Frecuencia"
names(d)[7] <- "Año"

d_2011 <- d

1.2.4 2013

Generamos las tablas de contingencia tal como acostumbramos:

ab <- casen_2013

b <- ab$comuna
c <- ab$e6a
d <- ab$r6
e <- ab$sexo
f <- ab$e1

cross_tab =  xtabs(ab$expc ~   unlist(b) + unlist(c)  + unlist(d) + unlist(e)  + unlist(f),aggregate(ab$expc ~  unlist(b) + unlist(c) + unlist(d) + unlist(e) + unlist(f) ,ab,mean))
tabla <- as.data.frame(cross_tab)
d <-tabla[!(tabla$Freq == 0),]
d$anio <- "2013"
      
names(d)[1] <- "comuna"
names(d)[2] <- "Estudios"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Sabe leer?"
names(d)[6] <- "Frecuencia"
names(d)[7] <- "Año"

d_2013 <- d

1.2.5 2015

Generamos las tablas de contingencia tal como acostumbramos:

ab <- casen_2015

b <- ab$comuna
c <- ab$e6a
d <- ab$r3
e <- ab$sexo
f <- ab$e1

cross_tab =  xtabs(ab$expc_todas ~   unlist(b) + unlist(c)  + unlist(d) + unlist(e)  + unlist(f),aggregate(ab$expc_todas ~  unlist(b) + unlist(c) + unlist(d) + unlist(e) + unlist(f) ,ab,mean))
tabla <- as.data.frame(cross_tab)
d <-tabla[!(tabla$Freq == 0),]
d$anio <- "2015"
      
names(d)[1] <- "comuna"
names(d)[2] <- "Estudios"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Sabe leer?"
names(d)[6] <- "Frecuencia"
names(d)[7] <- "Año"

d_2015 <- d

1.2.6 2017

Generamos las tablas de contingencia tal como acostumbramos:

ab <- casen_2017

b <- ab$comuna
c <- ab$e6a
d <- ab$r3
e <- ab$sexo
f <- ab$e1

cross_tab =  xtabs(ab$expc ~   unlist(b) + unlist(c)  + unlist(d) + unlist(e)  + unlist(f),aggregate(ab$expc ~  unlist(b) + unlist(c) + unlist(d) + unlist(e) + unlist(f) ,ab,mean))
tabla <- as.data.frame(cross_tab)
d <-tabla[!(tabla$Freq == 0),]
d$anio <- "2017"
      
names(d)[1] <- "comuna"
names(d)[2] <- "Estudios"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Sabe leer?"
names(d)[6] <- "Frecuencia"
names(d)[7] <- "Año"

d_2017 <- d

2 2020

Generamos las tablas de contingencia tal como acostumbramos:

ab <- casen_2020

b <- ab$comuna
c <- ab$e6a
d <- ab$r3
e <- ab$sexo
f <- ab$e1

cross_tab =  xtabs(ab$expc ~   unlist(b) + unlist(c)  + unlist(d) + unlist(e) + unlist(f) ,aggregate(ab$expc ~  unlist(b) + unlist(c) + unlist(d) + unlist(e)  + unlist(f),ab,mean))
tabla <- as.data.frame(cross_tab)
d <-tabla[!(tabla$Freq == 0),]
d$anio <- "2020"
      
names(d)[1] <- "comuna"
names(d)[2] <- "Estudios"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Sabe leer?"
names(d)[6] <- "Frecuencia"

d_2020 <- d

d_2020 <- mutate_if(d_2020, is.factor, as.character)
d_2020$`Sabe leer?`[d_2020$`Sabe leer?` == 0] <- "Sí"
d_2020$`Sabe leer?`[d_2020$`Sabe leer?` == 1] <- "No"

Unimos y desplegamos la tabla corregida:

3 Tabla final etnia homologada

union_etnia <- rbind(d_2006,d_2009, d_2011, d_2013, d_2015, d_2017)
union_etnia <- mutate_if(union_etnia, is.factor, as.character)
union <-union_etnia

#fn_etnia(union)

cod_com <- readRDS("C:/Users/chris/OneDrive/Documentos/archivos_grandes/codigos_comunales_2006-2020.rds") 
names(cod_com)[2] <- "comuna"
tab_f <- merge(x=union_etnia, y=cod_com, by="comuna") 
Etnia <- c(sort(unique(tab_f$Etnia)[-6]),"No pertenece a ningún pueblo indígena",NA)
Etnia<- as.data.frame(Etnia)
Etnia$cod_etnia <- paste("00",seq(1:nrow(Etnia)), sep = "")
codigos <- Etnia$cod_etnia
rango <- seq(1:nrow(Etnia))
cadena <- paste("",codigos[rango], sep = "")
cadena <- substr(cadena,(nchar(cadena)[rango])-(1),4)
codigos <- as.data.frame(codigos)
cadena <- as.data.frame(cadena)
codigos <- cbind(Etnia,cadena)  
colnames(codigos) <- c("Etnia","cadena","cod_etnia")

tab_f <- merge(x=tab_f, y=codigos, by="Etnia") 

tab_f$cod_sexo <- tab_f$Sexo
tab_f$cod_sexo[tab_f$cod_sexo == "Hombre"] <- "01"
tab_f$cod_sexo[tab_f$cod_sexo == "Mujer"] <- "02"

tab_f$cod_alfa <- tab_f$`Sabe leer?`
tab_f$cod_alfa[tab_f$cod_alfa == "Sí"] <- "01"
tab_f$cod_alfa[tab_f$cod_alfa == "No"] <- "02"

tab_f$cod_variable <- tab_f$Estudios
tab_f$cod_variable[tab_f$cod_variable ==    'basica'    ] <-    '1'
tab_f$cod_variable[tab_f$cod_variable ==    'basica'    ] <-    '1'
tab_f$cod_variable[tab_f$cod_variable ==    'basica'    ] <-    '1'
tab_f$cod_variable[tab_f$cod_variable ==    'basica'    ] <-    '1'
tab_f$cod_variable[tab_f$cod_variable ==    'basica'    ] <-    '1'
tab_f$cod_variable[tab_f$cod_variable ==    'basica'    ] <-    '1'
tab_f$cod_variable[tab_f$cod_variable ==    'basica'    ] <-    '1'
tab_f$cod_variable[tab_f$cod_variable ==    'basica'    ] <-    '1'
tab_f$cod_variable[tab_f$cod_variable ==    'diferencial'   ] <-    '2'
tab_f$cod_variable[tab_f$cod_variable ==    'diferencial'   ] <-    '2'
tab_f$cod_variable[tab_f$cod_variable ==    'kinder'    ] <-    '3'
tab_f$cod_variable[tab_f$cod_variable ==    'kinder'    ] <-    '3'
tab_f$cod_variable[tab_f$cod_variable ==    'kinder'    ] <-    '3'
tab_f$cod_variable[tab_f$cod_variable ==    'kinder'    ] <-    '3'
tab_f$cod_variable[tab_f$cod_variable ==    'kinder'    ] <-    '3'
tab_f$cod_variable[tab_f$cod_variable ==    'kinder'    ] <-    '3'
tab_f$cod_variable[tab_f$cod_variable ==    'kinder'    ] <-    '3'
tab_f$cod_variable[tab_f$cod_variable ==    'media' ] <-    '4'
tab_f$cod_variable[tab_f$cod_variable ==    'media' ] <-    '4'
tab_f$cod_variable[tab_f$cod_variable ==    'media' ] <-    '4'
tab_f$cod_variable[tab_f$cod_variable ==    'media' ] <-    '4'
tab_f$cod_variable[tab_f$cod_variable ==    'media' ] <-    '4'
tab_f$cod_variable[tab_f$cod_variable ==    'media' ] <-    '4'
tab_f$cod_variable[tab_f$cod_variable ==    'media' ] <-    '4'
tab_f$cod_variable[tab_f$cod_variable ==    'media' ] <-    '4'
tab_f$cod_variable[tab_f$cod_variable ==    'media' ] <-    '4'
tab_f$cod_variable[tab_f$cod_variable ==    'media' ] <-    '4'
tab_f$cod_variable[tab_f$cod_variable ==    'media' ] <-    '4'
tab_f$cod_variable[tab_f$cod_variable ==    'media' ] <-    '4'
tab_f$cod_variable[tab_f$cod_variable ==    'NA'    ] <-    '5'
tab_f$cod_variable[tab_f$cod_variable ==    'NA'    ] <-    '5'
tab_f$cod_variable[tab_f$cod_variable ==    'NA'    ] <-    '5'
tab_f$cod_variable[tab_f$cod_variable ==    'NA'    ] <-    '5'
tab_f$cod_variable[tab_f$cod_variable ==    'NA'    ] <-    '5'
tab_f$cod_variable[tab_f$cod_variable ==    'NA'    ] <-    '5'
tab_f$cod_variable[tab_f$cod_variable ==    'NA'    ] <-    '5'
tab_f$cod_variable[tab_f$cod_variable ==    'NA'    ] <-    '5'
tab_f$cod_variable[tab_f$cod_variable ==    'superior'  ] <-    '6'
tab_f$cod_variable[tab_f$cod_variable ==    'superior'  ] <-    '6'
tab_f$cod_variable[tab_f$cod_variable ==    'superior'  ] <-    '6'
tab_f$cod_variable[tab_f$cod_variable ==    'superior'  ] <-    '6'
tab_f$cod_variable[tab_f$cod_variable ==    'superior'  ] <-    '6'
tab_f$cod_variable[tab_f$cod_variable ==    'superior'  ] <-    '6'
tab_f$cod_variable[tab_f$cod_variable ==    'superior'  ] <-    '6'
tab_f$cod_variable[tab_f$cod_variable ==    'superior'  ] <-    '6'
tab_f$cod_variable[tab_f$cod_variable ==    'superior'  ] <-    '6'
tab_f$cod_variable[tab_f$cod_variable ==    'superior'  ] <-    '6'
tab_f$cod_variable[tab_f$cod_variable ==    'superior'  ] <-    '6'
tab_f$cod_variable[tab_f$cod_variable ==    'superior'  ] <-    '6'
tab_f$cod_variable[tab_f$cod_variable ==    'superior'  ] <-    '6'
tab_f$cod_variable[tab_f$cod_variable ==    'superior'  ] <-    '6'
tab_f$cod_variable[tab_f$cod_variable ==    'superior'  ] <-    '6'
tab_f$cod_variable[tab_f$cod_variable ==    'superior'  ] <-    '6'
tab_f$cod_variable[tab_f$cod_variable ==    'superior'  ] <-    '6'
tab_f$cod_variable[tab_f$cod_variable ==    'superior'  ] <-    '6'
tab_f$cod_variable[tab_f$cod_variable ==    'superior'  ] <-    '6'
tab_f$cod_variable[tab_f$cod_variable ==    'superior'  ] <-    '6'
tab_f$cod_variable[tab_f$cod_variable ==    'superior'  ] <-    '6'

datatable(tab_f, extensions = 'Buttons', escape = FALSE, rownames = FALSE,
          options = list(dom = 'Bfrtip',
          buttons = list('colvis', list(extend = 'collection',
          buttons = list(
          list(extend='copy'),
          list(extend='excel',
            filename = 'tabla_ytotcor_e5a'),
          list(extend='pdf',
            filename= 'tabla_ytotcor_e5a')),
          text = 'Download')), scrollX = TRUE))

4 MIGRA

4.0.1 2011

Generamos las tablas de contingencia tal como acostumbramos:

ab <- casen_2011

b <- ab$comuna
c <- ab$e6a
d <- ab$r2p_cod
e <- ab$sexo
f <- ab$e1

cross_tab =  xtabs(ab$expc_full ~   unlist(b) + unlist(c)  + unlist(d) + unlist(e)  + unlist(f),aggregate(ab$expc_full ~  unlist(b) + unlist(c) + unlist(d) + unlist(e) + unlist(f) ,ab,mean))
tabla <- as.data.frame(cross_tab)
d <-tabla[!(tabla$Freq == 0),]
d$anio <- "2011"

names(d)[1] <- "comuna"
names(d)[2] <- "Estudios"
names(d)[3] <- "Origen"
names(d)[4] <- "Sexo"
names(d)[5] <- "Sabe leer?"
names(d)[6] <- "Frecuencia"
names(d)[7] <- "Año"

d_2011 <- d

4.0.2 2013

ab <- casen_2013

b <- ab$comuna
c <- ab$e6a
d <- ab$r2_p_cod 
e <- ab$sexo
f <- ab$e1

cross_tab =  xtabs(ab$expc ~   unlist(b) + unlist(c)  + unlist(d) + unlist(e)  + unlist(f),aggregate(ab$expc ~  unlist(b) + unlist(c) + unlist(d) + unlist(e) + unlist(f) ,ab,mean)) 
tabla <- as.data.frame(cross_tab)
d <-tabla[!(tabla$Freq == 0),]
d$anio <- "2013"

names(d)[1] <- "comuna"
names(d)[2] <- "Estudios"
names(d)[3] <- "Origen"
names(d)[4] <- "Sexo"
names(d)[5] <- "Sabe leer?"
names(d)[6] <- "Frecuencia"
names(d)[7] <- "Año"
d_2013 <- d

4.0.3 2015

 ab <- casen_2015

b <- ab$comuna 
c <- ab$e6a 
d <- ab$r2espp_cod 
e <- ab$sexo 
f <- ab$e1 

 cross_tab =  xtabs(ab$expc_todas ~   unlist(b) + unlist(c)  + unlist(d) + unlist(e)  + unlist(f),aggregate(ab$expc_todas ~  unlist(b) + unlist(c) + unlist(d) + unlist(e) + unlist(f) ,ab,mean))
 tabla <- as.data.frame(cross_tab)
 d <-tabla[!(tabla$Freq == 0),] 
 d$anio <- "2015"

 names(d)[1] <- "comuna"
 names(d)[2] <- "Estudios" 
 names(d)[3] <- "Origen" 
 names(d)[4] <- "Sexo" 
 names(d)[5] <- "Sabe leer?" 
 names(d)[6] <- "Frecuencia" 
 names(d)[7] <- "Año" 

 d_2015 <- d

4.0.4 2017

ab <- casen_2017

b <- ab$comuna
c <- ab$e6a
d <- ab$r2_p_cod
e <- ab$sexo
f <- ab$e1

cross_tab =  xtabs(ab$expc~   unlist(b) + unlist(c)  + unlist(d) + unlist(e)  + unlist(f),aggregate(ab$expc ~  unlist(b) + unlist(c) + unlist(d) + unlist(e) + unlist(f) ,ab,mean))
tabla <- as.data.frame(cross_tab)
d <-tabla[!(tabla$Freq == 0),]
d$anio <- "2017"

names(d)[1] <- "comuna"
names(d)[2] <- "Estudios"
names(d)[3] <- "Origen"
names(d)[4] <- "Sexo"
names(d)[5] <- "Sabe leer?"
names(d)[6] <- "Frecuencia"
names(d)[7] <- "Año"

d_2017 <- d

4.0.5 2020

ab <- casen_2020

b <- ab$comuna
c <- ab$e6a
d <- ab$r2_pais_esp
e <- ab$sexo
f <- ab$e1

cross_tab =  xtabs(ab$expc ~   unlist(b) + unlist(c)  + unlist(d) + unlist(e)  + unlist(f),aggregate(ab$expc ~  unlist(b) + unlist(c) + unlist(d) + unlist(e)  + unlist(f),ab,mean))
tabla <- as.data.frame(cross_tab)
d <-tabla[!(tabla$Freq == 0),]
d$anio <- "2020"
names(d)[1] <- "comuna"
names(d)[2] <- "Estudios"
names(d)[3] <- "Origen"
names(d)[4] <- "Sexo"
names(d)[5] <- "Sabe leer?"
names(d)[6] <- "Frecuencia"
names(d)[7] <- "Año"
d_2020 <- d

Unimos y desplegamos la tabla corregida:

5 Tabla final inmigración homologada

union_etnia <- rbind(d_2011, d_2013, d_2015, d_2017, d_2020)
union_etnia <- mutate_if(union_etnia, is.factor, as.character)
union <-union_etnia

union$cod_sexo <- union$Sexo
union$cod_sexo[union$cod_sexo == "Hombre"] <- "01"
union$cod_sexo[union$cod_sexo == "Mujer"] <- "02"

union$cod_alfa <- union$`Sabe leer?`
union$cod_alfa[union$cod_alfa == "Sí"] <- "01"
union$cod_alfa[union$cod_alfa == "No"] <- "02"

union$cod_variable <- union$Estudios
union$cod_variable[union$cod_variable ==    'basica'    ] <-    '1'
union$cod_variable[union$cod_variable ==    'basica'    ] <-    '1'
union$cod_variable[union$cod_variable ==    'basica'    ] <-    '1'
union$cod_variable[union$cod_variable ==    'basica'    ] <-    '1'
union$cod_variable[union$cod_variable ==    'basica'    ] <-    '1'
union$cod_variable[union$cod_variable ==    'basica'    ] <-    '1'
union$cod_variable[union$cod_variable ==    'basica'    ] <-    '1'
union$cod_variable[union$cod_variable ==    'basica'    ] <-    '1'
union$cod_variable[union$cod_variable ==    'diferencial'   ] <-    '2'
union$cod_variable[union$cod_variable ==    'diferencial'   ] <-    '2'
union$cod_variable[union$cod_variable ==    'kinder'    ] <-    '3'
union$cod_variable[union$cod_variable ==    'kinder'    ] <-    '3'
union$cod_variable[union$cod_variable ==    'kinder'    ] <-    '3'
union$cod_variable[union$cod_variable ==    'kinder'    ] <-    '3'
union$cod_variable[union$cod_variable ==    'kinder'    ] <-    '3'
union$cod_variable[union$cod_variable ==    'kinder'    ] <-    '3'
union$cod_variable[union$cod_variable ==    'kinder'    ] <-    '3'
union$cod_variable[union$cod_variable ==    'media' ] <-    '4'
union$cod_variable[union$cod_variable ==    'media' ] <-    '4'
union$cod_variable[union$cod_variable ==    'media' ] <-    '4'
union$cod_variable[union$cod_variable ==    'media' ] <-    '4'
union$cod_variable[union$cod_variable ==    'media' ] <-    '4'
union$cod_variable[union$cod_variable ==    'media' ] <-    '4'
union$cod_variable[union$cod_variable ==    'media' ] <-    '4'
union$cod_variable[union$cod_variable ==    'media' ] <-    '4'
union$cod_variable[union$cod_variable ==    'media' ] <-    '4'
union$cod_variable[union$cod_variable ==    'media' ] <-    '4'
union$cod_variable[union$cod_variable ==    'media' ] <-    '4'
union$cod_variable[union$cod_variable ==    'media' ] <-    '4'
union$cod_variable[union$cod_variable ==    'NA'    ] <-    '5'
union$cod_variable[union$cod_variable ==    'NA'    ] <-    '5'
union$cod_variable[union$cod_variable ==    'NA'    ] <-    '5'
union$cod_variable[union$cod_variable ==    'NA'    ] <-    '5'
union$cod_variable[union$cod_variable ==    'NA'    ] <-    '5'
union$cod_variable[union$cod_variable ==    'NA'    ] <-    '5'
union$cod_variable[union$cod_variable ==    'NA'    ] <-    '5'
union$cod_variable[union$cod_variable ==    'NA'    ] <-    '5'
union$cod_variable[union$cod_variable ==    'superior'  ] <-    '6'
union$cod_variable[union$cod_variable ==    'superior'  ] <-    '6'
union$cod_variable[union$cod_variable ==    'superior'  ] <-    '6'
union$cod_variable[union$cod_variable ==    'superior'  ] <-    '6'
union$cod_variable[union$cod_variable ==    'superior'  ] <-    '6'
union$cod_variable[union$cod_variable ==    'superior'  ] <-    '6'
union$cod_variable[union$cod_variable ==    'superior'  ] <-    '6'
union$cod_variable[union$cod_variable ==    'superior'  ] <-    '6'
union$cod_variable[union$cod_variable ==    'superior'  ] <-    '6'
union$cod_variable[union$cod_variable ==    'superior'  ] <-    '6'
union$cod_variable[union$cod_variable ==    'superior'  ] <-    '6'
union$cod_variable[union$cod_variable ==    'superior'  ] <-    '6'
union$cod_variable[union$cod_variable ==    'superior'  ] <-    '6'
union$cod_variable[union$cod_variable ==    'superior'  ] <-    '6'
union$cod_variable[union$cod_variable ==    'superior'  ] <-    '6'
union$cod_variable[union$cod_variable ==    'superior'  ] <-    '6'
union$cod_variable[union$cod_variable ==    'superior'  ] <-    '6'
union$cod_variable[union$cod_variable ==    'superior'  ] <-    '6'
union$cod_variable[union$cod_variable ==    'superior'  ] <-    '6'
union$cod_variable[union$cod_variable ==    'superior'  ] <-    '6'
union$cod_variable[union$cod_variable ==    'superior'  ] <-    '6'

datatable(union, extensions = 'Buttons', escape = FALSE, rownames = FALSE,
          options = list(dom = 'Bfrtip',
          buttons = list('colvis', list(extend = 'collection',
          buttons = list(
          list(extend='copy'),
          list(extend='excel',
            filename = 'tabla_ytotcor_e5a'),
          list(extend='pdf',
            filename= 'tabla_ytotcor_e5a')),
          text = 'Download')), scrollX = TRUE))

Casens 2006-2020 Tabla 02

¿Cuál fue el nivel educacional más alto alcanzado o el nivel educacional actual?

VE-CC-AJ

1 ETNIA

1.1 Leemos las bases de datos para construir etnia

1.2 Extraccion

1.2.1 2006

1.2.2 2009

1.2.3 2011

1.2.4 2013

1.2.5 2015

1.2.6 2017

2 2020

3 Tabla final etnia homologada

4 MIGRA

4.0.1 2011

4.0.2 2013

4.0.3 2015

4.0.4 2017

4.0.5 2020

5 Tabla final inmigración homologada