1 Introducción
El procedimiento de generación de tablas de contingencia trae problemas si se consideran varias tablas referidas por ejemplo a varios años, cuyas categorías de divergen.
<<- readRDS("C:/Users/enamo/Desktop/Shiny-R/Casen_en_pandemia_2020/casen/casen_2006_c.rds")
casen_2006 <- mutate_if(casen_2006, is.factor, as.character)
casen_2006 <<- readRDS("C:/Users/enamo/Desktop/Shiny-R/Casen_en_pandemia_2020/casen/casen_2009_c.rds")
casen_2009 <- mutate_if(casen_2009, is.factor, as.character)
casen_2009 <<- readRDS("C:/Users/enamo/Desktop/Shiny-R/Casen_en_pandemia_2020/casen/casen_2011_c.rds")
casen_2011 <- mutate_if(casen_2011, is.factor, as.character)
casen_2011 <<- readRDS("C:/Users/enamo/Desktop/Shiny-R/Casen_en_pandemia_2020/casen/casen_2013_c.rds")
casen_2013 <- mutate_if(casen_2013, is.factor, as.character)
casen_2013 <<- readRDS("C:/Users/enamo/Desktop/Shiny-R/Casen_en_pandemia_2020/casen/casen_2015_c.rds")
casen_2015 <- mutate_if(casen_2015, is.factor, as.character)
casen_2015 <<- readRDS("C:/Users/enamo/Desktop/Shiny-R/Casen_en_pandemia_2020/casen/casen_2017_c.rds")
casen_2017 <- mutate_if(casen_2017, is.factor, as.character)
casen_2017
<<- readRDS("C:/Users/enamo/Desktop/Shiny-R/Casen_en_pandemia_2020/casen/casen_2020_c.rds")
casen_2020 <- mutate_if(casen_2020, is.factor, as.character)
casen_2020
<- readRDS("C:/Users/enamo/Desktop/Shiny-R/Casen_en_pandemia_2020/codigos_comunales_2006-2020.rds")
cod_com names(cod_com)[2] <- "comuna"
<- c("","","h11e_esp","r1a_cod","r1aesp_cod","r1a_cod")
vv
# casen_2006 <- casen_2006[,c("EXPC", "COMUNA" ,vv[1], "T4","SEXO","E1")]
# casen_2009 <- casen_2009[,c("EXPC", "COMUNA" ,vv[2], "T5","SEXO","E1")]
<- casen_2011[,c("expc_full", "comuna" ,vv[3], "r6","sexo","e1","r2p_cod")]
casen_2011 <- casen_2013[,c("expc", "comuna" ,vv[4], "r6","sexo","e1","r2_p_cod")]
casen_2013 <- casen_2015[,c("expc_todas", "comuna" ,vv[5], "r3","sexo","e1","r2espp_cod")]
casen_2015 <- casen_2017[,c("expc", "comuna" ,vv[6], "r3","sexo","e1","r2_p_cod")]
casen_2017 # casen_2020 <- casen_2020[,c("expc", "comuna" ,vv[7], "r3","sexo","e1","r2_pais_esp")]
Homologación de alfabetismo
<- function(dataset){
variable_alfa
<- switch(i,"E1","E1","e1","e1","e1","e1","e1")
variable
== "No sabe /Sin dato" ] <- NA
dataset[,variable][dataset[,variable] == "Sí, lee y escribe" ] <- "Sí"
dataset[,variable][dataset[,variable] == "No, sólo lee" ] <- "No"
dataset[,variable][dataset[,variable] == "No, ninguno" ] <-"No"
dataset[,variable][dataset[,variable] == "No, sólo escribe" ] <- "No"
dataset[,variable][dataset[,variable] #dataset_1 <<- dataset
switch(i,
case = casen_2006 <<- dataset,
case = casen_2009 <<- dataset,
case = casen_2011 <<- dataset,
case = casen_2013 <<- dataset,
case = casen_2015 <<- dataset,
case = casen_2017 <<- dataset,
case = casen_2020 <<- dataset
)
}
for (i in 3:6) {
switch(i,
case = casen <- casen_2006,
case = casen <- casen_2009,
case = casen <- casen_2011,
case = casen <- casen_2013,
case = casen <- casen_2015,
case = casen <- casen_2017,
case = casen <- casen_2020
)variable_alfa(casen)
}
Homologación de etnia
<- function(dataset){
variable_etnia
<- switch(i,"T4","T5","r6","r6","r3","r3","r3")
variable
== "Aimara" ] <- "Aymara"
dataset[,variable][dataset[,variable] == "No pertenece a ninguno de estos pueblos indígenas" ] <- "No pertenece a ningún pueblo indígena"
dataset[,variable][dataset[,variable] == "Mapuche"] <- "Mapuche"
dataset[,variable][dataset[,variable] == "Diaguita"] <- "Diaguita"
dataset[,variable][dataset[,variable] == "Atacameño (Likan-Antai)" ] <- "Atacameño"
dataset[,variable][dataset[,variable] == "Atacameño (Likán Antai)" ] <- "Atacameño"
dataset[,variable][dataset[,variable] == "Atacameño (Likán-Antai)" ] <- "Atacameño"
dataset[,variable][dataset[,variable] == "Yámana o Yagán" ] <- "Yagán"
dataset[,variable][dataset[,variable] == "Yagan" ] <- "Yagán"
dataset[,variable][dataset[,variable] == "Yagán (Yámana)" ] <- "Yagán"
dataset[,variable][dataset[,variable] == "Rapa-Nui o Pascuenses"] <- "Pascuense"
dataset[,variable][dataset[,variable] == "Rapa-Nui"] <- "Pascuense"
dataset[,variable][dataset[,variable] == "Rapa Nui (Pascuense)"] <- "Pascuense"
dataset[,variable][dataset[,variable] == "Rapa Nui"] <- "Pascuense"
dataset[,variable][dataset[,variable] == "Collas"] <- "Coya"
dataset[,variable][dataset[,variable] == "Kawashkar o Alacalufes" ] <- "Alacalufe"
dataset[,variable][dataset[,variable] == "Kawashkar" ] <- "Alacalufe"
dataset[,variable][dataset[,variable] == "Kawésqar (Alacalufes)" ] <- "Alacalufe"
dataset[,variable][dataset[,variable] == "Kawésqar" ] <- "Alacalufe"
dataset[,variable][dataset[,variable] == "Kawaskar" ] <- "Alacalufe"
dataset[,variable][dataset[,variable] == "Sin dato"] <- NA
dataset[,variable][dataset[,variable] == "NS/NR" ] <- NA
dataset[,variable][dataset[,variable] == "No sabe/no responde" ] <- NA
dataset[,variable][dataset[,variable] # df <<- dataset
switch(i,
case = casen_2006 <<- dataset,
case = casen_2009 <<- dataset,
case = casen_2011 <<- dataset,
case = casen_2013 <<- dataset,
case = casen_2015 <<- dataset,
case = casen_2017 <<- dataset,
case = casen_2020 <<- dataset
)
}
for (i in 3:6) {
switch(i,
case = casen <- casen_2006,
case = casen <- casen_2009,
case = casen <- casen_2011,
case = casen <- casen_2013,
case = casen <- casen_2015,
case = casen <- casen_2017,
case = casen <- casen_2020
)
variable_etnia(casen)
}
Homologación de migración
for (i in unique(casen_2020$r2_pais_esp)) {
<- gsub("(^[[:space:]]+|[[:space:]]+$)", "", i)
pais <- tolower(pais)
pais $r2_pais_esp[casen_2020$r2_pais_esp == i] <- str_to_title(pais)
casen_2020
}
$r2p_cod[casen_2011$r2p_cod == "No contesta"] <- "NS/NR"
casen_2011$r2_p_cod[casen_2013$r2_p_cod == "No contesta"] <- "NS/NR"
casen_2013$r2espp_cod[casen_2015$r2espp_cod == "No contesta"] <- "NS/NR"
casen_2015$r2_p_cod[casen_2017$r2_p_cod == "No Bien Especificado"] <- "NS/NR"
casen_2017$r2_p_cod[casen_2017$r2_p_cod == "No Responde"] <- "NS/NR"
casen_2017$r2_pais_esp[casen_2020$r2_pais_esp == "No Bien Especificado"] <- "NS/NR"
casen_2020$r2_pais_esp[casen_2020$r2_pais_esp == ""] <- NA
casen_2020$r2_pais_esp[casen_2020$r2_pais_esp == "No Responde"] <- "NS/NR" casen_2020
Homologación de variable
<- function(dataset){
variable_en_estudio
<- switch(i,"ft","ft","h11e_esp","r1a_cod","r1aesp_cod","r1a_cod")
variable
== 'Albania'] <- 'Albania'
dataset[,variable][dataset[,variable] == 'Alemania'] <- 'Alemania'
dataset[,variable][dataset[,variable] == 'Angola'] <- 'Angola'
dataset[,variable][dataset[,variable] == 'Argelia'] <- 'Argelia'
dataset[,variable][dataset[,variable] == 'Argentina'] <- 'Argentina'
dataset[,variable][dataset[,variable] == 'Australia'] <- 'Australia'
dataset[,variable][dataset[,variable] == 'Austria'] <- 'Austria'
dataset[,variable][dataset[,variable] == 'Bélgica'] <- 'Bélgica'
dataset[,variable][dataset[,variable] == 'Bolivia'] <- 'Bolivia'
dataset[,variable][dataset[,variable] == 'Brasil'] <- 'Brasil'
dataset[,variable][dataset[,variable] == 'Canadá'] <- 'Canadá'
dataset[,variable][dataset[,variable] == 'China'] <- 'China'
dataset[,variable][dataset[,variable] == 'Colombia'] <- 'Colombia'
dataset[,variable][dataset[,variable] == 'Corea del Sur'] <- 'Corea del Sur'
dataset[,variable][dataset[,variable] == 'Corea Del Sur'] <- 'Corea del Sur'
dataset[,variable][dataset[,variable] == 'Costa Rica'] <- 'Costa Rica'
dataset[,variable][dataset[,variable] == 'Croacia'] <- 'Croacia'
dataset[,variable][dataset[,variable] == 'Cuba'] <- 'Cuba'
dataset[,variable][dataset[,variable] == 'Dinamarca'] <- 'Dinamarca'
dataset[,variable][dataset[,variable] == 'Ecuador'] <- 'Ecuador'
dataset[,variable][dataset[,variable] == 'Egipto'] <- 'Egipto'
dataset[,variable][dataset[,variable] == 'El Salvador'] <- 'El Salvador'
dataset[,variable][dataset[,variable] == 'Eslovaquia'] <- 'Eslovaquia'
dataset[,variable][dataset[,variable] == 'Eslovenia'] <- 'Eslovenia'
dataset[,variable][dataset[,variable] == 'España'] <- 'España'
dataset[,variable][dataset[,variable] == 'Estados Unidos'] <- 'Estados Unidos'
dataset[,variable][dataset[,variable] == 'Etiopía'] <- 'Etiopía'
dataset[,variable][dataset[,variable] == 'Filipinas'] <- 'Filipinas'
dataset[,variable][dataset[,variable] == 'Finlandia'] <- 'Finlandia'
dataset[,variable][dataset[,variable] == 'Francia'] <- 'Francia'
dataset[,variable][dataset[,variable] == 'Ghana'] <- 'Ghana'
dataset[,variable][dataset[,variable] == 'Grecia'] <- 'Grecia'
dataset[,variable][dataset[,variable] == 'Guatemala'] <- 'Guatemala'
dataset[,variable][dataset[,variable] == 'Haití'] <- 'Haití'
dataset[,variable][dataset[,variable] == 'Holanda'] <- 'Holanda'
dataset[,variable][dataset[,variable] == 'Honduras'] <- 'Honduras'
dataset[,variable][dataset[,variable] == 'Hungría'] <- 'Hungría'
dataset[,variable][dataset[,variable] == 'India'] <- 'India'
dataset[,variable][dataset[,variable] == 'Indonesia'] <- 'Indonesia'
dataset[,variable][dataset[,variable] == 'Irlanda'] <- 'Irlanda'
dataset[,variable][dataset[,variable] == 'Israel'] <- 'Israel'
dataset[,variable][dataset[,variable] == 'Italia'] <- 'Italia'
dataset[,variable][dataset[,variable] == 'Japón'] <- 'Japón'
dataset[,variable][dataset[,variable] == 'Jordania'] <- 'Jordania'
dataset[,variable][dataset[,variable] == 'Kenia'] <- 'Kenia'
dataset[,variable][dataset[,variable] == 'Kirguistán'] <- 'Kirguistán'
dataset[,variable][dataset[,variable] == 'Líbano'] <- 'Líbano'
dataset[,variable][dataset[,variable] == 'Libia'] <- 'Libia'
dataset[,variable][dataset[,variable] == 'Lituania'] <- 'Lituania'
dataset[,variable][dataset[,variable] == 'Marruecos'] <- 'Marruecos'
dataset[,variable][dataset[,variable] == 'México'] <- 'México'
dataset[,variable][dataset[,variable] == 'Nicaragua'] <- 'Nicaragua'
dataset[,variable][dataset[,variable] == 'Nigeria'] <- 'Nigeria'
dataset[,variable][dataset[,variable] == 'No bien especificado'] <- 'No bien especificado'
dataset[,variable][dataset[,variable] == 'No Bien Especificado'] <- 'No bien especificado'
dataset[,variable][dataset[,variable] == 'No Responde'] <- 'No sabe o no responde'
dataset[,variable][dataset[,variable] == 'NA'] <- 'No sabe o no responde'
dataset[,variable][dataset[,variable] == 'No contesta'] <- 'No sabe o no responde'
dataset[,variable][dataset[,variable] == 'Noruega'] <- 'Noruega'
dataset[,variable][dataset[,variable] == 'Nueva Zelanda'] <- 'Nueva Zelanda'
dataset[,variable][dataset[,variable] == 'Otro país de Africa'] <- 'Otro país de Africa'
dataset[,variable][dataset[,variable] == 'Otro país de Asia'] <- 'Otro país de Asia'
dataset[,variable][dataset[,variable] == 'Otro país de Europa'] <- 'Otro país de Europa'
dataset[,variable][dataset[,variable] == 'Pakistán'] <- 'Pakistán'
dataset[,variable][dataset[,variable] == 'Palestina'] <- 'Palestina'
dataset[,variable][dataset[,variable] == 'Panamá'] <- 'Panamá'
dataset[,variable][dataset[,variable] == 'Paraguay'] <- 'Paraguay'
dataset[,variable][dataset[,variable] == 'Perú'] <- 'Perú'
dataset[,variable][dataset[,variable] == 'Polonia'] <- 'Polonia'
dataset[,variable][dataset[,variable] == 'Portugal'] <- 'Portugal'
dataset[,variable][dataset[,variable] == 'Puerto Rico'] <- 'Puerto Rico'
dataset[,variable][dataset[,variable] == 'Qatar'] <- 'Qatar'
dataset[,variable][dataset[,variable] == 'Reino Unido'] <- 'Reino Unido'
dataset[,variable][dataset[,variable] == 'República Checa'] <- 'República Checa'
dataset[,variable][dataset[,variable] == 'República Democrática Del Congo'] <- 'República Democrática Del Congo'
dataset[,variable][dataset[,variable] == 'República Dominicana'] <- 'República Dominicana'
dataset[,variable][dataset[,variable] == 'Rumanía'] <- 'Rumanía'
dataset[,variable][dataset[,variable] == 'Rusia'] <- 'Rusia'
dataset[,variable][dataset[,variable] == 'Serbia'] <- 'Serbia'
dataset[,variable][dataset[,variable] == 'Siria'] <- 'Siria'
dataset[,variable][dataset[,variable] == 'Sri Lanka'] <- 'Sri Lanka'
dataset[,variable][dataset[,variable] == 'Sudáfrica'] <- 'Sudáfrica'
dataset[,variable][dataset[,variable] == 'Suecia'] <- 'Suecia'
dataset[,variable][dataset[,variable] == 'Suiza'] <- 'Suiza'
dataset[,variable][dataset[,variable] == 'Tailandia'] <- 'Tailandia'
dataset[,variable][dataset[,variable] == 'Turquía'] <- 'Turquía'
dataset[,variable][dataset[,variable] == 'Ucrania'] <- 'Ucrania'
dataset[,variable][dataset[,variable] == 'Uruguay'] <- 'Uruguay'
dataset[,variable][dataset[,variable] == 'Venezuela'] <- 'Venezuela'
dataset[,variable][dataset[,variable]
switch(i,
case = casen_2006 <<- dataset,
case = casen_2009 <<- dataset,
case = casen_2011 <<- dataset,
case = casen_2013 <<- dataset,
case = casen_2015 <<- dataset,
case = casen_2017 <<- dataset,
case = casen_2020 <<- dataset
)
}
for (i in 3:6) {
switch(i,
case = casen <- casen_2006,
case = casen <- casen_2009,
case = casen <- casen_2011,
case = casen <- casen_2013,
case = casen <- casen_2015,
case = casen <- casen_2017,
case = casen <- casen_2020
)
variable_en_estudio(casen)
}
<- read_xlsx("C:/Users/enamo/Desktop/Shiny-R/ds_ttcc_ok/diccionarios/tabla_026_Diccionario_Identidad_país.xlsx") carrera
## New names:
## * `` -> ...2
## * `` -> ...3
## * `` -> ...4
## * `` -> ...5
## * `` -> ...6
## * ...
# carrera <- carrera[-c(1:1),c(1,3)]
<- carrera[-c(1:1),c(3,4)]
carrera # names(carrera)[2] <- "Homologacion_002"
carrera
## # A tibble: 89 x 2
## ...3 ...4
## <chr> <chr>
## 1 Albania 1
## 2 Alemania 2
## 3 Angola 3
## 4 Argelia 4
## 5 Argentina 5
## 6 Australia 6
## 7 Austria 7
## 8 Bélgica 8
## 9 Bolivia 9
## 10 Brasil 10
## # ... with 79 more rows
#
<- data.frame()
dataf1 for (n in 1:nrow(carrera)) {
# dataf1 <- rbind(dataf1,paste0("dataset[,variable][dataset[,variable] == '",carrera[n,1],"']"," <- '",carrera[n,2],"'"))
<- rbind(dataf1,paste0("dataset[,'cod_variable'][dataset[,'cod_variable'] == '",carrera[n,1],"']"," <- '",carrera[n,2],"'")) # <- codigo numerico
dataf1
}<- as.data.frame(dataf1)
dataf1 write_xlsx(dataf1,"el_total_final.xlsx")
1.0.1 2011
<- casen_2011
ab <- ab$comuna
b <- ab$h11e_esp
c <- ab$r6
d <- ab$sexo
e <- ab$e1
f
= xtabs(ab$expc_full ~ unlist(b) + unlist(c) + unlist(d) + unlist(e) + unlist(f),aggregate(ab$expc_full ~ unlist(b) + unlist(c) + unlist(d) + unlist(e) + unlist(f) ,ab,mean))
cross_tab <- as.data.frame(cross_tab)
tabla <-tabla[!(tabla$Freq == 0),]
d $anio <- "2011"
d
names(d)[1] <- "comuna"
names(d)[2] <- "variables"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Sabe leer?"
names(d)[6] <- "Frecuencia"
names(d)[7] <- "Año"
<- d d_2011
1.0.2 2013
<- casen_2013
ab
<- ab$comuna
b <- ab$r1a_cod
c <- ab$r6
d <- ab$sexo
e <- ab$e1
f
= xtabs(ab$expc ~ unlist(b) + unlist(c) + unlist(d) + unlist(e) + unlist(f),aggregate(ab$expc ~ unlist(b) + unlist(c) + unlist(d) + unlist(e) + unlist(f) ,ab,mean))
cross_tab <- as.data.frame(cross_tab)
tabla <-tabla[!(tabla$Freq == 0),]
d $anio <- "2013"
d
names(d)[1] <- "comuna"
names(d)[2] <- "variables"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Sabe leer?"
names(d)[6] <- "Frecuencia"
names(d)[7] <- "Año"
<- d d_2013
1.0.3 2015
<- casen_2015
ab
<- ab$comuna
b <- ab$r1aesp_cod
c <- ab$r3
d <- ab$sexo
e <- ab$e1
f
= xtabs(ab$expc_todas ~ unlist(b) + unlist(c) + unlist(d) + unlist(e) + unlist(f),aggregate(ab$expc_todas ~ unlist(b) + unlist(c) + unlist(d) + unlist(e) + unlist(f) ,ab,mean))
cross_tab <- as.data.frame(cross_tab)
tabla <-tabla[!(tabla$Freq == 0),]
d $anio <- "2015"
d
names(d)[1] <- "comuna"
names(d)[2] <- "variables"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Sabe leer?"
names(d)[6] <- "Frecuencia"
names(d)[7] <- "Año"
<- d d_2015
1.0.4 2017
<- casen_2017
ab
<- ab$comuna
b <- ab$r1a_cod
c <- ab$r3
d <- ab$sexo
e <- ab$e1
f
= xtabs(ab$expc ~ unlist(b) + unlist(c) + unlist(d) + unlist(e) + unlist(f),aggregate(ab$expc ~ unlist(b) + unlist(c) + unlist(d) + unlist(e) + unlist(f) ,ab,mean))
cross_tab <- as.data.frame(cross_tab)
tabla <-tabla[!(tabla$Freq == 0),]
d $anio <- "2017"
d
names(d)[1] <- "comuna"
names(d)[2] <- "variables"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Sabe leer?"
names(d)[6] <- "Frecuencia"
names(d)[7] <- "Año"
<- d d_2017
Unimos y desplegamos la tabla corregida:
2 Tabla final etnia homologada
<- rbind( d_2011, d_2013, d_2015, d_2017)
union_etnia <- mutate_if(union_etnia, is.factor, as.character) union_etnia
#fn_etnia(union)
<- readRDS("C:/Users/enamo/Desktop/Shiny-R/Casen_en_pandemia_2020/codigos_comunales_2006-2020.rds")
cod_com names(cod_com)[2] <- "comuna"
<- merge(x=union_etnia, y=cod_com, by="comuna")
tab_f
$cod_etnia[tab_f$Etnia == "Alacalufe" ] <- "01"
tab_f$cod_etnia[tab_f$Etnia == "Atacameño" ] <- "02"
tab_f$cod_etnia[tab_f$Etnia == "Aymara" ] <- "03"
tab_f$cod_etnia[tab_f$Etnia == "Chango" ] <- "04"
tab_f$cod_etnia[tab_f$Etnia == "Coya" ] <- "05"
tab_f$cod_etnia[tab_f$Etnia == "Diaguita" ] <- "06"
tab_f$cod_etnia[tab_f$Etnia == "Mapuche" ] <- "07"
tab_f$cod_etnia[tab_f$Etnia == "Pascuense" ] <- "08"
tab_f$cod_etnia[tab_f$Etnia == "Quechua" ] <- "09"
tab_f$cod_etnia[tab_f$Etnia == "Yagán" ] <- "10"
tab_f$cod_etnia[tab_f$Etnia == "No pertenece a ningún pueblo indígena" ] <- "11"
tab_f$cod_etnia[tab_f$Etnia == NA ] <- "12"
tab_f
$cod_sexo <- tab_f$Sexo
tab_f$cod_sexo[tab_f$cod_sexo == "Hombre"] <- "01"
tab_f$cod_sexo[tab_f$cod_sexo == "Mujer"] <- "02"
tab_f
$cod_alfa <- tab_f$`Sabe leer?`
tab_f$cod_alfa[tab_f$cod_alfa == "Sí"] <- "01"
tab_f$cod_alfa[tab_f$cod_alfa == "No"] <- "02"
tab_f
$cod_variable <- tab_f$variables
tab_f<- tab_f
dataset 'cod_variable'][dataset[,'cod_variable'] == 'Albania'] <- '1'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Alemania'] <- '2'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Angola'] <- '3'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Argelia'] <- '4'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Argentina'] <- '5'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Australia'] <- '6'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Austria'] <- '7'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Bélgica'] <- '8'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Bolivia'] <- '9'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Brasil'] <- '10'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Canadá'] <- '11'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'China'] <- '12'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Colombia'] <- '13'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Corea del Sur'] <- '14'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Corea del Sur'] <- '14'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Costa Rica'] <- '15'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Croacia'] <- '16'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Cuba'] <- '17'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Dinamarca'] <- '18'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Ecuador'] <- '19'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Egipto'] <- '20'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'El Salvador'] <- '21'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Eslovaquia'] <- '22'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Eslovenia'] <- '23'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'España'] <- '24'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Estados Unidos'] <- '25'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Etiopía'] <- '26'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Filipinas'] <- '27'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Finlandia'] <- '28'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Francia'] <- '29'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Ghana'] <- '30'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Grecia'] <- '31'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Guatemala'] <- '32'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Haití'] <- '33'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Holanda'] <- '34'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Honduras'] <- '35'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Hungría'] <- '36'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'India'] <- '37'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Indonesia'] <- '38'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Irlanda'] <- '39'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Israel'] <- '40'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Italia'] <- '41'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Japón'] <- '42'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Jordania'] <- '43'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Kenia'] <- '44'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Kirguistán'] <- '45'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Líbano'] <- '46'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Libia'] <- '47'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Lituania'] <- '48'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Marruecos'] <- '49'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'México'] <- '50'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Nicaragua'] <- '51'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Nigeria'] <- '52'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'No bien especificado'] <- '53'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'No bien especificado'] <- '53'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'No sabe o no responde'] <- '54'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'No sabe o no responde'] <- '54'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'No sabe o no responde'] <- '54'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Noruega'] <- '55'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Nueva Zelanda'] <- '56'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Otro país de Africa'] <- '57'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Otro país de Asia'] <- '58'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Otro país de Europa'] <- '59'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Pakistán'] <- '60'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Palestina'] <- '61'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Panamá'] <- '62'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Paraguay'] <- '63'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Perú'] <- '64'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Polonia'] <- '65'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Portugal'] <- '66'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Puerto Rico'] <- '67'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Qatar'] <- '68'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Reino Unido'] <- '69'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'República Checa'] <- '70'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'República Democrática Del Congo'] <- '71'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'República Dominicana'] <- '72'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Rumanía'] <- '73'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Rusia'] <- '74'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Serbia'] <- '75'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Siria'] <- '76'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Sri Lanka'] <- '77'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Sudáfrica'] <- '78'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Suecia'] <- '79'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Suiza'] <- '80'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Tailandia'] <- '81'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Turquía'] <- '82'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Ucrania'] <- '83'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Uruguay'] <- '84'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Venezuela'] <- '85'
dataset[,
datatable(dataset, extensions = 'Buttons', escape = FALSE, rownames = FALSE,
options = list(dom = 'Bfrtip',
buttons = list('colvis', list(extend = 'collection',
buttons = list(
list(extend='copy'),
list(extend='excel',
filename = 'tabla'),
list(extend='pdf',
filename= 'tabla')),
text = 'Download')), scrollX = TRUE))
3 MIGRA
3.0.1 2011
Generamos las tablas de contingencia tal como acostumbramos:
<- casen_2011
ab <- ab$comuna
b <- ab$h11e_esp
c <- ab$r2p_cod
d <- ab$sexo
e <- ab$e1
f
= xtabs(ab$expc_full ~ unlist(b) + unlist(c) + unlist(d) + unlist(e) + unlist(f),aggregate(ab$expc_full ~ unlist(b) + unlist(c) + unlist(d) + unlist(e) + unlist(f) ,ab,mean))
cross_tab <- as.data.frame(cross_tab)
tabla <-tabla[!(tabla$Freq == 0),]
d $anio <- "2011"
d
names(d)[1] <- "comuna"
names(d)[2] <- "variables"
names(d)[3] <- "Origen"
names(d)[4] <- "Sexo"
names(d)[5] <- "Sabe leer?"
names(d)[6] <- "Frecuencia"
names(d)[7] <- "Año"
<- d d_2011
3.0.2 2013
<- casen_2013
ab
<- ab$comuna
b <- ab$r1a_cod
c <- ab$r2_p_cod
d <- ab$sexo
e <- ab$e1
f
= xtabs(ab$expc ~ unlist(b) + unlist(c) + unlist(d) + unlist(e) + unlist(f),aggregate(ab$expc ~ unlist(b) + unlist(c) + unlist(d) + unlist(e) + unlist(f) ,ab,mean))
cross_tab <- as.data.frame(cross_tab)
tabla <-tabla[!(tabla$Freq == 0),]
d $anio <- "2013"
d
names(d)[1] <- "comuna"
names(d)[2] <- "variables"
names(d)[3] <- "Origen"
names(d)[4] <- "Sexo"
names(d)[5] <- "Sabe leer?"
names(d)[6] <- "Frecuencia"
names(d)[7] <- "Año"
<- d d_2013
3.0.3 2015
<- casen_2015
ab
<- ab$comuna
b <- ab$r1aesp_cod
c <- ab$r2espp_cod
d <- ab$sexo
e <- ab$e1
f
= xtabs(ab$expc_todas ~ unlist(b) + unlist(c) + unlist(d) + unlist(e) + unlist(f),aggregate(ab$expc_todas ~ unlist(b) + unlist(c) + unlist(d) + unlist(e) + unlist(f) ,ab,mean))
cross_tab <- as.data.frame(cross_tab)
tabla <-tabla[!(tabla$Freq == 0),]
d $anio <- "2015"
d
names(d)[1] <- "comuna"
names(d)[2] <- "variables"
names(d)[3] <- "Origen"
names(d)[4] <- "Sexo"
names(d)[5] <- "Sabe leer?"
names(d)[6] <- "Frecuencia"
names(d)[7] <- "Año"
<- d d_2015
3.0.4 2017
<- casen_2017
ab
<- ab$comuna
b <- ab$r1a_cod
c <- ab$r2_p_cod
d <- ab$sexo
e <- ab$e1
f
= xtabs(ab$expc~ unlist(b) + unlist(c) + unlist(d) + unlist(e) + unlist(f),aggregate(ab$expc ~ unlist(b) + unlist(c) + unlist(d) + unlist(e) + unlist(f) ,ab,mean))
cross_tab <- as.data.frame(cross_tab)
tabla <-tabla[!(tabla$Freq == 0),]
d $anio <- "2017"
d
names(d)[1] <- "comuna"
names(d)[2] <- "variables"
names(d)[3] <- "Origen"
names(d)[4] <- "Sexo"
names(d)[5] <- "Sabe leer?"
names(d)[6] <- "Frecuencia"
names(d)[7] <- "Año"
<- d d_2017
Unimos y desplegamos la tabla corregida:
4 Tabla final inmigración homologada
<- rbind(d_2011, d_2013, d_2015, d_2017)
union_etnia <- mutate_if(union_etnia, is.factor, as.character) union
$cod_sexo <- union$Sexo
union$cod_sexo[union$cod_sexo == "Hombre"] <- "01"
union$cod_sexo[union$cod_sexo == "Mujer"] <- "02"
union
$cod_alfa <- union$`Sabe leer?`
union$cod_alfa[union$cod_alfa == "Sí"] <- "01"
union$cod_alfa[union$cod_alfa == "No"] <- "02"
union
$cod_variable <- union$variables
union<- union
dataset
'cod_variable'][dataset[,'cod_variable'] == 'Albania'] <- '1'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Alemania'] <- '2'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Angola'] <- '3'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Argelia'] <- '4'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Argentina'] <- '5'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Australia'] <- '6'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Austria'] <- '7'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Bélgica'] <- '8'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Bolivia'] <- '9'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Brasil'] <- '10'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Canadá'] <- '11'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'China'] <- '12'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Colombia'] <- '13'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Corea del Sur'] <- '14'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Corea del Sur'] <- '14'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Costa Rica'] <- '15'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Croacia'] <- '16'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Cuba'] <- '17'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Dinamarca'] <- '18'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Ecuador'] <- '19'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Egipto'] <- '20'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'El Salvador'] <- '21'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Eslovaquia'] <- '22'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Eslovenia'] <- '23'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'España'] <- '24'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Estados Unidos'] <- '25'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Etiopía'] <- '26'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Filipinas'] <- '27'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Finlandia'] <- '28'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Francia'] <- '29'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Ghana'] <- '30'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Grecia'] <- '31'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Guatemala'] <- '32'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Haití'] <- '33'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Holanda'] <- '34'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Honduras'] <- '35'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Hungría'] <- '36'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'India'] <- '37'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Indonesia'] <- '38'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Irlanda'] <- '39'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Israel'] <- '40'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Italia'] <- '41'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Japón'] <- '42'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Jordania'] <- '43'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Kenia'] <- '44'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Kirguistán'] <- '45'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Líbano'] <- '46'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Libia'] <- '47'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Lituania'] <- '48'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Marruecos'] <- '49'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'México'] <- '50'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Nicaragua'] <- '51'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Nigeria'] <- '52'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'No bien especificado'] <- '53'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'No bien especificado'] <- '53'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'No sabe o no responde'] <- '54'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'No sabe o no responde'] <- '54'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'No sabe o no responde'] <- '54'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Noruega'] <- '55'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Nueva Zelanda'] <- '56'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Otro país de Africa'] <- '57'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Otro país de Asia'] <- '58'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Otro país de Europa'] <- '59'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Pakistán'] <- '60'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Palestina'] <- '61'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Panamá'] <- '62'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Paraguay'] <- '63'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Perú'] <- '64'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Polonia'] <- '65'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Portugal'] <- '66'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Puerto Rico'] <- '67'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Qatar'] <- '68'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Reino Unido'] <- '69'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'República Checa'] <- '70'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'República Democrática Del Congo'] <- '71'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'República Dominicana'] <- '72'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Rumanía'] <- '73'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Rusia'] <- '74'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Serbia'] <- '75'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Siria'] <- '76'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Sri Lanka'] <- '77'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Sudáfrica'] <- '78'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Suecia'] <- '79'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Suiza'] <- '80'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Tailandia'] <- '81'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Turquía'] <- '82'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Ucrania'] <- '83'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Uruguay'] <- '84'
dataset[,'cod_variable'][dataset[,'cod_variable'] == 'Venezuela'] <- '85'
dataset[,
datatable(dataset, extensions = 'Buttons', escape = FALSE, rownames = FALSE,
options = list(dom = 'Bfrtip',
buttons = list('colvis', list(extend = 'collection',
buttons = list(
list(extend='copy'),
list(extend='excel',
filename = 'tabla'),
list(extend='pdf',
filename= 'tabla')),
text = 'Download')), scrollX = TRUE))