1 Las variables de ingreso a utilizar serán:
Año | Ingreso total | Ingreso autónomo | Ingreso del trabajo | Ingreso ocupación principal |
---|---|---|---|---|
2006 | YTOTAJ | YAUTAJ | YTRABAJ | YOPRAJ |
2009 | YTOTAJ | YAUTAJ | YTRABAJ | YOPRAJ |
2011 | ytotaj | yautaj | ytrabaj | yopraj |
2013 | ytotcor | yautcor | ytrabajoCor | yoprCor |
2015 | ytotcor | yautcor | ytrabajoCor | yoprCor |
2017 | ytotcor | yautcor | ytrabajocor | yoprcor |
2020 | ytotcor | yautcor | ytrabajocor | yoprcor |
Lectura de bases de datos Casen
<<- readRDS("C:/Users/enamo/Desktop/Shiny-R/Casen_en_pandemia_2020/casen/casen_2006_c.rds")
dataset_06 <- mutate_if(dataset_06, is.factor, as.character)
dataset_06 <<- readRDS("C:/Users/enamo/Desktop/Shiny-R/Casen_en_pandemia_2020/casen/casen_2009_c.rds")
dataset_09 <- mutate_if(dataset_09, is.factor, as.character)
dataset_09 <<- readRDS("C:/Users/enamo/Desktop/Shiny-R/Casen_en_pandemia_2020/casen/casen_2011_c.rds")
dataset_11 <- mutate_if(dataset_11, is.factor, as.character)
dataset_11 <<- readRDS("C:/Users/enamo/Desktop/Shiny-R/Casen_en_pandemia_2020/casen/casen_2013_c.rds")
dataset_13 <- mutate_if(dataset_13, is.factor, as.character)
dataset_13 <<- readRDS("C:/Users/enamo/Desktop/Shiny-R/Casen_en_pandemia_2020/casen/casen_2015_c.rds")
dataset_15 <- mutate_if(dataset_15, is.factor, as.character)
dataset_15 <<- readRDS("C:/Users/enamo/Desktop/Shiny-R/Casen_en_pandemia_2020/casen/casen_2017_c.rds")
dataset_17 <- mutate_if(dataset_17, is.factor, as.character)
dataset_17 <<- readRDS("C:/Users/enamo/Desktop/Shiny-R/Casen_en_pandemia_2020/casen/casen_2020.rds")
dataset_20 <- mutate_if(dataset_20, is.factor, as.character) dataset_20
2 Introducción
La generación de ttcc que agrupa categorías y que después podemos expandir a la población total es independiente a la generación de ingresos que se les asocia pues es el simple promedio de las muestras y no de la población global.
Debido a algún motivo en la ttcc del año 2020 los ingresos se ven reducidos, por lo que se hizo un análisis en búsqueda de un posible error en la base de datos de la Casen 2020. Primero excluimos la variable de alfabetisto en todos los años para descartar un error asociado a ello. Se generó nuevamente la ttcc y el problema de ingreso continuó.
Haciendo un subset de los ingresos totales corregidos por año nos encontramos con múltiples NA y solamente en el año 2020 con 0
<- data.frame(
tab_ytotcor ytotcor_06 = head(dataset_06$YTOTAJ,20),
ytotcor_09 = head(dataset_09$YTOTAJ,20),
ytotcor_11 = head(dataset_11$ytotaj,20),
ytotcor_13 = head(dataset_13$ytotcor,20),
ytotcor_15 = head(dataset_15$ytotcor,20),
ytotcor_17 = head(dataset_17$ytotcor,20),
ytotcor_20 = head(dataset_20$ytotcor,20)
)datatable(tab_ytotcor, extensions = 'Buttons', escape = FALSE, rownames = FALSE,
options = list(dom = 'Bfrtip',
buttons = list('colvis', list(extend = 'collection',
buttons = list(
list(extend='copy'),
list(extend='excel',
filename = 'tabla_etnia_ytotcor'),
list(extend='pdf',
filename= 'tabla_etnia_ytotcor')),
text = 'Download')), scrollX = TRUE))
3 Generación de tablas de contingencia
<- data.frame()
df_tablas
for (var2 in 1:1) {
<- function(n){
funcion1
<-switch(n,"codigos_comunales_2006.rds","codigos_comunales_2009.rds","codigos_comunales_2011-2017.rds","codigos_comunales_2011-2017.rds","codigos_comunales_2011-2017.rds","codigos_comunales_2011-2017.rds","codigos_comunales_2011-2017.rds")
comunales<-switch(n,"2006","2009","2011","2013","2015","2017","2020")
xx<<- xx
tanio
if(xx==2006) {
<- switch(var2,"YTOTAJ","YAUTAJ","YTRABAJ","YOPRAJ")
ingreso <- mutate_at(dataset_06, c(ingreso), ~replace(., is.na(.), 0))
eliminated <- eliminated$YTOTAJ
a <- eliminated$COMUNA
b <- eliminated$SEXO
c <- eliminated$E1 #alfabetismo
d <- eliminated$T4 #etnia
e <- 2006
anio
}
if(xx==2009) {
<- switch(var2,"YTOTAJ","YAUTAJ","YTRABAJ","YOPRAJ")
ingreso <- mutate_at(dataset_09, c(ingreso), ~replace(., is.na(.), 0))
eliminated <- eliminated[,c(ingreso)]
a <- eliminated$COMUNA
b <- eliminated$SEXO
c <- eliminated$E1 #alfabetismo
d <- eliminated$T5 #etnia
e <- 2009
anio
}
if(xx==2011) {
<- switch(var2,"ytotaj","yautaj","ytrabaj","yopraj")
ingreso <- mutate_at(dataset_11, c(ingreso), ~replace(., is.na(.), 0))
eliminated <- eliminated[,c(ingreso)]
a <- eliminated$comuna
b <- eliminated$sexo
c <- eliminated$e1 #alfabetismo
d <- eliminated$r6 #etnia
e <- 2011
anio
}
if(xx==2013) {
<- switch(var2,"ytotcor","yautcor","ytrabajoCor","yoprCor")
ingreso <- mutate_at(dataset_13, c(ingreso), ~replace(., is.na(.), 0))
eliminated <- eliminated[,c(ingreso)]
a <- eliminated$comuna
b <- eliminated$sexo
c <- eliminated$e1 #alfabetismo
d <- eliminated$r6 #etnia
e <- 2013
anio
}
if(xx==2015) {
<- switch(var2,"ytotcor","yautcor","ytrabajoCor","yoprCor")
ingreso <- mutate_at(dataset_15, c(ingreso), ~replace(., is.na(.), 0))
eliminated <- eliminated[,c(ingreso)]
a <- eliminated$comuna
b <- eliminated$sexo
c <- eliminated$e1 #alfabetismo
d <- eliminated$r3 #etnia
e <- 2015
anio
}
if(xx==2017) {
<- switch(var2,"ytotcor","yautcor","ytrabajocor","yoprcor")
ingreso <- mutate_at(dataset_17, c(ingreso), ~replace(., is.na(.), 0))
eliminated <- eliminated[,c(ingreso)]
a <- eliminated$comuna
b <- eliminated$sexo
c <- eliminated$e1 #alfabetismo
d <- eliminated$r3 #etnia
e <- 2017
anio
}
if(xx==2020) {
<- switch(var2,"ytotcor","yautcor","ytrabajocor","yoprcor")
ingreso <- mutate_at(dataset_20, c(ingreso), ~replace(., is.na(.), 0))
eliminated <- eliminated[,c(ingreso)]
a <- eliminated$comuna
b <- eliminated$sexo
c <- eliminated$sexo #alfabetismo
d <- eliminated$r3 #etnia
e <- 2020
anio
}
<-aggregate(a, by=list(b, c, e ), FUN = mean , na.rm = TRUE)
promedios_grupales <-aggregate(a, by=list(b, c, e ), FUN = sd , na.rm = TRUE)
promedios_grupales_sd <-aggregate(a, by=list(b, c, e ), FUN = gini , na.rm = TRUE)
promedios_grupales_gini
$sd = promedios_grupales_sd$sd.a
promedios_grupales$gini = promedios_grupales_gini$gini.a
promedios_grupales<- promedios_grupales
df
################ -- frecuencia
<-switch(n,"EXPC","EXPC","expc_full","expc","expc_todas","expc","expc")
expan
<-xtabs(eliminated[,(expan)]~b+c +e , data = eliminated)
tabla_matp <- as.data.frame(tabla_matp)
tabla_matp <-tabla_matp[!(tabla_matp$Freq == 0),]
tabla_matp $freq <- tabla_matp$Freq
df<- df[complete.cases(df), ]
df ################
names(df)[1] <- "Comuna"
names(df)[2] <- "Sexo"
# names(df)[3] <- "Alfabetismo"
names(df)[3] <- "Etnia"
names(df)[4] <- "Promedio del Ingreso"
names(df)[5] <- "Desviación standard"
names(df)[6] <- "Gini"
names(df)[7] <- "freq"
$Año = xx
df
<- paste0("C:/Users/enamo/Desktop/Shiny-R/Casen_en_pandemia_2020/",comunales)
direc_cod_com <- readRDS(file = direc_cod_com)
codigos_comunales names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"
= merge( x = df, y = codigos_comunales, by = "Comuna", all.x = TRUE)
tabla_df <-tabla_df[!(tabla_df$Promedio == 0),]
tabla_df
<<- tabla_df
tabla_df2
}
<- data.frame()
data_df3 for (n in 1:7){
funcion1(n)
<- rbind(data_df3,tabla_df2)
data_df3
} <- switch(var2,"ytotcor","yautcor","ytrabajocor","yoprcor")
variable_i
$var_id <- paste0(variable_i,"_id")
data_df3assign(paste0("tabla_etnia_",variable_i),data_df3)
print(paste0("tabla_etnia_",variable_i))
}
## [1] "tabla_etnia_ytotcor"
3.0.1 Homologación de etnia
<- tabla_etnia_ytotcor
tabla_final $Etnia[tabla_final$Etnia == "Aimara" ] <- "Aymara"
tabla_final$Etnia[tabla_final$Etnia == "No pertenece a ninguno de estos pueblos indígenas" ] <- "No pertenece a ningún pueblo indígena"
tabla_final$Etnia[tabla_final$Etnia == "Mapuche"] <- "Mapuche"
tabla_final$Etnia[tabla_final$Etnia == "Diaguita"] <- "Diaguita"
tabla_final$Etnia[tabla_final$Etnia == "Atacameño" ] <- "Atacameño"
tabla_final$Etnia[tabla_final$Etnia == "Atacameño (Likan-Antai)" ] <- "Atacameño"
tabla_final$Etnia[tabla_final$Etnia == "Atacameño (Likán Antai)" ] <- "Atacameño"
tabla_final$Etnia[tabla_final$Etnia == "Atacameño (Likán-Antai)" ] <- "Atacameño"
tabla_final$Etnia[tabla_final$Etnia == "Quechua" ] <- "Quechua"
tabla_final$Etnia[tabla_final$Etnia == "Yámana o Yagán" ] <- "Yagán"
tabla_final$Etnia[tabla_final$Etnia == "Yagan" ] <- "Yagán"
tabla_final$Etnia[tabla_final$Etnia == "Yagán (Yámana)" ] <- "Yagán"
tabla_final$Etnia[tabla_final$Etnia == "Rapa-Nui o Pascuenses"] <- "Pascuense"
tabla_final$Etnia[tabla_final$Etnia == "Rapa-Nui"] <- "Pascuense"
tabla_final$Etnia[tabla_final$Etnia == "Rapa Nui (Pascuense)"] <- "Pascuense"
tabla_final$Etnia[tabla_final$Etnia == "Rapa Nui"] <- "Pascuense"
tabla_final$Etnia[tabla_final$Etnia == "Collas"] <- "Coya"
tabla_final$Etnia[tabla_final$Etnia == "Kawashkar o Alacalufes" ] <- "Alacalufe"
tabla_final$Etnia[tabla_final$Etnia == "Kawashkar" ] <- "Alacalufe"
tabla_final$Etnia[tabla_final$Etnia == "Kawésqar (Alacalufes)" ] <- "Alacalufe"
tabla_final$Etnia[tabla_final$Etnia == "Kawésqar" ] <- "Alacalufe"
tabla_final$Etnia[tabla_final$Etnia == "Kawaskar" ] <- "Alacalufe"
tabla_final$Etnia[tabla_final$Etnia == "Chango" ] <- "Chango"
tabla_final$Etnia[tabla_final$Etnia == "Sin dato"] <- NA
tabla_final$Etnia[tabla_final$Etnia == "NS/NR" ] <- NA
tabla_final$Etnia[tabla_final$Etnia == "No sabe/no responde" ] <- NA tabla_final
4 Ingreso total ytotcor
datatable(tabla_final, extensions = 'Buttons', escape = FALSE, rownames = FALSE,
options = list(dom = 'Bfrtip',
buttons = list('colvis', list(extend = 'collection',
buttons = list(
list(extend='copy'),
list(extend='excel',
filename = 'tabla_etnia_ytotcor'),
list(extend='pdf',
filename= 'tabla_etnia_ytotcor')),
text = 'Download')), scrollX = TRUE))%>%
formatRound(columns=c("Promedio del Ingreso","Desviación standard","Gini") ,mark = "", digits=3)
4.0.1 Comprobacion de las poblaciones por año a partir de la suma de las frecuencias
for (i in c(2006,2009,2011,2013,2015,2017)) {
<- filter(tabla_final,tabla_final$Año == i)
sum_freq print(paste0("Poblacion año ",i))
print(sum(sum_freq$freq))
}
## [1] "Poblacion año 2006"
## [1] 16129516
## [1] "Poblacion año 2009"
## [1] 16581352
## [1] "Poblacion año 2011"
## [1] 16904160
## [1] "Poblacion año 2013"
## [1] 17204714
## [1] "Poblacion año 2015"
## [1] 17489500
## [1] "Poblacion año 2017"
## [1] 17734204
4.0.2 Prueba 1
El resultado que muestra el gráfico representa el promedio del ingreso de las tablas de contingencia asignándole el valor de 0 a los NA de las Casen del 2006 al 2017.
title
4.0.3 Prueba 2
En este gráfico se observa le diferencia que existe entre el promedio del ingreso del 2020 con registros con valor de 0 y sin los valores 0
title