Referencia: http://www3.eurosur.org/FLACSO/mujeres/chile/demo-7.htm



1 Introducción

2 Enmienda a las categorías de etnia (pendiente)

3 Enmienda a las categorías de alfabetismo (pendiente)

4 ttcc: sobre la variable de ingresos totales - etnia

5 ttcc: sobre la variable de ingresos autónomos - etnia

6 ttcc: sobre la variable de ingresos de la ocupación principal - etnia

7 ttcc: sobre la variable de ingresos del trabajo - etnia

8 Gráficos (pendiente)



1. Introducción

Recordemos que las variables que consideramos más relevantes y que por lo tanto utilizaremos son:

variable de ingreso
Ingreso total Ingreso autónomo Ingreso del trabajo Ingreso de la ocupación principal
año
2017 yautcor yautcor ytrabajocor yoprcor
2015 yautcor yautcor ytrabajocor yoprcor
2013 yautcor yautcor ytrabajocor yoprcor
2011 ytotaj yautaj ytrabaj yopraj
2009 ytotaj yautaj ytrabaj yopraj
2006 ytotaj yautaj ytrabaj yopraj

Haremos un filtro sobre la Casen del 2017 para extraer solamente los registros de aquellas personas que se declaran jefes de hogar Generaremos entonces 4 tablas una para cada variable de ingreso

2017

Verifiquemos que la variable yautcor este presente en nuestros 6 datasets

Ingreso total (Etnia)

2 Generacion de ttcc para la variable de ingreso total (ytotcor-ytotaj) y etnia

dataset_2006 <- readRDS(file = "casen_2006_c.rds")
dataset_2009 <- readRDS(file = "casen_2009_c.rds")
dataset_2011 <- readRDS(file = "casen_2011_c.rds")
dataset_2013 <- readRDS(file = "casen_2013_c.rds")
dataset_2015 <- readRDS(file = "casen_2015_c.rds")
dataset_2017 <- readRDS(file = "casen_2017_c.rds")
filtro_2006 <- filter(dataset_2006, dataset_2006$PCO1 == "Jefe(a) de Hogar")
filtro_2009 <- filter(dataset_2009, dataset_2009$PCO1 == "Jefe(a) de Hogar")
filtro_2011 <- filter(dataset_2011, dataset_2011$pco1 == "Jefe(a) de hogar")
filtro_2013 <- filter(dataset_2013, dataset_2013$pco1 == "Jefe(a) de hogar")
filtro_2015 <- filter(dataset_2015, dataset_2015$pco1 == "Jefe(a) de hogar")
filtro_2017 <- filter(dataset_2017, dataset_2017$pco1 == "Jefe(a) de hogar")

4 ttcc: sobre la variable de ingresos totales - etnia

ab_2017 <- filtro_2017[!is.na(filtro_2017$yautcor),]
Q <- quantile(ab_2017$yautcor, probs=c(.25, .75), na.rm = FALSE)
iqr <- IQR(ab_2017$yautcor)
eliminated <- subset(ab_2017, ab_2017$yautcor > (Q[1] - 1.5*iqr) & ab_2017$yautcor < (Q[2]+1.5*iqr))
#eliminated
a <- eliminated$yautcor
b <- eliminated$comuna
c <- eliminated$e1 #alfabetismo
d <- eliminated$r3 #etnia
e <- eliminated$sexo
f <- eliminated$ecivil

promedios_grupales <-aggregate(a, by=list(b, c, d, e,f), FUN = mean , na.rm = TRUE)
promedios_grupales_sd <-aggregate(a, by=list(b, c, d, e,f), FUN = sd , na.rm = TRUE)
promedios_grupales_gini <-aggregate(a, by=list(b, c, d, e,f), FUN = gini , na.rm = TRUE)

promedios_grupales$sd = promedios_grupales_sd$sd.a
promedios_grupales$gini = promedios_grupales_gini$gini.a
d<-promedios_grupales
d$Año <- "2017"
# head(d,5)

names(d)[1] <- "Comuna"
names(d)[2] <- "Alfabetismo"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Estado civil"
names(d)[6] <- "Promedio del Ingreso"
names(d)[7] <- "Desviación standard"
names(d)[8] <- "Gini"
names(d)[9] <- "Año"
# head(d,3)
codigos_comunales <- readRDS(file = "codigos_comunales_2011-2017.rds")
names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"
# codigos_comunales

df_2017 = merge( x = d, y = codigos_comunales, by = "Comuna", all.x = TRUE)
df_2017 <-df_2017[!(df_2017$Promedio == 0),]
head(df_2017,5)
ab_2015 <- filtro_2015[!is.na(filtro_2015$yautcor),]
Q <- quantile(ab_2015$yautcor, probs=c(.25, .75), na.rm = FALSE)
iqr <- IQR(ab_2015$yautcor)
eliminated <- subset(ab_2015, ab_2015$yautcor > (Q[1] - 1.5*iqr) & ab_2015$yautcor < (Q[2]+1.5*iqr))
#eliminated
a <- eliminated$yautcor
b <- eliminated$comuna
c <- eliminated$e1 #alfabetismo
d <- eliminated$r3 #etnia
e <- eliminated$sexo
f <- eliminated$ecivil

promedios_grupales <-aggregate(a, by=list(b, c, d, e,f), FUN = mean , na.rm = TRUE)
promedios_grupales_sd <-aggregate(a, by=list(b, c, d, e,f), FUN = sd , na.rm = TRUE)
promedios_grupales_gini <-aggregate(a, by=list(b, c, d, e,f), FUN = gini , na.rm = TRUE)

promedios_grupales$sd = promedios_grupales_sd$sd.a
promedios_grupales$gini = promedios_grupales_gini$gini.a
d<-promedios_grupales
d$Año <- "2015"
# head(d,5)

names(d)[1] <- "Comuna"
names(d)[2] <- "Alfabetismo"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Estado civil"
names(d)[6] <- "Promedio del Ingreso"
names(d)[7] <- "Desviación standard"
names(d)[8] <- "Gini"
names(d)[9] <- "Año"
# head(d,3)
codigos_comunales <- readRDS(file = "codigos_comunales_2011-2017.rds")
names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"
# codigos_comunales

df_2015 = merge( x = d, y = codigos_comunales, by = "Comuna", all.x = TRUE)
df_2015 <-df_2015[!(df_2015$Promedio == 0),]
head(df_2015,5)
ab_2013 <- filtro_2013[!is.na(filtro_2013$yautcor),]
Q <- quantile(ab_2013$yautcor, probs=c(.25, .75), na.rm = FALSE)
iqr <- IQR(ab_2013$yautcor)
eliminated <- subset(ab_2013, ab_2013$yautcor > (Q[1] - 1.5*iqr) & ab_2013$yautcor < (Q[2]+1.5*iqr))
#eliminated
a <- eliminated$yautcor
b <- eliminated$comuna
c <- eliminated$e1 #alfabetismo
d <- eliminated$r6 #etnia
e <- eliminated$sexo
f <- eliminated$ecivil

promedios_grupales <-aggregate(a, by=list(b, c, d, e,f), FUN = mean , na.rm = TRUE)
promedios_grupales_sd <-aggregate(a, by=list(b, c, d, e,f), FUN = sd , na.rm = TRUE)
promedios_grupales_gini <-aggregate(a, by=list(b, c, d, e,f), FUN = gini , na.rm = TRUE)

promedios_grupales$sd = promedios_grupales_sd$sd.a
promedios_grupales$gini = promedios_grupales_gini$gini.a
d<-promedios_grupales
d$Año <- "2013"
# head(d,5)

names(d)[1] <- "Comuna"
names(d)[2] <- "Alfabetismo"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Estado civil"
names(d)[6] <- "Promedio del Ingreso"
names(d)[7] <- "Desviación standard"
names(d)[8] <- "Gini"
names(d)[9] <- "Año"
# head(d,3)
codigos_comunales <- readRDS(file = "codigos_comunales_2011-2017.rds")
names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"
# codigos_comunales

df_2013 = merge( x = d, y = codigos_comunales, by = "Comuna", all.x = TRUE)
df_2013 <-df_2013[!(df_2013$Promedio == 0),]
head(df_2013,5)
ab_2011 <- filtro_2011[!is.na(filtro_2011$ytotaj),]

Q <- quantile(ab_2011$ytotaj, probs=c(.25, .75), na.rm = FALSE)
iqr <- IQR(ab_2011$ytotaj)
eliminated <- subset(ab_2011, ab_2011$ytotaj > (Q[1] - 1.5*iqr) & ab_2011$ytotaj < (Q[2]+1.5*iqr))
#eliminated
a <- eliminated$ytotaj
b <- eliminated$comuna
c <- eliminated$e1 #alfabetismo
d <- eliminated$r6 #etnia
e <- eliminated$sexo
f <- eliminated$ecivil

promedios_grupales <-aggregate(a, by=list(b, c, d, e,f), FUN = mean , na.rm = TRUE)
promedios_grupales_sd <-aggregate(a, by=list(b, c, d, e,f), FUN = sd , na.rm = TRUE)
promedios_grupales_gini <-aggregate(a, by=list(b, c, d, e,f), FUN = gini , na.rm = TRUE)

promedios_grupales$sd = promedios_grupales_sd$sd.a
promedios_grupales$gini = promedios_grupales_gini$gini.a
d<-promedios_grupales
d$Año <- "2011"
# head(d,5)

names(d)[1] <- "Comuna"
names(d)[2] <- "Alfabetismo"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Estado civil"
names(d)[6] <- "Promedio del Ingreso"
names(d)[7] <- "Desviación standard"
names(d)[8] <- "Gini"
names(d)[9] <- "Año"
# head(d,3)
codigos_comunales <- readRDS(file = "codigos_comunales_2011-2017.rds")
names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"
# codigos_comunales

df_2011 = merge( x = d, y = codigos_comunales, by = "Comuna", all.x = TRUE)
df_2011 <-df_2011[!(df_2011$Promedio == 0),]
head(df_2011,5)
ab_2009 <- filtro_2009[!is.na(filtro_2009$YTOTAJ),]

Q <- quantile(ab_2009$YTOTAJ, probs=c(.25, .75), na.rm = FALSE)
iqr <- IQR(ab_2009$YTOTAJ)
eliminated <- subset(ab_2009, ab_2009$YTOTAJ > (Q[1] - 1.5*iqr) & ab_2009$YTOTAJ < (Q[2]+1.5*iqr))
#eliminated
a <- eliminated$YTOTAJ
b <- eliminated$COMUNA
c <- eliminated$E1 #alfabetismo
d <- eliminated$T5 #etnia
e <- eliminated$SEXO
f <- eliminated$ECIVIL

promedios_grupales <-aggregate(a, by=list(b, c, d, e,f), FUN = mean , na.rm = TRUE)
promedios_grupales_sd <-aggregate(a, by=list(b, c, d, e,f), FUN = sd , na.rm = TRUE)
promedios_grupales_gini <-aggregate(a, by=list(b, c, d, e,f), FUN = gini , na.rm = TRUE)

promedios_grupales$sd = promedios_grupales_sd$sd.a
promedios_grupales$gini = promedios_grupales_gini$gini.a
d<-promedios_grupales
d$Año <- "2009"
# head(d,5)

names(d)[1] <- "Comuna"
names(d)[2] <- "Alfabetismo"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Estado civil"
names(d)[6] <- "Promedio del Ingreso"
names(d)[7] <- "Desviación standard"
names(d)[8] <- "Gini"
names(d)[9] <- "Año"
# head(d,3)
codigos_comunales <- readRDS(file = "codigos_comunales_2009.rds")
names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"
# codigos_comunales

df_2009 = merge( x = d, y = codigos_comunales, by = "Comuna", all.x = TRUE)
df_2009 <-df_2009[!(df_2009$Promedio == 0),]
head(df_2009,5)
ab_2006 <- filtro_2006[!is.na(filtro_2006$YTOTAJ),]
Q <- quantile(ab_2006$YTOTAJ, probs=c(.25, .75), na.rm = FALSE)
iqr <- IQR(ab_2006$YTOTAJ)
eliminated <- subset(ab_2006, ab_2006$YTOTAJ > (Q[1] - 1.5*iqr) & ab_2006$YTOTAJ < (Q[2]+1.5*iqr))
#eliminated
a <- eliminated$YTOTAJ
b <- eliminated$COMUNA
c <- eliminated$E1 #alfabetismo
d <- eliminated$T4 #etnia
e <- eliminated$SEXO
f <- eliminated$ECIVIL

promedios_grupales <-aggregate(a, by=list(b, c, d, e,f), FUN = mean , na.rm = TRUE)
promedios_grupales_sd <-aggregate(a, by=list(b, c, d, e,f), FUN = sd , na.rm = TRUE)
promedios_grupales_gini <-aggregate(a, by=list(b, c, d, e,f), FUN = gini , na.rm = TRUE)

promedios_grupales$sd = promedios_grupales_sd$sd.a
promedios_grupales$gini = promedios_grupales_gini$gini.a
d<-promedios_grupales
d$Año <- "2006"
# head(d,5)

names(d)[1] <- "Comuna"
names(d)[2] <- "Alfabetismo"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Estado civil"
names(d)[6] <- "Promedio del Ingreso"
names(d)[7] <- "Desviación standard"
names(d)[8] <- "Gini"
names(d)[9] <- "Año"
# head(d,3)
codigos_comunales <- readRDS(file = "codigos_comunales_2006.rds")
names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"
# codigos_comunales

df_2006 = merge( x = d, y = codigos_comunales, by = "Comuna", all.x = TRUE)
df_2006 <-df_2006[!(df_2006$Promedio == 0),]
head(df_2006,5)
# union <- rbind(df_2006,df_2009,df_2011,df_2013,df_2015,df_2017)
# union
# filtro_union <- filter(union, union$Año == 2017)
# filtro_union
# saveRDS(union,"ttcc_jefe_de_hogar_yautcor.rds")
# write_xlsx(union,"ttcc_jefe_de_hogar_yautcor.xlsx")

5 ttcc: sobre la variable de ingresos autónomos - etnia

ab_2017 <- filtro_2017[!is.na(filtro_2017$yautcor),]
Q <- quantile(ab_2017$yautcor, probs=c(.25, .75), na.rm = FALSE)
iqr <- IQR(ab_2017$yautcor)
eliminated <- subset(ab_2017, ab_2017$yautcor > (Q[1] - 1.5*iqr) & ab_2017$yautcor < (Q[2]+1.5*iqr))
#eliminated
a <- eliminated$yautcor
b <- eliminated$comuna
c <- eliminated$e1 #alfabetismo
d <- eliminated$r3 #etnia
e <- eliminated$sexo
f <- eliminated$ecivil

promedios_grupales <-aggregate(a, by=list(b, c, d, e,f), FUN = mean , na.rm = TRUE)
promedios_grupales_sd <-aggregate(a, by=list(b, c, d, e,f), FUN = sd , na.rm = TRUE)
promedios_grupales_gini <-aggregate(a, by=list(b, c, d, e,f), FUN = gini , na.rm = TRUE)

promedios_grupales$sd = promedios_grupales_sd$sd.a
promedios_grupales$gini = promedios_grupales_gini$gini.a
d<-promedios_grupales
d$Año <- "2017"
# head(d,5)

names(d)[1] <- "Comuna"
names(d)[2] <- "Alfabetismo"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Estado civil"
names(d)[6] <- "Promedio del Ingreso"
names(d)[7] <- "Desviación standard"
names(d)[8] <- "Gini"
names(d)[9] <- "Año"
# head(d,3)
codigos_comunales <- readRDS(file = "codigos_comunales_2011-2017.rds")
names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"
# codigos_comunales

df_2017 = merge( x = d, y = codigos_comunales, by = "Comuna", all.x = TRUE)
df_2017 <-df_2017[!(df_2017$Promedio == 0),]
head(df_2017,5)
ab_2015 <- filtro_2015[!is.na(filtro_2015$yautcor),]
Q <- quantile(ab_2015$yautcor, probs=c(.25, .75), na.rm = FALSE)
iqr <- IQR(ab_2015$yautcor)
eliminated <- subset(ab_2015, ab_2015$yautcor > (Q[1] - 1.5*iqr) & ab_2015$yautcor < (Q[2]+1.5*iqr))
#eliminated
a <- eliminated$yautcor
b <- eliminated$comuna
c <- eliminated$e1 #alfabetismo
d <- eliminated$r3 #etnia
e <- eliminated$sexo
f <- eliminated$ecivil

promedios_grupales <-aggregate(a, by=list(b, c, d, e,f), FUN = mean , na.rm = TRUE)
promedios_grupales_sd <-aggregate(a, by=list(b, c, d, e,f), FUN = sd , na.rm = TRUE)
promedios_grupales_gini <-aggregate(a, by=list(b, c, d, e,f), FUN = gini , na.rm = TRUE)

promedios_grupales$sd = promedios_grupales_sd$sd.a
promedios_grupales$gini = promedios_grupales_gini$gini.a
d<-promedios_grupales
d$Año <- "2015"
# head(d,5)

names(d)[1] <- "Comuna"
names(d)[2] <- "Alfabetismo"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Estado civil"
names(d)[6] <- "Promedio del Ingreso"
names(d)[7] <- "Desviación standard"
names(d)[8] <- "Gini"
names(d)[9] <- "Año"
# head(d,3)
codigos_comunales <- readRDS(file = "codigos_comunales_2011-2017.rds")
names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"
# codigos_comunales

df_2015 = merge( x = d, y = codigos_comunales, by = "Comuna", all.x = TRUE)
df_2015 <-df_2015[!(df_2015$Promedio == 0),]
head(df_2015,5)
ab_2013 <- filtro_2013[!is.na(filtro_2013$yautcor),]
Q <- quantile(ab_2013$yautcor, probs=c(.25, .75), na.rm = FALSE)
iqr <- IQR(ab_2013$yautcor)
eliminated <- subset(ab_2013, ab_2013$yautcor > (Q[1] - 1.5*iqr) & ab_2013$yautcor < (Q[2]+1.5*iqr))
#eliminated
a <- eliminated$yautcor
b <- eliminated$comuna
c <- eliminated$e1 #alfabetismo
d <- eliminated$r6 #etnia
e <- eliminated$sexo
f <- eliminated$ecivil

promedios_grupales <-aggregate(a, by=list(b, c, d, e,f), FUN = mean , na.rm = TRUE)
promedios_grupales_sd <-aggregate(a, by=list(b, c, d, e,f), FUN = sd , na.rm = TRUE)
promedios_grupales_gini <-aggregate(a, by=list(b, c, d, e,f), FUN = gini , na.rm = TRUE)

promedios_grupales$sd = promedios_grupales_sd$sd.a
promedios_grupales$gini = promedios_grupales_gini$gini.a
d<-promedios_grupales
d$Año <- "2013"
# head(d,5)

names(d)[1] <- "Comuna"
names(d)[2] <- "Alfabetismo"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Estado civil"
names(d)[6] <- "Promedio del Ingreso"
names(d)[7] <- "Desviación standard"
names(d)[8] <- "Gini"
names(d)[9] <- "Año"
# head(d,3)
codigos_comunales <- readRDS(file = "codigos_comunales_2011-2017.rds")
names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"
# codigos_comunales

df_2013 = merge( x = d, y = codigos_comunales, by = "Comuna", all.x = TRUE)
df_2013 <-df_2013[!(df_2013$Promedio == 0),]
head(df_2013,5)
ab_2011 <- filtro_2011[!is.na(filtro_2011$yautaj),]

Q <- quantile(ab_2011$yautaj, probs=c(.25, .75), na.rm = FALSE)
iqr <- IQR(ab_2011$yautaj)
eliminated <- subset(ab_2011, ab_2011$yautaj > (Q[1] - 1.5*iqr) & ab_2011$yautaj < (Q[2]+1.5*iqr))
#eliminated
a <- eliminated$yautaj
b <- eliminated$comuna
c <- eliminated$e1 #alfabetismo
d <- eliminated$r6 #etnia
e <- eliminated$sexo
f <- eliminated$ecivil

promedios_grupales <-aggregate(a, by=list(b, c, d, e,f), FUN = mean , na.rm = TRUE)
promedios_grupales_sd <-aggregate(a, by=list(b, c, d, e,f), FUN = sd , na.rm = TRUE)
promedios_grupales_gini <-aggregate(a, by=list(b, c, d, e,f), FUN = gini , na.rm = TRUE)

promedios_grupales$sd = promedios_grupales_sd$sd.a
promedios_grupales$gini = promedios_grupales_gini$gini.a
d<-promedios_grupales
d$Año <- "2011"
# head(d,5)

names(d)[1] <- "Comuna"
names(d)[2] <- "Alfabetismo"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Estado civil"
names(d)[6] <- "Promedio del Ingreso"
names(d)[7] <- "Desviación standard"
names(d)[8] <- "Gini"
names(d)[9] <- "Año"
# head(d,3)
codigos_comunales <- readRDS(file = "codigos_comunales_2011-2017.rds")
names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"
# codigos_comunales

df_2011 = merge( x = d, y = codigos_comunales, by = "Comuna", all.x = TRUE)
df_2011 <-df_2011[!(df_2011$Promedio == 0),]
head(df_2011,5)
ab_2009 <- filtro_2009[!is.na(filtro_2009$YAUTAJ),]

Q <- quantile(ab_2009$YAUTAJ, probs=c(.25, .75), na.rm = FALSE)
iqr <- IQR(ab_2009$YAUTAJ)
eliminated <- subset(ab_2009, ab_2009$YAUTAJ > (Q[1] - 1.5*iqr) & ab_2009$YAUTAJ < (Q[2]+1.5*iqr))
#eliminated
a <- eliminated$YAUTAJ
b <- eliminated$COMUNA
c <- eliminated$E1 #alfabetismo
d <- eliminated$T5 #etnia
e <- eliminated$SEXO
f <- eliminated$ECIVIL

promedios_grupales <-aggregate(a, by=list(b, c, d, e,f), FUN = mean , na.rm = TRUE)
promedios_grupales_sd <-aggregate(a, by=list(b, c, d, e,f), FUN = sd , na.rm = TRUE)
promedios_grupales_gini <-aggregate(a, by=list(b, c, d, e,f), FUN = gini , na.rm = TRUE)

promedios_grupales$sd = promedios_grupales_sd$sd.a
promedios_grupales$gini = promedios_grupales_gini$gini.a
d<-promedios_grupales
d$Año <- "2009"
# head(d,5)

names(d)[1] <- "Comuna"
names(d)[2] <- "Alfabetismo"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Estado civil"
names(d)[6] <- "Promedio del Ingreso"
names(d)[7] <- "Desviación standard"
names(d)[8] <- "Gini"
names(d)[9] <- "Año"
# head(d,3)
codigos_comunales <- readRDS(file = "codigos_comunales_2009.rds")
names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"
# codigos_comunales

df_2009 = merge( x = d, y = codigos_comunales, by = "Comuna", all.x = TRUE)
df_2009 <-df_2009[!(df_2009$Promedio == 0),]
head(df_2009,5)
ab_2006 <- filtro_2006[!is.na(filtro_2006$YAUTAJ),]
Q <- quantile(ab_2006$YAUTAJ, probs=c(.25, .75), na.rm = FALSE)
iqr <- IQR(ab_2006$YAUTAJ)
eliminated <- subset(ab_2006, ab_2006$YAUTAJ > (Q[1] - 1.5*iqr) & ab_2006$YAUTAJ < (Q[2]+1.5*iqr))
#eliminated
a <- eliminated$YAUTAJ
b <- eliminated$COMUNA
c <- eliminated$E1 #alfabetismo
d <- eliminated$T4 #etnia
e <- eliminated$SEXO
f <- eliminated$ECIVIL

promedios_grupales <-aggregate(a, by=list(b, c, d, e,f), FUN = mean , na.rm = TRUE)
promedios_grupales_sd <-aggregate(a, by=list(b, c, d, e,f), FUN = sd , na.rm = TRUE)
promedios_grupales_gini <-aggregate(a, by=list(b, c, d, e,f), FUN = gini , na.rm = TRUE)

promedios_grupales$sd = promedios_grupales_sd$sd.a
promedios_grupales$gini = promedios_grupales_gini$gini.a
d<-promedios_grupales
d$Año <- "2006"
# head(d,5)

names(d)[1] <- "Comuna"
names(d)[2] <- "Alfabetismo"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Estado civil"
names(d)[6] <- "Promedio del Ingreso"
names(d)[7] <- "Desviación standard"
names(d)[8] <- "Gini"
names(d)[9] <- "Año"
# head(d,3)
codigos_comunales <- readRDS(file = "codigos_comunales_2006.rds")
names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"
# codigos_comunales

df_2006 = merge( x = d, y = codigos_comunales, by = "Comuna", all.x = TRUE)
df_2006 <-df_2006[!(df_2006$Promedio == 0),]
head(df_2006,5)
# union <- rbind(df_2006,df_2009,df_2011,df_2013,df_2015,df_2017)
# union
# filtro_union <- filter(union, union$Año == 2006)
# filtro_union
# saveRDS(union,"ttcc_jefe_de_hogar_yautcor.rds")
# write_xlsx(union,"ttcc_jefe_de_hogar_yautcor.xlsx")

6 ttcc: sobre la variable de ingresos de la ocupación principal - etnia

ab_2017 <- filtro_2017[!is.na(filtro_2017$yoprcor),]

Q <- quantile(ab_2017$yoprcor, probs=c(.25, .75), na.rm = FALSE)
iqr <- IQR(ab_2017$yoprcor)
eliminated <- subset(ab_2017, ab_2017$yoprcor > (Q[1] - 1.5*iqr) & ab_2017$yoprcor < (Q[2]+1.5*iqr))
#eliminated
a <- eliminated$yoprcor
b <- eliminated$comuna
c <- eliminated$e1 #alfabetismo
d <- eliminated$r3 #etnia
e <- eliminated$sexo
f <- eliminated$ecivil

promedios_grupales <-aggregate(a, by=list(b, c, d, e,f), FUN = mean , na.rm = TRUE)
promedios_grupales_sd <-aggregate(a, by=list(b, c, d, e,f), FUN = sd , na.rm = TRUE)
promedios_grupales_gini <-aggregate(a, by=list(b, c, d, e,f), FUN = gini , na.rm = TRUE)

promedios_grupales$sd = promedios_grupales_sd$sd.a
promedios_grupales$gini = promedios_grupales_gini$gini.a
d<-promedios_grupales
d$Año <- "2017"
# head(d,5)

names(d)[1] <- "Comuna"
names(d)[2] <- "Alfabetismo"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Estado civil"
names(d)[6] <- "Promedio del Ingreso"
names(d)[7] <- "Desviación standard"
names(d)[8] <- "Gini"
names(d)[9] <- "Año"
# head(d,3)
codigos_comunales <- readRDS(file = "codigos_comunales_2011-2017.rds")
names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"
# codigos_comunales

df_2017 = merge( x = d, y = codigos_comunales, by = "Comuna", all.x = TRUE)
df_2017 <-df_2017[!(df_2017$Promedio == 0),]
head(df_2017,5)
filtro_2015$yo
## NULL
ab_2015 <- filtro_2015[!is.na(filtro_2015$yoprCor),]

Q <- quantile(ab_2015$yoprCor, probs=c(.25, .75), na.rm = FALSE)
iqr <- IQR(ab_2015$yoprCor)
eliminated <- subset(ab_2015, ab_2015$yoprCor > (Q[1] - 1.5*iqr) & ab_2015$yoprCor < (Q[2]+1.5*iqr))
#eliminated
a <- eliminated$yoprCor
b <- eliminated$comuna
c <- eliminated$e1 #alfabetismo
d <- eliminated$r3 #etnia
e <- eliminated$sexo
f <- eliminated$ecivil

promedios_grupales <-aggregate(a, by=list(b, c, d, e,f), FUN = mean , na.rm = TRUE)
promedios_grupales_sd <-aggregate(a, by=list(b, c, d, e,f), FUN = sd , na.rm = TRUE)
promedios_grupales_gini <-aggregate(a, by=list(b, c, d, e,f), FUN = gini , na.rm = TRUE)

promedios_grupales$sd = promedios_grupales_sd$sd.a
promedios_grupales$gini = promedios_grupales_gini$gini.a
d<-promedios_grupales
d$Año <- "2015"
# head(d,5)

names(d)[1] <- "Comuna"
names(d)[2] <- "Alfabetismo"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Estado civil"
names(d)[6] <- "Promedio del Ingreso"
names(d)[7] <- "Desviación standard"
names(d)[8] <- "Gini"
names(d)[9] <- "Año"
# head(d,3)
codigos_comunales <- readRDS(file = "codigos_comunales_2011-2017.rds")
names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"
# codigos_comunales

df_2015 = merge( x = d, y = codigos_comunales, by = "Comuna", all.x = TRUE)
df_2015 <-df_2015[!(df_2015$Promedio == 0),]
head(df_2015,5)
ab_2013 <- filtro_2013[!is.na(filtro_2013$yoprCor),]
Q <- quantile(ab_2013$yoprCor, probs=c(.25, .75), na.rm = FALSE)
iqr <- IQR(ab_2013$yoprCor)
eliminated <- subset(ab_2013, ab_2013$yoprCor > (Q[1] - 1.5*iqr) & ab_2013$yoprCor < (Q[2]+1.5*iqr))
#eliminated
a <- eliminated$yoprCor
b <- eliminated$comuna
c <- eliminated$e1 #alfabetismo
d <- eliminated$r6 #etnia
e <- eliminated$sexo
f <- eliminated$ecivil

promedios_grupales <-aggregate(a, by=list(b, c, d, e,f), FUN = mean , na.rm = TRUE)
promedios_grupales_sd <-aggregate(a, by=list(b, c, d, e,f), FUN = sd , na.rm = TRUE)
promedios_grupales_gini <-aggregate(a, by=list(b, c, d, e,f), FUN = gini , na.rm = TRUE)

promedios_grupales$sd = promedios_grupales_sd$sd.a
promedios_grupales$gini = promedios_grupales_gini$gini.a
d<-promedios_grupales
d$Año <- "2013"
# head(d,5)

names(d)[1] <- "Comuna"
names(d)[2] <- "Alfabetismo"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Estado civil"
names(d)[6] <- "Promedio del Ingreso"
names(d)[7] <- "Desviación standard"
names(d)[8] <- "Gini"
names(d)[9] <- "Año"
# head(d,3)
codigos_comunales <- readRDS(file = "codigos_comunales_2011-2017.rds")
names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"
# codigos_comunales

df_2013 = merge( x = d, y = codigos_comunales, by = "Comuna", all.x = TRUE)
df_2013 <-df_2013[!(df_2013$Promedio == 0),]
head(df_2013,5)
ab_2011 <- filtro_2011[!is.na(filtro_2011$yopraj),]

Q <- quantile(ab_2011$yopraj, probs=c(.25, .75), na.rm = FALSE)
iqr <- IQR(ab_2011$yopraj)
eliminated <- subset(ab_2011, ab_2011$yopraj > (Q[1] - 1.5*iqr) & ab_2011$yopraj < (Q[2]+1.5*iqr))
#eliminated
a <- eliminated$yopraj
b <- eliminated$comuna
c <- eliminated$e1 #alfabetismo
d <- eliminated$r6 #etnia
e <- eliminated$sexo
f <- eliminated$ecivil

promedios_grupales <-aggregate(a, by=list(b, c, d, e,f), FUN = mean , na.rm = TRUE)
promedios_grupales_sd <-aggregate(a, by=list(b, c, d, e,f), FUN = sd , na.rm = TRUE)
promedios_grupales_gini <-aggregate(a, by=list(b, c, d, e,f), FUN = gini , na.rm = TRUE)

promedios_grupales$sd = promedios_grupales_sd$sd.a
promedios_grupales$gini = promedios_grupales_gini$gini.a
d<-promedios_grupales
d$Año <- "2011"
# head(d,5)

names(d)[1] <- "Comuna"
names(d)[2] <- "Alfabetismo"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Estado civil"
names(d)[6] <- "Promedio del Ingreso"
names(d)[7] <- "Desviación standard"
names(d)[8] <- "Gini"
names(d)[9] <- "Año"
# head(d,3)
codigos_comunales <- readRDS(file = "codigos_comunales_2011-2017.rds")
names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"
# codigos_comunales

df_2011 = merge( x = d, y = codigos_comunales, by = "Comuna", all.x = TRUE)
df_2011 <-df_2011[!(df_2011$Promedio == 0),]
head(df_2011,5)
ab_2009 <- filtro_2009[!is.na(filtro_2009$YOPRAJ),]

Q <- quantile(ab_2009$YOPRAJ, probs=c(.25, .75), na.rm = FALSE)
iqr <- IQR(ab_2009$YOPRAJ)
eliminated <- subset(ab_2009, ab_2009$YOPRAJ > (Q[1] - 1.5*iqr) & ab_2009$YOPRAJ < (Q[2]+1.5*iqr))
#eliminated
a <- eliminated$YOPRAJ
b <- eliminated$COMUNA
c <- eliminated$E1 #alfabetismo
d <- eliminated$T5 #etnia
e <- eliminated$SEXO
f <- eliminated$ECIVIL

promedios_grupales <-aggregate(a, by=list(b, c, d, e,f), FUN = mean , na.rm = TRUE)
promedios_grupales_sd <-aggregate(a, by=list(b, c, d, e,f), FUN = sd , na.rm = TRUE)
promedios_grupales_gini <-aggregate(a, by=list(b, c, d, e,f), FUN = gini , na.rm = TRUE)

promedios_grupales$sd = promedios_grupales_sd$sd.a
promedios_grupales$gini = promedios_grupales_gini$gini.a
d<-promedios_grupales
d$Año <- "2009"
# head(d,5)

names(d)[1] <- "Comuna"
names(d)[2] <- "Alfabetismo"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Estado civil"
names(d)[6] <- "Promedio del Ingreso"
names(d)[7] <- "Desviación standard"
names(d)[8] <- "Gini"
names(d)[9] <- "Año"
# head(d,3)
codigos_comunales <- readRDS(file = "codigos_comunales_2009.rds")
names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"
# codigos_comunales

df_2009 = merge( x = d, y = codigos_comunales, by = "Comuna", all.x = TRUE)
df_2009 <-df_2009[!(df_2009$Promedio == 0),]
head(df_2009,5)
ab_2006 <- filtro_2006[!is.na(filtro_2006$YOPRAJ),]
Q <- quantile(ab_2006$YOPRAJ, probs=c(.25, .75), na.rm = FALSE)
iqr <- IQR(ab_2006$YOPRAJ)
eliminated <- subset(ab_2006, ab_2006$YOPRAJ > (Q[1] - 1.5*iqr) & ab_2006$YOPRAJ < (Q[2]+1.5*iqr))
#eliminated
a <- eliminated$YOPRAJ
b <- eliminated$COMUNA
c <- eliminated$E1 #alfabetismo
d <- eliminated$T4 #etnia
e <- eliminated$SEXO
f <- eliminated$ECIVIL

promedios_grupales <-aggregate(a, by=list(b, c, d, e,f), FUN = mean , na.rm = TRUE)
promedios_grupales_sd <-aggregate(a, by=list(b, c, d, e,f), FUN = sd , na.rm = TRUE)
promedios_grupales_gini <-aggregate(a, by=list(b, c, d, e,f), FUN = gini , na.rm = TRUE)

promedios_grupales$sd = promedios_grupales_sd$sd.a
promedios_grupales$gini = promedios_grupales_gini$gini.a
d<-promedios_grupales
d$Año <- "2006"
# head(d,5)

names(d)[1] <- "Comuna"
names(d)[2] <- "Alfabetismo"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Estado civil"
names(d)[6] <- "Promedio del Ingreso"
names(d)[7] <- "Desviación standard"
names(d)[8] <- "Gini"
names(d)[9] <- "Año"
# head(d,3)
codigos_comunales <- readRDS(file = "codigos_comunales_2006.rds")
names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"
# codigos_comunales

df_2006 = merge( x = d, y = codigos_comunales, by = "Comuna", all.x = TRUE)
df_2006 <-df_2006[!(df_2006$Promedio == 0),]
head(df_2006,5)
# union <- rbind(df_2006,df_2009,df_2011,df_2013,df_2015,df_2017)
# union
# filtro_union <- filter(union, union$Año == 2006)
# filtro_union
# saveRDS(union,"ttcc_jefe_de_hogar_yopraj.rds")
# write_xlsx(union,"ttcc_jefe_de_hogar_yopraj.xlsx")

7 ttcc: sobre la variable de ingresos del trabajo - etnia

ab_2017 <- filtro_2017[!is.na(filtro_2017$ytrabajocor),]

Q <- quantile(ab_2017$ytrabajocor, probs=c(.25, .75), na.rm = FALSE)
iqr <- IQR(ab_2017$ytrabajocor)
eliminated <- subset(ab_2017, ab_2017$ytrabajocor > (Q[1] - 1.5*iqr) & ab_2017$ytrabajocor < (Q[2]+1.5*iqr))
#eliminated
a <- eliminated$ytrabajocor
b <- eliminated$comuna
c <- eliminated$e1 #alfabetismo
d <- eliminated$r3 #etnia
e <- eliminated$sexo
f <- eliminated$ecivil

promedios_grupales <-aggregate(a, by=list(b, c, d, e,f), FUN = mean , na.rm = TRUE)
promedios_grupales_sd <-aggregate(a, by=list(b, c, d, e,f), FUN = sd , na.rm = TRUE)
promedios_grupales_gini <-aggregate(a, by=list(b, c, d, e,f), FUN = gini , na.rm = TRUE)

promedios_grupales$sd = promedios_grupales_sd$sd.a
promedios_grupales$gini = promedios_grupales_gini$gini.a
d<-promedios_grupales
d$Año <- "2017"
# head(d,5)

names(d)[1] <- "Comuna"
names(d)[2] <- "Alfabetismo"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Estado civil"
names(d)[6] <- "Promedio del Ingreso"
names(d)[7] <- "Desviación standard"
names(d)[8] <- "Gini"
names(d)[9] <- "Año"
# head(d,3)
codigos_comunales <- readRDS(file = "codigos_comunales_2011-2017.rds")
names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"
# codigos_comunales

df_2017 = merge( x = d, y = codigos_comunales, by = "Comuna", all.x = TRUE)
df_2017 <-df_2017[!(df_2017$Promedio == 0),]
head(df_2017,5)
ab_2015 <- filtro_2015[!is.na(filtro_2015$ytrabajoCor),]

Q <- quantile(ab_2015$ytrabajoCor, probs=c(.25, .75), na.rm = FALSE)
iqr <- IQR(ab_2015$ytrabajoCor)
eliminated <- subset(ab_2015, ab_2015$ytrabajoCor > (Q[1] - 1.5*iqr) & ab_2015$ytrabajoCor < (Q[2]+1.5*iqr))
#eliminated
a <- eliminated$ytrabajoCor
b <- eliminated$comuna
c <- eliminated$e1 #alfabetismo
d <- eliminated$r3 #etnia
e <- eliminated$sexo
f <- eliminated$ecivil

promedios_grupales <-aggregate(a, by=list(b, c, d, e,f), FUN = mean , na.rm = TRUE)
promedios_grupales_sd <-aggregate(a, by=list(b, c, d, e,f), FUN = sd , na.rm = TRUE)
promedios_grupales_gini <-aggregate(a, by=list(b, c, d, e,f), FUN = gini , na.rm = TRUE)

promedios_grupales$sd = promedios_grupales_sd$sd.a
promedios_grupales$gini = promedios_grupales_gini$gini.a
d<-promedios_grupales
d$Año <- "2015"
# head(d,5)

names(d)[1] <- "Comuna"
names(d)[2] <- "Alfabetismo"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Estado civil"
names(d)[6] <- "Promedio del Ingreso"
names(d)[7] <- "Desviación standard"
names(d)[8] <- "Gini"
names(d)[9] <- "Año"
# head(d,3)
codigos_comunales <- readRDS(file = "codigos_comunales_2011-2017.rds")
names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"
# codigos_comunales

df_2015 = merge( x = d, y = codigos_comunales, by = "Comuna", all.x = TRUE)
df_2015 <-df_2015[!(df_2015$Promedio == 0),]
head(df_2015,5)
ab_2013 <- filtro_2013[!is.na(filtro_2013$ytrabajoCor),]
Q <- quantile(ab_2013$ytrabajoCor, probs=c(.25, .75), na.rm = FALSE)
iqr <- IQR(ab_2013$ytrabajoCor)
eliminated <- subset(ab_2013, ab_2013$ytrabajoCor > (Q[1] - 1.5*iqr) & ab_2013$ytrabajoCor < (Q[2]+1.5*iqr))
#eliminated
a <- eliminated$ytrabajoCor
b <- eliminated$comuna
c <- eliminated$e1 #alfabetismo
d <- eliminated$r6 #etnia
e <- eliminated$sexo
f <- eliminated$ecivil

promedios_grupales <-aggregate(a, by=list(b, c, d, e,f), FUN = mean , na.rm = TRUE)
promedios_grupales_sd <-aggregate(a, by=list(b, c, d, e,f), FUN = sd , na.rm = TRUE)
promedios_grupales_gini <-aggregate(a, by=list(b, c, d, e,f), FUN = gini , na.rm = TRUE)

promedios_grupales$sd = promedios_grupales_sd$sd.a
promedios_grupales$gini = promedios_grupales_gini$gini.a
d<-promedios_grupales
d$Año <- "2013"
# head(d,5)

names(d)[1] <- "Comuna"
names(d)[2] <- "Alfabetismo"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Estado civil"
names(d)[6] <- "Promedio del Ingreso"
names(d)[7] <- "Desviación standard"
names(d)[8] <- "Gini"
names(d)[9] <- "Año"
# head(d,3)
codigos_comunales <- readRDS(file = "codigos_comunales_2011-2017.rds")
names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"
# codigos_comunales

df_2013 = merge( x = d, y = codigos_comunales, by = "Comuna", all.x = TRUE)
df_2013 <-df_2013[!(df_2013$Promedio == 0),]
head(df_2013,5)
ab_2011 <- filtro_2011[!is.na(filtro_2011$ytrabaj),]

Q <- quantile(ab_2011$ytrabaj, probs=c(.25, .75), na.rm = FALSE)
iqr <- IQR(ab_2011$ytrabaj)
eliminated <- subset(ab_2011, ab_2011$ytrabaj > (Q[1] - 1.5*iqr) & ab_2011$ytrabaj < (Q[2]+1.5*iqr))
#eliminated
a <- eliminated$ytrabaj
b <- eliminated$comuna
c <- eliminated$e1 #alfabetismo
d <- eliminated$r6 #etnia
e <- eliminated$sexo
f <- eliminated$ecivil

promedios_grupales <-aggregate(a, by=list(b, c, d, e,f), FUN = mean , na.rm = TRUE)
promedios_grupales_sd <-aggregate(a, by=list(b, c, d, e,f), FUN = sd , na.rm = TRUE)
promedios_grupales_gini <-aggregate(a, by=list(b, c, d, e,f), FUN = gini , na.rm = TRUE)

promedios_grupales$sd = promedios_grupales_sd$sd.a
promedios_grupales$gini = promedios_grupales_gini$gini.a
d<-promedios_grupales
d$Año <- "2011"
# head(d,5)

names(d)[1] <- "Comuna"
names(d)[2] <- "Alfabetismo"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Estado civil"
names(d)[6] <- "Promedio del Ingreso"
names(d)[7] <- "Desviación standard"
names(d)[8] <- "Gini"
names(d)[9] <- "Año"
# head(d,3)
codigos_comunales <- readRDS(file = "codigos_comunales_2011-2017.rds")
names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"
# codigos_comunales

df_2011 = merge( x = d, y = codigos_comunales, by = "Comuna", all.x = TRUE)
df_2011 <-df_2011[!(df_2011$Promedio == 0),]
head(df_2011,5)
ab_2009 <- filtro_2009[!is.na(filtro_2009$YTRABAJ),]

Q <- quantile(ab_2009$YTRABAJ, probs=c(.25, .75), na.rm = FALSE)
iqr <- IQR(ab_2009$YTRABAJ)
eliminated <- subset(ab_2009, ab_2009$YTRABAJ > (Q[1] - 1.5*iqr) & ab_2009$YTRABAJ < (Q[2]+1.5*iqr))
#eliminated
a <- eliminated$YTRABAJ
b <- eliminated$COMUNA
c <- eliminated$E1 #alfabetismo
d <- eliminated$T5 #etnia
e <- eliminated$SEXO
f <- eliminated$ECIVIL

promedios_grupales <-aggregate(a, by=list(b, c, d, e,f), FUN = mean , na.rm = TRUE)
promedios_grupales_sd <-aggregate(a, by=list(b, c, d, e,f), FUN = sd , na.rm = TRUE)
promedios_grupales_gini <-aggregate(a, by=list(b, c, d, e,f), FUN = gini , na.rm = TRUE)

promedios_grupales$sd = promedios_grupales_sd$sd.a
promedios_grupales$gini = promedios_grupales_gini$gini.a
d<-promedios_grupales
d$Año <- "2009"
# head(d,5)

names(d)[1] <- "Comuna"
names(d)[2] <- "Alfabetismo"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Estado civil"
names(d)[6] <- "Promedio del Ingreso"
names(d)[7] <- "Desviación standard"
names(d)[8] <- "Gini"
names(d)[9] <- "Año"
# head(d,3)
codigos_comunales <- readRDS(file = "codigos_comunales_2009.rds")
names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"
# codigos_comunales

df_2009 = merge( x = d, y = codigos_comunales, by = "Comuna", all.x = TRUE)
df_2009 <-df_2009[!(df_2009$Promedio == 0),]
head(df_2009,5)
ab_2006 <- filtro_2006[!is.na(filtro_2006$YTRABAJ),]
Q <- quantile(ab_2006$YTRABAJ, probs=c(.25, .75), na.rm = FALSE)
iqr <- IQR(ab_2006$YTRABAJ)
eliminated <- subset(ab_2006, ab_2006$YTRABAJ > (Q[1] - 1.5*iqr) & ab_2006$YTRABAJ < (Q[2]+1.5*iqr))
#eliminated
a <- eliminated$YTRABAJ
b <- eliminated$COMUNA
c <- eliminated$E1 #alfabetismo
d <- eliminated$T4 #etnia
e <- eliminated$SEXO
f <- eliminated$ECIVIL

promedios_grupales <-aggregate(a, by=list(b, c, d, e,f), FUN = mean , na.rm = TRUE)
promedios_grupales_sd <-aggregate(a, by=list(b, c, d, e,f), FUN = sd , na.rm = TRUE)
promedios_grupales_gini <-aggregate(a, by=list(b, c, d, e,f), FUN = gini , na.rm = TRUE)

promedios_grupales$sd = promedios_grupales_sd$sd.a
promedios_grupales$gini = promedios_grupales_gini$gini.a
d<-promedios_grupales
d$Año <- "2006"
# head(d,5)

names(d)[1] <- "Comuna"
names(d)[2] <- "Alfabetismo"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Estado civil"
names(d)[6] <- "Promedio del Ingreso"
names(d)[7] <- "Desviación standard"
names(d)[8] <- "Gini"
names(d)[9] <- "Año"
# head(d,3)
codigos_comunales <- readRDS(file = "codigos_comunales_2006.rds")
names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"
# codigos_comunales

df_2006 = merge( x = d, y = codigos_comunales, by = "Comuna", all.x = TRUE)
df_2006 <-df_2006[!(df_2006$Promedio == 0),]
head(df_2006,5)
# union <- rbind(df_2006,df_2009,df_2011,df_2013,df_2015,df_2017)
# union
# filtro_union <- filter(union, union$Año == 2006)
# filtro_union
# saveRDS(union,"ttcc_jefe_de_hogar_ytrabaj.rds")
# write_xlsx(union,"ttcc_jefe_de_hogar_ytrabaj.xlsx")