Estudio de Ingreso en la Casen
Análisis de la distribución del Ingreso en los jefes de hogar por sexo.
Abstract
La sociología ha definido 3 tipos de familia en relación con su extensión y composición. Las nucleares, compuestas normalmente por un padre, madre y sus hijos, biológicos o adoptados, las extendidas, en las que se agregan a las nucleares las generaciones sucesivas a través de líneas de descendencia paternas o maternas, esto es, abuelos, tíos, sobrinos, primos, etc, y las unipersonales, una caracterización algo extraña.
La estructura familiar chilena ha tendido a una ampliación del número de familias nucleares. En 1970 solamente un tercio de ellas eran nucleares, siendo en 1982 aproximadamente los 2 tercios. Éste aumento notable de las familias nucleares frente a las extendidas, sucedió simultáneamente al tiempo que creció el número de familias viviendo en un mismo hogar, lo que estaría reflejando un deficít habitacional.
Existen muchos estudios que relacionan a las mujeres jefas de hogar con la pobreza, en lo que se ha denominado la “feminización de la pobreza”. El presente estudio genera clasificaciones en torno a la jefatura de hogar, el sexo, la etnia, el alfabetismo y el estado civil, sobre el promedio de los Ingresos. Exploraremos las diferencias de ingresos entre hombres y mujeres jefes de hogar.
Preguntas relevantes a responder son: ¿qué proporción de hogares tiene como jefe a una mujer? y ¿son las familias nucleares dirigidas por una mujer más pobres que el resto? Quedan pendientes para una futura investigación las siguientes preguntas: ¿las mujeres jefas de hogar tienen un menor nivel de estudio que los hombres? y ¿predominan las edades avanzadas en las jefas de las familias nucleares pobres?
Es difícil identificar con precisión el criterio para definir a un jefe de hogar. En general, se declaran así las mujeres cuando dirigen un hogar solas. Se deben considerar los factores culturales que hacen que se declaren como jefes de hogar identidades masculinas. Es así que creemos que la proporción de mujeres jefas de hogar es mucho más alta que las oficialmente declaradas.
Los datos examinados provienen de las encuestas Casen entre el 2006 y 2017
Referencia: http://www3.eurosur.org/FLACSO/mujeres/chile/demo-7.htm
Recordemos que las variables que consideramos más relevantes y que por lo tanto utilizaremos son:
variable de ingreso | ||||
---|---|---|---|---|
Ingreso total | Ingreso autónomo | Ingreso del trabajo | Ingreso de la ocupación principal | |
año | ||||
2017 | yautcor | yautcor | ytrabajocor | yoprcor |
2015 | yautcor | yautcor | ytrabajocor | yoprcor |
2013 | yautcor | yautcor | ytrabajocor | yoprcor |
2011 | ytotaj | yautaj | ytrabaj | yopraj |
2009 | ytotaj | yautaj | ytrabaj | yopraj |
2006 | ytotaj | yautaj | ytrabaj | yopraj |
Haremos un filtro sobre la Casen del 2017 para extraer solamente los registros de aquellas personas que se declaran jefes de hogar Generaremos entonces 4 tablas una para cada variable de ingreso
dataset_2006 <- readRDS(file = "casen_2006_c.rds")
dataset_2009 <- readRDS(file = "casen_2009_c.rds")
dataset_2011 <- readRDS(file = "casen_2011_c.rds")
dataset_2013 <- readRDS(file = "casen_2013_c.rds")
dataset_2015 <- readRDS(file = "casen_2015_c.rds")
dataset_2017 <- readRDS(file = "casen_2017_c.rds")
filtro_2006 <- filter(dataset_2006, dataset_2006$PCO1 == "Jefe(a) de Hogar")
filtro_2009 <- filter(dataset_2009, dataset_2009$PCO1 == "Jefe(a) de Hogar")
filtro_2011 <- filter(dataset_2011, dataset_2011$pco1 == "Jefe(a) de hogar")
filtro_2013 <- filter(dataset_2013, dataset_2013$pco1 == "Jefe(a) de hogar")
filtro_2015 <- filter(dataset_2015, dataset_2015$pco1 == "Jefe(a) de hogar")
filtro_2017 <- filter(dataset_2017, dataset_2017$pco1 == "Jefe(a) de hogar")
ab_2017 <- filtro_2017[!is.na(filtro_2017$yautcor),]
Q <- quantile(ab_2017$yautcor, probs=c(.25, .75), na.rm = FALSE)
iqr <- IQR(ab_2017$yautcor)
eliminated <- subset(ab_2017, ab_2017$yautcor > (Q[1] - 1.5*iqr) & ab_2017$yautcor < (Q[2]+1.5*iqr))
#eliminated
a <- eliminated$yautcor
b <- eliminated$comuna
c <- eliminated$e1 #alfabetismo
d <- eliminated$r3 #etnia
e <- eliminated$sexo
f <- eliminated$ecivil
promedios_grupales <-aggregate(a, by=list(b, c, d, e,f), FUN = mean , na.rm = TRUE)
promedios_grupales_sd <-aggregate(a, by=list(b, c, d, e,f), FUN = sd , na.rm = TRUE)
promedios_grupales_gini <-aggregate(a, by=list(b, c, d, e,f), FUN = gini , na.rm = TRUE)
promedios_grupales$sd = promedios_grupales_sd$sd.a
promedios_grupales$gini = promedios_grupales_gini$gini.a
d<-promedios_grupales
d$Año <- "2017"
# head(d,5)
names(d)[1] <- "Comuna"
names(d)[2] <- "Alfabetismo"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Estado civil"
names(d)[6] <- "Promedio del Ingreso"
names(d)[7] <- "Desviación standard"
names(d)[8] <- "Gini"
names(d)[9] <- "Año"
# head(d,3)
codigos_comunales <- readRDS(file = "codigos_comunales_2011-2017.rds")
names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"
# codigos_comunales
df_2017 = merge( x = d, y = codigos_comunales, by = "Comuna", all.x = TRUE)
df_2017 <-df_2017[!(df_2017$Promedio == 0),]
head(df_2017,5)
ab_2015 <- filtro_2015[!is.na(filtro_2015$yautcor),]
Q <- quantile(ab_2015$yautcor, probs=c(.25, .75), na.rm = FALSE)
iqr <- IQR(ab_2015$yautcor)
eliminated <- subset(ab_2015, ab_2015$yautcor > (Q[1] - 1.5*iqr) & ab_2015$yautcor < (Q[2]+1.5*iqr))
#eliminated
a <- eliminated$yautcor
b <- eliminated$comuna
c <- eliminated$e1 #alfabetismo
d <- eliminated$r3 #etnia
e <- eliminated$sexo
f <- eliminated$ecivil
promedios_grupales <-aggregate(a, by=list(b, c, d, e,f), FUN = mean , na.rm = TRUE)
promedios_grupales_sd <-aggregate(a, by=list(b, c, d, e,f), FUN = sd , na.rm = TRUE)
promedios_grupales_gini <-aggregate(a, by=list(b, c, d, e,f), FUN = gini , na.rm = TRUE)
promedios_grupales$sd = promedios_grupales_sd$sd.a
promedios_grupales$gini = promedios_grupales_gini$gini.a
d<-promedios_grupales
d$Año <- "2015"
# head(d,5)
names(d)[1] <- "Comuna"
names(d)[2] <- "Alfabetismo"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Estado civil"
names(d)[6] <- "Promedio del Ingreso"
names(d)[7] <- "Desviación standard"
names(d)[8] <- "Gini"
names(d)[9] <- "Año"
# head(d,3)
codigos_comunales <- readRDS(file = "codigos_comunales_2011-2017.rds")
names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"
# codigos_comunales
df_2015 = merge( x = d, y = codigos_comunales, by = "Comuna", all.x = TRUE)
df_2015 <-df_2015[!(df_2015$Promedio == 0),]
head(df_2015,5)
ab_2013 <- filtro_2013[!is.na(filtro_2013$yautcor),]
Q <- quantile(ab_2013$yautcor, probs=c(.25, .75), na.rm = FALSE)
iqr <- IQR(ab_2013$yautcor)
eliminated <- subset(ab_2013, ab_2013$yautcor > (Q[1] - 1.5*iqr) & ab_2013$yautcor < (Q[2]+1.5*iqr))
#eliminated
a <- eliminated$yautcor
b <- eliminated$comuna
c <- eliminated$e1 #alfabetismo
d <- eliminated$r6 #etnia
e <- eliminated$sexo
f <- eliminated$ecivil
promedios_grupales <-aggregate(a, by=list(b, c, d, e,f), FUN = mean , na.rm = TRUE)
promedios_grupales_sd <-aggregate(a, by=list(b, c, d, e,f), FUN = sd , na.rm = TRUE)
promedios_grupales_gini <-aggregate(a, by=list(b, c, d, e,f), FUN = gini , na.rm = TRUE)
promedios_grupales$sd = promedios_grupales_sd$sd.a
promedios_grupales$gini = promedios_grupales_gini$gini.a
d<-promedios_grupales
d$Año <- "2013"
# head(d,5)
names(d)[1] <- "Comuna"
names(d)[2] <- "Alfabetismo"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Estado civil"
names(d)[6] <- "Promedio del Ingreso"
names(d)[7] <- "Desviación standard"
names(d)[8] <- "Gini"
names(d)[9] <- "Año"
# head(d,3)
codigos_comunales <- readRDS(file = "codigos_comunales_2011-2017.rds")
names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"
# codigos_comunales
df_2013 = merge( x = d, y = codigos_comunales, by = "Comuna", all.x = TRUE)
df_2013 <-df_2013[!(df_2013$Promedio == 0),]
head(df_2013,5)
ab_2011 <- filtro_2011[!is.na(filtro_2011$ytotaj),]
Q <- quantile(ab_2011$ytotaj, probs=c(.25, .75), na.rm = FALSE)
iqr <- IQR(ab_2011$ytotaj)
eliminated <- subset(ab_2011, ab_2011$ytotaj > (Q[1] - 1.5*iqr) & ab_2011$ytotaj < (Q[2]+1.5*iqr))
#eliminated
a <- eliminated$ytotaj
b <- eliminated$comuna
c <- eliminated$e1 #alfabetismo
d <- eliminated$r6 #etnia
e <- eliminated$sexo
f <- eliminated$ecivil
promedios_grupales <-aggregate(a, by=list(b, c, d, e,f), FUN = mean , na.rm = TRUE)
promedios_grupales_sd <-aggregate(a, by=list(b, c, d, e,f), FUN = sd , na.rm = TRUE)
promedios_grupales_gini <-aggregate(a, by=list(b, c, d, e,f), FUN = gini , na.rm = TRUE)
promedios_grupales$sd = promedios_grupales_sd$sd.a
promedios_grupales$gini = promedios_grupales_gini$gini.a
d<-promedios_grupales
d$Año <- "2011"
# head(d,5)
names(d)[1] <- "Comuna"
names(d)[2] <- "Alfabetismo"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Estado civil"
names(d)[6] <- "Promedio del Ingreso"
names(d)[7] <- "Desviación standard"
names(d)[8] <- "Gini"
names(d)[9] <- "Año"
# head(d,3)
codigos_comunales <- readRDS(file = "codigos_comunales_2011-2017.rds")
names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"
# codigos_comunales
df_2011 = merge( x = d, y = codigos_comunales, by = "Comuna", all.x = TRUE)
df_2011 <-df_2011[!(df_2011$Promedio == 0),]
head(df_2011,5)
ab_2009 <- filtro_2009[!is.na(filtro_2009$YTOTAJ),]
Q <- quantile(ab_2009$YTOTAJ, probs=c(.25, .75), na.rm = FALSE)
iqr <- IQR(ab_2009$YTOTAJ)
eliminated <- subset(ab_2009, ab_2009$YTOTAJ > (Q[1] - 1.5*iqr) & ab_2009$YTOTAJ < (Q[2]+1.5*iqr))
#eliminated
a <- eliminated$YTOTAJ
b <- eliminated$COMUNA
c <- eliminated$E1 #alfabetismo
d <- eliminated$T5 #etnia
e <- eliminated$SEXO
f <- eliminated$ECIVIL
promedios_grupales <-aggregate(a, by=list(b, c, d, e,f), FUN = mean , na.rm = TRUE)
promedios_grupales_sd <-aggregate(a, by=list(b, c, d, e,f), FUN = sd , na.rm = TRUE)
promedios_grupales_gini <-aggregate(a, by=list(b, c, d, e,f), FUN = gini , na.rm = TRUE)
promedios_grupales$sd = promedios_grupales_sd$sd.a
promedios_grupales$gini = promedios_grupales_gini$gini.a
d<-promedios_grupales
d$Año <- "2009"
# head(d,5)
names(d)[1] <- "Comuna"
names(d)[2] <- "Alfabetismo"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Estado civil"
names(d)[6] <- "Promedio del Ingreso"
names(d)[7] <- "Desviación standard"
names(d)[8] <- "Gini"
names(d)[9] <- "Año"
# head(d,3)
codigos_comunales <- readRDS(file = "codigos_comunales_2009.rds")
names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"
# codigos_comunales
df_2009 = merge( x = d, y = codigos_comunales, by = "Comuna", all.x = TRUE)
df_2009 <-df_2009[!(df_2009$Promedio == 0),]
head(df_2009,5)
ab_2006 <- filtro_2006[!is.na(filtro_2006$YTOTAJ),]
Q <- quantile(ab_2006$YTOTAJ, probs=c(.25, .75), na.rm = FALSE)
iqr <- IQR(ab_2006$YTOTAJ)
eliminated <- subset(ab_2006, ab_2006$YTOTAJ > (Q[1] - 1.5*iqr) & ab_2006$YTOTAJ < (Q[2]+1.5*iqr))
#eliminated
a <- eliminated$YTOTAJ
b <- eliminated$COMUNA
c <- eliminated$E1 #alfabetismo
d <- eliminated$T4 #etnia
e <- eliminated$SEXO
f <- eliminated$ECIVIL
promedios_grupales <-aggregate(a, by=list(b, c, d, e,f), FUN = mean , na.rm = TRUE)
promedios_grupales_sd <-aggregate(a, by=list(b, c, d, e,f), FUN = sd , na.rm = TRUE)
promedios_grupales_gini <-aggregate(a, by=list(b, c, d, e,f), FUN = gini , na.rm = TRUE)
promedios_grupales$sd = promedios_grupales_sd$sd.a
promedios_grupales$gini = promedios_grupales_gini$gini.a
d<-promedios_grupales
d$Año <- "2006"
# head(d,5)
names(d)[1] <- "Comuna"
names(d)[2] <- "Alfabetismo"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Estado civil"
names(d)[6] <- "Promedio del Ingreso"
names(d)[7] <- "Desviación standard"
names(d)[8] <- "Gini"
names(d)[9] <- "Año"
# head(d,3)
codigos_comunales <- readRDS(file = "codigos_comunales_2006.rds")
names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"
# codigos_comunales
df_2006 = merge( x = d, y = codigos_comunales, by = "Comuna", all.x = TRUE)
df_2006 <-df_2006[!(df_2006$Promedio == 0),]
head(df_2006,5)
# union <- rbind(df_2006,df_2009,df_2011,df_2013,df_2015,df_2017)
# union
# filtro_union <- filter(union, union$Año == 2017)
# filtro_union
# saveRDS(union,"ttcc_jefe_de_hogar_yautcor.rds")
# write_xlsx(union,"ttcc_jefe_de_hogar_yautcor.xlsx")
ab_2017 <- filtro_2017[!is.na(filtro_2017$yautcor),]
Q <- quantile(ab_2017$yautcor, probs=c(.25, .75), na.rm = FALSE)
iqr <- IQR(ab_2017$yautcor)
eliminated <- subset(ab_2017, ab_2017$yautcor > (Q[1] - 1.5*iqr) & ab_2017$yautcor < (Q[2]+1.5*iqr))
#eliminated
a <- eliminated$yautcor
b <- eliminated$comuna
c <- eliminated$e1 #alfabetismo
d <- eliminated$r3 #etnia
e <- eliminated$sexo
f <- eliminated$ecivil
promedios_grupales <-aggregate(a, by=list(b, c, d, e,f), FUN = mean , na.rm = TRUE)
promedios_grupales_sd <-aggregate(a, by=list(b, c, d, e,f), FUN = sd , na.rm = TRUE)
promedios_grupales_gini <-aggregate(a, by=list(b, c, d, e,f), FUN = gini , na.rm = TRUE)
promedios_grupales$sd = promedios_grupales_sd$sd.a
promedios_grupales$gini = promedios_grupales_gini$gini.a
d<-promedios_grupales
d$Año <- "2017"
# head(d,5)
names(d)[1] <- "Comuna"
names(d)[2] <- "Alfabetismo"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Estado civil"
names(d)[6] <- "Promedio del Ingreso"
names(d)[7] <- "Desviación standard"
names(d)[8] <- "Gini"
names(d)[9] <- "Año"
# head(d,3)
codigos_comunales <- readRDS(file = "codigos_comunales_2011-2017.rds")
names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"
# codigos_comunales
df_2017 = merge( x = d, y = codigos_comunales, by = "Comuna", all.x = TRUE)
df_2017 <-df_2017[!(df_2017$Promedio == 0),]
head(df_2017,5)
ab_2015 <- filtro_2015[!is.na(filtro_2015$yautcor),]
Q <- quantile(ab_2015$yautcor, probs=c(.25, .75), na.rm = FALSE)
iqr <- IQR(ab_2015$yautcor)
eliminated <- subset(ab_2015, ab_2015$yautcor > (Q[1] - 1.5*iqr) & ab_2015$yautcor < (Q[2]+1.5*iqr))
#eliminated
a <- eliminated$yautcor
b <- eliminated$comuna
c <- eliminated$e1 #alfabetismo
d <- eliminated$r3 #etnia
e <- eliminated$sexo
f <- eliminated$ecivil
promedios_grupales <-aggregate(a, by=list(b, c, d, e,f), FUN = mean , na.rm = TRUE)
promedios_grupales_sd <-aggregate(a, by=list(b, c, d, e,f), FUN = sd , na.rm = TRUE)
promedios_grupales_gini <-aggregate(a, by=list(b, c, d, e,f), FUN = gini , na.rm = TRUE)
promedios_grupales$sd = promedios_grupales_sd$sd.a
promedios_grupales$gini = promedios_grupales_gini$gini.a
d<-promedios_grupales
d$Año <- "2015"
# head(d,5)
names(d)[1] <- "Comuna"
names(d)[2] <- "Alfabetismo"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Estado civil"
names(d)[6] <- "Promedio del Ingreso"
names(d)[7] <- "Desviación standard"
names(d)[8] <- "Gini"
names(d)[9] <- "Año"
# head(d,3)
codigos_comunales <- readRDS(file = "codigos_comunales_2011-2017.rds")
names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"
# codigos_comunales
df_2015 = merge( x = d, y = codigos_comunales, by = "Comuna", all.x = TRUE)
df_2015 <-df_2015[!(df_2015$Promedio == 0),]
head(df_2015,5)
ab_2013 <- filtro_2013[!is.na(filtro_2013$yautcor),]
Q <- quantile(ab_2013$yautcor, probs=c(.25, .75), na.rm = FALSE)
iqr <- IQR(ab_2013$yautcor)
eliminated <- subset(ab_2013, ab_2013$yautcor > (Q[1] - 1.5*iqr) & ab_2013$yautcor < (Q[2]+1.5*iqr))
#eliminated
a <- eliminated$yautcor
b <- eliminated$comuna
c <- eliminated$e1 #alfabetismo
d <- eliminated$r6 #etnia
e <- eliminated$sexo
f <- eliminated$ecivil
promedios_grupales <-aggregate(a, by=list(b, c, d, e,f), FUN = mean , na.rm = TRUE)
promedios_grupales_sd <-aggregate(a, by=list(b, c, d, e,f), FUN = sd , na.rm = TRUE)
promedios_grupales_gini <-aggregate(a, by=list(b, c, d, e,f), FUN = gini , na.rm = TRUE)
promedios_grupales$sd = promedios_grupales_sd$sd.a
promedios_grupales$gini = promedios_grupales_gini$gini.a
d<-promedios_grupales
d$Año <- "2013"
# head(d,5)
names(d)[1] <- "Comuna"
names(d)[2] <- "Alfabetismo"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Estado civil"
names(d)[6] <- "Promedio del Ingreso"
names(d)[7] <- "Desviación standard"
names(d)[8] <- "Gini"
names(d)[9] <- "Año"
# head(d,3)
codigos_comunales <- readRDS(file = "codigos_comunales_2011-2017.rds")
names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"
# codigos_comunales
df_2013 = merge( x = d, y = codigos_comunales, by = "Comuna", all.x = TRUE)
df_2013 <-df_2013[!(df_2013$Promedio == 0),]
head(df_2013,5)
ab_2011 <- filtro_2011[!is.na(filtro_2011$yautaj),]
Q <- quantile(ab_2011$yautaj, probs=c(.25, .75), na.rm = FALSE)
iqr <- IQR(ab_2011$yautaj)
eliminated <- subset(ab_2011, ab_2011$yautaj > (Q[1] - 1.5*iqr) & ab_2011$yautaj < (Q[2]+1.5*iqr))
#eliminated
a <- eliminated$yautaj
b <- eliminated$comuna
c <- eliminated$e1 #alfabetismo
d <- eliminated$r6 #etnia
e <- eliminated$sexo
f <- eliminated$ecivil
promedios_grupales <-aggregate(a, by=list(b, c, d, e,f), FUN = mean , na.rm = TRUE)
promedios_grupales_sd <-aggregate(a, by=list(b, c, d, e,f), FUN = sd , na.rm = TRUE)
promedios_grupales_gini <-aggregate(a, by=list(b, c, d, e,f), FUN = gini , na.rm = TRUE)
promedios_grupales$sd = promedios_grupales_sd$sd.a
promedios_grupales$gini = promedios_grupales_gini$gini.a
d<-promedios_grupales
d$Año <- "2011"
# head(d,5)
names(d)[1] <- "Comuna"
names(d)[2] <- "Alfabetismo"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Estado civil"
names(d)[6] <- "Promedio del Ingreso"
names(d)[7] <- "Desviación standard"
names(d)[8] <- "Gini"
names(d)[9] <- "Año"
# head(d,3)
codigos_comunales <- readRDS(file = "codigos_comunales_2011-2017.rds")
names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"
# codigos_comunales
df_2011 = merge( x = d, y = codigos_comunales, by = "Comuna", all.x = TRUE)
df_2011 <-df_2011[!(df_2011$Promedio == 0),]
head(df_2011,5)
ab_2009 <- filtro_2009[!is.na(filtro_2009$YAUTAJ),]
Q <- quantile(ab_2009$YAUTAJ, probs=c(.25, .75), na.rm = FALSE)
iqr <- IQR(ab_2009$YAUTAJ)
eliminated <- subset(ab_2009, ab_2009$YAUTAJ > (Q[1] - 1.5*iqr) & ab_2009$YAUTAJ < (Q[2]+1.5*iqr))
#eliminated
a <- eliminated$YAUTAJ
b <- eliminated$COMUNA
c <- eliminated$E1 #alfabetismo
d <- eliminated$T5 #etnia
e <- eliminated$SEXO
f <- eliminated$ECIVIL
promedios_grupales <-aggregate(a, by=list(b, c, d, e,f), FUN = mean , na.rm = TRUE)
promedios_grupales_sd <-aggregate(a, by=list(b, c, d, e,f), FUN = sd , na.rm = TRUE)
promedios_grupales_gini <-aggregate(a, by=list(b, c, d, e,f), FUN = gini , na.rm = TRUE)
promedios_grupales$sd = promedios_grupales_sd$sd.a
promedios_grupales$gini = promedios_grupales_gini$gini.a
d<-promedios_grupales
d$Año <- "2009"
# head(d,5)
names(d)[1] <- "Comuna"
names(d)[2] <- "Alfabetismo"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Estado civil"
names(d)[6] <- "Promedio del Ingreso"
names(d)[7] <- "Desviación standard"
names(d)[8] <- "Gini"
names(d)[9] <- "Año"
# head(d,3)
codigos_comunales <- readRDS(file = "codigos_comunales_2009.rds")
names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"
# codigos_comunales
df_2009 = merge( x = d, y = codigos_comunales, by = "Comuna", all.x = TRUE)
df_2009 <-df_2009[!(df_2009$Promedio == 0),]
head(df_2009,5)
ab_2006 <- filtro_2006[!is.na(filtro_2006$YAUTAJ),]
Q <- quantile(ab_2006$YAUTAJ, probs=c(.25, .75), na.rm = FALSE)
iqr <- IQR(ab_2006$YAUTAJ)
eliminated <- subset(ab_2006, ab_2006$YAUTAJ > (Q[1] - 1.5*iqr) & ab_2006$YAUTAJ < (Q[2]+1.5*iqr))
#eliminated
a <- eliminated$YAUTAJ
b <- eliminated$COMUNA
c <- eliminated$E1 #alfabetismo
d <- eliminated$T4 #etnia
e <- eliminated$SEXO
f <- eliminated$ECIVIL
promedios_grupales <-aggregate(a, by=list(b, c, d, e,f), FUN = mean , na.rm = TRUE)
promedios_grupales_sd <-aggregate(a, by=list(b, c, d, e,f), FUN = sd , na.rm = TRUE)
promedios_grupales_gini <-aggregate(a, by=list(b, c, d, e,f), FUN = gini , na.rm = TRUE)
promedios_grupales$sd = promedios_grupales_sd$sd.a
promedios_grupales$gini = promedios_grupales_gini$gini.a
d<-promedios_grupales
d$Año <- "2006"
# head(d,5)
names(d)[1] <- "Comuna"
names(d)[2] <- "Alfabetismo"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Estado civil"
names(d)[6] <- "Promedio del Ingreso"
names(d)[7] <- "Desviación standard"
names(d)[8] <- "Gini"
names(d)[9] <- "Año"
# head(d,3)
codigos_comunales <- readRDS(file = "codigos_comunales_2006.rds")
names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"
# codigos_comunales
df_2006 = merge( x = d, y = codigos_comunales, by = "Comuna", all.x = TRUE)
df_2006 <-df_2006[!(df_2006$Promedio == 0),]
head(df_2006,5)
# union <- rbind(df_2006,df_2009,df_2011,df_2013,df_2015,df_2017)
# union
# filtro_union <- filter(union, union$Año == 2006)
# filtro_union
# saveRDS(union,"ttcc_jefe_de_hogar_yautcor.rds")
# write_xlsx(union,"ttcc_jefe_de_hogar_yautcor.xlsx")
ab_2017 <- filtro_2017[!is.na(filtro_2017$yoprcor),]
Q <- quantile(ab_2017$yoprcor, probs=c(.25, .75), na.rm = FALSE)
iqr <- IQR(ab_2017$yoprcor)
eliminated <- subset(ab_2017, ab_2017$yoprcor > (Q[1] - 1.5*iqr) & ab_2017$yoprcor < (Q[2]+1.5*iqr))
#eliminated
a <- eliminated$yoprcor
b <- eliminated$comuna
c <- eliminated$e1 #alfabetismo
d <- eliminated$r3 #etnia
e <- eliminated$sexo
f <- eliminated$ecivil
promedios_grupales <-aggregate(a, by=list(b, c, d, e,f), FUN = mean , na.rm = TRUE)
promedios_grupales_sd <-aggregate(a, by=list(b, c, d, e,f), FUN = sd , na.rm = TRUE)
promedios_grupales_gini <-aggregate(a, by=list(b, c, d, e,f), FUN = gini , na.rm = TRUE)
promedios_grupales$sd = promedios_grupales_sd$sd.a
promedios_grupales$gini = promedios_grupales_gini$gini.a
d<-promedios_grupales
d$Año <- "2017"
# head(d,5)
names(d)[1] <- "Comuna"
names(d)[2] <- "Alfabetismo"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Estado civil"
names(d)[6] <- "Promedio del Ingreso"
names(d)[7] <- "Desviación standard"
names(d)[8] <- "Gini"
names(d)[9] <- "Año"
# head(d,3)
codigos_comunales <- readRDS(file = "codigos_comunales_2011-2017.rds")
names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"
# codigos_comunales
df_2017 = merge( x = d, y = codigos_comunales, by = "Comuna", all.x = TRUE)
df_2017 <-df_2017[!(df_2017$Promedio == 0),]
head(df_2017,5)
filtro_2015$yo
## NULL
ab_2015 <- filtro_2015[!is.na(filtro_2015$yoprCor),]
Q <- quantile(ab_2015$yoprCor, probs=c(.25, .75), na.rm = FALSE)
iqr <- IQR(ab_2015$yoprCor)
eliminated <- subset(ab_2015, ab_2015$yoprCor > (Q[1] - 1.5*iqr) & ab_2015$yoprCor < (Q[2]+1.5*iqr))
#eliminated
a <- eliminated$yoprCor
b <- eliminated$comuna
c <- eliminated$e1 #alfabetismo
d <- eliminated$r3 #etnia
e <- eliminated$sexo
f <- eliminated$ecivil
promedios_grupales <-aggregate(a, by=list(b, c, d, e,f), FUN = mean , na.rm = TRUE)
promedios_grupales_sd <-aggregate(a, by=list(b, c, d, e,f), FUN = sd , na.rm = TRUE)
promedios_grupales_gini <-aggregate(a, by=list(b, c, d, e,f), FUN = gini , na.rm = TRUE)
promedios_grupales$sd = promedios_grupales_sd$sd.a
promedios_grupales$gini = promedios_grupales_gini$gini.a
d<-promedios_grupales
d$Año <- "2015"
# head(d,5)
names(d)[1] <- "Comuna"
names(d)[2] <- "Alfabetismo"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Estado civil"
names(d)[6] <- "Promedio del Ingreso"
names(d)[7] <- "Desviación standard"
names(d)[8] <- "Gini"
names(d)[9] <- "Año"
# head(d,3)
codigos_comunales <- readRDS(file = "codigos_comunales_2011-2017.rds")
names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"
# codigos_comunales
df_2015 = merge( x = d, y = codigos_comunales, by = "Comuna", all.x = TRUE)
df_2015 <-df_2015[!(df_2015$Promedio == 0),]
head(df_2015,5)
ab_2013 <- filtro_2013[!is.na(filtro_2013$yoprCor),]
Q <- quantile(ab_2013$yoprCor, probs=c(.25, .75), na.rm = FALSE)
iqr <- IQR(ab_2013$yoprCor)
eliminated <- subset(ab_2013, ab_2013$yoprCor > (Q[1] - 1.5*iqr) & ab_2013$yoprCor < (Q[2]+1.5*iqr))
#eliminated
a <- eliminated$yoprCor
b <- eliminated$comuna
c <- eliminated$e1 #alfabetismo
d <- eliminated$r6 #etnia
e <- eliminated$sexo
f <- eliminated$ecivil
promedios_grupales <-aggregate(a, by=list(b, c, d, e,f), FUN = mean , na.rm = TRUE)
promedios_grupales_sd <-aggregate(a, by=list(b, c, d, e,f), FUN = sd , na.rm = TRUE)
promedios_grupales_gini <-aggregate(a, by=list(b, c, d, e,f), FUN = gini , na.rm = TRUE)
promedios_grupales$sd = promedios_grupales_sd$sd.a
promedios_grupales$gini = promedios_grupales_gini$gini.a
d<-promedios_grupales
d$Año <- "2013"
# head(d,5)
names(d)[1] <- "Comuna"
names(d)[2] <- "Alfabetismo"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Estado civil"
names(d)[6] <- "Promedio del Ingreso"
names(d)[7] <- "Desviación standard"
names(d)[8] <- "Gini"
names(d)[9] <- "Año"
# head(d,3)
codigos_comunales <- readRDS(file = "codigos_comunales_2011-2017.rds")
names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"
# codigos_comunales
df_2013 = merge( x = d, y = codigos_comunales, by = "Comuna", all.x = TRUE)
df_2013 <-df_2013[!(df_2013$Promedio == 0),]
head(df_2013,5)
ab_2011 <- filtro_2011[!is.na(filtro_2011$yopraj),]
Q <- quantile(ab_2011$yopraj, probs=c(.25, .75), na.rm = FALSE)
iqr <- IQR(ab_2011$yopraj)
eliminated <- subset(ab_2011, ab_2011$yopraj > (Q[1] - 1.5*iqr) & ab_2011$yopraj < (Q[2]+1.5*iqr))
#eliminated
a <- eliminated$yopraj
b <- eliminated$comuna
c <- eliminated$e1 #alfabetismo
d <- eliminated$r6 #etnia
e <- eliminated$sexo
f <- eliminated$ecivil
promedios_grupales <-aggregate(a, by=list(b, c, d, e,f), FUN = mean , na.rm = TRUE)
promedios_grupales_sd <-aggregate(a, by=list(b, c, d, e,f), FUN = sd , na.rm = TRUE)
promedios_grupales_gini <-aggregate(a, by=list(b, c, d, e,f), FUN = gini , na.rm = TRUE)
promedios_grupales$sd = promedios_grupales_sd$sd.a
promedios_grupales$gini = promedios_grupales_gini$gini.a
d<-promedios_grupales
d$Año <- "2011"
# head(d,5)
names(d)[1] <- "Comuna"
names(d)[2] <- "Alfabetismo"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Estado civil"
names(d)[6] <- "Promedio del Ingreso"
names(d)[7] <- "Desviación standard"
names(d)[8] <- "Gini"
names(d)[9] <- "Año"
# head(d,3)
codigos_comunales <- readRDS(file = "codigos_comunales_2011-2017.rds")
names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"
# codigos_comunales
df_2011 = merge( x = d, y = codigos_comunales, by = "Comuna", all.x = TRUE)
df_2011 <-df_2011[!(df_2011$Promedio == 0),]
head(df_2011,5)
ab_2009 <- filtro_2009[!is.na(filtro_2009$YOPRAJ),]
Q <- quantile(ab_2009$YOPRAJ, probs=c(.25, .75), na.rm = FALSE)
iqr <- IQR(ab_2009$YOPRAJ)
eliminated <- subset(ab_2009, ab_2009$YOPRAJ > (Q[1] - 1.5*iqr) & ab_2009$YOPRAJ < (Q[2]+1.5*iqr))
#eliminated
a <- eliminated$YOPRAJ
b <- eliminated$COMUNA
c <- eliminated$E1 #alfabetismo
d <- eliminated$T5 #etnia
e <- eliminated$SEXO
f <- eliminated$ECIVIL
promedios_grupales <-aggregate(a, by=list(b, c, d, e,f), FUN = mean , na.rm = TRUE)
promedios_grupales_sd <-aggregate(a, by=list(b, c, d, e,f), FUN = sd , na.rm = TRUE)
promedios_grupales_gini <-aggregate(a, by=list(b, c, d, e,f), FUN = gini , na.rm = TRUE)
promedios_grupales$sd = promedios_grupales_sd$sd.a
promedios_grupales$gini = promedios_grupales_gini$gini.a
d<-promedios_grupales
d$Año <- "2009"
# head(d,5)
names(d)[1] <- "Comuna"
names(d)[2] <- "Alfabetismo"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Estado civil"
names(d)[6] <- "Promedio del Ingreso"
names(d)[7] <- "Desviación standard"
names(d)[8] <- "Gini"
names(d)[9] <- "Año"
# head(d,3)
codigos_comunales <- readRDS(file = "codigos_comunales_2009.rds")
names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"
# codigos_comunales
df_2009 = merge( x = d, y = codigos_comunales, by = "Comuna", all.x = TRUE)
df_2009 <-df_2009[!(df_2009$Promedio == 0),]
head(df_2009,5)
ab_2006 <- filtro_2006[!is.na(filtro_2006$YOPRAJ),]
Q <- quantile(ab_2006$YOPRAJ, probs=c(.25, .75), na.rm = FALSE)
iqr <- IQR(ab_2006$YOPRAJ)
eliminated <- subset(ab_2006, ab_2006$YOPRAJ > (Q[1] - 1.5*iqr) & ab_2006$YOPRAJ < (Q[2]+1.5*iqr))
#eliminated
a <- eliminated$YOPRAJ
b <- eliminated$COMUNA
c <- eliminated$E1 #alfabetismo
d <- eliminated$T4 #etnia
e <- eliminated$SEXO
f <- eliminated$ECIVIL
promedios_grupales <-aggregate(a, by=list(b, c, d, e,f), FUN = mean , na.rm = TRUE)
promedios_grupales_sd <-aggregate(a, by=list(b, c, d, e,f), FUN = sd , na.rm = TRUE)
promedios_grupales_gini <-aggregate(a, by=list(b, c, d, e,f), FUN = gini , na.rm = TRUE)
promedios_grupales$sd = promedios_grupales_sd$sd.a
promedios_grupales$gini = promedios_grupales_gini$gini.a
d<-promedios_grupales
d$Año <- "2006"
# head(d,5)
names(d)[1] <- "Comuna"
names(d)[2] <- "Alfabetismo"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Estado civil"
names(d)[6] <- "Promedio del Ingreso"
names(d)[7] <- "Desviación standard"
names(d)[8] <- "Gini"
names(d)[9] <- "Año"
# head(d,3)
codigos_comunales <- readRDS(file = "codigos_comunales_2006.rds")
names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"
# codigos_comunales
df_2006 = merge( x = d, y = codigos_comunales, by = "Comuna", all.x = TRUE)
df_2006 <-df_2006[!(df_2006$Promedio == 0),]
head(df_2006,5)
# union <- rbind(df_2006,df_2009,df_2011,df_2013,df_2015,df_2017)
# union
# filtro_union <- filter(union, union$Año == 2006)
# filtro_union
# saveRDS(union,"ttcc_jefe_de_hogar_yopraj.rds")
# write_xlsx(union,"ttcc_jefe_de_hogar_yopraj.xlsx")
ab_2017 <- filtro_2017[!is.na(filtro_2017$ytrabajocor),]
Q <- quantile(ab_2017$ytrabajocor, probs=c(.25, .75), na.rm = FALSE)
iqr <- IQR(ab_2017$ytrabajocor)
eliminated <- subset(ab_2017, ab_2017$ytrabajocor > (Q[1] - 1.5*iqr) & ab_2017$ytrabajocor < (Q[2]+1.5*iqr))
#eliminated
a <- eliminated$ytrabajocor
b <- eliminated$comuna
c <- eliminated$e1 #alfabetismo
d <- eliminated$r3 #etnia
e <- eliminated$sexo
f <- eliminated$ecivil
promedios_grupales <-aggregate(a, by=list(b, c, d, e,f), FUN = mean , na.rm = TRUE)
promedios_grupales_sd <-aggregate(a, by=list(b, c, d, e,f), FUN = sd , na.rm = TRUE)
promedios_grupales_gini <-aggregate(a, by=list(b, c, d, e,f), FUN = gini , na.rm = TRUE)
promedios_grupales$sd = promedios_grupales_sd$sd.a
promedios_grupales$gini = promedios_grupales_gini$gini.a
d<-promedios_grupales
d$Año <- "2017"
# head(d,5)
names(d)[1] <- "Comuna"
names(d)[2] <- "Alfabetismo"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Estado civil"
names(d)[6] <- "Promedio del Ingreso"
names(d)[7] <- "Desviación standard"
names(d)[8] <- "Gini"
names(d)[9] <- "Año"
# head(d,3)
codigos_comunales <- readRDS(file = "codigos_comunales_2011-2017.rds")
names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"
# codigos_comunales
df_2017 = merge( x = d, y = codigos_comunales, by = "Comuna", all.x = TRUE)
df_2017 <-df_2017[!(df_2017$Promedio == 0),]
head(df_2017,5)
ab_2015 <- filtro_2015[!is.na(filtro_2015$ytrabajoCor),]
Q <- quantile(ab_2015$ytrabajoCor, probs=c(.25, .75), na.rm = FALSE)
iqr <- IQR(ab_2015$ytrabajoCor)
eliminated <- subset(ab_2015, ab_2015$ytrabajoCor > (Q[1] - 1.5*iqr) & ab_2015$ytrabajoCor < (Q[2]+1.5*iqr))
#eliminated
a <- eliminated$ytrabajoCor
b <- eliminated$comuna
c <- eliminated$e1 #alfabetismo
d <- eliminated$r3 #etnia
e <- eliminated$sexo
f <- eliminated$ecivil
promedios_grupales <-aggregate(a, by=list(b, c, d, e,f), FUN = mean , na.rm = TRUE)
promedios_grupales_sd <-aggregate(a, by=list(b, c, d, e,f), FUN = sd , na.rm = TRUE)
promedios_grupales_gini <-aggregate(a, by=list(b, c, d, e,f), FUN = gini , na.rm = TRUE)
promedios_grupales$sd = promedios_grupales_sd$sd.a
promedios_grupales$gini = promedios_grupales_gini$gini.a
d<-promedios_grupales
d$Año <- "2015"
# head(d,5)
names(d)[1] <- "Comuna"
names(d)[2] <- "Alfabetismo"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Estado civil"
names(d)[6] <- "Promedio del Ingreso"
names(d)[7] <- "Desviación standard"
names(d)[8] <- "Gini"
names(d)[9] <- "Año"
# head(d,3)
codigos_comunales <- readRDS(file = "codigos_comunales_2011-2017.rds")
names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"
# codigos_comunales
df_2015 = merge( x = d, y = codigos_comunales, by = "Comuna", all.x = TRUE)
df_2015 <-df_2015[!(df_2015$Promedio == 0),]
head(df_2015,5)
ab_2013 <- filtro_2013[!is.na(filtro_2013$ytrabajoCor),]
Q <- quantile(ab_2013$ytrabajoCor, probs=c(.25, .75), na.rm = FALSE)
iqr <- IQR(ab_2013$ytrabajoCor)
eliminated <- subset(ab_2013, ab_2013$ytrabajoCor > (Q[1] - 1.5*iqr) & ab_2013$ytrabajoCor < (Q[2]+1.5*iqr))
#eliminated
a <- eliminated$ytrabajoCor
b <- eliminated$comuna
c <- eliminated$e1 #alfabetismo
d <- eliminated$r6 #etnia
e <- eliminated$sexo
f <- eliminated$ecivil
promedios_grupales <-aggregate(a, by=list(b, c, d, e,f), FUN = mean , na.rm = TRUE)
promedios_grupales_sd <-aggregate(a, by=list(b, c, d, e,f), FUN = sd , na.rm = TRUE)
promedios_grupales_gini <-aggregate(a, by=list(b, c, d, e,f), FUN = gini , na.rm = TRUE)
promedios_grupales$sd = promedios_grupales_sd$sd.a
promedios_grupales$gini = promedios_grupales_gini$gini.a
d<-promedios_grupales
d$Año <- "2013"
# head(d,5)
names(d)[1] <- "Comuna"
names(d)[2] <- "Alfabetismo"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Estado civil"
names(d)[6] <- "Promedio del Ingreso"
names(d)[7] <- "Desviación standard"
names(d)[8] <- "Gini"
names(d)[9] <- "Año"
# head(d,3)
codigos_comunales <- readRDS(file = "codigos_comunales_2011-2017.rds")
names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"
# codigos_comunales
df_2013 = merge( x = d, y = codigos_comunales, by = "Comuna", all.x = TRUE)
df_2013 <-df_2013[!(df_2013$Promedio == 0),]
head(df_2013,5)
ab_2011 <- filtro_2011[!is.na(filtro_2011$ytrabaj),]
Q <- quantile(ab_2011$ytrabaj, probs=c(.25, .75), na.rm = FALSE)
iqr <- IQR(ab_2011$ytrabaj)
eliminated <- subset(ab_2011, ab_2011$ytrabaj > (Q[1] - 1.5*iqr) & ab_2011$ytrabaj < (Q[2]+1.5*iqr))
#eliminated
a <- eliminated$ytrabaj
b <- eliminated$comuna
c <- eliminated$e1 #alfabetismo
d <- eliminated$r6 #etnia
e <- eliminated$sexo
f <- eliminated$ecivil
promedios_grupales <-aggregate(a, by=list(b, c, d, e,f), FUN = mean , na.rm = TRUE)
promedios_grupales_sd <-aggregate(a, by=list(b, c, d, e,f), FUN = sd , na.rm = TRUE)
promedios_grupales_gini <-aggregate(a, by=list(b, c, d, e,f), FUN = gini , na.rm = TRUE)
promedios_grupales$sd = promedios_grupales_sd$sd.a
promedios_grupales$gini = promedios_grupales_gini$gini.a
d<-promedios_grupales
d$Año <- "2011"
# head(d,5)
names(d)[1] <- "Comuna"
names(d)[2] <- "Alfabetismo"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Estado civil"
names(d)[6] <- "Promedio del Ingreso"
names(d)[7] <- "Desviación standard"
names(d)[8] <- "Gini"
names(d)[9] <- "Año"
# head(d,3)
codigos_comunales <- readRDS(file = "codigos_comunales_2011-2017.rds")
names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"
# codigos_comunales
df_2011 = merge( x = d, y = codigos_comunales, by = "Comuna", all.x = TRUE)
df_2011 <-df_2011[!(df_2011$Promedio == 0),]
head(df_2011,5)
ab_2009 <- filtro_2009[!is.na(filtro_2009$YTRABAJ),]
Q <- quantile(ab_2009$YTRABAJ, probs=c(.25, .75), na.rm = FALSE)
iqr <- IQR(ab_2009$YTRABAJ)
eliminated <- subset(ab_2009, ab_2009$YTRABAJ > (Q[1] - 1.5*iqr) & ab_2009$YTRABAJ < (Q[2]+1.5*iqr))
#eliminated
a <- eliminated$YTRABAJ
b <- eliminated$COMUNA
c <- eliminated$E1 #alfabetismo
d <- eliminated$T5 #etnia
e <- eliminated$SEXO
f <- eliminated$ECIVIL
promedios_grupales <-aggregate(a, by=list(b, c, d, e,f), FUN = mean , na.rm = TRUE)
promedios_grupales_sd <-aggregate(a, by=list(b, c, d, e,f), FUN = sd , na.rm = TRUE)
promedios_grupales_gini <-aggregate(a, by=list(b, c, d, e,f), FUN = gini , na.rm = TRUE)
promedios_grupales$sd = promedios_grupales_sd$sd.a
promedios_grupales$gini = promedios_grupales_gini$gini.a
d<-promedios_grupales
d$Año <- "2009"
# head(d,5)
names(d)[1] <- "Comuna"
names(d)[2] <- "Alfabetismo"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Estado civil"
names(d)[6] <- "Promedio del Ingreso"
names(d)[7] <- "Desviación standard"
names(d)[8] <- "Gini"
names(d)[9] <- "Año"
# head(d,3)
codigos_comunales <- readRDS(file = "codigos_comunales_2009.rds")
names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"
# codigos_comunales
df_2009 = merge( x = d, y = codigos_comunales, by = "Comuna", all.x = TRUE)
df_2009 <-df_2009[!(df_2009$Promedio == 0),]
head(df_2009,5)
ab_2006 <- filtro_2006[!is.na(filtro_2006$YTRABAJ),]
Q <- quantile(ab_2006$YTRABAJ, probs=c(.25, .75), na.rm = FALSE)
iqr <- IQR(ab_2006$YTRABAJ)
eliminated <- subset(ab_2006, ab_2006$YTRABAJ > (Q[1] - 1.5*iqr) & ab_2006$YTRABAJ < (Q[2]+1.5*iqr))
#eliminated
a <- eliminated$YTRABAJ
b <- eliminated$COMUNA
c <- eliminated$E1 #alfabetismo
d <- eliminated$T4 #etnia
e <- eliminated$SEXO
f <- eliminated$ECIVIL
promedios_grupales <-aggregate(a, by=list(b, c, d, e,f), FUN = mean , na.rm = TRUE)
promedios_grupales_sd <-aggregate(a, by=list(b, c, d, e,f), FUN = sd , na.rm = TRUE)
promedios_grupales_gini <-aggregate(a, by=list(b, c, d, e,f), FUN = gini , na.rm = TRUE)
promedios_grupales$sd = promedios_grupales_sd$sd.a
promedios_grupales$gini = promedios_grupales_gini$gini.a
d<-promedios_grupales
d$Año <- "2006"
# head(d,5)
names(d)[1] <- "Comuna"
names(d)[2] <- "Alfabetismo"
names(d)[3] <- "Etnia"
names(d)[4] <- "Sexo"
names(d)[5] <- "Estado civil"
names(d)[6] <- "Promedio del Ingreso"
names(d)[7] <- "Desviación standard"
names(d)[8] <- "Gini"
names(d)[9] <- "Año"
# head(d,3)
codigos_comunales <- readRDS(file = "codigos_comunales_2006.rds")
names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"
# codigos_comunales
df_2006 = merge( x = d, y = codigos_comunales, by = "Comuna", all.x = TRUE)
df_2006 <-df_2006[!(df_2006$Promedio == 0),]
head(df_2006,5)
# union <- rbind(df_2006,df_2009,df_2011,df_2013,df_2015,df_2017)
# union
# filtro_union <- filter(union, union$Año == 2006)
# filtro_union
# saveRDS(union,"ttcc_jefe_de_hogar_ytrabaj.rds")
# write_xlsx(union,"ttcc_jefe_de_hogar_ytrabaj.xlsx")