Variables ingreso en la Casen
Revisión de tablas de contingencia generadas sobre 4 categorías de ingreso
Abstract
Ya tenemos las tablas de contingencia para las 4 variables que hemos seleccionado como las más relevantes en un artículo previo. Ahora, revisamos y corregimos el diseño de las categorías de respuesta para las preguntas referidas a Etnia y Alfabetismo. Analizamos un error que en definitiva no es tal.
En este artículo haremos una revisión completa a las tablas de contingencia generadas. En específico, sobre las categorías de respuesta a las preguntas sobre pertenencia a grupo indígena y a alfabetismo. Lo más relevante es que si bien, verificamos que nuestra descomposición de los ingresos realizada en un trabajo anterior es correcta, en las tablas de contingencia no se presenta la misma relación. Podemos afirmar que esto se produce por la naturaleza propia del agrupamiento en torno a promedios. Se presentan en el punto 7 las direcciones donde se pueden encontrar las tablas generadas y analizadas.
No es fácil comparar las preguntas o categorías de la Casen directamente a lo largo de los años. Muchas veces las preguntas son parecidas pero no iguales y lo mismo sucede con las categorías de respuesta. Es éste el caso para etnia y alfabetismo en las tablas de contingencia que generamos para los promedios de las variables de ingreso. A continuación exponemos la lógica de corrección para la pertenecia grupo étnico.
Haremos el análisis completo para YTOTAJ y sólo mostraremos el código para las demás.
var_YTOTAJ <- readRDS("variables_ingreso/YTOTAJ2.rds")
head(var_YTOTAJ,5)
## Comuna Alfabetismo Etnia Sexo
## 1 Aisén Sí Kawaskar Hombre
## 2 Aisén Sí Mapuche Hombre
## 3 Aisén Sí No pertenece a ningún pueblo indígena Mujer
## 4 Aisén No No pertenece a ningún pueblo indígena Mujer
## 5 Aisén Sí No pertenece a ningún pueblo indígena Hombre
## Promedio del Ingreso Desviación standard Gini Año Código
## 1 47386.0 NA 0.0000000 2006 11201
## 2 206218.9 103383.51 0.2792730 2006 11201
## 3 141209.0 101011.54 0.4004693 2006 11201
## 4 64652.2 41793.76 0.2441928 2006 11201
## 5 221528.5 120760.74 0.3104046 2006 11201
Despleguemos los porcentajes de las categorías asociadas a las etnias. Tengamos presente que éstas no son frecuencias de individuos, sino que de categorías. Podríamos hacer un cálculo en el que estrajésemos información de las frecuencias de los individuos en las categorías. Para ello tendríamos que aplicar los factores de expansión y un análisis mas profundo.
alfa_gene <- function(n){
x<-switch(n,"2006","2009","2011","2013","2015","2017")
for(i in x){
var <- filter(var_YTOTAJ, var_YTOTAJ$Año == x)
a <- nrow(var)
my_summary_data <- var %>%
group_by(Etnia) %>%
summarise(Porcentaje = n()*100/a)
print(my_summary_data)
return(my_summary_data)
}
}
Obtengamos las categorías y sus frecuencias para las Casen de 2006 al 2017
for (n in 1:6){
alfa_gene(n)
}
## `summarise()` ungrouping output (override with `.groups` argument)
## # A tibble: 11 x 2
## Etnia Porcentaje
## <fct> <dbl>
## 1 Aymara 4.53
## 2 Rapa Nui 0.430
## 3 Quechua 1.56
## 4 Mapuche 33.1
## 5 Atacameño 2.23
## 6 Coya 0.586
## 7 Kawaskar 0.781
## 8 Yagan 0.390
## 9 Diaguita 1.25
## 10 No pertenece a ningún pueblo indígena 52.2
## 11 Sin dato 2.97
## `summarise()` ungrouping output (override with `.groups` argument)
## # A tibble: 10 x 2
## Etnia Porcentaje
## <fct> <dbl>
## 1 Aymara 5.66
## 2 Rapa Nui 1.01
## 3 Quechua 1.99
## 4 Mapuche 32.8
## 5 Atacameño 2.30
## 6 Coya 0.858
## 7 Diaguita 2.77
## 8 No pertenece a ningún pueblo indígena 51.2
## 9 Kawésqar 0.624
## 10 Yagán 0.702
## `summarise()` ungrouping output (override with `.groups` argument)
## # A tibble: 10 x 2
## Etnia Porcentaje
## <fct> <dbl>
## 1 Aymara 4.51
## 2 Quechua 2.14
## 3 Mapuche 27.6
## 4 Coya 1.35
## 5 Diaguita 2.74
## 6 No pertenece a ningún pueblo indígena 57.8
## 7 Rapa Nui (Pascuense) 1.08
## 8 Atacameño (Likán Antai) 1.53
## 9 Kawésqar (Alacalufes) 0.782
## 10 Yagán (Yámana) 0.421
## `summarise()` ungrouping output (override with `.groups` argument)
## # A tibble: 11 x 2
## Etnia Porcentaje
## <fct> <dbl>
## 1 Aymara 4.47
## 2 Quechua 1.56
## 3 Mapuche 26.6
## 4 Coya 0.971
## 5 Diaguita 2.74
## 6 No pertenece a ningún pueblo indígena 56.9
## 7 Rapa Nui (Pascuense) 0.383
## 8 Atacameño (Likán Antai) 1.27
## 9 Kawésqar (Alacalufes) 0.913
## 10 Yagán (Yámana) 0.206
## 11 NS/NR 4.03
## `summarise()` ungrouping output (override with `.groups` argument)
## # A tibble: 11 x 2
## Etnia Porcentaje
## <fct> <dbl>
## 1 Quechua 2.29
## 2 Mapuche 27.9
## 3 Diaguita 3.71
## 4 No pertenece a ningún pueblo indígena 55.8
## 5 Sin dato 0.446
## 6 Aimara 5.58
## 7 Rapa-Nui o Pascuenses 0.535
## 8 Atacameño (Likán-Antai) 1.40
## 9 Collas 1.25
## 10 Kawashkar o Alacalufes 1.01
## 11 Yámana o Yagán 0.0891
## `summarise()` ungrouping output (override with `.groups` argument)
## # A tibble: 11 x 2
## Etnia Porcentaje
## <fct> <dbl>
## 1 Quechua 1.40
## 2 Mapuche 26.4
## 3 Diaguita 3.97
## 4 No pertenece a ningún pueblo indígena 57.8
## 5 Aimara 4.42
## 6 Rapa-Nui o Pascuenses 0.448
## 7 Collas 1.28
## 8 Kawashkar o Alacalufes 0.956
## 9 Yámana o Yagán 0.149
## 10 Atacameño (Likan-Antai) 1.25
## 11 No sabe/no responde 1.88
En la Casen del 2006 figuran 9 comunidades étnicas más la categoría “No pertenece a ningún pueblo indígena”, lo mismo en el 2009 y en el 2011. En el 2013 aparece la categoría “NS/NR”. En la Casen del 2015 en vez de “NS/NR” aparece la categoría “Sin dato”. En la del 2017 vuelve a aparecer “NS/NR”.
Utilizaremos el siguiente criterio: Todas las categorías que no indiquen identificación étnica serán asociadas a la categoría “No pertenece a ningún pueblo indígena”
Homogeneizaremos el texto escrito que identifica a las comunidades étnicas pues en diferentes años algunas están escritas de diferentes maneras.
Aplicaremos entonces un “unique” a la tabla de contingencia.
categorias_etnia <- unique(var_YTOTAJ$Etnia)
categorias_etnia <- as.data.frame(categorias_etnia)
categorias_etnia
## categorias_etnia
## 1 Kawaskar
## 2 Mapuche
## 3 No pertenece a ningún pueblo indígena
## 4 Atacameño
## 5 Diaguita
## 6 Aymara
## 7 Sin dato
## 8 Quechua
## 9 Yagan
## 10 Coya
## 11 Rapa Nui
## 12 Kawésqar
## 13 Yagán
## 14 Rapa Nui (Pascuense)
## 15 Atacameño (Likán Antai)
## 16 Yagán (Yámana)
## 17 Kawésqar (Alacalufes)
## 18 NS/NR
## 19 Aimara
## 20 Collas
## 21 Atacameño (Likán-Antai)
## 22 Kawashkar o Alacalufes
## 23 Rapa-Nui o Pascuenses
## 24 Yámana o Yagán
## 25 No sabe/no responde
## 26 Atacameño (Likan-Antai)
# write_xlsx(categorias_etnia,"categorias_etnia.xlsx")
La tabla diccionario queda entonces como sigue:
categorias <- read_xlsx("categorias_etnia.xlsx")
categoriasbuenas = merge( x = var_YTOTAJ, y = categorias, by = "Etnia", all.x = TRUE)
ytotaj_et_corr <- categoriasbuenas[,c(-1)]
head(ytotaj_et_corr,5)
## Comuna Alfabetismo Sexo Promedio del Ingreso Desviación standard
## 1 Curicó Sí, lee y escribe Mujer 163000 NA
## 2 Pica No, sólo lee Hombre 94355 NA
## 3 Putre No, sólo lee Mujer 150898 109835.1
## 4 Lo Prado No, ninguno Hombre 70000 NA
## 5 Chañaral Sí, lee y escribe Mujer 100000 NA
## Gini Año Código categorias_etnicas
## 1 0.0000000 2015 07301 Aymara
## 2 0.0000000 2015 01405 Aymara
## 3 0.3634627 2015 15201 Aymara
## 4 0.0000000 2015 13117 Aymara
## 5 0.0000000 2017 03201 Aymara
Haremos pruebas sobre 10 registros aleatorios de nuestra tabla de contingencia original:
x10 <- sample(1:18563,10)
x10
## [1] 7150 11269 9022 6107 11489 13504 16581 6439 10878 16815
var_YTOTAJ_etnia <- var_YTOTAJ[x10,]
var_YTOTAJ_etnia
## Comuna Alfabetismo Etnia
## 7150 Pemuco No, sólo escribe No pertenece a ningún pueblo indígena
## 11269 San Fernando No, sólo lee No pertenece a ningún pueblo indígena
## 9022 Cochrane No, ninguno No pertenece a ningún pueblo indígena
## 6107 Freire No, ninguno No pertenece a ningún pueblo indígena
## 11489 Talagante Sí, lee y escribe Mapuche
## 13504 Maullín No, ninguno No pertenece a ningún pueblo indígena
## 16581 Linares Sí, lee y escribe No pertenece a ningún pueblo indígena
## 6439 Lampa No, sólo lee No pertenece a ningún pueblo indígena
## 10878 Putre No, ninguno Aymara
## 16815 Maipú No, ninguno No pertenece a ningún pueblo indígena
## Sexo Promedio del Ingreso Desviación standard Gini Año Código
## 7150 Hombre 21980.00 NA 0.00000000 2011 16105
## 11269 Hombre 240864.83 161554.257 0.34060954 2013 06301
## 9022 Hombre 92391.33 9438.397 0.04449672 2013 11301
## 6107 Mujer 93633.40 43059.144 0.20891007 2011 09105
## 11489 Hombre 234444.44 79860.990 0.16956293 2013 13601
## 13504 Mujer 144470.60 75762.310 0.23716438 2015 10108
## 16581 Mujer 243852.78 187930.571 0.41878136 2017 07401
## 6439 Hombre 151435.67 64353.975 0.17839479 2011 13302
## 10878 Mujer 119413.45 48592.693 0.20768913 2013 15201
## 16815 Hombre 211534.00 156503.552 0.36570821 2017 13119
Ahora identifiquemos este registro en nuestra tabla de contingencia tratada:
categoriasbuenas_etnia <- filter(categoriasbuenas, round(categoriasbuenas$`Promedio del Ingreso`) == 75000)
categoriasbuenas_etnia2 <- filter(categoriasbuenas_etnia, categoriasbuenas_etnia$Comuna=="Osorno" )
categoriasbuenas_etnia2
## Etnia Comuna Alfabetismo Sexo Promedio del Ingreso
## 1 Kawashkar o Alacalufes Osorno Sí, lee y escribe Hombre 75000
## Desviación standard Gini Año Código categorias_etnicas
## 1 NA 0 2017 10301 Alacalufes
# saveRDS(categoriasbuenas,"variables_ingreso/YTOTAJ_etnias.rds")
La asignación se produjo correctamente.
var_YAUTAJ <- readRDS("variables_ingreso/YAUTAJ.rds")
categoriasbuenas = merge( x = var_YAUTAJ, y = categorias, by = "Etnia", all.x = TRUE)
yautaj_et_corr <- categoriasbuenas[,c(-1)]
head(yautaj_et_corr,5)
## Comuna Alfabetismo Sexo Promedio del Ingreso
## 1 Sierra Gorda Sí, lee y escribe Hombre 251875
## 2 Chañaral Sí, lee y escribe Mujer 100000
## 3 Camiña No, ninguno Mujer 107500
## 4 Huasco Sí, lee y escribe Hombre 255000
## 5 Iquique Sí, lee y escribe Mujer 347038
## Desviación standard Gini Año Código categorias_etnicas
## 1 73362.33 0.1029777 2015 02103 Aymara
## 2 NA 0.0000000 2017 03201 Aymara
## 3 NA 0.0000000 2017 01402 Aymara
## 4 106066.02 0.1470588 2015 03304 Aymara
## 5 213295.75 0.3350889 2017 01101 Aymara
var_YOPRAJ <- readRDS("variables_ingreso/YOPRAJ.rds")
categoriasbuenas = merge( x = var_YOPRAJ, y = categorias, by = "Etnia", all.x = TRUE)
yopraj_et_corr <- categoriasbuenas[,c(-1)]
head(yopraj_et_corr,5)
## Comuna Alfabetismo Sexo Promedio del Ingreso Desviación standard
## 1 Temuco Sí, lee y escribe Mujer 350000.0 NA
## 2 Castro Sí, lee y escribe Hombre 250000.0 NA
## 3 Putre Sí, lee y escribe Hombre 319215.7 167910
## 4 Camarones No, sólo lee Mujer 100000.0 NA
## 5 Coquimbo Sí, lee y escribe Hombre 420000.0 NA
## Gini Año Código categorias_etnicas
## 1 0.0000000 2015 09101 Aymara
## 2 0.0000000 2015 10201 Aymara
## 3 0.2722787 2017 15201 Aymara
## 4 0.0000000 2017 15102 Aymara
## 5 0.0000000 2017 04102 Aymara
var_YTRABAJ <- readRDS("variables_ingreso/YTRABAJ.rds")
categoriasbuenas = merge( x = var_YTRABAJ, y = categorias, by = "Etnia", all.x = TRUE)
ytrabaj_et_corr <- categoriasbuenas[,c(-1)]
head(ytrabaj_et_corr,5)
## Comuna Alfabetismo Sexo Promedio del Ingreso Desviación standard
## 1 Copiapó Sí, lee y escribe Hombre 448928.6 234127.9
## 2 Huara Sí, lee y escribe Mujer 195833.3 226798.6
## 3 Paredones Sí, lee y escribe Hombre 270000.0 NA
## 4 Los Lagos Sí, lee y escribe Hombre 552917.0 NA
## 5 Caldera Sí, lee y escribe Mujer 535000.0 NA
## Gini Año Código categorias_etnicas
## 1 0.2686668 2017 03101 Aymara
## 2 0.5228131 2015 01404 Aymara
## 3 0.0000000 2017 06206 Aymara
## 4 0.0000000 2017 14104 Aymara
## 5 0.0000000 2015 03102 Aymara
A la respuesta de la pregunta ¿Sabe leer?, la Casen del 2006 entrega 3 categorías de respuesta. Éstas categorías no son constantes pues se le agregan otras o son modificadas en las Casen posteriores. En nuestra tabla de contingencia relacionada al ingreso YTOTAJ, éstas categorías se distribuyen en los siguientes porcentajes:
Primero veamos el contenido de la ttcc en cuestión.
head(ytotaj_et_corr,5)
## Comuna Alfabetismo Sexo Promedio del Ingreso Desviación standard
## 1 Curicó Sí, lee y escribe Mujer 163000 NA
## 2 Pica No, sólo lee Hombre 94355 NA
## 3 Putre No, sólo lee Mujer 150898 109835.1
## 4 Lo Prado No, ninguno Hombre 70000 NA
## 5 Chañaral Sí, lee y escribe Mujer 100000 NA
## Gini Año Código categorias_etnicas
## 1 0.0000000 2015 07301 Aymara
## 2 0.0000000 2015 01405 Aymara
## 3 0.3634627 2015 15201 Aymara
## 4 0.0000000 2015 13117 Aymara
## 5 0.0000000 2017 03201 Aymara
alfa_gene <- function(n){
x<-switch(n,"2006","2009","2011","2013","2015","2017")
for(i in x){
var <- filter(ytotaj_et_corr, ytotaj_et_corr$Año == x)
a <- nrow(var)
my_summary_data <- var %>%
group_by(Alfabetismo) %>%
summarise(Porcentaje = n()*100/a)
print(my_summary_data)
return(my_summary_data)
}
}
for (n in 1:6){
alfa_gene(n)
}
## `summarise()` ungrouping output (override with `.groups` argument)
## # A tibble: 3 x 2
## Alfabetismo Porcentaje
## <fct> <dbl>
## 1 Sí 61.7
## 2 No 37.6
## 3 No sabe /Sin dato 0.625
## `summarise()` ungrouping output (override with `.groups` argument)
## # A tibble: 2 x 2
## Alfabetismo Porcentaje
## <fct> <dbl>
## 1 Sí 62.6
## 2 No 37.4
## `summarise()` ungrouping output (override with `.groups` argument)
## # A tibble: 4 x 2
## Alfabetismo Porcentaje
## <fct> <dbl>
## 1 Sí, lee y escribe 48.7
## 2 No, sólo lee 17.7
## 3 No, sólo escribe 7.52
## 4 No, ninguno 26.1
## `summarise()` ungrouping output (override with `.groups` argument)
## # A tibble: 5 x 2
## Alfabetismo Porcentaje
## <fct> <dbl>
## 1 Sí, lee y escribe 48.8
## 2 No, sólo lee 18.6
## 3 No, sólo escribe 6.83
## 4 No, ninguno 24.7
## 5 NS/NR 1.09
## `summarise()` ungrouping output (override with `.groups` argument)
## # A tibble: 4 x 2
## Alfabetismo Porcentaje
## <fct> <dbl>
## 1 Sí, lee y escribe 50.3
## 2 No, sólo lee 16.9
## 3 No, sólo escribe 6.98
## 4 No, ninguno 25.8
## `summarise()` ungrouping output (override with `.groups` argument)
## # A tibble: 5 x 2
## Alfabetismo Porcentaje
## <fct> <dbl>
## 1 Sí, lee y escribe 49.7
## 2 No, sólo lee 14.9
## 3 No, sólo escribe 7.35
## 4 No, ninguno 25.7
## 5 No sabe/responde 2.39
Llegamos a un resultado sorprendente: la mitad de los registros lo representan categorías de analfabetos. Lo podemos explicar de la siguiente forma: no es correcto afirmar que la mitad de la tabla de contingencia esté compuesta por analfabetos, sino que simplemente se representan la cantidad de categorías que se generan por el criterio de agrupación. Lo correcto es analizar los ingresos por categoría y no interpretar los porcentajes como frecuencias, sino que simplemente como clasificaciones.
alfabetismo_unicos <- unique(ytotaj_et_corr$Alfabetismo)
alfabetismo_unicos <- as.data.frame(alfabetismo_unicos)
alfabetismo_unicos
## alfabetismo_unicos
## 1 Sí, lee y escribe
## 2 No, sólo lee
## 3 No, ninguno
## 4 No, sólo escribe
## 5 No sabe/responde
## 6 Sí
## 7 No
## 8 NS/NR
## 9 No sabe /Sin dato
alfabetismo <- read_xlsx("alfabetismo_unicos.xlsx")
alfabetismo
## # A tibble: 9 x 2
## Alfabetismo cat_alfa
## <chr> <chr>
## 1 Sí Sí
## 2 No No
## 3 No sabe /Sin dato NS/NR
## 4 Sí, lee y escribe Sí
## 5 No, sólo lee No
## 6 No, ninguno No
## 7 No, sólo escribe No
## 8 NS/NR NS/NR
## 9 No sabe/responde NS/NR
nuevas_cat = merge( x = ytotaj_et_corr, y = alfabetismo, by = "Alfabetismo", all.x = TRUE)
ytotaj_et_alf_corr <- nuevas_cat[,c(-1)]
head(ytotaj_et_alf_corr,5)
## Comuna Sexo Promedio del Ingreso Desviación standard Gini Año
## 1 Algarrobo Mujer 129186.00 NA 0.0000000 2006
## 2 Natales Mujer 89500.00 NA 0.0000000 2009
## 3 El Monte Hombre 179679.93 94845.54 0.2901287 2009
## 4 Coelemu Hombre 118268.79 53762.70 0.2396685 2009
## 5 Cabrero Mujer 68486.78 42854.04 0.3170571 2006
## Código categorias_etnicas cat_alfa
## 1 05602 Mapuche No
## 2 12401 Mapuche No
## 3 13602 No pertenece a ningún pueblo indígena No
## 4 16203 No pertenece a ningún pueblo indígena No
## 5 08303 No pertenece a ningún pueblo indígena No
nuevas_cat = merge( x = yautaj_et_corr, y = alfabetismo, by = "Alfabetismo", all.x = TRUE)
yautaj_et_alf_corr <- nuevas_cat[,c(-1)]
head(yautaj_et_alf_corr,5)
## Comuna Sexo Promedio del Ingreso Desviación standard Gini
## 1 Tomé Mujer 107329.6 43545.39 0.1648321
## 2 Yerbas Buenas Mujer 114731.5 142223.19 0.5498817
## 3 Tierra Amarilla Hombre 200117.9 147027.26 0.3347113
## 4 Purén Mujer 111647.1 46394.83 0.2011381
## 5 Gorbea Mujer 50270.0 42044.57 0.2957032
## Año Código categorias_etnicas cat_alfa
## 1 2006 08111 No pertenece a ningún pueblo indígena No
## 2 2009 07408 No pertenece a ningún pueblo indígena No
## 3 2006 03103 No pertenece a ningún pueblo indígena No
## 4 2006 09208 Mapuche No
## 5 2009 09107 Mapuche No
nuevas_cat = merge( x = yopraj_et_corr, y = alfabetismo, by = "Alfabetismo", all.x = TRUE)
yopraj_et_alf_corr <- nuevas_cat[,c(-1)]
head(yopraj_et_alf_corr,5)
## Comuna Sexo Promedio del Ingreso Desviación standard Gini Año
## 1 Conchalí Mujer 206821.3 35825.75 0.0748687 2009
## 2 Gorbea Hombre 118560.0 NA 0.0000000 2006
## 3 Freire Hombre 204357.5 112961.10 0.2384363 2009
## 4 Puerto Varas Mujer 8383.0 NA 0.0000000 2006
## 5 Chillán Hombre 135678.7 74854.24 0.2861258 2009
## Código categorias_etnicas cat_alfa
## 1 13104 No pertenece a ningún pueblo indígena No
## 2 09107 Mapuche No
## 3 09105 Mapuche No
## 4 10109 No pertenece a ningún pueblo indígena No
## 5 16101 No pertenece a ningún pueblo indígena No
nuevas_cat = merge( x = ytrabaj_et_corr, y = alfabetismo, by = "Alfabetismo", all.x = TRUE)
ytrabaj_et_alf_corr <- nuevas_cat[,c(-1)]
head(ytrabaj_et_alf_corr,5)
## Comuna Sexo Promedio del Ingreso Desviación standard Gini Año
## 1 Doñihue Hombre 78967.27 88051.87 0.5788865 2006
## 2 Lo Prado Mujer 147888.00 NA 0.0000000 2009
## 3 Galvarino Mujer 92689.11 130360.36 0.5927452 2006
## 4 Casablanca Mujer 105717.00 85230.41 0.2850393 2006
## 5 Catemu Hombre 104208.57 70062.61 0.3453948 2006
## Código categorias_etnicas cat_alfa
## 1 06105 No pertenece a ningún pueblo indígena No
## 2 13117 No pertenece a ningún pueblo indígena No
## 3 09106 Mapuche No
## 4 05102 No pertenece a ningún pueblo indígena No
## 5 05702 No pertenece a ningún pueblo indígena No
saveRDS(ytotaj_et_alf_corr,"ytotaj_et_alf_corr.rds")
saveRDS(yautaj_et_alf_corr,"yautaj_et_alf_corr.rds")
saveRDS(yopraj_et_alf_corr,"yopraj_et_alf_corr.rds")
saveRDS(ytrabaj_et_alf_corr,"ytrabaj_et_alf_corr.rds")
Despleguemos la ttcc original.
head(var_YTOTAJ,5)
## Comuna Alfabetismo Etnia Sexo
## 1 Aisén Sí Kawaskar Hombre
## 2 Aisén Sí Mapuche Hombre
## 3 Aisén Sí No pertenece a ningún pueblo indígena Mujer
## 4 Aisén No No pertenece a ningún pueblo indígena Mujer
## 5 Aisén Sí No pertenece a ningún pueblo indígena Hombre
## Promedio del Ingreso Desviación standard Gini Año Código
## 1 47386.0 NA 0.0000000 2006 11201
## 2 206218.9 103383.51 0.2792730 2006 11201
## 3 141209.0 101011.54 0.4004693 2006 11201
## 4 64652.2 41793.76 0.2441928 2006 11201
## 5 221528.5 120760.74 0.3104046 2006 11201
Tomemos el registro 6 que tiene promedio de ingreso “95985.17” y pertenece al año 2015, identifiquemos este registro en nuestra tabla tratada y corroboremos
prueba <- filter(var_YTOTAJ, var_YTOTAJ$Año==2015)
prueba_2 <- filter(prueba,round(prueba$`Promedio del Ingreso`) == 95985)
# prueba_3 <- filter(prueba_2, prueba_2$Sexo == "Mujer")
prueba_2
## Comuna Alfabetismo Etnia Sexo Promedio del Ingreso Desviación standard
## 1 Huara No, sólo lee Aimara Mujer 95985.17 12101.9
## Gini Año Código
## 1 0.04990731 2015 01404
prueba <- filter(nuevas_cat, nuevas_cat$Año==2015)
prueba_2 <- filter(prueba,round(prueba$`Promedio del Ingreso`) == 95985)
# prueba_3 <- filter(prueba_2, prueba_2$Sexo == "Mujer")
prueba_2
## [1] Alfabetismo Comuna Sexo
## [4] Promedio del Ingreso Desviación standard Gini
## [7] Año Código categorias_etnicas
## [10] cat_alfa
## <0 rows> (or 0-length row.names)
La transformación se realizó exitosamente.
En un artículo anterior determinamos las relaciones entre los ingresos de la Casen, después de lo cuál determinamos los 4 más relevantes. Vamos a determinar si los datos que hemos obtenido en nuestras tablas de contingencia se ajustan a ésta lógica.
El ingreso de la ocupación principal debe ser menor pero aproximado al ingreso del trabajo.
El ingreso autónomo debe ser menor al ingreso del trabajo, con un Δ que representaría otro ingreso autónomo.
El ingreso total debe ser mayor al ingreso autónomo con un Δ que representa los subsidios monetarios y otro Δ que representa el alquiler imputado.
Extraigamos una categoría cualquiera y obtengamos sus ingresos asociados en las 4 tablas de contingencia. Vamos a determinar si existe coherencia, la categoría sera Comuna: Arica, Sexo: Mujer, Etnia: Aymara, Alfabetismo: Sí para los 6 años.
ytotaj_et_alf_corr_filtrado <- filter(ytotaj_et_alf_corr, ytotaj_et_alf_corr$Comuna=="Arica")
ytotaj_et_alf_corr_filtrado <- filter(ytotaj_et_alf_corr_filtrado, ytotaj_et_alf_corr_filtrado$categorias_etnicas=="Aymara")
ytotaj_et_alf_corr_filtrado <- filter(ytotaj_et_alf_corr_filtrado, ytotaj_et_alf_corr_filtrado$Sexo=="Mujer")
ytotaj_et_alf_corr_filtrado <- filter(ytotaj_et_alf_corr_filtrado, ytotaj_et_alf_corr_filtrado$cat_alfa =="Sí")
ytotaj_et_alf_corr_filtrado
## Comuna Sexo Promedio del Ingreso Desviación standard Gini Año Código
## 1 Arica Mujer 113984.6 98619.89 0.4408677 2006 15101
## 2 Arica Mujer 166388.5 146365.85 0.4842500 2009 15101
## 3 Arica Mujer 234034.0 179899.89 0.4185738 2015 15101
## 4 Arica Mujer 245979.1 174997.12 0.3877048 2017 15101
## 5 Arica Mujer 205533.1 168623.44 0.4468356 2011 15101
## 6 Arica Mujer 178993.7 148803.67 0.4495608 2013 15101
## categorias_etnicas cat_alfa
## 1 Aymara Sí
## 2 Aymara Sí
## 3 Aymara Sí
## 4 Aymara Sí
## 5 Aymara Sí
## 6 Aymara Sí
yautaj_et_alf_corr_filtrado <- filter(yautaj_et_alf_corr, yautaj_et_alf_corr$Comuna=="Arica")
yautaj_et_alf_corr_filtrado <- filter(yautaj_et_alf_corr_filtrado, yautaj_et_alf_corr_filtrado$categorias_etnicas=="Aymara")
yautaj_et_alf_corr_filtrado <- filter(yautaj_et_alf_corr_filtrado, yautaj_et_alf_corr_filtrado$Sexo=="Mujer")
yautaj_et_alf_corr_filtrado <- filter(yautaj_et_alf_corr_filtrado, yautaj_et_alf_corr_filtrado$cat_alfa =="Sí")
yautaj_et_alf_corr_filtrado
## Comuna Sexo Promedio del Ingreso Desviación standard Gini Año Código
## 1 Arica Mujer 239396.3 169873.34 0.3929191 2009 15101
## 2 Arica Mujer 122382.7 99266.01 0.4109897 2006 15101
## 3 Arica Mujer 280804.6 182229.55 0.3409808 2017 15101
## 4 Arica Mujer 277688.2 189083.31 0.3602626 2015 15101
## 5 Arica Mujer 236582.1 164742.87 0.3780248 2011 15101
## 6 Arica Mujer 208830.1 140816.12 0.3619709 2013 15101
## categorias_etnicas cat_alfa
## 1 Aymara Sí
## 2 Aymara Sí
## 3 Aymara Sí
## 4 Aymara Sí
## 5 Aymara Sí
## 6 Aymara Sí
yopraj_et_alf_corr_filtrado <- filter(yopraj_et_alf_corr, yopraj_et_alf_corr$Comuna=="Arica")
yopraj_et_alf_corr_filtrado <- filter(yopraj_et_alf_corr_filtrado, yopraj_et_alf_corr_filtrado$categorias_etnicas=="Aymara")
yopraj_et_alf_corr_filtrado <- filter(yopraj_et_alf_corr_filtrado, yopraj_et_alf_corr_filtrado$Sexo=="Mujer")
yopraj_et_alf_corr_filtrado <- filter(yopraj_et_alf_corr_filtrado, yopraj_et_alf_corr_filtrado$cat_alfa =="Sí")
yopraj_et_alf_corr_filtrado
## Comuna Sexo Promedio del Ingreso Desviación standard Gini Año Código
## 1 Arica Mujer 138700.6 102907.8 0.3757916 2006 15101
## 2 Arica Mujer 244397.6 129615.3 0.2968804 2009 15101
## 3 Arica Mujer 251901.6 176768.0 0.3605212 2015 15101
## 4 Arica Mujer 276547.3 154156.1 0.2933870 2017 15101
## 5 Arica Mujer 242195.9 150715.3 0.3398709 2011 15101
## 6 Arica Mujer 196975.6 123885.9 0.3353414 2013 15101
## categorias_etnicas cat_alfa
## 1 Aymara Sí
## 2 Aymara Sí
## 3 Aymara Sí
## 4 Aymara Sí
## 5 Aymara Sí
## 6 Aymara Sí
ytrabaj_et_alf_corr_filtrado <- filter(ytrabaj_et_alf_corr, ytrabaj_et_alf_corr$Comuna=="Arica")
ytrabaj_et_alf_corr_filtrado <- filter(ytrabaj_et_alf_corr_filtrado, ytrabaj_et_alf_corr_filtrado$categorias_etnicas=="Aymara")
ytrabaj_et_alf_corr_filtrado <- filter(ytrabaj_et_alf_corr_filtrado, ytrabaj_et_alf_corr_filtrado$Sexo=="Mujer")
ytrabaj_et_alf_corr_filtrado <- filter(ytrabaj_et_alf_corr_filtrado, ytrabaj_et_alf_corr_filtrado$cat_alfa =="Sí")
ytrabaj_et_alf_corr_filtrado
## Comuna Sexo Promedio del Ingreso Desviación standard Gini Año Código
## 1 Arica Mujer 115751.7 101801.9 0.4464991 2006 15101
## 2 Arica Mujer 246158.5 145090.1 0.3300689 2009 15101
## 3 Arica Mujer 271502.1 197541.5 0.3809748 2015 15101
## 4 Arica Mujer 296280.5 194231.6 0.3424730 2017 15101
## 5 Arica Mujer 253408.5 170344.4 0.3636373 2011 15101
## 6 Arica Mujer 212323.8 145675.8 0.3681491 2013 15101
## categorias_etnicas cat_alfa
## 1 Aymara Sí
## 2 Aymara Sí
## 3 Aymara Sí
## 4 Aymara Sí
## 5 Aymara Sí
## 6 Aymara Sí
# yopraj_et_alf_corr
ytotaj yautaj yopraj ytrabaj
ytotaj-ytotcor: ingreso total yautaj-yautcor: ingreso autónomo yopraj-yoprcor: ingreso de la ocupacion principal ytrabaj-ytrabajocor: ingreso del trabajo
Se debiesen cumplir las siguientes desigualdades:
Se confirma en 5 de 6 casos
Se confirma en 5 de 6 casos
No se cumple.
Es posible que esto sea así producto de los promedios, por que analizaremos los datos en forma individual.
dataset_2006 <- readRDS(file = "casen_2006_c.rds")
# dataset_2009 <- readRDS(file = "casen_2009_c.rds")
# dataset_2011 <- readRDS(file = "casen_2011_c.rds")
# dataset_2013 <- readRDS(file = "casen_2013_c.rds")
# dataset_2015 <- readRDS(file = "casen_2015_c.rds")
# dataset_2017 <- readRDS(file = "casen_2017_c.rds")
Es menor el ingreso de la ocupación principal al ingreso del trabajo?
# dataset_2006_ytotaj <- dataset_2006$YTOTAJ
dataset_2006_yopraj <- sum(dataset_2006$YOPRAJ, na.rm = TRUE )
dataset_2006_ytrabaj <- sum(dataset_2006$YTRABAJ, na.rm = TRUE )
dataset_2006_yopraj
## [1] 23466814415
dataset_2006_ytrabaj
## [1] 28966578258
dataset_2006_yopraj < dataset_2006_ytrabaj
## [1] TRUE
Que porcentaje del ingreso del trabajo representa el ingreso de la ocupación principal?
Porcentaje <- (dataset_2006_yopraj*100)/dataset_2006_ytrabaj
Porcentaje
## [1] 81.01342
En términos agregados, para el 2006 en ingresos de la ocupación principal representaron el 81,01% de los ingresos del trabajo
Es el ingreso autónomo del trabajo menor al ingreso del trabajo total?
# dataset_2006_ytotaj <- dataset_2006$YTOTAJ
dataset_2006_ytotaj <- sum(dataset_2006$YTOTAJ, na.rm = TRUE )
dataset_2006_yautaj <- sum(dataset_2006$YAUTAJ, na.rm = TRUE )
dataset_2006_ytotaj > dataset_2006_yautaj
## [1] TRUE
Que porcentaje del ingreso total representan los subsidios monetarios y el alquiler imputado?
Porcentaje <- (dataset_2006_yautaj*100)/dataset_2006_ytotaj
100-Porcentaje
## [1] 2.510925
Los subsidios monetarios y el alquiler imputado representaron un 2,51% de los ingresos totales
Son los ingresos del trabajo menores a los ingresos autónomos?
# El ingreso autónomo debe ser mayor al ingreso del trabajo
dataset_2006_yautaj <- sum(dataset_2006$YAUTAJ, na.rm = TRUE )
dataset_2006_ytrabaj <- sum(dataset_2006$YTRABAJ, na.rm = TRUE )
dataset_2006_yautaj > dataset_2006_ytrabaj
## [1] TRUE
Que porcentaje del ingreso autónomo representa el ingreso del trabajo?
Porcentaje <- (dataset_2006_ytrabaj*100)/dataset_2006_yautaj
Porcentaje
## [1] 85.9327
Los ingresos del trabajo representan un 85,93% de los ingresos autónomos
La descomposición de los ingresos que realizamos en trabajo previo es correcto. Pero también llegamos a un resultado sorprendente. En términos agregados el 2,51% de los ingresos de las personas correponden o bien a un subsidio monetario del estado y/o al alquiler imputado de su vivienda
Arica Mujer 113984.6 98619.89 0.4408677 2006 15101 Aymara Sí
dataset_2006_filter <- filter(dataset_2006, dataset_2006$COMUNA=="Arica")
dataset_2006_filter <- filter(dataset_2006_filter, dataset_2006_filter$T4=="Aymara")
dataset_2006_filter <- filter(dataset_2006_filter, dataset_2006_filter$SEXO=="Mujer")
dataset_2006_filter <- filter(dataset_2006_filter, dataset_2006_filter$E1 =="Sí")
# head(dataset_2006_filter,5)
# El ingreso autónomo debe ser mayor al ingreso del trabajo
dataset_2006_yautaj <- sum(dataset_2006_filter$YAUTAJ, na.rm = TRUE )
dataset_2006_ytrabaj <- sum(dataset_2006_filter$YTRABAJ, na.rm = TRUE )
dataset_2006_yautaj > dataset_2006_ytrabaj
## [1] TRUE
Que porcentaje del ingreso autónomo representa el ingreso del trabajo?
Porcentaje <- (dataset_2006_ytrabaj*100)/dataset_2006_yautaj
Porcentaje
## [1] 88.63668
# dataset_2006_ytotaj <- dataset_2006$YTOTAJ
dataset_2006_ytotaj <- sum(dataset_2006_filter$YTOTAJ, na.rm = TRUE )
dataset_2006_yautaj <- sum(dataset_2006_filter$YAUTAJ, na.rm = TRUE )
dataset_2006_ytotaj > dataset_2006_yautaj
## [1] TRUE
Que porcentaje del ingreso total representan los subsidios monetarios y el alquiler imputado?
Porcentaje <- (dataset_2006_yautaj*100)/dataset_2006_ytotaj
100-Porcentaje
## [1] 4.040509
# dataset_2006_ytotaj <- dataset_2006$YTOTAJ
dataset_2006_yopraj <- sum(dataset_2006$YOPRAJ, na.rm = TRUE )
dataset_2006_ytrabaj <- sum(dataset_2006$YTRABAJ, na.rm = TRUE )
dataset_2006_yopraj
## [1] 23466814415
dataset_2006_ytrabaj
## [1] 28966578258
dataset_2006_yopraj < dataset_2006_ytrabaj
## [1] TRUE
Que porcentaje del ingreso del trabajo representa el ingreso de la ocupación principal?
Porcentaje <- (dataset_2006_yopraj*100)/dataset_2006_ytrabaj
Porcentaje
## [1] 81.01342
Nuestra interpretaci[on de las variables de ingreso fue correcta. Podemos afirmar que las divergencias se producen por el caracter agregado de los datos al hacer los promedios.