Abstract

Ya tenemos las tablas de contingencia para las 4 variables que hemos seleccionado como las más relevantes en un artículo previo. Ahora, revisamos y corregimos el diseño de las categorías de respuesta para las preguntas referidas a Etnia y Alfabetismo. Analizamos un error que en definitiva no es tal.

Índice

1 Introducción

2 Enmienda a las categorías étnicas

3 Enmienda a las categorías de alfabetismo

4 Verificación de la exactitud de las magnitudes de los ingresos

5 Análisis de un posible error

6 Gráficos

7 Ubicación de las tablas de contingencia

1. Introducción

En este artículo haremos una revisión completa a las tablas de contingencia generadas. En específico, sobre las categorías de respuesta a las preguntas sobre pertenencia a grupo indígena y a alfabetismo. Lo más relevante es que si bien, verificamos que nuestra descomposición de los ingresos realizada en un trabajo anterior es correcta, en las tablas de contingencia no se presenta la misma relación. Podemos afirmar que esto se produce por la naturaleza propia del agrupamiento en torno a promedios. Se presentan en el punto 7 las direcciones donde se pueden encontrar las tablas generadas y analizadas.

2. Enmienda a las categorías étnicas

2.1 El problema

No es fácil comparar las preguntas o categorías de la Casen directamente a lo largo de los años. Muchas veces las preguntas son parecidas pero no iguales y lo mismo sucede con las categorías de respuesta. Es éste el caso para etnia y alfabetismo en las tablas de contingencia que generamos para los promedios de las variables de ingreso. A continuación exponemos la lógica de corrección para la pertenecia grupo étnico.

Haremos el análisis completo para YTOTAJ y sólo mostraremos el código para las demás.

Variable YTOTAJ

2.2 Leemos la base de datos de ingreso referida a la variable YTOTAJ

var_YTOTAJ <- readRDS("variables_ingreso/YTOTAJ2.rds")
head(var_YTOTAJ,5)

##   Comuna Alfabetismo                                 Etnia   Sexo
## 1  Aisén          Sí                              Kawaskar Hombre
## 2  Aisén          Sí                               Mapuche Hombre
## 3  Aisén          Sí No pertenece a ningún pueblo indígena  Mujer
## 4  Aisén          No No pertenece a ningún pueblo indígena  Mujer
## 5  Aisén          Sí No pertenece a ningún pueblo indígena Hombre
##   Promedio del Ingreso Desviación standard      Gini  Año Código
## 1              47386.0                  NA 0.0000000 2006  11201
## 2             206218.9           103383.51 0.2792730 2006  11201
## 3             141209.0           101011.54 0.4004693 2006  11201
## 4              64652.2            41793.76 0.2441928 2006  11201
## 5             221528.5           120760.74 0.3104046 2006  11201

Categorías asociadas a las etnias

Despleguemos los porcentajes de las categorías asociadas a las etnias. Tengamos presente que éstas no son frecuencias de individuos, sino que de categorías. Podríamos hacer un cálculo en el que estrajésemos información de las frecuencias de los individuos en las categorías. Para ello tendríamos que aplicar los factores de expansión y un análisis mas profundo.

alfa_gene <- function(n){
  
 x<-switch(n,"2006","2009","2011","2013","2015","2017")
  for(i in x){
    
  var <- filter(var_YTOTAJ, var_YTOTAJ$Año == x)
  a <- nrow(var)
  my_summary_data <- var %>%
    group_by(Etnia) %>%
    summarise(Porcentaje = n()*100/a)
  print(my_summary_data)
  return(my_summary_data)
  }
 
}

Obtengamos las categorías y sus frecuencias para las Casen de 2006 al 2017

for (n in 1:6){
  alfa_gene(n)
}

## `summarise()` ungrouping output (override with `.groups` argument)

## # A tibble: 11 x 2
##    Etnia                                 Porcentaje
##    <fct>                                      <dbl>
##  1 Aymara                                     4.53 
##  2 Rapa Nui                                   0.430
##  3 Quechua                                    1.56 
##  4 Mapuche                                   33.1  
##  5 Atacameño                                  2.23 
##  6 Coya                                       0.586
##  7 Kawaskar                                   0.781
##  8 Yagan                                      0.390
##  9 Diaguita                                   1.25 
## 10 No pertenece a ningún pueblo indígena     52.2  
## 11 Sin dato                                   2.97

## `summarise()` ungrouping output (override with `.groups` argument)

## # A tibble: 10 x 2
##    Etnia                                 Porcentaje
##    <fct>                                      <dbl>
##  1 Aymara                                     5.66 
##  2 Rapa Nui                                   1.01 
##  3 Quechua                                    1.99 
##  4 Mapuche                                   32.8  
##  5 Atacameño                                  2.30 
##  6 Coya                                       0.858
##  7 Diaguita                                   2.77 
##  8 No pertenece a ningún pueblo indígena     51.2  
##  9 Kawésqar                                   0.624
## 10 Yagán                                      0.702

## `summarise()` ungrouping output (override with `.groups` argument)

## # A tibble: 10 x 2
##    Etnia                                 Porcentaje
##    <fct>                                      <dbl>
##  1 Aymara                                     4.51 
##  2 Quechua                                    2.14 
##  3 Mapuche                                   27.6  
##  4 Coya                                       1.35 
##  5 Diaguita                                   2.74 
##  6 No pertenece a ningún pueblo indígena     57.8  
##  7 Rapa Nui (Pascuense)                       1.08 
##  8 Atacameño (Likán Antai)                    1.53 
##  9 Kawésqar (Alacalufes)                      0.782
## 10 Yagán (Yámana)                             0.421

## `summarise()` ungrouping output (override with `.groups` argument)

## # A tibble: 11 x 2
##    Etnia                                 Porcentaje
##    <fct>                                      <dbl>
##  1 Aymara                                     4.47 
##  2 Quechua                                    1.56 
##  3 Mapuche                                   26.6  
##  4 Coya                                       0.971
##  5 Diaguita                                   2.74 
##  6 No pertenece a ningún pueblo indígena     56.9  
##  7 Rapa Nui (Pascuense)                       0.383
##  8 Atacameño (Likán Antai)                    1.27 
##  9 Kawésqar (Alacalufes)                      0.913
## 10 Yagán (Yámana)                             0.206
## 11 NS/NR                                      4.03

## `summarise()` ungrouping output (override with `.groups` argument)

## # A tibble: 11 x 2
##    Etnia                                 Porcentaje
##    <fct>                                      <dbl>
##  1 Quechua                                   2.29  
##  2 Mapuche                                  27.9   
##  3 Diaguita                                  3.71  
##  4 No pertenece a ningún pueblo indígena    55.8   
##  5 Sin dato                                  0.446 
##  6 Aimara                                    5.58  
##  7 Rapa-Nui o Pascuenses                     0.535 
##  8 Atacameño (Likán-Antai)                   1.40  
##  9 Collas                                    1.25  
## 10 Kawashkar o Alacalufes                    1.01  
## 11 Yámana o Yagán                            0.0891

## `summarise()` ungrouping output (override with `.groups` argument)

## # A tibble: 11 x 2
##    Etnia                                 Porcentaje
##    <fct>                                      <dbl>
##  1 Quechua                                    1.40 
##  2 Mapuche                                   26.4  
##  3 Diaguita                                   3.97 
##  4 No pertenece a ningún pueblo indígena     57.8  
##  5 Aimara                                     4.42 
##  6 Rapa-Nui o Pascuenses                      0.448
##  7 Collas                                     1.28 
##  8 Kawashkar o Alacalufes                     0.956
##  9 Yámana o Yagán                             0.149
## 10 Atacameño (Likan-Antai)                    1.25 
## 11 No sabe/no responde                        1.88

2.3 El tratamiento

En la Casen del 2006 figuran 9 comunidades étnicas más la categoría “No pertenece a ningún pueblo indígena”, lo mismo en el 2009 y en el 2011. En el 2013 aparece la categoría “NS/NR”. En la Casen del 2015 en vez de “NS/NR” aparece la categoría “Sin dato”. En la del 2017 vuelve a aparecer “NS/NR”.

Utilizaremos el siguiente criterio: Todas las categorías que no indiquen identificación étnica serán asociadas a la categoría “No pertenece a ningún pueblo indígena”

Homogeneizaremos el texto escrito que identifica a las comunidades étnicas pues en diferentes años algunas están escritas de diferentes maneras.

Aplicaremos entonces un “unique” a la tabla de contingencia.

categorias_etnia <- unique(var_YTOTAJ$Etnia)
categorias_etnia <- as.data.frame(categorias_etnia)
categorias_etnia

##                         categorias_etnia
## 1                               Kawaskar
## 2                                Mapuche
## 3  No pertenece a ningún pueblo indígena
## 4                              Atacameño
## 5                               Diaguita
## 6                                 Aymara
## 7                               Sin dato
## 8                                Quechua
## 9                                  Yagan
## 10                                  Coya
## 11                              Rapa Nui
## 12                              Kawésqar
## 13                                 Yagán
## 14                  Rapa Nui (Pascuense)
## 15               Atacameño (Likán Antai)
## 16                        Yagán (Yámana)
## 17                 Kawésqar (Alacalufes)
## 18                                 NS/NR
## 19                                Aimara
## 20                                Collas
## 21               Atacameño (Likán-Antai)
## 22                Kawashkar o Alacalufes
## 23                 Rapa-Nui o Pascuenses
## 24                        Yámana o Yagán
## 25                   No sabe/no responde
## 26               Atacameño (Likan-Antai)

# write_xlsx(categorias_etnia,"categorias_etnia.xlsx")

La tabla diccionario queda entonces como sigue:

categorias <- read_xlsx("categorias_etnia.xlsx")

categoriasbuenas = merge( x = var_YTOTAJ, y = categorias, by = "Etnia", all.x = TRUE)
ytotaj_et_corr <- categoriasbuenas[,c(-1)]
head(ytotaj_et_corr,5)

##     Comuna       Alfabetismo   Sexo Promedio del Ingreso Desviación standard
## 1   Curicó Sí, lee y escribe  Mujer               163000                  NA
## 2     Pica      No, sólo lee Hombre                94355                  NA
## 3    Putre      No, sólo lee  Mujer               150898            109835.1
## 4 Lo Prado       No, ninguno Hombre                70000                  NA
## 5 Chañaral Sí, lee y escribe  Mujer               100000                  NA
##        Gini  Año Código categorias_etnicas
## 1 0.0000000 2015  07301             Aymara
## 2 0.0000000 2015  01405             Aymara
## 3 0.3634627 2015  15201             Aymara
## 4 0.0000000 2015  13117             Aymara
## 5 0.0000000 2017  03201             Aymara

2.4 Pruebas

Haremos pruebas sobre 10 registros aleatorios de nuestra tabla de contingencia original:

x10 <- sample(1:18563,10)
x10

##  [1]  7150 11269  9022  6107 11489 13504 16581  6439 10878 16815

var_YTOTAJ_etnia <- var_YTOTAJ[x10,] 
var_YTOTAJ_etnia

##             Comuna       Alfabetismo                                 Etnia
## 7150        Pemuco  No, sólo escribe No pertenece a ningún pueblo indígena
## 11269 San Fernando      No, sólo lee No pertenece a ningún pueblo indígena
## 9022      Cochrane       No, ninguno No pertenece a ningún pueblo indígena
## 6107        Freire       No, ninguno No pertenece a ningún pueblo indígena
## 11489    Talagante Sí, lee y escribe                               Mapuche
## 13504      Maullín       No, ninguno No pertenece a ningún pueblo indígena
## 16581      Linares Sí, lee y escribe No pertenece a ningún pueblo indígena
## 6439         Lampa      No, sólo lee No pertenece a ningún pueblo indígena
## 10878        Putre       No, ninguno                                Aymara
## 16815        Maipú       No, ninguno No pertenece a ningún pueblo indígena
##         Sexo Promedio del Ingreso Desviación standard       Gini  Año Código
## 7150  Hombre             21980.00                  NA 0.00000000 2011  16105
## 11269 Hombre            240864.83          161554.257 0.34060954 2013  06301
## 9022  Hombre             92391.33            9438.397 0.04449672 2013  11301
## 6107   Mujer             93633.40           43059.144 0.20891007 2011  09105
## 11489 Hombre            234444.44           79860.990 0.16956293 2013  13601
## 13504  Mujer            144470.60           75762.310 0.23716438 2015  10108
## 16581  Mujer            243852.78          187930.571 0.41878136 2017  07401
## 6439  Hombre            151435.67           64353.975 0.17839479 2011  13302
## 10878  Mujer            119413.45           48592.693 0.20768913 2013  15201
## 16815 Hombre            211534.00          156503.552 0.36570821 2017  13119

Ahora identifiquemos este registro en nuestra tabla de contingencia tratada:

categoriasbuenas_etnia <- filter(categoriasbuenas, round(categoriasbuenas$`Promedio del Ingreso`) == 75000)
categoriasbuenas_etnia2 <- filter(categoriasbuenas_etnia, categoriasbuenas_etnia$Comuna=="Osorno" )
categoriasbuenas_etnia2

##                    Etnia Comuna       Alfabetismo   Sexo Promedio del Ingreso
## 1 Kawashkar o Alacalufes Osorno Sí, lee y escribe Hombre                75000
##   Desviación standard Gini  Año Código categorias_etnicas
## 1                  NA    0 2017  10301         Alacalufes

# saveRDS(categoriasbuenas,"variables_ingreso/YTOTAJ_etnias.rds")

La asignación se produjo correctamente.

Variable YAUTAJ

var_YAUTAJ <- readRDS("variables_ingreso/YAUTAJ.rds")
categoriasbuenas = merge( x = var_YAUTAJ, y = categorias, by = "Etnia", all.x = TRUE)
yautaj_et_corr <- categoriasbuenas[,c(-1)]
head(yautaj_et_corr,5)

##         Comuna       Alfabetismo   Sexo Promedio del Ingreso
## 1 Sierra Gorda Sí, lee y escribe Hombre               251875
## 2     Chañaral Sí, lee y escribe  Mujer               100000
## 3       Camiña       No, ninguno  Mujer               107500
## 4       Huasco Sí, lee y escribe Hombre               255000
## 5      Iquique Sí, lee y escribe  Mujer               347038
##   Desviación standard      Gini  Año Código categorias_etnicas
## 1            73362.33 0.1029777 2015  02103             Aymara
## 2                  NA 0.0000000 2017  03201             Aymara
## 3                  NA 0.0000000 2017  01402             Aymara
## 4           106066.02 0.1470588 2015  03304             Aymara
## 5           213295.75 0.3350889 2017  01101             Aymara

Variable YOPRAJ

var_YOPRAJ <- readRDS("variables_ingreso/YOPRAJ.rds")
categoriasbuenas = merge( x = var_YOPRAJ, y = categorias, by = "Etnia", all.x = TRUE)
yopraj_et_corr <- categoriasbuenas[,c(-1)]
head(yopraj_et_corr,5)

##      Comuna       Alfabetismo   Sexo Promedio del Ingreso Desviación standard
## 1    Temuco Sí, lee y escribe  Mujer             350000.0                  NA
## 2    Castro Sí, lee y escribe Hombre             250000.0                  NA
## 3     Putre Sí, lee y escribe Hombre             319215.7              167910
## 4 Camarones      No, sólo lee  Mujer             100000.0                  NA
## 5  Coquimbo Sí, lee y escribe Hombre             420000.0                  NA
##        Gini  Año Código categorias_etnicas
## 1 0.0000000 2015  09101             Aymara
## 2 0.0000000 2015  10201             Aymara
## 3 0.2722787 2017  15201             Aymara
## 4 0.0000000 2017  15102             Aymara
## 5 0.0000000 2017  04102             Aymara

Variable YTRABAJ

var_YTRABAJ <- readRDS("variables_ingreso/YTRABAJ.rds")
categoriasbuenas = merge( x = var_YTRABAJ, y = categorias, by = "Etnia", all.x = TRUE)
ytrabaj_et_corr <- categoriasbuenas[,c(-1)]
head(ytrabaj_et_corr,5)

##      Comuna       Alfabetismo   Sexo Promedio del Ingreso Desviación standard
## 1   Copiapó Sí, lee y escribe Hombre             448928.6            234127.9
## 2     Huara Sí, lee y escribe  Mujer             195833.3            226798.6
## 3 Paredones Sí, lee y escribe Hombre             270000.0                  NA
## 4 Los Lagos Sí, lee y escribe Hombre             552917.0                  NA
## 5   Caldera Sí, lee y escribe  Mujer             535000.0                  NA
##        Gini  Año Código categorias_etnicas
## 1 0.2686668 2017  03101             Aymara
## 2 0.5228131 2015  01404             Aymara
## 3 0.0000000 2017  06206             Aymara
## 4 0.0000000 2017  14104             Aymara
## 5 0.0000000 2015  03102             Aymara

3. Enmienda a las categorías de alfabetismo

A la respuesta de la pregunta ¿Sabe leer?, la Casen del 2006 entrega 3 categorías de respuesta. Éstas categorías no son constantes pues se le agregan otras o son modificadas en las Casen posteriores. En nuestra tabla de contingencia relacionada al ingreso YTOTAJ, éstas categorías se distribuyen en los siguientes porcentajes:

Primero veamos el contenido de la ttcc en cuestión.

    head(ytotaj_et_corr,5)

##     Comuna       Alfabetismo   Sexo Promedio del Ingreso Desviación standard
## 1   Curicó Sí, lee y escribe  Mujer               163000                  NA
## 2     Pica      No, sólo lee Hombre                94355                  NA
## 3    Putre      No, sólo lee  Mujer               150898            109835.1
## 4 Lo Prado       No, ninguno Hombre                70000                  NA
## 5 Chañaral Sí, lee y escribe  Mujer               100000                  NA
##        Gini  Año Código categorias_etnicas
## 1 0.0000000 2015  07301             Aymara
## 2 0.0000000 2015  01405             Aymara
## 3 0.3634627 2015  15201             Aymara
## 4 0.0000000 2015  13117             Aymara
## 5 0.0000000 2017  03201             Aymara

Categorías y porcentajes de analfabetismo por año para YTOTAJ

alfa_gene <- function(n){
  
 x<-switch(n,"2006","2009","2011","2013","2015","2017")
  for(i in x){
    
  var <- filter(ytotaj_et_corr, ytotaj_et_corr$Año == x)
  a <- nrow(var)
  my_summary_data <- var %>%
    group_by(Alfabetismo) %>%
    summarise(Porcentaje = n()*100/a)
  print(my_summary_data)
  return(my_summary_data)
  }
 
}

for (n in 1:6){
  alfa_gene(n)
}

## `summarise()` ungrouping output (override with `.groups` argument)

## # A tibble: 3 x 2
##   Alfabetismo       Porcentaje
##   <fct>                  <dbl>
## 1 Sí                    61.7  
## 2 No                    37.6  
## 3 No sabe /Sin dato      0.625

## `summarise()` ungrouping output (override with `.groups` argument)

## # A tibble: 2 x 2
##   Alfabetismo Porcentaje
##   <fct>            <dbl>
## 1 Sí                62.6
## 2 No                37.4

## `summarise()` ungrouping output (override with `.groups` argument)

## # A tibble: 4 x 2
##   Alfabetismo       Porcentaje
##   <fct>                  <dbl>
## 1 Sí, lee y escribe      48.7 
## 2 No, sólo lee           17.7 
## 3 No, sólo escribe        7.52
## 4 No, ninguno            26.1

## `summarise()` ungrouping output (override with `.groups` argument)

## # A tibble: 5 x 2
##   Alfabetismo       Porcentaje
##   <fct>                  <dbl>
## 1 Sí, lee y escribe      48.8 
## 2 No, sólo lee           18.6 
## 3 No, sólo escribe        6.83
## 4 No, ninguno            24.7 
## 5 NS/NR                   1.09

## `summarise()` ungrouping output (override with `.groups` argument)

## # A tibble: 4 x 2
##   Alfabetismo       Porcentaje
##   <fct>                  <dbl>
## 1 Sí, lee y escribe      50.3 
## 2 No, sólo lee           16.9 
## 3 No, sólo escribe        6.98
## 4 No, ninguno            25.8

## `summarise()` ungrouping output (override with `.groups` argument)

## # A tibble: 5 x 2
##   Alfabetismo       Porcentaje
##   <fct>                  <dbl>
## 1 Sí, lee y escribe      49.7 
## 2 No, sólo lee           14.9 
## 3 No, sólo escribe        7.35
## 4 No, ninguno            25.7 
## 5 No sabe/responde        2.39

Llegamos a un resultado sorprendente: la mitad de los registros lo representan categorías de analfabetos. Lo podemos explicar de la siguiente forma: no es correcto afirmar que la mitad de la tabla de contingencia esté compuesta por analfabetos, sino que simplemente se representan la cantidad de categorías que se generan por el criterio de agrupación. Lo correcto es analizar los ingresos por categoría y no interpretar los porcentajes como frecuencias, sino que simplemente como clasificaciones.

Vamos a utilizar el siguiente criterio: consideraremos analfabetos a todos los que respondan algo distinto de “Sí” a la pregunta ¿Sabe leer? en las Casen posteriores a la del 2006:

alfabetismo_unicos <- unique(ytotaj_et_corr$Alfabetismo)
alfabetismo_unicos <- as.data.frame(alfabetismo_unicos)
alfabetismo_unicos

##   alfabetismo_unicos
## 1  Sí, lee y escribe
## 2       No, sólo lee
## 3        No, ninguno
## 4   No, sólo escribe
## 5   No sabe/responde
## 6                 Sí
## 7                 No
## 8              NS/NR
## 9  No sabe /Sin dato

alfabetismo <- read_xlsx("alfabetismo_unicos.xlsx")
alfabetismo

## # A tibble: 9 x 2
##   Alfabetismo       cat_alfa
##   <chr>             <chr>   
## 1 Sí                Sí      
## 2 No                No      
## 3 No sabe /Sin dato NS/NR   
## 4 Sí, lee y escribe Sí      
## 5 No, sólo lee      No      
## 6 No, ninguno       No      
## 7 No, sólo escribe  No      
## 8 NS/NR             NS/NR   
## 9 No sabe/responde  NS/NR

nuevas_cat = merge( x = ytotaj_et_corr, y = alfabetismo, by = "Alfabetismo", all.x = TRUE)
ytotaj_et_alf_corr <- nuevas_cat[,c(-1)]
head(ytotaj_et_alf_corr,5)

##      Comuna   Sexo Promedio del Ingreso Desviación standard      Gini  Año
## 1 Algarrobo  Mujer            129186.00                  NA 0.0000000 2006
## 2   Natales  Mujer             89500.00                  NA 0.0000000 2009
## 3  El Monte Hombre            179679.93            94845.54 0.2901287 2009
## 4   Coelemu Hombre            118268.79            53762.70 0.2396685 2009
## 5   Cabrero  Mujer             68486.78            42854.04 0.3170571 2006
##   Código                    categorias_etnicas cat_alfa
## 1  05602                               Mapuche       No
## 2  12401                               Mapuche       No
## 3  13602 No pertenece a ningún pueblo indígena       No
## 4  16203 No pertenece a ningún pueblo indígena       No
## 5  08303 No pertenece a ningún pueblo indígena       No

nuevas_cat = merge( x = yautaj_et_corr, y = alfabetismo, by = "Alfabetismo", all.x = TRUE)
yautaj_et_alf_corr <- nuevas_cat[,c(-1)]
head(yautaj_et_alf_corr,5)

##            Comuna   Sexo Promedio del Ingreso Desviación standard      Gini
## 1            Tomé  Mujer             107329.6            43545.39 0.1648321
## 2   Yerbas Buenas  Mujer             114731.5           142223.19 0.5498817
## 3 Tierra Amarilla Hombre             200117.9           147027.26 0.3347113
## 4           Purén  Mujer             111647.1            46394.83 0.2011381
## 5          Gorbea  Mujer              50270.0            42044.57 0.2957032
##    Año Código                    categorias_etnicas cat_alfa
## 1 2006  08111 No pertenece a ningún pueblo indígena       No
## 2 2009  07408 No pertenece a ningún pueblo indígena       No
## 3 2006  03103 No pertenece a ningún pueblo indígena       No
## 4 2006  09208                               Mapuche       No
## 5 2009  09107                               Mapuche       No

nuevas_cat = merge( x = yopraj_et_corr, y = alfabetismo, by = "Alfabetismo", all.x = TRUE)
yopraj_et_alf_corr <- nuevas_cat[,c(-1)]
head(yopraj_et_alf_corr,5)

##         Comuna   Sexo Promedio del Ingreso Desviación standard      Gini  Año
## 1     Conchalí  Mujer             206821.3            35825.75 0.0748687 2009
## 2       Gorbea Hombre             118560.0                  NA 0.0000000 2006
## 3       Freire Hombre             204357.5           112961.10 0.2384363 2009
## 4 Puerto Varas  Mujer               8383.0                  NA 0.0000000 2006
## 5      Chillán Hombre             135678.7            74854.24 0.2861258 2009
##   Código                    categorias_etnicas cat_alfa
## 1  13104 No pertenece a ningún pueblo indígena       No
## 2  09107                               Mapuche       No
## 3  09105                               Mapuche       No
## 4  10109 No pertenece a ningún pueblo indígena       No
## 5  16101 No pertenece a ningún pueblo indígena       No

nuevas_cat = merge( x = ytrabaj_et_corr, y = alfabetismo, by = "Alfabetismo", all.x = TRUE)
ytrabaj_et_alf_corr <- nuevas_cat[,c(-1)]
head(ytrabaj_et_alf_corr,5)

##       Comuna   Sexo Promedio del Ingreso Desviación standard      Gini  Año
## 1    Doñihue Hombre             78967.27            88051.87 0.5788865 2006
## 2   Lo Prado  Mujer            147888.00                  NA 0.0000000 2009
## 3  Galvarino  Mujer             92689.11           130360.36 0.5927452 2006
## 4 Casablanca  Mujer            105717.00            85230.41 0.2850393 2006
## 5     Catemu Hombre            104208.57            70062.61 0.3453948 2006
##   Código                    categorias_etnicas cat_alfa
## 1  06105 No pertenece a ningún pueblo indígena       No
## 2  13117 No pertenece a ningún pueblo indígena       No
## 3  09106                               Mapuche       No
## 4  05102 No pertenece a ningún pueblo indígena       No
## 5  05702 No pertenece a ningún pueblo indígena       No

saveRDS(ytotaj_et_alf_corr,"ytotaj_et_alf_corr.rds")
saveRDS(yautaj_et_alf_corr,"yautaj_et_alf_corr.rds")
saveRDS(yopraj_et_alf_corr,"yopraj_et_alf_corr.rds")
saveRDS(ytrabaj_et_alf_corr,"ytrabaj_et_alf_corr.rds")

5. Pruebas

Vamos a revisar que nuestra transformación sea la correcta.

Despleguemos la ttcc original.

head(var_YTOTAJ,5)

##   Comuna Alfabetismo                                 Etnia   Sexo
## 1  Aisén          Sí                              Kawaskar Hombre
## 2  Aisén          Sí                               Mapuche Hombre
## 3  Aisén          Sí No pertenece a ningún pueblo indígena  Mujer
## 4  Aisén          No No pertenece a ningún pueblo indígena  Mujer
## 5  Aisén          Sí No pertenece a ningún pueblo indígena Hombre
##   Promedio del Ingreso Desviación standard      Gini  Año Código
## 1              47386.0                  NA 0.0000000 2006  11201
## 2             206218.9           103383.51 0.2792730 2006  11201
## 3             141209.0           101011.54 0.4004693 2006  11201
## 4              64652.2            41793.76 0.2441928 2006  11201
## 5             221528.5           120760.74 0.3104046 2006  11201

Tomemos el registro 6 que tiene promedio de ingreso “95985.17” y pertenece al año 2015, identifiquemos este registro en nuestra tabla tratada y corroboremos

prueba <- filter(var_YTOTAJ, var_YTOTAJ$Año==2015)
prueba_2 <- filter(prueba,round(prueba$`Promedio del Ingreso`) == 95985)
# prueba_3 <- filter(prueba_2, prueba_2$Sexo == "Mujer")
prueba_2

##   Comuna  Alfabetismo  Etnia  Sexo Promedio del Ingreso Desviación standard
## 1  Huara No, sólo lee Aimara Mujer             95985.17             12101.9
##         Gini  Año Código
## 1 0.04990731 2015  01404

prueba <- filter(nuevas_cat, nuevas_cat$Año==2015)
prueba_2 <- filter(prueba,round(prueba$`Promedio del Ingreso`) == 95985)
# prueba_3 <- filter(prueba_2, prueba_2$Sexo == "Mujer")
prueba_2

##  [1] Alfabetismo          Comuna               Sexo                
##  [4] Promedio del Ingreso Desviación standard  Gini                
##  [7] Año                  Código               categorias_etnicas  
## [10] cat_alfa            
## <0 rows> (or 0-length row.names)

La transformación se realizó exitosamente.

6 Verificación de la exactitud de las magnitudes de los ingresos

En un artículo anterior determinamos las relaciones entre los ingresos de la Casen, después de lo cuál determinamos los 4 más relevantes. Vamos a determinar si los datos que hemos obtenido en nuestras tablas de contingencia se ajustan a ésta lógica.

El ingreso de la ocupación principal debe ser menor pero aproximado al ingreso del trabajo.
El ingreso autónomo debe ser menor al ingreso del trabajo, con un Δ que representaría otro ingreso autónomo.
El ingreso total debe ser mayor al ingreso autónomo con un Δ que representa los subsidios monetarios y otro Δ que representa el alquiler imputado.

Extraigamos una categoría cualquiera y obtengamos sus ingresos asociados en las 4 tablas de contingencia. Vamos a determinar si existe coherencia, la categoría sera Comuna: Arica, Sexo: Mujer, Etnia: Aymara, Alfabetismo: Sí para los 6 años.

ytotaj_et_alf_corr_filtrado <- filter(ytotaj_et_alf_corr, ytotaj_et_alf_corr$Comuna=="Arica")
ytotaj_et_alf_corr_filtrado <- filter(ytotaj_et_alf_corr_filtrado, ytotaj_et_alf_corr_filtrado$categorias_etnicas=="Aymara")
ytotaj_et_alf_corr_filtrado <- filter(ytotaj_et_alf_corr_filtrado, ytotaj_et_alf_corr_filtrado$Sexo=="Mujer")
ytotaj_et_alf_corr_filtrado <- filter(ytotaj_et_alf_corr_filtrado, ytotaj_et_alf_corr_filtrado$cat_alfa =="Sí")
ytotaj_et_alf_corr_filtrado

##   Comuna  Sexo Promedio del Ingreso Desviación standard      Gini  Año Código
## 1  Arica Mujer             113984.6            98619.89 0.4408677 2006  15101
## 2  Arica Mujer             166388.5           146365.85 0.4842500 2009  15101
## 3  Arica Mujer             234034.0           179899.89 0.4185738 2015  15101
## 4  Arica Mujer             245979.1           174997.12 0.3877048 2017  15101
## 5  Arica Mujer             205533.1           168623.44 0.4468356 2011  15101
## 6  Arica Mujer             178993.7           148803.67 0.4495608 2013  15101
##   categorias_etnicas cat_alfa
## 1             Aymara       Sí
## 2             Aymara       Sí
## 3             Aymara       Sí
## 4             Aymara       Sí
## 5             Aymara       Sí
## 6             Aymara       Sí

yautaj_et_alf_corr_filtrado <- filter(yautaj_et_alf_corr, yautaj_et_alf_corr$Comuna=="Arica")
yautaj_et_alf_corr_filtrado <- filter(yautaj_et_alf_corr_filtrado, yautaj_et_alf_corr_filtrado$categorias_etnicas=="Aymara")
yautaj_et_alf_corr_filtrado <- filter(yautaj_et_alf_corr_filtrado, yautaj_et_alf_corr_filtrado$Sexo=="Mujer")
yautaj_et_alf_corr_filtrado <- filter(yautaj_et_alf_corr_filtrado, yautaj_et_alf_corr_filtrado$cat_alfa =="Sí")
yautaj_et_alf_corr_filtrado

##   Comuna  Sexo Promedio del Ingreso Desviación standard      Gini  Año Código
## 1  Arica Mujer             239396.3           169873.34 0.3929191 2009  15101
## 2  Arica Mujer             122382.7            99266.01 0.4109897 2006  15101
## 3  Arica Mujer             280804.6           182229.55 0.3409808 2017  15101
## 4  Arica Mujer             277688.2           189083.31 0.3602626 2015  15101
## 5  Arica Mujer             236582.1           164742.87 0.3780248 2011  15101
## 6  Arica Mujer             208830.1           140816.12 0.3619709 2013  15101
##   categorias_etnicas cat_alfa
## 1             Aymara       Sí
## 2             Aymara       Sí
## 3             Aymara       Sí
## 4             Aymara       Sí
## 5             Aymara       Sí
## 6             Aymara       Sí

yopraj_et_alf_corr_filtrado <- filter(yopraj_et_alf_corr, yopraj_et_alf_corr$Comuna=="Arica")
yopraj_et_alf_corr_filtrado <- filter(yopraj_et_alf_corr_filtrado, yopraj_et_alf_corr_filtrado$categorias_etnicas=="Aymara")
yopraj_et_alf_corr_filtrado <- filter(yopraj_et_alf_corr_filtrado, yopraj_et_alf_corr_filtrado$Sexo=="Mujer")
yopraj_et_alf_corr_filtrado <- filter(yopraj_et_alf_corr_filtrado, yopraj_et_alf_corr_filtrado$cat_alfa =="Sí")
yopraj_et_alf_corr_filtrado

##   Comuna  Sexo Promedio del Ingreso Desviación standard      Gini  Año Código
## 1  Arica Mujer             138700.6            102907.8 0.3757916 2006  15101
## 2  Arica Mujer             244397.6            129615.3 0.2968804 2009  15101
## 3  Arica Mujer             251901.6            176768.0 0.3605212 2015  15101
## 4  Arica Mujer             276547.3            154156.1 0.2933870 2017  15101
## 5  Arica Mujer             242195.9            150715.3 0.3398709 2011  15101
## 6  Arica Mujer             196975.6            123885.9 0.3353414 2013  15101
##   categorias_etnicas cat_alfa
## 1             Aymara       Sí
## 2             Aymara       Sí
## 3             Aymara       Sí
## 4             Aymara       Sí
## 5             Aymara       Sí
## 6             Aymara       Sí

ytrabaj_et_alf_corr_filtrado <- filter(ytrabaj_et_alf_corr, ytrabaj_et_alf_corr$Comuna=="Arica")
ytrabaj_et_alf_corr_filtrado <- filter(ytrabaj_et_alf_corr_filtrado, ytrabaj_et_alf_corr_filtrado$categorias_etnicas=="Aymara")
ytrabaj_et_alf_corr_filtrado <- filter(ytrabaj_et_alf_corr_filtrado, ytrabaj_et_alf_corr_filtrado$Sexo=="Mujer")
ytrabaj_et_alf_corr_filtrado <- filter(ytrabaj_et_alf_corr_filtrado, ytrabaj_et_alf_corr_filtrado$cat_alfa =="Sí")
ytrabaj_et_alf_corr_filtrado

##   Comuna  Sexo Promedio del Ingreso Desviación standard      Gini  Año Código
## 1  Arica Mujer             115751.7            101801.9 0.4464991 2006  15101
## 2  Arica Mujer             246158.5            145090.1 0.3300689 2009  15101
## 3  Arica Mujer             271502.1            197541.5 0.3809748 2015  15101
## 4  Arica Mujer             296280.5            194231.6 0.3424730 2017  15101
## 5  Arica Mujer             253408.5            170344.4 0.3636373 2011  15101
## 6  Arica Mujer             212323.8            145675.8 0.3681491 2013  15101
##   categorias_etnicas cat_alfa
## 1             Aymara       Sí
## 2             Aymara       Sí
## 3             Aymara       Sí
## 4             Aymara       Sí
## 5             Aymara       Sí
## 6             Aymara       Sí

# yopraj_et_alf_corr

ytotaj yautaj yopraj ytrabaj

ytotaj-ytotcor: ingreso total yautaj-yautcor: ingreso autónomo yopraj-yoprcor: ingreso de la ocupacion principal ytrabaj-ytrabajocor: ingreso del trabajo

Se debiesen cumplir las siguientes desigualdades:

El ingreso de la ocupación principal(yopraj-yoprcor) debe ser menor pero aproximado al ingreso del trabajo(ytrabaj-ytrabajocor).

Se confirma en 5 de 6 casos

El ingreso autónomo(yautaj-yautcor) debe ser mayor al ingreso del trabajo(ytrabaj-ytrabajocor). con Δ que representaria otro ingreso autónomo

Se confirma en 5 de 6 casos

El ingreso total(ytotaj-ytotcor) debe ser mayor al ingreso autónomo(yautaj-yautcor) con un Δ que representa los subsidios monetarios y otro Δ que representa el alquiler imputado.

No se cumple.

Es posible que esto sea así producto de los promedios, por que analizaremos los datos en forma individual.

Análisis de un posible error

dataset_2006 <- readRDS(file = "casen_2006_c.rds")
# dataset_2009 <- readRDS(file = "casen_2009_c.rds")
# dataset_2011 <- readRDS(file = "casen_2011_c.rds")
# dataset_2013 <- readRDS(file = "casen_2013_c.rds")
# dataset_2015 <- readRDS(file = "casen_2015_c.rds")
# dataset_2017 <- readRDS(file = "casen_2017_c.rds")

1 Verificacion de I

Es menor el ingreso de la ocupación principal al ingreso del trabajo?

# dataset_2006_ytotaj <- dataset_2006$YTOTAJ
dataset_2006_yopraj <- sum(dataset_2006$YOPRAJ, na.rm = TRUE )
dataset_2006_ytrabaj <- sum(dataset_2006$YTRABAJ, na.rm = TRUE )

dataset_2006_yopraj

## [1] 23466814415

dataset_2006_ytrabaj

## [1] 28966578258

dataset_2006_yopraj < dataset_2006_ytrabaj

## [1] TRUE

Que porcentaje del ingreso del trabajo representa el ingreso de la ocupación principal?

    Porcentaje <- (dataset_2006_yopraj*100)/dataset_2006_ytrabaj
    Porcentaje

## [1] 81.01342

En términos agregados, para el 2006 en ingresos de la ocupación principal representaron el 81,01% de los ingresos del trabajo

2 Verificacion de II

Es el ingreso autónomo del trabajo menor al ingreso del trabajo total?

# dataset_2006_ytotaj <- dataset_2006$YTOTAJ
dataset_2006_ytotaj <- sum(dataset_2006$YTOTAJ, na.rm = TRUE )
dataset_2006_yautaj <- sum(dataset_2006$YAUTAJ, na.rm = TRUE )
dataset_2006_ytotaj > dataset_2006_yautaj

## [1] TRUE

Que porcentaje del ingreso total representan los subsidios monetarios y el alquiler imputado?

    Porcentaje <- (dataset_2006_yautaj*100)/dataset_2006_ytotaj
    100-Porcentaje

## [1] 2.510925

Los subsidios monetarios y el alquiler imputado representaron un 2,51% de los ingresos totales

3 Verificacion de III

Son los ingresos del trabajo menores a los ingresos autónomos?

# El ingreso autónomo debe ser mayor al ingreso del trabajo
dataset_2006_yautaj <- sum(dataset_2006$YAUTAJ, na.rm = TRUE )
dataset_2006_ytrabaj <- sum(dataset_2006$YTRABAJ, na.rm = TRUE )
dataset_2006_yautaj > dataset_2006_ytrabaj

## [1] TRUE

Que porcentaje del ingreso autónomo representa el ingreso del trabajo?

    Porcentaje <- (dataset_2006_ytrabaj*100)/dataset_2006_yautaj
    Porcentaje

## [1] 85.9327

Los ingresos del trabajo representan un 85,93% de los ingresos autónomos

La descomposición de los ingresos que realizamos en trabajo previo es correcto. Pero también llegamos a un resultado sorprendente. En términos agregados el 2,51% de los ingresos de las personas correponden o bien a un subsidio monetario del estado y/o al alquiler imputado de su vivienda

Haremos una sumatoria completa para los registros que obtenemos segun las categorias de nuestras ttcc:

Arica Mujer 113984.6 98619.89 0.4408677 2006 15101 Aymara Sí

dataset_2006_filter <- filter(dataset_2006, dataset_2006$COMUNA=="Arica")
dataset_2006_filter <- filter(dataset_2006_filter, dataset_2006_filter$T4=="Aymara")
dataset_2006_filter <- filter(dataset_2006_filter, dataset_2006_filter$SEXO=="Mujer")
dataset_2006_filter <- filter(dataset_2006_filter, dataset_2006_filter$E1 =="Sí")
# head(dataset_2006_filter,5)

# El ingreso autónomo debe ser mayor al ingreso del trabajo
dataset_2006_yautaj <- sum(dataset_2006_filter$YAUTAJ, na.rm = TRUE )
dataset_2006_ytrabaj <- sum(dataset_2006_filter$YTRABAJ, na.rm = TRUE )
dataset_2006_yautaj > dataset_2006_ytrabaj

## [1] TRUE