Introducción

Necesitamos que nuestras estimaciones de pobreza obtenidas con cálculos propios desde la Casen coincidan con la información ya publicada.

Hicimos 6 contrastes, en algunos acertamos y en otros no. Para el primero, en el que consideramos la pobreza en Iquique para el 2006, nuestras estimaciones coinciden perfectamente. Éste resultado indica que nuestra metodología de cálculo es correcta, pero que sin embargo, pueden existir errores de nuestra parte (al no considerar correctamente las variables de la Casen referidas a la pobreza o tomando un factor de expansión errado) como también, y eso lo veremos en el quinto y el sexto contraste, posibles errores de calculo de la fuente.

Primer contraste: Iquique 2006

1 El siguiente link nos dirige a un documento oficial que entrega los porcentajes de pobreza comunal en la región de Tarapaca calculados a partir de la Casen del 2006.

ir al documento

Éste nos dice que los porcentajes de pobre e indigencia para la comuna de Iquique al 2006 es:

Pobreza no indigente: 6,2

Indigencia: 1,2

Hagamos nuestros propios cálculos y contrastemos.

2 Cálculo propio de la pobreza por comuna. La identificamos con la variable llamada CORTE en la Casen del 2006, la cual la divide en tres categorías:

Indigente

Pobre no indigente

No pobre

Tomaremos 3 variables de la Casen 2006: comuna, corte, y el factor de expansión.

¿El total poblacional para el calculo de la pobreza es la suma de estas tres categorías expandidas o la proyección que realiza el INE al 2006?, El problema es que la suma de los factores de expansión no da la población comunal exacta. Sin embargo, para el cálculo del porcentaje de pobreza tiene sentido que sea la suma de las tres categorías y asi es como se calcula como veremos ahora.

comuna_1101 <- CASEN_2006_ds[CASEN_2006_ds$COMUNA == 1101,]
# write_xlsx(comuna_1101 ,'comuna_1101.xlsx')
# =SUMIF(B2:B1127;“=1”;C2:C1127)
dataset <- comuna_1101
#colnames(dataset2006)

3 La tabla de contingencia omite automáticamente los NA, que en nuestro dataset original es 1.

cross_tab = xtabs(dataset$EXPC ~ unlist(dataset$COMUNA) + unlist(dataset$CORTE),aggregate(dataset$EXPC ~ unlist(dataset$COMUNA) + unlist(dataset$CORTE),dataset,sum))
tabla <- as.data.frame(cross_tab)
tabla
##   unlist.dataset.COMUNA. unlist.dataset.CORTE.   Freq
## 1                   1101                     1   2147
## 2                   1101                     2  10886
## 3                   1101                     3 162000
valor <-  dataset$CORTE %>% attr('labels')
valor
##          Indigente Pobre no indigente           No pobre 
##                  1                  2                  3

4 Calculemos la pobreza sobre la poblacion considerada como la suma de : Indigente + Pobre no indigente + No pobre

lasuma <- sum(tabla$Freq)
lasuma
## [1] 175033

5.1 Porcentaje de Pobre no indigente:

100*10886/175033
## [1] 6.219399

5.2 Porcentaje de Indigencia:

100*2147/175033
## [1] 1.226626

Coincide.

Segundo contraste: Santa Cruz 2011

Estimación para Áreas Pequeñas (SAE)

ir al documento

Pobreza en Santa Cruz 2011

Casen 2011

# CASEN_2011 <- read_sav("casen2011_octubre2011_enero2012_principal_08032013spss.sav")
# saveRDS(CASEN_2011, "CASEN_2011.rds") 
CASEN_2011_ds <- readRDS("CASEN_2011.rds")

Codigo de Santa Cruz

valor <-  CASEN_2011_ds$comuna %>% attr('labels')
# valor

6310

# colnames(CASEN_2011)
comuna_6310 <- CASEN_2011_ds[CASEN_2011_ds$comuna == 6310,]
#write_xlsx(comuna_1101 ,'comuna_1101.xlsx')
dataset <- comuna_6310
#colnames(dataset2006)

La tabla de contingencia omite automaticamente los NA, que en nuyestro dataset originale es 1.

cross_tab = xtabs(dataset$expc_full ~ unlist(dataset$comuna) + unlist(dataset$corte),aggregate(dataset$expc_full ~ unlist(dataset$comuna) + unlist(dataset$corte),dataset,sum))
tabla <- as.data.frame(cross_tab)
tabla
##   unlist.dataset.comuna. unlist.dataset.corte.  Freq
## 1                   6310                     1   706
## 2                   6310                     2  3799
## 3                   6310                     3 31576
valor <-  CASEN_2011_ds$corte %>% attr('labels')
valor
## Pobreza extrema           Pobre        No pobre 
##               1               2               3

3 Calculemos la pobreza sobre la poblacion considerada como la suma de : Pobreza extrema Pobre No pobre

lasuma <- sum(tabla$Freq)
lasuma
## [1] 36081

Porcentaje de Pobreza extrema:

100*706/36081
## [1] 1.956709

Porcentaje de Pobres:

100*3799/36081
## [1] 10.52909
100*706/36081 + 100*3799/36081
## [1] 12.4858

Si consideramos que estan tomando sólo a los Pobres, Coincide (difiere en 7 centésimas]).

Tercer contraste: Santa Cruz 2009

# colnames(CASEN_2009_ds)

Codigo de Santa Cruz

valor <-  CASEN_2009_ds$COMUNA %>% attr('labels')
# valor

6310

comuna_6310 <- CASEN_2009_ds[CASEN_2009_ds$COMUNA == 6310,]
#write_xlsx(comuna_1101 ,'comuna_1101.xlsx')
dataset <- comuna_6310
# colnames(dataset)
cross_tab = xtabs(dataset$EXPC ~ unlist(dataset$COMUNA) + unlist(dataset$CORTE),aggregate(dataset$EXPC ~ unlist(dataset$COMUNA) + unlist(dataset$CORTE),dataset,sum))
tabla <- as.data.frame(cross_tab)
tabla
##   unlist.dataset.COMUNA. unlist.dataset.CORTE.  Freq
## 1                   6310                     1   459
## 2                   6310                     2  6125
## 3                   6310                     3 29013
valor <-  dataset$CORTE %>% attr('labels')
valor
##          Indigente Pobre no Indigente           No pobre 
##                  1                  2                  3

3 Calculemos la pobreza sobre la poblacion considerada como la suma de : Indigente Pobre no Indigente No pobre

lasuma <- sum(tabla$Freq)
lasuma
## [1] 35597

Porcentaje de Indigente:

100*459 /35597
## [1] 1.289435

Porcentaje de Pobre no Indigente:

100*6125/35597
## [1] 17.20651
100*459 /35597 + 100*6125/35597
## [1] 18.49594

No coincide.

Cuarto contraste: Valdivia 2013

ir al documento

Valdivia 2013: nueva metodologia. pobreza_MN CASEN_2013_MN_B_Principal

Codigo de Valdivia

valor <-  CASEN_2013_ds$comuna %>% attr('labels')
# valor

14101

#colnames(CASEN_2013)

comuna_14101 <- CASEN_2013_ds[CASEN_2013_ds$comuna == 14101,]
dataset <- comuna_14101
#colnames(dataset2006)

cross_tab = xtabs(dataset$expc ~ unlist(dataset$comuna) + unlist(dataset$pobreza_MN),aggregate(dataset$expc ~ unlist(dataset$comuna) + unlist(dataset$pobreza_MN),dataset,sum))
tabla <- as.data.frame(cross_tab)
tabla
##   unlist.dataset.comuna. unlist.dataset.pobreza_MN.   Freq
## 1                  14101                          1   7920
## 2                  14101                          2  14814
## 3                  14101                          3 136846
valor <-  dataset$pobreza_MN %>% attr('labels')
valor
##    Pobres extremos Pobres no extremos          No pobres 
##                  1                  2                  3

3 Calculemos la pobreza sobre la poblacion considerada como la suma de : Pobres extremos Pobres no extremos No pobres

lasuma <- sum(tabla$Freq)
lasuma
## [1] 159580

Porcentaje de Pobres extremos:

100*7920/159580
## [1] 4.963028

Porcentaje de Pobres no extremos:

100*14814/159580
## [1] 9.283118
100*7920/159580 + 100*14814/159580
## [1] 14.24615

Si consideramos que como % de Personas en Situacion de Pobreza por Ingresos consideran a los pobres extremos y a los pobres no extremos, Coincide? (difiere en 4 décimas).

Quinto contraste: Salamanca 2011

ir al documento

Caption for the picture.

# colnames(CASEN_2011_ds)

Codigo de Salamanca

valor <- CASEN_2011_ds$comuna %>% attr('labels')
# valor

4204

comuna_4204 <- CASEN_2011_ds[CASEN_2011_ds$comuna == 4204,]
dataset <- comuna_4204
#dataset
#write_xlsx(dataset ,'salamanca_2011.xlsx')
cross_tab = xtabs(dataset$expc_full ~ unlist(dataset$comuna) + unlist(dataset$corte),aggregate(dataset$expc_full ~ unlist(dataset$comuna) + unlist(dataset$corte),dataset,sum))
tabla <- as.data.frame(cross_tab)
tabla
##   unlist.dataset.comuna. unlist.dataset.corte.  Freq
## 1                   4204                     1   929
## 2                   4204                     2  2415
## 3                   4204                     3 19973
valor <-  dataset$corte %>% attr('labels')
valor
## Pobreza extrema           Pobre        No pobre 
##               1               2               3

3 Calculemos la pobreza sobre la poblacion considerada como la suma de : Pobreza extrema Pobre No pobre

lasuma <- sum(tabla$Freq)
lasuma
## [1] 23317

Porcentaje de Pobres extremos:

100*929/23317
## [1] 3.984218

Porcentaje de Pobres:

100*2415/23317
## [1] 10.35725
100*4604/156668 + 100*21548/156668
## [1] 16.69262

Haciendo el cálculo en Excel llegamos a lo mismo:

Pobreza en Salamanca 2011

Pobreza en Salamanca 2011

Esto no calza por ningún lado, siendo sospechosos los datos oficiales. La nueva metodología de medición de pobreza del 2013 es más exigente, lo que daría cuenta de un leve aumento de la pobreza al ser aplicada, sin embargo vemos que para Salamanca, la tasa de pobreza bajó de un 43,43 a un 19,09 en sólo dos años, lo que no es posible..

Sexto contraste: Salamanca 2013

CASEN_2013_ds <- readRDS("CASEN_2013.rds")
#colnames(CASEN_2013)

comuna_4204 <- CASEN_2013_ds[CASEN_2013_ds$comuna == 4204,]
dataset <- comuna_4204
#colnames(dataset2006)

cross_tab = xtabs(dataset$expc ~ unlist(dataset$comuna) + unlist(dataset$pobreza_MN),aggregate(dataset$expc ~ unlist(dataset$comuna) + unlist(dataset$pobreza_MN),dataset,sum))
tabla <- as.data.frame(cross_tab)
tabla
##   unlist.dataset.comuna. unlist.dataset.pobreza_MN.  Freq
## 1                   4204                          1  1062
## 2                   4204                          2  3711
## 3                   4204                          3 18590
valor <-  CASEN_2013_ds$pobreza_MN %>% attr('labels')
valor
##    Pobres extremos Pobres no extremos          No pobres 
##                  1                  2                  3

3 Calculemos la pobreza sobre la poblacion considerada como la suma de : Pobres extremos Pobres no extremos No pobres

lasuma <- sum(tabla$Freq)
lasuma
## [1] 23363

Porcentaje de Pobres extremos:

100*1062/23363
## [1] 4.545649

Porcentaje de Pobres no extremos:

100*3711/23363
## [1] 15.88409

Suma del porcentaje de Pobres extremos y el porcentaje de Pobres no extremos:

100*1062/23363 + 100*3711/23363
## [1] 20.42974

Si consideramos que como % de Personas en Situacion de Pobreza por Ingresos consideran a los pobres extremos y a los pobres no extremos, Coincide? (difiere en 1,3 puntos).