Cálculo propio del porcentaje de pobreza desde la encuesta Casen y su contraste con lo ya publicado.

Introducción

Necesitamos que nuestras estimaciones de pobreza obtenidas con cálculos propios desde la Casen coincidan con la información ya publicada.

Hicimos 6 contrastes, en algunos acertamos y en otros no. Para el primero, en el que consideramos la pobreza en Iquique para el 2006, nuestras estimaciones coinciden perfectamente. Éste resultado indica que nuestra metodología de cálculo es correcta, pero que sin embargo, pueden existir errores de nuestra parte (al no considerar correctamente las variables de la Casen referidas a la pobreza o tomando un factor de expansión errado) como también, y eso lo veremos en el quinto y el sexto contraste, posibles errores de calculo de la fuente.

Primer contraste: Iquique 2006

1 El siguiente link nos dirige a un documento oficial que entrega los porcentajes de pobreza comunal en la región de Tarapaca calculados a partir de la Casen del 2006.

ir al documento

Éste nos dice que los porcentajes de pobre e indigencia para la comuna de Iquique al 2006 es:

Pobreza no indigente: 6,2

Indigencia: 1,2

Hagamos nuestros propios cálculos y contrastemos.

2 Cálculo propio de la pobreza por comuna. La identificamos con la variable llamada CORTE en la Casen del 2006, la cual la divide en tres categorías:

Indigente

Pobre no indigente

No pobre

Tomaremos 3 variables de la Casen 2006: comuna, corte, y el factor de expansión.

¿El total poblacional para el calculo de la pobreza es la suma de estas tres categorías expandidas o la proyección que realiza el INE al 2006?, El problema es que la suma de los factores de expansión no da la población comunal exacta. Sin embargo, para el cálculo del porcentaje de pobreza tiene sentido que sea la suma de las tres categorías y asi es como se calcula como veremos ahora.

comuna_1101 <- CASEN_2006_ds[CASEN_2006_ds$COMUNA == 1101,]
# write_xlsx(comuna_1101 ,'comuna_1101.xlsx')
# =SUMIF(B2:B1127;“=1”;C2:C1127)
dataset <- comuna_1101
#colnames(dataset2006)

3 La tabla de contingencia omite automáticamente los NA, que en nuestro dataset original es 1.

cross_tab = xtabs(dataset$EXPC ~ unlist(dataset$COMUNA) + unlist(dataset$CORTE),aggregate(dataset$EXPC ~ unlist(dataset$COMUNA) + unlist(dataset$CORTE),dataset,sum))
tabla <- as.data.frame(cross_tab)
tabla

##   unlist.dataset.COMUNA. unlist.dataset.CORTE.   Freq
## 1                   1101                     1   2147
## 2                   1101                     2  10886
## 3                   1101                     3 162000

valor <-  dataset$CORTE %>% attr('labels')
valor

##          Indigente Pobre no indigente           No pobre 
##                  1                  2                  3

4 Calculemos la pobreza sobre la poblacion considerada como la suma de : Indigente + Pobre no indigente + No pobre

lasuma <- sum(tabla$Freq)
lasuma

## [1] 175033

5.1 Porcentaje de Pobre no indigente:

100*10886/175033

## [1] 6.219399

5.2 Porcentaje de Indigencia:

100*2147/175033

## [1] 1.226626

Coincide.

Segundo contraste: Santa Cruz 2011

Estimación para Áreas Pequeñas (SAE)

ir al documento

Pobreza en Santa Cruz 2011

Casen 2011

# CASEN_2011 <- read_sav("casen2011_octubre2011_enero2012_principal_08032013spss.sav")
# saveRDS(CASEN_2011, "CASEN_2011.rds") 
CASEN_2011_ds <- readRDS("CASEN_2011.rds")

Codigo de Santa Cruz

valor <-  CASEN_2011_ds$comuna %>% attr('labels')
# valor

6310

# colnames(CASEN_2011)

comuna_6310 <- CASEN_2011_ds[CASEN_2011_ds$comuna == 6310,]
#write_xlsx(comuna_1101 ,'comuna_1101.xlsx')
dataset <- comuna_6310
#colnames(dataset2006)

La tabla de contingencia omite automaticamente los NA, que en nuyestro dataset originale es 1.

cross_tab = xtabs(dataset$expc_full ~ unlist(dataset$comuna) + unlist(dataset$corte),aggregate(dataset$expc_full ~ unlist(dataset$comuna) + unlist(dataset$corte),dataset,sum))
tabla <- as.data.frame(cross_tab)
tabla

##   unlist.dataset.comuna. unlist.dataset.corte.  Freq
## 1                   6310                     1   706
## 2                   6310                     2  3799
## 3                   6310                     3 31576

valor <-  CASEN_2011_ds$corte %>% attr('labels')
valor

## Pobreza extrema           Pobre        No pobre 
##               1               2               3

3 Calculemos la pobreza sobre la poblacion considerada como la suma de : Pobreza extrema Pobre No pobre

lasuma <- sum(tabla$Freq)
lasuma

## [1] 36081

Porcentaje de Pobreza extrema:

100*706/36081

## [1] 1.956709

Porcentaje de Pobres:

100*3799/36081

## [1] 10.52909

100*706/36081 + 100*3799/36081

## [1] 12.4858

Si consideramos que estan tomando sólo a los Pobres, Coincide (difiere en 7 centésimas]).

Tercer contraste: Santa Cruz 2009

# colnames(CASEN_2009_ds)

Codigo de Santa Cruz

valor <-  CASEN_2009_ds$COMUNA %>% attr('labels')
# valor

6310

comuna_6310 <- CASEN_2009_ds[CASEN_2009_ds$COMUNA == 6310,]
#write_xlsx(comuna_1101 ,'comuna_1101.xlsx')
dataset <- comuna_6310
# colnames(dataset)

cross_tab = xtabs(dataset$EXPC ~ unlist(dataset$COMUNA) + unlist(dataset$CORTE),aggregate(dataset$EXPC ~ unlist(dataset$COMUNA) + unlist(dataset$CORTE),dataset,sum))
tabla <- as.data.frame(cross_tab)
tabla

##   unlist.dataset.COMUNA. unlist.dataset.CORTE.  Freq
## 1                   6310                     1   459
## 2                   6310                     2  6125
## 3                   6310                     3 29013

valor <-  dataset$CORTE %>% attr('labels')
valor

##          Indigente Pobre no Indigente           No pobre 
##                  1                  2                  3

3 Calculemos la pobreza sobre la poblacion considerada como la suma de : Indigente Pobre no Indigente No pobre

lasuma <- sum(tabla$Freq)
lasuma

## [1] 35597

Porcentaje de Indigente:

100*459 /35597

## [1] 1.289435

Porcentaje de Pobre no Indigente:

100*6125/35597

## [1] 17.20651

100*459 /35597 + 100*6125/35597

## [1] 18.49594

No coincide.

Cuarto contraste: Valdivia 2013

ir al documento

Valdivia 2013: nueva metodologia. pobreza_MN CASEN_2013_MN_B_Principal

Codigo de Valdivia

valor <-  CASEN_2013_ds$comuna %>% attr('labels')
# valor

14101

#colnames(CASEN_2013)

comuna_14101 <- CASEN_2013_ds[CASEN_2013_ds$comuna == 14101,]
dataset <- comuna_14101

#colnames(dataset2006)

cross_tab = xtabs(dataset$expc ~ unlist(dataset$comuna) + unlist(dataset$pobreza_MN),aggregate(dataset$expc ~ unlist(dataset$comuna) + unlist(dataset$pobreza_MN),dataset,sum))
tabla <- as.data.frame(cross_tab)
tabla

##   unlist.dataset.comuna. unlist.dataset.pobreza_MN.   Freq
## 1                  14101                          1   7920
## 2                  14101                          2  14814
## 3                  14101                          3 136846

valor <-  dataset$pobreza_MN %>% attr('labels')
valor

##    Pobres extremos Pobres no extremos          No pobres 
##                  1                  2                  3

3 Calculemos la pobreza sobre la poblacion considerada como la suma de : Pobres extremos Pobres no extremos No pobres

lasuma <- sum(tabla$Freq)
lasuma

## [1] 159580

Porcentaje de Pobres extremos:

100*7920/159580

## [1] 4.963028

Porcentaje de Pobres no extremos:

100*14814/159580

## [1] 9.283118

100*7920/159580 + 100*14814/159580

## [1] 14.24615

Si consideramos que como % de Personas en Situacion de Pobreza por Ingresos consideran a los pobres extremos y a los pobres no extremos, Coincide? (difiere en 4 décimas).

Quinto contraste: Salamanca 2011

ir al documento

Caption for the picture.

# colnames(CASEN_2011_ds)

Codigo de Salamanca

valor <- CASEN_2011_ds$comuna %>% attr('labels')
# valor

4204

comuna_4204 <- CASEN_2011_ds[CASEN_2011_ds$comuna == 4204,]
dataset <- comuna_4204
#dataset
#write_xlsx(dataset ,'salamanca_2011.xlsx')

cross_tab = xtabs(dataset$expc_full ~ unlist(dataset$comuna) + unlist(dataset$corte),aggregate(dataset$expc_full ~ unlist(dataset$comuna) + unlist(dataset$corte),dataset,sum))
tabla <- as.data.frame(cross_tab)
tabla

##   unlist.dataset.comuna. unlist.dataset.corte.  Freq
## 1                   4204                     1   929
## 2                   4204                     2  2415
## 3                   4204                     3 19973

valor <-  dataset$corte %>% attr('labels')
valor

## Pobreza extrema           Pobre        No pobre 
##               1               2               3

3 Calculemos la pobreza sobre la poblacion considerada como la suma de : Pobreza extrema Pobre No pobre

lasuma <- sum(tabla$Freq)
lasuma

## [1] 23317

Porcentaje de Pobres extremos:

100*929/23317

## [1] 3.984218

Porcentaje de Pobres:

100*2415/23317

## [1] 10.35725

100*4604/156668 + 100*21548/156668

## [1] 16.69262

Haciendo el cálculo en Excel llegamos a lo mismo:

Pobreza en Salamanca 2011

Esto no calza por ningún lado, siendo sospechosos los datos oficiales. La nueva metodología de medición de pobreza del 2013 es más exigente, lo que daría cuenta de un leve aumento de la pobreza al ser aplicada, sin embargo vemos que para Salamanca, la tasa de pobreza bajó de un 43,43 a un 19,09 en sólo dos años, lo que no es posible..

Sexto contraste: Salamanca 2013

CASEN_2013_ds <- readRDS("CASEN_2013.rds")

#colnames(CASEN_2013)

comuna_4204 <- CASEN_2013_ds[CASEN_2013_ds$comuna == 4204,]
dataset <- comuna_4204

#colnames(dataset2006)

cross_tab = xtabs(dataset$expc ~ unlist(dataset$comuna) + unlist(dataset$pobreza_MN),aggregate(dataset$expc ~ unlist(dataset$comuna) + unlist(dataset$pobreza_MN),dataset,sum))
tabla <- as.data.frame(cross_tab)
tabla

##   unlist.dataset.comuna. unlist.dataset.pobreza_MN.  Freq
## 1                   4204                          1  1062
## 2                   4204                          2  3711
## 3                   4204                          3 18590

valor <-  CASEN_2013_ds$pobreza_MN %>% attr('labels')
valor

##    Pobres extremos Pobres no extremos          No pobres 
##                  1                  2                  3

3 Calculemos la pobreza sobre la poblacion considerada como la suma de : Pobres extremos Pobres no extremos No pobres

lasuma <- sum(tabla$Freq)
lasuma

## [1] 23363

Porcentaje de Pobres extremos:

100*1062/23363

## [1] 4.545649

Porcentaje de Pobres no extremos:

100*3711/23363

## [1] 15.88409

Suma del porcentaje de Pobres extremos y el porcentaje de Pobres no extremos:

100*1062/23363 + 100*3711/23363

## [1] 20.42974

Si consideramos que como % de Personas en Situacion de Pobreza por Ingresos consideran a los pobres extremos y a los pobres no extremos, Coincide? (difiere en 1,3 puntos).

Cálculo propio del porcentaje de pobreza desde la encuesta Casen y su contraste con lo ya publicado.

Víctor Enamorado - Christian Castro. DI

23-12-2020

Introducción

Primer contraste: Iquique 2006

Segundo contraste: Santa Cruz 2011

Tercer contraste: Santa Cruz 2009

Cuarto contraste: Valdivia 2013

Quinto contraste: Salamanca 2011

Sexto contraste: Salamanca 2013