Necesitamos que nuestras estimaciones de pobreza obtenidas con cálculos propios desde la Casen coincidan con la información ya publicada.
Hicimos 6 contrastes, en algunos acertamos y en otros no. Para el primero, en el que consideramos la pobreza en Iquique para el 2006, nuestras estimaciones coinciden perfectamente. Éste resultado indica que nuestra metodología de cálculo es correcta, pero que sin embargo, pueden existir errores de nuestra parte (al no considerar correctamente las variables de la Casen referidas a la pobreza o tomando un factor de expansión errado) como también, y eso lo veremos en el quinto y el sexto contraste, posibles errores de calculo de la fuente.
1 El siguiente link nos dirige a un documento oficial que entrega los porcentajes de pobreza comunal en la región de Tarapaca calculados a partir de la Casen del 2006.
Éste nos dice que los porcentajes de pobre e indigencia para la comuna de Iquique al 2006 es:
Pobreza no indigente: 6,2
Indigencia: 1,2
Hagamos nuestros propios cálculos y contrastemos.
2 Cálculo propio de la pobreza por comuna. La identificamos con la variable llamada CORTE en la Casen del 2006, la cual la divide en tres categorías:
Indigente
Pobre no indigente
No pobre
Tomaremos 3 variables de la Casen 2006: comuna, corte, y el factor de expansión.
¿El total poblacional para el calculo de la pobreza es la suma de estas tres categorías expandidas o la proyección que realiza el INE al 2006?, El problema es que la suma de los factores de expansión no da la población comunal exacta. Sin embargo, para el cálculo del porcentaje de pobreza tiene sentido que sea la suma de las tres categorías y asi es como se calcula como veremos ahora.
comuna_1101 <- CASEN_2006_ds[CASEN_2006_ds$COMUNA == 1101,]
# write_xlsx(comuna_1101 ,'comuna_1101.xlsx')
# =SUMIF(B2:B1127;“=1”;C2:C1127)
dataset <- comuna_1101
#colnames(dataset2006)
3 La tabla de contingencia omite automáticamente los NA, que en nuestro dataset original es 1.
cross_tab = xtabs(dataset$EXPC ~ unlist(dataset$COMUNA) + unlist(dataset$CORTE),aggregate(dataset$EXPC ~ unlist(dataset$COMUNA) + unlist(dataset$CORTE),dataset,sum))
tabla <- as.data.frame(cross_tab)
tabla
## unlist.dataset.COMUNA. unlist.dataset.CORTE. Freq
## 1 1101 1 2147
## 2 1101 2 10886
## 3 1101 3 162000
valor <- dataset$CORTE %>% attr('labels')
valor
## Indigente Pobre no indigente No pobre
## 1 2 3
4 Calculemos la pobreza sobre la poblacion considerada como la suma de : Indigente + Pobre no indigente + No pobre
lasuma <- sum(tabla$Freq)
lasuma
## [1] 175033
5.1 Porcentaje de Pobre no indigente:
100*10886/175033
## [1] 6.219399
5.2 Porcentaje de Indigencia:
100*2147/175033
## [1] 1.226626
Coincide.
Estimación para Áreas Pequeñas (SAE)
Pobreza en Santa Cruz 2011
Casen 2011
# CASEN_2011 <- read_sav("casen2011_octubre2011_enero2012_principal_08032013spss.sav")
# saveRDS(CASEN_2011, "CASEN_2011.rds")
CASEN_2011_ds <- readRDS("CASEN_2011.rds")
Codigo de Santa Cruz
valor <- CASEN_2011_ds$comuna %>% attr('labels')
# valor
6310
# colnames(CASEN_2011)
comuna_6310 <- CASEN_2011_ds[CASEN_2011_ds$comuna == 6310,]
#write_xlsx(comuna_1101 ,'comuna_1101.xlsx')
dataset <- comuna_6310
#colnames(dataset2006)
La tabla de contingencia omite automaticamente los NA, que en nuyestro dataset originale es 1.
cross_tab = xtabs(dataset$expc_full ~ unlist(dataset$comuna) + unlist(dataset$corte),aggregate(dataset$expc_full ~ unlist(dataset$comuna) + unlist(dataset$corte),dataset,sum))
tabla <- as.data.frame(cross_tab)
tabla
## unlist.dataset.comuna. unlist.dataset.corte. Freq
## 1 6310 1 706
## 2 6310 2 3799
## 3 6310 3 31576
valor <- CASEN_2011_ds$corte %>% attr('labels')
valor
## Pobreza extrema Pobre No pobre
## 1 2 3
3 Calculemos la pobreza sobre la poblacion considerada como la suma de : Pobreza extrema Pobre No pobre
lasuma <- sum(tabla$Freq)
lasuma
## [1] 36081
Porcentaje de Pobreza extrema:
100*706/36081
## [1] 1.956709
Porcentaje de Pobres:
100*3799/36081
## [1] 10.52909
100*706/36081 + 100*3799/36081
## [1] 12.4858
Si consideramos que estan tomando sólo a los Pobres, Coincide (difiere en 7 centésimas]).
# colnames(CASEN_2009_ds)
Codigo de Santa Cruz
valor <- CASEN_2009_ds$COMUNA %>% attr('labels')
# valor
6310
comuna_6310 <- CASEN_2009_ds[CASEN_2009_ds$COMUNA == 6310,]
#write_xlsx(comuna_1101 ,'comuna_1101.xlsx')
dataset <- comuna_6310
# colnames(dataset)
cross_tab = xtabs(dataset$EXPC ~ unlist(dataset$COMUNA) + unlist(dataset$CORTE),aggregate(dataset$EXPC ~ unlist(dataset$COMUNA) + unlist(dataset$CORTE),dataset,sum))
tabla <- as.data.frame(cross_tab)
tabla
## unlist.dataset.COMUNA. unlist.dataset.CORTE. Freq
## 1 6310 1 459
## 2 6310 2 6125
## 3 6310 3 29013
valor <- dataset$CORTE %>% attr('labels')
valor
## Indigente Pobre no Indigente No pobre
## 1 2 3
3 Calculemos la pobreza sobre la poblacion considerada como la suma de : Indigente Pobre no Indigente No pobre
lasuma <- sum(tabla$Freq)
lasuma
## [1] 35597
Porcentaje de Indigente:
100*459 /35597
## [1] 1.289435
Porcentaje de Pobre no Indigente:
100*6125/35597
## [1] 17.20651
100*459 /35597 + 100*6125/35597
## [1] 18.49594
No coincide.
Valdivia 2013: nueva metodologia. pobreza_MN CASEN_2013_MN_B_Principal
Codigo de Valdivia
valor <- CASEN_2013_ds$comuna %>% attr('labels')
# valor
14101
#colnames(CASEN_2013)
comuna_14101 <- CASEN_2013_ds[CASEN_2013_ds$comuna == 14101,]
dataset <- comuna_14101
#colnames(dataset2006)
cross_tab = xtabs(dataset$expc ~ unlist(dataset$comuna) + unlist(dataset$pobreza_MN),aggregate(dataset$expc ~ unlist(dataset$comuna) + unlist(dataset$pobreza_MN),dataset,sum))
tabla <- as.data.frame(cross_tab)
tabla
## unlist.dataset.comuna. unlist.dataset.pobreza_MN. Freq
## 1 14101 1 7920
## 2 14101 2 14814
## 3 14101 3 136846
valor <- dataset$pobreza_MN %>% attr('labels')
valor
## Pobres extremos Pobres no extremos No pobres
## 1 2 3
3 Calculemos la pobreza sobre la poblacion considerada como la suma de : Pobres extremos Pobres no extremos No pobres
lasuma <- sum(tabla$Freq)
lasuma
## [1] 159580
Porcentaje de Pobres extremos:
100*7920/159580
## [1] 4.963028
Porcentaje de Pobres no extremos:
100*14814/159580
## [1] 9.283118
100*7920/159580 + 100*14814/159580
## [1] 14.24615
Si consideramos que como % de Personas en Situacion de Pobreza por Ingresos consideran a los pobres extremos y a los pobres no extremos, Coincide? (difiere en 4 décimas).
Caption for the picture.
# colnames(CASEN_2011_ds)
Codigo de Salamanca
valor <- CASEN_2011_ds$comuna %>% attr('labels')
# valor
4204
comuna_4204 <- CASEN_2011_ds[CASEN_2011_ds$comuna == 4204,]
dataset <- comuna_4204
#dataset
#write_xlsx(dataset ,'salamanca_2011.xlsx')
cross_tab = xtabs(dataset$expc_full ~ unlist(dataset$comuna) + unlist(dataset$corte),aggregate(dataset$expc_full ~ unlist(dataset$comuna) + unlist(dataset$corte),dataset,sum))
tabla <- as.data.frame(cross_tab)
tabla
## unlist.dataset.comuna. unlist.dataset.corte. Freq
## 1 4204 1 929
## 2 4204 2 2415
## 3 4204 3 19973
valor <- dataset$corte %>% attr('labels')
valor
## Pobreza extrema Pobre No pobre
## 1 2 3
3 Calculemos la pobreza sobre la poblacion considerada como la suma de : Pobreza extrema Pobre No pobre
lasuma <- sum(tabla$Freq)
lasuma
## [1] 23317
Porcentaje de Pobres extremos:
100*929/23317
## [1] 3.984218
Porcentaje de Pobres:
100*2415/23317
## [1] 10.35725
100*4604/156668 + 100*21548/156668
## [1] 16.69262
Haciendo el cálculo en Excel llegamos a lo mismo:
Pobreza en Salamanca 2011
Pobreza en Salamanca 2011
Esto no calza por ningún lado, siendo sospechosos los datos oficiales. La nueva metodología de medición de pobreza del 2013 es más exigente, lo que daría cuenta de un leve aumento de la pobreza al ser aplicada, sin embargo vemos que para Salamanca, la tasa de pobreza bajó de un 43,43 a un 19,09 en sólo dos años, lo que no es posible..
CASEN_2013_ds <- readRDS("CASEN_2013.rds")
#colnames(CASEN_2013)
comuna_4204 <- CASEN_2013_ds[CASEN_2013_ds$comuna == 4204,]
dataset <- comuna_4204
#colnames(dataset2006)
cross_tab = xtabs(dataset$expc ~ unlist(dataset$comuna) + unlist(dataset$pobreza_MN),aggregate(dataset$expc ~ unlist(dataset$comuna) + unlist(dataset$pobreza_MN),dataset,sum))
tabla <- as.data.frame(cross_tab)
tabla
## unlist.dataset.comuna. unlist.dataset.pobreza_MN. Freq
## 1 4204 1 1062
## 2 4204 2 3711
## 3 4204 3 18590
valor <- CASEN_2013_ds$pobreza_MN %>% attr('labels')
valor
## Pobres extremos Pobres no extremos No pobres
## 1 2 3
3 Calculemos la pobreza sobre la poblacion considerada como la suma de : Pobres extremos Pobres no extremos No pobres
lasuma <- sum(tabla$Freq)
lasuma
## [1] 23363
Porcentaje de Pobres extremos:
100*1062/23363
## [1] 4.545649
Porcentaje de Pobres no extremos:
100*3711/23363
## [1] 15.88409
Suma del porcentaje de Pobres extremos y el porcentaje de Pobres no extremos:
100*1062/23363 + 100*3711/23363
## [1] 20.42974
Si consideramos que como % de Personas en Situacion de Pobreza por Ingresos consideran a los pobres extremos y a los pobres no extremos, Coincide? (difiere en 1,3 puntos).