¿Cómo mide la pobreza en Chile la Casen?

Aplicación al caso de la Casen 2015 por sus factores de expansión comunales ausentes.

Víctor Enamorado - Christian Castro

DataIntelligence-Chile

28-12-2020

Abstract

En un trabajo previo (ir al documento: “Propuesta de solución a la ausencia de factores de expansión comunales en 185 comunas de la Casen 2015”), propusimos una solución al problema de los factores de expansión ausentes en la Casen del 2015 (una investigación posterior nos reveló que para éstas 185 comunas no se buscó contar con representatividad estadística en la Casen 2015, siendo reemplazados los factores de expansión por una estimación SAE (Small Areas Estimation) cuyos detalles nos son inaccesibles). Sobre ésta base de datos ya corregida, calcularemos nuestro propio porcentaje de pobreza para Chile el 2015 y veremos que un resultado difiere en dos décimas de los resultados oficiales y el otro en una. Calcularemos el porcentaje de pobreza para una comuna que no posee factor de expansión y veremos que el resultado cae dentro de los límites de error para la pobreza estimada con SAE y veremos que para Iquique nuestra estimación coincide con el dato oficial. Revisaremos una definición conceptual de qué es la pobreza y cómo intenta medirla la Casen en sus seis versiones desde el 2006, y concluiremos con gráficos que relacionan algunas variables relevantes con el decil de ingreso al que pertenecen las personas.

1 Aspectos conceptuales

La metodología de estimación de la Pobreza y la actualización del 2013.

Desde la década de 1980 y hasta la actualidad, en Chile la medición de la situación de pobreza de los hogares se ha realizado utilizando una metodología basada en ingresos. Según ésta, un hogar se ha considerado en situación de pobreza extrema si sus ingresos totales per cápita mensuales no son suficientes para financiar el valor de la denominada canasta de necesidades básicas alimentarias (NBA). En esta metodología tradicional, el valor de la NBA es la línea de pobreza extrema o indigencia. En tanto, se entiende que el hogar está en situación de pobreza si sus ingresos totales per cápita mensuales no le permiten cubrir sus necesidades básicas alimentarias y no alimentarias (el valor de la canasta básica alimentaria y no alimentaria es la línea de pobreza).

La composición de la canasta básica alimentaria de la Metodología Tradicional de medición de pobreza fue definida sobre la base de los patrones de consumo de los hogares, registrados en la Encuesta de Presupuestos Familiares 1986-1987 del Instituto Nacional de Estadísticas (INE).

Los ingresos de los hogares han sido estimados utilizando los datos de la Encuesta de Caracterización Socioeconómica Nacional (Casen), de responsabilidad del Ministerio de Desarrollo Social (ex Ministerio de Planificación).

En el periodo 1987-2011 los datos de ingreso utilizados para la estimación de la tasa de pobreza han sido validados, corregidos por no respuesta y ajustados a Cuentas Nacionales por la Comisión Económica para América Latina y el Caribe (CEPAL). Adicionalmente, CEPAL tradicionalmente ha validado y editado los subsidios monetarios de monto fijo que no han sido declarados con exactitud por los encuestados.

El año 2013 se preparó e implementó el levantamiento de la encuesta Casen 2013. Como parte de este proceso, se ha llevado a cabo una actualización y perfeccionamiento de la metodología de medición de la pobreza.

Pobreza absoluta versus pobreza relativa

Los indicadores de pobreza y pobreza extrema estimados por Ministerio de Desarrollo Social a partir de la información de la Encuesta Casen utilizan el método de ingresos o indirecto. La utilización de esta misma metodología desde 1987 ha permitido la construcción de indicadores comparables a lo largo del tiempo, haciendo posible de esta manera evaluar su evolución. Además, su amplia aplicación a nivel internacional, permite la comparación de la situación nacional con la de otros países.

Este método, al igual que el método directo o de necesidades básicas insatisfechas, NBI, mide pobreza y pobreza extrema en términos absolutos. Esto es, los límites entre quiénes son pobres o indigentes y quiénes no lo son se definen en relación a mínimos de satisfacción de necesidades básicas, en el caso de la pobreza, o alimentarias, en el caso de la pobreza extrema.

A diferencia del método de NBI, este método utiliza el ingreso como indicador de la capacidad de satisfacción de las necesidades básicas, de modo que estos mínimos se establecen en términos de un cierto nivel de ingreso. Así, la línea de pobreza es el ingreso mínimo establecido por persona para satisfacer las necesidades básicas y la línea de pobreza extrema es el mínimo establecido por persona para satisfacer las necesidades alimentarias.

De acuerdo con ello, se considera en situación de pobreza a aquellos hogares cuyos ingresos son inferiores al mínimo establecido para satisfacer las necesidades básicas de sus miembros, y en situación de pobreza extrema a aquellos hogares cuyos ingresos son inferiores al mínimo establecido para satisfacer las necesidades alimentarias de sus miembros.

Para la clasificación de los hogares en estas categorías, el ingreso del hogar se define como la suma del ingreso autónomo del hogar, las transferencias monetarias que recibe el hogar del Estado y una imputación por concepto de arriendo de la vivienda, cuando ésta es habitada por sus propietarios.

En términos generales, es posible distinguir dos perspectivas de medición de la pobreza, los enfoques subjetivo y objetivo. En el enfoque subjetivo, la situación de pobreza se define a partir de la percepción que tienen los propios individuos, ya sea personas u hogares, de su situación; en tanto, en el enfoque objetivo, la situación de pobreza se define de acuerdo a criterios comunes establecidos externamente, que utilizan información recogida sobre los individuos. A su vez, dentro del enfoque objetivo, se puede distinguir entre las mediciones de pobreza absoluta y las mediciones de pobreza relativa. Mientras los métodos de medición de pobreza absoluta consideran que hay umbrales absolutos de satisfacción de las necesidades básicas de los individuos (y definen el límite de la situación de pobreza en relación a estos mínimos), los métodos de medición de pobreza relativa consideran que un individuo se encuentra en situación de pobreza cuando está en desventaja respecto a los individuos que conforman la sociedad de la que es parte (y definen el límite para la situación de pobreza en relación a indicadores del bienestar del conjunto de la sociedad).

“Con el objetivo de analizar de manera simultánea y rigurosa un conjunto de dimensiones pertinentes al estudio de la pobreza, el desarrollo de una medida multidimensional de la pobreza requiere adoptar decisiones metodológicas fundamentadas tanto desde un punto de vista técnico como normativo. Reconociendo esta complejidad, la metodología propuesta por Alkire y Foster (2007) constituye uno de los principales esfuerzos desarrollados en las últimas décadas y es el referente de base para la construcción de una metodología aplicable al caso de Chile.”

ir al documento: “Nueva Metodología de Medición de la Pobreza por Ingresos y Multidimensional”

2 Aspectos Técnicos

Pobreza por ingresos

Todas las Casen (años 2006, 2009, 2011, 2013, 2015 y 2017) contienen una sola variable que discrimina la categoría de pobreza en la que cada observación es clasificada. Las categorías son tres, las que si bien se denominan de distinto modo a partir del año 2013, identifican lo mismo:

Hasta el 2011:

Indigente
Pobre no indigente
No pobre

A partir del 2013, “MN” a nueva metodología que incluye nuevas líneas de pobreza y nueva metodología de datos de ingresos.

ir al documento: “La batalla en contra la desigualdad - Clapes UC”

Desde el 2013:

Pobres extremos
Pobres no extremos
No pobres

	2006	2009	2011	2013	2015	2017
Variable	corte	corte	corte	pobreza_mn	pobreza	pobreza
—	—	—	—	—	—	—
Categorías	Indigente	Indigente	Indigente	Pobres extremos	Pobres extremos	Pobres extremos
	Pobre no indigente	Pobre no indigente	Pobre	Pobres no extremos	Pobres no extremos	Pobres no extremos
	No pobre	No pobre	No pobre	No pobres	No pobres	No pobres

Pobreza multidimensional

	2013	2015	2017
Variable	pobreza_multi	pobreza_multi_4d	pobreza_multi_4d
		pobreza_multi_5d	pobreza_multi_5d
—	—	—	—
Categorías	no pobre	no pobre	no pobre
	pobre	pobre	pobre

La variable: pobreza_multi_5d, “Situación de pobreza multidimensional” considera la dimensión: “Entorno y Redes”.

La desigualdad.

Para caracterizar el valor de una observación se puede establecer una estructura divisional –ascendente o descendente- para situar la posición relativa de un caso en el marco de su población de referencia. Las “medidas de posición no central” permiten dividir la distribución en un variable número de segmentos –cuantiles- facilitando la ubicación de orden de un sujeto o caso sobre un conjunto de los datos. Estas medidas requieren que exista un orden en las categorías de la variable, por lo que sólo se pueden determinar a partir de la escala ordinal. Los cuantiles más comunes en el ámbito de la estadística aplicada a las Ciencias Sociales son: cuartiles, deciles y percentiles pero, con la misma lógica podrían generarse otras unidades divisionales como por ejemplo, quintiles, sextiles, etc. Los cuartiles (Qm) dividen el conjunto de las observaciones en cuatro partes iguales, son por tanto tres puntos y se denotan como Q1 Q2 y Q3. Los deciles (Dm) son las nueve marcas que fraccionan la distribución en diez partes iguales, conteniendo cada una de ellas la décima parte de las observaciones y se nombran como D1 D2 … D8 y D9. Los centiles o percentiles (Cm ó Pm) segmentan el conjunto de las observaciones en cien partes iguales y su notación se expresa como P1…P20…P99 ó C1…C20…C99.

Clasificación de las observaciones por deciles o quintiles

2006:

1. qaut: Quintil Autónomo Nacional (se excluye el s.d.p.a)
2. qautr: Quintil Autónomo Regional (antigua división administrativa) (se excluye el s.d.p.a)
3. dau: Decil Autónomo Nacional (se excluye el s.d.p.a)
4. daur: Decil Autónomo Regional (antigua división administrativa) (se excluye el s.d.p.a)
5. qautr_15: Quintil Autonomo Regional (nueva división administrativa) (se excluye el s.d.p.a)
6. daur_15: Decil Autónomo Regional (nueva división administrativa) (se excluye el s.d.p.a)

2009:

1. dau: Decil de Ingreso Autónomo Per cápita Nacional (se excluye el s.d.p.a)
2. daur: Decil de Ingreso Autónomo Per cápita Regional (se excluye el s.d.p.a)
3. qaut: Quintil de Ingreso Autónomo Per cápita Nacional (se excluye el s.d.p.a)
4. qautr: Quintil de Ingreso Autónomo Per cápita Regional (se excluye el s.d.p.a)

2011:

1. qaut: Quintil de ingreso autónomo
2. daut: Decil de ingreso autónomo
3. qaur: Quintiles regionales
4. daur: Deciles regionales

2013:

1. dau_mn: Decil autónomo nacional Nueva Metodología
2. dautr_mn: Decil autónomo regional Nueva Metodología
3. qaut_mn: Quintil autónomo nacional Nueva Metodología
4. qautr_mn: Quintil autónomo regional Nueva Metodología

2015:

1. dau: Decil autónomo nacional
2. dautr: Decil autónomo regional
3. qaut: Quintil autónomo nacional
4. qautr: Quintil autónomo regional

2017:

1. dau: Decil autónomo nacional
2. dautr: Decil autónomo regional
3. qaut: Quintil autónomo nacional
4. qautr: Quintil autónomo regional

3 Código R: Cálculos propios a partir de la Casen 2015

Hemos obtenido una tabla corregida para el 2015: CASEN_2015_ds_final.rds, a la que le creamos factores de expansión para las observaciones que no lo tenian.

dataset2015_original  <- readRDS("CASEN_2015_ds_final.rds")
# Como humanos, preferimos trabajar con etiquetas que con códigos.
dataset2015  <- as_factor(dataset2015_original, only_labelled = TRUE)

Calculamos las frecuencias por categoria de pobreza y por comuna

    a <- dataset2015$comuna
    b <- dataset2015$pobreza

    cross_tab =  xtabs(dataset2015$expc ~ unlist(a) + unlist(b),aggregate(dataset2015$expc ~ unlist(a)+unlist(b),dataset2015,mean))
    tabla <- as.data.frame(cross_tab)
    d <-tabla[!(tabla$Freq == 0),]
    d$anio <- "2015"

    head(d,10)

##        unlist.a.       unlist.b. Freq anio
## 1        Iquique Pobres extremos 3208 2015
## 2  Alto Hospicio Pobres extremos 2470 2015
## 3   Pozo Almonte Pobres extremos  457 2015
## 4         Camiña Pobres extremos  279 2015
## 5          Huara Pobres extremos  300 2015
## 6           Pica Pobres extremos  255 2015
## 7    Antofagasta Pobres extremos 5466 2015
## 8     Mejillones Pobres extremos  108 2015
## 9   Sierra Gorda Pobres extremos   45 2015
## 10        Taltal Pobres extremos  312 2015

Al asignar correctamente los codigos a la Casen del 2015 (los codigos actuales), destruímos la dualidad valor-etiqueta, por lo que debemos asignar correctamente los nombres a las comunas que solo poseen su codigo

d$unlist.a.[d$unlist.a. == 16101] <- "Chillán"
d$unlist.a.[d$unlist.a. == 16102] <- "Bulnes"
d$unlist.a.[d$unlist.a. == 16103] <- "Chillán Viejo"

d$unlist.a.[d$unlist.a. == 16104] <- "El Carmen"
d$unlist.a.[d$unlist.a. == 16105] <- "Pemuco"
d$unlist.a.[d$unlist.a. == 16106] <- "Pinto"

d$unlist.a.[d$unlist.a. == 16107] <- "Quillón"
d$unlist.a.[d$unlist.a. == 16108] <- "San Ignacio"
d$unlist.a.[d$unlist.a. == 16109] <- "Yungay"


d$unlist.a.[d$unlist.a. == 16201] <- "Quirihue"
d$unlist.a.[d$unlist.a. == 16202] <- "Cobquecura"
d$unlist.a.[d$unlist.a. == 16203] <- "Coelemu"

d$unlist.a.[d$unlist.a. == 16204] <- "Ninhue"
d$unlist.a.[d$unlist.a. == 16205] <- "Portezuelo"
d$unlist.a.[d$unlist.a. == 16206] <- "Ranquil"

d$unlist.a.[d$unlist.a. == 16207] <- "Treguaco"
d$unlist.a.[d$unlist.a. == 16301] <- "San Carlos"
d$unlist.a.[d$unlist.a. == 16302] <- "Coihueco"

d$unlist.a.[d$unlist.a. == 16303] <- "Ñiquén"
d$unlist.a.[d$unlist.a. == 16304] <- "San Fabián"
d$unlist.a.[d$unlist.a. == 16305] <- "San Nicolás"

hay problemas con 16206

h <- filter(d, Freq == "399")
h

##   unlist.a.       unlist.b. Freq anio
## 1      <NA> Pobres extremos  399 2015

En los siguientes registros no aparece el nombre de la comuna: Ránquil.

newdata <- which(is.na(d$unlist.a.))
newdata

## [1] 300 622 946

Le asignamos su nombre:

    d[300,1]<-"Ránquil"
    d[622,1]<-"Ránquil"
    d[946,1]<-"Ránquil"

Verificamos que no existan NAs:

newdata <- which(is.na(d$unlist.a.))
newdata

## integer(0)

Obtenemos las frecuencias globales de las categorías de pobreza y les asignamos nombres de cabecera coherentes:

sumas_grupales <-aggregate(d$Freq, by=list(d$unlist.b.), FUN = sum, na.rm = TRUE)
sumas_grupales

##              Group.1 sum.d$Freq
## 1    Pobres extremos     661265
## 2 Pobres no extremos    1531080
## 3          No pobres   17088065

names(sumas_grupales)[1] <- "frec_pob"
names(sumas_grupales)[2] <- "cate_pob"

sumas_grupales

##             frec_pob cate_pob
## 1    Pobres extremos   661265
## 2 Pobres no extremos  1531080
## 3          No pobres 17088065

Calculemos los porcentajes de población que entran en cada una de las categorías:

sumas_grupales$prob <- prop.table(sumas_grupales$cate_pob)
sumas_grupales$prob <- round(prop.table(sumas_grupales$cate_pob), 3)*100
sumas_grupales

##             frec_pob cate_pob prob
## 1    Pobres extremos   661265  3.4
## 2 Pobres no extremos  1531080  7.9
## 3          No pobres 17088065 88.6

Comparemos nuestro cálculo total de la pobreza en Chile: 7,9, con los resultados oficiales de la Casen 2015: 8,1 y de la extrema pobreza: 3,4, con 3,5.

Consideremos el cálculo de la pobreza en alguna comuna que no posea factor de expansión para el 2015.

Camiña 1402

h <- filter(d, unlist.a. == "Camiña")
h

##   unlist.a.          unlist.b. Freq anio
## 1    Camiña    Pobres extremos  279 2015
## 2    Camiña Pobres no extremos  207 2015
## 3    Camiña          No pobres  702 2015

names(h)[1] <- "comuna"
names(h)[3] <- "frec"
h

##   comuna          unlist.b. frec anio
## 1 Camiña    Pobres extremos  279 2015
## 2 Camiña Pobres no extremos  207 2015
## 3 Camiña          No pobres  702 2015

sumas_grupales$prob <- prop.table(h$frec)
sumas_grupales$prob <- round(prop.table(h$frec), 3)*100
sumas_grupales

##             frec_pob cate_pob prob
## 1    Pobres extremos   661265 23.5
## 2 Pobres no extremos  1531080 17.4
## 3          No pobres 17088065 59.1

Obtenemos como resultado 40,9%.

ir al documento: “Informe de estimaciones comunales de pobreza, con datos de Casen 2015”

Verificamos para una comuna que posea factor de expansión comunal el 2015: Iquique

h <- filter(d, unlist.a. == "Iquique")
h

##   unlist.a.          unlist.b.   Freq anio
## 1   Iquique    Pobres extremos   3208 2015
## 2   Iquique Pobres no extremos   6283 2015
## 3   Iquique          No pobres 168596 2015

sumas_grupales$prob <- prop.table(h$Freq)
sumas_grupales$prob <- round(prop.table(h$Freq), 3)*100
sumas_grupales

##             frec_pob cate_pob prob
## 1    Pobres extremos   661265  1.8
## 2 Pobres no extremos  1531080  3.5
## 3          No pobres 17088065 94.7

Da exactamente el valor oficial: 5,3.

La metodología SAE

Se intentó averiguar más en detalle la metodología SAE, pero cuando se intentó acceder al siguiente vínculo, éste estaba roto.

4 plot_ly: Algunos gráficos que cruzan la pertenencia a los deciles de ingresos con algunas variables relevantes de la Casen 2015.

Podemos constrastar ciertas hipótesis con la ayuda de los gráficos:

Gráfica de decil por ingreso autónomo versus tipo de educación recibida:

El obtener la licencia de educacion media asegura un mejor futuro económico frente a aquellos que tienen una educación aun menor.

No parece haber un efecto significativo el tener educacion media completa frente a quienes no la tienen. El poseer un título universitario o un postgrado completo si.

Gráfica de decil por ingreso autónomo versus sexo:

Las mujeres son mas pobres que los hombres.

Efectivamente en los deciles inferiores priman las mujeres, mientras que en los más ricos, los hombres.

Las etnias están en una situación de desventaja frente los chilenos.

Gráfica de decil por ingreso autónomo versus etnia:

Efectivamente, si se grafica sólo la etnia Mapuche con los que no dicen sentirse representados por ninguna (Chilenos), veremos que la diferencia en frecuencia dentro de un mismo decil va aumentando de manera exponencial a medida que nos acercamos al décimo.

Conclusiones:

Considerando el cálculo propio que hicimos de los factores de expansión, el llegar al nivel nacional a una diferencia de una y dos décimas en el cálculo de la pobreza y la pobreza extrema demuestra lo preciso de nuestro análisis en términos agregados.

Oficialmente no se quiso buscar el factor de expansión para éstas comunas pequeñas en la Casen 2015 a propósito, probablemente por razones presupuestarias, pero nuestras estimaciones, cayendo dentro de los intervalos de aceptación de cálculo oficial SAE, son validadas.

En el caso de Camiña nos alejamos 6 puntos porcentuales del cálculo oficial, estando dentro de los límites de aceptación del modelo SAE propuesto. Con Iquique determinamos el porcentaje de pobreza exacta.

Podemos considerar nuestras estimaciones correctas.

Por último, la herramienta para graficar plot_ly parece ser muy relevante a la hora de indagar rápidamente relaciones en forma interactiva en la base de datos de la Casen, tanto en su diseño en el back (en los dashboards Shiny), como por el usuario mismo, que puede manipular y descargar los gráficos.