INDICE DE POBREZA MULTIDIMENSIONAL 2018

Airam Bello Lopez*

*Estudiante de Ciencia Politica y Gobierno en la Pontificia Universidad Catolica del Perú


FUENTE:ENCUESTA DEMOGRAFICA Y DE SALUD FAMILIAR (ENDES)

1) INTRODUCCION

Desde hace algunos años se viene desarrollando la propuesta que la pobreza no es una categoria que se base solo en lo económico. La nueva forma para hablar de pobreza es como un problema multidimensional que se basa como señala Sen en la privacion del desarrollo de capacidades. Este es el enfoque que sirve como base para incorporar otras dimensiones en donde la persona pueda ser restringuido a desarrollar sus capacidades, en otras palabras, la pobreza no es carencia de lo economico, segun esta nueva teoria, sino que se basa en el impedimento en la capacidad para desarrollar nuestras libertades.

La medicion de pobreza se basaba en variables como pobreza monetaria y necesidades basicas insatisfechas. Con el nuevo enfoque se busca que sean incluidas otras dimensiones como por ejemplo: salud, educacion, calidad de vidad, entre otras.

El Programa de Desarrollo de las Naciones Unidas ha realizado un “Global Multidimensional Poverty Index (MPI)” el cual tiene como objetivo medir el grado de pobreza multidimensional que se tiene por paises, lo realiza anualmente y ve que paises a lo largo de los años van mejorando o empeorando sus niveles de pobreza multidimensional.

La metodologia para crear el Indice de pobreza multidimensional será la base para la metodologia de este trabajo. El PNUD ha identificado 3 dimensiones que son las responsables de medir la desigualdad en el desarrollo humano. Esta entidad, tambien parte de la premisa que Sen señala, la cual se enfoca en la privacion de capacidades o restriccion de las libertades para el desarrollo humano, eso es pobreza.

Las tres dimensiones que identifica el PNUD son: educacion, salud y calidad de vida. Cada una se compone de indicadores independientes que hacen un total de 10 variables, las cuales se dividen por las dimensiones:

Educacion:

VARIABLE 1: Ningun miembro de la familia ha completado 6 años de escolaridad

VARIABLE 2: Niños no matriculados en la etapa escolar

Salud:

VARIABLE 3: Un miembro de la familia desnutrido

VARIABLE 4: Uno o mas niños de la familia muertos

Calidad de vida:

VARIABLE 5: No cuenta con electricidad

VARIABLE 6: Sin acceso a saneamiento

VARIABLE 7: Sin acceso al agua

VARIABLE 8: Casa de material noble

VARIABLE 9: Cocinar con madera, carbon, u otro

VARIABLE 10: El hogar no posee un automóvil o camión y no posee más de uno de los siguientes
activos: radio, televisión, teléfono, computadora, animal carro, bicicleta, moto o refrigerador

La metodologia del PNUD se basa en darle un valor a cada variable según el número de dimensiones, teniendo en cuenta que el 100% seria la maxima privacion. Para que cada privacion tenga un mismo peso se divide 100% entre el numero de dimensiones, siendo este el 33,3% el valor de cada dimension. Asimismo, el peso que recibira cada variable sera el resultado de la division de 33,3% entre el numero de variables que contenga la dimension. En este caso para la dimension salud y educacion sus variables tendran un peso de 16,7% y para la dimension de calidad de vida estas tendran un peso de 5,6%, según la metodologia del PNUD.

Para este trabajo usaremos la data de la ENCUESTA DEMOGRAFICA Y DE SALUD FAMILIAR (ENDES) con el fin de encontrar variables que sean proxys a las planteadas por el PNUD y de esta manera visualizar el porcentaje de pobreza multidimensional que tuvo o mantiene el Perú en el añoo 2018.

Adicionalmente, creare una nueva dimension llamada Tecnologia con el fin de demostrar que la privacion de este ambito tambien debe ser incluido actualmente en las dimensiones de pobreza, ya que en un mundo donde la globalizacion avanza, el no poseer los recursos para tener un celular o acceso a internet, te puede privar de informacion y otros aspectos importantes para la vida de hoy. Al agregar esta nueva dimension el peso que le dare a cada variable sigue la misma metodologia que plantea el PNUD.

Las variables que conforman tecnologia son:

VARIABLE 11:No cuenta con computadoras

VARIABLE 12:No cuenta con acceso a Internet

VARIABLE 13: No cuenta con luz electrica

A continuacion se mostrara de que manera se encontraron las variables proxys para cada dimension, como se?ale todo es fuente de la ENDES.

2) MANEJO DE DATA

.Cargar la data

library(foreign)
HOGAR<- read.spss("RECH0.SAV",use.value.labels=TRUE,max.value.labels=TRUE,to.data.frame = T)
INDI1<- read.spss("RECH1.SAV",use.value.labels=TRUE,max.value.labels=TRUE,to.data.frame = T)
INDI2<- read.spss("RECH23.SAV",use.value.labels=TRUE,max.value.labels=TRUE,to.data.frame = T)
INDI3<- read.spss("RECH6.SAV",use.value.labels=TRUE,max.value.labels=TRUE,to.data.frame = T)
MUERTOS<- read.spss("RECHM.sav",use.value.labels=TRUE,max.value.labels=TRUE,to.data.frame = T)

a) CREAMOS LAS VARIABLES PARA EDUCACION

Seleccionamos las variables que usaremos para crear la dimension de educacion, las cuales son seg?n el MPI (Multidimensional Poverty Index):

.Al menos un ni?o no est? matriculado en el colegio

.Ningun familiar ha completado 6 a?os de educacion escolar

En este caso seleccionamos las columnas: “ID DEL HOGAR”, “EDAD”, “A?O DE ESTUDIOS”, “SI/NO MATRICULADOS”

INDIVIDUO1=INDI1[,c("HHID","HV105","HV108","HV121")]

Creamos las dos variables proxys que ser?n usadas para crear la dimensi?n de EDUCACION

INDIVIDUO1$ANO_ESTUDIOS=ifelse(INDIVIDUO1$HV105>= 11 & INDIVIDUO1$HV108<=5, "1", "0")
INDIVIDUO1$NINOS_NM=ifelse(INDIVIDUO1$HV105>=3 & INDIVIDUO1$HV105<= 16 & INDIVIDUO1$HV121==0,"1","0")
INDIVIDUO1=INDIVIDUO1[,c(1,5,6)]

Volvemos numericos nuestras variables

INDIVIDUO1[,c(2,3)]=lapply(INDIVIDUO1[,c(2,3)],as.numeric)

Agrupamos segun el codigo del hogar y sumamos las cantidades

INDIVIDUO1=aggregate(cbind(ANO_ESTUDIOS, NINOS_NM) # dependientes
          ~ HHID, # nivel
          data = INDIVIDUO1,    # data
          sum)   

Si la cantidad es igual o mayor a 1 entonces se le categorizar? con “1” que significa pobreza

INDIVIDUO1$ANO_ESTUDIOS=ifelse(INDIVIDUO1$ANO_ESTUDIOS>=1, "1", "0")
INDIVIDUO1$NINOS_NM=ifelse(INDIVIDUO1$NINOS_NM>=1, "1", "0")

b) CREAMOS LAS VARIABLES PARA CALIDAD DE VIDA

Seleccionamos las variables que usaremos para crear la dimension de calidad de vida, las cuales son segun el MPI (Multidimensional Poverty Index):

.No electricidad

.Sin acceso a saneamiento

.Sin acceso al agua

.Cocinar con materiales como madera,estiercol, carbon, entre otros

.Casa con material noble

.El hogar no posee un autom?vil o cami?n y no posee m?s de uno de los siguientes activos: radio, televisi?n, tel?fono, computadora, animal carro, bicicleta, moto o refrigerador

cargamos las variables mas parecidad a las propuestas por el PNUD

INDIVIDUO2=INDI2[,c("HHID","HV201","HV206","HV205","HV212","HV207","HV208","HV209","HV210","HV211","HV221","HV243A","HV243C","HV243D","HV213","HV214","HV215","HV226")]

Los valores perdidos lo completamos con 0 para poder hacer operaciones, no afectara ya que nuestro objetivo es marcar con “1”

INDIVIDUO2[is.na(INDIVIDUO2)] <- 0

.No electricidad

INDIVIDUO2$NO_ELECTRICIDAD=ifelse(INDIVIDUO2$HV206==1, "0","1")

.Sin acceso a saneamiento

INDIVIDUO2$NO_SANEAMIENTO=ifelse(INDIVIDUO2$HV205>12 ,"1","0")

.Sin acceso al agua

INDIVIDUO2$NO_AGUA=ifelse(INDIVIDUO2$HV201> 13,"1","0")

.Cocinar con materiales como madera,estiercol, carbon, entre otros

INDIVIDUO2$COCINA=ifelse(INDIVIDUO2$HV226> 4 ,"1","0")

.Casa con material noble

INDIVIDUO2$CASA1=ifelse(INDIVIDUO2$HV213>21 ,"0","1")
INDIVIDUO2$CASA2=ifelse(INDIVIDUO2$HV214<=24 & INDIVIDUO2$HV214<=41,"1","0")
INDIVIDUO2$CASA3=ifelse(INDIVIDUO2$HV215<=22 & INDIVIDUO2$HV215<=41,"1","0")
INDIVIDUO2[,c(23:25)]=lapply(INDIVIDUO2[,c(23:25)],as.numeric)
INDIVIDUO2$SUMA = rowSums (INDIVIDUO2[,c(23,24,25)])
INDIVIDUO2$CASA_MATERIAL=ifelse(INDIVIDUO2$SUMA>=2,"1","0")

.El hogar no posee un autom?vil o cami?n y no posee m?s de uno de los siguientes activos: radio, televisi?n, tel?fono, computadora, animal carro, bicicleta, moto o refrigerador

INDIVIDUO2$SUMA2 = rowSums (INDIVIDUO2[,c(5:14)])
INDIVIDUO2$ACTIVOS=ifelse(INDIVIDUO2$SUMA2==1,"1","0")

Nos quedamos con las columnas que conformaran la dimension para calidad de vida

INDIVIDUO2=INDIVIDUO2[,c(1,19:22,27,29)]

c) CREAMOS LAS VARIABLES PARA SALUD

Seleccionamos las variables que usaremos para crear la dimension de salud, las cuales son seg?n el MPI (Multidimensional Poverty Index): .Un miembro de la familia desnutrido .Uno o mas ni?os muertos

En este caso seleccionaremos las columnas que nos ayudaran a crear la dimension de SALUD

INDIVIDUO3=INDI3[,c("HHID","HC57")]

En este caso rellenamos los valores perdidos con 4 por que estos recibiran la categoria de 0, por tanto no afectara con nuetro analisis

INDIVIDUO3[is.na(INDIVIDUO3)] <- 4

.Un miembro de la familia desnutrido

INDIVIDUO3$DESNUTRICION=ifelse(INDIVIDUO3$HC57==4,"0","1")
INDIVIDUO3$HC57=NULL

Volvemos desnutricion numerico para poder operacionalizarlo

INDIVIDUO3$DESNUTRICION=as.numeric(INDIVIDUO3$DESNUTRICION)

Agregamos la informacion segun e ID de hogar

INDIVIDUO3=aggregate(cbind(DESNUTRICION) # dependientes
          ~ HHID, # nivel
          data = INDIVIDUO3,    # data
          sum)

Todas las casas que sean 1 o mayor a 1, significara que cuentan con desnutricion por tanto tendran la categoria de “1”

INDIVIDUO3$DESNUTRICION=ifelse(INDIVIDUO3$DESNUTRICION>=1, "1", "0")

.Uno o mas ni?os muertos

MUERTOS$NINOS_MUERTOS=ifelse(MUERTOS$QH31M<=17,"1","0")
MUERTOS=MUERTOS[,c(1,9)]

Los volvemos numericos para poder operacionalizarlo

MUERTOS$NINOS_MUERTOS=as.numeric(MUERTOS$NINOS_MUERTOS)

Los agregamos segun el ID de hogar

MUERTOS=aggregate(cbind(NINOS_MUERTOS) # dependientes
          ~ HHID, # nivel
          data = MUERTOS,    # data
          sum)

Si el resultado es igual o mas de un ni?o muerto por hogar, entonces se le pone la categoria de “1”

MUERTOS$NINOS_MUERTOS=ifelse(MUERTOS$NINOS_MUERTOS>=1, "1", "0")

Unimos todas las variables en una sola data

HOGAR=HOGAR[!HOGAR$HV009 == "0",]
HOGAR=HOGAR[,c(1,35,40,9)]
MERGE1=merge(HOGAR,INDIVIDUO1)
MERGE2=merge(MERGE1,INDIVIDUO2)
MERGE3=merge(MERGE2,INDIVIDUO3,all=T)
POBREZA=merge(MERGE3,MUERTOS,all=T)
POBREZA[is.na(POBREZA)] <- 0
POBREZA[,-c(1:4)]=lapply(POBREZA[,-c(1:4)],as.numeric)

3) OPERACIONALIZACION DE VARIABLES

SEGUN EL PNUD:

EDUCACION:

POBREZA$POR_ANO_ESTUDIO=POBREZA$ANO_ESTUDIOS*16.7
POBREZA$POR_NINO_NM=POBREZA$NINOS_NM*16.7

CALIDAD DE VIDA:

POBREZA$POR_NO_ELECTRICIDAD=POBREZA$NO_ELECTRICIDAD*5.6
POBREZA$POR_NO_SANEAMIENTO=POBREZA$NO_SANEAMIENTO*5.6
POBREZA$POR_NO_AGUA=POBREZA$NO_AGUA*5.6
POBREZA$POR_COCINA=POBREZA$COCINA*5.6
POBREZA$POR_CASA_MATERIAL=POBREZA$CASA_MATERIAL*5.6
POBREZA$POR_ACTIVOS=POBREZA$ACTIVOS*5.6

SALUD:

POBREZA$POR_DESNUTRICION=POBREZA$DESNUTRICION*16.7
POBREZA$POR_NINOS_MUERTOS=POBREZA$NINOS_MUERTOS*16.7
POBREZA$SUMA_POR = rowSums (POBREZA[,-c(1:14)])

NUMERO DE HOGARES QUE SON CONSIDERADOS POBRES

nrow(POBREZA[POBREZA$SUMA_POR >= 33.3,])
## [1] 10760

SEGUN MI APORTE:

CREAREMOS UNA NUEVA DIMENSION, QUE TENGA EN CUENTA ALGUNAS VARIABLES QUE PUEDEN SER PROXYS DEL ACERCAMIENTO DE LA POBLACION EN LO QUE SE BASA EL GOIERNO ELECTRONICO, QUE ES LA TECNOLOGIA:

d) TECNOLOGIA

.No tiene computaadora

.No tiene acceso a internet

.No cuenta con Luz electrica

INDIVIDUO4=INDI2[,c("HHID","SH61P","SH61Q","SH70")]
INDIVIDUO4$NO_COMPUTADORA=ifelse(INDIVIDUO4$SH61P==0 ,"1","0")
INDIVIDUO4$NO_INTERNET=ifelse(INDIVIDUO4$SH61Q==0 ,"1","0")
INDIVIDUO4$NO_LUZ_ELEC=ifelse(INDIVIDUO4$SH70==1 ,"0","1")
INDIVIDUO4=INDIVIDUO4[,-c(2:4)]
INDIVIDUO4=INDIVIDUO4[complete.cases(INDIVIDUO4),]
POBREZA=merge(INDIVIDUO4,POBREZA)
POBREZA[,c(2:4)]=lapply(POBREZA[,c(2:4)],as.numeric)

Al operacionalizar cambian el porcentaje que recibe cada variable, ya que se han aumentado variables

EDUCACION:

POBREZA$POR_ANO_ESTUDIO2=POBREZA$ANO_ESTUDIOS*12.5
POBREZA$POR_NINO_NM2=POBREZA$NINOS_NM*12.5

CALIDAD DE VIDA:

POBREZA$POR_NO_ELECTRICIDAD2=POBREZA$NO_ELECTRICIDAD*4.17
POBREZA$POR_NO_SANEAMIENTO2=POBREZA$NO_SANEAMIENTO*4.17
POBREZA$POR_NO_AGUA2=POBREZA$NO_AGUA*4.17
POBREZA$POR_COCINA2=POBREZA$COCINA*4.17
POBREZA$POR_CASA_MATERIAL2=POBREZA$CASA_MATERIAL*4.17
POBREZA$POR_ACTIVOS2=POBREZA$ACTIVOS*4.17

SALUD:

POBREZA$POR_DESNUTRICION2=POBREZA$DESNUTRICION*12.5
POBREZA$POR_NINOS_MUERTOS2=POBREZA$NINOS_MUERTOS*12.5

TECNOLOGIA:

POBREZA$POR_NO_COMPU=POBREZA$NO_COMPUTADORA*8.33
POBREZA$POR_NO_INTERNET=POBREZA$NO_INTERNET*8.33
POBREZA$POR_NO_LUZ=POBREZA$NO_LUZ_ELEC*8.33
POBREZA$SUMA_POR2 = rowSums (POBREZA[,-c(1:28)])

NUMERO DE HOGARES QUE SON CONSIDERADOS POBRES

nrow(POBREZA[POBREZA$SUMA_POR2 >= 25,])
## [1] 22343
library(ggplot2)
boxplot(POBREZA$SUMA_POR,POBREZA$SUMA_POR2,main="Indices de pobreza multidimensional", names= c("Sin tecnologia","Con tecnologia"),
col="orange",
border="brown"
)

Al parecer existe diferencia entre las dos variables, si bien es posible que haya relacion porque ambas tienen las mismas variables, las variables de tecnologia aumentan el promedio de pobreza multidimensional del Perú en el 2018

ordenamos

POBREZA=POBREZA[,c(1,5,6,7:28,2:4,29:42)]
POBREZA[,c(5:14,26:28)]=lapply(POBREZA[,c(5:14,26:28)], as.factor)

Visualizamos nuestras variables:

str(POBREZA)
## 'data.frame':    35388 obs. of  42 variables:
##  $ HHID                : Factor w/ 37486 levels "      000100701",..: 1 2 3 4 5 6 7 8 9 11 ...
##  $ ubigeo              : Factor w/ 898 levels "010101","010106",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ NOMCCPP             : Factor w/ 1872 levels "(JAHUNGA) JAHUANGA                                ",..: 297 297 297 297 297 297 297 297 297 297 ...
##  $ HV009               : num  6 3 6 4 4 3 2 7 5 3 ...
##  $ ANO_ESTUDIOS        : Factor w/ 2 levels "0","1": 2 1 1 2 1 2 1 2 1 1 ...
##  $ NINOS_NM            : Factor w/ 2 levels "0","1": 1 1 2 1 1 1 1 1 1 1 ...
##  $ NO_ELECTRICIDAD     : Factor w/ 2 levels "0","1": 1 1 1 1 1 1 1 1 1 1 ...
##  $ NO_SANEAMIENTO      : Factor w/ 2 levels "0","1": 1 1 1 1 1 1 1 1 1 1 ...
##  $ NO_AGUA             : Factor w/ 2 levels "0","1": 1 1 1 1 1 1 1 1 1 1 ...
##  $ COCINA              : Factor w/ 2 levels "0","1": 1 1 1 1 1 1 1 1 1 1 ...
##  $ CASA_MATERIAL       : Factor w/ 2 levels "0","1": 1 1 1 1 1 1 1 1 1 1 ...
##  $ ACTIVOS             : Factor w/ 2 levels "0","1": 1 2 1 1 1 1 1 1 1 1 ...
##  $ DESNUTRICION        : Factor w/ 2 levels "0","1": 1 2 1 1 1 1 1 1 1 1 ...
##  $ NINOS_MUERTOS       : Factor w/ 2 levels "0","1": 1 1 1 1 1 1 1 1 1 1 ...
##  $ POR_ANO_ESTUDIO     : num  16.7 0 0 16.7 0 16.7 0 16.7 0 0 ...
##  $ POR_NINO_NM         : num  0 0 16.7 0 0 0 0 0 0 0 ...
##  $ POR_NO_ELECTRICIDAD : num  0 0 0 0 0 0 0 0 0 0 ...
##  $ POR_NO_SANEAMIENTO  : num  0 0 0 0 0 0 0 0 0 0 ...
##  $ POR_NO_AGUA         : num  0 0 0 0 0 0 0 0 0 0 ...
##  $ POR_COCINA          : num  0 0 0 0 0 0 0 0 0 0 ...
##  $ POR_CASA_MATERIAL   : num  0 0 0 0 0 0 0 0 0 0 ...
##  $ POR_ACTIVOS         : num  0 5.6 0 0 0 0 0 0 0 0 ...
##  $ POR_DESNUTRICION    : num  0 16.7 0 0 0 0 0 0 0 0 ...
##  $ POR_NINOS_MUERTOS   : num  0 0 0 0 0 0 0 0 0 0 ...
##  $ SUMA_POR            : num  16.7 22.3 16.7 16.7 0 16.7 0 16.7 0 0 ...
##  $ NO_COMPUTADORA      : Factor w/ 2 levels "0","1": 2 2 2 1 1 2 2 2 2 1 ...
##  $ NO_INTERNET         : Factor w/ 2 levels "0","1": 2 2 2 2 1 2 2 2 2 1 ...
##  $ NO_LUZ_ELEC         : Factor w/ 2 levels "0","1": 1 1 1 1 1 1 1 1 1 1 ...
##  $ POR_ANO_ESTUDIO2    : num  12.5 0 0 12.5 0 12.5 0 12.5 0 0 ...
##  $ POR_NINO_NM2        : num  0 0 12.5 0 0 0 0 0 0 0 ...
##  $ POR_NO_ELECTRICIDAD2: num  0 0 0 0 0 0 0 0 0 0 ...
##  $ POR_NO_SANEAMIENTO2 : num  0 0 0 0 0 0 0 0 0 0 ...
##  $ POR_NO_AGUA2        : num  0 0 0 0 0 0 0 0 0 0 ...
##  $ POR_COCINA2         : num  0 0 0 0 0 0 0 0 0 0 ...
##  $ POR_CASA_MATERIAL2  : num  0 0 0 0 0 0 0 0 0 0 ...
##  $ POR_ACTIVOS2        : num  0 4.17 0 0 0 0 0 0 0 0 ...
##  $ POR_DESNUTRICION2   : num  0 12.5 0 0 0 0 0 0 0 0 ...
##  $ POR_NINOS_MUERTOS2  : num  0 0 0 0 0 0 0 0 0 0 ...
##  $ POR_NO_COMPU        : num  8.33 8.33 8.33 0 0 8.33 8.33 8.33 8.33 0 ...
##  $ POR_NO_INTERNET     : num  8.33 8.33 8.33 8.33 0 8.33 8.33 8.33 8.33 0 ...
##  $ POR_NO_LUZ          : num  0 0 0 0 0 0 0 0 0 0 ...
##  $ SUMA_POR2           : num  29.2 33.3 29.2 20.8 0 ...

Queremos saber si esa diferencia es significativa:

library(nortest)
ad.test(POBREZA$SUMA_POR)
## 
##  Anderson-Darling normality test
## 
## data:  POBREZA$SUMA_POR
## A = 595.03, p-value < 2.2e-16
ad.test(POBREZA$SUMA_POR2)
## 
##  Anderson-Darling normality test
## 
## data:  POBREZA$SUMA_POR2
## A = 154.18, p-value < 2.2e-16

Como no hay normalidad, realizamos un Rho de Spearman

library(ggpubr)
## Loading required package: magrittr
p1=ggscatter(POBREZA, 
          x = "SUMA_POR2", y = "SUMA_POR",
          cor.coef = TRUE, 
          cor.method = "spearman") 

p1

El p-value es menor a 0.05, por tanto podemos decir que si existe correlacion entre ambas dimensiones. Ademas, tiene un coeficiente de 0.94 que quiere decir una relacion fuerte y positiva, si un porcentaje sube, por ende, el otro tambien lo hara.

4) CONCLUSIONES

Si bien existe correlacion entre las dos dimensiones, es muy probable que esto se deba a las variaables en común que las conforman. Asimismo, al aumentar la variable de tecnologia el numero de casos hogares catalogadas como pobres aumenta en cantidad.

Seria interesante que para un proximo proyecto se busque mejorar la variable de tecnologia y asimismo, ver estos mismos resultados por años.

Por años es mas facil saber si de verdad existe un efecto de alguna variable en especifico y trabajar en las demas para saber donde mejorar en la creacion de politicas publicas.