“Estimación provincial de la tasa de pobreza en Argentina”

author: “Francisco Parra Rodríguez” date: “Friday, Mayo 20, 2015” output: html_document

Introduction

La extensa literatura desarrollada recientemente sobre la producción de estadísticas para áreas geográficas pequeñas, sugiere procedimientos para la obtención de estimadores de consumo en función de variables comunes en encuestas de hogares y censos de población (Ghosh y Rao (1994), Rao (1999)). La aplicación de estos métodos al problema específico de los indices de pobreza ha sido desarrollado por:

. Elbers, Lanjouw, Lanjouw, y Leite (2003), auspiciado por el Banco Mundial y aplicado a Africa Sur, Brasil, Panamá, Madagascar y Nicaragua, entre otros.

. Molina y Rao (2009) que estiman la pobreza a través del mejor predictor empírico (EBP).

. Chambers y Tzavidis (2006), que utilizan la aproximación por M-quantiles.

La idea central de la metodología consiste en utilizar la muestra contenida en las encuestas de hogares para estimar un modelo explicativo gasto de consumo o de los ingresos de los hogares si se quiere observar la pobreza por esta otra vía. Si W es un indicador de pobreza o desigualdad basado en la distribución de una variable de interés a nivel de hogar (\(y_h\)), con la encuesta de hogares se puede estimar la distribución conjunta de \(y_h\) y un vector de covariables, denotada por \(x_h\). Dichas covariables deben de haberse incluido tanto en la encuesta como en el censo o un registro de población, y esta distribución estimada puede usarse para generar la distribución de \(y_h\) para cualquier subpoblación en el Censo, condicionada a diferentes características observables.

Estás tecnicas se van a aplicar para obtener una estimación de tasa de pobreza en una sección censal de la región de Cantabria, utilizando como encuesta la ECV 2011 y como censo el de Población y Vivienda de 2011.

Metodología

Dada una población \(U\) divida en \(D\) dominios o áreas de tamaño \(U_1,U_2,...,U_d\) de tamaños \(N_1,N_2,...,N_d\), de la que disponemos de una muestra \(S_d \subset U_d\) de tamaño \(n_d\) que ha sido distribuida en \(d\) dominios \(d=1,2,...D\), y considerando \(E_{dj}\) la medida cuantitativa del bienestar (ingreso o gasto per capita, por ejemplo) de cada hogar \(j\) en el dominio \(d\), una vez definida la línea de pobreza,\(z\), para dicha población, la función objetivo a estimar es la medida de pobreza definida por Foster, Greer y Thorbecke (FGT) (1984):

\(F_{\alpha d}=\frac {1}{N_d} \sum_{j=1}^{N_d}(\frac{z-E_{dj}}{z})^{\alpha}\), \(I(E_{dj} < z)\) , \(\alpha=0,1,2\)

Siendo:

. \(\alpha=0\), mide el indicador de pobreza (porcentaje de hogares por debajo de la linea de pobreza)

. \(\alpha=1\), mide el gap de pobreza

. \(\alpha=2\), mide el indicador de pobreza severa.

La distribución de la medida de bienestar \(E_{dj}\) se supone que difiere de la distribución normal en el sentido de que es asimétrica a la derecha y presenta mayor curtosis o apuntamiento, tal y como se suele representar en la literatura económica. Se parte de que dicha distribución puede transformarse a normal : \(Y_{dj}=T(E_{dj})\) , de forma que se asume que \(Y_{dj}\) sigue un modelo lineal con errores aleatorios que podría ser del tipo multinivel con efectos aleatorios en el área o dominio:

\(Y_{dj}= X_{dj} \beta + u_d + e_{dj}\)

Donde \(X_{dj}\) es un conjunto de p variables explicativas observables, \(u_d\) un error con efectos en área o dominio , \(u_d \sim N(0,\sigma_u^2)\), y \(e_{dj}\) un error de estimación, \(e_{dj} \sim N(0,\sigma_e^2)\) , la estimación condicional de \(Y_{dj}\) sobre las variables observables se calculan a través del vector de parámetros \(\beta\).

Elbers, Lanjouw, Lanjouw, y Leite (2002), no presupone que la distribución de errores ha de ser aleatoria y homocedástica entre todos los hogares de la muestra, sino que va a existir una varianza de error común a todos los hogares de la muestra pertenecientes a un determinado cluster (efecto localización), la presencia de heterocedasticidad en las matriz de varianzas y covarianzas de los errores, obliga a realizar, una regresión auxiliar entre una transformación de errores del modelo, la variables ajustada, \(\hat Y_{jd}\) y/o las covariables \(X_{dj}\).

En una segunda etapa del análisis combina las estimaciones de parámetros de la primera fase con las características observables de cada hogar en el censo con el objeto de predecir el gasto de consumo y simular las perturbaciones aleatorias.

Se realizan un conjunto de simulaciones (boostrap), por cada simulación se obtiene un conjunto de estimaciones de los coeficientes de las regresiones realizadas en la primera etap, su matiz de varianzas y covarianzas, y la varianza del componente de error de area o dominio. De manera que para cada hogar se obtiene una simulación del término de error \(u_d\) y \(e_{dj}\) a partir de su correspondiente distribución.

Finalmente, el total de la simulación de la medida de bienestar es utilizada para calcular estimaciones de las medidas de pobreza para el nivel de agregación territorial que se define en el dominio.

Las estimaciones EBP , consideran que la medida FGT de orden \(\alpha\) es una función no lineal , \(h_{\alpha}(y_d)\) , siendo \(y_d=(y'_{ds},y'_{dr})'\) el vector que contiene los valores estimados de \(Y_{dj}\) para los hogares de la muestra, \(s\), y los ajenos a la muestra,\(r\), del dominio \(d\).

\(F_{\alpha d}=\frac {1}{N_d} \sum_{j=1}^{N_d}(\frac{z-T^{-1}(Y_{dj})}{z})^{\alpha}\), \(I(T^{-1}(Y_{dj} < z)\) , \(\alpha=0,1,2\)

Entonces EBP, vendría dado por:

\(\hat F_{\alpha d} = \int_R h_{\alpha}(y_d) \int (\frac{Y_{dr}}{Y_{ds}})d Y_{dr}\)

Dado que no hay expresión para \(\hat F_{\alpha d}\) , esta se aproxima por simulaciones Monte Carlo, generando \(L\) replicas para la distribución de \((\frac{Y_{dr}}{Y_{ds}})\) , que en la practica se realizan generando valores univariados para el modelo siguiente:

\(Y_{dj}^{(l)}= X_{dj} \hat \beta + \hat u_d + v_d + \varepsilon_{dj}\), \(v_d \sim N(0,\hat \sigma_u^2(1-\hat \gamma_d))\),\(\varepsilon_{dj} \sim N(0, \hat \sigma_\varepsilon^2)\)

Siendo \(\gamma_d = \sigma_u^2(\frac{\sigma^2_u+\sigma^2_e}{n_d})^{-1}\), y \(n_d\) el tamaño de la muestra en el dominio d

Estimación de un modelo para Argentina en base a la ENGHO de 2011

Se leen los datos de hogares del fichero de Engho de 2011.

#setwd("D:/Distribucion personal de la renta/estimacion argentina")
#setwd("Y:/Paco/Distribuciones personales de la renta/estimacion argentina")
setwd("~/Distribucion personal de la renta/estimacion argentina")
#ENGHO5 <- read.table(file="completo_ENGHO2.csv",sep=";",dec=",",header=T)
NUEVAS <- ENGHO5
str(NUEVAS)
## 'data.frame':    20960 obs. of  36 variables:
##  $ NUMSERIEHOGAR                        : int  1 2 3 4 5 6 7 8 9 10 ...
##  $ REGION                               : int  4 6 6 4 6 4 1 1 4 6 ...
##  $ SUBCOD                               : int  9 12 12 9 11 8 2 2 8 12 ...
##  $ PROVINCIA                            : int  22 94 78 34 62 54 6 6 18 78 ...
##  $ HACINAINDAC                          : num  3 0.667 0.833 0.5 1 0.6 0.667 0.5 0.4 1.4 ...
##  $ FACTORPERSON                         : int  100 104 101 28 70 63 7051 2450 152 65 ...
##  $ NUMPERSON_max                        : int  3 2 5 2 3 3 2 1 2 7 ...
##  $ GAPERC                               : num  1499 4811 386 694 248 ...
##  $ GAEQUI                               : num  1955 7024 457 1006 357 ...
##  $ INGTOTH                              : num  1616 7500 16967 2900 432 ...
##  $ INGPCH                               : num  539 3750 3393 1450 144 ...
##  $ INEQUI                               : num  703 5474 4021 2101 207 ...
##  $ DLP_PORCEN_HOGAR                     : num  0.1263 0.0725 0.0918 0.3395 0.0823 ...
##  $ MONOPAREN_VARON                      : int  0 0 0 0 0 0 0 0 0 0 ...
##  $ MONOPAREN_MUJER                      : int  0 0 0 0 0 0 0 0 0 0 ...
##  $ JEFE_ASISTEOASISTIOEDUCAT_12         : int  1 1 1 1 1 1 1 1 1 1 ...
##  $ NOJEFE_ASISTEOASISTIOEDUCAT_12       : int  2 1 4 1 2 2 1 0 1 5 ...
##  $ MATERIALPISO                         : int  1 1 1 1 1 1 1 1 1 1 ...
##  $ DESAGUEADONDE                        : int  1 1 1 0 1 1 1 1 1 1 ...
##  $ COMBUSTIBLEUSO                       : int  0 1 1 0 1 0 1 1 0 1 ...
##  $ HACINATASA                           : int  0 1 1 1 1 1 1 1 1 1 ...
##  $ JEFE_SEXOPERSON                      : int  1 0 0 0 0 0 1 0 0 1 ...
##  $ JEFE_NIVELEDUCACURSAOCURSO           : int  1 0 0 0 0 0 1 0 1 0 ...
##  $ NOJEFE_NIVELEDUCACURSAOCURSO         : int  1 0 2 0 0 0 0 0 0 0 ...
##  $ JEFE_GRUPEDAD3_NUEVO_2               : int  1 1 1 0 1 0 1 0 1 1 ...
##  $ NOJEFE_GRUPEDAD3_NUEVO_3             : num  0 0 0 0 0 0.5 1 0 0 0 ...
##  $ PORCEN_INASISTENCIA                  : num  0 0 0 0 0 0 0 0 0 0 ...
##  $ PUCO                                 : num  0.667 0 0.6 0.5 0 ...
##  $ NOJEFE_PUCO                          : num  0.5 0 0.5 1 0 0 0 0 0 0 ...
##  $ PORCEN_OCUPADO_EDAD                  : num  1 0 0.75 1 0 0 0.5 0 0 0.25 ...
##  $ PORCEN_ASISTEOASISTIOEDUCAT_12       : num  1 1 1 1 1 ...
##  $ PORCEN_NOJEFE_ASISTEOASISTIOEDUCAT_12: num  1 1 1 1 1 ...
##  $ NOMPROVINCIA                         : int  22 94 78 34 62 54 6 6 18 78 ...
##  $ EDU_H1                               : num  13.5 12 13.2 6.5 12 ...
##  $ EDU_H2                               : int  3 3 3 2 3 1 3 1 2 2 ...
##  $ EDU_OCUH                             : num  13.5 0 10.5 4.5 0 0 7.5 0 0 0.25 ...

Cálculos indices de pobreza por hogar :

##                                                      area    PovInc
## 1                                               Argentina 20.159327
## 2                               Provincia de Buenos Aires 17.653252
## 3                                               Catamarca 34.015123
## 4                                                   Chaco 49.042989
## 5                                                  Chubut 15.539342
## 6                                  Ciudad de Buenos Aires  5.899631
## 7                                                 Córdoba 17.893924
## 8                                              Corrientes 30.677662
## 9                                              Entre Ríos 26.971368
## 10                                                Formosa 32.272369
## 11                                                  Jujuy 27.443057
## 12                                               La Pampa 21.398725
## 13                                               La Rioja 36.154969
## 14                                                Mendoza 26.730008
## 15                                               Misiones 36.315179
## 16                                                Neuquén 34.423970
## 17                                              Río Negro 29.511305
## 18                                                  Salta 37.457824
## 19                                               San Juan 32.320515
## 20                                               San Luis 19.675553
## 21                                             Santa Cruz  8.666945
## 22                                               Santa Fe 15.039112
## 23                                    Santiago del Estero 32.296091
## 24 Tierra del Fuego , Antártida e Islas del Atlántico sur 10.016625
## 25                                                Tucumán 29.093236
##       PovGap    PovSev
## 1   6.739031  3.239495
## 2   5.636790  2.592521
## 3  10.578618  4.673870
## 4  19.346795 10.100229
## 5   5.491188  2.853720
## 6   1.761966  0.777224
## 7   5.970155  2.899742
## 8  10.131931  4.914182
## 9   9.247200  4.613039
## 10 12.473907  6.620965
## 11  7.274080  2.842444
## 12  8.771170  4.988978
## 13 14.241547  7.260770
## 14  9.117991  4.389322
## 15 13.200003  6.571487
## 16 13.958781  7.747929
## 17 11.661296  6.274689
## 18 13.393911  6.777752
## 19 10.594107  4.717214
## 20  6.367282  3.081499
## 21  3.853078  2.295932
## 22  4.792937  2.377153
## 23 10.267289  4.627113
## 24  2.965416  1.343881
## 25  8.426661  3.555037

Tasas de pobreza por personas:

##                                                      area   PovInc
## 1                                               Argentina 28.39024
## 2                               Provincia de Buenos Aires 24.82917
## 3                                               Catamarca 45.21677
## 4                                                   Chaco 62.21762
## 5                                                  Chubut 18.46901
## 6                                  Ciudad de Buenos Aires 10.03465
## 7                                                 Córdoba 24.37466
## 8                                              Corrientes 41.30793
## 9                                              Entre Ríos 33.97348
## 10                                                Formosa 42.89953
## 11                                                  Jujuy 38.07161
## 12                                               La Pampa 29.04500
## 13                                               La Rioja 47.45231
## 14                                                Mendoza 33.48949
## 15                                               Misiones 50.42534
## 16                                                Neuquén 41.36593
## 17                                              Río Negro 36.04571
## 18                                                  Salta 48.88938
## 19                                               San Juan 39.16865
## 20                                               San Luis 28.09566
## 21                                             Santa Cruz 10.70665
## 22                                               Santa Fe 21.67185
## 23                                    Santiago del Estero 44.96997
## 24 Tierra del Fuego , Antártida e Islas del Atlántico sur 14.02199
## 25                                                Tucumán 37.91796
##       PovGap    PovSev
## 1   9.967768  4.924054
## 2   8.342533  3.975128
## 3  15.117095  7.038510
## 4  26.590228 14.436685
## 5   6.493733  3.468447
## 6   3.140498  1.468465
## 7   8.285723  4.130148
## 8  13.722303  6.553481
## 9  12.263250  6.271241
## 10 17.698825  9.610844
## 11 10.727339  4.366059
## 12 12.362896  7.252829
## 13 18.650697  9.530787
## 14 11.911501  5.798024
## 15 19.266899  9.959158
## 16 16.620302  9.203812
## 17 14.765765  8.061078
## 18 18.754684  9.773311
## 19 13.354426  6.077740
## 20  9.880441  5.008009
## 21  4.785630  2.795917
## 22  7.704954  3.994848
## 23 15.402169  7.207033
## 24  4.681013  2.196505
## 25 11.602143  5.016884

Se realiza un análisis exploratorio de variables buscando la mejor regresión paso a paso con gastos per capita equivalentes.

Las variables en la ENGHo que se han utilizado en el análisis exploratorio son:

NUMP: número de personas en el hogar DLP: Coeficiente de Dificultad o Limitación Permanente de las personas (en tanto por uno) MON1: Dicotómica. Nivel 1, Hogares monoparentales (sólo vive un varón menor de 65 años) MON2: Dicotómica. Nivel 1, Hogares monoparentales (sólo vive una mujer menor de 65 años) GREDAD1: Dicotómica. Nivel 1, Edad del jefe de hogar: Más de 18 años y menos de 65. GREDAD2: Tanto por uno de miembros de 65 y más años, excluyendo el jefe de hogar. SEXO: Sexo del jefe de hogar ASI1: Dicotómica. Nivel 1, Jefe de hogar si asiste o asitió (público+privado) ASI2: Número de personas en el hogar que asiste o asistió a un establecimiento educativo sin considerar el jefe de hogar. ASI3: Tanto por uno. Porcentaje de miembros que asisten o asistieron. ASI4: Tanto por uno. Porcentaje de miembros que asisten o asistieron sin incluir al jefe de hogar. INA Tanto por uno. Personas entre 6 y 17 que no asistieron a establecimiento educativo entre total de personas de 6 a 17’. EDU1: Dicotómica. Nivel educativo terciario del jefe de hogar( Superior no universitario, Universitario y Post-universitario). EDU2: Número de personas en el hogar con estudios terciarios sin considerar el jefe de hogar MP: Dicotómica. Nivel 1, vivienda con Cerámica, baldosa, mosaico, mármol, madera o alfombrado y Cemento o ladrillo fijo HACINA1: número de personas por cuarto HACINA2: Dicotómica. Nivel 1, vivienda con Tres y más personas por cuarto (dom. exclusivo). ALQUILER: Dicotómica.Nivel 1, Miembro del hogar inquilino o arrendatario de la vivienda
DESA: Dicotómica. Nivel 1, desagua a red pública (saneamiento) y a cámara séptica y pozo ciego’ COMB: Dicotómica. Nivel 1, vivienda con Gas de red, Gas a granel (tanques) y Electricidad’. REDPB Dicotómica. Nivel 1, la procedencia de agua es de red pública. OCUP1: Tanto por uno. Porcentaje de ocupados entre 70 y 14 años dividido por miembros entre 70 y 14 años EDU_OCUH. Variable que considera la escolaridad de los ocupados. Puede considerarse como una proxi de potencialidad económica (de gasto). Su valor es la suma de los años de escolaridad de los ocupados de 14 y más años, respecto a los ocupados de 14 y más años. PUCO1: Ocupados entre número de miembros del hogar PUCO2: Ocupados entre número de miembros del hogar sin incluir el jefe de hogar.

## Warning: package 'MASS' was built under R version 3.2.0
## 
## Call:
## lm(formula = log(GAEQUI) ~ NUMP + MON1 + MON2 + ASI1 + EDU1 + 
##     EDU2 + SEXO + EDU_OCUH + MP + DESA + COMB + HACINA1, data = Datos)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -5.3999 -0.4047  0.0130  0.4252  3.3227 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  7.111201   0.045905 154.910  < 2e-16 ***
## NUMP        -0.129768   0.003344 -38.805  < 2e-16 ***
## MON1         0.018132   0.021955   0.826    0.409    
## MON2         0.327805   0.024872  13.180  < 2e-16 ***
## ASI1         0.175633   0.034266   5.126 2.99e-07 ***
## EDU1         0.276443   0.012822  21.560  < 2e-16 ***
## EDU2         0.072584   0.008033   9.036  < 2e-16 ***
## SEXO         0.068795   0.010491   6.558 5.59e-11 ***
## EDU_OCUH     0.029725   0.001134  26.202  < 2e-16 ***
## MP           0.127875   0.030967   4.129 3.65e-05 ***
## DESA         0.130495   0.014558   8.964  < 2e-16 ***
## COMB         0.260149   0.009731  26.733  < 2e-16 ***
## HACINA1     -0.102444   0.006284 -16.302  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.6644 on 20940 degrees of freedom
## Multiple R-squared:  0.3664, Adjusted R-squared:  0.3661 
## F-statistic:  1009 on 12 and 20940 DF,  p-value: < 2.2e-16
## Start:  AIC=-17122.33
## log(GAEQUI) ~ NUMP + MON1 + MON2 + ASI1 + EDU1 + EDU2 + SEXO + 
##     EDU_OCUH + MP + DESA + COMB + HACINA1
## 
##            Df Sum of Sq    RSS    AIC
## - MON1      1      0.30 9243.3 -17124
## <none>                  9243.0 -17122
## - MP        1      7.53 9250.5 -17107
## - ASI1      1     11.60 9254.6 -17098
## - SEXO      1     18.98 9261.9 -17081
## - DESA      1     35.47 9278.4 -17044
## - EDU2      1     36.04 9279.0 -17043
## - MON2      1     76.67 9319.6 -16951
## - HACINA1   1    117.31 9360.3 -16860
## - EDU1      1    205.18 9448.1 -16664
## - EDU_OCUH  1    303.04 9546.0 -16448
## - COMB      1    315.45 9558.4 -16421
## - NUMP      1    664.69 9907.7 -15669
## 
## Step:  AIC=-17123.65
## log(GAEQUI) ~ NUMP + MON2 + ASI1 + EDU1 + EDU2 + SEXO + EDU_OCUH + 
##     MP + DESA + COMB + HACINA1
## 
##            Df Sum of Sq    RSS    AIC
## <none>                  9243.3 -17124
## + MON1      1      0.30 9243.0 -17122
## - MP        1      7.45 9250.7 -17109
## - ASI1      1     11.52 9254.8 -17100
## - SEXO      1     20.84 9264.1 -17079
## - DESA      1     35.34 9278.6 -17046
## - EDU2      1     35.82 9279.1 -17045
## - MON2      1     76.58 9319.8 -16953
## - HACINA1   1    117.62 9360.9 -16861
## - EDU1      1    205.64 9448.9 -16665
## - EDU_OCUH  1    312.98 9556.2 -16428
## - COMB      1    315.28 9558.6 -16423
## - NUMP      1    716.17 9959.4 -15562
## 
## Call:
## lm(formula = log(GAEQUI) ~ NUMP + MON2 + ASI1 + EDU1 + EDU2 + 
##     SEXO + EDU_OCUH + MP + DESA + COMB + HACINA1, data = Datos)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -5.3996 -0.4047  0.0128  0.4251  3.3235 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  7.114802   0.045698 155.693  < 2e-16 ***
## NUMP        -0.130456   0.003239 -40.280  < 2e-16 ***
## MON2         0.325453   0.024708  13.172  < 2e-16 ***
## ASI1         0.175020   0.034258   5.109 3.27e-07 ***
## EDU1         0.276685   0.012819  21.585  < 2e-16 ***
## EDU2         0.071665   0.007955   9.009  < 2e-16 ***
## SEXO         0.070566   0.010269   6.872 6.52e-12 ***
## EDU_OCUH     0.029866   0.001122  26.628  < 2e-16 ***
## MP           0.127166   0.030955   4.108 4.00e-05 ***
## DESA         0.130230   0.014555   8.948  < 2e-16 ***
## COMB         0.259733   0.009718  26.726  < 2e-16 ***
## HACINA1     -0.102557   0.006282 -16.324  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.6644 on 20941 degrees of freedom
## Multiple R-squared:  0.3664, Adjusted R-squared:  0.3661 
## F-statistic:  1101 on 11 and 20941 DF,  p-value: < 2.2e-16

Se estudia la heterocedasticiad del modelo a través del contraste Breusch-Pagan :

## Warning: package 'lmtest' was built under R version 3.2.0
## Loading required package: zoo
## Warning: package 'zoo' was built under R version 3.2.0
## 
## Attaching package: 'zoo'
## 
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
## 
##  studentized Breusch-Pagan test
## 
## data:  EQ1_step
## BP = 222.3994, df = 11, p-value < 2.2e-16

Se lee la función R

Adaptamos los datos :

Estimamos la linea de pobreza, hogares por debajo del 0,60 de la mediana:

##    Domain SampSz    PovInc    PovGap
## 1       1   2321 19.693803  6.348367
## 2       2    903 33.188390 12.356989
## 3       3    833 44.465210 17.872369
## 4       4    777 13.411703  3.871729
## 5       5    637  6.205141  1.615228
## 6       6    678 18.916622  6.183414
## 7       7   1024 26.931224  9.531757
## 8       8    711 24.092237  8.055847
## 9       9    972 34.571968 13.093560
## 10     10   1023 29.137953 10.393679
## 11     11    816 21.204820  6.751132
## 12     12    989 30.458596 11.193338
## 13     13    668 23.163184  7.708877
## 14     14   1111 32.893959 11.946052
## 15     15    587 30.097698 10.710602
## 16     16    664 27.056616  9.165668
## 17     17    871 34.712347 13.700240
## 18     18    722 33.147048 12.098970
## 19     19    959 23.346793  7.818177
## 20     20    738  6.325888  1.622464
## 21     21    743 15.764960  4.937529
## 22     22    755 35.012509 13.439276
## 23     23    439  7.772334  2.048567
## 24     24   1012 29.500500 10.563692
## Linear mixed-effects model fit by REML
##  Data: NULL 
##        AIC      BIC    logLik
##   41056.59 41167.88 -20514.29
## 
## Random effects:
##  Formula: ~1 | as.factor(dom)
##         (Intercept)  Residual
## StdDev:   0.1830232 0.6414051
## 
## Fixed effects: ys ~ -1 + Xs 
##                 Value  Std.Error    DF   t-value p-value
## Xsconstante  7.192393 0.05824649 20918 123.48201       0
## XsNUMP      -0.128110 0.00315208 20918 -40.64312       0
## XsMON2       0.336667 0.02387937 20918  14.09865       0
## XsASI1       0.149183 0.03315463 20918   4.49960       0
## XsEDU1       0.281212 0.01244919 20918  22.58879       0
## XsEDU2       0.086987 0.00774963 20918  11.22465       0
## XsSEXO       0.065270 0.00995840 20918   6.55424       0
## XsEDU_OCUH   0.028295 0.00108684 20918  26.03387       0
## XsMP         0.123754 0.03003520 20918   4.12031       0
## XsDESA       0.139206 0.01433520 20918   9.71076       0
## XsCOMB       0.163228 0.01253127 20918  13.02563       0
## XsHACINA1   -0.103551 0.00615004 20918 -16.83742       0
##  Correlation: 
##            Xscnst XsNUMP XsMON2 XsASI1 XsEDU1 XsEDU2 XsSEXO XEDU_O XsMP  
## XsNUMP     -0.067                                                        
## XsMON2     -0.055  0.141                                                 
## XsASI1     -0.512  0.003 -0.018                                          
## XsEDU1      0.005  0.068 -0.086 -0.012                                   
## XsEDU2      0.046 -0.256  0.096 -0.012 -0.173                            
## XsSEXO     -0.074 -0.048  0.264 -0.044  0.076 -0.060                     
## XsEDU_OCUH -0.007  0.064 -0.079 -0.095 -0.368 -0.147 -0.110              
## XsMP       -0.451 -0.035  0.009 -0.042 -0.006 -0.013  0.001 -0.028       
## XsDESA     -0.106 -0.044 -0.015 -0.035 -0.030 -0.039  0.010 -0.041 -0.147
## XsCOMB     -0.074 -0.025 -0.012 -0.009 -0.096 -0.117  0.002  0.002 -0.007
## XsHACINA1  -0.127 -0.604  0.009 -0.002  0.028  0.148 -0.006 -0.036  0.098
##            XsDESA XsCOMB
## XsNUMP                  
## XsMON2                  
## XsASI1                  
## XsEDU1                  
## XsEDU2                  
## XsSEXO                  
## XsEDU_OCUH              
## XsMP                    
## XsDESA                  
## XsCOMB     -0.181       
## XsHACINA1   0.135  0.161
## 
## Standardized Within-Group Residuals:
##         Min          Q1         Med          Q3         Max 
## -6.99479135 -0.60193340  0.02304385  0.63844696  5.09250066 
## 
## Number of Observations: 20953
## Number of Groups: 24

Estimación de la tasa de pobreza del censo de población

Leemos las covariables en el Censo de Población.

Censo <- read.csv(file="completo_CENSO_15_05.csv",header=T,sep=";",dec=",")
str(Censo)
## 'data.frame':    1217166 obs. of  28 variables:
##  $ NUMSERIEHOGAR                        : int  1000 2000 3000 4000 5000 6000 7000 8000 9000 10000 ...
##  $ NOMPROVINCIA                         : int  2 2 2 2 2 2 2 2 2 2 ...
##  $ HACINAINDAC                          : num  1.5 1 1 1 1 ...
##  $ FACTORPERSON                         : int  10 10 10 10 10 10 10 10 10 10 ...
##  $ NUMPERSON_max                        : int  2 1 1 1 1 3 2 5 4 5 ...
##  $ DLP_PORCEN_HOGAR                     : num  0.201 0.08 0.08 0.08 0.08 ...
##  $ MONOPAREN_VARON                      : int  0 1 1 0 1 0 0 0 0 0 ...
##  $ MONOPAREN_MUJER                      : int  0 0 0 1 0 0 0 0 0 0 ...
##  $ JEFE_ASISTEOASISTIOEDUCAT_12         : int  1 1 1 1 1 1 1 1 1 1 ...
##  $ NOJEFE_ASISTEOASISTIOEDUCAT_12       : int  1 0 0 0 0 1 1 4 3 4 ...
##  $ MATERIALPISO                         : int  1 1 1 1 1 1 1 0 1 1 ...
##  $ DESAGUEADONDE                        : int  1 1 1 1 1 1 1 0 1 1 ...
##  $ COMBUSTIBLEUSO                       : int  1 1 0 1 0 0 1 0 0 0 ...
##  $ HACINATASA                           : int  1 1 1 1 1 1 1 1 1 1 ...
##  $ JEFE_SEXOPERSON                      : int  1 1 1 0 1 1 0 1 0 1 ...
##  $ JEFE_NIVELEDUCACURSAOCURSO           : int  1 1 0 0 0 0 0 0 1 0 ...
##  $ NOJEFE_NIVELEDUCACURSAOCURSO         : int  0 0 0 0 0 0 0 1 0 0 ...
##  $ JEFE_GRUPEDAD3_NUEVO_2               : int  0 1 1 0 1 1 1 1 1 1 ...
##  $ NOJEFE_GRUPEDAD3_NUEVO_3             : num  0 0 0 0 0 0 0 0 0 0 ...
##  $ PORCEN_INASISTENCIA                  : num  0 0 0 0 0 0 0 0 0 0 ...
##  $ PUCO                                 : num  0.5 1 1 1 1 ...
##  $ PORCEN_OCUPADO_EDAD                  : num  0.5 1 1 1 1 0.5 1 1 1 0.8 ...
##  $ PORCEN_ASISTEOASISTIOEDUCAT_12       : num  1 1 1 1 1 ...
##  $ PORCEN_NOJEFE_ASISTEOASISTIOEDUCAT_12: num  1 0 0 0 0 0.5 1 1 1 1 ...
##  $ NOJEFE_PUCO                          : num  0 0 0 0 0 ...
##  $ EDU_H1                               : num  15.5 17 5 12 10 ...
##  $ EDU_UCUH                             : num  7 17 5 12 10 ...
##  $ EDU_H2                               : int  3 3 1 3 2 1 2 1 1 2 ...

Estimacion para cada provincia:

## Domain num. 1 
## Domain num. 1 
## Domain num. 1 
## Domain num. 1 
## Domain num. 1 
## Domain num. 1 
## Domain num. 1 
## Domain num. 1 
## Domain num. 1 
## Domain num. 1 
## Domain num. 1 
## Domain num. 1 
## Domain num. 1 
## Domain num. 1 
## Domain num. 1 
## Domain num. 1 
## Domain num. 1 
## Domain num. 1 
## Domain num. 1 
## Domain num. 1 
## Domain num. 1 
## Domain num. 1 
## Domain num. 1 
## Domain num. 1
##                                                      area    PovInc
## 2                               Provincia de Buenos Aires 19.948298
## 3                                               Catamarca 38.506712
## 4                                                   Chaco 51.075249
## 5                                                  Chubut 14.265931
## 6                                  Ciudad de Buenos Aires  6.222289
## 7                                                 Córdoba 19.641714
## 8                                              Corrientes 29.616480
## 9                                              Entre Ríos 25.394344
## 10                                                Formosa 36.018196
## 11                                                  Jujuy 34.146435
## 12                                               La Pampa 23.485194
## 13                                               La Rioja 34.672245
## 14                                                Mendoza 26.446104
## 15                                               Misiones 37.053525
## 16                                                Neuquén 31.741701
## 17                                              Río Negro 29.009377
## 18                                                  Salta 36.205348
## 19                                               San Juan 33.014752
## 20                                               San Luis 25.408981
## 21                                             Santa Cruz  6.433057
## 22                                               Santa Fe 17.695523
## 23                                    Santiago del Estero 40.303542
## 24 Tierra del Fuego , Antártida e Islas del Atlántico sur  8.835718
## 25                                                Tucumán 31.593197
##       PovGap
## 2   6.484462
## 3  13.898376
## 4  20.426838
## 5   4.018452
## 6   1.546254
## 7   5.949615
## 8   9.952091
## 9   8.103106
## 10 12.951628
## 11 11.915812
## 12  7.356437
## 13 12.170903
## 14  8.600339
## 15 13.195004
## 16 10.751687
## 17  9.568778
## 18 13.168284
## 19 11.406504
## 20  8.205341
## 21  1.697650
## 22  5.256007
## 23 15.034458
## 24  2.309677
## 25 10.897388

Histogramas:

Cartografía de la tasa de pobreza del censo de población

Se lee el mapa de Argentina:

library(sp)
## Warning: package 'sp' was built under R version 3.1.3
load("ARG_adm1.RData")
argentina=gadm

Se representan los indices de pobreza estimados con las covariables del censo:

## Warning: package 'RColorBrewer' was built under R version 3.2.0
## Warning: package 'taRifx' was built under R version 3.2.0

Se representan la brecha de pobreza estimados con las covariables del censo:

Se representan los indices de pobreza estimados con las covariables y la encuesta:

Se representan los indices de pobreza calculados con la encuesta:

Bibliografía

Elbers, C., Lanjouw J. and Lanjouw P., (2003). Micro-level estimation of poverty and inequality,Econometrica, 71, 355-64.

EU : SAMPLE (Small Area Methods for Poverty and Living Conditions Estimates) DELIVERABLE 22. SOFTWARE ON SMALL AREA ESTIMATION: http://www.sample-project.eu/

Ghosh, M., and J. N. K. Rao (1994): Small Area Estimation: An Appraisal,Statistical Science, 9, 55-93

Molina, I. and Rao, J.N.K. (2009): Small area estimation of poverty indicators. Under review by The Canadian Journal of Statistics.

Rao, J. N. K. (1999): Some Recent Advances in Model-Based Small Area Estimation, Survey Methodology, 25, 175-86.

Chambers, R. and Tzavidis, N. (2006):M-quantile models for small area estimation. Biometrika, 93, 255-68.