Introducción

El objetivo del presente trabajo consiste en analizar la distribución geoespacial de los hogares del Departamento de General Pueyrredón según el Indice de Privación Material de los Hogares (IPMH) (IPMH), y verificar puntualmente la existencia de asociación espacial a fin de detectar zonas que pudieran ser foco de políticas públicas destinadas a mejorar sus condiciones de vida. El IPMH es calculado por el Instituto Nacional de Estadísticas y Censos (INDEC) a partir de datos censales brindando la posibilidad de identificar carencias de los hogares a nivel de radio censal.

El IPMH tiene como objetivo identificar a los hogares con privaciones para lo cual tiene en cuenta dos dimensiones: una referida a la situación patrimonial y otra a los recursos corrientes.

La dimensión patrimonial tiene en cuenta el capital físico necesario para garantizar condiciones de habitabilidad de las viviendas. Por otro lado, el análisis de los recursos corrientes tiene en cuenta el ingreso de los hogares como medio para satisfacer las necesidades de consumo.

Para el calculo del IPMH, la dimensión patrimonial utiliza dos indicadores: tenencia de inodoro con descarga de agua y calidad de materiales de pisos y techo de la vivienda. Por su parte, para captar los recursos corrientes, en tanto el Censo no recopila información sobre ingresos, se utiliza el nivel educativo de los perceptores del hogar como variable para estimar la capacidad económica de los hogares. Los hogares se pueden diferenciar según su situación respecto a dichas dimensiones: hogares con privación patrimonial, hogares con privación corriente, hogares con privación convergente (ambas privaciones) y hogares sin privaciones.

Fuente: INDEC

En esta ocasión vamos a trabajar con el indicador de intensidad de IPMH que se define como la suma de los hogares con algún tipo de privación, sea solo de recursos corrientes, solo patrimonial o convergente –es decir, con ambas privaciones–, sobre el total de hogares de cada radio censal.

Fuentes de información

Se utilizan los datos suministrados por el portal geoestadístico de INDEC que permite descargar indicadores a nivel de radio censal. El mismo puede consultarse a partir del siguiente link

Análisis exploratorio

La base de datos descargada y delimitada para el partido de General Pueyrredón contiene 1.084 registros y 13 variables.

## Rows: 1,084
## Columns: 13
## $ fid       <int> 40954, 41597, 41697, 41975, 43200, 43530, 43531, 43532, 4356…
## $ id        <chr> "53469", "53470", "53472", "53473", "53607", "53630", "53632…
## $ cpr       <chr> "06", "06", "06", "06", "06", "06", "06", "06", "06", "06", …
## $ jur       <chr> "Buenos Aires", "Buenos Aires", "Buenos Aires", "Buenos Aire…
## $ cde       <chr> "06357", "06357", "06357", "06357", "06357", "06357", "06357…
## $ dpto      <chr> "General Pueyrredón", "General Pueyrredón", "General Pueyrre…
## $ cfn       <chr> "12", "12", "12", "12", "57", "59", "59", "59", "59", "59", …
## $ cro       <chr> "06", "07", "09", "10", "08", "10", "12", "11", "01", "03", …
## $ tro       <chr> "U", "U", "U", "U", "U", "U", "U", "U", "U", "U", "U", "U", …
## $ cod_indec <chr> "063571206", "063571207", "063571209", "063571210", "0635757…
## $ sag       <chr> "INDEC", "INDEC", "INDEC", "INDEC", "INDEC", "INDEC", "INDEC…
## $ value     <dbl> 37.735849, 29.368030, 23.651452, 20.710059, 9.883721, 9.9547…
## $ geometry  <MULTIPOLYGON [m]> MULTIPOLYGON (((5710677 579..., MULTIPOLYGON ((…

Las variables que nos interesan puntualmente son:

cod_indec: id del radio censal

geometry: multipolygonos de radios censales

value: indica el porcentaje de hogares con IPMH (patrimonial, corriente o convergente) a nivel radio censal.

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.00   13.34   20.71   25.91   34.54   91.67

Nuestra variable de interés “value” posee una mediana de 25.91 un valor minimo de 0 y un valor máximo de 91.67. A continuación podemos observar su distribución en el histograma.

Asimismo podemos observar su distribución espacial en el siguiente mapa:

Análisis de asociación espacial

El análisis de autocorrelación espacial toma en cuenta las relaciones entre los valores de la variable de estudio en diferentes localizaciones. En otras palabras: “La autocorrelación espacial mide el grado en el que una variable geográfica está correlacionada con ella misma en dos puntos o zonas diferentes del área de estudio”1.

Si nuestra variable de interés se agrupa en zonas uniformes podemos afirmar la existencia de autocorrelación positiva, en cambio si la misma se encuentra dispersa -las unidades colindantes son disímiles- la autocorrelación es negativa. Por el contrario, cuando nuestra variable se distribuye aleatoriamente y no se observa un comportamiento definido, no existe autocorrelación espacial. La inexistencia de autocorrelación implica que la presencia o ausencia de un atributo del fenómeno analizado no influye en la expresión del mismo en los lugares vecinos.

Un aspecto clave en este tipo de análisis es el criterio de cercanía y vecindad a tener en cuenta para analizar si el comportamiento de nuestra variable presenta o no autocorrelación. Existen diversos criterios de vecindad que pueden adoptarse, y su análisis se realiza a través de la **matriz de contigüidad *W donde se representan la relación de vecindad entre las unidades de análisis. Los resultados de la matriz varian de acuerdo al criterio (lineal, torre, reina, alfil) y orden (primer, segundo, ordenes integrados)** de vecindad adoptado.

Ejemplo de matriz de contigüidad física. Criterio de vecindad: Reina de primer orden. Ejemplo de matriz de pesos estandarizada equiponderada

Las medidas de asociación espacial se clasifican en:

  1. Indices globales: se tienen en cuenta todas las unidades de análisis como un bloque a través de la media global de la variable estudiada.

  2. Indices locales (LISA): permiten identificar zonas al interior del espacio global bajo análisis. Si bien el cálculo principal también considera la media global, se asignan medidas de autocorrelación a cada unidad de análisis permitiendo identificar el nivel de agrupamiento /dispersión de cada unidad con relación a sus vecinos.

En el presente trabajo vamos a realizar ambos análisis para lo cual utilizaremos el Indice de Moral I global y local.

Asociación espacial global: Indice de Morán I

A fin de verificar la existencia de correlación espacial global utilizaremos el Indice de Moran I, el cual constituye una representación de la covarianza global del fenómeno bajo estudio. El valor de I es el resultado de comparar los valores de cada unidad de análisis con la media global del fenómeno y depende del criterio de vecindad seleccionado en tanto define cual será el patrón espacial a informar. Se deberá definir el tipo de matriz W que mejor describa el fenómeno analizado.

El valor de I varía de -1 a 1, siendo -1 autocorrelación espacial negativa, 1 autocorrelación espacial positiva y 0 ausencia de correlación espacial (aleatoriedad). Inclusive se recomienda interpretar los valores entre - 0,35 y 0,35 como manifestación de aleatoriedad.

Pasos para el calculo del Indice de Morán I.

  1. Construir el vecindario: Generamos los datos vecinos (clase nb) usando la función poly2nb() del paquete spdep. Utilizamos el criterio de vecindad “queen”.
vecinos <- poly2nb(IPMH, row.names = IPMH$cod_indec, queen = T)

Dicha función nos devuelve una lista de vecinos (objeto nb). Presentamos una breve muestra a continuación:

card(vecinos) |> head() # La función card() del paquete spdep sirve para contar el número de vecinos una vez armada la lista de vecinos con la funcion poly2nb
## [1] 6 6 8 7 7 4
cat("\nVecinos de los primeros 3 registros")
## 
## Vecinos de los primeros 3 registros
vecinos[1:3]
## [[1]]
## [1]   2  39  42 176 180 288
## 
## [[2]]
## [1]   1   3   4  39  40 288
## 
## [[3]]
## [1]   2   4  40 151 152 620 626 627
  1. Mapeamos los vinculos entre vecinos.

  1. Asignamos pesos a los vecinos

La función que utilizamos es nb2listw. Mediante el argumento “style” se pueden seleccionar diferentes opciones de ponderación a cada relación con los vecinos. Por ejemplo, se puede optar, entre otras, por una clasificación “binaria” donde los vecinos tienen valor = 1 y los no vecinos = 0 (con style='B') o “estandarizada” donde se estandariza de acuerdo a la cantidad de vecinos, siendo la suma de los pesos = 1 (con style ='W') . En nuestro caso optamos por la opción estandarizada.

pesos_vecinos <-  nb2listw(vecinos, style = 'W')
  1. Calculamos el I Moran (Global)

Si algún polígono no tiene vecinos da error. El parámetro zero.policy permite definir el modo de manipular estos casos (por defecto es NULL): si se le asigna TRUE es posible considerar datos sin vecinos, si es FALSE asigna NA a estos vecinos. Ante la duda es conveniente usar zero.policy = TRUE.

# Retenemos sólo el Índice de Moran
I_MORAN_IPMH_2022 <- moran(IPMH$value,            # Variable a autocorrelacionar
                 listw = pesos_vecinos,            # Pesos de los vecinos
                 n = length(vecinos),          # Cantidad de zonas
                 S0 = Szero(pesos_vecinos))[[1]]   # Suma de los pesos. Szero() es utilizada para realizar dicho calculo

El Indice de Moran arrojo un valor de 0.75, lo cual indica la presencia de autocorrelación espacial positiva.

  1. Testeamos la significatividad
prueba_moran <- moran.test(IPMH$value, pesos_vecinos)
prueba_moran
## 
##  Moran I test under randomisation
## 
## data:  IPMH$value  
## weights: pesos_vecinos    
## 
## Moran I statistic standard deviate = 43.449, p-value <
## 0.00000000000000022
## alternative hypothesis: greater
## sample estimates:
## Moran I statistic       Expectation          Variance 
##      0.7471352548     -0.0009233610      0.0002964296

A continuación realizamos una prueba para testear la significancia estadística de nuestro Indice de Moran. El valor p obtenido es menor a 0.05 nos indica la baja probabilidad de que nuestro patrón espacial sea aleatorio (rechazamos la hipotesis nula que plantea la aleatoriedad del comportamiento espacial de nuestra variable).

  1. Graficamos el Correlograma de Morán

    El correlograma nos permite observar como la autocorrelación espacial disminuye a medida que aumenta la distancia de los vecinos. Los resultados indican:

correlograma_imoran <- sp.correlogram(neighbours = vecinos,
                         var = IPMH$value,
                         order = 5, 
                         method = "I",
                         style = "B",
                         zero.policy = TRUE)

correlograma_imoran
## Spatial correlogram for IPMH$value 
## method: Moran's I
##              estimate  expectation     variance standard deviate
## 1 (1084)  0.719124213 -0.000923361  0.000283309           42.779
## 2 (1084)  0.704170050 -0.000923361  0.000114720           65.830
## 3 (1084)  0.695560586 -0.000923361  0.000063604           87.331
## 4 (1084)  0.650587318 -0.000923361  0.000043040           99.308
## 5 (1084)  0.559356095 -0.000923361  0.000032376           98.467
##                Pr(I) two sided    
## 1 (1084) < 0.00000000000000022 ***
## 2 (1084) < 0.00000000000000022 ***
## 3 (1084) < 0.00000000000000022 ***
## 4 (1084) < 0.00000000000000022 ***
## 5 (1084) < 0.00000000000000022 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
plot(correlograma_imoran)

  1. Diagrama de dispersión de Moran
moran_disp <- moran.plot(IPMH$value, 
                 listw = pesos_vecinos, 
                 zero.policy = TRUE,
                 labels = IPMH$value,
                 #pch = 5
                 )

La función moran.plot no solo grafica la relación entre los datos y los “lag” de las observaciones, sino que al mismo tiempo brinda un resumen de las medidas de influencia para la relación lineal entre los datos y el lag. A continuación se detallan las variables que nos arroja la función:

##           x       wx is_inf    labels       dfb.1_         dfb.x        dffit
## 1 37.735849 29.62324  FALSE 37.735849  0.001984520 -0.0163515231 -0.027740242
## 2 29.368030 27.66502  FALSE 29.368030 -0.001073888 -0.0006554749 -0.003143074
## 3 23.651452 32.06015  FALSE 23.651452  0.023308332 -0.0050171418  0.036289710
## 4 20.710059 25.64366  FALSE 20.710059  0.013593167 -0.0054399515  0.017791777
## 5  9.883721 17.75253  FALSE  9.883721  0.024428314 -0.0176534750  0.025100678
## 6  9.954751 21.98680  FALSE  9.954751  0.050098859 -0.0361423701  0.051504921
##      cov.r         cook.d          hat
## 1 1.002261 0.000384922892 0.0014137052
## 2 1.002799 0.000004943981 0.0009644546
## 3 1.000204 0.000658228812 0.0009404854
## 4 1.002295 0.000158374550 0.0010176459
## 5 1.003044 0.000315212979 0.0018254508
## 6 1.000975 0.001325818517 0.0018174662

Cada una de las variables significa lo siguiente:

  • x: es el valor estandarizado de la variable que se está estudiando.
  • wx: es el valor lag de la variable. (El “lag” en el contexto de variables geográficas generalmente se refiere a la distancia de separación (conocida como “lag”) entre dos puntos geográficos en geoestadística)
  • is_inf: determina si la observación es influyente en la regresión lineal entre x y wx.
  • labels: las etiquetas de la variable.
  • : medidas de influencia.

Mediante el cálculo del Indice de Moran Global podemos concluir la existencia de autocorrelación espacial, habiendo realizado el correspondiente análisis de significatividad, y corroborado mediante el correlograma y gráfico de dispersión.

Asociación espacial local: Moran local (\(I_i\))

Anteriormente pudimos confirmar la existencia de autocorrelación global positiva. Sin embargo, nos queda por confirmar si existen manifestaciones zonales de privaciones materiales de los hogares a través del análisis de autocorrelación espacial local (LISA).

En términos generales el LISA nos provee:

  • Para cada observación (unidad de análisis central), una medida del nivel de agrupamiento espacial significativo con relación a los valores que se localizan alrededor de esa observación (unidades vecinas).

  • La suma de las medidas lisa de todas las observaciones es proporcional al indicador global de asociación espacial (autocorrelación espacial global), por lo que resultan útiles para medir la contribución de cada observación local al valor global 2.

Como resultado del LISA vamos a obtener agrupaciones o clústeres con los siguientes posibles comportamientos:

  1. COLDSPOTS valores BAJO - BAJO: unidad central de análisis con un valor por debajo de la media global y rodeada de vecinos que también están por debajo de la media;

  2. HOTSPOTS valores ALTO - ALTO: unidad central de análisis con un valor por encima de la media global y rodeada de vecinos que también están por encima de la media.

  3. Por fuera de estas posibilidades se encuentran las unidades de análisis centrales que están rodeadas de valores vecinos opuestos a su valor, ya sea por encima o por debajo.

Pasos para el calculo del Indice de Morán I.

  1. El calculo del moran local se realiza mediante la función localmoran(), el cual nos brinda la siguiente salida:
LOC_MORAN_IPMH <- localmoran(IPMH$value, listw = pesos_vecinos)

head(LOC_MORAN_IPMH)
##                     Ii           E.Ii      Var.Ii       Z.Ii Pr(z != E(Ii))
## 063571206  0.167090223 -0.00049164951 0.088370744  0.5637321      0.5729365
## 063571207  0.023055833 -0.00004198415 0.007549769  0.2658301      0.7903701
## 063571209 -0.052960429 -0.00001799280 0.002422207 -1.0757175      0.2820536
## 063571210  0.005341726 -0.00009522455 0.014663034  0.0448997      0.9641873
## 063575708  0.498303988 -0.00090377527 0.139054173  1.3387187      0.1806623
## 063575910  0.238689095 -0.00089578334 0.241867352  0.4871591      0.6261456

Las variables expresan lo siguiente:

  • Ii: Valor del Moran local
  • E.Ii: esperanza del Moran local
  • Var.Ii: varianza del Moran local
  • Z.Ii: desvío estándar del Moran local
  • Pr(...): p-value del Moran local

Asimismo uno de los atributos calculados es el cuadrante al que pertenece cada observación. A continuación mostramos el ejemplo para las primeras observaciones:

##        mean    median     pysal
## 1 High-High High-High High-High
## 2 High-High High-High High-High
## 3  Low-High High-High  Low-High
## 4   Low-Low  Low-High   Low-Low
## 5   Low-Low   Low-Low   Low-Low
## 6   Low-Low  Low-High   Low-Low
  1. A continuación agregamos las variables mencionadas arriba (salida del Indice Moran Local) y la información de los cuadrantes -utilizamos la media en esta ocasión- a nuestra base de datos. Además agregamos los valores estandarizados de la variable y lag que obtuvimos a partir de la función moran.plot().
lisaIPMH <- cbind(IPMH,                           # Base original
                  moran_disp[c("x", "wx")],              # Variable y lag (estandarizado)
                  LOC_MORAN_IPMH,                     # Valores de Moran Local
                  attributes(LOC_MORAN_IPMH)$quadr) |># Cuadrantes LISA
  # Renombramos la columna "Pr(z != E(Ii))"
  rename(p = Pr.z....E.Ii..) |> 
  # Los valores no significativos se diferencian en otra categoría
  mutate(quad = ifelse(p > 0.05, 5, mean),
         quad = factor(quad, levels = 1:5,
                labels = c("Low-Low", "High-Low", 
                           "Low-High", "High-High", 
                           "No Signif") ) )

Nuestros radios censales quedan agrupados de la siguiente manera:

## 
##   Low-Low  High-Low  Low-High High-High No Signif 
##       242         2        12       197       631
  1. Graficamos el resultado del Moran Local identificando hotspots y coldspots:

  1. Por último visualizamos estos resultados en el mapa:

Conclusiones

El Indice de Moran arrojó un valor de 0.75, manifestando la existencia de autocorrelación espacial positiva. Por su parte, al testear la significativad comprobamos un valor p menor a 0.05, lo cual nos indica la baja probabilidad de que nuestro patrón espacial sea aleatorio (rechazamos la hipótesis nula que plantea la aleatoriedad del comportamiento espacial de nuestra variable).

Por su parte, la utilización del Indice de Morán Local nos permite comprobar la existencia de una marcada distribución espacial del Indice de Privación Material de los Hogares. La representación en el mapa de los cuadrantes identifica zonas de radios con valores bajos de IPMH rodeados de valores bajos concentradas en el sector más centrico y costero del partido, y un cordón periferico de radios con valores altos (por encima de la media) rodeados de valores altos de IPMH. Se destacan asimismo, radios con valores bajos que contrastan con valores altos circundantes y viceversa.

El análisis espacial exploratorio realizado respecto a la distribución de los niveles de IPMH en los radios censales del Partido de General Pueyrredón justifica la profundización del mismo en futuros estudios. Entre otras cuestiones, resulta de interés continuar el análisis discriminando las privaciones de acuerdo al tipo de IPMH (patrimonial, corriente o convergente) a fin de obtener mayor detalle de las condiciones que la conforman y brindar información para la confección de políticas públicas requeridas para la mejora de las condiciones de vida de la población.


  1. Siabato, W y Guzmán-Manrique J. 2019.La autocorrelación espacial y el desarrollo de la geografía cuantitativa. Cuadernos de Geografía: Revista Colombiana de Geografía 28 (1): 1-22. http://www.scielo.org.co/pdf/rcdg/v28n1/2256-5442-rcdg-28-01-1.pdf↩︎

  2. Ibid↩︎