El objetivo del presente trabajo consiste en analizar la distribución geoespacial de los hogares del Departamento de General Pueyrredón según el Indice de Privación Material de los Hogares (IPMH) (IPMH), y verificar puntualmente la existencia de asociación espacial a fin de detectar zonas que pudieran ser foco de políticas públicas destinadas a mejorar sus condiciones de vida. El IPMH es calculado por el Instituto Nacional de Estadísticas y Censos (INDEC) a partir de datos censales brindando la posibilidad de identificar carencias de los hogares a nivel de radio censal.
El IPMH tiene como objetivo identificar a los hogares con privaciones para lo cual tiene en cuenta dos dimensiones: una referida a la situación patrimonial y otra a los recursos corrientes.
La dimensión patrimonial tiene en cuenta el capital físico necesario para garantizar condiciones de habitabilidad de las viviendas. Por otro lado, el análisis de los recursos corrientes tiene en cuenta el ingreso de los hogares como medio para satisfacer las necesidades de consumo.
Para el calculo del IPMH, la dimensión patrimonial utiliza dos indicadores: tenencia de inodoro con descarga de agua y calidad de materiales de pisos y techo de la vivienda. Por su parte, para captar los recursos corrientes, en tanto el Censo no recopila información sobre ingresos, se utiliza el nivel educativo de los perceptores del hogar como variable para estimar la capacidad económica de los hogares. Los hogares se pueden diferenciar según su situación respecto a dichas dimensiones: hogares con privación patrimonial, hogares con privación corriente, hogares con privación convergente (ambas privaciones) y hogares sin privaciones.
En esta ocasión vamos a trabajar con el indicador de intensidad de IPMH que se define como la suma de los hogares con algún tipo de privación, sea solo de recursos corrientes, solo patrimonial o convergente –es decir, con ambas privaciones–, sobre el total de hogares de cada radio censal.
Se utilizan los datos suministrados por el portal geoestadístico de INDEC que permite descargar indicadores a nivel de radio censal. El mismo puede consultarse a partir del siguiente link
La base de datos descargada y delimitada para el partido de General Pueyrredón contiene 1.084 registros y 13 variables.
## Rows: 1,084
## Columns: 13
## $ fid <int> 40954, 41597, 41697, 41975, 43200, 43530, 43531, 43532, 4356…
## $ id <chr> "53469", "53470", "53472", "53473", "53607", "53630", "53632…
## $ cpr <chr> "06", "06", "06", "06", "06", "06", "06", "06", "06", "06", …
## $ jur <chr> "Buenos Aires", "Buenos Aires", "Buenos Aires", "Buenos Aire…
## $ cde <chr> "06357", "06357", "06357", "06357", "06357", "06357", "06357…
## $ dpto <chr> "General Pueyrredón", "General Pueyrredón", "General Pueyrre…
## $ cfn <chr> "12", "12", "12", "12", "57", "59", "59", "59", "59", "59", …
## $ cro <chr> "06", "07", "09", "10", "08", "10", "12", "11", "01", "03", …
## $ tro <chr> "U", "U", "U", "U", "U", "U", "U", "U", "U", "U", "U", "U", …
## $ cod_indec <chr> "063571206", "063571207", "063571209", "063571210", "0635757…
## $ sag <chr> "INDEC", "INDEC", "INDEC", "INDEC", "INDEC", "INDEC", "INDEC…
## $ value <dbl> 37.735849, 29.368030, 23.651452, 20.710059, 9.883721, 9.9547…
## $ geometry <MULTIPOLYGON [m]> MULTIPOLYGON (((5710677 579..., MULTIPOLYGON ((…
Las variables que nos interesan puntualmente son:
cod_indec: id del radio censal
geometry: multipolygonos de radios censales
value: indica el porcentaje de hogares con IPMH (patrimonial, corriente o convergente) a nivel radio censal.
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00 13.34 20.71 25.91 34.54 91.67
Nuestra variable de interés “value” posee una mediana de 25.91 un valor minimo de 0 y un valor máximo de 91.67. A continuación podemos observar su distribución en el histograma.
Asimismo podemos observar su distribución espacial en el siguiente mapa:
El análisis de autocorrelación espacial toma en cuenta las relaciones entre los valores de la variable de estudio en diferentes localizaciones. En otras palabras: “La autocorrelación espacial mide el grado en el que una variable geográfica está correlacionada con ella misma en dos puntos o zonas diferentes del área de estudio”1.
Si nuestra variable de interés se agrupa en zonas uniformes podemos afirmar la existencia de autocorrelación positiva, en cambio si la misma se encuentra dispersa -las unidades colindantes son disímiles- la autocorrelación es negativa. Por el contrario, cuando nuestra variable se distribuye aleatoriamente y no se observa un comportamiento definido, no existe autocorrelación espacial. La inexistencia de autocorrelación implica que la presencia o ausencia de un atributo del fenómeno analizado no influye en la expresión del mismo en los lugares vecinos.
Un aspecto clave en este tipo de análisis es el criterio de cercanía y vecindad a tener en cuenta para analizar si el comportamiento de nuestra variable presenta o no autocorrelación. Existen diversos criterios de vecindad que pueden adoptarse, y su análisis se realiza a través de la **matriz de contigüidad *W donde se representan la relación de vecindad entre las unidades de análisis. Los resultados de la matriz varian de acuerdo al criterio (lineal, torre, reina, alfil) y orden (primer, segundo, ordenes integrados)** de vecindad adoptado.
| Ejemplo de matriz de contigüidad física. Criterio de vecindad: Reina de primer orden. | Ejemplo de matriz de pesos estandarizada equiponderada |
Las medidas de asociación espacial se clasifican en:
Indices globales: se tienen en cuenta todas las unidades de análisis como un bloque a través de la media global de la variable estudiada.
Indices locales (LISA): permiten identificar zonas al interior del espacio global bajo análisis. Si bien el cálculo principal también considera la media global, se asignan medidas de autocorrelación a cada unidad de análisis permitiendo identificar el nivel de agrupamiento /dispersión de cada unidad con relación a sus vecinos.
En el presente trabajo vamos a realizar ambos análisis para lo cual utilizaremos el Indice de Moral I global y local.
A fin de verificar la existencia de correlación espacial global utilizaremos el Indice de Moran I, el cual constituye una representación de la covarianza global del fenómeno bajo estudio. El valor de I es el resultado de comparar los valores de cada unidad de análisis con la media global del fenómeno y depende del criterio de vecindad seleccionado en tanto define cual será el patrón espacial a informar. Se deberá definir el tipo de matriz W que mejor describa el fenómeno analizado.
El valor de I varía de -1 a 1, siendo -1 autocorrelación espacial negativa, 1 autocorrelación espacial positiva y 0 ausencia de correlación espacial (aleatoriedad). Inclusive se recomienda interpretar los valores entre - 0,35 y 0,35 como manifestación de aleatoriedad.
nb) usando la función poly2nb() del paquete
spdep. Utilizamos el criterio de vecindad “queen”.vecinos <- poly2nb(IPMH, row.names = IPMH$cod_indec, queen = T)
Dicha función nos devuelve una lista de vecinos (objeto nb). Presentamos una breve muestra a continuación:
card(vecinos) |> head() # La función card() del paquete spdep sirve para contar el número de vecinos una vez armada la lista de vecinos con la funcion poly2nb
## [1] 6 6 8 7 7 4
cat("\nVecinos de los primeros 3 registros")
##
## Vecinos de los primeros 3 registros
vecinos[1:3]
## [[1]]
## [1] 2 39 42 176 180 288
##
## [[2]]
## [1] 1 3 4 39 40 288
##
## [[3]]
## [1] 2 4 40 151 152 620 626 627
La función que utilizamos es nb2listw. Mediante el
argumento “style” se pueden seleccionar diferentes opciones de
ponderación a cada relación con los vecinos. Por ejemplo, se puede
optar, entre otras, por una clasificación “binaria” donde los vecinos
tienen valor = 1 y los no vecinos = 0 (con style='B') o
“estandarizada” donde se estandariza de acuerdo a la cantidad de
vecinos, siendo la suma de los pesos = 1 (con style ='W') .
En nuestro caso optamos por la opción estandarizada.
pesos_vecinos <- nb2listw(vecinos, style = 'W')
Si algún polígono no tiene vecinos da error. El parámetro
zero.policy permite definir el modo de manipular estos
casos (por defecto es NULL): si se le asigna
TRUE es posible considerar datos sin vecinos, si es
FALSE asigna NA a estos vecinos. Ante la duda
es conveniente usar zero.policy = TRUE.
# Retenemos sólo el Índice de Moran
I_MORAN_IPMH_2022 <- moran(IPMH$value, # Variable a autocorrelacionar
listw = pesos_vecinos, # Pesos de los vecinos
n = length(vecinos), # Cantidad de zonas
S0 = Szero(pesos_vecinos))[[1]] # Suma de los pesos. Szero() es utilizada para realizar dicho calculo
El Indice de Moran arrojo un valor de 0.75, lo cual indica la presencia de autocorrelación espacial positiva.
prueba_moran <- moran.test(IPMH$value, pesos_vecinos)
prueba_moran
##
## Moran I test under randomisation
##
## data: IPMH$value
## weights: pesos_vecinos
##
## Moran I statistic standard deviate = 43.449, p-value <
## 0.00000000000000022
## alternative hypothesis: greater
## sample estimates:
## Moran I statistic Expectation Variance
## 0.7471352548 -0.0009233610 0.0002964296
A continuación realizamos una prueba para testear la significancia estadística de nuestro Indice de Moran. El valor p obtenido es menor a 0.05 nos indica la baja probabilidad de que nuestro patrón espacial sea aleatorio (rechazamos la hipotesis nula que plantea la aleatoriedad del comportamiento espacial de nuestra variable).
Graficamos el Correlograma de Morán
El correlograma nos permite observar como la autocorrelación espacial disminuye a medida que aumenta la distancia de los vecinos. Los resultados indican:
correlograma_imoran <- sp.correlogram(neighbours = vecinos,
var = IPMH$value,
order = 5,
method = "I",
style = "B",
zero.policy = TRUE)
correlograma_imoran
## Spatial correlogram for IPMH$value
## method: Moran's I
## estimate expectation variance standard deviate
## 1 (1084) 0.719124213 -0.000923361 0.000283309 42.779
## 2 (1084) 0.704170050 -0.000923361 0.000114720 65.830
## 3 (1084) 0.695560586 -0.000923361 0.000063604 87.331
## 4 (1084) 0.650587318 -0.000923361 0.000043040 99.308
## 5 (1084) 0.559356095 -0.000923361 0.000032376 98.467
## Pr(I) two sided
## 1 (1084) < 0.00000000000000022 ***
## 2 (1084) < 0.00000000000000022 ***
## 3 (1084) < 0.00000000000000022 ***
## 4 (1084) < 0.00000000000000022 ***
## 5 (1084) < 0.00000000000000022 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
plot(correlograma_imoran)
moran_disp <- moran.plot(IPMH$value,
listw = pesos_vecinos,
zero.policy = TRUE,
labels = IPMH$value,
#pch = 5
)
La función moran.plot no solo grafica la relación entre los datos y los “lag” de las observaciones, sino que al mismo tiempo brinda un resumen de las medidas de influencia para la relación lineal entre los datos y el lag. A continuación se detallan las variables que nos arroja la función:
## x wx is_inf labels dfb.1_ dfb.x dffit
## 1 37.735849 29.62324 FALSE 37.735849 0.001984520 -0.0163515231 -0.027740242
## 2 29.368030 27.66502 FALSE 29.368030 -0.001073888 -0.0006554749 -0.003143074
## 3 23.651452 32.06015 FALSE 23.651452 0.023308332 -0.0050171418 0.036289710
## 4 20.710059 25.64366 FALSE 20.710059 0.013593167 -0.0054399515 0.017791777
## 5 9.883721 17.75253 FALSE 9.883721 0.024428314 -0.0176534750 0.025100678
## 6 9.954751 21.98680 FALSE 9.954751 0.050098859 -0.0361423701 0.051504921
## cov.r cook.d hat
## 1 1.002261 0.000384922892 0.0014137052
## 2 1.002799 0.000004943981 0.0009644546
## 3 1.000204 0.000658228812 0.0009404854
## 4 1.002295 0.000158374550 0.0010176459
## 5 1.003044 0.000315212979 0.0018254508
## 6 1.000975 0.001325818517 0.0018174662
Cada una de las variables significa lo siguiente:
x: es el valor estandarizado de la variable que se está
estudiando.wx: es el valor lag de la variable. (El “lag” en el
contexto de variables geográficas generalmente se refiere a la distancia
de separación (conocida como “lag”) entre dos puntos geográficos en
geoestadística)is_inf: determina si la observación es influyente en la
regresión lineal entre x y wx.labels: las etiquetas de la variable.…: medidas de influencia.Mediante el cálculo del Indice de Moran Global podemos concluir la existencia de autocorrelación espacial, habiendo realizado el correspondiente análisis de significatividad, y corroborado mediante el correlograma y gráfico de dispersión.
Anteriormente pudimos confirmar la existencia de autocorrelación global positiva. Sin embargo, nos queda por confirmar si existen manifestaciones zonales de privaciones materiales de los hogares a través del análisis de autocorrelación espacial local (LISA).
En términos generales el LISA nos provee:
Para cada observación (unidad de análisis central), una medida del nivel de agrupamiento espacial significativo con relación a los valores que se localizan alrededor de esa observación (unidades vecinas).
La suma de las medidas lisa de todas las observaciones es proporcional al indicador global de asociación espacial (autocorrelación espacial global), por lo que resultan útiles para medir la contribución de cada observación local al valor global 2.
Como resultado del LISA vamos a obtener agrupaciones o clústeres con los siguientes posibles comportamientos:
COLDSPOTS valores BAJO - BAJO: unidad central de análisis con un valor por debajo de la media global y rodeada de vecinos que también están por debajo de la media;
HOTSPOTS valores ALTO - ALTO: unidad central de análisis con un valor por encima de la media global y rodeada de vecinos que también están por encima de la media.
Por fuera de estas posibilidades se encuentran las unidades de análisis centrales que están rodeadas de valores vecinos opuestos a su valor, ya sea por encima o por debajo.
LOC_MORAN_IPMH <- localmoran(IPMH$value, listw = pesos_vecinos)
head(LOC_MORAN_IPMH)
## Ii E.Ii Var.Ii Z.Ii Pr(z != E(Ii))
## 063571206 0.167090223 -0.00049164951 0.088370744 0.5637321 0.5729365
## 063571207 0.023055833 -0.00004198415 0.007549769 0.2658301 0.7903701
## 063571209 -0.052960429 -0.00001799280 0.002422207 -1.0757175 0.2820536
## 063571210 0.005341726 -0.00009522455 0.014663034 0.0448997 0.9641873
## 063575708 0.498303988 -0.00090377527 0.139054173 1.3387187 0.1806623
## 063575910 0.238689095 -0.00089578334 0.241867352 0.4871591 0.6261456
Las variables expresan lo siguiente:
Ii: Valor del Moran localE.Ii: esperanza del Moran localVar.Ii: varianza del Moran localZ.Ii: desvío estándar del Moran localPr(...): p-value del Moran localAsimismo uno de los atributos calculados es el cuadrante al que pertenece cada observación. A continuación mostramos el ejemplo para las primeras observaciones:
## mean median pysal
## 1 High-High High-High High-High
## 2 High-High High-High High-High
## 3 Low-High High-High Low-High
## 4 Low-Low Low-High Low-Low
## 5 Low-Low Low-Low Low-Low
## 6 Low-Low Low-High Low-Low
lisaIPMH <- cbind(IPMH, # Base original
moran_disp[c("x", "wx")], # Variable y lag (estandarizado)
LOC_MORAN_IPMH, # Valores de Moran Local
attributes(LOC_MORAN_IPMH)$quadr) |># Cuadrantes LISA
# Renombramos la columna "Pr(z != E(Ii))"
rename(p = Pr.z....E.Ii..) |>
# Los valores no significativos se diferencian en otra categoría
mutate(quad = ifelse(p > 0.05, 5, mean),
quad = factor(quad, levels = 1:5,
labels = c("Low-Low", "High-Low",
"Low-High", "High-High",
"No Signif") ) )
Nuestros radios censales quedan agrupados de la siguiente manera:
##
## Low-Low High-Low Low-High High-High No Signif
## 242 2 12 197 631
El Indice de Moran arrojó un valor de 0.75, manifestando la existencia de autocorrelación espacial positiva. Por su parte, al testear la significativad comprobamos un valor p menor a 0.05, lo cual nos indica la baja probabilidad de que nuestro patrón espacial sea aleatorio (rechazamos la hipótesis nula que plantea la aleatoriedad del comportamiento espacial de nuestra variable).
Por su parte, la utilización del Indice de Morán Local nos permite comprobar la existencia de una marcada distribución espacial del Indice de Privación Material de los Hogares. La representación en el mapa de los cuadrantes identifica zonas de radios con valores bajos de IPMH rodeados de valores bajos concentradas en el sector más centrico y costero del partido, y un cordón periferico de radios con valores altos (por encima de la media) rodeados de valores altos de IPMH. Se destacan asimismo, radios con valores bajos que contrastan con valores altos circundantes y viceversa.
El análisis espacial exploratorio realizado respecto a la distribución de los niveles de IPMH en los radios censales del Partido de General Pueyrredón justifica la profundización del mismo en futuros estudios. Entre otras cuestiones, resulta de interés continuar el análisis discriminando las privaciones de acuerdo al tipo de IPMH (patrimonial, corriente o convergente) a fin de obtener mayor detalle de las condiciones que la conforman y brindar información para la confección de políticas públicas requeridas para la mejora de las condiciones de vida de la población.
Siabato, W y Guzmán-Manrique J. 2019.La autocorrelación espacial y el desarrollo de la geografía cuantitativa. Cuadernos de Geografía: Revista Colombiana de Geografía 28 (1): 1-22. http://www.scielo.org.co/pdf/rcdg/v28n1/2256-5442-rcdg-28-01-1.pdf↩︎
Ibid↩︎