Objetivo: En el siguiente trabajo intento ver como se relacionan los
hogares en condiciones vulnerables con respecto a la accesibilidad al
tranporte publico en el partido de La Matanza. Por eso mi objetivo va
ser determinar si los Barrio Populares que se encuentran en La Matanza
tienen peor acceso al transporte de colectivos.
Carga las librerías que vamos a necesitar.
Dentro de las fuentes de datos para realizar el trabajo identifique
tres dataset relevantes:
1- Un dataset que muestra la cantidad de hogares por radio censal en
el Partido de La Matanza (donde la variable de interes es la Columna
“Cantidad_H” que se refiere a la cantidad de hogares).
2- Un dataset de los recorridos de colectivos de Provicnia de Buenos
Aires (que su variable geometry me servia para calcular la distancias
hacia el recorrido).
3- El dataset de Barrio Populares de todo el pais (donde busque usar
su variable geometry para identificar cuales eran los radio asignados
esos barrio dentro del Partido de La Matanza)
Carga de datos que vamos a necesitar.
Pre-Procesamiento y limpieza de los datos.
En el pre-procesamiento tuve que producir una base que me diera el
area del Partido de La Matanza, para luego utilizar ese dataset para
hacer intersecciones con los recorridos y los barrio populares, y
obtener de esos dataset solo lo que se encunetran en el Partido de La
Matanza. Luego de eso realice con cruce entre los barrios populares de
La Matanza con los radios censales, para obtener los radios censales
involucrados dentros de los barrios pupulares y lo datos de los mismo
para generar una base que tenga la cantidad de hogares dentro de los
barrio populares de La Matanza. A todo esto tambien selecciones la
variables de cada dataset que requeria para el analisis.
Metodología:
Realice la generacion de un buffer de 300 metrso sobre el dataset de
recorridos de colectivos para luego hacer una interseccion con los radio
de toda La Matanza y en los barrios populares del mismo partido y asi
calcular el porcentaje de hogares en barrio populares que estan
influenciados por el los recorridos.
Correlación entre densidad de hogares y distancia promedio, con el
objetivo de identificar que relación se establece entre a distribución
de la población y su acceso al transporte público de colectivos.
Para analizar y explicar relaciones entre las variables produje un
Modelo de regresión espacial. Esto me definira la variable dependiente y
independiente. Y investigar la autocorrelacion espacial entre
ellas.
Mapa de Distribución de Hogares en Buffers y Barrios Populares en La
Matanza

### Mapa de hogares con distancia mínima y barrios populares

Explicación del modelo:
Variable dependiente (distancia_min_log): Distancia mínima de cada
radio censal al recorrido de colectivos.
Predictores:
en_barrio_popular: Indica si el radio censal está en un barrio
popular.
densidad: Densidad de hogares por metro cuadrado en cada radio
censal.
Formula del modelo: distancia_min_log ~ en_barrio_popular +
densidad
Aplicacion de un modelo de regresión espacial para analizar la
relación.
modelo_sar <- lagsarlm( formula, data =
Cant_Hog_R_LaMatanza_limpio, listw = pesos)
Evaluación:
Se calcula un pseudo R² para evaluar qué tan bien explica el modelo
la variabilidad en la variable dependiente.
Se realiza un test de Moran para verificar si los residuos del
modelo tienen autocorrelación espacial.
Codigo de evalucion de modelo:
R² ajustado (pseudo R² para modelos espaciales)
Verificar autocorrelación en los residuos mediante el test de
Moran
moran_test <- moran.test(residuals(modelo_sar), pesos)
Resultados del Modelo de Regresión Espacial (SAR)
##
## Call:lagsarlm(formula = formula, data = Cant_Hog_R_LaMatanza_limpio,
## listw = pesos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -4.09782 -0.26200 0.18638 0.48346 2.19305
##
## Type: lag
## Coefficients: (asymptotic standard errors)
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 1.2336518 0.1034234 11.9282 < 2.2e-16
## en_barrio_popularTRUE 0.3177350 0.0664945 4.7784 1.767e-06
## densidad -0.0041864 0.0021726 -1.9269 0.05399
##
## Rho: 0.76555, LR test value: 946.28, p-value: < 2.22e-16
## Asymptotic standard error: 0.018935
## z-value: 40.43, p-value: < 2.22e-16
## Wald statistic: 1634.6, p-value: < 2.22e-16
##
## Log likelihood: -2123.384 for lag model
## ML residual variance (sigma squared): 0.66461, (sigma: 0.81523)
## Number of observations: 1647
## Number of parameters estimated: 5
## AIC: 4256.8, (AIC for lm: 5201.1)
## LM test for residual autocorrelation
## test value: 9.5764, p-value: 0.0019709
Resulatdos de la Evaluacion
Pseudo R2 Y Moran
## [1] "Pseudo R²: 0.5594"
##
## Moran I test under randomisation
##
## data: residuals(modelo_sar)
## weights: pesos
##
## Moran I statistic standard deviate = -1.3898, p-value = 0.9177
## alternative hypothesis: greater
## sample estimates:
## Moran I statistic Expectation Variance
## -0.0216336946 -0.0006075334 0.0002288739
Interpretaciones:
La variable “en_barrio_popular” tiene un efecto positivo
significativo sobre la distancia mínima de cada radio censal al
recorrido de colectivos.
La densidad tiene un efecto negativo marginalmente significativo,
aunque su impacto no es tan fuerte.
El modelo muestra una fuerte autocorrelación espacial (indicado por
Rho y el test LR), justifica el uso de un modelo espacial.
El AIC (4256.8) más bajo en el modelo espacial indica que este es
más eficiente que un modelo lineal estándar.
El modelo sugiere que vivir en un barrio popular está asociado con
un aumento en la distancia mínima de cada radio censal al recorrido de
colectivos, y que la densidad tiene un efecto negativo. Además, los
resultados confirman la importancia de considerar la dependencia
espacial en los datos.
Discusión:
De los hogares influenciados por el recorrido de los colectivos, el
12,6% pertenece a barrios populares
En términos del análisis de accesibilidad y vulnerabilidad:
La correlación negativa indica que, a medida que aumenta la densidad
de hogares, la distancia promedio a las paradas de colectivos tiende a
disminuir. Los bajos niveles de correlación sugiere que la densidad de
hogares no explica significativamente la accesibilidad. Esto sugiere que
otros factores (como la distribución geográfica de los recorridos o la
configuración del territorio) podrían estar influyendo en mayor
medida.
En el caso de los barrios populares la correlación entre la densidad
de hogares y la distancia promedio a los recorridos de colectivos indica
una relación positiva muy débil. Pero apesar de esta realacion positiva
no genera ningun impacto determinante en su accesibilidad al transporte
público al igual que pasa con todo el Partido de La Matanza.
En La Matanza en general, existe una correlación negativa débil pero
significativa entre densidad y distancia, lo que sugiere que las áreas
más densas tienen un leve mejor acceso al transporte. Sin embargo, esta
relación no se observa en los Barrios Populares, donde la correlación es
insignificante, lo que podría reflejar desigualdades en la distribución
del transporte público.
Como la variable de barrios populares es significativa, esto indica
que vivir en un barrio popular aumenta la distancia mínima a las paradas
de colectivos.
La densidad no es estadísticamente significativa, pero su
coeficiente negativo sugiere que mayores densidades podrían estar
asociadas con menores distancias.
La dependencia espacial es muy alta y significativa, lo que confirma
la necesidad de un modelo espacial para estos datos.
AIC menor que un modelo lineal clásico, lo que demuestra que el
modelo espacial captura mejor las relaciones en los datos.
Uno de los problemas con los que me encontre al realizar el trabajo
es que no puede encontrar información sobre las paradas de los
colectivos dentro del Partido de La Matanza, lo cual claramente afecta
al los resutados de mi analisis ya que no puedo obtener la distancia
exacta al los lugares de acceso a los colectivos