Objetivo: En el siguiente trabajo intento ver como se relacionan los hogares en condiciones vulnerables con respecto a la accesibilidad al tranporte publico en el partido de La Matanza. Por eso mi objetivo va ser determinar si los Barrio Populares que se encuentran en La Matanza tienen peor acceso al transporte de colectivos.

Carga las librerías que vamos a necesitar.

Dentro de las fuentes de datos para realizar el trabajo identifique tres dataset relevantes:

1- Un dataset que muestra la cantidad de hogares por radio censal en el Partido de La Matanza (donde la variable de interes es la Columna “Cantidad_H” que se refiere a la cantidad de hogares).

2- Un dataset de los recorridos de colectivos de Provicnia de Buenos Aires (que su variable geometry me servia para calcular la distancias hacia el recorrido).

3- El dataset de Barrio Populares de todo el pais (donde busque usar su variable geometry para identificar cuales eran los radio asignados esos barrio dentro del Partido de La Matanza)

Carga de datos que vamos a necesitar.

Pre-Procesamiento y limpieza de los datos.

En el pre-procesamiento tuve que producir una base que me diera el area del Partido de La Matanza, para luego utilizar ese dataset para hacer intersecciones con los recorridos y los barrio populares, y obtener de esos dataset solo lo que se encunetran en el Partido de La Matanza. Luego de eso realice con cruce entre los barrios populares de La Matanza con los radios censales, para obtener los radios censales involucrados dentros de los barrios pupulares y lo datos de los mismo para generar una base que tenga la cantidad de hogares dentro de los barrio populares de La Matanza. A todo esto tambien selecciones la variables de cada dataset que requeria para el analisis.

Metodología:

Realice la generacion de un buffer de 300 metrso sobre el dataset de recorridos de colectivos para luego hacer una interseccion con los radio de toda La Matanza y en los barrios populares del mismo partido y asi calcular el porcentaje de hogares en barrio populares que estan influenciados por el los recorridos.

Correlación entre densidad de hogares y distancia promedio, con el objetivo de identificar que relación se establece entre a distribución de la población y su acceso al transporte público de colectivos.

Para analizar y explicar relaciones entre las variables produje un Modelo de regresión espacial. Esto me definira la variable dependiente y independiente. Y investigar la autocorrelacion espacial entre ellas.

Mapa de Distribución de Hogares en Buffers y Barrios Populares en La Matanza

### Mapa de hogares con distancia mínima y barrios populares

Explicación del modelo:

Variable dependiente (distancia_min_log): Distancia mínima de cada radio censal al recorrido de colectivos.

Predictores:

densidad: Densidad de hogares por metro cuadrado en cada radio censal.

Aplicacion de un modelo de regresión espacial para analizar la relación.

modelo_sar <- lagsarlm( formula, data = Cant_Hog_R_LaMatanza_limpio, listw = pesos)

Evaluación:

Se calcula un pseudo R² para evaluar qué tan bien explica el modelo la variabilidad en la variable dependiente.

Se realiza un test de Moran para verificar si los residuos del modelo tienen autocorrelación espacial.

Codigo de evalucion de modelo:

R² ajustado (pseudo R² para modelos espaciales)

r2 <- 1 - (modelo_sar\(SSE/sum((Cant_Hog_R_LaMatanza_limpio\)distancia_min_log - mean(Cant_Hog_R_LaMatanza_limpio$distancia_min))^2))

Verificar autocorrelación en los residuos mediante el test de Moran

moran_test <- moran.test(residuals(modelo_sar), pesos)

Resultados del Modelo de Regresión Espacial (SAR)

## 
## Call:lagsarlm(formula = formula, data = Cant_Hog_R_LaMatanza_limpio, 
##     listw = pesos)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -4.09782 -0.26200  0.18638  0.48346  2.19305 
## 
## Type: lag 
## Coefficients: (asymptotic standard errors) 
##                         Estimate Std. Error z value  Pr(>|z|)
## (Intercept)            1.2336518  0.1034234 11.9282 < 2.2e-16
## en_barrio_popularTRUE  0.3177350  0.0664945  4.7784 1.767e-06
## densidad              -0.0041864  0.0021726 -1.9269   0.05399
## 
## Rho: 0.76555, LR test value: 946.28, p-value: < 2.22e-16
## Asymptotic standard error: 0.018935
##     z-value: 40.43, p-value: < 2.22e-16
## Wald statistic: 1634.6, p-value: < 2.22e-16
## 
## Log likelihood: -2123.384 for lag model
## ML residual variance (sigma squared): 0.66461, (sigma: 0.81523)
## Number of observations: 1647 
## Number of parameters estimated: 5 
## AIC: 4256.8, (AIC for lm: 5201.1)
## LM test for residual autocorrelation
## test value: 9.5764, p-value: 0.0019709

Resulatdos de la Evaluacion

Pseudo R2 Y Moran

## [1] "Pseudo R²: 0.5594"
## 
##  Moran I test under randomisation
## 
## data:  residuals(modelo_sar)  
## weights: pesos    
## 
## Moran I statistic standard deviate = -1.3898, p-value = 0.9177
## alternative hypothesis: greater
## sample estimates:
## Moran I statistic       Expectation          Variance 
##     -0.0216336946     -0.0006075334      0.0002288739

Interpretaciones:

La densidad tiene un efecto negativo marginalmente significativo, aunque su impacto no es tan fuerte.

El modelo muestra una fuerte autocorrelación espacial (indicado por Rho y el test LR), justifica el uso de un modelo espacial.

El AIC (4256.8) más bajo en el modelo espacial indica que este es más eficiente que un modelo lineal estándar.

Discusión:

De los hogares influenciados por el recorrido de los colectivos, el 12,6% pertenece a barrios populares

En términos del análisis de accesibilidad y vulnerabilidad:

La correlación negativa indica que, a medida que aumenta la densidad de hogares, la distancia promedio a las paradas de colectivos tiende a disminuir. Los bajos niveles de correlación sugiere que la densidad de hogares no explica significativamente la accesibilidad. Esto sugiere que otros factores (como la distribución geográfica de los recorridos o la configuración del territorio) podrían estar influyendo en mayor medida.

En el caso de los barrios populares la correlación entre la densidad de hogares y la distancia promedio a los recorridos de colectivos indica una relación positiva muy débil. Pero apesar de esta realacion positiva no genera ningun impacto determinante en su accesibilidad al transporte público al igual que pasa con todo el Partido de La Matanza.

En La Matanza en general, existe una correlación negativa débil pero significativa entre densidad y distancia, lo que sugiere que las áreas más densas tienen un leve mejor acceso al transporte. Sin embargo, esta relación no se observa en los Barrios Populares, donde la correlación es insignificante, lo que podría reflejar desigualdades en la distribución del transporte público.

La densidad no es estadísticamente significativa, pero su coeficiente negativo sugiere que mayores densidades podrían estar asociadas con menores distancias.

La dependencia espacial es muy alta y significativa, lo que confirma la necesidad de un modelo espacial para estos datos.

AIC menor que un modelo lineal clásico, lo que demuestra que el modelo espacial captura mejor las relaciones en los datos.

Uno de los problemas con los que me encontre al realizar el trabajo es que no puede encontrar información sobre las paradas de los colectivos dentro del Partido de La Matanza, lo cual claramente afecta al los resutados de mi analisis ya que no puedo obtener la distancia exacta al los lugares de acceso a los colectivos