library(rgdal)
library(sp)
library(sf)
library(leaflet)
library(RColorBrewer)
library(maptools)
library(leaflet.esri)
library(data.table)
library(rgeos)
library(dplyr)
library(spdep)
library(dbscan)
library(leaflet.minicharts)
library(dbscan)
library(gridGraphics)
library(spatialreg)
library(pscl)
library(vcdExtra)
library(stringr)
library(DT)
library(vcdExtra)Analisis espacial de datos de area
Homicidios en Bogotá
La relación entre los homicidios y el tamaño de la población es un factor importante a considerar al analizar la seguridad ciudadana en una ciudad como Bogotá. Aunque es lógico pensar que una mayor población podría implicar una mayor incidencia de homicidios debido a la concentración de personas, la relación entre estos dos factores puede ser más compleja. El análisis de los datos de homicidios en Bogotá es esencial para comprender la magnitud y las tendencias de este problema.
En esta sentido se exploraran los datos de homicidios en Bogotá del año 2020, proporcionando una visión general de las áreas más afectadas por este delito. Estos datos, nos permitirán analizar las tendencias y patrones de homicidios en la ciudad, así como identificar posibles factores de riesgo.
A través del análisis espacial de datos de área se estabelecera un modelo de regresion espacial que describa la tasa de homicidios en Bogotá tendiendo en cuenta variables relevantes que podrían estar asociadas con la ocurrencia de homicidios en la ciudad. Además se tendrán en cuenta factores como la distribución demográfica por UPZ, los indices de escolaridad, la densidad población y la presencia de actividades delictivas
Es importante destacar que los datos presentados estadísticos y se basan en información recopilada para la fecha indicada. Es fundamental considerar el contexto completo y los otros factores subyacentes antes de realizar conclusiones definitivas o implementar medidas específicas.
De acuerdo a la Camara de Comercio de Bogota (2023), Bogotá esta divida en Unidades de Planificacion Zonal (UPZ) las cuales se definen como áreas urbanas de menor área que una localidad. La funcion de las UPZ es actuar como unidades territoriales para la planificacion del desarollo urbano de la cuidad.
Debido a la gran diferencia que existe entre sectores en términos de desarrollo y capacidad economica alrededor de la cuidad, se definen normas y se desarrollan los planes de inversion de recursos que requiere la comunidad.
Bogota tiene un total de 117 Unidades de Planificacion Zonal, las cuales estan compuestas por barrios, dentro del trabajo desarrollado tomaran 116 sin tener en cuenta la UPZ89 la cual pertenece a San Isidro patios

Para la descripcion del modelo se toman en cuenta los datos de homicidios reportados de Homicidios para el año 2020.
| UPZ | Homicidios | Zona |
|---|---|---|
| UPZ48 | 11 | Timiza |
| UPZ96 | 13 | Lourdes |
| UPZ75 | 12 | Fontibon |
| UPZ51 | 16 | Los Libertadores |
| UPZ66 | 18 | San Francisco |
| UPZ102 | 48 | La Sabana |
| UPZ39 | 15 | Quiroga |
| UPZ55 | 21 | Diana Turbay |
| UPZ26 | 6 | Las Ferias |
| UPZ80 | 34 | Corabastos |
Analisis exploratorio
Con base en los datos de homicidios se realiza un análisis exploratorio.
Mapa de cuantiles
El mapa de cuantilez muestra las UPZ sobre las cuales se lleva acabo el estudio y la ubicación de las UPZ de mayor peligrosidad dentro de la cuidad:
De acuerdo a los datos recopilados se puede ver que algunas de las zonas mas peligrosas determinadas por el mapa de cuantiles con base en la cantidad de homicidios son:
| UPZ | Homicidios | Zona |
|---|---|---|
| UPZ51 | 16 | Los Libertadores |
| UPZ55 | 21 | Diana Turbay |
| UPZ80 | 34 | Corabastos |
| UPZ11 | 10 | San Cristobal Norte |
| UPZ59 | 14 | Alfonso Lopez |
| UPZ85 | 26 | Bosa Central |
| UPZ108 | 7 | Zona Industrial |
| UPZ71 | 32 | Tibabuyes |
| UPZ9 | 14 | Verbenal |
| UPZ82 | 41 | Patio Bonito |
| UPZ28 | 22 | El Rincon |
| UPZ84 | 24 | Bosa Occidental |
| UPZ57 | 26 | Gran Yomasa |
| UPZ86 | 23 | El Porvenir |
| UPZ54 | 29 | Marruecos |
| UPZ74 | 22 | Engativa |
datos1 <- datos
centros1 <- gCentroid(datos1,byid=T, id=datos1$CMIUUPLA)
centros1 <- data.frame(centros1)datos <- spTransform(datos,CRS("+proj=tmerc +lat_0=4.596200416666666 +lon_0=-74.07750791666666 +k=1 +x_0=1000000 +y_0=1000000 +ellps=GRS80 +towgs84=0,0,0,0,0,0,0 +units=m +no_defs"))
centros <- gCentroid(datos,byid=T, id=datos$CMIUUPLA)
centros <- data.frame(centros)
centros$CMIUUPLA <- row.names(centros)
datos@data <- datos@data %>% left_join(centros, by="CMIUUPLA")
coordinates(centros) <- c('x','y')Modelado de datos de área.
En la mayoría de datos donde se obtienen observaciones las cuales son ordenadas en el espacio o en el espacio tiempo, están puede ser caracterizadas por su posición, usando un sistema de coordenadas o su posición relativa, basa un una medida de distancia particular.
Situaciones como esta donde se utilizan datos sobre la población, teniendo en cuenta características socio-economicas son usados por los entes gubernamentales para ejercer planes de acción sobre una necesidad en particular.
Uno de los problemas que se presentan en estas metodologías es la existencia de una dependencia espacial entre los datos, la cual puede ser considerada como una relación entre lo que pasa entre un punto en el espacio y otro lugar en particular, lo cual puede estar dado por dos tipos de condiciones.
Existencia de un fenómeno de interacción espacial
Como subproducto de los errores de medición en las observaciones en una unidad espacial contigua.
Vecinos en el espacio.
La nocion de dependencia espacial implica la necesidad de determina cuales de las otras unidades en el sistema espacial tiene una influencia en particular sobre la unidad en consideración, lo cual puede ser expresado en términos de vecindad o en términos de vecinos mas cercanos.
El conjunto resultante de vecinos para cada unidad espacial puede ser representado gráficamente o mediante red y una matriz de conectividad asociada.
Matriz de contiguidad espacial.
La matriz de pesos espaciales esta definida como una matriz que mide las relaciones relaciones entre dos variables teniendo en cuenta los criterios de vecindad espacial. Se debe tener en cuenta que la matriz es deterministica y establece una magnitud que cuantifica las posibles interacciones dentro de un espacio establecido. Esta se define de la siguiente manera:
\[ W=\left(w_{i j}\right)=\left(\begin{array}{ccccc}0 & w_{12} & w_{13} & \cdots & w_{1 k} \\ w_{21} & 0 & w_{23} & \cdots & w_{2 k} \\ w_{31} & w_{32} & 0 & \cdots & w_{3 k} \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ w_{k 1} & w_{k 2} & w_{k 3} & \cdots & 0\end{array}\right) \]
Los subindices \(i\) y \(j\) representan unidades espaciales, donde \(w_{ij}\) establece la relacion entre las unidades espaciales.
Existen multiples maneras de establecer los elementos individuales de la matriz W, es asi como una matrices de peso binaria asignan el valor de uno a las unidades contiguas y cero a las demas:
\[w_{ij}=\begin{cases} 1, \mbox{si } j \in N(i) \\ 0, \mbox{en el otro caso} \end{cases}\]
Sin embargo, esto determina una simetría dentro de la matriz debido al criterio geométrico establecido, para suplir esta falencia se realiza una estandarización de la matriz, donde se pondera teniendo en cuenta la suma de la filas, rompiendo la simetría mencionada anteriormente:
\[ w_{ij}^{*}=\dfrac{w_{ij}}{\sum_{j=1}^n w_{ij}}\]
Existen múltiples criterios para generar la matriz W, algunos de ellos tienen en cuenta la ubicación adyacente (Criterio: torre, alfil, reina), mientras que otros se basa en la distancia( k-vecinos mas cercanos, triangulacion de Delaunay, Esfera de influencia, Gráfica de Gabriel).
Criterios generacion Matriz W
En este caso se utilizaran los criterios antes mencionados donde se tendrán en cuenta las matrices binarias, así como las matrices estandarizadas por filas, a continuación se pueden apreciar los mapas generados para las UPZ en Bogotá.
Matriz W criterio tipo torre (rook)
Matriz criterio tipo torre binaria
Characteristics of weights list object:
Neighbour list object:
Number of regions: 111
Number of nonzero links: 542
Percentage nonzero weights: 4.398994
Average number of links: 4.882883
Weights style: B
Weights constants summary:
n nn S0 S1 S2
B 111 12321 542 1084 11432

Matriz criterio tipo torre estandarizada
Characteristics of weights list object:
Neighbour list object:
Number of regions: 111
Number of nonzero links: 542
Percentage nonzero weights: 4.398994
Average number of links: 4.882883
Weights style: W
Weights constants summary:
n nn S0 S1 S2
W 111 12321 111 47.56239 454.1576

Matriz criterio tipo reina (queen)
Matriz criterio tipo reina binaria
Characteristics of weights list object:
Neighbour list object:
Number of regions: 111
Number of nonzero links: 624
Percentage nonzero weights: 5.064524
Average number of links: 5.621622
Weights style: B
Weights constants summary:
n nn S0 S1 S2
B 111 12321 624 1248 15360

Matriz tipo criterio tipo estandarizada por filas
Characteristics of weights list object:
Neighbour list object:
Number of regions: 111
Number of nonzero links: 624
Percentage nonzero weights: 5.064524
Average number of links: 5.621622
Weights style: W
Weights constants summary:
n nn S0 S1 S2
W 111 12321 111 42.36038 453.4068

Matriz K-vecinos más cercanos.
Matriz 1- Vecino más cercano binaria.
Characteristics of weights list object:
Neighbour list object:
Number of regions: 111
Number of nonzero links: 111
Percentage nonzero weights: 0.9009009
Average number of links: 1
Non-symmetric neighbours list
Weights style: B
Weights constants summary:
n nn S0 S1 S2
B 111 12321 111 175 532

Matriz 1- Vecino mas cernano estandarizada
Characteristics of weights list object:
Neighbour list object:
Number of regions: 111
Number of nonzero links: 111
Percentage nonzero weights: 0.9009009
Average number of links: 1
Non-symmetric neighbours list
Weights style: W
Weights constants summary:
n nn S0 S1 S2
W 111 12321 111 175 532

Matriz 2- Vecinos más cercano binaria.
Characteristics of weights list object:
Neighbour list object:
Number of regions: 111
Number of nonzero links: 222
Percentage nonzero weights: 1.801802
Average number of links: 2
Non-symmetric neighbours list
Weights style: B
Weights constants summary:
n nn S0 S1 S2
B 111 12321 222 392 1856

Matriz 2- Vecinos mas cernanos estandarizada
Characteristics of weights list object:
Neighbour list object:
Number of regions: 111
Number of nonzero links: 222
Percentage nonzero weights: 1.801802
Average number of links: 2
Non-symmetric neighbours list
Weights style: W
Weights constants summary:
n nn S0 S1 S2
W 111 12321 111 98 464

Matriz 3- Vecinos más cercanos binaria.
Characteristics of weights list object:
Neighbour list object:
Number of regions: 111
Number of nonzero links: 333
Percentage nonzero weights: 2.702703
Average number of links: 3
Non-symmetric neighbours list
Weights style: B
Weights constants summary:
n nn S0 S1 S2
B 111 12321 333 595 4134

Matriz 3- Vecinos mas cercanos estandarizada
Characteristics of weights list object:
Neighbour list object:
Number of regions: 111
Number of nonzero links: 333
Percentage nonzero weights: 2.702703
Average number of links: 3
Non-symmetric neighbours list
Weights style: W
Weights constants summary:
n nn S0 S1 S2
W 111 12321 111 66.11111 459.3333

Mariz criterio de Triangulacion de Delaunay
Matriz criterio de Triangulacion de Delaunay binaria
Characteristics of weights list object:
Neighbour list object:
Number of regions: 111
Number of nonzero links: 640
Percentage nonzero weights: 5.194384
Average number of links: 5.765766
Weights style: B
Weights constants summary:
n nn S0 S1 S2
B 111 12321 640 1280 15352

Matriz Triangulacion de Delaunay estandarizada
Characteristics of weights list object:
Neighbour list object:
Number of regions: 111
Number of nonzero links: 640
Percentage nonzero weights: 5.194384
Average number of links: 5.765766
Weights style: W
Weights constants summary:
n nn S0 S1 S2
W 111 12321 111 39.24774 450.1223

Mariz W criterio de Esfera de influencia
Matriz criterio de Esfera de influencia binaria
Characteristics of weights list object:
Neighbour list object:
Number of regions: 111
Number of nonzero links: 546
Percentage nonzero weights: 4.431458
Average number of links: 4.918919
Weights style: B
Weights constants summary:
n nn S0 S1 S2
B 111 12321 546 1092 11600

Matriz criterio de Esfera de influencia estandarizada
Characteristics of weights list object:
Neighbour list object:
Number of regions: 111
Number of nonzero links: 546
Percentage nonzero weights: 4.431458
Average number of links: 4.918919
Weights style: W
Weights constants summary:
n nn S0 S1 S2
W 111 12321 111 47.84537 452.6019

Matriz criterio de vecinos relativos
Matriz criterio de vecinos relativos binaria
Characteristics of weights list object:
Neighbour list object:
Number of regions: 111
Number of nonzero links: 296
Percentage nonzero weights: 2.402402
Average number of links: 2.666667
Weights style: B
Weights constants summary:
n nn S0 S1 S2
B 111 12321 296 592 3432

Matriz criterio de vecinos relativos estandarizada
Characteristics of weights list object:
Neighbour list object:
Number of regions: 111
Number of nonzero links: 296
Percentage nonzero weights: 2.402402
Average number of links: 2.666667
Weights style: W
Weights constants summary:
n nn S0 S1 S2
W 111 12321 111 89.23611 460.4583

Matriz criterio de Grafica de Gabriel
Matriz criterio de Grafica de Gabriel binaria
Characteristics of weights list object:
Neighbour list object:
Number of regions: 111
Number of nonzero links: 478
Percentage nonzero weights: 3.879555
Average number of links: 4.306306
Weights style: B
Weights constants summary:
n nn S0 S1 S2
B 111 12321 478 956 8856

Matriz criterio de Grafica de Gabriel estandarizada
Characteristics of weights list object:
Neighbour list object:
Number of regions: 111
Number of nonzero links: 478
Percentage nonzero weights: 3.879555
Average number of links: 4.306306
Weights style: W
Weights constants summary:
n nn S0 S1 S2
W 111 12321 111 54.56611 450.1411

Seleccion matriz
Indice de Moran
Con el fin de calcular la medida de autocorrelacion espacial se utiliza el indice de moran, con base en la siguiente expresion.
\[I=\frac{n}{\sum_{i=1}^{n} \sum_{j=1}^{n} W_{i j}} \frac{\sum_{i=1}^{n} \sum_{j=1}^{n} W_{i j}\left(z_{i}-\bar{z}\right)\left(z_{j}-\bar{z}\right)}{\sum_{i=1}^{n}\left(z_{i}-\bar{z}\right)^{2}}\] Aquí se seleccionara la matriz que maximice el Indice de moran
mat=list(rook_nb_b,rook_nb_w,
queen_nb_b,queen_nb_w,
tri_nb_b,tri_nb_w,
soi_nb_b,soi_nb_w,
gabriel_nb_b,gabriel_nb_w,
relative_nb_b,relative_nb_w,
knn1_nb_b,knn1_nb_w,
knn2_nb_b,knn2_nb_w,
knn3_nb_b,knn3_nb_w)
options(warn = -1)
aux=NULL
for(i in 1:length(mat))
{
aux[i] <- moran.test(datos$CMH20CONT,mat[[i]],
alternative="two.sided")$"statistic"
aux
}Donde se plantea la prueba de hipótesis como:
\[ \begin{aligned} H_{0}: & \textrm{ No existe autocorrelación espacial} \\[1pt] H_{1}: & \textrm{ Existe autocorrelación espacial} \end{aligned} \]
moran.test(datos$CMH20CONT,mat[[which.max(aux)]],
alternative="two.sided")
Moran I test under randomisation
data: datos$CMH20CONT
weights: mat[[which.max(aux)]]
Moran I statistic standard deviate = 4.187, p-value = 2.827e-05
alternative hypothesis: two.sided
sample estimates:
Moran I statistic Expectation Variance
0.234352367 -0.009090909 0.003380558
El resultado de la prueba establece un valor-\(p\) menor al valor \(\alpha\) (2.82e-05 <0.05), lo cual proporciona evidencia estadísticame significativa para rechazar \(H_0\) a un nivel de significancia del 5%, por lo cual se puede asegurar que existe autocorrelacion espacial.
En este caso, observando el valor de la estadística (0.234) se puede apreciar que la correlación espacial es positiva, indicando una relación directa entre los homicidios
Con base en los resultados obtenidos no se puede asumir independencia espacial, por lo cual se deberá incluir espacial en el modelo seleccionado.
mt<-moran.mc(datos$CMH20CONT,mat[[which.max(aux)]],
alternative="two.sided", nsim=1000)
plot(mt)
Indice de Moran Local
De igual manera se realiza el calculo del Indice de moran local (LISA), con el fin de identificar posibles clusteres espaciales.
LISA<-localmoran(datos$CMH20CONT,mat[[which.max(aux)]],zero.policy = TRUE)
mean(LISA[,1])[1] 0.2343524
Debido a que el indice de moran global es igual al indice local se establece que no existen el mismo comportamiento en zonas especificas, lo cual se corrobora mendiante los mapas:

Prueba de exceso de ceros
Debido a que se debe realizar un modelo de regresion con conteos se realiza la prueba de exceso de ceros
zero.test(datos$CMH20CONT) Score test for zero inflation
Chi-square = 22666.10015
df = 1
pvalue: < 2.22e-16