Se proporciona información de los homicidios registrados en un periodo de tiempo en la ciudad de cali y se desea con base en estos datos realizar una estrategia que permita por medio de la identidicación de caracteristicas relevantes a nivel de individuo y espacial cuales son las zonas de mayor prioridad para mejorar la seguridad en la ciudad y las caracteristicas de los eventos
Como señala Paula Moraga en su libro, los patrones de puntos son conjuntos de ubicaciones que representan eventos observados en el espacio, como resultado de procesos aleatorios que ocurren en una región específica. Estos patrones pueden variar en cantidad y distribución dependiendo de cada realización del proceso. Por esta razón, se suelen estudiar en diversos contextos, como en este caso, la distribución de homicidios en las comunas de la ciudad de Cali, cuyas ubicaciones se muestran en la siguiente figura.
Figura 11. Distribución espacial de homicidios en las comunas de Cali
Para obtener una idea del patrón de puntos espaciales, podemos calcular la intensidad de los eventos, que indica el número medio de eventos por unidad de área. En la figura 12 podemos observar que la intensidad de homicidios varia en toda la ciudad con una intensidad promedio de 0,00003966978 homicidios por cada 30 metros. Aquí se observan zonas con de alta densidad(color amarillo mas pronunciado). Es decir, áreas donde los homicidios están concentrados, con una mayor cantidad de homicidios en comparación con otras áreas.
Figura 12. Densidad de homicidios en la ciudad de Santiago de Cali
La aleatoriedad espacial completa (CSR) es el modelo más simple para describir la distribución de eventos, donde los puntos (homicidios, en este caso) ocurren de manera completamente aleatoria dentro de un área, sin influencias entre ellos.
Realizar este análisis sirve como base para comparar si los homicidios siguen una distribución aleatoria o si existen patrones más complejos, como agrupamientos o distribuciones regulares. Si el patrón de homicidios se desvía de la CSR, esto sugiere que hay factores que afectan la distribución, como áreas con alta criminalidad (agrupados) o mecanismos de control (regulares). Esta comparación ayudará a entener mejor los factores que influyen en la ocurrencia de homicidios en diferentes zonas.
Se utilizó la función quadrat.test() del paquete spatstat, el cual realiza una prueba estadística de aleatoriedad espacial completa (CSR) en un patrón de puntos, basada en los conteos dentro de una cuadrícula de celdas, como se observa en la Figura 13.
##
## Chi-squared test of CSR using quadrat counts
##
## data: homicidios_ppp
## X2 = 3378, df = 10, p-value < 2.2e-16
## alternative hypothesis: two.sided
##
## Quadrats: 11 tiles (irregular windows)
La prueba da como resultado un p-value de 2.2e-16, por lo que hay evidencia estadísticamente significativa para rechazar la hipótesis de CSR. Esto indica que los homicidios no están distribuidos aleatoriamente en el área, sino que muestran un patrón no aleatorio (agrupado o regular).
Figura 13. Método del cuadrante para aleatoriedad
Para analizar el patrón espacial de homicidios en Cali, se utilizó
nuevamente la función Kest()
del paquete
spatstat
para estimar la función \(K\) de un patrón de puntos espaciales. Este
análisis evalúa si el patrón espacial observado presenta características
de agrupamiento, regularidad o aleatoriedad.
La función \(K\) fue estimada
utilizando diferentes métodos de corrección de bordes
(border
, isotropic
y translate
),
junto con la función teórica \(K(s) = \pi
s^2\) para un proceso de Poisson homogéneo.Adicionalmente se
realizó la transformación \(L\), la
cual normaliza la función \(K\) para
que, bajo la hipótesis de un proceso de Poisson homogéneo, la función
\(L\) teórica sea una línea recta con
pendiente cero esto facilita la interpretación visual. La estimación de
la función \(K\) se realizó de la
siguiente manera:
## number of data points exceeds 3000 - computing border correction estimate only
Figura 14. Funciones K y L para aleatoriedad de homicidios.
## number of data points exceeds 3000 - computing border correction estimate only
Figura 14. Funciones K y L para aleatoriedad de homicidios.
Como observamos en las anteriores representación, la \(K\) y la \(L\) estimada se encuentra por encima de la línea teórica de un proceso de Poisson homogéneo, esto indica que el patrón de puntos observado muestra agrupamiento, es decir, que hay más puntos (homicidios) cercanos entre sí de lo que se esperaría si los puntos fueran distribuidos aleatoriamente.
Como sabemos que los homicidios no se produjeron aleatoriamnete, sino mas bien de una manera agrupada por zonas de la ciudad de cali.
Figura 15. Cantidad de homicidios por comuna
Como podemos observar anteriormente las comunas con los números más altos de homicidios son las comunas 15, 14 y 13, con 552, 504 y 488 homicidios respectivamente. Estas comunas tienen más del 20% del total de homicidios registrados en el conjunto de datos.seguidos de la Comuna 21 que también presenta un número significativo de homicidios con 398 homicidios.
Por otro lado, las comunas 20, 6 y 18 tienen una cantidad de homicidios que ronda entre 262 y 213, lo que indica que estas zonas también son relevantes, aunque con una incidencia menor que las anteriores.
Por último, las comunas con menor número de homicidios son comunas 22, 5 y 1, con 7, 63 y 72 homicidios respectivamente. Es posible que estas zonas cuenten con una menor densidad poblacional.