La seguridad ciudadana es un aspecto fundamental para la gestión pública y la toma de decisiones estratégicas en las ciudades. El análisis de datos históricos de criminalidad permite identificar patrones, tendencias temporales y características relevantes de los delitos, aportando información clave para la prevención y asignación eficiente de recursos.
En este informe se presenta un diagnóstico de los crímenes registrados en la ciudad de Chicago durante el primer semestre del año 2020, con el fin de describir su comportamiento general y extraer conclusiones relevantes a partir de los datos disponibles y proponer estrategias policiales.
¿Cuáles son los patrones temporales y las características más relevantes de los crímenes registrados en Chicago durante el primer semestre del año 2020?
En esta sección se presenta una descripción general del conjunto de datos utilizado, con el fin de comprender su estructura, tipología de variables y características principales. Este análisis inicial permite identificar la naturaleza de la información disponible, así como los tipos de datos que la componen, lo cual resulta fundamental para definir las estrategias de limpieza, transformación y preparación previas al análisis exploratorio y modelado. Asimismo, se establecen las bases para garantizar la coherencia, calidad y adecuada utilización de los datos en las etapas posteriores del estudio.
Se dispone de un archivo de datos en formato CSV que contiene registros de hechos delictivos ocurridos en la ciudad de Chicago durante el año 2020. El conjunto de datos está compuesto por 25 variables, que incluyen variables numéricas, categóricas y lógicas, las cuales describen las características del incidente, su clasificación, ubicación y condiciones asociadas. Esta estructura permite abordar el análisis desde una perspectiva descriptiva, temporal y espacial.
| Indicador | Detalle |
|---|---|
| Volumen Total de Datos | 91,318 incidentes |
| Variables Numéricas | 7 variables (Coords, Distritos) |
| Variables Categóricas | 9 variables (Tipos, Ubicación) |
| Ventana de Tiempo | Enero 2020 - Junio 2020 |
En esta sección se presenta el diccionario de variables del conjunto de datos, en el cual se describen las variables incluidas, su significado y el tipo de dato asociado. Este diccionario tiene como objetivo facilitar la comprensión de la información contenida en el conjunto de datos, asegurar una interpretación homogénea de las variables y servir como referencia para los procesos de análisis, transformación y modelado que se desarrollan en las etapas posteriores del estudio.
| Variable | Significado | Tipo |
|---|---|---|
| id | Identificador unico del registro del incidente | integer |
| case_number | Número único asignado al caso por la policia | character |
| date | Fecha y hora en que ocurrio el incidente | POSIXct |
| block | Bloque o direccion aproximada donde ocurrio el incidente | character |
| iucr | Codigo IUCR que clasifica el tipo de delito | character |
| primary_type | Categoria principal del delito | factor |
| description | Descripcion detallada del delito | character |
| location_description | Tipo de lugar donde ocurrio el incidente | factor |
| arrest | Indica si hubo arresto (Si/No) | logical |
| domestic | Indica si el incidente fue de violencia domestica | logical |
| beat | Zona policial (beat) donde ocurrio el incidente | integer |
| district | Distrito policial correspondiente | integer |
| ward | Distrito politico (ward) donde ocurrio el incidente | integer |
| community_area | Area comunitaria de la ciudad | integer |
| fbi_code | Codigo del FBI que clasifica el delito | character |
| x_coordinate | Coordenada X del sistema cartografico local | numeric |
| y_coordinate | Coordenada Y del sistema cartografico local | numeric |
| year | Anio en que ocurrio el incidente | integer |
| updated_on | Fecha y hora de la ultima actualizacion del registro | POSIXct |
| latitude | Latitud geografica del lugar del incidente | numeric |
| longitude | Longitud geografica del lugar del incidente | numeric |
| location | Par de coordenadas geograficas (latitud, longitud) | character |
| hash | Identificador hash del registro | character |
| point_date | Fecha asociada al punto geografico | POSIXct |
| geom | Geometria espacial del incidente | sf / sfc |
| Total de crímenes | Porcentaje de arrestos | Porcentaje de delitos domésticos |
|---|---|---|
| 91318 | 18% | 19% |
Del total de 91.318 crímenes registrados, aproximadamente 18% resultaron en arresto y 19% fueron delitos domésticos. Esto indica que solo una minoría de los delitos llevan a un arresto, y una minoria son delitos domésticos.
El análisis por tipo de delito muestra que el hurto fue el más frecuente, seguido por agresiones físicas y daños, concentrando la mayor parte de los casos reportados. En contraste, delitos como homicidio, secuestro, tráfico de personas y delitos sexuales presentan una menor frecuencia relativa.
En cuanto a la ubicación, los delitos se registraron principalmente en vías públicas, residencias y apartamentos, los cuales representan la mayor proporción de los casos frente a otros entornos como comercios, instituciones o medios de transporte.
Desde la perspectiva temporal, los registros mensuales evidencian mayores volúmenes de crímenes en los primeros meses del año, con una reducción hacia los meses posteriores. A nivel horario, la intensidad de los delitos aumenta durante las horas de la tarde y la noche, concentrándose entre el final de la jornada laboral y la medianoche.
Analizamos la distribución temporal para optimizar la asignación de turnos de vigilancia.
Este gráfico permite identificar las “ventanas de riesgo” donde la probabilidad de un incidente es máxima. Se observa claramente que el periodo de menor riesgo ocurre consistentemente en las primeras horas de la mañana, entre las 4:00 y las 7:00 a.m., mientras que la actividad de incidentes aumenta significativamente hacia la tarde y la noche. Destaca una franja vertical negra muy marcada a las 12:00 del mediodía en todos los días de la semana, lo que sugiere un pico sistemático de incidentes a esa hora; además, se nota que los fines de semana presentan una mayor intensidad de incidentes en las horas de la madrugada en comparación con los días laborables.
Observamos la estacionalidad del delito para prever picos operativos. El gráfico muestra la evolución semestral de cinco tipologías delictivas, evidenciando una clara segmentación entre delitos de alto volumen y de bajo impacto. Aunque la tendencia general es decreciente hacia el final del periodo, destacando una caída drástica en junio donde todas las categorías alcanzan sus mínimos, el comportamiento se ve interrumpido por un notable repunte en mayo para los delitos más frecuentes, antes de desplomarse finalmente, punto en el cual incluso la categoría históricamente dominante sobre delitos de patrimonio cae por debajo de otras tipologías.
Aplicamos el principio de Pareto para identificar qué delitos consumen la mayor parte de los recursos de seguridad. Este diagrama de Pareto jerarquiza los 15 delitos más frecuentes, revelando una concentración crítica en la parte izquierda del gráfico donde el Hurto y la Agresión Física dominan las estadísticas, alcanzando cada uno cifras cercanas a los 18,000 casos. La línea roja de porcentaje acumulado evidencia que estas dos categorías, sumadas a Daño a Propiedad, Asalto/Amenaza y Fraude, constituyen aproximadamente el 75% de la carga total del sistema, cumpliendo con el principio de que unos pocos tipos de delitos generan la mayor parte del volumen de incidentes; esto sugiere que los esfuerzos de mitigación tendrían un impacto masivo si se enfocan prioritariamente en este grupo superior en lugar de en los delitos de menor frecuencia ubicados a la derecha.
Visualización de la densidad criminal para la focalización de patrullajes.
El mapa de calor geoespacial identifica con precisión los puntos calientes de criminalidad en Chicago, revelando una clara polarización en dos zonas críticas principales: un foco de altísima densidad en el área céntrica y comercial correspondiente a los Distritos 1 y 18, y un segundo conglomerado intenso hacia el oeste, centrado fuertemente en el Distrito 11 y extendiéndose hacia los distritos 10 y 15. Esta visualización confirma que la actividad delictiva no es uniforme en la ciudad, sino que se agrupa en núcleos específicos, contrastando con vastas áreas del sur como los distritos 5, 6 y 22 y el extremo norte que muestran una densidad comparativamente menor, lo cual señala objetivamente dónde deberían concentrarse los recursos de intervención prioritaria.
El gráfico de intersección muestra una clara correlación entre el tipo de delito y el entorno donde ocurre, revelando que la violencia interpersonal relacionada con la agresión física es el fenómeno de mayor volumen y se concentra masivamente en espacios privados como apartamentos y residencias, lo que sugiere una fuerte componente de violencia doméstica. Por el contrario, delitos patrimoniales como el hurto dominan en espacios abiertos, especialmente en la vía pública, aunque también afectan significativamente a las residencias. Esta visualización permite concluir que mientras los delitos violentos tienden a ocurrir en lugares cerrados, los delitos contra la propiedad y el orden público como el narcotráfico en aceras predominan en el espacio urbano exterior.
El gráfico destaca una anomalía positiva crítica en el Distrito 11. A pesar de tener, por un margen significativo, la mayor carga de trabajo también presenta la tasa de arrestos más alta cercano al 30%. Esto rompe con la tendencia general del resto de los distritos, donde la tasa de efectividad se mantiene relativamente estancada entre el 10% y el 20%, independientemente de si el volumen de crímenes es bajo o medio-alto. Esto sugiere que en el Distrito 11, la alta actividad criminal podría estar correlacionada con delitos que generan arrestos inmediatos como posesión de drogas o alteraciones del orden.
Con el fin de facilitar el análisis y la interpretación de la información, los distintos tipos de delitos (primary_type) fueron agrupados en categorías más amplias, de acuerdo con la naturaleza del delito y el bien jurídico afectado. Esta categorización permite reducir la dispersión de eventos, mejorar la lectura de las visualizaciones y analizar patrones temporales y espaciales de forma más estructurada.
Las categorías definidas son las siguientes:
Delitos contra la propiedad: incluyen hechos cuyo objetivo principal es la apropiación, daño o uso indebido de bienes, tales como hurto, robo, allanamiento, daño criminal, incendio y fraude.
Delitos contra la persona: agrupan conductas que atentan directamente contra la integridad física o la vida de las personas, como homicidio, agresiones físicas, secuestro e intimidación.
Delitos sexuales: comprenden los delitos relacionados con agresiones sexuales, explotación sexual, prostitución, obscenidad y conductas sexuales ilegales, incluyendo aquellas que involucran menores de edad.
Delitos relacionados con drogas: incluyen la posesión, tráfico u otras infracciones asociadas a sustancias narcóticas.
Delitos con armas: corresponden a infracciones relacionadas con la posesión, uso o porte ilegal de armas.
Delitos contra el orden público y la autoridad: agrupan comportamientos que afectan la convivencia, el orden social o el ejercicio de la autoridad, como alteraciones al orden público, interferencia con funcionarios, violaciones a leyes de licor, juegos de azar y conductas indecentes en espacios públicos.
Otros delitos: categoría residual que agrupa delitos menos frecuentes o de naturaleza diversa que no encajan claramente en las categorías anteriores, como tráfico de personas u otras infracciones atípicas.
El gráfico de barras apiladas al 100% revela una estabilidad estructural notable en la composición del crimen durante el semestre. Los Delitos Contra la Propiedad dominan consistentemente el panorama, representando cerca de la mitad de todos los incidentes entre 45% y 51%, seguidos por los Delitos Violentos, que oscilan entre el 27% y el 33%. Sin embargo, se observa un cambio cualitativo importante en junio, mientras la proporción de delitos patrimoniales cae a su mínimo en 45%, los delitos violentos y las infracciones de armas alcanzan su máximo relativo del semestre a 33% y 6% respectivamente, lo que sugiere que, aunque el volumen total pueda variar, la gravedad de la mezcla delictiva tiende a intensificarse hacia el inicio del verano.
El gráfico de distribución mensual por ubicación revela una dinámica de desplazamiento del riesgo entre el espacio privado y el público. Se observa un predominio estructural de dos entornos: Residencia y Vivienda y Vía Pública y Exterior, que juntos acaparan cerca del 70-75% de la incidencia delictiva. Sin embargo, el comportamiento temporal muestra una correlación inversa notable: mientras que los delitos en residencias alcanzan su punto crítico en abril (47%) coincidiendo probablemente con medidas de confinamiento, hacia el final del semestre esta proporción desciende para dar paso a un aumento significativo de la criminalidad en la vía pública, que alcanza su máximo del periodo con un 36%. Esto confirma que el crimen no desaparece, sino que se adapta a los patrones de movilidad ciudadana, trasladándose del interior de los hogares hacia las calles conforme se acerca el verano.
El mapa de intensidad vial revela la anatomía del crimen en Chicago, desmintiendo la idea de que la inseguridad se distribuye uniformemente en vulnerables. La visualización confirma que el delito se adhiere a la estructura urbana, concentrándose intensamente a lo largo de ejes viales primarios y corredores comerciales, mientras que las calles residenciales interiores o paralelas permanecen comparativamente en calma. Se observa una concentración sistémica en la red densa del distrito central y una propagación lineal hacia el oeste y el sur a través de avenidas principales, lo que sugiere operativamente que la estrategia de vigilancia debería transicionar de un enfoque por áreas de cuadrante a uno de patrullaje de corredores.
El análisis de la criminalidad en Chicago durante el primer semestre de 2020 revela una estructura delictiva rígida pero con movilidad estacional. A pesar de las fluctuaciones mensuales, se confirma el Principio de Pareto, donde un núcleo reducido de tipologías como Hurto y Agresión Física genera sistemáticamente cerca del 75% de la carga del sistema. No obstante, se evidencia un fenómeno crítico de desplazamiento del riesgo mientras que las medidas de confinamiento concentraron el delito en espacios residenciales durante abril, la llegada del verano en junio detonó una migración masiva de la incidencia hacia la vía pública, lo que exige que la estrategia policial evolucione dinámicamente de una vigilancia doméstica a una saturación de espacios abiertos según la época del año.
Desde la perspectiva espacial, el mapeo de intensidad vial desmiente la distribución uniforme de la inseguridad, demostrando que el crimen se adhiere a la anatomía urbana. Los focos de calor no son áreas difusas, sino que siguen patrones reticulares a lo largo de ejes viales principales y corredores comerciales específicos, comportándose como arterias de alta actividad que conectan el centro Distrito 1 y 18 con el oeste Distrito 11. Esto sugiere que el patrullaje debe abandonar los enfoques por cuadrantes generales para priorizar la intervención quirúrgica sobre estos corredores viales identificados, optimizando la presencia en las rutas de mayor flujo delictivo.
Finalmente, el análisis de eficiencia operativa destaca al Distrito 11 como un caso de estudio excepcional. A pesar de enfrentar la mayor carga de trabajo de la ciudad, este distrito mantiene las tasas de arresto más altas, rompiendo la tendencia de saturación observada en otras zonas. Este hallazgo implica que el alto volumen delictivo no conduce necesariamente a la ineficiencia policial, y sugiere que las tácticas de respuesta agresiva implementadas en esta zona podrían replicarse en otros distritos críticos para cerrar la brecha de impunidad, especialmente en delitos violentos y de orden público.