Introducción

El presente informe se fundamenta en el conjunto de datos Chicago Crime 2020, el cual recopila información detallada sobre los crímenes reportados en la ciudad de Chicago durante el primer semestre del año 2020.

A partir de este conjunto de datos, se desarrolla un análisis exploratorio y descriptivo orientado a examinar la distribución de los crímenes en el tiempo (diaria y mensual), la frecuencia de los distintos tipos de delitos, la relación entre los crímenes y los arrestos, así como su localización espacial dentro de la ciudad. Para ello, se emplean técnicas de visualización de datos tales como gráficos de barras, series temporales, boxplots, histogramas, diagramas de torta y mapas geográficos, con el fin de facilitar la interpretación de los resultados.

Pregunta de investigación

¿Qué patrones y comportamientos relevantes se pueden identificar al analizar los datos criminalidad en la ciudad de Chicago durante 2020?

Conjunto de datos

El dataset incluye variables identificadoras como el ID del caso y el número de expediente, así como atributos temporales relevantes, entre los que se destacan la fecha y hora de ocurrencia del delito, el año y las variables derivadas utilizadas en el análisis, como el mes y la fecha diaria. Estas variables facilitan el estudio de patrones diarios y mensuales en la ocurrencia de los crímenes.

En términos de clasificación delictiva, la base de datos incorpora campos como tipo primario de crimen (primary_type), descripción del delito, y código FBI, lo cual permite agrupar y comparar los diferentes tipos de infracciones según su naturaleza. Asimismo, se incluyen variables operativas como arresto y violencia doméstica, que aportan información clave sobre la respuesta institucional y el contexto del delito.

Desde una perspectiva geográfica, el dataset contiene coordenadas de latitud y longitud, así como referencias administrativas como distrito policial, zona comunitaria, ward y beat, lo que posibilita la visualización espacial de los eventos criminales y la identificación de concentraciones geográficas dentro de la ciudad de Chicago.

A continuación se presenta el mapa de crímenes cometidos entre enero y junio del 2020.

## R Markdown

Con el fin de identificar cuáles son los delitos más frecuentes en la ciudad de Chicago durante el año 2020, se presenta a continuación un análisis de la cantidad total de crímenes por tipo. Este gráfico permite comparar la incidencia relativa de cada categoría delictiva y reconocer aquellos tipos de crimen que concentran la mayor proporción de casos reportados. El análisis facilita una comprensión general de la estructura delictiva de la ciudad y sirve como punto de partida para la identificación de patrones relevantes en la criminalidad.

## R Markdown

En este gráfico de radar se presentan los 15 crímenes más comunes en el primer semestre del 2020:

## R Markdown

Con el objetivo de analizar el comportamiento de la criminalidad a lo largo del tiempo, se presenta la evolución mensual del número de crímenes registrados. Este gráfico permite identificar tendencias temporales, variaciones entre meses y posibles cambios en la intensidad de la actividad delictiva, proporcionando una visión general de la dinámica mensual de los crímenes en el periodo analizado, donde en general se evidencia una tendencia decreciente.

## R Markdown

El gráfico boxplot presenta la distribución de la cantidad diaria de crímenes para cada mes del periodo analizado, permitiendo comparar la variabilidad, tendencia central y presencia de valores atípicos entre los meses de enero a junio de 2020.

El gráfico evidencia una dinámica temporal clara en la criminalidad diaria de Chicago durante el primer semestre de 2020, caracterizada por un nivel elevado al inicio del año, una caída pronunciada a mediados del semestre y un repunte posterior, pero en general se observa que la mediana por mes ha sido descendente en comparación al mes de enero, lo que nos indica que con respecto al primer mes ha disminuido.

## R Markdown

El histograma permite observar la forma de la distribución de los crímenes diarios, la línea vertical punteada en color rojo señala la mediana de la distribución.

Se evidencia que la mayoría de los días presentan una cantidad de crímenes cercana a la mediana, lo que indica un comportamiento relativamente estable de la criminalidad diaria. Sin embargo, la presencia de valores extremos hacia niveles altos explica la variabilidad observada en el boxplot mensual, donde se identifican días con incrementos significativos en el número de crímenes.

## R Markdown

El diagrama de torta evidencia una marcada diferencia entre los crímenes que derivaron en un arresto y aquellos que no. Aproximadamente el 82,2 % de los delitos registrados no culminaron en arresto, mientras que solo el 17,8 % de los casos resultaron en la detención de al menos una persona involucrada.

## R Markdown

A continuación muestra la distribución diaria de crímenes diferenciando los casos que derivaron en arresto y aquellos que no resultaron en arresto, para cada mes del periodo analizado. A través de boxplots, se comparan tanto la tendencia central (mediana) como la variabilidad diaria de ambos grupos, permitiendo evaluar el comportamiento mensual de la criminalidad y la respuesta policial asociada.

El gráfico evidencia que la mayor parte de la criminalidad diaria en Chicago durante el primer semestre de 2020 no culminó en arrestos, y que los días con mayor volumen de delitos corresponden principalmente a casos sin detención. Esta diferencia persistente resalta la necesidad de profundizar en el análisis de los factores asociados a la efectividad de los arrestos y su relación con el tipo de delito

Conclusiones

El análisis descriptivo de los datos de criminalidad en la ciudad de Chicago durante el año 2020 permitió identificar una serie de patrones temporales, estructurales y operativos que aportan una comprensión integral del comportamiento delictivo en el periodo analizado.

En primer lugar, se evidencian patrones temporales claros en la ocurrencia de los crímenes. La criminalidad diaria presenta niveles más elevados durante los primeros meses del año, con una disminución significativa en marzo y abril, seguida de un repunte gradual en mayo y junio. Este comportamiento sugiere que la actividad delictiva no se mantiene constante a lo largo del tiempo, sino que responde a cambios contextuales que influyen directamente en su dinámica.

En cuanto a la estructura delictiva, el análisis por tipo de crimen muestra que ciertos delitos concentran una mayor proporción de los casos reportados, lo que indica una concentración de la criminalidad en categorías específicas. Esta distribución desigual resalta la importancia de priorizar estrategias de prevención y control focalizadas en los tipos de delito con mayor incidencia.

Desde una perspectiva operativa, los resultados revelan que la mayoría de los crímenes no derivan en arresto, evidenciando una brecha consistente entre el volumen de delitos registrados y los casos que culminan con detención. Esta diferencia se mantiene a lo largo de todos los meses analizados y es más pronunciada en los días con mayor cantidad de crímenes, lo que sugiere limitaciones en la capacidad de respuesta inmediata frente a picos de criminalidad.

Adicionalmente, el análisis de la variabilidad diaria muestra la presencia de valores atípicos, correspondientes a días con niveles excepcionalmente altos o bajos de crímenes. Estos eventos extremos influyen en la dispersión de los datos y ponen de manifiesto la importancia de utilizar medidas robustas, como la mediana, para describir el comportamiento típico de la criminalidad diaria.

Finalmente, la visualización espacial de los crímenes permite identificar una concentración geográfica de los eventos delictivos en determinadas zonas de la ciudad, lo que confirma que la criminalidad no se distribuye de manera homogénea en el territorio urbano. Este patrón espacial refuerza la necesidad de enfoques de seguridad diferenciados según la ubicación.