Maestrante de la Universidad Estatal Peninsula de Santa Elena

Introducción

El análisis de la criminalidad es un aspecto clave en la formulación de políticas de seguridad pública y en la comprensión de los factores que influyen en la incidencia delictiva. Este informe se basa en la base de datos USArrests, que proporciona información sobre los índices de arrestos por crímenes violentos en los Estados Unidos, organizados por estado.

Los datos, recopilados por el FBI en 1973, incluyen cuatro variables principales:

Objetivos

El objetivo de este análisis es identificar patrones en las tasas de criminalidad y su relación con la urbanización, lo que puede proporcionar información valiosa sobre tendencias y factores asociados a la violencia en los diferentes estados de EE.UU.

Análisis exploratorio de datos

Presentacion de bases de datos

colnames(USArrests) <- c("Asesinatos", "Asaltos", "Poblacion_Urbana", "Violaciones")
USArrests
##                Asesinatos Asaltos Poblacion_Urbana Violaciones
## Alabama              13.2     236               58        21.2
## Alaska               10.0     263               48        44.5
## Arizona               8.1     294               80        31.0
## Arkansas              8.8     190               50        19.5
## California            9.0     276               91        40.6
## Colorado              7.9     204               78        38.7
## Connecticut           3.3     110               77        11.1
## Delaware              5.9     238               72        15.8
## Florida              15.4     335               80        31.9
## Georgia              17.4     211               60        25.8
## Hawaii                5.3      46               83        20.2
## Idaho                 2.6     120               54        14.2
## Illinois             10.4     249               83        24.0
## Indiana               7.2     113               65        21.0
## Iowa                  2.2      56               57        11.3
## Kansas                6.0     115               66        18.0
## Kentucky              9.7     109               52        16.3
## Louisiana            15.4     249               66        22.2
## Maine                 2.1      83               51         7.8
## Maryland             11.3     300               67        27.8
## Massachusetts         4.4     149               85        16.3
## Michigan             12.1     255               74        35.1
## Minnesota             2.7      72               66        14.9
## Mississippi          16.1     259               44        17.1
## Missouri              9.0     178               70        28.2
## Montana               6.0     109               53        16.4
## Nebraska              4.3     102               62        16.5
## Nevada               12.2     252               81        46.0
## New Hampshire         2.1      57               56         9.5
## New Jersey            7.4     159               89        18.8
## New Mexico           11.4     285               70        32.1
## New York             11.1     254               86        26.1
## North Carolina       13.0     337               45        16.1
## North Dakota          0.8      45               44         7.3
## Ohio                  7.3     120               75        21.4
## Oklahoma              6.6     151               68        20.0
## Oregon                4.9     159               67        29.3
## Pennsylvania          6.3     106               72        14.9
## Rhode Island          3.4     174               87         8.3
## South Carolina       14.4     279               48        22.5
## South Dakota          3.8      86               45        12.8
## Tennessee            13.2     188               59        26.9
## Texas                12.7     201               80        25.5
## Utah                  3.2     120               80        22.9
## Vermont               2.2      48               32        11.2
## Virginia              8.5     156               63        20.7
## Washington            4.0     145               73        26.2
## West Virginia         5.7      81               39         9.3
## Wisconsin             2.6      53               66        10.8
## Wyoming               6.8     161               60        15.6

Explicación de la Variables

1.Asesinatos

Esta variable representa la tasa de homicidios intencionales por cada 100,000 habitantes en cada estado de EE.UU.

Características principales:

  • Expresada en número de asesinatos por cada 100,000 habitantes.

  • Valores típicos en la base de datos van desde 0.8 hasta 17.4 asesinatos por cada 100,000 habitantes.

  • Estados con valores altos pueden indicar problemas de violencia, crimen organizado o inseguridad social.

2.Asaltos

Representa la tasa de asaltos violentos registrados por cada 100,000 habitantes en cada estado de EE.UU.

Características principales:

  • Se mide en incidentes de asalto por cada 100,000 habitantes.

  • Sus valores oscilan entre 45 y 337 asaltos por cada 100,000 habitantes.

  • Es la variable con los valores más altos en comparación con las demás.

3.Poblacion Urbana en

  • Se expresa en porcentaje (%), con valores entre 32% y 91%.

  • No representa el tamaño total de la población, sino la proporción de personas que viven en zonas urbanas dentro de cada estado.

  • Es un factor clave para analizar cómo la urbanización puede influir en las tasas de criminalidad

4.Violaciones

Representa la tasa de delitos de agresión sexual por cada 100,000 habitantes en cada estado.

Características principales:

  • Se mide en casos de violaciones por cada 100,000 habitantes.

  • Sus valores van desde 7.3 hasta 46.0 violaciones por cada 100,000 habitantes.

  • Es importante analizar esta variable en conjunto con UrbanPop, ya que puede haber una relación entre la urbanización y los delitos sexuales.

Resumen Estadístico

summary(USArrests)
##    Asesinatos        Asaltos      Poblacion_Urbana  Violaciones   
##  Min.   : 0.800   Min.   : 45.0   Min.   :32.00    Min.   : 7.30  
##  1st Qu.: 4.075   1st Qu.:109.0   1st Qu.:54.50    1st Qu.:15.07  
##  Median : 7.250   Median :159.0   Median :66.00    Median :20.10  
##  Mean   : 7.788   Mean   :170.8   Mean   :65.54    Mean   :21.23  
##  3rd Qu.:11.250   3rd Qu.:249.0   3rd Qu.:77.75    3rd Qu.:26.18  
##  Max.   :17.400   Max.   :337.0   Max.   :91.00    Max.   :46.00

Interpretación de los datos

Asesinatos

  • Min: 0.600 El valor mínimo de asesinatos por 100,000 habitantes es de 0.6 en el estado con la tasa más baja.

  • 1st Qu.: 4.140 El primer cuartil indica que el 25% de los estados tienen una tasa de asesinatos de 4.14 o menos. En otras palabras, 25% de los estados tienen tasas de asesinatos bajas.

  • Median: 7.010 La mediana es 7.01, lo que significa que el 50% de los estados tienen tasas de asesinatos inferiores a 7.01 y el 50% tienen tasas mayores. Es el valor central de los datos.

  • Mean: 7.786 La media o promedio es 7.79, lo que nos indica que la tasa promedio de asesinatos por 100,000 habitantes es de 7.79. La media puede ser influenciada por valores extremos, por lo que es importante compararla con la mediana.

  • 3rd Qu.: 11.770 El tercer cuartil indica que el 75% de los estados tienen una tasa de asesinatos de 11.77 o menos.

  • Max: 15.400 El valor máximo es 15.4, lo que significa que el estado con la mayor tasa de asesinatos tiene 15.4 asesinatos por cada 100,000 habitantes.

Visualización de la Distribución de la Poblacion Urbana

Podemos usar un histograma para ver la distribución de la Poblacion Urbana:

hist(USArrests$Poblacion_Urbana, 
     col="blue", 
     main="Distribución de la Población Urbana en EE.UU.", 
     xlab="Porcentaje de Población Urbana", 
     ylab="Frecuencia")

Esto nos permitirá ver si hay más estados con alta o baja urbanización.

Mapa de calor de correlaciones

Para entender las relaciones entre las variables, se calculará y visualizará una matriz de correlación.

library(corrplot)
## corrplot 0.95 loaded
cor_matrix <- cor(USArrests)
corrplot(cor_matrix, method="color", type="upper", tl.col="black", tl.srt=45)

Relación entre la Poblacion Urbana y los Asesinatos

El análisis de la relación entre la población urbana y los asesinatos busca identificar si existe alguna tendencia o patrón que vincule la urbanización con las tasas de crímenes violentos, en este caso, los asesinatos. La pregunta central que estamos tratando de responder es: ¿A medida que la proporción de la población urbana aumenta en un estado, también aumenta la tasa de asesinatos?

Podemos analizar si existe una correlación entre el porcentaje de población urbana y los delitos violentos. Por ejemplo:

cor(USArrests$Poblacion_Urbana, USArrests$Asesinatos)
## [1] 0.06957262

Como la correlación es positiva, indica que a mayor Poblacion urbana, mayor número de asesinatos.

También podemos visualizarlo con un gráfico de dispersión:

library(ggplot2)
ggplot(USArrests, aes(x=Poblacion_Urbana, y=Asesinatos)) +
  geom_point(color="red") +
  geom_smooth(method="lm", col="blue") +
  labs(title="Relación entre la Poblacion Urbana y Asesinatos",
       x="Población Urbana (%)",
       y="Asesinatos por 100,000 habitantes")
## `geom_smooth()` using formula = 'y ~ x'

Este gráfico nos mostrará lo siguiente:

  • Puntos azules: Cada punto representa un estado, con su porcentaje de población urbana en el eje X y la tasa de asesinatos en el eje Y.

  • Línea roja: La línea de regresión lineal ajustada que nos ayudará a visualizar la tendencia general.

Si la línea de regresión tiene una pendiente positiva, esto indicaría que existe una relación positiva entre la Población Urbana y los Asesinatos: es decir, a medida que aumenta la proporción de población urbana, los asesinatos también tienden a aumentar.

Analices de la relación entre los asaltos y las violaciones:

Cuando analizamos la relación entre dos variables como Asaltos y Violaciones, estamos interesados en cómo estas dos variables están relacionadas entre sí. En este caso, ambas son crímenes violentos reportados por cada estado de EE. UU., por lo que se podría esperar que existiera algún tipo de correlación, es decir, que cuando una variable aumenta (por ejemplo, los asaltos), la otra también lo haga (las violaciones).

ggplot(USArrests, aes(x=Asaltos, y=Violaciones)) +
  geom_point(color="darkgreen") +
  geom_smooth(method="lm", col="red") +
  labs(title="Relación entre Asaltos y Violaciones",
       x="Asaltos por 100,000 habitantes",
       y="Violaciones por 100,000 habitantes")
## `geom_smooth()` using formula = 'y ~ x'

Este gráfico nos mostrará:

  • Puntos Verdes: Cada punto representa un estado y sus tasas de Asaltos y Violaciones.

  • Línea roja: Representa la línea de ajuste de mínimos cuadrados (regresión lineal), que nos ayuda a visualizar la relación general.

Si la línea roja es ascendente, indica que existe una relación positiva entre Asaltos y Violaciones: es decir, a medida que aumentan los asaltos, también aumentan las violaciones. Si la línea es plana o descendente, sugiere que no hay o existe una relación negativa entre ambas variables.

Ciudades con Mayor numero de asesinatos

El análisis de las ciudades con mayor número de asesinatos nos permite identificar cuáles son los estados (o ciudades) que tienen las tasas más altas de asesinatos en los Estados Unidos. Al observar esta información, podemos intentar descubrir patrones o factores que podrían estar contribuyendo a las altas tasas de homicidio, como características socioeconómicas, políticas de seguridad pública, entre otros.

library(tibble)

library(ggplot2)

library(dplyr)
## 
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
miUSArrests <- USArrests
miUSArrests <- USArrests %>% rownames_to_column(var = "Estado")
top_Asesinato <- miUSArrests %>% arrange(desc(Asesinatos)) %>% slice_head(n = 5)
ggplot(top_Asesinato, aes(x = reorder(Estado, Asesinatos), y = Asesinatos, fill=Asesinatos)) +
  geom_bar(stat = "identity") +
  coord_flip() +  # Girar el gráfico para mejor visualización
  labs(title = "Top 10 de las ciudades con mayor tasa de asesinatos en EE.UU.",
       x = "Ciudad",
       y = "Asesinatos por 100,000 habitantes") +
  theme_minimal() +
  scale_fill_gradient(low="yellow", high="blue")

Conclusiones

  1. Correlaciones: Se observa una fuerte correlación entre las tasas de asesinatos, asaltos y violaciones, lo que sugiere que los estados con altos índices de un tipo de crimen suelen tener altos índices de los otros.

  2. Impacto de la Urbanización: No se observa una correlación clara entre la urbanización y los crímenes violentos, lo que indica que otros factores pueden estar influyendo en las tasas de criminalidad.

  3. Clustering: Se identificaron tres grupos de estados con diferentes niveles de criminalidad, lo que podría servir como base para estrategias de seguridad diferenciadas según la región.

Este análisis proporciona una visión general de la criminalidad en los EE.UU. y cómo los diferentes factores pueden estar relacionados con los niveles de violencia en cada estado.