Maestrante de la Universidad Estatal Peninsula de Santa Elena
El análisis de la criminalidad es un aspecto clave en la formulación de políticas de seguridad pública y en la comprensión de los factores que influyen en la incidencia delictiva. Este informe se basa en la base de datos USArrests, que proporciona información sobre los índices de arrestos por crímenes violentos en los Estados Unidos, organizados por estado.
Los datos, recopilados por el FBI en 1973, incluyen cuatro variables principales:
El objetivo de este análisis es identificar patrones en las tasas de criminalidad y su relación con la urbanización, lo que puede proporcionar información valiosa sobre tendencias y factores asociados a la violencia en los diferentes estados de EE.UU.
colnames(USArrests) <- c("Asesinatos", "Asaltos", "Poblacion_Urbana", "Violaciones")
USArrests
## Asesinatos Asaltos Poblacion_Urbana Violaciones
## Alabama 13.2 236 58 21.2
## Alaska 10.0 263 48 44.5
## Arizona 8.1 294 80 31.0
## Arkansas 8.8 190 50 19.5
## California 9.0 276 91 40.6
## Colorado 7.9 204 78 38.7
## Connecticut 3.3 110 77 11.1
## Delaware 5.9 238 72 15.8
## Florida 15.4 335 80 31.9
## Georgia 17.4 211 60 25.8
## Hawaii 5.3 46 83 20.2
## Idaho 2.6 120 54 14.2
## Illinois 10.4 249 83 24.0
## Indiana 7.2 113 65 21.0
## Iowa 2.2 56 57 11.3
## Kansas 6.0 115 66 18.0
## Kentucky 9.7 109 52 16.3
## Louisiana 15.4 249 66 22.2
## Maine 2.1 83 51 7.8
## Maryland 11.3 300 67 27.8
## Massachusetts 4.4 149 85 16.3
## Michigan 12.1 255 74 35.1
## Minnesota 2.7 72 66 14.9
## Mississippi 16.1 259 44 17.1
## Missouri 9.0 178 70 28.2
## Montana 6.0 109 53 16.4
## Nebraska 4.3 102 62 16.5
## Nevada 12.2 252 81 46.0
## New Hampshire 2.1 57 56 9.5
## New Jersey 7.4 159 89 18.8
## New Mexico 11.4 285 70 32.1
## New York 11.1 254 86 26.1
## North Carolina 13.0 337 45 16.1
## North Dakota 0.8 45 44 7.3
## Ohio 7.3 120 75 21.4
## Oklahoma 6.6 151 68 20.0
## Oregon 4.9 159 67 29.3
## Pennsylvania 6.3 106 72 14.9
## Rhode Island 3.4 174 87 8.3
## South Carolina 14.4 279 48 22.5
## South Dakota 3.8 86 45 12.8
## Tennessee 13.2 188 59 26.9
## Texas 12.7 201 80 25.5
## Utah 3.2 120 80 22.9
## Vermont 2.2 48 32 11.2
## Virginia 8.5 156 63 20.7
## Washington 4.0 145 73 26.2
## West Virginia 5.7 81 39 9.3
## Wisconsin 2.6 53 66 10.8
## Wyoming 6.8 161 60 15.6
1.Asesinatos
Esta variable representa la tasa de homicidios intencionales por cada 100,000 habitantes en cada estado de EE.UU.
Características principales:
Expresada en número de asesinatos por cada 100,000 habitantes.
Valores típicos en la base de datos van desde 0.8 hasta 17.4 asesinatos por cada 100,000 habitantes.
Estados con valores altos pueden indicar problemas de violencia, crimen organizado o inseguridad social.
2.Asaltos
Representa la tasa de asaltos violentos registrados por cada 100,000 habitantes en cada estado de EE.UU.
Características principales:
Se mide en incidentes de asalto por cada 100,000 habitantes.
Sus valores oscilan entre 45 y 337 asaltos por cada 100,000 habitantes.
Es la variable con los valores más altos en comparación con las demás.
3.Poblacion Urbana en
Se expresa en porcentaje (%), con valores entre 32% y 91%.
No representa el tamaño total de la población, sino la proporción de personas que viven en zonas urbanas dentro de cada estado.
Es un factor clave para analizar cómo la urbanización puede influir en las tasas de criminalidad
4.Violaciones
Representa la tasa de delitos de agresión sexual por cada 100,000 habitantes en cada estado.
Características principales:
Se mide en casos de violaciones por cada 100,000 habitantes.
Sus valores van desde 7.3 hasta 46.0 violaciones por cada 100,000 habitantes.
Es importante analizar esta variable en conjunto con UrbanPop, ya que puede haber una relación entre la urbanización y los delitos sexuales.
summary(USArrests)
## Asesinatos Asaltos Poblacion_Urbana Violaciones
## Min. : 0.800 Min. : 45.0 Min. :32.00 Min. : 7.30
## 1st Qu.: 4.075 1st Qu.:109.0 1st Qu.:54.50 1st Qu.:15.07
## Median : 7.250 Median :159.0 Median :66.00 Median :20.10
## Mean : 7.788 Mean :170.8 Mean :65.54 Mean :21.23
## 3rd Qu.:11.250 3rd Qu.:249.0 3rd Qu.:77.75 3rd Qu.:26.18
## Max. :17.400 Max. :337.0 Max. :91.00 Max. :46.00
Min: 0.600 El valor mínimo de asesinatos por 100,000 habitantes es de 0.6 en el estado con la tasa más baja.
1st Qu.: 4.140 El primer cuartil indica que el 25% de los estados tienen una tasa de asesinatos de 4.14 o menos. En otras palabras, 25% de los estados tienen tasas de asesinatos bajas.
Median: 7.010 La mediana es 7.01, lo que significa que el 50% de los estados tienen tasas de asesinatos inferiores a 7.01 y el 50% tienen tasas mayores. Es el valor central de los datos.
Mean: 7.786 La media o promedio es 7.79, lo que nos indica que la tasa promedio de asesinatos por 100,000 habitantes es de 7.79. La media puede ser influenciada por valores extremos, por lo que es importante compararla con la mediana.
3rd Qu.: 11.770 El tercer cuartil indica que el 75% de los estados tienen una tasa de asesinatos de 11.77 o menos.
Max: 15.400 El valor máximo es 15.4, lo que significa que el estado con la mayor tasa de asesinatos tiene 15.4 asesinatos por cada 100,000 habitantes.
Podemos usar un histograma para ver la distribución de la Poblacion Urbana:
hist(USArrests$Poblacion_Urbana,
col="blue",
main="Distribución de la Población Urbana en EE.UU.",
xlab="Porcentaje de Población Urbana",
ylab="Frecuencia")
Esto nos permitirá ver si hay más estados con alta o baja urbanización.
Para entender las relaciones entre las variables, se calculará y visualizará una matriz de correlación.
library(corrplot)
## corrplot 0.95 loaded
cor_matrix <- cor(USArrests)
corrplot(cor_matrix, method="color", type="upper", tl.col="black", tl.srt=45)
El análisis de la relación entre la población urbana y los asesinatos busca identificar si existe alguna tendencia o patrón que vincule la urbanización con las tasas de crímenes violentos, en este caso, los asesinatos. La pregunta central que estamos tratando de responder es: ¿A medida que la proporción de la población urbana aumenta en un estado, también aumenta la tasa de asesinatos?
Podemos analizar si existe una correlación entre el porcentaje de población urbana y los delitos violentos. Por ejemplo:
cor(USArrests$Poblacion_Urbana, USArrests$Asesinatos)
## [1] 0.06957262
Como la correlación es positiva, indica que a mayor Poblacion urbana, mayor número de asesinatos.
También podemos visualizarlo con un gráfico de dispersión:
library(ggplot2)
ggplot(USArrests, aes(x=Poblacion_Urbana, y=Asesinatos)) +
geom_point(color="red") +
geom_smooth(method="lm", col="blue") +
labs(title="Relación entre la Poblacion Urbana y Asesinatos",
x="Población Urbana (%)",
y="Asesinatos por 100,000 habitantes")
## `geom_smooth()` using formula = 'y ~ x'
Este gráfico nos mostrará lo siguiente:
Puntos azules: Cada punto representa un estado, con su porcentaje de población urbana en el eje X y la tasa de asesinatos en el eje Y.
Línea roja: La línea de regresión lineal ajustada que nos ayudará a visualizar la tendencia general.
Si la línea de regresión tiene una pendiente positiva, esto indicaría que existe una relación positiva entre la Población Urbana y los Asesinatos: es decir, a medida que aumenta la proporción de población urbana, los asesinatos también tienden a aumentar.
Cuando analizamos la relación entre dos variables como Asaltos y Violaciones, estamos interesados en cómo estas dos variables están relacionadas entre sí. En este caso, ambas son crímenes violentos reportados por cada estado de EE. UU., por lo que se podría esperar que existiera algún tipo de correlación, es decir, que cuando una variable aumenta (por ejemplo, los asaltos), la otra también lo haga (las violaciones).
ggplot(USArrests, aes(x=Asaltos, y=Violaciones)) +
geom_point(color="darkgreen") +
geom_smooth(method="lm", col="red") +
labs(title="Relación entre Asaltos y Violaciones",
x="Asaltos por 100,000 habitantes",
y="Violaciones por 100,000 habitantes")
## `geom_smooth()` using formula = 'y ~ x'
Este gráfico nos mostrará:
Puntos Verdes: Cada punto representa un estado y sus tasas de Asaltos y Violaciones.
Línea roja: Representa la línea de ajuste de mínimos cuadrados (regresión lineal), que nos ayuda a visualizar la relación general.
Si la línea roja es ascendente, indica que existe una relación positiva entre Asaltos y Violaciones: es decir, a medida que aumentan los asaltos, también aumentan las violaciones. Si la línea es plana o descendente, sugiere que no hay o existe una relación negativa entre ambas variables.
El análisis de las ciudades con mayor número de asesinatos nos permite identificar cuáles son los estados (o ciudades) que tienen las tasas más altas de asesinatos en los Estados Unidos. Al observar esta información, podemos intentar descubrir patrones o factores que podrían estar contribuyendo a las altas tasas de homicidio, como características socioeconómicas, políticas de seguridad pública, entre otros.
library(tibble)
library(ggplot2)
library(dplyr)
##
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
miUSArrests <- USArrests
miUSArrests <- USArrests %>% rownames_to_column(var = "Estado")
top_Asesinato <- miUSArrests %>% arrange(desc(Asesinatos)) %>% slice_head(n = 5)
ggplot(top_Asesinato, aes(x = reorder(Estado, Asesinatos), y = Asesinatos, fill=Asesinatos)) +
geom_bar(stat = "identity") +
coord_flip() + # Girar el gráfico para mejor visualización
labs(title = "Top 10 de las ciudades con mayor tasa de asesinatos en EE.UU.",
x = "Ciudad",
y = "Asesinatos por 100,000 habitantes") +
theme_minimal() +
scale_fill_gradient(low="yellow", high="blue")
Correlaciones: Se observa una fuerte correlación entre las tasas de asesinatos, asaltos y violaciones, lo que sugiere que los estados con altos índices de un tipo de crimen suelen tener altos índices de los otros.
Impacto de la Urbanización: No se observa una correlación clara entre la urbanización y los crímenes violentos, lo que indica que otros factores pueden estar influyendo en las tasas de criminalidad.
Clustering: Se identificaron tres grupos de estados con diferentes niveles de criminalidad, lo que podría servir como base para estrategias de seguridad diferenciadas según la región.
Este análisis proporciona una visión general de la criminalidad en los EE.UU. y cómo los diferentes factores pueden estar relacionados con los niveles de violencia en cada estado.