Este conjunto de datos recopila información sobre los homicidios por armas de fuego en los Estados Unidos, basados en los datos del censo del año 2010 proporcionados por el FBI. Es una herramienta útil para analizar la correlación entre la densidad poblacional y los índices de criminalidad a nivel estatal.
| Variable | Descripción |
|---|---|
| state | Nombre del estado de EE. UU. |
| abb | Abreviatura oficial de dos letras del estado. |
| region | Región geográfica (Northeast, South, North Central, West). |
| population | Población total del estado según el censo de 2010. |
| total | Número total de homicidios por armas de fuego en ese estado. |
| rate | Tasa de homicidios por cada 100,000 habitantes. |
dim(murders)
## [1] 51 6
colnames(murders)
## [1] "state" "abb" "region" "population" "total"
## [6] "rate"
summary(murders)
## state abb region population
## Length:51 Length:51 Northeast : 9 Min. : 563626
## Class :character Class :character South :17 1st Qu.: 1696962
## Mode :character Mode :character North Central:12 Median : 4339367
## West :13 Mean : 6075769
## 3rd Qu.: 6636084
## Max. :37253956
## total rate
## Min. : 2.0 Min. : 0.3196
## 1st Qu.: 24.5 1st Qu.: 1.2526
## Median : 97.0 Median : 2.6871
## Mean : 184.4 Mean : 2.7791
## 3rd Qu.: 268.0 3rd Qu.: 3.3861
## Max. :1257.0 Max. :16.4528
sapply(murders, class)
## state abb region population total rate
## "character" "character" "factor" "numeric" "numeric" "numeric"
colSums(is.na(murders))
## state abb region population total rate
## 0 0 0 0 0 0
El dataset contiene 51 observaciones y 6 variables. No presenta valores faltantes. Incluye variables categóricas y numéricas.
ggplot(murders, aes(x = population/10^6, y = total, color = region)) +
geom_point(size = 3) +
labs(title = "Población vs Homicidios",
x = "Población (millones)",
y = "Total de homicidios")
El gráfico de dispersión muestra una correlación positiva entre la población de los estados y el número de homicidios; a mayor población, mayor es el conteo total de incidentes. Los colores permiten identificar que los estados de la región “South” presentan los valores más elevados en ambas variables.
ggplot(murders, aes(x = rate)) +
geom_histogram(bins = 15, fill = "steelblue", color = "white") +
labs(title = "Distribución de la tasa de homicidios",
x = "Tasa por cada 100,000 habitantes",
y = "Frecuencia")
Este histograma revela que la mayoría de los estados reportan cifras bajas de homicidios. La distribución no es simétrica, mostrando un sesgo hacia la derecha, lo que indica que solo un pequeño número de estados concentran las cifras más altas de criminalidad.
El análisis del dataset permite observar que existe una relación directa entre la población y el número de homicidios. Además, se evidencia que la mayoría de los estados tienen niveles relativamente bajos, mientras que unos pocos concentran altos índices, lo cual sugiere desigualdad en la distribución de la criminalidad.