Descripción de los datos

Este conjunto de datos recopila información sobre los homicidios por armas de fuego en los Estados Unidos, basados en los datos del censo del año 2010 proporcionados por el FBI. Es una herramienta útil para analizar la correlación entre la densidad poblacional y los índices de criminalidad a nivel estatal.

Tabla resumen

Variable Descripción
state Nombre del estado de EE. UU.
abb Abreviatura oficial de dos letras del estado.
region Región geográfica (Northeast, South, North Central, West).
population Población total del estado según el censo de 2010.
total Número total de homicidios por armas de fuego en ese estado.
rate Tasa de homicidios por cada 100,000 habitantes.

Exploración de datos

dim(murders)
## [1] 51  6
colnames(murders)
## [1] "state"      "abb"        "region"     "population" "total"     
## [6] "rate"
summary(murders)
##     state               abb                      region     population      
##  Length:51          Length:51          Northeast    : 9   Min.   :  563626  
##  Class :character   Class :character   South        :17   1st Qu.: 1696962  
##  Mode  :character   Mode  :character   North Central:12   Median : 4339367  
##                                        West         :13   Mean   : 6075769  
##                                                           3rd Qu.: 6636084  
##                                                           Max.   :37253956  
##      total             rate        
##  Min.   :   2.0   Min.   : 0.3196  
##  1st Qu.:  24.5   1st Qu.: 1.2526  
##  Median :  97.0   Median : 2.6871  
##  Mean   : 184.4   Mean   : 2.7791  
##  3rd Qu.: 268.0   3rd Qu.: 3.3861  
##  Max.   :1257.0   Max.   :16.4528
sapply(murders, class)
##       state         abb      region  population       total        rate 
## "character" "character"    "factor"   "numeric"   "numeric"   "numeric"
colSums(is.na(murders))
##      state        abb     region population      total       rate 
##          0          0          0          0          0          0

El dataset contiene 51 observaciones y 6 variables. No presenta valores faltantes. Incluye variables categóricas y numéricas.

Gráfico 1: Dispersión

ggplot(murders, aes(x = population/10^6, y = total, color = region)) +
  geom_point(size = 3) +
  labs(title = "Población vs Homicidios", 
       x = "Población (millones)", 
       y = "Total de homicidios")

El gráfico de dispersión muestra una correlación positiva entre la población de los estados y el número de homicidios; a mayor población, mayor es el conteo total de incidentes. Los colores permiten identificar que los estados de la región “South” presentan los valores más elevados en ambas variables.

Gráfico 2: Histograma

ggplot(murders, aes(x = rate)) +
  geom_histogram(bins = 15, fill = "steelblue", color = "white") +
  labs(title = "Distribución de la tasa de homicidios", 
       x = "Tasa por cada 100,000 habitantes", 
       y = "Frecuencia")

Este histograma revela que la mayoría de los estados reportan cifras bajas de homicidios. La distribución no es simétrica, mostrando un sesgo hacia la derecha, lo que indica que solo un pequeño número de estados concentran las cifras más altas de criminalidad.

Conclusión

El análisis del dataset permite observar que existe una relación directa entre la población y el número de homicidios. Además, se evidencia que la mayoría de los estados tienen niveles relativamente bajos, mientras que unos pocos concentran altos índices, lo cual sugiere desigualdad en la distribución de la criminalidad.