Importar la base de datos

data("USArrests")
summary(USArrests)
##      Murder          Assault         UrbanPop          Rape      
##  Min.   : 0.800   Min.   : 45.0   Min.   :32.00   Min.   : 7.30  
##  1st Qu.: 4.075   1st Qu.:109.0   1st Qu.:54.50   1st Qu.:15.07  
##  Median : 7.250   Median :159.0   Median :66.00   Median :20.10  
##  Mean   : 7.788   Mean   :170.8   Mean   :65.54   Mean   :21.23  
##  3rd Qu.:11.250   3rd Qu.:249.0   3rd Qu.:77.75   3rd Qu.:26.18  
##  Max.   :17.400   Max.   :337.0   Max.   :91.00   Max.   :46.00
USArrests <- scale(USArrests)
km.res <- kmeans(USArrests, 4)
df_member <- cbind(USArrests, cluster = km.res$cluster)
head(df_member,10)
##                  Murder    Assault   UrbanPop         Rape cluster
## Alabama      1.24256408  0.7828393 -0.5209066 -0.003416473       2
## Alaska       0.50786248  1.1068225 -1.2117642  2.484202941       2
## Arizona      0.07163341  1.4788032  0.9989801  1.042878388       2
## Arkansas     0.23234938  0.2308680 -1.0735927 -0.184916602       1
## California   0.27826823  1.2628144  1.7589234  2.067820292       2
## Colorado     0.02571456  0.3988593  0.8608085  1.864967207       2
## Connecticut -1.03041900 -0.7290821  0.7917228 -1.081740768       3
## Delaware    -0.43347395  0.8068381  0.4462940 -0.579946294       1
## Florida      1.74767144  1.9707777  0.9989801  1.138966691       2
## Georgia      2.20685994  0.4828549 -0.3827351  0.487701523       2
#install.packages("factoextra")
library(factoextra)
## Loading required package: ggplot2
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa
fviz_cluster(km.res, data = USArrests,
             palette=c("red", "blue", "black", "darkgreen"),
             ellipse.type = "euclid",
             star.plot = T,
             repel = T,
             ggtheme = theme())

library(cluster)
#install.packages("data.table")
library(data.table)

Gráfica

set.seed(123)
optimizacion <- clusGap(df_member, FUN = kmeans, nstart = 25, K.max = 10, B = 50)
plot(optimizacion, xlab = "Numero de clusters k")

Conclusión

En conclusión, el concepto principal que se trabajo en esta actividad fue el de segmentación, y para llevarlo a cabo, se utilizaron dos herramientas, primero el K-means clustering, que ayudó a segmentar por estados de US los delitos cometidos, y la segunda herramienta sirvió para optimizar los clusters. Esta herramienta de segmentación que R ofrece, ayuda en distintos giros, como empresariales, de salud, de seguridad, etc.