data("USArrests")
summary(USArrests)
## Murder Assault UrbanPop Rape
## Min. : 0.800 Min. : 45.0 Min. :32.00 Min. : 7.30
## 1st Qu.: 4.075 1st Qu.:109.0 1st Qu.:54.50 1st Qu.:15.07
## Median : 7.250 Median :159.0 Median :66.00 Median :20.10
## Mean : 7.788 Mean :170.8 Mean :65.54 Mean :21.23
## 3rd Qu.:11.250 3rd Qu.:249.0 3rd Qu.:77.75 3rd Qu.:26.18
## Max. :17.400 Max. :337.0 Max. :91.00 Max. :46.00
USArrests <- scale(USArrests)
km.res <- kmeans(USArrests, 4)
df_member <- cbind(USArrests, cluster = km.res$cluster)
head(df_member,10)
## Murder Assault UrbanPop Rape cluster
## Alabama 1.24256408 0.7828393 -0.5209066 -0.003416473 2
## Alaska 0.50786248 1.1068225 -1.2117642 2.484202941 2
## Arizona 0.07163341 1.4788032 0.9989801 1.042878388 2
## Arkansas 0.23234938 0.2308680 -1.0735927 -0.184916602 1
## California 0.27826823 1.2628144 1.7589234 2.067820292 2
## Colorado 0.02571456 0.3988593 0.8608085 1.864967207 2
## Connecticut -1.03041900 -0.7290821 0.7917228 -1.081740768 3
## Delaware -0.43347395 0.8068381 0.4462940 -0.579946294 1
## Florida 1.74767144 1.9707777 0.9989801 1.138966691 2
## Georgia 2.20685994 0.4828549 -0.3827351 0.487701523 2
#install.packages("factoextra")
library(factoextra)
## Loading required package: ggplot2
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa
fviz_cluster(km.res, data = USArrests,
palette=c("red", "blue", "black", "darkgreen"),
ellipse.type = "euclid",
star.plot = T,
repel = T,
ggtheme = theme())
library(cluster)
#install.packages("data.table")
library(data.table)
set.seed(123)
optimizacion <- clusGap(df_member, FUN = kmeans, nstart = 25, K.max = 10, B = 50)
plot(optimizacion, xlab = "Numero de clusters k")
En conclusión, el concepto principal que se trabajo en esta actividad fue el de segmentación, y para llevarlo a cabo, se utilizaron dos herramientas, primero el K-means clustering, que ayudó a segmentar por estados de US los delitos cometidos, y la segunda herramienta sirvió para optimizar los clusters. Esta herramienta de segmentación que R ofrece, ayuda en distintos giros, como empresariales, de salud, de seguridad, etc.