La segmentación o clusters es un conjunto
de técnicas cuyo propósito es formar
grupos a partir de un conjunto de elementos.
Paso 1. Instalar paquetes y llamar librerías
install.packages(“cluster”) library(cluster)
install.packages(“ggplot2”) library(ggplot2)
install.packages(“data.table”) library(data.table)
install.packages(“factoextra”) library(factoextra)
Paso 2. Obtener los datos
df <- data.frame(x=c(2,2,8,5,7,6,1,4), y=c(10,5,4,8,5,4,2,9))
Paso 3. Cantidad de grupos
grupos <- 3
Paso 4. Generar los segmentos
segmentos <- kmeans(df,4) segmentos # Paso 5. Asignar el grupo al
que pertenece cada observación asignacion <- cbind(df, cluster =
segmentos$cluster) asignacion
Paso 6. Graficar los clusters
fviz_cluster(segmentos, data=df)
Paso 7. Optimizar la cantidad de grupos
La cantidad óptima de grupos corresponde al punto
más alto de la siguiente gráfica.
set.seed(123) optimizacion <- clusGap(df, FUN=kmeans, nstart=1,
K.max =7) plot(optimizacion, xlab=“Número de clusters k”)
Conclusión
La segmentación o clusters es un algoritmo útil para las
empresas
que desean clasificar sus clientes y dirigir campañas de
marketing
más enfocadas y especializadas.