
Contexto
La segmentación o clusters es un conjunto
de técnicas cuyo propósito es formar grupos a partir de un conjunto de
elemetos.
Más información: R for Data Science
(2ed)
Paso 1. Instalar paquetes y llamar librerias
#install.packages("cluster")
library(cluster)
#install.packages("ggplot2")
library(ggplot2)
#install.packages("data.table")
library(data.table)
#install.packages("factoextra")
library(factoextra)
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa
Paso 2. Obtener los datos
df <- data.frame (x=c(2,2,8,5,7,6,1,4), y=c(10,5,4,8,5,4,2,9))
#View(df)
Paso 3. Cantidad de grupos
grupos <- 3
Paso 4. Generar los segmentos
segmentos <- kmeans(df,grupos)
segmentos
## K-means clustering with 3 clusters of sizes 3, 3, 2
##
## Cluster means:
## x y
## 1 7.000000 4.333333
## 2 3.666667 9.000000
## 3 1.500000 3.500000
##
## Clustering vector:
## [1] 2 3 1 2 1 1 3 2
##
## Within cluster sum of squares by cluster:
## [1] 2.666667 6.666667 5.000000
## (between_SS / total_SS = 85.8 %)
##
## Available components:
##
## [1] "cluster" "centers" "totss" "withinss" "tot.withinss"
## [6] "betweenss" "size" "iter" "ifault"
Paso 5. Asignar el grupo al que pertenece cada observación
asignacion <- cbind(df, cluster = segmentos$cluster)
asignacion
## x y cluster
## 1 2 10 2
## 2 2 5 3
## 3 8 4 1
## 4 5 8 2
## 5 7 5 1
## 6 6 4 1
## 7 1 2 3
## 8 4 9 2
Paso 6. Graficar los clusters
fviz_cluster(segmentos, data = df)

Paso 7. Optimizar la cantidad de grupos
La cantidad óptima de grupos corresponde al grupo más alto de la
siguiente gráfica.
set.seed(123)
optimizacion <- clusGap(df, FUN=kmeans, nstart=1, K.max=7)
plot(optimizacion, xlab="Número de Clusters")

Conclusión
La segmentación o clusters es un algoritmo útil para las empresas que
desean clasificar sus clientes y dirigir campañas de marketing más
enfocadas y especializadas.
LS0tCnRpdGxlOiAiQWN0aXZpZGFkIENsdXN0ZXJzIgphdXRob3I6ICJNYXJjZWxvIFRhbSBBcmljYSAtIEEwMTcyMjE0MCIKZGF0ZTogIjIwMjQtMDItMTkiCm91dHB1dDogCiAgaHRtbF9kb2N1bWVudDogCiAgICB0b2M6IFRSVUUKICAgIHRvY19mbG9hdDogVFJVRQogICAgY29kZV9kb3dubG9hZDogVFJVRQotLS0KCiFbXSgvVXNlcnMvbWFyY2Vsb3RhbS9EZXNrdG9wL2NvbmNlbnRyYWNpb24gQUkvTTIvYWN0Y2x1c3Rlci5naWYpCgojIENvbnRleHRvCkxhICoqc2VnbWVudGFjacOzbioqIG8gKmNsdXN0ZXJzKiBlcyB1biBjb25qdW50byBkZSB0w6ljbmljYXMgY3V5byBwcm9ww7NzaXRvIGVzIGZvcm1hciBncnVwb3MgYSBwYXJ0aXIgZGUgdW4gY29uanVudG8gZGUgZWxlbWV0b3MuCgpNw6FzIGluZm9ybWFjacOzbjogW1IgZm9yIERhdGEgU2NpZW5jZSAoMmVkKV0oaHR0cHM6Ly9yNGRzLmhhZGxleS5uei8pCgojIFBhc28gMS4gSW5zdGFsYXIgcGFxdWV0ZXMgeSBsbGFtYXIgbGlicmVyaWFzIApgYGB7cn0KI2luc3RhbGwucGFja2FnZXMoImNsdXN0ZXIiKQpsaWJyYXJ5KGNsdXN0ZXIpCiNpbnN0YWxsLnBhY2thZ2VzKCJnZ3Bsb3QyIikKbGlicmFyeShnZ3Bsb3QyKQojaW5zdGFsbC5wYWNrYWdlcygiZGF0YS50YWJsZSIpCmxpYnJhcnkoZGF0YS50YWJsZSkKI2luc3RhbGwucGFja2FnZXMoImZhY3RvZXh0cmEiKQpsaWJyYXJ5KGZhY3RvZXh0cmEpCmBgYAoKIyBQYXNvIDIuIE9idGVuZXIgbG9zIGRhdG9zCmBgYHtyfQpkZiA8LSBkYXRhLmZyYW1lICh4PWMoMiwyLDgsNSw3LDYsMSw0KSwgeT1jKDEwLDUsNCw4LDUsNCwyLDkpKQojVmlldyhkZikKYGBgCgojIFBhc28gMy4gQ2FudGlkYWQgZGUgZ3J1cG9zCmBgYHtyfQpncnVwb3MgPC0gMwpgYGAKCiMgUGFzbyA0LiBHZW5lcmFyIGxvcyBzZWdtZW50b3MKYGBge3J9CnNlZ21lbnRvcyA8LSBrbWVhbnMoZGYsZ3J1cG9zKQpzZWdtZW50b3MKYGBgCgojIFBhc28gNS4gQXNpZ25hciBlbCBncnVwbyBhbCBxdWUgcGVydGVuZWNlIGNhZGEgb2JzZXJ2YWNpw7NuCmBgYHtyfQphc2lnbmFjaW9uIDwtIGNiaW5kKGRmLCBjbHVzdGVyID0gc2VnbWVudG9zJGNsdXN0ZXIpCmFzaWduYWNpb24KYGBgCgojIFBhc28gNi4gR3JhZmljYXIgbG9zIGNsdXN0ZXJzCmBgYHtyfQpmdml6X2NsdXN0ZXIoc2VnbWVudG9zLCBkYXRhID0gZGYpCmBgYAoKIyBQYXNvIDcuIE9wdGltaXphciBsYSBjYW50aWRhZCBkZSBncnVwb3MKTGEgY2FudGlkYWQgw7NwdGltYSBkZSBncnVwb3MgY29ycmVzcG9uZGUgYWwgZ3J1cG8gbcOhcyBhbHRvIGRlIGxhIHNpZ3VpZW50ZSBncsOhZmljYS4KYGBge3J9CnNldC5zZWVkKDEyMykKb3B0aW1pemFjaW9uIDwtIGNsdXNHYXAoZGYsIEZVTj1rbWVhbnMsIG5zdGFydD0xLCBLLm1heD03KQpwbG90KG9wdGltaXphY2lvbiwgeGxhYj0iTsO6bWVybyBkZSBDbHVzdGVycyIpCmBgYAoKIyBDb25jbHVzacOzbgpMYSBzZWdtZW50YWNpw7NuIG8gY2x1c3RlcnMgZXMgdW4gYWxnb3JpdG1vIMO6dGlsIHBhcmEgbGFzIGVtcHJlc2FzIHF1ZSBkZXNlYW4gY2xhc2lmaWNhciBzdXMgY2xpZW50ZXMgeSBkaXJpZ2lyIGNhbXBhw7FhcyBkZSBtYXJrZXRpbmcgbcOhcyBlbmZvY2FkYXMgeSBlc3BlY2lhbGl6YWRhcy4K