Contexto

La segmentación o clúster es un conjunto de técnicas cuyo propósito es formar grupos a partir de un conjunto de elementos

Mas información: R for Data Science (2ed)

Paso 1. Instalar paquetes y llamar librerias

# install.packages("cluster")
library(cluster)
## Warning: package 'cluster' was built under R version 4.3.2
# install.packages("ggplot2")
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.3.2
# install.packages("data.table")
library(data.table)
# install.packages("factoextra")
library(factoextra)
## Warning: package 'factoextra' was built under R version 4.3.2
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa

Paso 2. Obtener los datos

df <- data.frame(x=c(2,2,8,5,7,6,1,4), y=c(10,5,4,8,5,4,2,9))

Paso 3. Cantidad de grupos

grupos <- 3

Paso 4. Generar los segmentos

segmentos <- kmeans (df,grupos)
segmentos
## K-means clustering with 3 clusters of sizes 3, 3, 2
## 
## Cluster means:
##          x        y
## 1 7.000000 4.333333
## 2 3.666667 9.000000
## 3 1.500000 3.500000
## 
## Clustering vector:
## [1] 2 3 1 2 1 1 3 2
## 
## Within cluster sum of squares by cluster:
## [1] 2.666667 6.666667 5.000000
##  (between_SS / total_SS =  85.8 %)
## 
## Available components:
## 
## [1] "cluster"      "centers"      "totss"        "withinss"     "tot.withinss"
## [6] "betweenss"    "size"         "iter"         "ifault"

Paso 5. asignar el grupo al que pertenece cada observación

asignacion <- cbind(df,cluster = segmentos$cluster)
asignacion
##   x  y cluster
## 1 2 10       2
## 2 2  5       3
## 3 8  4       1
## 4 5  8       2
## 5 7  5       1
## 6 6  4       1
## 7 1  2       3
## 8 4  9       2

Paso 6. Graficar los clústers

fviz_cluster(segmentos,data = df)

Paso 7. Optimizar la cantidad de grupos

set.seed(123)
optimizacion <- clusGap(df, FUN = kmeans, nstart = 1, K.max = 7)
plot(optimizacion,xlab = "Numero de clusters k")

La cantidad optima de grupos corresponde al punto más alto de la siguiente grafica

Conclusión

La segmentación o clúster es un algoritmo útil para las empresas que desean clasificar sus clientes y dirigir campañas de marketing más enfocadas y especializadas

LS0tDQp0aXRsZTogIlNlZ21lbnRhY2nDs24gKENsdXN0ZXJzKSINCmF1dGhvcjogIkx1aXMgTWVuZG96YSAtIEEwMDgyOTA5OSINCmRhdGU6ICIyMDI0LTAyLTE5Ig0Kb3V0cHV0OiANCiAgaHRtbF9kb2N1bWVudDoNCiAgICB0b2M6IFRSVUUNCiAgICB0b2NfZmxvYXQ6IFRSVUUNCiAgICBjb2RlX2Rvd25sb2FkOiBUUlVFDQotLS0NCg0KIVtdKEM6XFxVc2Vyc1xcTHVpcyBSb2RyaWd1ZXpcXERvd25sb2Fkc1xcc2VnbWVudGFjaW9uLmdpZikNCg0KIyBDb250ZXh0bw0KTGEgKipzZWdtZW50YWNpw7NuKiogbyAqY2zDunN0ZXIqIGVzIHVuIGNvbmp1bnRvIGRlIHTDqWNuaWNhcyBjdXlvDQpwcm9ww7NzaXRvIGVzIGZvcm1hciBncnVwb3MgYSBwYXJ0aXIgZGUgdW4gY29uanVudG8gZGUgZWxlbWVudG9zDQoNCk1hcyAgaW5mb3JtYWNpw7NuOg0KW1IgZm9yIERhdGEgU2NpZW5jZSAoMmVkKV0oaHR0cHM6Ly9yNGRzLmhhZGxleS5uei8pDQoNCg0KIyBQYXNvIDEuIEluc3RhbGFyIHBhcXVldGVzIHkgbGxhbWFyIGxpYnJlcmlhcyANCmBgYHtyfQ0KIyBpbnN0YWxsLnBhY2thZ2VzKCJjbHVzdGVyIikNCmxpYnJhcnkoY2x1c3RlcikNCiMgaW5zdGFsbC5wYWNrYWdlcygiZ2dwbG90MiIpDQpsaWJyYXJ5KGdncGxvdDIpDQojIGluc3RhbGwucGFja2FnZXMoImRhdGEudGFibGUiKQ0KbGlicmFyeShkYXRhLnRhYmxlKQ0KIyBpbnN0YWxsLnBhY2thZ2VzKCJmYWN0b2V4dHJhIikNCmxpYnJhcnkoZmFjdG9leHRyYSkNCmBgYA0KDQojIFBhc28gMi4gT2J0ZW5lciBsb3MgZGF0b3MgDQpgYGB7cn0NCmRmIDwtIGRhdGEuZnJhbWUoeD1jKDIsMiw4LDUsNyw2LDEsNCksIHk9YygxMCw1LDQsOCw1LDQsMiw5KSkNCmBgYA0KDQojIFBhc28gMy4gQ2FudGlkYWQgZGUgZ3J1cG9zDQpgYGB7cn0NCmdydXBvcyA8LSAzDQpgYGANCg0KIyBQYXNvIDQuIEdlbmVyYXIgbG9zIHNlZ21lbnRvcw0KYGBge3J9DQpzZWdtZW50b3MgPC0ga21lYW5zIChkZixncnVwb3MpDQpzZWdtZW50b3MNCmBgYA0KDQojIFBhc28gNS4gYXNpZ25hciBlbCBncnVwbyBhbCBxdWUgcGVydGVuZWNlIGNhZGEgb2JzZXJ2YWNpw7NuIA0KYGBge3J9DQphc2lnbmFjaW9uIDwtIGNiaW5kKGRmLGNsdXN0ZXIgPSBzZWdtZW50b3MkY2x1c3RlcikNCmFzaWduYWNpb24NCmBgYA0KDQojIFBhc28gNi4gR3JhZmljYXIgbG9zIGNsw7pzdGVycw0KYGBge3J9DQpmdml6X2NsdXN0ZXIoc2VnbWVudG9zLGRhdGEgPSBkZikNCmBgYA0KDQojIFBhc28gNy4gT3B0aW1pemFyIGxhIGNhbnRpZGFkIGRlIGdydXBvcw0KYGBge3J9DQpzZXQuc2VlZCgxMjMpDQpvcHRpbWl6YWNpb24gPC0gY2x1c0dhcChkZiwgRlVOID0ga21lYW5zLCBuc3RhcnQgPSAxLCBLLm1heCA9IDcpDQpwbG90KG9wdGltaXphY2lvbix4bGFiID0gIk51bWVybyBkZSBjbHVzdGVycyBrIikNCg0KYGBgDQoNCkxhIGNhbnRpZGFkIG9wdGltYSBkZSBncnVwb3MgY29ycmVzcG9uZGUgYWwgDQpwdW50byBtw6FzIGFsdG8gZGUgbGEgc2lndWllbnRlIGdyYWZpY2ENCg0KIyBDb25jbHVzacOzbiANCg0KTGEgc2VnbWVudGFjacOzbiBvIGNsw7pzdGVyIGVzIHVuIGFsZ29yaXRtbyDDunRpbCBwYXJhIGxhcyBlbXByZXNhcyBxdWUgZGVzZWFuIGNsYXNpZmljYXIgc3VzIGNsaWVudGVzIHkgZGlyaWdpciBjYW1wYcOxYXMgZGUgbWFya2V0aW5nIG3DoXMgZW5mb2NhZGFzIHkgZXNwZWNpYWxpemFkYXMNCg==