1. Instalar paquetes y llamar librerias librerias

# install.packages("DataExplorer")
library(DataExplorer)
#install.packages("cluster")
library(cluster)
#install.packages("ggplot2")
library(ggplot2)
#install.packages("data.table")
library(data.table)
#install.packages("factoextra")
library(factoextra)
library(dplyr)

2. Subir base de datos

data <- read.csv("C:\\Users\\maria\\OneDrive\\Desktop\\AD24\\Modulo 2\\abarrotes1.csv")

3. Entender la base de datos

summary(data)
##    Cliente          Ticket_Promedio      Visitas         
##  Length:4298        Min.   :   0.00   Min.   :    1.000  
##  Class :character   1st Qu.:  27.92   1st Qu.:    1.000  
##  Mode  :character   Median :  51.12   Median :    2.000  
##                     Mean   :  68.50   Mean   :    9.266  
##                     3rd Qu.:  88.32   3rd Qu.:    5.000  
##                     Max.   :3023.64   Max.   :21664.000
str(data)
## 'data.frame':    4298 obs. of  3 variables:
##  $ Cliente        : chr  "12346" "12347" "12349" "12350" ...
##  $ Ticket_Promedio: num  1.04 68.74 605.1 65.3 169.26 ...
##  $ Visitas        : int  1 7 1 1 8 1 1 1 3 1 ...
introduce(data)
##   rows columns discrete_columns continuous_columns all_missing_columns
## 1 4298       3                1                  2                   0
##   total_missing_values complete_rows total_observations memory_usage
## 1                    0          4298              12894       328216
plot_intro(data)

plot_missing(data)

4. Escalar la base de datos

data1 <- select(data, Ticket_Promedio, Visitas)
df <- scale(data1)

5. Cantidad de grupos

grupos <- 4

6. Generar los segmentos

segmentos <- kmeans(df,grupos)
segmentos
## K-means clustering with 4 clusters of sizes 1339, 5, 185, 2769
## 
## Cluster means:
##   Ticket_Promedio     Visitas
## 1       0.4133781 -0.01607889
## 2      19.3097338 13.10027209
## 3       2.1198481 -0.01922430
## 4      -0.3763936 -0.01459560
## 
## Clustering vector:
##    [1] 4 4 3 4 1 4 3 4 4 3 1 1 4 1 4 4 4 1 4 1 1 3 4 1 1 4 1 4 4 1 4 4 4 3 1 4 4
##   [38] 4 4 4 1 1 4 4 1 1 1 4 4 4 4 1 1 4 1 4 4 3 1 1 1 4 3 4 4 3 4 3 1 1 1 4 1 4
##   [75] 1 1 4 1 4 1 1 1 4 4 4 4 4 1 3 4 1 1 3 1 1 1 1 4 1 4 1 4 1 4 4 4 4 4 4 3 3
##  [112] 4 1 4 4 4 1 4 1 1 1 4 1 1 4 1 1 4 4 4 1 4 1 4 4 4 3 1 2 1 3 1 4 1 1 1 4 4
##  [149] 1 4 1 4 1 4 4 4 1 4 1 1 4 1 1 4 4 1 4 4 4 1 1 1 4 4 4 1 1 4 1 3 1 4 4 4 4
##  [186] 3 4 4 4 4 4 4 4 3 1 1 1 1 1 1 1 4 1 1 1 4 4 4 4 1 1 1 1 4 1 1 1 1 1 1 4 4
##  [223] 4 1 4 4 4 4 4 4 4 1 4 4 1 4 1 4 4 4 4 1 3 4 4 4 4 4 1 4 4 1 4 4 4 1 4 3 1
##  [260] 1 4 4 1 4 4 1 1 4 4 1 1 4 4 4 4 1 1 1 1 1 4 1 4 1 4 4 4 1 4 4 4 1 1 4 1 4
##  [297] 1 4 4 1 4 3 2 4 4 3 4 1 1 4 4 4 3 1 1 1 4 3 1 1 4 3 4 4 4 1 1 1 4 4 1 1 4
##  [334] 1 4 4 1 4 4 4 4 1 4 4 4 1 1 4 1 4 4 4 4 4 4 4 4 4 4 4 4 1 1 3 1 1 4 4 4 1
##  [371] 4 4 4 1 1 1 4 4 1 4 1 1 4 4 1 1 1 4 4 1 4 4 1 4 4 4 3 4 4 1 1 1 4 1 4 1 4
##  [408] 4 4 4 1 4 4 1 4 4 4 1 1 4 4 1 4 4 1 4 4 4 4 4 4 1 4 4 1 4 4 3 1 4 1 4 4 1
##  [445] 4 4 1 1 4 1 1 4 4 3 4 4 4 1 4 4 4 4 4 4 4 4 1 1 3 4 4 4 4 1 4 4 4 4 4 4 4
##  [482] 4 4 4 4 4 4 4 4 1 4 4 4 4 1 4 4 4 4 1 1 4 4 4 4 4 4 1 1 4 1 4 4 4 1 4 4 4
##  [519] 4 4 4 1 4 1 1 4 4 4 4 4 4 4 4 4 4 3 4 4 4 4 4 4 4 4 4 4 1 4 4 4 4 4 4 4 4
##  [556] 4 4 1 4 1 1 4 4 4 1 1 3 4 4 4 4 4 4 1 4 1 1 4 1 4 4 4 4 1 4 4 1 4 3 4 4 4
##  [593] 4 1 4 4 4 4 1 4 1 4 4 4 4 3 3 4 4 4 4 4 4 1 1 4 4 1 1 4 4 1 4 4 4 4 4 1 4
##  [630] 4 1 4 4 4 4 4 1 4 1 4 4 4 4 4 1 1 4 1 1 4 4 4 4 3 1 1 4 4 4 4 4 4 4 4 3 4
##  [667] 4 4 1 4 4 4 4 4 4 1 4 4 1 4 1 4 1 4 4 4 1 1 4 1 4 4 4 4 4 4 4 4 4 4 4 4 4
##  [704] 1 4 4 4 4 1 4 4 4 4 4 4 4 4 4 4 4 4 4 3 1 1 3 4 1 1 3 1 4 4 4 1 1 1 1 1 1
##  [741] 3 1 1 1 1 4 3 4 1 1 1 1 1 1 1 4 1 4 4 1 1 4 4 4 4 4 1 4 1 4 4 4 4 4 4 4 4
##  [778] 4 1 4 4 4 1 3 4 4 4 1 4 4 1 4 4 4 1 1 4 4 1 4 4 3 3 4 1 4 4 4 4 4 1 4 1 4
##  [815] 4 1 4 1 4 3 4 4 4 4 4 4 4 4 4 1 4 4 1 4 4 4 4 4 4 1 3 4 4 1 1 4 1 4 4 4 4
##  [852] 4 4 4 4 1 1 4 1 3 4 3 4 4 1 4 4 1 4 4 1 4 4 1 1 1 4 4 4 1 4 1 1 4 1 3 3 4
##  [889] 1 1 1 4 4 1 4 4 4 4 4 4 1 1 4 4 1 4 1 4 1 4 3 1 4 4 1 4 4 4 3 1 4 3 1 4 4
##  [926] 4 4 4 4 4 4 4 1 1 1 4 1 4 4 3 4 1 4 4 4 4 4 4 4 1 4 4 1 3 4 4 4 3 4 4 4 4
##  [963] 1 4 4 1 4 4 4 4 4 4 4 4 4 4 4 1 4 4 4 1 4 1 1 1 4 4 4 4 4 4 4 4 4 1 1 4 4
## [1000] 4 4 4 4 1 4 3 3 1 4 4 4 1 4 4 4 4 4 4 4 4 4 4 1 4 4 4 4 1 4 4 3 4 4 1 1 1
## [1037] 4 4 1 1 4 4 4 4 4 4 4 4 4 1 1 4 4 4 4 4 4 4 3 1 4 1 1 1 4 4 4 1 1 1 4 4 1
## [1074] 4 4 4 1 4 4 1 4 1 4 4 4 4 1 3 4 1 4 4 4 1 4 4 4 4 4 1 4 3 4 1 4 1 4 4 4 1
## [1111] 4 4 4 1 4 4 4 1 1 4 4 4 1 4 1 4 4 4 4 1 4 1 4 4 4 4 4 4 4 4 1 4 4 4 4 4 1
## [1148] 4 1 4 4 4 4 4 4 4 4 4 4 4 4 3 4 4 4 1 4 4 4 4 4 1 4 4 4 4 1 4 4 1 4 4 4 4
## [1185] 4 4 1 4 4 4 4 1 1 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 1 4 4 4 4 1 4
## [1222] 4 4 1 4 1 4 4 4 3 3 4 4 1 4 4 4 1 4 4 4 4 4 4 1 1 1 4 4 1 4 4 4 4 3 1 4 4
## [1259] 1 3 4 4 4 1 2 4 4 1 4 4 1 3 4 4 4 4 4 4 4 4 4 4 1 4 1 4 4 4 4 3 4 4 4 4 4
## [1296] 4 4 4 4 4 1 4 4 1 4 4 3 4 4 4 1 1 4 4 4 1 4 1 4 4 3 4 4 1 3 1 1 1 4 4 4 4
## [1333] 1 4 4 4 4 4 1 4 4 4 1 4 4 4 4 4 4 4 4 4 4 4 4 1 1 4 4 4 4 4 4 4 4 4 4 4 4
## [1370] 1 4 4 4 1 1 1 4 1 4 1 4 4 4 1 4 4 1 1 1 4 4 4 4 3 4 4 1 4 1 4 4 4 1 4 4 4
## [1407] 4 4 4 4 4 4 1 1 4 1 4 1 4 4 4 1 4 4 4 4 4 1 4 4 1 4 1 4 4 4 4 4 4 4 4 1 4
## [1444] 1 4 4 4 4 4 4 4 1 1 1 1 4 1 4 4 4 1 4 4 1 3 4 4 4 1 4 4 1 4 1 1 4 4 4 4 4
## [1481] 4 4 4 4 4 1 4 4 4 1 4 1 1 4 4 1 4 4 1 4 1 1 1 4 4 4 4 3 4 1 4 1 4 4 1 4 1
## [1518] 1 1 3 4 1 4 3 4 4 1 4 4 1 1 4 3 4 4 4 4 4 4 4 4 4 1 4 1 4 4 1 4 4 4 1 1 1
## [1555] 4 4 1 1 1 3 3 4 1 4 4 4 1 4 4 4 4 4 4 1 1 1 4 1 1 1 4 1 3 1 4 4 4 1 4 4 4
## [1592] 1 3 1 4 1 4 4 1 1 1 4 4 4 4 1 1 4 4 4 1 1 4 1 4 4 4 1 1 4 4 1 4 1 1 1 1 4
## [1629] 4 1 1 4 4 1 4 4 4 4 4 1 4 4 4 1 4 1 1 4 3 4 4 1 4 4 1 4 4 4 4 4 4 4 1 1 1
## [1666] 1 1 4 1 1 1 1 4 4 1 1 1 4 1 1 1 1 4 3 4 4 4 4 1 4 4 4 1 4 4 4 4 4 1 4 1 1
## [1703] 1 4 1 4 4 4 1 1 4 1 4 4 4 1 1 1 1 3 1 1 1 4 4 4 4 4 4 4 1 4 4 4 1 4 4 1 4
## [1740] 1 1 1 1 3 4 4 4 4 4 4 4 3 1 4 4 4 4 1 4 4 4 4 4 4 4 4 4 4 4 1 4 4 1 1 4 4
## [1777] 4 4 1 4 4 4 3 1 4 4 4 4 1 4 4 4 4 4 4 4 4 4 1 3 1 4 4 4 4 1 4 4 4 4 1 4 4
## [1814] 4 4 4 4 4 4 4 1 4 1 1 1 4 4 4 4 4 4 4 4 4 4 4 4 1 4 1 4 4 4 4 4 3 4 4 1 4
## [1851] 4 4 4 4 4 1 1 1 1 1 4 4 4 4 4 1 4 4 1 3 4 1 4 4 1 4 1 4 1 1 4 1 4 1 1 3 1
## [1888] 4 4 3 4 1 1 4 1 1 4 1 3 1 3 1 3 4 1 4 1 4 1 4 4 1 1 1 3 4 3 4 4 4 4 1 4 1
## [1925] 1 4 1 1 1 1 4 4 1 4 4 4 4 4 4 1 1 4 1 4 1 1 4 4 4 4 3 3 1 1 3 4 4 4 1 1 1
## [1962] 4 4 4 4 4 1 1 1 4 4 4 4 4 4 3 4 4 4 1 3 4 4 4 1 4 1 1 4 1 4 4 4 1 1 4 1 1
## [1999] 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 1 4 1 1 1 1 3 4 1 4 4 4 4 1 1 1 4 4 4
## [2036] 4 4 4 4 4 4 4 1 4 4 4 4 4 1 4 4 4 4 4 4 4 4 4 4 4 1 1 4 4 4 4 4 4 1 4 4 4
## [2073] 4 4 1 4 4 1 4 4 4 4 4 4 1 4 4 4 4 4 4 4 4 1 4 4 4 4 1 4 3 1 4 4 4 4 4 3 4
## [2110] 4 1 4 4 1 4 1 1 4 1 4 4 4 4 4 4 4 4 1 1 4 4 1 1 4 1 4 4 1 1 4 4 4 4 4 4 4
## [2147] 4 1 1 1 4 4 4 1 4 4 4 4 1 1 4 4 1 4 1 4 4 4 1 4 1 1 4 1 4 4 4 4 4 4 4 4 4
## [2184] 4 4 4 4 1 1 4 4 1 4 4 4 4 4 4 4 4 4 4 1 4 4 1 4 1 1 1 4 1 4 4 1 1 4 4 4 4
## [2221] 4 4 1 3 4 1 4 4 4 1 3 1 1 4 4 1 3 4 4 1 4 4 4 1 4 4 1 4 1 4 4 3 4 1 4 4 1
## [2258] 1 1 4 4 1 3 4 4 1 1 4 4 1 4 3 1 4 4 1 3 1 4 4 1 3 4 1 1 4 4 4 4 4 4 4 1 4
## [2295] 4 1 1 4 4 4 1 1 3 3 1 1 1 4 4 4 4 4 1 1 1 4 1 4 1 4 1 4 1 4 4 4 4 4 4 4 1
## [2332] 4 1 1 1 1 4 4 1 3 4 1 1 4 4 4 4 4 4 4 4 4 1 4 4 4 4 4 4 4 1 4 4 4 4 4 4 1
## [2369] 4 1 1 4 4 4 4 1 4 4 4 4 1 1 4 4 1 1 4 4 4 4 1 4 4 1 4 4 4 4 4 4 4 1 1 4 4
## [2406] 4 4 4 1 1 4 3 1 4 4 4 4 4 1 4 4 4 4 4 4 1 1 1 1 4 1 4 1 1 1 4 4 4 4 4 4 1
## [2443] 3 3 4 1 4 1 1 4 4 4 4 4 4 4 4 4 1 4 4 4 1 1 4 1 1 4 4 1 1 4 4 4 1 3 1 4 1
## [2480] 4 4 1 4 1 4 4 4 1 4 4 3 1 4 1 1 4 1 4 4 1 1 4 3 4 1 4 4 4 3 4 4 1 4 1 4 4
## [2517] 4 4 1 4 4 1 1 4 4 1 4 1 3 4 1 1 4 4 4 4 4 4 4 4 1 4 4 4 4 4 4 1 4 1 1 4 4
## [2554] 1 1 1 4 1 1 1 1 3 4 4 1 4 4 4 1 1 4 4 4 4 4 1 1 4 1 1 3 4 4 4 1 4 4 1 4 1
## [2591] 4 4 4 1 4 4 1 4 4 4 4 4 4 4 1 1 4 1 1 1 4 4 1 4 4 4 1 4 4 4 4 1 4 1 1 1 4
## [2628] 4 4 1 4 4 4 1 1 4 1 1 1 3 4 1 1 4 1 4 1 4 4 1 4 1 1 1 1 4 4 4 3 1 1 4 4 4
## [2665] 1 4 1 3 4 4 4 4 1 4 4 4 4 4 3 4 1 1 3 1 3 4 1 4 4 1 4 4 4 3 4 4 4 4 4 1 4
## [2702] 1 1 4 4 4 4 4 1 4 4 4 3 4 4 1 4 4 4 1 4 3 4 1 4 1 1 1 4 4 3 4 4 1 4 1 1 4
## [2739] 4 4 4 1 4 4 4 1 1 1 4 4 4 1 4 4 1 1 4 4 4 4 4 1 4 4 4 4 4 4 4 4 4 4 4 1 4
## [2776] 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 3 4 4 4 1 4 4 1 1 4 4 1 1 4 4 4 3 4 4 1 3 4
## [2813] 4 4 4 1 4 4 4 4 4 4 3 1 1 1 1 1 4 4 4 4 1 1 4 4 1 1 1 1 4 1 1 4 4 3 1 4 3
## [2850] 1 4 4 1 1 4 4 4 1 4 4 4 1 4 4 4 4 4 4 1 1 4 4 4 4 4 4 4 1 4 1 1 4 4 4 4 4
## [2887] 1 3 4 4 4 4 1 1 1 4 4 4 4 4 4 4 4 4 4 3 1 4 4 1 4 4 1 1 1 1 1 1 1 4 4 4 4
## [2924] 1 4 4 1 4 4 1 4 4 1 3 1 1 4 1 4 1 4 1 4 1 4 1 1 4 1 1 1 4 4 4 4 1 1 4 4 4
## [2961] 4 4 4 4 4 1 4 1 4 1 4 1 4 4 4 4 4 4 4 4 4 1 1 4 4 3 4 4 1 1 4 4 1 4 4 4 4
## [2998] 1 4 1 4 1 4 1 4 1 1 1 1 4 4 4 1 1 4 4 1 4 1 4 4 4 4 4 4 1 4 4 1 4 4 1 4 4
## [3035] 1 1 3 4 4 4 4 3 1 4 4 4 4 4 1 4 4 1 4 4 4 4 4 4 4 4 1 1 4 4 4 4 4 4 1 4 4
## [3072] 4 4 1 1 4 4 4 4 1 1 4 4 1 4 4 4 1 1 4 4 4 4 4 4 4 1 4 4 1 4 1 1 4 4 4 4 4
## [3109] 4 1 4 4 4 4 4 1 4 1 4 1 4 4 4 4 4 1 4 1 4 4 4 1 1 4 4 4 4 4 4 4 3 4 4 4 1
## [3146] 1 4 1 4 4 4 4 1 1 1 1 4 1 1 1 4 4 1 1 1 4 1 4 1 1 1 1 1 4 4 1 4 4 4 4 4 3
## [3183] 4 1 4 4 4 4 1 4 1 1 4 1 4 4 1 4 4 1 1 1 4 4 4 1 3 4 1 1 4 4 1 1 4 4 1 1 4
## [3220] 4 1 4 4 1 4 4 4 1 4 3 1 4 4 1 1 4 4 4 4 4 1 1 4 4 4 4 1 1 4 4 1 4 4 4 4 4
## [3257] 4 4 4 4 1 4 4 4 4 4 4 4 4 4 4 4 4 4 4 1 4 4 4 1 1 4 1 1 4 4 1 4 4 4 4 1 1
## [3294] 1 1 4 1 1 1 1 1 4 1 1 1 1 1 1 4 1 4 4 1 4 1 4 4 1 1 1 1 1 4 4 4 4 1 1 4 1
## [3331] 1 1 3 1 1 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 3 4 1 4 1 4 4 3 4 4 1
## [3368] 4 4 4 1 4 4 4 4 4 4 4 4 4 4 4 1 1 4 4 1 4 4 4 4 4 4 4 4 4 4 4 3 1 4 4 4 1
## [3405] 4 4 4 1 4 1 1 1 1 4 1 1 3 4 4 4 4 1 4 4 1 4 1 1 4 4 4 4 1 1 4 3 1 4 1 4 4
## [3442] 1 4 1 4 4 4 4 4 1 3 4 4 4 1 4 4 4 4 1 4 4 1 1 1 4 1 4 4 4 1 1 4 3 1 1 4 4
## [3479] 4 4 4 4 4 1 1 4 4 4 4 4 4 1 4 4 4 4 4 4 4 4 4 4 4 4 4 1 1 1 4 4 1 1 1 4 4
## [3516] 4 4 1 4 1 1 4 1 4 1 4 1 1 4 4 4 4 4 1 4 4 4 4 4 4 1 4 4 4 4 4 1 1 1 1 1 1
## [3553] 1 1 4 1 4 4 1 4 4 4 4 4 1 1 4 1 1 1 4 4 1 1 4 4 4 1 4 4 1 4 1 4 4 1 4 4 4
## [3590] 4 4 1 1 4 4 4 4 4 4 4 4 3 3 4 1 1 1 1 4 1 4 1 4 4 4 4 4 4 1 1 4 1 4 4 1 1
## [3627] 4 4 4 1 1 4 1 4 4 4 1 4 4 1 4 1 4 1 4 4 4 1 4 4 1 4 1 4 1 4 1 3 4 4 4 4 4
## [3664] 4 3 1 4 1 4 4 4 4 1 4 4 4 4 1 4 1 4 4 1 4 4 4 4 1 4 4 4 4 4 4 4 1 1 4 1 4
## [3701] 1 4 1 4 4 4 1 4 4 4 4 4 4 4 4 4 4 4 4 4 1 4 4 4 4 1 4 1 4 1 4 1 4 4 1 1 1
## [3738] 4 4 1 4 4 4 4 4 4 4 1 1 4 4 4 4 1 4 4 4 1 4 4 4 1 4 4 4 1 4 4 4 1 4 4 3 4
## [3775] 1 3 4 4 4 4 4 4 4 4 4 4 1 4 1 1 1 1 4 1 1 3 4 4 3 1 1 4 1 1 4 4 3 4 4 1 1
## [3812] 4 4 1 1 3 4 4 1 4 4 1 4 4 4 4 4 4 4 1 4 1 3 4 4 1 4 4 4 4 4 4 1 4 4 4 1 4
## [3849] 4 4 4 3 4 4 1 4 4 4 1 4 4 4 4 1 1 4 4 4 4 4 4 1 4 1 1 4 4 4 4 1 4 4 1 4 1
## [3886] 4 4 4 4 1 4 1 4 4 4 3 3 4 1 1 4 4 1 4 4 1 4 4 4 4 4 1 4 4 4 4 1 1 4 4 4 1
## [3923] 1 4 1 1 4 4 1 1 4 1 1 4 4 4 1 1 4 4 4 4 3 4 1 1 1 4 1 4 4 4 4 1 3 4 1 4 4
## [3960] 1 1 1 4 4 4 4 4 1 1 1 1 1 2 4 4 4 4 4 4 4 4 1 4 1 4 4 4 4 4 4 4 4 4 4 4 4
## [3997] 4 4 4 4 4 1 4 1 1 4 4 4 1 4 4 4 4 4 4 1 4 1 4 1 1 4 4 1 1 4 1 1 4 4 1 1 4
## [4034] 4 4 4 4 4 4 1 1 4 4 3 4 4 3 4 4 4 4 4 4 4 4 1 4 4 4 4 4 4 4 1 1 4 1 1 4 1
## [4071] 1 4 1 1 3 4 4 1 4 1 1 4 4 4 4 4 4 4 4 1 1 1 1 1 4 1 1 4 4 1 4 1 4 4 4 3 4
## [4108] 4 4 4 4 1 4 4 4 4 4 4 1 4 1 4 4 4 1 1 4 4 4 4 4 4 4 1 4 3 4 4 4 4 4 4 4 4
## [4145] 4 4 1 4 4 4 3 1 4 4 4 4 1 4 4 4 4 1 4 1 1 1 1 4 4 1 1 1 1 1 4 4 1 4 1 1 4
## [4182] 4 4 4 4 4 4 4 4 1 4 1 4 4 4 4 4 4 4 3 4 1 1 4 1 4 4 1 4 4 4 4 4 4 1 4 4 4
## [4219] 4 1 4 4 4 4 1 4 4 1 4 4 1 4 4 1 1 1 1 4 1 4 1 4 4 1 4 4 4 4 4 4 4 4 4 4 4
## [4256] 4 4 4 1 4 1 1 4 4 4 4 4 4 4 4 1 4 1 4 1 4 4 4 1 4 4 4 1 4 4 4 4 4 4 4 4 4
## [4293] 4 4 4 1 4 2
## 
## Within cluster sum of squares by cluster:
## [1]  128.7104 3950.7811  219.7401  118.9040
##  (between_SS / total_SS =  48.6 %)
## 
## Available components:
## 
## [1] "cluster"      "centers"      "totss"        "withinss"     "tot.withinss"
## [6] "betweenss"    "size"         "iter"         "ifault"

7. Asignar el grupo al que pertenece cada observación

asignacion <- cbind(data, cluster = segmentos$cluster)
# asignacion

8. Graficar los clusters

fviz_cluster(segmentos, data=df)

9. Optimizar la cantidad de grupos

set.seed(123)
optimizacion <- clusGap(df, FUN=kmeans, nstart=1, K.max =10)
plot(optimizacion, xlab="Número de clusters k")

10. Comparar segmentos

promedio <- aggregate(asignacion, by=list(asignacion$cluster), FUN=mean)
promedio
##   Group.1 Cliente Ticket_Promedio     Visitas cluster
## 1       1      NA       105.78966    3.952950       1
## 2       2      NA      1810.38250 4338.400000       2
## 3       3      NA       259.72604    2.913514       3
## 4       4      NA        34.54634    4.443120       4

Conclusion

La segmentación o clusters es un algoritmo útil para identificar o clasificar a nuestros clientes en segmentos de mercado para implementar mejores estrategias de mercadotecnia a cada uno.

En este codigo estamos analizando los datos de la base de datos de abarrotes, donde podemos obtener distintas estadisticas relevantes a nuestra investigacion. Posteriormente los agrupamos en clusters de acuerdo a sus caracteristicas.

LS0tDQp0aXRsZTogIkRhdGEgRXhwbG9yZXIgJiBDbHVzdGVyIEFiYXJyb3RlcyINCmF1dGhvcjogIk1hcmlhbmEgR2FyY2lhIEEwMTE3NzcwNSINCmRhdGU6ICIyMDI0LTA4LTI1Ig0Kb3V0cHV0OiANCiAgaHRtbF9kb2N1bWVudDoNCiAgICB0b2M6IFRSVUUNCiAgICB0b2NfZmxvYXQ6IFRSVUUNCiAgICBjb2RlX2Rvd25sb2FkOiBUUlVFDQogICAgdGhlbWU6ICJkYXJrIg0KLS0tDQoNCmBgYHtyIHNldHVwLCBpbmNsdWRlPUZBTFNFfSANCmtuaXRyOjpvcHRzX2NodW5rJHNldCh3YXJuaW5nID0gRkFMU0UsIG1lc3NhZ2UgPSBGQUxTRSkgDQpgYGANCg0KIVtdKEM6XFxVc2Vyc1xcbWFyaWFcXE9uZURyaXZlXFxEZXNrdG9wXFxBRDI0XFxNb2R1bG8gMlxcYWJhcnJvdGVzIGdpZmYuZ2lmKQ0KDQojIyAgMS4gSW5zdGFsYXIgcGFxdWV0ZXMgeSBsbGFtYXIgbGlicmVyaWFzIGxpYnJlcmlhcw0KYGBge3J9DQojIGluc3RhbGwucGFja2FnZXMoIkRhdGFFeHBsb3JlciIpDQpsaWJyYXJ5KERhdGFFeHBsb3JlcikNCiNpbnN0YWxsLnBhY2thZ2VzKCJjbHVzdGVyIikNCmxpYnJhcnkoY2x1c3RlcikNCiNpbnN0YWxsLnBhY2thZ2VzKCJnZ3Bsb3QyIikNCmxpYnJhcnkoZ2dwbG90MikNCiNpbnN0YWxsLnBhY2thZ2VzKCJkYXRhLnRhYmxlIikNCmxpYnJhcnkoZGF0YS50YWJsZSkNCiNpbnN0YWxsLnBhY2thZ2VzKCJmYWN0b2V4dHJhIikNCmxpYnJhcnkoZmFjdG9leHRyYSkNCmxpYnJhcnkoZHBseXIpDQpgYGANCg0KIyMgIDIuIFN1YmlyIGJhc2UgZGUgZGF0b3MNCmBgYHtyfQ0KZGF0YSA8LSByZWFkLmNzdigiQzpcXFVzZXJzXFxtYXJpYVxcT25lRHJpdmVcXERlc2t0b3BcXEFEMjRcXE1vZHVsbyAyXFxhYmFycm90ZXMxLmNzdiIpDQpgYGANCg0KIyMgIDMuIEVudGVuZGVyIGxhIGJhc2UgZGUgZGF0b3MNCmBgYHtyfQ0Kc3VtbWFyeShkYXRhKQ0Kc3RyKGRhdGEpDQppbnRyb2R1Y2UoZGF0YSkNCnBsb3RfaW50cm8oZGF0YSkNCnBsb3RfbWlzc2luZyhkYXRhKQ0KDQpgYGANCg0KDQojIyAgNC4gRXNjYWxhciBsYSBiYXNlIGRlIGRhdG9zDQpgYGB7cn0NCmRhdGExIDwtIHNlbGVjdChkYXRhLCBUaWNrZXRfUHJvbWVkaW8sIFZpc2l0YXMpDQpkZiA8LSBzY2FsZShkYXRhMSkNCmBgYA0KDQoNCg0KIyMgNS4gQ2FudGlkYWQgZGUgZ3J1cG9zDQpgYGB7cn0NCmdydXBvcyA8LSA0DQpgYGANCg0KIyMgIDYuIEdlbmVyYXIgbG9zIHNlZ21lbnRvcw0KYGBge3J9DQpzZWdtZW50b3MgPC0ga21lYW5zKGRmLGdydXBvcykNCnNlZ21lbnRvcw0KYGBgDQoNCg0KIyMgIDcuIEFzaWduYXIgZWwgZ3J1cG8gYWwgcXVlIHBlcnRlbmVjZSBjYWRhIG9ic2VydmFjacOzbjwvc3Bhbj4gDQpgYGB7cn0NCmFzaWduYWNpb24gPC0gY2JpbmQoZGF0YSwgY2x1c3RlciA9IHNlZ21lbnRvcyRjbHVzdGVyKQ0KIyBhc2lnbmFjaW9uDQpgYGANCg0KIyMgOC4gR3JhZmljYXIgbG9zIGNsdXN0ZXJzDQpgYGB7cn0NCmZ2aXpfY2x1c3RlcihzZWdtZW50b3MsIGRhdGE9ZGYpDQpgYGANCg0KDQojIyAgOS4gT3B0aW1pemFyIGxhIGNhbnRpZGFkIGRlIGdydXBvcw0KYGBge3J9DQpzZXQuc2VlZCgxMjMpDQpvcHRpbWl6YWNpb24gPC0gY2x1c0dhcChkZiwgRlVOPWttZWFucywgbnN0YXJ0PTEsIEsubWF4ID0xMCkNCnBsb3Qob3B0aW1pemFjaW9uLCB4bGFiPSJOw7ptZXJvIGRlIGNsdXN0ZXJzIGsiKQ0KYGBgDQoNCg0KIyMgIDEwLiBDb21wYXJhciBzZWdtZW50b3MgDQpgYGB7cn0NCnByb21lZGlvIDwtIGFnZ3JlZ2F0ZShhc2lnbmFjaW9uLCBieT1saXN0KGFzaWduYWNpb24kY2x1c3RlciksIEZVTj1tZWFuKQ0KcHJvbWVkaW8NCmBgYA0KDQoNCiMjIENvbmNsdXNpb24gDQpMYSAqKnNlZ21lbnRhY2nDs24qKiBvICpjbHVzdGVycyogZXMgdW4gYWxnb3JpdG1vIMO6dGlsIHBhcmEgaWRlbnRpZmljYXIgbyBjbGFzaWZpY2FyIGEgbnVlc3Ryb3MgY2xpZW50ZXMgZW4gc2VnbWVudG9zIGRlIG1lcmNhZG8gcGFyYSBpbXBsZW1lbnRhciBtZWpvcmVzIGVzdHJhdGVnaWFzIGRlIG1lcmNhZG90ZWNuaWEgYSBjYWRhIHVuby4NCg0KRW4gZXN0ZSBjb2RpZ28gZXN0YW1vcyBhbmFsaXphbmRvIGxvcyBkYXRvcyBkZSBsYSBiYXNlIGRlIGRhdG9zIGRlIGFiYXJyb3RlcywgZG9uZGUgcG9kZW1vcyBvYnRlbmVyIGRpc3RpbnRhcyBlc3RhZGlzdGljYXMgcmVsZXZhbnRlcyBhIG51ZXN0cmEgaW52ZXN0aWdhY2lvbi4gUG9zdGVyaW9ybWVudGUgbG9zIGFncnVwYW1vcyBlbiBjbHVzdGVycyBkZSBhY3VlcmRvIGEgc3VzIGNhcmFjdGVyaXN0aWNhcy4=