RFM Customer Segmentation

Customer Segmentation K-Means Clustering

# Load required libraries
library(ggplot2)
install.packages("dplyr")

Error in install.packages : Updating loaded packages

library(dplyr)
library(factoextra)
library(cluster)
library(fpc)
install.packages("flexclust")

Error in install.packages : Updating loaded packages

library(flexclust)
install.packages("mclust")

Error in install.packages : Updating loaded packages

library(mclust)
install.packages("clusterSim")

Error in install.packages : Updating loaded packages

library(cluster)
install.packages("hopkins")

Error in install.packages : Updating loaded packages

library(hopkins)

# Load the Online Retail dataset
data <- Online_Retail

# Data preprocessing
data <- data %>%
  dplyr::filter(!is.na(CustomerID)) %>%
  dplyr::select(CustomerID, InvoiceNo, InvoiceDate, UnitPrice)

# Calculate total spending (monetary value) per customer
monetary <- data %>%
  group_by(CustomerID) %>%
  summarise(monetary = sum(UnitPrice))

# Calculate the recency and frequency variables
# Recency is calculated by the time elapsed since the last day of the dataset
# Frequency is calculated by summing up the distinct invoices of a customer
recency <- data %>%
  group_by(CustomerID) %>%
  summarise(recency = as.numeric(difftime(max(data$InvoiceDate), max(InvoiceDate), units = "days")),
            frequency = n_distinct(InvoiceNo))

# Merge RFM variables with monetary value
rfm <- left_join(recency, monetary, by = "CustomerID")

# Data normalization
rfm$recency_scaled <- scale(rfm$recency)
rfm$frequency_scaled <- scale(rfm$frequency)
rfm$monetary_scaled <- scale(rfm$monetary)

# Prepare data frame to use for clustering
kmeans_data <- rfm[, c("recency_scaled", "frequency_scaled", "monetary_scaled")]

Error in exists(cacheKey, where = .rs.WorkingDataEnv, inherits = FALSE) : 
  invalid first argument
Error in assign(cacheKey, frame, .rs.CachedDataEnv) : 
  attempt to use zero-length variable name

# Calculate the Hopkins statistic
hopkins_stat <- hopkins::hopkins(X = as.matrix(kmeans_data), m = nrow(kmeans_data) - 1, method = "simple")
cat("Hopkins Statistic:", hopkins_stat, "\n")

Hopkins Statistic: 0.9965328

# Prompt the user to choose the number of clusters based on the elbow plot
chosen_k <- readline(prompt = "Enter the optimal number of clusters based on the elbow plot: ")
7
chosen_k <- as.integer(chosen_k)

# Perform K-means clustering with chosen number of clusters
set.seed(123)
kmeans_model <- kmeans(kmeans_data, centers = chosen_k, nstart = 25)

# Add cluster labels to the original dataset
rfm$cluster <- as.factor(kmeans_model$cluster)

# Visualize the clusters
fviz_cluster(kmeans_model, data = kmeans_data)


# Determine and visualise the optimal number of clusters
fviz_nbclust(kmeans_data, kmeans, method = "wss")

fviz_nbclust(kmeans_data, kmeans, method = "silhouette")

fviz_nbclust(kmeans_data, kmeans, method = "gap_stat")

Clustering k = 1,2,..., K.max (= 10): .. done
Bootstrapping, b = 1,2,..., B (= 100)  [one "." per sample]:
.......

Warning: did not converge in 10 iterations

............

Warning: did not converge in 10 iterations

..........

Warning: did not converge in 10 iterations

.........

Warning: Quick-TRANSfer stage steps exceeded maximum (= 218600)

.....

Warning: did not converge in 10 iterations

....... 50 
..................

Warning: did not converge in 10 iterationsWarning: did not converge in 10 iterations

....

Warning: did not converge in 10 iterations

............

Warning: did not converge in 10 iterations

................ 100

# Visualize data points plotted against recency, monetary, and frequency
ggplot(rfm, aes(x = recency, y = monetary, color = cluster)) +
  geom_point() +
  labs(x = "Recency", y = "Monetary", color = "Cluster") +
  theme_minimal()


ggplot(rfm, aes(x = recency, y = frequency, color = cluster)) +
  geom_point() +
  labs(x = "Recency", y = "Frequency", color = "Cluster") +
  theme_minimal()


ggplot(rfm, aes(x = monetary, y = frequency, color = cluster)) +
  geom_point() +
  labs(x = "Monetary", y = "Frequency", color = "Cluster") +
  theme_minimal()


# Cluster analysis
cluster_analysis <- rfm %>%
  group_by(cluster) %>%
  summarise(average_recency = mean(recency),
            average_frequency = mean(frequency),
            average_monetary = mean(monetary),
            count_customers = n())

print(cluster_analysis)


# Silhouette analysis
sil <- silhouette(kmeans_model$cluster, dist(kmeans_data))
avg_silhouette <- mean(sil[, "sil_width"])

cat("Average Silhouette Width:", avg_silhouette, "\n")

Average Silhouette Width: 0.5094448

# Calculate clustering indices using cluster.stats
clustering_indices <- cluster.stats(dist(kmeans_data), kmeans_model$cluster)
print(clustering_indices)

$n
[1] 4372

$cluster.number
[1] 7

$cluster.size
[1]   48  617 2462  471    4    3  767

$min.cluster.size
[1] 3

$noisen
[1] 0

$diameter
[1] 13.829273  1.721251  1.977773  4.432850 14.771437 12.673996  3.480057

$average.distance
[1]  3.6092760  0.5556253  0.5007617  0.9763928 10.7583198 10.5712937  0.5532323

$median.distance
[1]  2.5705356  0.4949363  0.4762083  0.8248311 12.4094830 11.8860221  0.4993416

$separation
[1]  0.216424551  0.008527502  0.008876033  0.023725235  9.252061626 10.390085232  0.008527502

$average.toother
[1]  6.035026  2.562908  1.991939  2.035711 25.705291 28.374071  1.546554

$separation.matrix
           [,1]         [,2]         [,3]        [,4]      [,5]     [,6]         [,7]
[1,]  0.0000000  3.647130892  2.873742316  0.21642455  9.252062 10.66982  2.953838122
[2,]  3.6471309  0.000000000  1.304904340  1.48149596 18.905945 22.85383  0.008527502
[3,]  2.8737423  1.304904340  0.000000000  0.02372524 17.989815 22.76257  0.008876033
[4,]  0.2164246  1.481495960  0.023725235  0.00000000 16.439481 19.89367  0.346069518
[5,]  9.2520616 18.905945115 17.989814732 16.43948070  0.000000 10.39009 16.260864040
[6,] 10.6698195 22.853832079 22.762571910 19.89366834 10.390085  0.00000 21.945623396
[7,]  2.9538381  0.008527502  0.008876033  0.34606952 16.260864 21.94562  0.000000000

$ave.between.matrix
          [,1]      [,2]      [,3]      [,4]     [,5]     [,6]      [,7]
[1,]  0.000000  6.891162  5.956237  4.652317 23.77636 23.31331  6.288220
[2,]  6.891162  0.000000  2.620755  3.326089 25.98129 28.88034  1.412632
[3,]  5.956237  2.620755  0.000000  1.539219 25.75248 28.49905  1.288422
[4,]  4.652317  3.326089  1.539219  0.000000 25.10700 27.14937  2.209086
[5,] 23.776361 25.981290 25.752477 25.107002  0.00000 22.54987 25.832261
[6,] 23.313310 28.880335 28.499050 27.149372 22.54987  0.00000 28.664789
[7,]  6.288220  1.412632  1.288422  2.209086 25.83226 28.66479  0.000000

$average.between
[1] 2.141269

$average.within
[1] 0.619373

$n.between
[1] 5929896

$n.within
[1] 3625110

$max.diameter
[1] 14.77144

$min.separation
[1] 0.008527502

$within.cluster.ss
[1] 1826.977

$clus.avg.silwidths
        1         2         3         4         5         6         7 
0.1760061 0.5717862 0.5580084 0.3192309 0.4650750 0.4981160 0.4413600 

$avg.silwidth
[1] 0.5094448

$g2
NULL

$g3
NULL

$pearsongamma
[1] 0.4099661

$dunn
[1] 0.0005772967

$dunn2
[1] 0.1197605

$entropy
[1] 1.206027

$wb.ratio
[1] 0.2892551

$ch
[1] 4494.081

$cwidegap
[1]  4.3314064  0.3625535  0.5992575  2.8213618 11.8906586 11.8860221  1.4109591

$widestgap
[1] 11.89066

$sindex
[1] 0.09630851

$corrected.rand
NULL

$vi
NULL

# Extract the Dunn index from the clustering indices list
dunn_index <- clustering_indices$dunn
cat("Dunn Index:", dunn_index, "\n")

Dunn Index: 0.0005772967

# Calculate the Davies-Bouldin Index
db_index <- clusterSim::index.DB(kmeans_data, kmeans_model$cluster)
print(db_index)

$DB
[1] 0.7757305

$r
[1] 0.9758716 0.6732245 0.8507658 0.9758716 0.6272708 0.6272708 0.6998387

$R
          [,1]      [,2]      [,3]      [,4]      [,5]      [,6]      [,7]
[1,]       Inf 0.5729061 0.6528990 0.9758716 0.4403419 0.4157323 0.6286032
[2,] 0.5729061       Inf 0.3318168 0.3970572 0.2918980 0.2350118 0.6732245
[3,] 0.6528990 0.3318168       Inf 0.8507658 0.2915483 0.2356091 0.6998387
[4,] 0.9758716 0.3970572 0.8507658       Inf 0.3161507 0.2633344 0.6111041
[5,] 0.4403419 0.2918980 0.2915483 0.3161507       Inf 0.6272708 0.2932302
[6,] 0.4157323 0.2350118 0.2356091 0.2633344 0.6272708       Inf 0.2365250
[7,] 0.6286032 0.6732245 0.6998387 0.6111041 0.2932302 0.2365250       Inf

$d
          1         2         3         4        5        6         7
1  0.000000  6.519704  5.610816  4.189210 23.39613 22.92693  5.930687
2  6.519704  0.000000  2.599600  3.242420 25.69935 28.64009  1.377465
3  5.610816  2.599600  0.000000  1.428765 25.48363 28.26239  1.222369
4  4.189210  3.242420  1.428765  0.000000 24.84430 26.90007  2.095054
5 23.396125 25.699351 25.483629 24.844302  0.00000 21.19958 25.558278
6 22.926931 28.640094 28.262394 26.900068 21.19958  0.00000 28.426716
7  5.930687  1.377465  1.222369  2.095054 25.55828 28.42672  0.000000

$S
[1] 3.2679420 0.4672364 0.3953546 0.8201897 7.0343533 6.2635227 0.4601066

$centers
           [,1]       [,2]        [,3]
[1,] -0.8675599  5.0559406  1.93721894
[2,]  2.0354305 -0.3824309 -0.18487878
[3,] -0.5534493 -0.1655285 -0.09227753
[4,] -0.7556678  1.1479795  0.43229235
[5,] -0.2267805  2.8027850 25.21577909
[6,] -0.9023141 22.3360828 17.00505334
[7,]  0.6622009 -0.2843701 -0.13978747

K-Means Redone

# Remove observations in cluster 3
rfm_filtered <- rfm[!(rfm$cluster %in% c(5, 6)), ]

# Prepare filtered data frame for clustering
kmeans_data_filtered <- rfm_filtered[, c("recency_scaled", "frequency_scaled", "monetary_scaled")]

# Calculate the Hopkins statistic
hopkins_stat_filtered <- hopkins::hopkins(X = as.matrix(kmeans_data_filtered), m = nrow(kmeans_data_filtered) - 1, method = "simple")
cat("Hopkins Statistic (Filtered):", hopkins_stat_filtered, "\n")

Hopkins Statistic (Filtered): 0.9991269

# Perform K-means clustering on filtered data
set.seed(123)
kmeans_model_filtered <- kmeans(kmeans_data_filtered, centers = chosen_k, nstart = 25)

# Add cluster labels to the original dataset
rfm_filtered$cluster <- as.factor(kmeans_model_filtered$cluster)

# Visualize the clusters after filtering
fviz_cluster(kmeans_model_filtered, data = kmeans_data_filtered)


# Determine and visualise the optimal number of clusters
fviz_nbclust(kmeans_data_filtered, kmeans, method = "wss")

fviz_nbclust(kmeans_data_filtered, kmeans, method = "silhouette")

fviz_nbclust(kmeans_data_filtered, kmeans, method = "gap_stat")

Clustering k = 1,2,..., K.max (= 10): .. done
Bootstrapping, b = 1,2,..., B (= 100)  [one "." per sample]:
....

Warning: Quick-TRANSfer stage steps exceeded maximum (= 218250)

.............................................. 50 
............................

Warning: did not converge in 10 iterations

...................... 100

# Visualize data points plotted against recency, monetary, and frequency after filtering
ggplot(rfm_filtered, aes(x = recency, y = monetary, color = cluster)) +
  geom_point() +
  labs(x = "Recency", y = "Monetary", color = "Cluster") +
  theme_minimal()


ggplot(rfm_filtered, aes(x = recency, y = frequency, color = cluster)) +
  geom_point() +
  labs(x = "Recency", y = "Frequency", color = "Cluster") +
  theme_minimal()


ggplot(rfm_filtered, aes(x = monetary, y = frequency, color = cluster)) +
  geom_point() +
  labs(x = "Monetary", y = "Frequency", color = "Cluster") +
  theme_minimal()


# Cluster analysis on filtered data
cluster_analysis_filtered <- rfm_filtered %>%
  group_by(cluster) %>%
  summarise(average_recency = mean(recency),
            average_frequency = mean(frequency),
            average_monetary = mean(monetary),
            count_customers = n())

print(cluster_analysis_filtered)


# Silhouette analysis on filtered data
sil_filtered <- silhouette(kmeans_model_filtered$cluster, dist(kmeans_data_filtered))
avg_silhouette_filtered <- mean(sil_filtered[, "sil_width"])

cat("Average Silhouette Width (filtered data):", avg_silhouette_filtered, "\n")

Average Silhouette Width (filtered data): 0.410558

# Calculate clustering indices using cluster.stats on filtered data
clustering_indices_filtered <- cluster.stats(dist(kmeans_data_filtered), kmeans_model_filtered$cluster)
print(clustering_indices_filtered)

$n
[1] 4365

$cluster.number
[1] 7

$cluster.size
[1]  956 1669  618  514   93  505   10

$min.cluster.size
[1] 10

$noisen
[1] 0

$diameter
[1]  1.756549  1.178992  3.486484  3.216320 11.442911  1.721251  7.651552

$average.distance
[1] 0.4125185 0.3883796 0.4997264 0.7701894 1.8702627 0.4982096 4.0383326

$median.distance
[1] 0.3828204 0.3635399 0.4411893 0.6915428 1.4501589 0.4549806 4.1604236

$separation
[1] 0.008015243 0.008015243 0.016228707 0.022005240 0.119527979 0.016228707 1.108150582

$average.toother
[1] 1.253222 1.584484 1.659767 1.762314 3.870893 2.583039 9.985118

$separation.matrix
            [,1]        [,2]       [,3]       [,4]     [,5]       [,6]     [,7]
[1,] 0.000000000 0.008015243 0.01816411 0.11059565 1.920735 1.14119735 6.747913
[2,] 0.008015243 0.000000000 0.80226028 0.02200524 1.846596 1.94304442 6.784611
[3,] 0.018164110 0.802260278 0.00000000 0.37930242 2.023195 0.01622871 6.380692
[4,] 0.110595653 0.022005240 0.37930242 0.00000000 0.119528 1.50301034 5.043469
[5,] 1.920734589 1.846596456 2.02319541 0.11952798 0.000000 2.43310143 1.108151
[6,] 1.141197353 1.943044421 0.01622871 1.50301034 2.433101 0.00000000 6.872097
[7,] 6.747912838 6.784611372 6.38069184 5.04346876 1.108151 6.87209694 0.000000

$ave.between.matrix
           [,1]       [,2]      [,3]     [,4]     [,5]      [,6]      [,7]
[1,]  0.0000000  0.7186601  1.129150 1.490303 3.902414  2.265956 10.172748
[2,]  0.7186601  0.0000000  1.726467 1.203646 3.701349  2.880617 10.016099
[3,]  1.1291496  1.7264668  0.000000 2.217695 4.292442  1.218974 10.353049
[4,]  1.4903028  1.2036461  2.217695 0.000000 2.696331  3.252078  8.946331
[5,]  3.9024142  3.7013491  4.292442 2.696331 0.000000  4.993472  6.785039
[6,]  2.2659556  2.8806171  1.218974 3.252078 4.993472  0.000000 10.723893
[7,] 10.1727481 10.0160987 10.353049 8.946331 6.785039 10.723893  0.000000

$average.between
[1] 1.769162

$average.within
[1] 0.5070321

$n.between
[1] 7221917

$n.within
[1] 2302513

$max.diameter
[1] 11.44291

$min.separation
[1] 0.008015243

$within.cluster.ss
[1] 1041.182

$clus.avg.silwidths
        1         2         3         4         5         6         7 
0.3594481 0.4329407 0.4212373 0.3069062 0.2707465 0.5525951 0.3560846 

$avg.silwidth
[1] 0.410558

$g2
NULL

$g3
NULL

$pearsongamma
[1] 0.4661497

$dunn
[1] 0.0007004549

$dunn2
[1] 0.1779596

$entropy
[1] 1.574323

$wb.ratio
[1] 0.2865946

$ch
[1] 4749.204

$cwidegap
[1] 0.5992575 0.2119316 1.4109591 0.7670103 4.3314064 0.3625535 3.4331291

$widestgap
[1] 4.331406

$sindex
[1] 0.05312771

$corrected.rand
NULL

$vi
NULL

# Extract the Dunn index from the clustering indices list for filtered data
dunn_index_filtered <- clustering_indices_filtered$dunn
cat("Dunn Index (filtered data):", dunn_index_filtered, "\n")

Dunn Index (filtered data): 0.0007004549

# Calculate the Davies-Bouldin Index for filtered data
db_index_filtered <- clusterSim::index.DB(kmeans_data_filtered, kmeans_model_filtered$cluster)
print(db_index_filtered)

$DB
[1] 0.8898893

$r
[1] 1.0271967 1.0271967 0.7158673 0.9986825 0.9986825 0.7158673 0.7457325

$R
          [,1]      [,2]      [,3]      [,4]      [,5]      [,6]      [,7]
[1,]       Inf 1.0271967 0.7121167 0.6871342 0.5671687 0.3340569 0.3317411
[2,] 1.0271967       Inf 0.4357237 0.8422737 0.5918766 0.2528442 0.3342843
[3,] 0.7121167 0.4357237       Inf 0.4930724 0.5372929 0.7158673 0.3353985
[4,] 0.6871342 0.8422737 0.4930724       Inf 0.9986825 0.3261877 0.4127906
[5,] 0.5671687 0.5918766 0.5372929 0.9986825       Inf 0.4554497 0.7457325
[6,] 0.3340569 0.2528442 0.7158673 0.3261877 0.4554497       Inf 0.3229575
[7,] 0.3317411 0.3342843 0.3353985 0.4127906 0.7457325 0.3229575       Inf

$d
           1         2         3        4        5         6         7
1  0.0000000 0.6213921  1.067160 1.393092 3.690169  2.247836 10.017020
2  0.6213921 0.0000000  1.682471 1.104618 3.490758  2.863641  9.860490
3  1.0671605 1.6824709  0.000000 2.133645 4.071799  1.181372 10.190438
4  1.3930916 1.1046177  2.133645 0.000000 2.388193  3.197557  8.757845
5  3.6901691 3.4907581  4.071799 2.388193 0.000000  4.783649  6.370734
6  2.2478363 2.8636409  1.181372 3.197557 4.783649  0.000000 10.555013
7 10.0170199 9.8604905 10.190438 8.757845 6.370734 10.555013  0.000000

$S
[1] 0.3325711 0.3057208 0.4273717 0.6246697 1.7603772 0.4183342 2.9904864

$centers
            [,1]       [,2]        [,3]
[1,] -0.08294552 -0.2702957 -0.14257274
[2,] -0.69114470 -0.1544282 -0.08968949
[3,]  0.98359034 -0.3067994 -0.14216607
[4,] -0.73496808  0.8596042  0.34619805
[5,] -0.82234785  3.1156793  1.12463119
[6,]  2.16148705 -0.3861514 -0.18579211
[7,] -0.87273658  9.0937740  3.32601727

Hierarchical Clustering

# Load required libraries
library(ggplot2)
install.packages("dplyr")

Error in install.packages : Updating loaded packages

library(dplyr)
library(factoextra)
library(cluster)
library(fpc)
library(flexclust)
library(mclust)
library(clusterSim)
library(hopkins)

# Load the Online Retail dataset
data <- Online_Retail

# Data preprocessing
data <- data %>%
  dplyr::filter(!is.na(CustomerID)) %>%
  dplyr::select(CustomerID, InvoiceNo, InvoiceDate, UnitPrice)

# Calculate total spending (monetary value) per customer
monetary <- data %>%
  group_by(CustomerID) %>%
  summarise(monetary = sum(UnitPrice))

# Calculate the recency and frequency variables
# Recency is calculated by the time elapsed since the last day of the dataset
# Frequency is calculated by summing up the distinct invoices of a customer
recency <- data %>%
  group_by(CustomerID) %>%
  summarise(recency = as.numeric(difftime(max(data$InvoiceDate), max(InvoiceDate), units = "days")),
            frequency = n_distinct(InvoiceNo))

# Merge RFM variables with monetary value
rfm <- left_join(recency, monetary, by = "CustomerID")

# Calculate the Hopkins statistic
hopkins_stat <- hopkins::hopkins(X = as.matrix(rfm), m = nrow(rfm) - 1, method = "simple")
print(hopkins_stat)

[1] 0.9935658

# Check the value of the Hopkins statistic
cat("Hopkins Statistic:", hopkins_stat, "\n")

Hopkins Statistic: 0.9935658

# Data normalization
rfm$recency_scaled <- scale(rfm$recency)
rfm$frequency_scaled <- scale(rfm$frequency)
rfm$monetary_scaled <- scale(rfm$monetary)

# Perform hierarchical clustering
hclust_data <- rfm[, c("recency_scaled", "frequency_scaled", "monetary_scaled")]
hclust_model <- hclust(dist(hclust_data))

# Specify the desired number of clusters
desired_clusters <- 4

# Determine the cutoff height for the desired number of clusters
cutoff_height <- hclust_model$height[length(hclust_model$height) - (desired_clusters - 1)]
cat("Cut-off height at ", desired_clusters, " clusters:", cutoff_height, "\n")

Cut-off height at  4  clusters: 14.77144

# Plot the dendogram with an indication of the cut-off
plot(hclust_model, labels = FALSE)
abline(h = cutoff_height, col = "red", lty = 2)


# Determine and visualise the optimal number of clusters up to 10 with bootstrapping up to 10
fviz_nbclust(hclust_data, hcut, method = "wss")

fviz_nbclust(hclust_data, hcut, method = "silhouette")

gap_stat_hclust <- clusGap(hclust_data, hcut, K.max = 10, B = 10)

Clustering k = 1,2,..., K.max (= 10): .. done
Bootstrapping, b = 1,2,..., B (= 10)  [one "." per sample]:
.......... 10

fviz_gap_stat(gap_stat_hclust)


# Determine the tree cut for a desired number of clusters
cut <- cutree(hclust_model, k = desired_clusters)

# Add cluster labels to the original dataset
rfm$cluster <- as.factor(cut)

# Visualize data points plotted against recency, monetary, and frequency
ggplot(rfm, aes(x = recency, y = monetary, color = cluster)) +
  geom_point() +
  labs(x = "Recency", y = "Monetary", color = "Cluster") +
  theme_minimal()


ggplot(rfm, aes(x = recency, y = frequency, color = cluster)) +
  geom_point() +
  labs(x = "Recency", y = "Frequency", color = "Cluster") +
  theme_minimal()


ggplot(rfm, aes(x = monetary, y = frequency, color = cluster)) +
  geom_point() +
  labs(x = "Monetary", y = "Frequency", color = "Cluster") +
  theme_minimal()


# Cluster analysis
cluster_analysis <- rfm %>%
  group_by(cluster) %>%
  summarise(average_recency = mean(recency),
            average_frequency = mean(frequency),
            average_monetary = mean(monetary),
            count_customers = n())

print(cluster_analysis)


# Silhouette analysis
sil <- silhouette(cut, dist(hclust_data))
avg_silhouette <- mean(sil[, "sil_width"])

cat("Average Silhouette Width:", avg_silhouette, "\n")

Average Silhouette Width: 0.8031784

# Calculate clustering indices using cluster.stats
clustering_indices <- cluster.stats(dist(hclust_data), cut)
print(clustering_indices)

$n
[1] 4372

$cluster.number
[1] 4

$cluster.size
[1] 4340   25    4    3

$min.cluster.size
[1] 3

$noisen
[1] 0

$diameter
[1] 10.94129 10.17666 14.77144 12.67400

$average.distance
[1]  1.378864  3.601903 10.758320 10.571294

$median.distance
[1]  1.110563  3.180654 12.409483 11.886022

$separation
[1]  0.6352564  0.6352564  9.2520616 10.3900852

$average.toother
[1] 11.567897  7.307411 25.705291 28.374071

$separation.matrix
           [,1]       [,2]      [,3]     [,4]
[1,]  0.0000000  0.6352564  9.252062 18.40517
[2,]  0.6352564  0.0000000 13.717897 10.66982
[3,]  9.2520616 13.7178974  0.000000 10.39009
[4,] 18.4051659 10.6698195 10.390085  0.00000

$ave.between.matrix
          [,1]      [,2]     [,3]     [,4]
[1,]  0.000000  7.282036 25.71830 28.41620
[2,]  7.282036  0.000000 23.82517 21.99288
[3,] 25.718302 23.825174  0.00000 22.54987
[4,] 28.416196 21.992881 22.54987  0.00000

$average.between
[1] 11.58328

$average.within
[1] 1.406465

$n.between
[1] 139067

$n.within
[1] 9415939

$max.diameter
[1] 14.77144

$min.separation
[1] 0.6352564

$within.cluster.ss
[1] 6916.75

$clus.avg.silwidths
        1         2         3         4 
0.8054802 0.4963800 0.4678211 0.4770577 

$avg.silwidth
[1] 0.8031784

$g2
NULL

$g3
NULL

$pearsongamma
[1] 0.6381906

$dunn
[1] 0.04300573

$dunn2
[1] 0.6768748

$entropy
[1] 0.04822162

$wb.ratio
[1] 0.121422

$ch
[1] 1304.332

$cwidegap
[1]  4.331406  3.433129 11.890659 11.886022

$widestgap
[1] 11.89066

$sindex
[1] 2.794022

$corrected.rand
NULL

$vi
NULL

# Extract the Dunn index from the clustering indices list
dunn_index <- clustering_indices$dunn
cat("Dunn Index:", dunn_index, "\n")

Dunn Index: 0.04300573

# Calculate the Davies-Bouldin Index
db_index <- clusterSim::index.DB(hclust_data, cut)
print(db_index)

$DB
[1] 0.6138877

$r
[1] 0.6005045 0.6005045 0.6272708 0.6272708

$R
          [,1]      [,2]      [,3]      [,4]
[1,]       Inf 0.6005045 0.3243178 0.2654419
[2,] 0.6005045       Inf 0.4295965 0.4297899
[3,] 0.3243178 0.4295965       Inf 0.6272708
[4,] 0.2654419 0.4297899 0.6272708       Inf

$d
          1         2        3        4
1  0.000000  7.085531 25.42511 28.16053
2  7.085531  0.000000 23.45872 21.65466
3 25.425107 23.458720  0.00000 21.19958
4 28.160533 21.654660 21.19958  0.00000

$S
[1] 1.211463 3.043431 7.034353 6.263523

$centers
             [,1]        [,2]        [,3]
[1,]  0.005880044 -0.05629346 -0.04699245
[2,] -0.876213115  6.64376839  2.08275854
[3,] -0.226780490  2.80278496 25.21577909
[4,] -0.902314125 22.33608281 17.00505334

Hierarchical Clustering Redone

# Filter out observations in clusters other than cluster 1
rfm_filtered <- rfm[rfm$cluster == 1, ]

# Perform hierarchical clustering on the filtered dataset
hclust_data_filtered <- rfm_filtered[, c("recency_scaled", "frequency_scaled", "monetary_scaled")]
hclust_model_filtered <- hclust(dist(hclust_data_filtered))

# Specify the desired number of clusters
desired_clusters_filtered <- 4

# Determine the cutoff height for the desired number of clusters
cutoff_height_filtered <- hclust_model_filtered$height[length(hclust_model_filtered$height) - (desired_clusters_filtered - 1)]
cat("Cut-off height at", desired_clusters_filtered, "cluster(s):", cutoff_height_filtered, "\n")

Cut-off height at 4 cluster(s): 4.637608

# Plot the dendrogram with an indication of the cut-off
plot(hclust_model_filtered, labels = FALSE)
abline(h = cutoff_height_filtered, col = "red", lty = 2)


# Determine and visualize the optimal number of clusters up to 10 with bootstrapping up to 10
fviz_nbclust(hclust_data_filtered, hcut, method = "wss")

fviz_nbclust(hclust_data_filtered, hcut, method = "silhouette")

gap_stat_hclust_filtered <- clusGap(hclust_data_filtered, hcut, K.max = 10, B = 10)

Clustering k = 1,2,..., K.max (= 10): .. done
Bootstrapping, b = 1,2,..., B (= 10)  [one "." per sample]:
.......... 10

fviz_gap_stat(gap_stat_hclust_filtered)


# Determine the tree cut for a desired number of clusters
cut_filtered <- cutree(hclust_model_filtered, k = desired_clusters_filtered)

# Add cluster labels to the filtered dataset
rfm_filtered$cluster <- as.factor(cut_filtered)

# Visualize data points plotted against recency, monetary, and frequency
ggplot(rfm_filtered, aes(x = recency, y = monetary, color = cluster)) +
  geom_point() +
  labs(x = "Recency", y = "Monetary", color = "Cluster") +
  theme_minimal()


ggplot(rfm_filtered, aes(x = recency, y = frequency, color = cluster)) +
  geom_point() +
  labs(x = "Recency", y = "Frequency", color = "Cluster") +
  theme_minimal()


ggplot(rfm_filtered, aes(x = monetary, y = frequency, color = cluster)) +
  geom_point() +
  labs(x = "Monetary", y = "Frequency", color = "Cluster") +
  theme_minimal()


# Cluster analysis
cluster_analysis_filtered <- rfm_filtered %>%
  group_by(cluster) %>%
  summarise(average_recency = mean(recency),
            average_frequency = mean(frequency),
            average_monetary = mean(monetary),
            count_customers = n())

print(cluster_analysis_filtered)


# Silhouette analysis
sil_filtered <- silhouette(cut_filtered, dist(hclust_data_filtered))
avg_silhouette_filtered <- mean(sil_filtered[, "sil_width"])

cat("Average Silhouette Width:", avg_silhouette_filtered, "\n")

Average Silhouette Width: 0.5618641

# Calculate clustering indices using cluster.stats
clustering_indices_filtered <- cluster.stats(dist(hclust_data_filtered), cut_filtered)
print(clustering_indices_filtered)

$n
[1] 4340

$cluster.number
[1] 4

$cluster.size
[1]  697 3453  187    3

$min.cluster.size
[1] 3

$noisen
[1] 0

$diameter
[1] 1.637197 3.874338 3.821206 4.637608

$average.distance
[1] 0.5996526 0.8388544 1.2124658 3.1414414

$median.distance
[1] 0.5274782 0.7316045 1.0796680 4.3314064

$separation
[1] 0.02074356 0.02074356 0.10850601 3.13231909

$average.toother
[1] 2.427511 2.382063 2.671076 7.659358

$separation.matrix
           [,1]       [,2]     [,3]     [,4]
[1,] 0.00000000 0.02074356 1.954498 6.442425
[2,] 0.02074356 0.00000000 0.108506 3.159829
[3,] 1.95449833 0.10850601 0.000000 3.132319
[4,] 6.44242505 3.15982900 3.132319 0.000000

$ave.between.matrix
         [,1]     [,2]     [,3]     [,4]
[1,] 0.000000 2.346175 3.836342 8.228365
[2,] 2.346175 0.000000 2.432268 7.590602
[3,] 3.836342 2.432268 0.000000 6.808108
[4,] 8.228365 7.590602 6.808108 0.000000

$average.between
[1] 2.445977

$average.within
[1] 0.8181285

$n.between
[1] 3195802

$n.within
[1] 6219828

$max.diameter
[1] 4.637608

$min.separation
[1] 0.02074356

$within.cluster.ss
[1] 2052.066

$clus.avg.silwidths
        1         2         3         4 
0.7356960 0.5313029 0.4786358 0.5387765 

$avg.silwidth
[1] 0.5618641

$g2
NULL

$g3
NULL

$pearsongamma
[1] 0.751978

$dunn
[1] 0.0044729

$dunn2
[1] 0.7468465

$entropy
[1] 0.6161344

$wb.ratio
[1] 0.3344792

$ch
[1] 3040.947

$cwidegap
[1] 0.3619369 1.4109591 2.8213618 4.3314064

$widestgap
[1] 4.331406

$sindex
[1] 0.1846325

$corrected.rand
NULL

$vi
NULL

# Extract the Dunn index from the clustering indices list
dunn_index_filtered <- clustering_indices_filtered$dunn
cat("Dunn Index:", dunn_index_filtered, "\n")

Dunn Index: 0.0044729

# Calculate the Davies-Bouldin Index
db_index_filtered <- clusterSim::index.DB(hclust_data_filtered, cut_filtered)
print(db_index_filtered)

$DB
[1] 0.6150994

$r
[1] 0.5214179 0.7381963 0.7381963 0.4625872

$R
          [,1]      [,2]      [,3]      [,4]
[1,]       Inf 0.5214179 0.4004371 0.3234591
[2,] 0.5214179       Inf 0.7381963 0.3764138
[3,] 0.4004371 0.7381963       Inf 0.4625872
[4,] 0.3234591 0.3764138 0.4625872       Inf

$d
         1        2        3        4
1 0.000000 2.305232 3.740158 8.118145
2 2.305232 0.000000 2.288395 7.485045
3 3.740158 2.288395 0.000000 6.729939
4 8.118145 7.485045 6.729939 0.000000

$S
[1] 0.5052015 0.6967875 0.9924968 2.1206864

$centers
           [,1]       [,2]        [,3]
[1,]  1.9435668 -0.3838634 -0.18685373
[2,] -0.3412198 -0.1040612 -0.06213785
[3,] -0.7944171  2.0275954  0.63600386
[4,] -0.7862184  1.1341113  7.30636307

DBSCAN

# Load required libraries
library(ggplot2)
library(dplyr)
library(factoextra)
library(cluster)
library(fpc)
library(flexclust)
library(mclust)

# Load the Online Retail dataset
data <- Online_Retail

# Data preprocessing
data <- data %>%
  dplyr::filter(!is.na(CustomerID)) %>%
  dplyr::select(CustomerID, InvoiceNo, InvoiceDate, UnitPrice)

# Calculate total spending (monetary value) per customer
monetary <- data %>%
  group_by(CustomerID) %>%
  summarise(monetary = sum(UnitPrice))

# Calculate the recency and frequency variables
# Recency is calculated by the time elapsed since the last day of the dataset
# Frequency is calculated by summing up the distinct invoices of a customer
recency <- data %>%
  group_by(CustomerID) %>%
  summarise(recency = as.numeric(difftime(max(data$InvoiceDate), max(InvoiceDate), units = "days")),
            frequency = n_distinct(InvoiceNo))

# Merge RFM variables with monetary value
rfm <- left_join(recency, monetary, by = "CustomerID")

# Create distance matrix of RFM data frame 

# Perform DBSCAN clustering
dbscan_model <- dbscan(dist(rfm), eps = 0.5, MinPts = 5, scale = TRUE, method = "raw", showplot = 1)

# Add cluster labels to the original dataset
rfm$cluster <- as.factor(dbscan_model$cluster)

# Visualize the clusters
fviz_cluster(dbscan_model, data = normalized_data)

# Cluster analysis
cluster_analysis <- rfm %>%
  group_by(cluster) %>%
  summarise(average_recency = mean(recency),
            average_frequency = mean(frequency),
            average_monetary = mean(monetary),
            count_customers = n())

print(cluster_analysis)

# Silhouette analysis
sil <- silhouette(dbscan_model$cluster, dist(normalized_data))
avg_silhouette <- mean(sil[, "sil_width"])
cat("Average Silhouette Width:", avg_silhouette, "\n")

# Extract cluster labels from the DBSCAN model
dbscan_labels <- dbscan_model$cluster

# Calculate clustering indices using cluster.stats
clustering_indices <- cluster.stats(dist(rfm), dbscan_labels)
print(clustering_indices)

# Extract the Dunn index from the clustering indices list
dunn_index <- clustering_indices$dunn
cat("Dunn Index:", dunn_index, "\n")

# Calculate the Davies-Bouldin Index
db_index <- clusterSim::index.DB(rfm, dbscan_labels)
print(db_index)

LS0tDQp0aXRsZTogIlJGTSBDdXN0b21lciBTZWdtZW50YXRpb24iDQphdXRob3I6ICJGcmVkZXJpY2sgSGFnZWxzdGVpbiINCmRhdGU6ICJKdW5lIDE2IDIwMjMiDQpvdXRwdXQ6IGh0bWxfbm90ZWJvb2sNCi0tLQ0KDQpDdXN0b21lciBTZWdtZW50YXRpb24NCkstTWVhbnMgQ2x1c3RlcmluZw0KYGBge3J9DQojIExvYWQgcmVxdWlyZWQgbGlicmFyaWVzDQpsaWJyYXJ5KGdncGxvdDIpDQppbnN0YWxsLnBhY2thZ2VzKCJkcGx5ciIpDQpsaWJyYXJ5KGRwbHlyKQ0KbGlicmFyeShmYWN0b2V4dHJhKQ0KbGlicmFyeShjbHVzdGVyKQ0KbGlicmFyeShmcGMpDQppbnN0YWxsLnBhY2thZ2VzKCJmbGV4Y2x1c3QiKQ0KbGlicmFyeShmbGV4Y2x1c3QpDQppbnN0YWxsLnBhY2thZ2VzKCJtY2x1c3QiKQ0KbGlicmFyeShtY2x1c3QpDQppbnN0YWxsLnBhY2thZ2VzKCJjbHVzdGVyU2ltIikNCmxpYnJhcnkoY2x1c3RlcikNCmluc3RhbGwucGFja2FnZXMoImhvcGtpbnMiKQ0KbGlicmFyeShob3BraW5zKQ0KDQojIExvYWQgdGhlIE9ubGluZSBSZXRhaWwgZGF0YXNldA0KZGF0YSA8LSBPbmxpbmVfUmV0YWlsDQoNCiMgRGF0YSBwcmVwcm9jZXNzaW5nDQpkYXRhIDwtIGRhdGEgJT4lDQogIGRwbHlyOjpmaWx0ZXIoIWlzLm5hKEN1c3RvbWVySUQpKSAlPiUNCiAgZHBseXI6OnNlbGVjdChDdXN0b21lcklELCBJbnZvaWNlTm8sIEludm9pY2VEYXRlLCBVbml0UHJpY2UpDQoNCiMgQ2FsY3VsYXRlIHRvdGFsIHNwZW5kaW5nIChtb25ldGFyeSB2YWx1ZSkgcGVyIGN1c3RvbWVyDQptb25ldGFyeSA8LSBkYXRhICU+JQ0KICBncm91cF9ieShDdXN0b21lcklEKSAlPiUNCiAgc3VtbWFyaXNlKG1vbmV0YXJ5ID0gc3VtKFVuaXRQcmljZSkpDQoNCiMgQ2FsY3VsYXRlIHRoZSByZWNlbmN5IGFuZCBmcmVxdWVuY3kgdmFyaWFibGVzDQojIFJlY2VuY3kgaXMgY2FsY3VsYXRlZCBieSB0aGUgdGltZSBlbGFwc2VkIHNpbmNlIHRoZSBsYXN0IGRheSBvZiB0aGUgZGF0YXNldA0KIyBGcmVxdWVuY3kgaXMgY2FsY3VsYXRlZCBieSBzdW1taW5nIHVwIHRoZSBkaXN0aW5jdCBpbnZvaWNlcyBvZiBhIGN1c3RvbWVyDQpyZWNlbmN5IDwtIGRhdGEgJT4lDQogIGdyb3VwX2J5KEN1c3RvbWVySUQpICU+JQ0KICBzdW1tYXJpc2UocmVjZW5jeSA9IGFzLm51bWVyaWMoZGlmZnRpbWUobWF4KGRhdGEkSW52b2ljZURhdGUpLCBtYXgoSW52b2ljZURhdGUpLCB1bml0cyA9ICJkYXlzIikpLA0KICAgICAgICAgICAgZnJlcXVlbmN5ID0gbl9kaXN0aW5jdChJbnZvaWNlTm8pKQ0KDQojIE1lcmdlIFJGTSB2YXJpYWJsZXMgd2l0aCBtb25ldGFyeSB2YWx1ZQ0KcmZtIDwtIGxlZnRfam9pbihyZWNlbmN5LCBtb25ldGFyeSwgYnkgPSAiQ3VzdG9tZXJJRCIpDQoNCiMgRGF0YSBub3JtYWxpemF0aW9uDQpyZm0kcmVjZW5jeV9zY2FsZWQgPC0gc2NhbGUocmZtJHJlY2VuY3kpDQpyZm0kZnJlcXVlbmN5X3NjYWxlZCA8LSBzY2FsZShyZm0kZnJlcXVlbmN5KQ0KcmZtJG1vbmV0YXJ5X3NjYWxlZCA8LSBzY2FsZShyZm0kbW9uZXRhcnkpDQoNCiMgUHJlcGFyZSBkYXRhIGZyYW1lIHRvIHVzZSBmb3IgY2x1c3RlcmluZw0Ka21lYW5zX2RhdGEgPC0gcmZtWywgYygicmVjZW5jeV9zY2FsZWQiLCAiZnJlcXVlbmN5X3NjYWxlZCIsICJtb25ldGFyeV9zY2FsZWQiKV0NCg0KIyBDYWxjdWxhdGUgdGhlIEhvcGtpbnMgc3RhdGlzdGljDQpob3BraW5zX3N0YXQgPC0gaG9wa2luczo6aG9wa2lucyhYID0gYXMubWF0cml4KGttZWFuc19kYXRhKSwgbSA9IG5yb3coa21lYW5zX2RhdGEpIC0gMSwgbWV0aG9kID0gInNpbXBsZSIpDQpjYXQoIkhvcGtpbnMgU3RhdGlzdGljOiIsIGhvcGtpbnNfc3RhdCwgIlxuIikNCg0KIyBQcm9tcHQgdGhlIHVzZXIgdG8gY2hvb3NlIHRoZSBudW1iZXIgb2YgY2x1c3RlcnMgYmFzZWQgb24gdGhlIGVsYm93IHBsb3QNCmNob3Nlbl9rIDwtIHJlYWRsaW5lKHByb21wdCA9ICJFbnRlciB0aGUgb3B0aW1hbCBudW1iZXIgb2YgY2x1c3RlcnMgYmFzZWQgb24gdGhlIGVsYm93IHBsb3Q6ICIpDQpjaG9zZW5fayA8LSBhcy5pbnRlZ2VyKGNob3Nlbl9rKQ0KDQojIFBlcmZvcm0gSy1tZWFucyBjbHVzdGVyaW5nIHdpdGggY2hvc2VuIG51bWJlciBvZiBjbHVzdGVycw0Kc2V0LnNlZWQoMTIzKQ0Ka21lYW5zX21vZGVsIDwtIGttZWFucyhrbWVhbnNfZGF0YSwgY2VudGVycyA9IGNob3Nlbl9rLCBuc3RhcnQgPSAyNSkNCg0KIyBBZGQgY2x1c3RlciBsYWJlbHMgdG8gdGhlIG9yaWdpbmFsIGRhdGFzZXQNCnJmbSRjbHVzdGVyIDwtIGFzLmZhY3RvcihrbWVhbnNfbW9kZWwkY2x1c3RlcikNCg0KIyBWaXN1YWxpemUgdGhlIGNsdXN0ZXJzDQpmdml6X2NsdXN0ZXIoa21lYW5zX21vZGVsLCBkYXRhID0ga21lYW5zX2RhdGEpDQoNCiMgRGV0ZXJtaW5lIGFuZCB2aXN1YWxpc2UgdGhlIG9wdGltYWwgbnVtYmVyIG9mIGNsdXN0ZXJzDQpmdml6X25iY2x1c3Qoa21lYW5zX2RhdGEsIGttZWFucywgbWV0aG9kID0gIndzcyIpDQpmdml6X25iY2x1c3Qoa21lYW5zX2RhdGEsIGttZWFucywgbWV0aG9kID0gInNpbGhvdWV0dGUiKQ0KZnZpel9uYmNsdXN0KGttZWFuc19kYXRhLCBrbWVhbnMsIG1ldGhvZCA9ICJnYXBfc3RhdCIpDQoNCiMgVmlzdWFsaXplIGRhdGEgcG9pbnRzIHBsb3R0ZWQgYWdhaW5zdCByZWNlbmN5LCBtb25ldGFyeSwgYW5kIGZyZXF1ZW5jeQ0KZ2dwbG90KHJmbSwgYWVzKHggPSByZWNlbmN5LCB5ID0gbW9uZXRhcnksIGNvbG9yID0gY2x1c3RlcikpICsNCiAgZ2VvbV9wb2ludCgpICsNCiAgbGFicyh4ID0gIlJlY2VuY3kiLCB5ID0gIk1vbmV0YXJ5IiwgY29sb3IgPSAiQ2x1c3RlciIpICsNCiAgdGhlbWVfbWluaW1hbCgpDQoNCmdncGxvdChyZm0sIGFlcyh4ID0gcmVjZW5jeSwgeSA9IGZyZXF1ZW5jeSwgY29sb3IgPSBjbHVzdGVyKSkgKw0KICBnZW9tX3BvaW50KCkgKw0KICBsYWJzKHggPSAiUmVjZW5jeSIsIHkgPSAiRnJlcXVlbmN5IiwgY29sb3IgPSAiQ2x1c3RlciIpICsNCiAgdGhlbWVfbWluaW1hbCgpDQoNCmdncGxvdChyZm0sIGFlcyh4ID0gbW9uZXRhcnksIHkgPSBmcmVxdWVuY3ksIGNvbG9yID0gY2x1c3RlcikpICsNCiAgZ2VvbV9wb2ludCgpICsNCiAgbGFicyh4ID0gIk1vbmV0YXJ5IiwgeSA9ICJGcmVxdWVuY3kiLCBjb2xvciA9ICJDbHVzdGVyIikgKw0KICB0aGVtZV9taW5pbWFsKCkNCg0KIyBDbHVzdGVyIGFuYWx5c2lzDQpjbHVzdGVyX2FuYWx5c2lzIDwtIHJmbSAlPiUNCiAgZ3JvdXBfYnkoY2x1c3RlcikgJT4lDQogIHN1bW1hcmlzZShhdmVyYWdlX3JlY2VuY3kgPSBtZWFuKHJlY2VuY3kpLA0KICAgICAgICAgICAgYXZlcmFnZV9mcmVxdWVuY3kgPSBtZWFuKGZyZXF1ZW5jeSksDQogICAgICAgICAgICBhdmVyYWdlX21vbmV0YXJ5ID0gbWVhbihtb25ldGFyeSksDQogICAgICAgICAgICBjb3VudF9jdXN0b21lcnMgPSBuKCkpDQoNCnByaW50KGNsdXN0ZXJfYW5hbHlzaXMpDQoNCiMgU2lsaG91ZXR0ZSBhbmFseXNpcw0Kc2lsIDwtIHNpbGhvdWV0dGUoa21lYW5zX21vZGVsJGNsdXN0ZXIsIGRpc3Qoa21lYW5zX2RhdGEpKQ0KYXZnX3NpbGhvdWV0dGUgPC0gbWVhbihzaWxbLCAic2lsX3dpZHRoIl0pDQoNCmNhdCgiQXZlcmFnZSBTaWxob3VldHRlIFdpZHRoOiIsIGF2Z19zaWxob3VldHRlLCAiXG4iKQ0KDQojIENhbGN1bGF0ZSBjbHVzdGVyaW5nIGluZGljZXMgdXNpbmcgY2x1c3Rlci5zdGF0cw0KY2x1c3RlcmluZ19pbmRpY2VzIDwtIGNsdXN0ZXIuc3RhdHMoZGlzdChrbWVhbnNfZGF0YSksIGttZWFuc19tb2RlbCRjbHVzdGVyKQ0KcHJpbnQoY2x1c3RlcmluZ19pbmRpY2VzKQ0KDQojIEV4dHJhY3QgdGhlIER1bm4gaW5kZXggZnJvbSB0aGUgY2x1c3RlcmluZyBpbmRpY2VzIGxpc3QNCmR1bm5faW5kZXggPC0gY2x1c3RlcmluZ19pbmRpY2VzJGR1bm4NCmNhdCgiRHVubiBJbmRleDoiLCBkdW5uX2luZGV4LCAiXG4iKQ0KDQojIENhbGN1bGF0ZSB0aGUgRGF2aWVzLUJvdWxkaW4gSW5kZXgNCmRiX2luZGV4IDwtIGNsdXN0ZXJTaW06OmluZGV4LkRCKGttZWFuc19kYXRhLCBrbWVhbnNfbW9kZWwkY2x1c3RlcikNCnByaW50KGRiX2luZGV4KQ0KDQpgYGANCg0KSy1NZWFucyBSZWRvbmUNCmBgYHtyfQ0KIyBSZW1vdmUgb2JzZXJ2YXRpb25zIGluIGNsdXN0ZXIgMw0KcmZtX2ZpbHRlcmVkIDwtIHJmbVshKHJmbSRjbHVzdGVyICVpbiUgYyg1LCA2KSksIF0NCg0KIyBQcmVwYXJlIGZpbHRlcmVkIGRhdGEgZnJhbWUgZm9yIGNsdXN0ZXJpbmcNCmttZWFuc19kYXRhX2ZpbHRlcmVkIDwtIHJmbV9maWx0ZXJlZFssIGMoInJlY2VuY3lfc2NhbGVkIiwgImZyZXF1ZW5jeV9zY2FsZWQiLCAibW9uZXRhcnlfc2NhbGVkIildDQoNCiMgQ2FsY3VsYXRlIHRoZSBIb3BraW5zIHN0YXRpc3RpYw0KaG9wa2luc19zdGF0X2ZpbHRlcmVkIDwtIGhvcGtpbnM6OmhvcGtpbnMoWCA9IGFzLm1hdHJpeChrbWVhbnNfZGF0YV9maWx0ZXJlZCksIG0gPSBucm93KGttZWFuc19kYXRhX2ZpbHRlcmVkKSAtIDEsIG1ldGhvZCA9ICJzaW1wbGUiKQ0KY2F0KCJIb3BraW5zIFN0YXRpc3RpYyAoRmlsdGVyZWQpOiIsIGhvcGtpbnNfc3RhdF9maWx0ZXJlZCwgIlxuIikNCg0KIyBQZXJmb3JtIEstbWVhbnMgY2x1c3RlcmluZyBvbiBmaWx0ZXJlZCBkYXRhDQpzZXQuc2VlZCgxMjMpDQprbWVhbnNfbW9kZWxfZmlsdGVyZWQgPC0ga21lYW5zKGttZWFuc19kYXRhX2ZpbHRlcmVkLCBjZW50ZXJzID0gY2hvc2VuX2ssIG5zdGFydCA9IDI1KQ0KDQojIEFkZCBjbHVzdGVyIGxhYmVscyB0byB0aGUgb3JpZ2luYWwgZGF0YXNldA0KcmZtX2ZpbHRlcmVkJGNsdXN0ZXIgPC0gYXMuZmFjdG9yKGttZWFuc19tb2RlbF9maWx0ZXJlZCRjbHVzdGVyKQ0KDQojIFZpc3VhbGl6ZSB0aGUgY2x1c3RlcnMgYWZ0ZXIgZmlsdGVyaW5nDQpmdml6X2NsdXN0ZXIoa21lYW5zX21vZGVsX2ZpbHRlcmVkLCBkYXRhID0ga21lYW5zX2RhdGFfZmlsdGVyZWQpDQoNCiMgRGV0ZXJtaW5lIGFuZCB2aXN1YWxpc2UgdGhlIG9wdGltYWwgbnVtYmVyIG9mIGNsdXN0ZXJzDQpmdml6X25iY2x1c3Qoa21lYW5zX2RhdGFfZmlsdGVyZWQsIGttZWFucywgbWV0aG9kID0gIndzcyIpDQpmdml6X25iY2x1c3Qoa21lYW5zX2RhdGFfZmlsdGVyZWQsIGttZWFucywgbWV0aG9kID0gInNpbGhvdWV0dGUiKQ0KZnZpel9uYmNsdXN0KGttZWFuc19kYXRhX2ZpbHRlcmVkLCBrbWVhbnMsIG1ldGhvZCA9ICJnYXBfc3RhdCIpDQoNCiMgVmlzdWFsaXplIGRhdGEgcG9pbnRzIHBsb3R0ZWQgYWdhaW5zdCByZWNlbmN5LCBtb25ldGFyeSwgYW5kIGZyZXF1ZW5jeSBhZnRlciBmaWx0ZXJpbmcNCmdncGxvdChyZm1fZmlsdGVyZWQsIGFlcyh4ID0gcmVjZW5jeSwgeSA9IG1vbmV0YXJ5LCBjb2xvciA9IGNsdXN0ZXIpKSArDQogIGdlb21fcG9pbnQoKSArDQogIGxhYnMoeCA9ICJSZWNlbmN5IiwgeSA9ICJNb25ldGFyeSIsIGNvbG9yID0gIkNsdXN0ZXIiKSArDQogIHRoZW1lX21pbmltYWwoKQ0KDQpnZ3Bsb3QocmZtX2ZpbHRlcmVkLCBhZXMoeCA9IHJlY2VuY3ksIHkgPSBmcmVxdWVuY3ksIGNvbG9yID0gY2x1c3RlcikpICsNCiAgZ2VvbV9wb2ludCgpICsNCiAgbGFicyh4ID0gIlJlY2VuY3kiLCB5ID0gIkZyZXF1ZW5jeSIsIGNvbG9yID0gIkNsdXN0ZXIiKSArDQogIHRoZW1lX21pbmltYWwoKQ0KDQpnZ3Bsb3QocmZtX2ZpbHRlcmVkLCBhZXMoeCA9IG1vbmV0YXJ5LCB5ID0gZnJlcXVlbmN5LCBjb2xvciA9IGNsdXN0ZXIpKSArDQogIGdlb21fcG9pbnQoKSArDQogIGxhYnMoeCA9ICJNb25ldGFyeSIsIHkgPSAiRnJlcXVlbmN5IiwgY29sb3IgPSAiQ2x1c3RlciIpICsNCiAgdGhlbWVfbWluaW1hbCgpDQoNCiMgQ2x1c3RlciBhbmFseXNpcyBvbiBmaWx0ZXJlZCBkYXRhDQpjbHVzdGVyX2FuYWx5c2lzX2ZpbHRlcmVkIDwtIHJmbV9maWx0ZXJlZCAlPiUNCiAgZ3JvdXBfYnkoY2x1c3RlcikgJT4lDQogIHN1bW1hcmlzZShhdmVyYWdlX3JlY2VuY3kgPSBtZWFuKHJlY2VuY3kpLA0KICAgICAgICAgICAgYXZlcmFnZV9mcmVxdWVuY3kgPSBtZWFuKGZyZXF1ZW5jeSksDQogICAgICAgICAgICBhdmVyYWdlX21vbmV0YXJ5ID0gbWVhbihtb25ldGFyeSksDQogICAgICAgICAgICBjb3VudF9jdXN0b21lcnMgPSBuKCkpDQoNCnByaW50KGNsdXN0ZXJfYW5hbHlzaXNfZmlsdGVyZWQpDQoNCiMgU2lsaG91ZXR0ZSBhbmFseXNpcyBvbiBmaWx0ZXJlZCBkYXRhDQpzaWxfZmlsdGVyZWQgPC0gc2lsaG91ZXR0ZShrbWVhbnNfbW9kZWxfZmlsdGVyZWQkY2x1c3RlciwgZGlzdChrbWVhbnNfZGF0YV9maWx0ZXJlZCkpDQphdmdfc2lsaG91ZXR0ZV9maWx0ZXJlZCA8LSBtZWFuKHNpbF9maWx0ZXJlZFssICJzaWxfd2lkdGgiXSkNCg0KY2F0KCJBdmVyYWdlIFNpbGhvdWV0dGUgV2lkdGggKGZpbHRlcmVkIGRhdGEpOiIsIGF2Z19zaWxob3VldHRlX2ZpbHRlcmVkLCAiXG4iKQ0KDQojIENhbGN1bGF0ZSBjbHVzdGVyaW5nIGluZGljZXMgdXNpbmcgY2x1c3Rlci5zdGF0cyBvbiBmaWx0ZXJlZCBkYXRhDQpjbHVzdGVyaW5nX2luZGljZXNfZmlsdGVyZWQgPC0gY2x1c3Rlci5zdGF0cyhkaXN0KGttZWFuc19kYXRhX2ZpbHRlcmVkKSwga21lYW5zX21vZGVsX2ZpbHRlcmVkJGNsdXN0ZXIpDQpwcmludChjbHVzdGVyaW5nX2luZGljZXNfZmlsdGVyZWQpDQoNCiMgRXh0cmFjdCB0aGUgRHVubiBpbmRleCBmcm9tIHRoZSBjbHVzdGVyaW5nIGluZGljZXMgbGlzdCBmb3IgZmlsdGVyZWQgZGF0YQ0KZHVubl9pbmRleF9maWx0ZXJlZCA8LSBjbHVzdGVyaW5nX2luZGljZXNfZmlsdGVyZWQkZHVubg0KY2F0KCJEdW5uIEluZGV4IChmaWx0ZXJlZCBkYXRhKToiLCBkdW5uX2luZGV4X2ZpbHRlcmVkLCAiXG4iKQ0KDQojIENhbGN1bGF0ZSB0aGUgRGF2aWVzLUJvdWxkaW4gSW5kZXggZm9yIGZpbHRlcmVkIGRhdGENCmRiX2luZGV4X2ZpbHRlcmVkIDwtIGNsdXN0ZXJTaW06OmluZGV4LkRCKGttZWFuc19kYXRhX2ZpbHRlcmVkLCBrbWVhbnNfbW9kZWxfZmlsdGVyZWQkY2x1c3RlcikNCnByaW50KGRiX2luZGV4X2ZpbHRlcmVkKQ0KDQpgYGANCg0KDQoNCkhpZXJhcmNoaWNhbCBDbHVzdGVyaW5nDQpgYGB7cn0NCiMgTG9hZCByZXF1aXJlZCBsaWJyYXJpZXMNCmxpYnJhcnkoZ2dwbG90MikNCmluc3RhbGwucGFja2FnZXMoImRwbHlyIikNCmxpYnJhcnkoZHBseXIpDQpsaWJyYXJ5KGZhY3RvZXh0cmEpDQpsaWJyYXJ5KGNsdXN0ZXIpDQpsaWJyYXJ5KGZwYykNCmxpYnJhcnkoZmxleGNsdXN0KQ0KbGlicmFyeShtY2x1c3QpDQpsaWJyYXJ5KGNsdXN0ZXJTaW0pDQpsaWJyYXJ5KGhvcGtpbnMpDQoNCiMgTG9hZCB0aGUgT25saW5lIFJldGFpbCBkYXRhc2V0DQpkYXRhIDwtIE9ubGluZV9SZXRhaWwNCg0KIyBEYXRhIHByZXByb2Nlc3NpbmcNCmRhdGEgPC0gZGF0YSAlPiUNCiAgZHBseXI6OmZpbHRlcighaXMubmEoQ3VzdG9tZXJJRCkpICU+JQ0KICBkcGx5cjo6c2VsZWN0KEN1c3RvbWVySUQsIEludm9pY2VObywgSW52b2ljZURhdGUsIFVuaXRQcmljZSkNCg0KIyBDYWxjdWxhdGUgdG90YWwgc3BlbmRpbmcgKG1vbmV0YXJ5IHZhbHVlKSBwZXIgY3VzdG9tZXINCm1vbmV0YXJ5IDwtIGRhdGEgJT4lDQogIGdyb3VwX2J5KEN1c3RvbWVySUQpICU+JQ0KICBzdW1tYXJpc2UobW9uZXRhcnkgPSBzdW0oVW5pdFByaWNlKSkNCg0KIyBDYWxjdWxhdGUgdGhlIHJlY2VuY3kgYW5kIGZyZXF1ZW5jeSB2YXJpYWJsZXMNCiMgUmVjZW5jeSBpcyBjYWxjdWxhdGVkIGJ5IHRoZSB0aW1lIGVsYXBzZWQgc2luY2UgdGhlIGxhc3QgZGF5IG9mIHRoZSBkYXRhc2V0DQojIEZyZXF1ZW5jeSBpcyBjYWxjdWxhdGVkIGJ5IHN1bW1pbmcgdXAgdGhlIGRpc3RpbmN0IGludm9pY2VzIG9mIGEgY3VzdG9tZXINCnJlY2VuY3kgPC0gZGF0YSAlPiUNCiAgZ3JvdXBfYnkoQ3VzdG9tZXJJRCkgJT4lDQogIHN1bW1hcmlzZShyZWNlbmN5ID0gYXMubnVtZXJpYyhkaWZmdGltZShtYXgoZGF0YSRJbnZvaWNlRGF0ZSksIG1heChJbnZvaWNlRGF0ZSksIHVuaXRzID0gImRheXMiKSksDQogICAgICAgICAgICBmcmVxdWVuY3kgPSBuX2Rpc3RpbmN0KEludm9pY2VObykpDQoNCiMgTWVyZ2UgUkZNIHZhcmlhYmxlcyB3aXRoIG1vbmV0YXJ5IHZhbHVlDQpyZm0gPC0gbGVmdF9qb2luKHJlY2VuY3ksIG1vbmV0YXJ5LCBieSA9ICJDdXN0b21lcklEIikNCg0KIyBDYWxjdWxhdGUgdGhlIEhvcGtpbnMgc3RhdGlzdGljDQpob3BraW5zX3N0YXQgPC0gaG9wa2luczo6aG9wa2lucyhYID0gYXMubWF0cml4KHJmbSksIG0gPSBucm93KHJmbSkgLSAxLCBtZXRob2QgPSAic2ltcGxlIikNCnByaW50KGhvcGtpbnNfc3RhdCkNCg0KIyBDaGVjayB0aGUgdmFsdWUgb2YgdGhlIEhvcGtpbnMgc3RhdGlzdGljDQpjYXQoIkhvcGtpbnMgU3RhdGlzdGljOiIsIGhvcGtpbnNfc3RhdCwgIlxuIikNCg0KIyBEYXRhIG5vcm1hbGl6YXRpb24NCnJmbSRyZWNlbmN5X3NjYWxlZCA8LSBzY2FsZShyZm0kcmVjZW5jeSkNCnJmbSRmcmVxdWVuY3lfc2NhbGVkIDwtIHNjYWxlKHJmbSRmcmVxdWVuY3kpDQpyZm0kbW9uZXRhcnlfc2NhbGVkIDwtIHNjYWxlKHJmbSRtb25ldGFyeSkNCg0KIyBQZXJmb3JtIGhpZXJhcmNoaWNhbCBjbHVzdGVyaW5nDQpoY2x1c3RfZGF0YSA8LSByZm1bLCBjKCJyZWNlbmN5X3NjYWxlZCIsICJmcmVxdWVuY3lfc2NhbGVkIiwgIm1vbmV0YXJ5X3NjYWxlZCIpXQ0KaGNsdXN0X21vZGVsIDwtIGhjbHVzdChkaXN0KGhjbHVzdF9kYXRhKSkNCg0KIyBTcGVjaWZ5IHRoZSBkZXNpcmVkIG51bWJlciBvZiBjbHVzdGVycw0KZGVzaXJlZF9jbHVzdGVycyA8LSA0DQoNCiMgRGV0ZXJtaW5lIHRoZSBjdXRvZmYgaGVpZ2h0IGZvciB0aGUgZGVzaXJlZCBudW1iZXIgb2YgY2x1c3RlcnMNCmN1dG9mZl9oZWlnaHQgPC0gaGNsdXN0X21vZGVsJGhlaWdodFtsZW5ndGgoaGNsdXN0X21vZGVsJGhlaWdodCkgLSAoZGVzaXJlZF9jbHVzdGVycyAtIDEpXQ0KY2F0KCJDdXQtb2ZmIGhlaWdodCBhdCAiLCBkZXNpcmVkX2NsdXN0ZXJzLCAiIGNsdXN0ZXJzOiIsIGN1dG9mZl9oZWlnaHQsICJcbiIpDQoNCiMgUGxvdCB0aGUgZGVuZG9ncmFtIHdpdGggYW4gaW5kaWNhdGlvbiBvZiB0aGUgY3V0LW9mZg0KcGxvdChoY2x1c3RfbW9kZWwsIGxhYmVscyA9IEZBTFNFKQ0KYWJsaW5lKGggPSBjdXRvZmZfaGVpZ2h0LCBjb2wgPSAicmVkIiwgbHR5ID0gMikNCg0KIyBEZXRlcm1pbmUgYW5kIHZpc3VhbGlzZSB0aGUgb3B0aW1hbCBudW1iZXIgb2YgY2x1c3RlcnMgdXAgdG8gMTAgd2l0aCBib290c3RyYXBwaW5nIHVwIHRvIDEwDQpmdml6X25iY2x1c3QoaGNsdXN0X2RhdGEsIGhjdXQsIG1ldGhvZCA9ICJ3c3MiKQ0KZnZpel9uYmNsdXN0KGhjbHVzdF9kYXRhLCBoY3V0LCBtZXRob2QgPSAic2lsaG91ZXR0ZSIpDQpnYXBfc3RhdF9oY2x1c3QgPC0gY2x1c0dhcChoY2x1c3RfZGF0YSwgaGN1dCwgSy5tYXggPSAxMCwgQiA9IDEwKQ0KZnZpel9nYXBfc3RhdChnYXBfc3RhdF9oY2x1c3QpDQoNCiMgRGV0ZXJtaW5lIHRoZSB0cmVlIGN1dCBmb3IgYSBkZXNpcmVkIG51bWJlciBvZiBjbHVzdGVycw0KY3V0IDwtIGN1dHJlZShoY2x1c3RfbW9kZWwsIGsgPSBkZXNpcmVkX2NsdXN0ZXJzKQ0KDQojIEFkZCBjbHVzdGVyIGxhYmVscyB0byB0aGUgb3JpZ2luYWwgZGF0YXNldA0KcmZtJGNsdXN0ZXIgPC0gYXMuZmFjdG9yKGN1dCkNCg0KIyBWaXN1YWxpemUgZGF0YSBwb2ludHMgcGxvdHRlZCBhZ2FpbnN0IHJlY2VuY3ksIG1vbmV0YXJ5LCBhbmQgZnJlcXVlbmN5DQpnZ3Bsb3QocmZtLCBhZXMoeCA9IHJlY2VuY3ksIHkgPSBtb25ldGFyeSwgY29sb3IgPSBjbHVzdGVyKSkgKw0KICBnZW9tX3BvaW50KCkgKw0KICBsYWJzKHggPSAiUmVjZW5jeSIsIHkgPSAiTW9uZXRhcnkiLCBjb2xvciA9ICJDbHVzdGVyIikgKw0KICB0aGVtZV9taW5pbWFsKCkNCg0KZ2dwbG90KHJmbSwgYWVzKHggPSByZWNlbmN5LCB5ID0gZnJlcXVlbmN5LCBjb2xvciA9IGNsdXN0ZXIpKSArDQogIGdlb21fcG9pbnQoKSArDQogIGxhYnMoeCA9ICJSZWNlbmN5IiwgeSA9ICJGcmVxdWVuY3kiLCBjb2xvciA9ICJDbHVzdGVyIikgKw0KICB0aGVtZV9taW5pbWFsKCkNCg0KZ2dwbG90KHJmbSwgYWVzKHggPSBtb25ldGFyeSwgeSA9IGZyZXF1ZW5jeSwgY29sb3IgPSBjbHVzdGVyKSkgKw0KICBnZW9tX3BvaW50KCkgKw0KICBsYWJzKHggPSAiTW9uZXRhcnkiLCB5ID0gIkZyZXF1ZW5jeSIsIGNvbG9yID0gIkNsdXN0ZXIiKSArDQogIHRoZW1lX21pbmltYWwoKQ0KDQojIENsdXN0ZXIgYW5hbHlzaXMNCmNsdXN0ZXJfYW5hbHlzaXMgPC0gcmZtICU+JQ0KICBncm91cF9ieShjbHVzdGVyKSAlPiUNCiAgc3VtbWFyaXNlKGF2ZXJhZ2VfcmVjZW5jeSA9IG1lYW4ocmVjZW5jeSksDQogICAgICAgICAgICBhdmVyYWdlX2ZyZXF1ZW5jeSA9IG1lYW4oZnJlcXVlbmN5KSwNCiAgICAgICAgICAgIGF2ZXJhZ2VfbW9uZXRhcnkgPSBtZWFuKG1vbmV0YXJ5KSwNCiAgICAgICAgICAgIGNvdW50X2N1c3RvbWVycyA9IG4oKSkNCg0KcHJpbnQoY2x1c3Rlcl9hbmFseXNpcykNCg0KIyBTaWxob3VldHRlIGFuYWx5c2lzDQpzaWwgPC0gc2lsaG91ZXR0ZShjdXQsIGRpc3QoaGNsdXN0X2RhdGEpKQ0KYXZnX3NpbGhvdWV0dGUgPC0gbWVhbihzaWxbLCAic2lsX3dpZHRoIl0pDQoNCmNhdCgiQXZlcmFnZSBTaWxob3VldHRlIFdpZHRoOiIsIGF2Z19zaWxob3VldHRlLCAiXG4iKQ0KDQojIENhbGN1bGF0ZSBjbHVzdGVyaW5nIGluZGljZXMgdXNpbmcgY2x1c3Rlci5zdGF0cw0KY2x1c3RlcmluZ19pbmRpY2VzIDwtIGNsdXN0ZXIuc3RhdHMoZGlzdChoY2x1c3RfZGF0YSksIGN1dCkNCnByaW50KGNsdXN0ZXJpbmdfaW5kaWNlcykNCg0KIyBFeHRyYWN0IHRoZSBEdW5uIGluZGV4IGZyb20gdGhlIGNsdXN0ZXJpbmcgaW5kaWNlcyBsaXN0DQpkdW5uX2luZGV4IDwtIGNsdXN0ZXJpbmdfaW5kaWNlcyRkdW5uDQpjYXQoIkR1bm4gSW5kZXg6IiwgZHVubl9pbmRleCwgIlxuIikNCg0KIyBDYWxjdWxhdGUgdGhlIERhdmllcy1Cb3VsZGluIEluZGV4DQpkYl9pbmRleCA8LSBjbHVzdGVyU2ltOjppbmRleC5EQihoY2x1c3RfZGF0YSwgY3V0KQ0KcHJpbnQoZGJfaW5kZXgpDQpgYGANCg0KSGllcmFyY2hpY2FsIENsdXN0ZXJpbmcgUmVkb25lDQpgYGB7cn0NCiMgRmlsdGVyIG91dCBvYnNlcnZhdGlvbnMgaW4gY2x1c3RlcnMgb3RoZXIgdGhhbiBjbHVzdGVyIDENCnJmbV9maWx0ZXJlZCA8LSByZm1bcmZtJGNsdXN0ZXIgPT0gMSwgXQ0KDQojIFBlcmZvcm0gaGllcmFyY2hpY2FsIGNsdXN0ZXJpbmcgb24gdGhlIGZpbHRlcmVkIGRhdGFzZXQNCmhjbHVzdF9kYXRhX2ZpbHRlcmVkIDwtIHJmbV9maWx0ZXJlZFssIGMoInJlY2VuY3lfc2NhbGVkIiwgImZyZXF1ZW5jeV9zY2FsZWQiLCAibW9uZXRhcnlfc2NhbGVkIildDQpoY2x1c3RfbW9kZWxfZmlsdGVyZWQgPC0gaGNsdXN0KGRpc3QoaGNsdXN0X2RhdGFfZmlsdGVyZWQpKQ0KDQojIFNwZWNpZnkgdGhlIGRlc2lyZWQgbnVtYmVyIG9mIGNsdXN0ZXJzDQpkZXNpcmVkX2NsdXN0ZXJzX2ZpbHRlcmVkIDwtIDQNCg0KIyBEZXRlcm1pbmUgdGhlIGN1dG9mZiBoZWlnaHQgZm9yIHRoZSBkZXNpcmVkIG51bWJlciBvZiBjbHVzdGVycw0KY3V0b2ZmX2hlaWdodF9maWx0ZXJlZCA8LSBoY2x1c3RfbW9kZWxfZmlsdGVyZWQkaGVpZ2h0W2xlbmd0aChoY2x1c3RfbW9kZWxfZmlsdGVyZWQkaGVpZ2h0KSAtIChkZXNpcmVkX2NsdXN0ZXJzX2ZpbHRlcmVkIC0gMSldDQpjYXQoIkN1dC1vZmYgaGVpZ2h0IGF0IiwgZGVzaXJlZF9jbHVzdGVyc19maWx0ZXJlZCwgImNsdXN0ZXIocyk6IiwgY3V0b2ZmX2hlaWdodF9maWx0ZXJlZCwgIlxuIikNCg0KIyBQbG90IHRoZSBkZW5kcm9ncmFtIHdpdGggYW4gaW5kaWNhdGlvbiBvZiB0aGUgY3V0LW9mZg0KcGxvdChoY2x1c3RfbW9kZWxfZmlsdGVyZWQsIGxhYmVscyA9IEZBTFNFKQ0KYWJsaW5lKGggPSBjdXRvZmZfaGVpZ2h0X2ZpbHRlcmVkLCBjb2wgPSAicmVkIiwgbHR5ID0gMikNCg0KIyBEZXRlcm1pbmUgYW5kIHZpc3VhbGl6ZSB0aGUgb3B0aW1hbCBudW1iZXIgb2YgY2x1c3RlcnMgdXAgdG8gMTAgd2l0aCBib290c3RyYXBwaW5nIHVwIHRvIDEwDQpmdml6X25iY2x1c3QoaGNsdXN0X2RhdGFfZmlsdGVyZWQsIGhjdXQsIG1ldGhvZCA9ICJ3c3MiKQ0KZnZpel9uYmNsdXN0KGhjbHVzdF9kYXRhX2ZpbHRlcmVkLCBoY3V0LCBtZXRob2QgPSAic2lsaG91ZXR0ZSIpDQpnYXBfc3RhdF9oY2x1c3RfZmlsdGVyZWQgPC0gY2x1c0dhcChoY2x1c3RfZGF0YV9maWx0ZXJlZCwgaGN1dCwgSy5tYXggPSAxMCwgQiA9IDEwKQ0KZnZpel9nYXBfc3RhdChnYXBfc3RhdF9oY2x1c3RfZmlsdGVyZWQpDQoNCiMgRGV0ZXJtaW5lIHRoZSB0cmVlIGN1dCBmb3IgYSBkZXNpcmVkIG51bWJlciBvZiBjbHVzdGVycw0KY3V0X2ZpbHRlcmVkIDwtIGN1dHJlZShoY2x1c3RfbW9kZWxfZmlsdGVyZWQsIGsgPSBkZXNpcmVkX2NsdXN0ZXJzX2ZpbHRlcmVkKQ0KDQojIEFkZCBjbHVzdGVyIGxhYmVscyB0byB0aGUgZmlsdGVyZWQgZGF0YXNldA0KcmZtX2ZpbHRlcmVkJGNsdXN0ZXIgPC0gYXMuZmFjdG9yKGN1dF9maWx0ZXJlZCkNCg0KIyBWaXN1YWxpemUgZGF0YSBwb2ludHMgcGxvdHRlZCBhZ2FpbnN0IHJlY2VuY3ksIG1vbmV0YXJ5LCBhbmQgZnJlcXVlbmN5DQpnZ3Bsb3QocmZtX2ZpbHRlcmVkLCBhZXMoeCA9IHJlY2VuY3ksIHkgPSBtb25ldGFyeSwgY29sb3IgPSBjbHVzdGVyKSkgKw0KICBnZW9tX3BvaW50KCkgKw0KICBsYWJzKHggPSAiUmVjZW5jeSIsIHkgPSAiTW9uZXRhcnkiLCBjb2xvciA9ICJDbHVzdGVyIikgKw0KICB0aGVtZV9taW5pbWFsKCkNCg0KZ2dwbG90KHJmbV9maWx0ZXJlZCwgYWVzKHggPSByZWNlbmN5LCB5ID0gZnJlcXVlbmN5LCBjb2xvciA9IGNsdXN0ZXIpKSArDQogIGdlb21fcG9pbnQoKSArDQogIGxhYnMoeCA9ICJSZWNlbmN5IiwgeSA9ICJGcmVxdWVuY3kiLCBjb2xvciA9ICJDbHVzdGVyIikgKw0KICB0aGVtZV9taW5pbWFsKCkNCg0KZ2dwbG90KHJmbV9maWx0ZXJlZCwgYWVzKHggPSBtb25ldGFyeSwgeSA9IGZyZXF1ZW5jeSwgY29sb3IgPSBjbHVzdGVyKSkgKw0KICBnZW9tX3BvaW50KCkgKw0KICBsYWJzKHggPSAiTW9uZXRhcnkiLCB5ID0gIkZyZXF1ZW5jeSIsIGNvbG9yID0gIkNsdXN0ZXIiKSArDQogIHRoZW1lX21pbmltYWwoKQ0KDQojIENsdXN0ZXIgYW5hbHlzaXMNCmNsdXN0ZXJfYW5hbHlzaXNfZmlsdGVyZWQgPC0gcmZtX2ZpbHRlcmVkICU+JQ0KICBncm91cF9ieShjbHVzdGVyKSAlPiUNCiAgc3VtbWFyaXNlKGF2ZXJhZ2VfcmVjZW5jeSA9IG1lYW4ocmVjZW5jeSksDQogICAgICAgICAgICBhdmVyYWdlX2ZyZXF1ZW5jeSA9IG1lYW4oZnJlcXVlbmN5KSwNCiAgICAgICAgICAgIGF2ZXJhZ2VfbW9uZXRhcnkgPSBtZWFuKG1vbmV0YXJ5KSwNCiAgICAgICAgICAgIGNvdW50X2N1c3RvbWVycyA9IG4oKSkNCg0KcHJpbnQoY2x1c3Rlcl9hbmFseXNpc19maWx0ZXJlZCkNCg0KIyBTaWxob3VldHRlIGFuYWx5c2lzDQpzaWxfZmlsdGVyZWQgPC0gc2lsaG91ZXR0ZShjdXRfZmlsdGVyZWQsIGRpc3QoaGNsdXN0X2RhdGFfZmlsdGVyZWQpKQ0KYXZnX3NpbGhvdWV0dGVfZmlsdGVyZWQgPC0gbWVhbihzaWxfZmlsdGVyZWRbLCAic2lsX3dpZHRoIl0pDQoNCmNhdCgiQXZlcmFnZSBTaWxob3VldHRlIFdpZHRoOiIsIGF2Z19zaWxob3VldHRlX2ZpbHRlcmVkLCAiXG4iKQ0KDQojIENhbGN1bGF0ZSBjbHVzdGVyaW5nIGluZGljZXMgdXNpbmcgY2x1c3Rlci5zdGF0cw0KY2x1c3RlcmluZ19pbmRpY2VzX2ZpbHRlcmVkIDwtIGNsdXN0ZXIuc3RhdHMoZGlzdChoY2x1c3RfZGF0YV9maWx0ZXJlZCksIGN1dF9maWx0ZXJlZCkNCnByaW50KGNsdXN0ZXJpbmdfaW5kaWNlc19maWx0ZXJlZCkNCg0KIyBFeHRyYWN0IHRoZSBEdW5uIGluZGV4IGZyb20gdGhlIGNsdXN0ZXJpbmcgaW5kaWNlcyBsaXN0DQpkdW5uX2luZGV4X2ZpbHRlcmVkIDwtIGNsdXN0ZXJpbmdfaW5kaWNlc19maWx0ZXJlZCRkdW5uDQpjYXQoIkR1bm4gSW5kZXg6IiwgZHVubl9pbmRleF9maWx0ZXJlZCwgIlxuIikNCg0KIyBDYWxjdWxhdGUgdGhlIERhdmllcy1Cb3VsZGluIEluZGV4DQpkYl9pbmRleF9maWx0ZXJlZCA8LSBjbHVzdGVyU2ltOjppbmRleC5EQihoY2x1c3RfZGF0YV9maWx0ZXJlZCwgY3V0X2ZpbHRlcmVkKQ0KcHJpbnQoZGJfaW5kZXhfZmlsdGVyZWQpDQpgYGANCg0KDQpEQlNDQU4NCmBgYHtyfQ0KIyBMb2FkIHJlcXVpcmVkIGxpYnJhcmllcw0KbGlicmFyeShnZ3Bsb3QyKQ0KbGlicmFyeShkcGx5cikNCmxpYnJhcnkoZmFjdG9leHRyYSkNCmxpYnJhcnkoY2x1c3RlcikNCmxpYnJhcnkoZnBjKQ0KbGlicmFyeShmbGV4Y2x1c3QpDQpsaWJyYXJ5KG1jbHVzdCkNCg0KIyBMb2FkIHRoZSBPbmxpbmUgUmV0YWlsIGRhdGFzZXQNCmRhdGEgPC0gT25saW5lX1JldGFpbA0KDQojIERhdGEgcHJlcHJvY2Vzc2luZw0KZGF0YSA8LSBkYXRhICU+JQ0KICBkcGx5cjo6ZmlsdGVyKCFpcy5uYShDdXN0b21lcklEKSkgJT4lDQogIGRwbHlyOjpzZWxlY3QoQ3VzdG9tZXJJRCwgSW52b2ljZU5vLCBJbnZvaWNlRGF0ZSwgVW5pdFByaWNlKQ0KDQojIENhbGN1bGF0ZSB0b3RhbCBzcGVuZGluZyAobW9uZXRhcnkgdmFsdWUpIHBlciBjdXN0b21lcg0KbW9uZXRhcnkgPC0gZGF0YSAlPiUNCiAgZ3JvdXBfYnkoQ3VzdG9tZXJJRCkgJT4lDQogIHN1bW1hcmlzZShtb25ldGFyeSA9IHN1bShVbml0UHJpY2UpKQ0KDQojIENhbGN1bGF0ZSB0aGUgcmVjZW5jeSBhbmQgZnJlcXVlbmN5IHZhcmlhYmxlcw0KIyBSZWNlbmN5IGlzIGNhbGN1bGF0ZWQgYnkgdGhlIHRpbWUgZWxhcHNlZCBzaW5jZSB0aGUgbGFzdCBkYXkgb2YgdGhlIGRhdGFzZXQNCiMgRnJlcXVlbmN5IGlzIGNhbGN1bGF0ZWQgYnkgc3VtbWluZyB1cCB0aGUgZGlzdGluY3QgaW52b2ljZXMgb2YgYSBjdXN0b21lcg0KcmVjZW5jeSA8LSBkYXRhICU+JQ0KICBncm91cF9ieShDdXN0b21lcklEKSAlPiUNCiAgc3VtbWFyaXNlKHJlY2VuY3kgPSBhcy5udW1lcmljKGRpZmZ0aW1lKG1heChkYXRhJEludm9pY2VEYXRlKSwgbWF4KEludm9pY2VEYXRlKSwgdW5pdHMgPSAiZGF5cyIpKSwNCiAgICAgICAgICAgIGZyZXF1ZW5jeSA9IG5fZGlzdGluY3QoSW52b2ljZU5vKSkNCg0KIyBNZXJnZSBSRk0gdmFyaWFibGVzIHdpdGggbW9uZXRhcnkgdmFsdWUNCnJmbSA8LSBsZWZ0X2pvaW4ocmVjZW5jeSwgbW9uZXRhcnksIGJ5ID0gIkN1c3RvbWVySUQiKQ0KDQojIENyZWF0ZSBkaXN0YW5jZSBtYXRyaXggb2YgUkZNIGRhdGEgZnJhbWUgDQoNCiMgUGVyZm9ybSBEQlNDQU4gY2x1c3RlcmluZw0KZGJzY2FuX21vZGVsIDwtIGRic2NhbihkaXN0KHJmbSksIGVwcyA9IDAuNSwgTWluUHRzID0gNSwgc2NhbGUgPSBUUlVFLCBtZXRob2QgPSAicmF3Iiwgc2hvd3Bsb3QgPSAxKQ0KDQojIEFkZCBjbHVzdGVyIGxhYmVscyB0byB0aGUgb3JpZ2luYWwgZGF0YXNldA0KcmZtJGNsdXN0ZXIgPC0gYXMuZmFjdG9yKGRic2Nhbl9tb2RlbCRjbHVzdGVyKQ0KDQojIFZpc3VhbGl6ZSB0aGUgY2x1c3RlcnMNCmZ2aXpfY2x1c3RlcihkYnNjYW5fbW9kZWwsIGRhdGEgPSBub3JtYWxpemVkX2RhdGEpDQoNCiMgQ2x1c3RlciBhbmFseXNpcw0KY2x1c3Rlcl9hbmFseXNpcyA8LSByZm0gJT4lDQogIGdyb3VwX2J5KGNsdXN0ZXIpICU+JQ0KICBzdW1tYXJpc2UoYXZlcmFnZV9yZWNlbmN5ID0gbWVhbihyZWNlbmN5KSwNCiAgICAgICAgICAgIGF2ZXJhZ2VfZnJlcXVlbmN5ID0gbWVhbihmcmVxdWVuY3kpLA0KICAgICAgICAgICAgYXZlcmFnZV9tb25ldGFyeSA9IG1lYW4obW9uZXRhcnkpLA0KICAgICAgICAgICAgY291bnRfY3VzdG9tZXJzID0gbigpKQ0KDQpwcmludChjbHVzdGVyX2FuYWx5c2lzKQ0KDQojIFNpbGhvdWV0dGUgYW5hbHlzaXMNCnNpbCA8LSBzaWxob3VldHRlKGRic2Nhbl9tb2RlbCRjbHVzdGVyLCBkaXN0KG5vcm1hbGl6ZWRfZGF0YSkpDQphdmdfc2lsaG91ZXR0ZSA8LSBtZWFuKHNpbFssICJzaWxfd2lkdGgiXSkNCmNhdCgiQXZlcmFnZSBTaWxob3VldHRlIFdpZHRoOiIsIGF2Z19zaWxob3VldHRlLCAiXG4iKQ0KDQojIEV4dHJhY3QgY2x1c3RlciBsYWJlbHMgZnJvbSB0aGUgREJTQ0FOIG1vZGVsDQpkYnNjYW5fbGFiZWxzIDwtIGRic2Nhbl9tb2RlbCRjbHVzdGVyDQoNCiMgQ2FsY3VsYXRlIGNsdXN0ZXJpbmcgaW5kaWNlcyB1c2luZyBjbHVzdGVyLnN0YXRzDQpjbHVzdGVyaW5nX2luZGljZXMgPC0gY2x1c3Rlci5zdGF0cyhkaXN0KHJmbSksIGRic2Nhbl9sYWJlbHMpDQpwcmludChjbHVzdGVyaW5nX2luZGljZXMpDQoNCiMgRXh0cmFjdCB0aGUgRHVubiBpbmRleCBmcm9tIHRoZSBjbHVzdGVyaW5nIGluZGljZXMgbGlzdA0KZHVubl9pbmRleCA8LSBjbHVzdGVyaW5nX2luZGljZXMkZHVubg0KY2F0KCJEdW5uIEluZGV4OiIsIGR1bm5faW5kZXgsICJcbiIpDQoNCiMgQ2FsY3VsYXRlIHRoZSBEYXZpZXMtQm91bGRpbiBJbmRleA0KZGJfaW5kZXggPC0gY2x1c3RlclNpbTo6aW5kZXguREIocmZtLCBkYnNjYW5fbGFiZWxzKQ0KcHJpbnQoZGJfaW5kZXgpDQoNCg0KDQpgYGANCg0K

RFM Customer Segmentation

Frederick Hagelstein

June 16 2023