Θέμα 3 — Τμηματοποίηση πελατών εμπορικού κέντρου

Επιλογή μεθόδου

Ο απώτερος στόχος μας είναι να σχεδιάσουμε τμηματοποιημένες καμπάνιες. Παρόλα αυτά, πριν προχωρήσουμε σε αυτό το βήμα, θα πρέπει να εξετάσουμε και να διαχωροποιήσουμε τους πελάτες μας σε ομάδες (συγκεκριμένα ζητάει με βάση το εισόδημα - στήλη “Annual Income (k$)” και τη συμπεριφορά δαπανών - στήλη “Spending Score (1 - 100)”).

Για αυτό το λόγο η μέθοδος που θα επιλεχτεί για να ανακαλύψει αυτές τις ομάδες είναι η μέθοδος της Συσταδοποίησης (Clustering).

Διερευνητικές ερωτήσεις

Mall_Customers <- read.csv("C:/Users/Dimitris/Documents/ea_erg1/Mall_Customers.csv")
Mall_Customers = unique(Mall_Customers)
str(Mall_Customers) 
## 'data.frame':    200 obs. of  5 variables:
##  $ CustomerID            : int  1 2 3 4 5 6 7 8 9 10 ...
##  $ Gender                : chr  "Male" "Male" "Female" "Female" ...
##  $ Age                   : int  19 21 20 23 31 22 35 23 64 30 ...
##  $ Annual.Income..k..    : int  15 15 16 16 17 17 18 18 19 19 ...
##  $ Spending.Score..1.100.: int  39 81 6 77 40 76 6 94 3 72 ...
summary(Mall_Customers) 
##    CustomerID        Gender               Age        Annual.Income..k..
##  Min.   :  1.00   Length:200         Min.   :18.00   Min.   : 15.00    
##  1st Qu.: 50.75   Class :character   1st Qu.:28.75   1st Qu.: 41.50    
##  Median :100.50   Mode  :character   Median :36.00   Median : 61.50    
##  Mean   :100.50                      Mean   :38.85   Mean   : 60.56    
##  3rd Qu.:150.25                      3rd Qu.:49.00   3rd Qu.: 78.00    
##  Max.   :200.00                      Max.   :70.00   Max.   :137.00    
##  Spending.Score..1.100.
##  Min.   : 1.00         
##  1st Qu.:34.75         
##  Median :50.00         
##  Mean   :50.20         
##  3rd Qu.:73.00         
##  Max.   :99.00
  1. Πόσες διακριτές ομάδες πελατών αναδεικνύονται από τα δεδομένα και πώς το τεκμηριώνετε;

Οι διακριτές ομάδες κατά τις οποίες θα μπορούσαμε να τμηματοποιήσουμε τους πελάτες μας είναι 4. Αυτές είναι το gender του κάθε πελάτη, η ηλικία, το εισόδημα και η συμπεριφορά δαπανών. Το ID δεν μπορεί να μας βοηθήσει σε κάποια τμηματοποίηση καθώς είναι απλώς ένας assigned τυχαίος αριθμός.

  1. Πώς θα περιγράφατε (προφίλ) κάθε ομάδα ως προς εισόδημα και spending score;
num_data <- Mall_Customers[, sapply(Mall_Customers, is.numeric)]
num_data <- na.omit(num_data)

distances <- dist(num_data, method = "euclidean")
clusterSurvey <- hclust(distances, method = "ward.D2")

plot(clusterSurvey)

clusterGroups = cutree(clusterSurvey, k = 7)
#tapply(Mall_Customers$`Annual Income (k$)`, clusterGroups, mean)
#tapply(Mall_Customers$`Spending Score (1-100)`, clusterGroups, mean)
#ΕΠΡΕΠΕ ΝΑ ΒΑΛΛΩ # ΓΙΑΤΙ ΤΕΛΕΙΩΝΕ Ο ΧΡΟΝΟΣ ΑΛΛΑ ΚΑΝΟΝΙΚΑ ΕΙΝΑΙ ΧΩΡΙΣ

Χωρίζοντας τα προφίλ των πελατών σε 7 segments λόγω και του μικρού αριθμού τους (200), μπορούμε να εντοπίσουμε για τις μεταβλητές που μας ενδιαφέρουν το μέσο όρο των πελατών.

Με την εντολή “tapply()” παρατηρούμε ότι το εισόδημα των πελατών κυμαίνεται στα 20 με 100 ευρώ, στρογγυλοποιημένα. Ενώ για την συμπεριφορά δαπανών βλέπουμε με τον ίδιο τρόπο ότι κυμαίνονται από τα 18 στα 80, πάλι στρογγυλοποιημένα.

Ένα συμπέρασμα από αυτό είναι ότι η συμπεριφορά δαπανών τους είναι μέσο όρο ένα καλό ποσό των 10%-20% από το εισόδημά τους.

  1. Υπάρχει ομάδα «υψηλό εισόδημα – χαμηλές δαπάνες» που αξίζει ειδική στόχευση;
subset(Mall_Customers, Mall_Customers$`Annual Income (k$)`>="85")
## [1] CustomerID             Gender                 Age                   
## [4] Annual.Income..k..     Spending.Score..1.100.
## <0 rows> (or 0-length row.names)
clusterGroups[100]
## 100 
##   4
cluster2 = subset(Mall_Customers, clusterGroups==4)
cluster2$`Spending Score (1-100)`[20:55]        
## NULL
View(cluster2)

subset(Mall_Customers, Mall_Customers$`Spending Score (1-100)`<=65)
## [1] CustomerID             Gender                 Age                   
## [4] Annual.Income..k..     Spending.Score..1.100.
## <0 rows> (or 0-length row.names)
clusterGroups[100]
## 100 
##   4
cluster3 = subset(Mall_Customers, clusterGroups==3)
cluster3$`Annual Income (k$)`[85:120]       
## NULL
View(cluster3)

Γενικά, από τα παραδείγματα που εξάγαμε από τις ομάδες, δεν προκύπτει κάποια συγκεκριμένη ομάδα με υψηλό εισόδημα - χαμηλές δαπάνες που να χρειάζεται κάποια περαιτέρω τμηματοποίηση.

Στο cluster2 ελέγξαμε αν με κύριο δεδομένο το υψηλό εισόδημα (>80) υπάρχει χαμηλή δαπάνη, αλλά ο πίνακας των αποτελεσμάτων μας έδειξε ότι όσοι επιλέχτηκαν σε αυτή την ομάδα ξοδεύουν παραπάνω από το εισόδημά τους ή πολύ λιγότερο. Αλλά η διαφορά είναι πολύ μικρή για να εξάγουμε κάποιο οφέλιμο συμπέρασμα.

Στο cluster3 ελέγξαμε ουσιαστικά το ίδιο αλλά με ανάποδη μεθοδολογία. Όσοι είχαν χαμηλές δαπάνες, είχαν υψηλό εισόδημα? Πάλι εδώ η απάντηση ήταν όχι. Από τον πίνακα φαίνεται ότι πάλι οι δαπάνες είναι μεγαλύτερες κατά μέσο όρο από το εισόδημα των πελατών, κάτι που είναι ήδη ευνοϊκό για την εταιρεία.

  1. Πώς αλλάζει η εικόνα αν προσθέσετε την ηλικία ως τρίτη διάσταση;

Έστω ότι προσθέτουμε κάποιες τμηματοποιημένες ομάδες προσθέτοντας στην “εξίσωση” και την ηλικία - στήλη (Age).

subset(Mall_Customers, Mall_Customers$Age>="20")
##     CustomerID Gender Age Annual.Income..k.. Spending.Score..1.100.
## 2            2   Male  21                 15                     81
## 3            3 Female  20                 16                      6
## 4            4 Female  23                 16                     77
## 5            5 Female  31                 17                     40
## 6            6 Female  22                 17                     76
## 7            7 Female  35                 18                      6
## 8            8 Female  23                 18                     94
## 9            9   Male  64                 19                      3
## 10          10 Female  30                 19                     72
## 11          11   Male  67                 19                     14
## 12          12 Female  35                 19                     99
## 13          13 Female  58                 20                     15
## 14          14 Female  24                 20                     77
## 15          15   Male  37                 20                     13
## 16          16   Male  22                 20                     79
## 17          17 Female  35                 21                     35
## 18          18   Male  20                 21                     66
## 19          19   Male  52                 23                     29
## 20          20 Female  35                 23                     98
## 21          21   Male  35                 24                     35
## 22          22   Male  25                 24                     73
## 23          23 Female  46                 25                      5
## 24          24   Male  31                 25                     73
## 25          25 Female  54                 28                     14
## 26          26   Male  29                 28                     82
## 27          27 Female  45                 28                     32
## 28          28   Male  35                 28                     61
## 29          29 Female  40                 29                     31
## 30          30 Female  23                 29                     87
## 31          31   Male  60                 30                      4
## 32          32 Female  21                 30                     73
## 33          33   Male  53                 33                      4
## 35          35 Female  49                 33                     14
## 36          36 Female  21                 33                     81
## 37          37 Female  42                 34                     17
## 38          38 Female  30                 34                     73
## 39          39 Female  36                 37                     26
## 40          40 Female  20                 37                     75
## 41          41 Female  65                 38                     35
## 42          42   Male  24                 38                     92
## 43          43   Male  48                 39                     36
## 44          44 Female  31                 39                     61
## 45          45 Female  49                 39                     28
## 46          46 Female  24                 39                     65
## 47          47 Female  50                 40                     55
## 48          48 Female  27                 40                     47
## 49          49 Female  29                 40                     42
## 50          50 Female  31                 40                     42
## 51          51 Female  49                 42                     52
## 52          52   Male  33                 42                     60
## 53          53 Female  31                 43                     54
## 54          54   Male  59                 43                     60
## 55          55 Female  50                 43                     45
## 56          56   Male  47                 43                     41
## 57          57 Female  51                 44                     50
## 58          58   Male  69                 44                     46
## 59          59 Female  27                 46                     51
## 60          60   Male  53                 46                     46
## 61          61   Male  70                 46                     56
## 63          63 Female  67                 47                     52
## 64          64 Female  54                 47                     59
## 65          65   Male  63                 48                     51
## 67          67 Female  43                 48                     50
## 68          68 Female  68                 48                     48
## 70          70 Female  32                 48                     47
## 71          71   Male  70                 49                     55
## 72          72 Female  47                 49                     42
## 73          73 Female  60                 50                     49
## 74          74 Female  60                 50                     56
## 75          75   Male  59                 54                     47
## 76          76   Male  26                 54                     54
## 77          77 Female  45                 54                     53
## 78          78   Male  40                 54                     48
## 79          79 Female  23                 54                     52
## 80          80 Female  49                 54                     42
## 81          81   Male  57                 54                     51
## 82          82   Male  38                 54                     55
## 83          83   Male  67                 54                     41
## 84          84 Female  46                 54                     44
## 85          85 Female  21                 54                     57
## 86          86   Male  48                 54                     46
## 87          87 Female  55                 57                     58
## 88          88 Female  22                 57                     55
## 89          89 Female  34                 58                     60
## 90          90 Female  50                 58                     46
## 91          91 Female  68                 59                     55
## 93          93   Male  48                 60                     49
## 94          94 Female  40                 60                     40
## 95          95 Female  32                 60                     42
## 96          96   Male  24                 60                     52
## 97          97 Female  47                 60                     47
## 98          98 Female  27                 60                     50
## 99          99   Male  48                 61                     42
## 100        100   Male  20                 61                     49
## 101        101 Female  23                 62                     41
## 102        102 Female  49                 62                     48
## 103        103   Male  67                 62                     59
## 104        104   Male  26                 62                     55
## 105        105   Male  49                 62                     56
## 106        106 Female  21                 62                     42
## 107        107 Female  66                 63                     50
## 108        108   Male  54                 63                     46
## 109        109   Male  68                 63                     43
## 110        110   Male  66                 63                     48
## 111        111   Male  65                 63                     52
## 113        113 Female  38                 64                     42
## 117        117 Female  63                 65                     43
## 118        118 Female  49                 65                     59
## 119        119 Female  51                 67                     43
## 120        120 Female  50                 67                     57
## 121        121   Male  27                 67                     56
## 122        122 Female  38                 67                     40
## 123        123 Female  40                 69                     58
## 124        124   Male  39                 69                     91
## 125        125 Female  23                 70                     29
## 126        126 Female  31                 70                     77
## 127        127   Male  43                 71                     35
## 128        128   Male  40                 71                     95
## 129        129   Male  59                 71                     11
## 130        130   Male  38                 71                     75
## 131        131   Male  47                 71                      9
## 132        132   Male  39                 71                     75
## 133        133 Female  25                 72                     34
## 134        134 Female  31                 72                     71
## 135        135   Male  20                 73                      5
## 136        136 Female  29                 73                     88
## 137        137 Female  44                 73                      7
## 138        138   Male  32                 73                     73
## 140        140 Female  35                 74                     72
## 141        141 Female  57                 75                      5
## 142        142   Male  32                 75                     93
## 143        143 Female  28                 76                     40
## 144        144 Female  32                 76                     87
## 145        145   Male  25                 77                     12
## 146        146   Male  28                 77                     97
## 147        147   Male  48                 77                     36
## 148        148 Female  32                 77                     74
## 149        149 Female  34                 78                     22
## 150        150   Male  34                 78                     90
## 151        151   Male  43                 78                     17
## 152        152   Male  39                 78                     88
## 153        153 Female  44                 78                     20
## 154        154 Female  38                 78                     76
## 155        155 Female  47                 78                     16
## 156        156 Female  27                 78                     89
## 157        157   Male  37                 78                      1
## 158        158 Female  30                 78                     78
## 159        159   Male  34                 78                      1
## 160        160 Female  30                 78                     73
## 161        161 Female  56                 79                     35
## 162        162 Female  29                 79                     83
## 164        164 Female  31                 81                     93
## 165        165   Male  50                 85                     26
## 166        166 Female  36                 85                     75
## 167        167   Male  42                 86                     20
## 168        168 Female  33                 86                     95
## 169        169 Female  36                 87                     27
## 170        170   Male  32                 87                     63
## 171        171   Male  40                 87                     13
## 172        172   Male  28                 87                     75
## 173        173   Male  36                 87                     10
## 174        174   Male  36                 87                     92
## 175        175 Female  52                 88                     13
## 176        176 Female  30                 88                     86
## 177        177   Male  58                 88                     15
## 178        178   Male  27                 88                     69
## 179        179   Male  59                 93                     14
## 180        180   Male  35                 93                     90
## 181        181 Female  37                 97                     32
## 182        182 Female  32                 97                     86
## 183        183   Male  46                 98                     15
## 184        184 Female  29                 98                     88
## 185        185 Female  41                 99                     39
## 186        186   Male  30                 99                     97
## 187        187 Female  54                101                     24
## 188        188   Male  28                101                     68
## 189        189 Female  41                103                     17
## 190        190 Female  36                103                     85
## 191        191 Female  34                103                     23
## 192        192 Female  32                103                     69
## 193        193   Male  33                113                      8
## 194        194 Female  38                113                     91
## 195        195 Female  47                120                     16
## 196        196 Female  35                120                     79
## 197        197 Female  45                126                     28
## 198        198   Male  32                126                     74
## 199        199   Male  32                137                     18
## 200        200   Male  30                137                     83
clusterGroups[100]
## 100 
##   4
cluster4 = subset(Mall_Customers, clusterGroups==6)
cluster4$`Spending Score (1-100)`[20:55] + cluster4$`Annual Income (k$)`>="85"  
## logical(0)
View(cluster4)

Προσθέτοντας την ηλικία ως 3η διάσταση μπορούμε να παρατηρήσουμε ότι οι περισσότεροι πελάτες μας κυμαίνονται σε ηλικίες από 35-55 μέσο όρο. Χρησιμοποιώντας πάλι το όριο “υψηλό εισόδημα – χαμηλές δαπάνες” παρατηρούμε ότι τώρα μας εμφάνισε ο πίνακας cluster4 όντως άτομα ηλικίας 30-50 ετών τα οποία έχουν υψηλό εισόδημα αλλά με χαμηλές δαπάνες. Αυτό δεν συμφέρει την εταιρεία οπότε με αυτό τον τρόπο μπορούμε να στοχεύσουμε σε άτομα της αντίστοιχης ηλικίας για να βρούμε το πρόβλημα.

  1. Ποια ομάδα θα στοχεύατε πρώτη για μια premium καμπάνια και με ποιο επιχείρημα από τα δεδομένα;

Με τα καινούργια αυτά δεδομένα, μπορούμε εύλογα να πούμε ότι θα στοχεύαμε άτομα, προφανώς με “υψηλό εισόδημα – χαμηλές δαπάνες”, αλλά όχι με τεράστια απόκλιση, καθώς δεν θα είχε πολύ νόημα αφού οι τμές θα έπρεπε να πέσουν κατακόρυφα. π.χ.

16 157 Male 37 Age 78 Annual income 1 Spending score
17 159 Male 34 Age 78 Annual income 1 Spending score
18 161 Female 56 Age 79 Annual income 35 Spending score
19 163 Male 19 Age 81 Annual income 5 Spending score

Αντιθέτως, θα επικεντρονώμασταν σε άτομα με ένα επαρκές ποσοστό υψηλού εισοδήματος - χαμηλής δαπάνης π.χ.

9 143 Female 28 Age 76 Annual income 40 Spending score
10 145 Male 25 Age 77 Annual income 12 Spending score
11 147 Male 48 Age 77 Annual income 36 Spending score

και με επίκεντρο και την ηλικία, που κυμαίνεται στα 30 συνήθως, από τις παρατηρήσεις μας, θα προσπαθούσαμε να εντωπίσουμε τους λόγους που μπορεί να προκαλούν αυτή τη διαφορά και ύστερα πώς θα μπορούσαμε να πλησιάσουμε αυτό το κοινό το οποίο είναι πιο πιθανό να μετατραπεί σε μελλοντικούς καλύτερους πελάτες.

Fin