1 Pendahuluan

Halo, Salam kenal semua! Selamat datang di Rmd saya, di Rmd ini saya akan membahas data Costumer Shopping Trends yang saya peroleh dari Keggle.com . Dataset ini merupakan sebuah synthetic dataset yang dibuat untuk mempelajari mengenai data analisis. Dataset ini menyediakan insight terhadap perilaku konsumen dan pola pembelian. Dataset ini menangpkap berbagai sifat pelanggan termasuk usia, jenis kelamin, riwayat pembelian, metode pembayaran pilihan, frekuensi pembelian, dan banyak lagi. Menganalisis data ini dapat membantu membuat keputusan bisnis yang tepat, mengoptimalkan penawaran produk, dan meningkatkan kepuasan pelanggan.

Link Dataset (https://www.kaggle.com/datasets/iamsouravbanerjee/customer-shopping-trends-dataset/data)

2 Set up

Pertama-tama kita setup library yang akan kita gunakan pada Rmd ini.

library(dplyr)
library(lubridate)
library(tidyr)
library(plotly)

3 Data Preproscessing

3.1 Import Data

Sekarang kita masukkan data yang akan kita gunakan ke dalam sebuah variabel shop

shop <- read.csv("datainput/shopping_trends_updated.csv")

3.2 Memeriksa Data

Kemudian kita periksa data kita, periksa kepala dari data

head(shop)
##   Customer.ID Age Gender Item.Purchased Category Purchase.Amount..USD.
## 1           1  55   Male         Blouse Clothing                    53
## 2           2  19   Male        Sweater Clothing                    64
## 3           3  50   Male          Jeans Clothing                    73
## 4           4  21   Male        Sandals Footwear                    90
## 5           5  45   Male         Blouse Clothing                    49
## 6           6  46   Male       Sneakers Footwear                    20
##        Location Size     Color Season Review.Rating Subscription.Status
## 1      Kentucky    L      Gray Winter           3.1                 Yes
## 2         Maine    L    Maroon Winter           3.1                 Yes
## 3 Massachusetts    S    Maroon Spring           3.1                 Yes
## 4  Rhode Island    M    Maroon Spring           3.5                 Yes
## 5        Oregon    M Turquoise Spring           2.7                 Yes
## 6       Wyoming    M     White Summer           2.9                 Yes
##   Shipping.Type Discount.Applied Promo.Code.Used Previous.Purchases
## 1       Express              Yes             Yes                 14
## 2       Express              Yes             Yes                  2
## 3 Free Shipping              Yes             Yes                 23
## 4  Next Day Air              Yes             Yes                 49
## 5 Free Shipping              Yes             Yes                 31
## 6      Standard              Yes             Yes                 14
##   Payment.Method Frequency.of.Purchases
## 1          Venmo            Fortnightly
## 2           Cash            Fortnightly
## 3    Credit Card                 Weekly
## 4         PayPal                 Weekly
## 5         PayPal               Annually
## 6          Venmo                 Weekly

dan periksa dari akhir dari data

tail(shop)
##      Customer.ID Age Gender Item.Purchased    Category Purchase.Amount..USD.
## 3895        3895  66 Female          Skirt    Clothing                    78
## 3896        3896  40 Female         Hoodie    Clothing                    28
## 3897        3897  52 Female       Backpack Accessories                    49
## 3898        3898  46 Female           Belt Accessories                    33
## 3899        3899  44 Female          Shoes    Footwear                    77
## 3900        3900  52 Female        Handbag Accessories                    81
##         Location Size     Color Season Review.Rating Subscription.Status
## 3895 Connecticut    L     White Spring           3.9                  No
## 3896    Virginia    L Turquoise Summer           4.2                  No
## 3897        Iowa    L     White Spring           4.5                  No
## 3898  New Jersey    L     Green Spring           2.9                  No
## 3899   Minnesota    S     Brown Summer           3.8                  No
## 3900  California    M     Beige Spring           3.1                  No
##       Shipping.Type Discount.Applied Promo.Code.Used Previous.Purchases
## 3895 2-Day Shipping               No              No                 44
## 3896 2-Day Shipping               No              No                 32
## 3897   Store Pickup               No              No                 41
## 3898       Standard               No              No                 24
## 3899        Express               No              No                 24
## 3900   Store Pickup               No              No                 33
##      Payment.Method Frequency.of.Purchases
## 3895    Credit Card         Every 3 Months
## 3896          Venmo                 Weekly
## 3897  Bank Transfer              Bi-Weekly
## 3898          Venmo              Quarterly
## 3899          Venmo                 Weekly
## 3900          Venmo              Quarterly

Kemudian periksa struktur data kita dengan menggunakan glimpse

glimpse(shop)
## Rows: 3,900
## Columns: 18
## $ Customer.ID            <int> 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, …
## $ Age                    <int> 55, 19, 50, 21, 45, 46, 63, 27, 26, 57, 53, 30,…
## $ Gender                 <chr> "Male", "Male", "Male", "Male", "Male", "Male",…
## $ Item.Purchased         <chr> "Blouse", "Sweater", "Jeans", "Sandals", "Blous…
## $ Category               <chr> "Clothing", "Clothing", "Clothing", "Footwear",…
## $ Purchase.Amount..USD.  <int> 53, 64, 73, 90, 49, 20, 85, 34, 97, 31, 34, 68,…
## $ Location               <chr> "Kentucky", "Maine", "Massachusetts", "Rhode Is…
## $ Size                   <chr> "L", "L", "S", "M", "M", "M", "M", "L", "L", "M…
## $ Color                  <chr> "Gray", "Maroon", "Maroon", "Maroon", "Turquois…
## $ Season                 <chr> "Winter", "Winter", "Spring", "Spring", "Spring…
## $ Review.Rating          <dbl> 3.1, 3.1, 3.1, 3.5, 2.7, 2.9, 3.2, 3.2, 2.6, 4.…
## $ Subscription.Status    <chr> "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes"…
## $ Shipping.Type          <chr> "Express", "Express", "Free Shipping", "Next Da…
## $ Discount.Applied       <chr> "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes"…
## $ Promo.Code.Used        <chr> "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes"…
## $ Previous.Purchases     <int> 14, 2, 23, 49, 31, 14, 49, 19, 8, 4, 26, 10, 37…
## $ Payment.Method         <chr> "Venmo", "Cash", "Credit Card", "PayPal", "PayP…
## $ Frequency.of.Purchases <chr> "Fortnightly", "Fortnightly", "Weekly", "Weekly…

##Merubah Tipe Data Selanjutnya kita akan lakukan perubahan tipe data pada dataframe menjadi tipe data yang tepat untuk memudahkan kita mengeksplor data.

shop <- shop %>% mutate(Gender = as.factor(Gender), Category = as.factor(Category), Location = as.factor(Location), Size = as.factor(Size), Color = as.factor(Color), Season = as.factor(Season), Subscription.Status = as.factor(Subscription.Status), Shipping.Type = as.factor(Shipping.Type), Discount.Applied = as.factor(Discount.Applied), Promo.Code.Used = as.factor(Promo.Code.Used), Payment.Method = as.factor(Payment.Method), Frequency.of.Purchases = as.factor(Frequency.of.Purchases), Item.Purchased = as.factor(Item.Purchased))

Periksa kembali apakah tipe datanya sudah berubah

glimpse(shop)
## Rows: 3,900
## Columns: 18
## $ Customer.ID            <int> 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, …
## $ Age                    <int> 55, 19, 50, 21, 45, 46, 63, 27, 26, 57, 53, 30,…
## $ Gender                 <fct> Male, Male, Male, Male, Male, Male, Male, Male,…
## $ Item.Purchased         <fct> Blouse, Sweater, Jeans, Sandals, Blouse, Sneake…
## $ Category               <fct> Clothing, Clothing, Clothing, Footwear, Clothin…
## $ Purchase.Amount..USD.  <int> 53, 64, 73, 90, 49, 20, 85, 34, 97, 31, 34, 68,…
## $ Location               <fct> Kentucky, Maine, Massachusetts, Rhode Island, O…
## $ Size                   <fct> L, L, S, M, M, M, M, L, L, M, L, S, M, M, L, M,…
## $ Color                  <fct> Gray, Maroon, Maroon, Maroon, Turquoise, White,…
## $ Season                 <fct> Winter, Winter, Spring, Spring, Spring, Summer,…
## $ Review.Rating          <dbl> 3.1, 3.1, 3.1, 3.5, 2.7, 2.9, 3.2, 3.2, 2.6, 4.…
## $ Subscription.Status    <fct> Yes, Yes, Yes, Yes, Yes, Yes, Yes, Yes, Yes, Ye…
## $ Shipping.Type          <fct> Express, Express, Free Shipping, Next Day Air, …
## $ Discount.Applied       <fct> Yes, Yes, Yes, Yes, Yes, Yes, Yes, Yes, Yes, Ye…
## $ Promo.Code.Used        <fct> Yes, Yes, Yes, Yes, Yes, Yes, Yes, Yes, Yes, Ye…
## $ Previous.Purchases     <int> 14, 2, 23, 49, 31, 14, 49, 19, 8, 4, 26, 10, 37…
## $ Payment.Method         <fct> Venmo, Cash, Credit Card, PayPal, PayPal, Venmo…
## $ Frequency.of.Purchases <fct> Fortnightly, Fortnightly, Weekly, Weekly, Annua…

##Periksa Missing Value Selanjutnya lakukan pemeriksaan terhadap missing value yang mungkin ada pada dataframe.

colSums(is.na(shop))
##            Customer.ID                    Age                 Gender 
##                      0                      0                      0 
##         Item.Purchased               Category  Purchase.Amount..USD. 
##                      0                      0                      0 
##               Location                   Size                  Color 
##                      0                      0                      0 
##                 Season          Review.Rating    Subscription.Status 
##                      0                      0                      0 
##          Shipping.Type       Discount.Applied        Promo.Code.Used 
##                      0                      0                      0 
##     Previous.Purchases         Payment.Method Frequency.of.Purchases 
##                      0                      0                      0
anyNA(shop)
## [1] FALSE

4 Exploratory Data

Setelah melakukan data preprocessing selanjutnya kita bisa menyelam dan mengekslpore data yang kita miliki. Kita dapat dengan mudah mendapatkan gambaran umum mengenai data kita dengan cara menggunakan fungsi summary.

summary(shop)
##   Customer.ID          Age           Gender     Item.Purchased
##  Min.   :   1.0   Min.   :18.00   Female:1248   Blouse : 171  
##  1st Qu.: 975.8   1st Qu.:31.00   Male  :2652   Jewelry: 171  
##  Median :1950.5   Median :44.00                 Pants  : 171  
##  Mean   :1950.5   Mean   :44.07                 Shirt  : 169  
##  3rd Qu.:2925.2   3rd Qu.:57.00                 Dress  : 166  
##  Max.   :3900.0   Max.   :70.00                 Sweater: 164  
##                                                 (Other):2888  
##         Category    Purchase.Amount..USD.       Location    Size     
##  Accessories:1240   Min.   : 20.00        Montana   :  96   L :1053  
##  Clothing   :1737   1st Qu.: 39.00        California:  95   M :1755  
##  Footwear   : 599   Median : 60.00        Idaho     :  93   S : 663  
##  Outerwear  : 324   Mean   : 59.76        Illinois  :  92   XL: 429  
##                     3rd Qu.: 81.00        Alabama   :  89            
##                     Max.   :100.00        Minnesota :  88            
##                                           (Other)   :3347            
##      Color         Season    Review.Rating  Subscription.Status
##  Olive  : 177   Fall  :975   Min.   :2.50   No :2847           
##  Yellow : 174   Spring:999   1st Qu.:3.10   Yes:1053           
##  Silver : 173   Summer:955   Median :3.70                      
##  Teal   : 172   Winter:971   Mean   :3.75                      
##  Green  : 169                3rd Qu.:4.40                      
##  Black  : 167                Max.   :5.00                      
##  (Other):2868                                                  
##         Shipping.Type Discount.Applied Promo.Code.Used Previous.Purchases
##  2-Day Shipping:627   No :2223         No :2223        Min.   : 1.00     
##  Express       :646   Yes:1677         Yes:1677        1st Qu.:13.00     
##  Free Shipping :675                                    Median :25.00     
##  Next Day Air  :648                                    Mean   :25.35     
##  Standard      :654                                    3rd Qu.:38.00     
##  Store Pickup  :650                                    Max.   :50.00     
##                                                                          
##        Payment.Method    Frequency.of.Purchases
##  Bank Transfer:612    Annually      :572       
##  Cash         :670    Bi-Weekly     :547       
##  Credit Card  :671    Every 3 Months:584       
##  Debit Card   :636    Fortnightly   :542       
##  PayPal       :677    Monthly       :553       
##  Venmo        :634    Quarterly     :563       
##                       Weekly        :539

Dapat dilihat dari summary tersebut terdapat beberapa insight yang dapat kita ambil seperti:

  1. Lebih banyak pelanggan Pria.

  2. Pelanggan termuda berumur 18 tahun dan pelanggan tertua berumur 70 tahun.

  3. Barang yang banyak dibeli adalah blouse, jewelry, dan pants.

  4. Kategori barang yang banyak terjual adalah Clothing.

  5. Penjualan paling banyak terjadi pada musim semi.

dst.

dari summary tersebut mari kita perdalami lagi data yang kita miliki satu persatu. Kita mulai dari Eksplorasi Profit.

4.1 Eksplorasi Profit

Dari summary kita mengetahui transaksi/profit terbesar adalah 100 USD namun berapa total dari semua transaksi

sum(shop$Purchase.Amount..USD.)
## [1] 233081

Total Profitnya adalah 233.081 USD Kemudian berapa total profit per kategorinya dan kategori apa kah dengan profit terbesar

shop %>% group_by(Category) %>% summarise(Total = sum(Purchase.Amount..USD.))
## # A tibble: 4 × 2
##   Category     Total
##   <fct>        <int>
## 1 Accessories  74200
## 2 Clothing    104264
## 3 Footwear     36093
## 4 Outerwear    18524

Kategori clothing merupakan Kategori dengan profit terbesar dengan total profit 104.264 USD

Kita telah mengetahui dari summary barang dengan penjualan terbanyak yaitu blouse, jewelry, dan pants. Pada bagian ini kita ingin mengetahui 10 barang dengan total profit terbesar.

shop %>% group_by(Item.Purchased) %>% summarise(Penjualan = n(),Profit = sum(Purchase.Amount..USD.)) %>% ungroup() %>% arrange(-Profit) %>% head(10)
## # A tibble: 10 × 3
##    Item.Purchased Penjualan Profit
##    <fct>              <int>  <int>
##  1 Blouse               171  10410
##  2 Shirt                169  10332
##  3 Dress                166  10320
##  4 Pants                171  10090
##  5 Jewelry              171  10010
##  6 Sunglasses           161   9649
##  7 Belt                 161   9635
##  8 Scarf                157   9561
##  9 Sweater              164   9462
## 10 Shorts               157   9433

Dapat dilihat 10 barang dengan total profit terbesar adalah Blouse, Shirt, Dress, Pants, Jewelry, Sunglasses, Belt, Scarf, Sweater, dan Shorts.

Selanjutnya mari kita lihat payment method dengan profit terbesar

shop %>% group_by(Payment.Method) %>% summarise(Banyak = n(),Profit = sum(Purchase.Amount..USD.), ratarata = mean(Purchase.Amount..USD.), min = min(Purchase.Amount..USD.), max = max(Purchase.Amount..USD.)) %>% ungroup() %>% arrange(-Profit)
## # A tibble: 6 × 6
##   Payment.Method Banyak Profit ratarata   min   max
##   <fct>           <int>  <int>    <dbl> <int> <int>
## 1 Credit Card       671  40310     60.1    20   100
## 2 PayPal            677  40109     59.2    20   100
## 3 Cash              670  40002     59.7    20   100
## 4 Debit Card        636  38742     60.9    20   100
## 5 Venmo             634  37374     58.9    20   100
## 6 Bank Transfer     612  36544     59.7    20   100

Metode pembayaran dengan total profit tertinggi adalah dengan menggunakan credit card sedangkan metode pembayaran yang sering digunakan oleh pelanggan adalah dengan menggunakan paypal. Dari hal tersebut kita mengetahui bahwa kebanyakan pelanggan kita nyaman dan lebih memilih untuk bertransaksi menggunakan credit card atau paypal dan dengan rata-rata transaksi lebih dari 59 USD.

Selanjutnya kita lihat banyaknya profit per moda pengiriman

shop %>% group_by(Shipping.Type) %>% summarise(Banyak = n(),Profit = sum(Purchase.Amount..USD.),ratarata = mean(Purchase.Amount..USD.)) %>% ungroup() %>% arrange(-Profit)
## # A tibble: 6 × 4
##   Shipping.Type  Banyak Profit ratarata
##   <fct>           <int>  <int>    <dbl>
## 1 Free Shipping     675  40777     60.4
## 2 Express           646  39067     60.5
## 3 Store Pickup      650  38931     59.9
## 4 Standard          654  38233     58.5
## 5 2-Day Shipping    627  38080     60.7
## 6 Next Day Air      648  37993     58.6

Dapat kita lihat metode pengiriman free shipping memiliki profit terbesar dan yang paling banyak digunakan.

Kesimpulan yang dapat kita ambil :

  1. Total profit dari seluruh transaksi adalah 233.081 USD

  2. Kategori clothing merupakan Kategori dengan profit terbesar dengan total profit 104.264 USD

  3. 10 barang dengan total profit terbesar adalah Blouse, Shirt, Dress, Pants, Jewelry, Sunglasses, Belt, Scarf, Sweater, dan Shorts.

  4. Credit card adalah metode pembayaran dengan profit terbesar

  5. Paypal adalah metode pembayaran yang paling banyak digunakan oleh pelanggan

  6. Free shipping merupakan metode pengiriman yang paling banyak digunakan

4.2 Eksplorasi Range Usia

Pada bagian age, kita mau lihat pelanggan kita itu berada di range umur berapa saja.

hist(shop$Age)

Dari histogram tersebut kita bisa lihat pelanggan kita tersebar dominan di range umur 20-70 tahun. Mari kita lihat lebih jelas lagi.

age_r <- shop %>% group_by(Age) %>% summarise(freq = n()) %>% ungroup() 
age_range <- age_r %>%                        # Aggregate values in range
  mutate(ranges = cut(Age,
                      seq(20, 70, 5))) %>% 
  group_by(ranges) %>% 
  dplyr::summarize(sums = sum(freq)) %>% 
  as.data.frame()
age_range %>% arrange(-sums) %>% head(-5)
##    ranges sums
## 1 (45,50]  382
## 2 (55,60]  382
## 3 (25,30]  378
## 4 (50,55]  371
## 5 (40,45]  368
## 6 (60,65]  368

Bisa dilihat dengan lebih jelas, range usia pelanggan kita yang tertinggi berada pada umur 46 sampai 50 dan umur 56 sampai 60.

Kita juga bisa memisahkan range usia pelanggan kita berdasarkan gender.

m <- shop %>% filter(Gender == "Male") 
f <- shop %>% filter(Gender == "Female")
#Range usia pelanggan pria
hist(m$Age)

#Range usia pelanggan wanita
hist(f$Age)

#Frekuensi range usia pria
age_rm <- m %>% group_by(Age) %>% summarise(freq = n()) %>% ungroup() 
age_rangem <- age_rm %>%                        # Aggregate values in range
  mutate(ranges = cut(Age,
                      seq(18, 70, 5))) %>% 
  group_by(ranges) %>% 
  dplyr::summarize(sums = sum(freq)) %>% 
  as.data.frame()
#Frekuensi range usia wanita
age_rf <- shop %>% group_by(Age) %>% summarise(freq = n()) %>% ungroup() 
age_rangef <- age_rf %>%                        # Aggregate values in range
  mutate(ranges = cut(Age,
                      seq(20, 70, 5))) %>% 
  group_by(ranges) %>% 
  dplyr::summarize(sums = sum(freq)) %>% 
  as.data.frame()
#range usia pria
age_rangem %>% arrange(-sums) %>% head(-5)
##    ranges sums
## 1 (53,58]  276
## 2 (38,43]  266
## 3 (23,28]  263
## 4 (48,53]  259
## 5 (28,33]  252
## 6 (33,38]  249
#range usia wanita
age_rangef %>% arrange(-sums) %>% head(-5)
##    ranges sums
## 1 (45,50]  382
## 2 (55,60]  382
## 3 (25,30]  378
## 4 (50,55]  371
## 5 (40,45]  368
## 6 (60,65]  368

Kesimpulan yang dapat kita ambil :

  1. Dari range usia tersebut kita dapat mendesign produk-prdouk kita agar selaras dengan selera pelanggan pada range usia tersebut untuk memaksimalkan kemungkinan terjadi penjualan.

  2. Jika ingin melakukan ekspansi pasar, kita bisa coba untuk mentargetkan range usia 18-20 karena range usia tersebut merupakan range usia terendah.

4.3 Eksplorasi Barang dan Season

Selanjutnya kita mau tau barang apakah yang diminati per musimnya

seasn <- shop %>% group_by(Item.Purchased, Season) %>% summarise(Penjualan = n()) %>% ungroup()
seasn_f <- seasn %>% filter(Season == "Fall")
seasn_w <- seasn %>% filter(Season == "Winter")
seasn_s <- seasn %>% filter(Season == "Summer")
seasn_sp <- seasn %>% filter(Season == "Spring")
plot_seasn_f <- ggplot(seasn_f, aes(x=Penjualan, y=reorder(Item.Purchased,Penjualan))) +
  geom_col(aes(fill = Item.Purchased))
plot_seasn_w <- ggplot(seasn_w, aes(x=Penjualan, y=reorder(Item.Purchased,Penjualan))) +
  geom_col(aes(fill = Item.Purchased))
plot_seasn_s <- ggplot(seasn_s, aes(x=Penjualan, y=reorder(Item.Purchased,Penjualan))) +
  geom_col(aes(fill = Item.Purchased))
plot_seasn_sp <- ggplot(seasn_sp, aes(x=Penjualan, y=reorder(Item.Purchased,Penjualan))) +
  geom_col(aes(fill = Item.Purchased))

Sekarang kita ingin melihat barang apa yang terjual terbanyak pada musim gugur

seasn_f %>% arrange(-Penjualan)
## # A tibble: 25 × 3
##    Item.Purchased Season Penjualan
##    <fct>          <fct>      <int>
##  1 Jacket         Fall          54
##  2 Hat            Fall          50
##  3 Handbag        Fall          48
##  4 Skirt          Fall          46
##  5 Sandals        Fall          44
##  6 Blouse         Fall          42
##  7 Socks          Fall          42
##  8 Sweater        Fall          42
##  9 Belt           Fall          41
## 10 Scarf          Fall          40
## # ℹ 15 more rows

Dapat dilihat penjualan terbanyak pada musim gugur adalah penjualan jaket. Dapat dilihat pula dari visualisasi plot berikut.

ggplotly(plot_seasn_f)

Kemudian kita ingin melihat penjualan pada musim dingin.

seasn_w %>% arrange(-Penjualan)
## # A tibble: 25 × 3
##    Item.Purchased Season Penjualan
##    <fct>          <fct>      <int>
##  1 Sunglasses     Winter        52
##  2 Pants          Winter        51
##  3 Shirt          Winter        50
##  4 Hoodie         Winter        48
##  5 Jewelry        Winter        47
##  6 Sweater        Winter        42
##  7 Jacket         Winter        41
##  8 Belt           Winter        40
##  9 Blouse         Winter        40
## 10 Dress          Winter        40
## # ℹ 15 more rows

Ternyata tidak seperti yang dibayangkan karena ternyata penjualan terbanyak pada musim dingin ialah penjualan sunglasses kemudian disusul dengan penjualan pants dan shirt. Bisa dilihat juga pada visualisasi berikut.

ggplotly(plot_seasn_w)

Selanjutnya kita akan lihat penjualan pada musim semi

seasn_sp %>% arrange(-Penjualan)
## # A tibble: 25 × 3
##    Item.Purchased Season Penjualan
##    <fct>          <fct>      <int>
##  1 Sweater        Spring        52
##  2 Shorts         Spring        47
##  3 Blouse         Spring        46
##  4 Coat           Spring        46
##  5 Skirt          Spring        46
##  6 Sandals        Spring        44
##  7 Dress          Spring        43
##  8 Gloves         Spring        42
##  9 Jewelry        Spring        42
## 10 Shirt          Spring        42
## # ℹ 15 more rows

Dapat dilihat penjualan terbanyak pada musim semi adalah penjualan sweater. Bisa dilihat pula visualisasi berikut.

ggplotly(plot_seasn_sp)

Terakhir kita akan melihat penjualan pada musim panas

seasn_s %>% arrange(-Penjualan)
## # A tibble: 25 × 3
##    Item.Purchased Season Penjualan
##    <fct>          <fct>      <int>
##  1 Pants          Summer        50
##  2 Dress          Summer        47
##  3 Jewelry        Summer        47
##  4 Shoes          Summer        46
##  5 Backpack       Summer        45
##  6 Blouse         Summer        43
##  7 Scarf          Summer        43
##  8 Coat           Summer        42
##  9 Socks          Summer        42
## 10 Sandals        Summer        40
## # ℹ 15 more rows

Berikut visualisasinya

ggplotly(plot_seasn_s)

Kesimpulan:

  1. Dengan mengetahui penjualan terbanyak setiap musimnya kita bisa melakukan perencaan penjualan tiap musimnya untuk memaksimalkan penjualan kita.

5 Kesimpulan

Dari Eksplorasi yang telah kita lakukan, kita dapat mengambil beberapa kesimpulan diantaranya:

  1. Total Profit pada dataset ini sejumlah USD. 233.081

  2. Dengan Profit terbagi kebeberapa kategori dengan profit terbesar pada kategori clothing dengan besar USD. 104.264

  3. Barang yang paling diminati oleh pelanggan adalah Blouse, Jewelry, dan Pants.

  4. 10 Barang dengan profit tertinggi yaitu Blouse, Shirt, Dress, Pants, Jewelry, Sunglasses, Belt, Scarf, Sweater, dan Shorts.

  5. Metode pembayaran dengan total profit terbesar adalah dengan menggunakan credit card sedangkan metode pembayaran yang paling banyak digunakan adalah dengan paypal.

  6. Range usia pelanggan terbanyak adalah pada range 46 sampai 50 dan 56 sampai 60.