1.Pendahuluan

Dataset Coffee Chain digunakan untuk menganalisis pola penjualan produk pada berbagai market. Mengingat setiap market memiliki karakteristik konsumen yang berbeda, diperlukan pemahaman mendalam mengenai produk yang paling diminati serta distribusi penjualan di masing-masing wilayah. Selain itu, analisis statistik essensial untuk menentukan apakah terdapat perbedaan penjualan yang signifikan antar market. Di samping pemetaan produk, analisis ini mencakup evaluasi statistik terhadap distribusi data penjualan melalui uji normalitas. Langkah tersebut menjadi dasar bagi uji komparatif guna menetapkan adanya perbedaan performa penjualan yang signifikan antar wilayah.

2. Mempersiakan packages dan mengimpor data

2.1 Mempersiapkan Packages

library(dplyr)
library(ggplot2)
library(readxl)
knitr::opts_knit$set(root.dir = "C:/Users/USER/Downloads/SIM")

2.2 Mengimpor Data

library(readxl)
data <- read_excel("SIM - Coffee Chain Datasets.xlsx")

3. Analisis Data

3.1 Analisis Top 3 Produk per Market

top3 <- data %>%
  group_by(Market, `Product Type`) %>%
  summarise(TotalSales = sum(Sales, na.rm = TRUE), .groups = "drop") %>%
  arrange(Market, desc(TotalSales)) %>%
  group_by(Market) %>%
  slice_head(n = 3)

3.2 Uji Normalitas

by(data$Sales, data$Market, shapiro.test)
## data$Market: Central
## 
##  Shapiro-Wilk normality test
## 
## data:  dd[x, ]
## W = 0.82607, p-value < 2.2e-16
## 
## ------------------------------------------------------------ 
## data$Market: East
## 
##  Shapiro-Wilk normality test
## 
## data:  dd[x, ]
## W = 0.75605, p-value < 2.2e-16
## 
## ------------------------------------------------------------ 
## data$Market: South
## 
##  Shapiro-Wilk normality test
## 
## data:  dd[x, ]
## W = 0.79125, p-value < 2.2e-16
## 
## ------------------------------------------------------------ 
## data$Market: West
## 
##  Shapiro-Wilk normality test
## 
## data:  dd[x, ]
## W = 0.80428, p-value < 2.2e-16
options(scipen = 999)

3.3 Uji Kruskal-Wallis

kruskal.test(Sales ~ Market, data = data)
## 
##  Kruskal-Wallis rank sum test
## 
## data:  Sales by Market
## Kruskal-Wallis chi-squared = 27.871, df = 3, p-value = 0.000003865

4. Visualisasi Data

4.1 Visualisasi Top 3 Produk Terlaris

ggplot(top3, aes(x = reorder(`Product Type`, TotalSales),
                 y = TotalSales,
                 fill = Market)) +
  geom_bar(stat = "identity") +
  coord_flip() +
  facet_wrap(~Market) +
  labs(title = "Top 3 Produk Terlaris di Setiap Market",
       x = "Product Type",
       y = "Total Sales") +
  theme_minimal() +
  theme(plot.title = element_text(hjust = 0.5))

4.2 Boxplot per Market

ggplot(data, aes(x = Market, y = Sales)) +
  geom_boxplot(fill = "lightsteelblue") +
  theme_minimal()

5. Intepretasi Hasil

5.1 Intepretasi Analisis

Berdasarkan analisis tersebut, diperoleh tiga produk dengan penjualan tertinggi pada masing-masing market. Adapun daftar produk terlaris pada tiap market adalah sebagai berikut:

Central: Coffee, Tea, Herbal Tea

East: Coffee, Espresso, Herbal Tea

South: Espresso, Coffee, Herbal Tea

West: Herbal Tea, Tea, Espresso

5.2 Uji Normalitas

Berdasarkan hasil uji normalitas menggunakan metode Shapiro-Wilk pada masing-masing market, diperoleh nilai p-value yang mendekati 0 yang artinya kurang dari 0,05. Hal ini menunjukkan bahwa data penjualan (Sales) pada seluruh market tidak berdistribusi normal, sehingga analisis selanjutnya perlu menggunakan metode statistik non-parametrik.

5.3 Uji Kruskal-Wallis

Uji Kruskal-Wallis dilakukan untuk mengetahui apakah terdapat perbedaan penjualan (Sales) antar market. Hasil pengujian menunjukkan bahwa p-value sebesar 0.000003865 yang artinya kurang dari 0.05, sehingga dapat disimpulkan bahwa ada perbedaan yang signifikan antara keempat market.

5.4 Visualisasi Top 3 Produk Terlaris

Visualisasi tersebut menampilkan tiga produk dengan penjualan tertinggi pada masing-masing market dalam bentuk diagram batang. Setiap market memiliki komposisi produk terlaris yang berbeda, dengan panjang batang menunjukkan besarnya total penjualan. Grafik ini mempermudah perbandingan kontribusi penjualan antar produk di dalam setiap market serta menegaskan bahwa terdapat variasi preferensi konsumen di tiap market.

5.5 Visualisasi Distribusi

Berdasarkan boxplot, terlihat bahwa distribusi penjualan (Sales) pada keempat market tidak sama. Market West cenderung memiliki nilai penjualan yang lebih tinggi, sedangkan South relatif lebih rendah, dengan variasi data yang berbeda pada setiap market. Selain itu, pada semua market terdapat beberapa nilai yang jauh lebih tinggi dari sebagian besar data (outlier), yang menunjukkan adanya transaksi dengan penjualan besar. Hal ini mengindikasikan bahwa karakteristik penjualan berbeda di masing-masing market.

5.6 Kesimpulan

Berdasarkan hasil analisis, diperoleh bahwa setiap market memiliki produk terlaris yang berbeda, yang menunjukkan adanya variasi preferensi konsumen pada masing-masing market. Hasil uji normalitas menunjukkan bahwa data penjualan tidak berdistribusi normal, sehingga digunakan uji non-parametrik Kruskal-Wallis. Hasil uji tersebut menunjukkan adanya perbedaan yang signifikan dalam penjualan antar keempat market. Temuan ini juga didukung oleh visualisasi yang memperlihatkan perbedaan distribusi dan tingkat penjualan pada setiap market. Dengan demikian, dapat disimpulkan bahwa karakteristik dan pola penjualan pada masing-masing market tidak sama.