Industri kopi di Amerika Serikat merupakan salah satu sektor yang berkembang pesat, persaingan antar produk seperti coffee, espresso, herbal tea, dan tea membuat perusahaan perlu memahami performa masing-masing produk secara mendalam, terutama dari sisi profitabilitas. Maka dari itu, analisis terhadap data penjualan dan profit merupakan aspek penting dalam pengambilan keputusan yang strategis. Dalam konteks ini, dataset Coffee Chain menyediakan informasi terkait penjualan dan profit berbagai jenis produk di beberapa negara bagian Amerika Serikat, termasuk Washington, pada periode 2012–2013.
Analisis profit berdasarkan product type (coffee, espresso, herbal tea, dan tea) di Washington pada tahun 2013 dilakukan untuk memahami performa masing-masing produk dan mengidentifikasi apakah terdapat perbedaan signifikan dalam profit antar jenis produk. Namun, dalam kenyataannya, data profit yang diperoleh dari penjualan produk-produk tersebut tidak selalu mengikuti distribusi normal. Hal ini membuat metode analisis parametrik seperti ANOVA tidak dapat digunakan. Oleh karena itu, dalam analisis ini digunakan metode non-parametrik Uji Kruskal-Wallis untuk mengetahui apakah terdapat perbedaan profit yang signifikan antara keempat jenis produk. Jika perbedaan signifikan ditemukan, uji lanjut Dunn-Bonferroni dapat digunakan untuk mengidentifikasi pasangan product type yang berbeda secara spesifik. Dengan demikian, analisis ini tidak hanya bertujuan untuk menguji perbedaan profit, tetapi juga dapat memberikan insight bagi manajemen coffee Chain terkait keputusan bisnis, seperti menentukan produk yang perlu diprioritaskan atau dievaluasi lebih lanjut.
Statistik deskriptif pada dasarnya merupakan proses transformasi data penelitian dalam bentuk yang lebih mudah dipahami dan diinterpretasikan (Wahyuni, 2020). Pendekatan ini bertujuan untuk menggambarkan karakteristik utama data, seperti ukuran pemusatan (mean, median) dan penyebaran (minimum, maksimum, standar deviasi), tanpa membuat inferensi atau generalisasi. Ukuran statistik yang dihitung meliputi:
Tabel statistik deskriptif akan disajikan untuk memudahkan perbandingan antar kelompok. Visualisasi data, seperti box plot, juga akan digunakan untuk menunjukkan distribusi data dan mengidentifikasi adanya outlier. Pendekatan ini membantu memahami pola dasar data sebelum melakukan uji inferensial.
Uji statistika non-parametrik merupakan suatu uji statistik yang tidak memerlukan adanya asumsi mengenai sebaran data populasi. Statistik non–parametrik tidak mensyaratkan bentuk sebaran parameter populasi berdistribusi normal. Metode ini cocok digunakan untuk data berskala nominal maupun ordinal, karena jenis data tersebut umumnya tidak mengikuti sebaran normal. Salah satu uji dalam Statistika Non-Parametrik adalah Uji Kruskal-Wallis, yang diperkenalkan oleh W.H. Kruskal dan Wallis pada tahun 1952. Uji ini merupakan pengembangan dari uji Wilcoxon yang diperluas penggunaannya untuk membandingkan lebih dari dua kelompok sampel yang independen.
Uji Kruskal-Wallis merupakan alternatif dari uji ANOVA one way, jika data tidak memenuhi asumsi normalitas. Syarat Uji Kruskal Wallis:
Statistik Uji:
Uji statistik dalam uji Kruskal-Wallis didasarkan pada rank/peringkat data dan dihitung menggunakan rumus,
\[H=\frac{12}{N(N+1)}\sum_{i=1}^k\frac{R_i^2}{n_i}-3(N+1)\]Keterengan:
H = Nilai statistik Kruskal-Wallis
N = Jumlah total sampel
k = Jumlah Kelompok
\(R_i\) = Jumlah peringkat (rank) dalam kelompok i
\(n_i\) = Jumlah sampel dalam kelompok i
Nilai H yang diperoleh kemudian dibandingkan dengan nilai kritis distribusi chi-square dengan derajat bebas (df) = k - 1. Nilai p-value yang dihasilkan akan menentukan apakah terdapat perbedaan signifikan antar kelompok.
Uji Dunn-Bonferroni digunakan sebagai uji post-hoc setelah uji Kruskal-Wallis untuk menentukan kelompok mana yang berbeda secara signifikan. Uji Dunn-Bonferroni menggabungkan uji Dunn dengan metode koreksi Bonferroni untuk mengendalikan kesalahan tipe I. Uji Dunn membandingkan peringkat antar pasangan kelompok secara berpasangan, sementara koreksi Bonferroni menyesuaikan tingkat signifikansi (\(\alpha\)) dengan membaginya dengan jumlah perbandingan yang dilakukan, sehingga mengurangi risiko kesalahan menolak hipotesis nol yang sebenarnya benar.
Data yang digunakan dalam analisis ini berasal dari Coffee Chain dataset, dengan variabel X sebagai product type dari negara bagian Washington tahun 2013 dan variebel Y sebagai profit dari negara bagian Washington tahun 2013. Dataset dapat diakses melalui link berikut.
# Input Data
library(readxl)
data <- read_excel("D:/data_washington.xlsx")
data
Analisis statistik deskriptif dilakukan untuk memberikan gambaran awal tentang distribusi profit masing-masing product type. Ukuran statistik yang dihitung meliputi jumlah observasi (n), rata-rata (mean), median, nilai minimum, nilai maksimum, dan standar deviasi (sd). Hasilnya disajikan dalam tabel berikut:
library(dplyr)
library(rstatix)
library(knitr)
deskriptif <- data %>% group_by(X) %>%
summarise(n = n(),
mean = mean(Y),
median = median(Y),
min = min(Y),
max = max(Y),
sd = sd(Y))
kable(deskriptif)
| X | n | mean | median | min | max | sd |
|---|---|---|---|---|---|---|
| Coffee | 24 | 54.75000 | 53.0 | 14 | 105 | 29.90310 |
| Espresso | 36 | 43.97222 | 47.0 | 15 | 98 | 22.55088 |
| Herbal Tea | 24 | 102.41667 | 87.0 | 43 | 181 | 51.95894 |
| Tea | 36 | 39.13889 | 43.5 | -11 | 109 | 33.64279 |
Dari analisis deskriptif ini dapat disimpulkan bahwa Herbal Tea memiliki profit rata-rata tertinggi namun dengan sebaran yang paling besar, menunjukkan potensi profit tinggi yang fluktuatif. Espresso dan Coffee memiliki profit yang lebih stabil, sementara Tea memiliki profit paling rendah bahkan sempat merugi, sehingga perlu perhatian khusus dalam pengelolaannya.
Untuk memperjelas distribusi profit dan mengidentifikasi potensi outlier, visualisasi box plot dibuat sebagai berikut:
boxplot(Y~X, data=data,
main = "Boxplot Product Type dengan Profit", col = "#94a3b8")
Box plot di atas menggambarkan distribusi profit untuk masing-masing product type. Herbal Tea menunjukkan rentang interkuartil yang lebar dan beberapa outlier pada profit yang tinggi, hal ni sesuai dengan standar deviasi besar pada tabel statistik deskriptif. Outlier ini mengindikasikan adanya kasus di mana Herbal Tea menghasilkan profit di atas rata-rata. Coffee dan Espresso memiliki box plot yang menunjukkan distribusi profit lebih seragam dan sedikit atau tanpa outlier. Tea menunjukkan rentang profit yang sempit dengan beberapa nilai negatif.
Karena uji Kruskal-Wallis tidak memerlukan jenis data yang normal, maka dilakukan uji normalitas pada masing-masing data profit berdasarkan product type. Uji Shapiro-Wilk digunakan untuk menguji normalitas profit masing-masing product type. Berikut adalah hasil uji normalitas:
\(H_0\) : Data berdistribusi normal
\(H_1\) : Data tidak berdistribusi normal
\(\alpha=0.05\)
\(H_0\) ditolak jika \(p-value<\alpha\)
shapiro.test(data$Y[data$X == "Coffee"])
##
## Shapiro-Wilk normality test
##
## data: data$Y[data$X == "Coffee"]
## W = 0.89171, p-value = 0.01442
Didapat nilai \(p-value=0.01442\).
Karena nilai \(p-value=0.01442<\alpha\) maka \(H_0\) ditolak, artinya data profit coffee tidak berdistribusi normal.
\(H_0\) : Data berdistribusi normal
\(H_1\) : Data tidak berdistribusi normal
\(\alpha=0.05\)
\(H_0\) ditolak jika \(p-value<\alpha\)
shapiro.test(data$Y[data$X == "Espresso"])
##
## Shapiro-Wilk normality test
##
## data: data$Y[data$X == "Espresso"]
## W = 0.92221, p-value = 0.01462
Didapat nilai \(p-value=0.01462\).
Karena nilai \(p-value=0.01462<\alpha\) maka \(H_0\) ditolak, artinya data profit espresso tidak berdistribusi normal.
\(H_0\) : Data berdistribusi normal
\(H_1\) : Data tidak berdistribusi normal
\(\alpha=0.05\)
\(H_0\) ditolak jika \(p-value<\alpha\)
shapiro.test(data$Y[data$X == "Herbal Tea"])
##
## Shapiro-Wilk normality test
##
## data: data$Y[data$X == "Herbal Tea"]
## W = 0.8545, p-value = 0.002652
Didapat nilai \(p-value=0.002652\).
Karena nilai \(p-value=0.002652<\alpha\) maka \(H_0\) ditolak, artinya data profit herbal tea tidak berdistribusi normal.
\(H_0\) : Data berdistribusi normal
\(H_1\) : Data tidak berdistribusi normal
\(\alpha=0.05\)
\(H_0\) ditolak jika \(p-value<\alpha\)
shapiro.test(data$Y[data$X == "Tea"])
##
## Shapiro-Wilk normality test
##
## data: data$Y[data$X == "Tea"]
## W = 0.94489, p-value = 0.07222
Didapat nilai \(p-value=0.07222\).
Karena nilai \(p-value=0.07222>\alpha\) maka \(H_0\) tidak ditolak, artinya data profit tea berdistribusi normal.
⚠️ KesimpulanSetelah dilakukan uji normalitas dari keseluruhan data profit product type di atas, diketahui terdapat tiga data yang tidak berdistribusi normal (coffee, espresso, dan herbal tea), sehingga selanjutnya digunakan analisis non-parametrik Uji Kruskal-Wallis sebagai analisis perbedaan profit setiap product type.
\(H_0\) : Tidak terdapat perbedaan profit antara product type di negara bagian Washington tahun 2013
\(H_1\) : Terdapat perbedaan profit secara signifikan antara product type di negara bagian Washington tahun 2013
\(\alpha=0.05\)
\(H_0\) ditolak jika \(p-value < \alpha\)
kruskal.test(Y~X, data)
##
## Kruskal-Wallis rank sum test
##
## data: Y by X
## Kruskal-Wallis chi-squared = 25.616, df = 3, p-value = 1.148e-05
Karena nilai \(p-value=1.148e-05<0.05\) maka \(H_0\) ditolak yang berarti, terdapat perbedaan profit secara signifikan antara product type di negara bagian Washington tahun 2013.
Pada hasil analisis uji kruskal wallis di atas, didapatkan hasil bahwa terdapat perbedaan yang signifikan antara product type, sehingga perlu dilakukan uji lanjut untuk mengetahui product mana yang berbeda signifikan. Uji lanjut yang digunakan yaitu uji Post-Hoc Dunn dengan koreksi Bonferroni untuk mengendalikan tingkat kesalahan tipe I. Berikut adalah hasil uji:
library(dunn.test)
# Uji Post-Hoc Dunn dengan koreksi Bonferroni
dunn_test <- dunn.test(data$Y, data$X, method = "bonferroni")
## Kruskal-Wallis rank sum test
##
## data: x and group
## Kruskal-Wallis chi-squared = 25.6158, df = 3, p-value = 0
##
##
## Comparison of x by group
## (Bonferroni)
## Col Mean-|
## Row Mean | Coffee Espresso Herbal T
## ---------+---------------------------------
## Espresso | 1.269192
## | 0.6131
## |
## Herbal T | -2.732934 -4.262972
## | 0.0188* 0.0001*
## |
## Tea | 1.719282 0.503215 4.713062
## | 0.2567 1.0000 0.0000*
##
## alpha = 0.05
## Reject Ho if p <= alpha/2
Dari koreksi Bonferroni, diperoleh hasil Kruskal-Wallis Chi-Squared sebesar 25.6158 dengan derajat kebebasan 3 dan \(p-value=0\). Karena \(p-value=0<0.05\), maka dapat disimpulkan hipotesis nol ditolak. Hal ini berarti ada perbedaan yang signifikan diantara product type secara keseluruhan.
Tabel berikut merangkum p-value untuk setiap perbandingan berpasangan:
| Product | Coffee | Espresso | Herbal Tea | Tea |
|---|---|---|---|---|
| Coffee | – | 0.6131 | 0.0188* | 0.2567 |
| Espresso | 0.6131 | – | 0.0001* | 1.0000 |
| Herbal Tea | 0.0188* | 0.0001* | – | 0.0000* |
| Tea | 0.2567 | 1.0000 | 0.0000* | – |
Jika nilai \(p-value<\alpha\) maka menandakan kedua pasangan product Type berbeda signifikan. Berdasarkan tabel di atas, pasangan yang menunjukkan perbedaan signifikan adalah:
Hasil ini menunjukkan bahwa Herbal Tea memiliki profit yang secara signifikan berbeda dibandingkan dengan Coffee, Espresso, dan Tea. Tidak ada perbedaan signifikan yang ditemukan antar pasangan lainnya, seperti Coffee vs. Espresso atau Espresso vs. Tea. Hasil ini sesuai dengan analisis statistik deskriptif, di mana Herbal Tea memiliki rata-rata profit tertinggi namun dengan variabilitas besar, menunjukkan karakteristik profit yang unik dibandingkan produk lain.
Haryanti, I. dkk.(2024).Analisis Kruskal-Wallis untuk Mengetahui Kemampuan Literasi Siswa SMP Miftahurrohman Gresik Berdasarkan Asesmen Kompetensi Minimum.Indonesian Journal of Multidisciplinary on Social and Technology Vol 2, No 1. Universitas PGRI Adi Buana Surabaya.
Hidayat, A.(2014).Kruskal Wallis H. https://www.statistikian.com/2014/07/kruskall-wallis-h.html
Nugroho, S.(2008).Statistika Nonparametrik.Bengkulu: UNIB Press.
Wahyuni, M.(2020).Statistik Deskriptif.Yogyakarta: Bintang Pustaka Madani.