1 Pendahuluan

1.1 Deskripsi Data

Industri kopi di Amerika Serikat merupakan salah satu sektor yang berkembang pesat, persaingan antar produk seperti coffee, espresso, herbal tea, dan tea membuat perusahaan perlu memahami performa masing-masing produk secara mendalam, terutama dari sisi profitabilitas. Maka dari itu, analisis terhadap data penjualan dan profit merupakan aspek penting dalam pengambilan keputusan yang strategis. Dalam konteks ini, dataset Coffee Chain menyediakan informasi terkait penjualan dan profit berbagai jenis produk di beberapa negara bagian Amerika Serikat, termasuk Washington, pada periode 2012–2013.

Analisis profit berdasarkan product type (coffee, espresso, herbal tea, dan tea) di Washington pada tahun 2013 dilakukan untuk memahami performa masing-masing produk dan mengidentifikasi apakah terdapat perbedaan signifikan dalam profit antar jenis produk. Namun, dalam kenyataannya, data profit yang diperoleh dari penjualan produk-produk tersebut tidak selalu mengikuti distribusi normal. Hal ini membuat metode analisis parametrik seperti ANOVA tidak dapat digunakan. Oleh karena itu, dalam analisis ini digunakan metode non-parametrik Uji Kruskal-Wallis untuk mengetahui apakah terdapat perbedaan profit yang signifikan antara keempat jenis produk. Jika perbedaan signifikan ditemukan, uji lanjut Dunn-Bonferroni dapat digunakan untuk mengidentifikasi pasangan product type yang berbeda secara spesifik. Dengan demikian, analisis ini tidak hanya bertujuan untuk menguji perbedaan profit, tetapi juga dapat memberikan insight bagi manajemen coffee Chain terkait keputusan bisnis, seperti menentukan produk yang perlu diprioritaskan atau dievaluasi lebih lanjut.

1.2 Kajian Teori

1.2.1 Statistik Deskriptif

Statistik deskriptif pada dasarnya merupakan proses transformasi data penelitian dalam bentuk yang lebih mudah dipahami dan diinterpretasikan (Wahyuni, 2020). Pendekatan ini bertujuan untuk menggambarkan karakteristik utama data, seperti ukuran pemusatan (mean, median) dan penyebaran (minimum, maksimum, standar deviasi), tanpa membuat inferensi atau generalisasi. Ukuran statistik yang dihitung meliputi:

  • Jumlah Observasi (n): Menunjukkan banyaknya data untuk setiap kelompok.
  • Median: Menunjukkan nilai tengah, yang lebih tahan terhadap outlier dibandingkan rata-rata.
  • Mean: Menunjukkan rata-rata untuk setiap kelompok.
  • Minimum dan Maksimum: Menggambarkan rentang nilai data terkecil dan terbesar.
  • Standar Deviasi: Mengukur tingkat variabilitas atau penyebaran data dalam setiap kelompok.

Tabel statistik deskriptif akan disajikan untuk memudahkan perbandingan antar kelompok. Visualisasi data, seperti box plot, juga akan digunakan untuk menunjukkan distribusi data dan mengidentifikasi adanya outlier. Pendekatan ini membantu memahami pola dasar data sebelum melakukan uji inferensial.

1.2.2 Uji Kruskal-Wallis

Uji statistika non-parametrik merupakan suatu uji statistik yang tidak memerlukan adanya asumsi mengenai sebaran data populasi. Statistik non–parametrik tidak mensyaratkan bentuk sebaran parameter populasi berdistribusi normal. Metode ini cocok digunakan untuk data berskala nominal maupun ordinal, karena jenis data tersebut umumnya tidak mengikuti sebaran normal. Salah satu uji dalam Statistika Non-Parametrik adalah Uji Kruskal-Wallis, yang diperkenalkan oleh W.H. Kruskal dan Wallis pada tahun 1952. Uji ini merupakan pengembangan dari uji Wilcoxon yang diperluas penggunaannya untuk membandingkan lebih dari dua kelompok sampel yang independen.

Uji Kruskal-Wallis merupakan alternatif dari uji ANOVA one way, jika data tidak memenuhi asumsi normalitas. Syarat Uji Kruskal Wallis:

  1. Data sampel tidak berdistribusi normal
  2. Lebih dari Dua Kelompok sampel yang saling independent atau tidak berpengaruh satu sama lain (anggota sampel antar kelompok berbeda)
  3. Sampel berskala data ordinal, atau interval

Statistik Uji:

Uji statistik dalam uji Kruskal-Wallis didasarkan pada rank/peringkat data dan dihitung menggunakan rumus,

\[H=\frac{12}{N(N+1)}\sum_{i=1}^k\frac{R_i^2}{n_i}-3(N+1)\]

Keterengan:

H = Nilai statistik Kruskal-Wallis

N = Jumlah total sampel

k = Jumlah Kelompok

\(R_i\) = Jumlah peringkat (rank) dalam kelompok i

\(n_i\) = Jumlah sampel dalam kelompok i

Nilai H yang diperoleh kemudian dibandingkan dengan nilai kritis distribusi chi-square dengan derajat bebas (df) = k - 1. Nilai p-value yang dihasilkan akan menentukan apakah terdapat perbedaan signifikan antar kelompok.

1.2.3 Uji Lanjut Dunn-Bonferroni

Uji Dunn-Bonferroni digunakan sebagai uji post-hoc setelah uji Kruskal-Wallis untuk menentukan kelompok mana yang berbeda secara signifikan. Uji Dunn-Bonferroni menggabungkan uji Dunn dengan metode koreksi Bonferroni untuk mengendalikan kesalahan tipe I. Uji Dunn membandingkan peringkat antar pasangan kelompok secara berpasangan, sementara koreksi Bonferroni menyesuaikan tingkat signifikansi (\(\alpha\)) dengan membaginya dengan jumlah perbandingan yang dilakukan, sehingga mengurangi risiko kesalahan menolak hipotesis nol yang sebenarnya benar.

2 Hasil dan Pembahasan

2.1 Data

Data yang digunakan dalam analisis ini berasal dari Coffee Chain dataset, dengan variabel X sebagai product type dari negara bagian Washington tahun 2013 dan variebel Y sebagai profit dari negara bagian Washington tahun 2013. Dataset dapat diakses melalui link berikut.

# Input Data
library(readxl)
data <- read_excel("D:/data_washington.xlsx")
data

2.2 Statistik Deskriptif

Analisis statistik deskriptif dilakukan untuk memberikan gambaran awal tentang distribusi profit masing-masing product type. Ukuran statistik yang dihitung meliputi jumlah observasi (n), rata-rata (mean), median, nilai minimum, nilai maksimum, dan standar deviasi (sd). Hasilnya disajikan dalam tabel berikut:

library(dplyr)
library(rstatix)
library(knitr)
deskriptif <- data %>% group_by(X) %>% 
  summarise(n = n(),
            mean = mean(Y),
            median = median(Y),
            min = min(Y),
            max = max(Y),
            sd = sd(Y))
kable(deskriptif)
X n mean median min max sd
Coffee 24 54.75000 53.0 14 105 29.90310
Espresso 36 43.97222 47.0 15 98 22.55088
Herbal Tea 24 102.41667 87.0 43 181 51.95894
Tea 36 39.13889 43.5 -11 109 33.64279

Dari analisis deskriptif ini dapat disimpulkan bahwa Herbal Tea memiliki profit rata-rata tertinggi namun dengan sebaran yang paling besar, menunjukkan potensi profit tinggi yang fluktuatif. Espresso dan Coffee memiliki profit yang lebih stabil, sementara Tea memiliki profit paling rendah bahkan sempat merugi, sehingga perlu perhatian khusus dalam pengelolaannya.

Untuk memperjelas distribusi profit dan mengidentifikasi potensi outlier, visualisasi box plot dibuat sebagai berikut:

boxplot(Y~X, data=data,
         main = "Boxplot Product Type dengan Profit", col = "#94a3b8")

Box plot di atas menggambarkan distribusi profit untuk masing-masing product type. Herbal Tea menunjukkan rentang interkuartil yang lebar dan beberapa outlier pada profit yang tinggi, hal ni sesuai dengan standar deviasi besar pada tabel statistik deskriptif. Outlier ini mengindikasikan adanya kasus di mana Herbal Tea menghasilkan profit di atas rata-rata. Coffee dan Espresso memiliki box plot yang menunjukkan distribusi profit lebih seragam dan sedikit atau tanpa outlier. Tea menunjukkan rentang profit yang sempit dengan beberapa nilai negatif.

2.3 Uji Asumsi Normalitas

Karena uji Kruskal-Wallis tidak memerlukan jenis data yang normal, maka dilakukan uji normalitas pada masing-masing data profit berdasarkan product type. Uji Shapiro-Wilk digunakan untuk menguji normalitas profit masing-masing product type. Berikut adalah hasil uji normalitas:

Coffee

  1. Hipotesis

    \(H_0\) : Data berdistribusi normal

    \(H_1\) : Data tidak berdistribusi normal

  2. Taraf Signifikansi

    \(\alpha=0.05\)

  3. Daerah Kritis

    \(H_0\) ditolak jika \(p-value<\alpha\)

  4. Statistik Uji
shapiro.test(data$Y[data$X == "Coffee"])
## 
##  Shapiro-Wilk normality test
## 
## data:  data$Y[data$X == "Coffee"]
## W = 0.89171, p-value = 0.01442

Didapat nilai \(p-value=0.01442\).

  1. Kesimpulan

    Karena nilai \(p-value=0.01442<\alpha\) maka \(H_0\) ditolak, artinya data profit coffee tidak berdistribusi normal.

Espresso

  1. Hipotesis

    \(H_0\) : Data berdistribusi normal

    \(H_1\) : Data tidak berdistribusi normal

  2. Taraf Signifikansi

    \(\alpha=0.05\)

  3. Daerah Kritis

    \(H_0\) ditolak jika \(p-value<\alpha\)

  4. Statistik Uji
shapiro.test(data$Y[data$X == "Espresso"])
## 
##  Shapiro-Wilk normality test
## 
## data:  data$Y[data$X == "Espresso"]
## W = 0.92221, p-value = 0.01462

Didapat nilai \(p-value=0.01462\).

  1. Kesimpulan

    Karena nilai \(p-value=0.01462<\alpha\) maka \(H_0\) ditolak, artinya data profit espresso tidak berdistribusi normal.

Herbal Tea

  1. Hipotesis

    \(H_0\) : Data berdistribusi normal

    \(H_1\) : Data tidak berdistribusi normal

  2. Taraf Signifikansi

    \(\alpha=0.05\)

  3. Daerah Kritis

    \(H_0\) ditolak jika \(p-value<\alpha\)

  4. Statistik Uji
shapiro.test(data$Y[data$X == "Herbal Tea"])
## 
##  Shapiro-Wilk normality test
## 
## data:  data$Y[data$X == "Herbal Tea"]
## W = 0.8545, p-value = 0.002652

Didapat nilai \(p-value=0.002652\).

  1. Kesimpulan

    Karena nilai \(p-value=0.002652<\alpha\) maka \(H_0\) ditolak, artinya data profit herbal tea tidak berdistribusi normal.

Tea

  1. Hipotesis

    \(H_0\) : Data berdistribusi normal

    \(H_1\) : Data tidak berdistribusi normal

  2. Taraf Signifikansi

    \(\alpha=0.05\)

  3. Daerah Kritis

    \(H_0\) ditolak jika \(p-value<\alpha\)

  4. Statistik Uji
shapiro.test(data$Y[data$X == "Tea"])
## 
##  Shapiro-Wilk normality test
## 
## data:  data$Y[data$X == "Tea"]
## W = 0.94489, p-value = 0.07222

Didapat nilai \(p-value=0.07222\).

  1. Kesimpulan

    Karena nilai \(p-value=0.07222>\alpha\) maka \(H_0\) tidak ditolak, artinya data profit tea berdistribusi normal.

⚠️ Kesimpulan

Setelah dilakukan uji normalitas dari keseluruhan data profit product type di atas, diketahui terdapat tiga data yang tidak berdistribusi normal (coffee, espresso, dan herbal tea), sehingga selanjutnya digunakan analisis non-parametrik Uji Kruskal-Wallis sebagai analisis perbedaan profit setiap product type.

2.4 Uji Kruskal-Wallis

  1. Hipotesis

    \(H_0\) : Tidak terdapat perbedaan profit antara product type di negara bagian Washington tahun 2013

    \(H_1\) : Terdapat perbedaan profit secara signifikan antara product type di negara bagian Washington tahun 2013

  2. Taraf signifikansi

    \(\alpha=0.05\)

  3. Daerah Kritis

    \(H_0\) ditolak jika \(p-value < \alpha\)

  4. Statistik Uji
kruskal.test(Y~X, data)
## 
##  Kruskal-Wallis rank sum test
## 
## data:  Y by X
## Kruskal-Wallis chi-squared = 25.616, df = 3, p-value = 1.148e-05
  1. Kesimpulan

    Karena nilai \(p-value=1.148e-05<0.05\) maka \(H_0\) ditolak yang berarti, terdapat perbedaan profit secara signifikan antara product type di negara bagian Washington tahun 2013.

2.5 Uji Lanjut Dunn-Bonferroni

Pada hasil analisis uji kruskal wallis di atas, didapatkan hasil bahwa terdapat perbedaan yang signifikan antara product type, sehingga perlu dilakukan uji lanjut untuk mengetahui product mana yang berbeda signifikan. Uji lanjut yang digunakan yaitu uji Post-Hoc Dunn dengan koreksi Bonferroni untuk mengendalikan tingkat kesalahan tipe I. Berikut adalah hasil uji:

library(dunn.test)
# Uji Post-Hoc Dunn dengan koreksi Bonferroni
dunn_test <- dunn.test(data$Y, data$X, method = "bonferroni")
##   Kruskal-Wallis rank sum test
## 
## data: x and group
## Kruskal-Wallis chi-squared = 25.6158, df = 3, p-value = 0
## 
## 
##                            Comparison of x by group                            
##                                  (Bonferroni)                                  
## Col Mean-|
## Row Mean |     Coffee   Espresso   Herbal T
## ---------+---------------------------------
## Espresso |   1.269192
##          |     0.6131
##          |
## Herbal T |  -2.732934  -4.262972
##          |    0.0188*    0.0001*
##          |
##      Tea |   1.719282   0.503215   4.713062
##          |     0.2567     1.0000    0.0000*
## 
## alpha = 0.05
## Reject Ho if p <= alpha/2

Dari koreksi Bonferroni, diperoleh hasil Kruskal-Wallis Chi-Squared sebesar 25.6158 dengan derajat kebebasan 3 dan \(p-value=0\). Karena \(p-value=0<0.05\), maka dapat disimpulkan hipotesis nol ditolak. Hal ini berarti ada perbedaan yang signifikan diantara product type secara keseluruhan.

Tabel berikut merangkum p-value untuk setiap perbandingan berpasangan:

Tabel P-value Hasil Uji Dunn (Bonferroni)
Product Coffee Espresso Herbal Tea Tea
Coffee 0.6131 0.0188* 0.2567
Espresso 0.6131 0.0001* 1.0000
Herbal Tea 0.0188* 0.0001* 0.0000*
Tea 0.2567 1.0000 0.0000*

Jika nilai \(p-value<\alpha\) maka menandakan kedua pasangan product Type berbeda signifikan. Berdasarkan tabel di atas, pasangan yang menunjukkan perbedaan signifikan adalah:

  1. Herbal Tea dengan Coffee (\(p-value=0.0188\))
  2. Herbal Tea dengan Espresso (\(p-value=0.0001\))
  3. Herbal Tea dengan Tea (\(p-value=0.0000\))

Hasil ini menunjukkan bahwa Herbal Tea memiliki profit yang secara signifikan berbeda dibandingkan dengan Coffee, Espresso, dan Tea. Tidak ada perbedaan signifikan yang ditemukan antar pasangan lainnya, seperti Coffee vs. Espresso atau Espresso vs. Tea. Hasil ini sesuai dengan analisis statistik deskriptif, di mana Herbal Tea memiliki rata-rata profit tertinggi namun dengan variabilitas besar, menunjukkan karakteristik profit yang unik dibandingkan produk lain.

3 Kesimpulan

  1. Berdasarkan analisis statistik deskriptif, Herbal Tea menjadi product yang memiliki profit paling tinggi (181) dan tea yang memiliki profit paling rendah bahkan hingga rugi (-11). Herbal Tea menonjol dengan rata-rata profit tertinggi namun disertai dengan variasi yang sangat besar, mencerminkan potensi keuntungan tinggi yang tidak stabil. Coffee dan Espresso menunjukkan profit yang lebih konsisten, menjadikannya produk yang lebih stabil dalam menghasilkan keuntungan. Sedangkan, Tea memiliki rata-rata profitnya paling kecil. Oleh karena itu, hasil ini dapat menjadi bahan evaluasi penting dalam pengambilan keputusan bisnis terkait prioritas pengembangan dan promosi masing-masing produk.
  2. Berdasarkan hasil uji Kruskal-Wallis yang dilanjutkan dengan uji Dunn-Bonferroni, dapat disimpulkan bahwa terdapat perbedaan yang signifikan dalam profit antar product type di negara bagian Washington tahun 2013. Hasil uji lanjut menunjukkan bahwa Herbal Tea memiliki perbedaan signifikan terhadap ketiga product type lainnya, yaitu Coffee, Espresso, dan Tea. Hal ini menunjukkan bahwa performa profit Herbal Tea memiliki karakteristik tersendiri yang secara statistik berbeda, sehingga dapat dianalisis lebih lanjut apakah disebabkan oleh strategi pemasaran, segmen pasar, atau faktor lainnya yang untuk produk ini.
  3. Secara praktis, hasil analisis ini memberikan insight strategis bagi manajemen Coffee Chain. Produk Herbal Tea dapat dikategorikan sebagai produk unggulan, tetapi perlu strategi untuk mengurangi fluktuasi profit, seperti pemasaran yang konsisten atau variasi produk. Coffee dan Espresso, dengan stabilitas profitnya, dapat dipertahankan sebagai produk inti. Sedangkan, Tea dengan profit rendah dan ada potensi kerugian, memerlukan evaluasi, seperti penyesuaian harga, inovasi rasa, atau target ulang segmen pasar, untuk meningkatkan daya saingnya di pasar Washington. Analisis ini juga menunjukkan pentingnya pendekatan non-parametrik seperti uji Kruskal-Wallis dalam menangani data profit yang tidak berdistribusi normal.

4 Referensi

Haryanti, I. dkk.(2024).Analisis Kruskal-Wallis untuk Mengetahui Kemampuan Literasi Siswa SMP Miftahurrohman Gresik Berdasarkan Asesmen Kompetensi Minimum.Indonesian Journal of Multidisciplinary on Social and Technology Vol 2, No 1. Universitas PGRI Adi Buana Surabaya.

Hidayat, A.(2014).Kruskal Wallis H. https://www.statistikian.com/2014/07/kruskall-wallis-h.html

Nugroho, S.(2008).Statistika Nonparametrik.Bengkulu: UNIB Press.

Wahyuni, M.(2020).Statistik Deskriptif.Yogyakarta: Bintang Pustaka Madani.