Analisis Profit Berdasarkan Product Type di Negara yang Memiliki Profit Paling Tinggi Menggunakan Visualisasi dan Uji Kruskal-Wallis pada Data Penjualan Coffee Shop

Aqila Khansa Hartanto
(M0723015)

Gambar 1 Secangkir Kopi
Gambar 1. Secangkir Kopi
Sumber: https://www.bitkaorigin.com/#roasting-and-grinding
Gambar 2 California Coffee
Gambar 2. California Coffee
Sumber: https://www.belarq.com.br/?portfolio=california-coffee

PENDAHULUAN

Latar Belakang

Industri kopi dan teh merupakan sektor yang mengalami pertumbuhan pesat, seiring dengan meningkatnya konsumsi minuman tersebut di berbagai kalangan. Dalam konteks ini, perusahaan-perusahaan ritel dan distribusi kopi perlu melakukan analisis data secara mendalam untuk memahami dinamika pasar, preferensi konsumen, serta kinerja produk mereka. Data penjualan yang terperinci, seperti yang tercantum dalam data penjualan coffee shop, memberikan gambaran menyeluruh mengenai berbagai aspek penting, antara lain jenis produk, wilayah pemasaran, ukuran pasar, dan strategi pemasaran yang diterapkan.

Melalui analisis data ini, diharapkan dapat diperoleh wawasan strategis yang dapat meningkatkan performa bisnis dan membantu merumuskan kebijakan pemasaran yang lebih efektif. Dengan mengidentifikasi faktor-faktor yang mempengaruhi profitabilitas serta tren penjualan berdasarkan waktu dan lokasi, perusahaan dapat merancang pendekatan yang lebih tepat sasaran dan relevan. Oleh karena itu, analisis terhadap dataset ini tidak hanya memberikan pemahaman deskriptif mengenai kondisi bisnis saat ini, tetapi juga membuka peluang untuk prediksi serta pengambilan keputusan berbasis data yang lebih akurat dan terarah.

Landasan Teori

One Way ANAVA

Uji anova satu arah (one-way anova) adalah jenis uji statistika parametrik yang bertujuan untuk mengetahui apakah terdapat perbedaan rata-rata antara lebih dari dua kelompok sampel. Istilah satu arah berarti sumber keragaman yang dianalisis hanya berlangsung satu arah yaitu antar perlakuan (between group).

Anova satu arah merupakan pengembangan lebih lanjut. Penggunaan uji lanjut dimaksudkan untuk membandingkan dua kelompok data, sedangkan anova satu arah bertujuan untuk membandingkan tiga kelompok data atau lebih. Uji asumsi dasar yang harus terpenuhi sebelum melakukan uji anova adalah sebagai uji normalitas dan uji homogenitas.

Tujuan dari anova satu arah adalah untuk membandingkan lebih dari dua buah rata-rata. Sedangkan kegunaan dari uji anova satu arah adalah untuk menguji kemampuan generalisasi. Jika rata-rata antar dua kelompok terbukti tidak berbeda, maka kedua kelompok sampel tersebut dapat digeneralisasikan (data sampel dianggap dapat mewakili populasi).

Uji Normalitas

Analisis normalitas dilakukan untuk mengetahui apakah data residual berdistribusi normal atau tidak. Uji yang digunakan dalam penelitian ini adalah uji Kolmogorov-Smirnov. Uji ini membandingkan distribusi kumulatif empiris data dengan distribusi kumulatif normal teoritis (Wardani, I. et al. 2021).

Adapun hipotesis yang digunakan dalam uji Kolmogorov-Smirnov adalah sebagai berikut:

  1. H0: Sisaan (residual) berdistribusi normal
  2. H1: Sisaan (residual) tidak berdistribusi normal

Langkah-langkah pengujian dilakukan dengan menetapkan taraf signifikansi α, kemudian menghitung statistik uji dengan rumus:

\[D_{hitung} = \max |F_n(x) - F^*(x)|\]

Di mana \(F_n(x)\) adalah fungsi distribusi kumulatif empiris dari data sampel, dan \(F^*(x)\) adalah fungsi distribusi kumulatif normal.

Keputusan pengujian ditentukan dengan membandingkan nilai statistik \(D_{hitung}\) dengan nilai kritis \(D_{(1-\alpha, n)}\) dari tabel Kolmogorov-Smirnov. Jika:

\[D_{hitung} > D_{(1-\alpha, n)}\]

maka \(H_0\) ditolak, yang berarti sisaan tidak berdistribusi normal. Sebaliknya, jika \(D_{hitung} \leq D_{(1-\alpha, n)}\), maka \(H_0\) gagal ditolak, yang berarti sisaan berdistribusi normal.

Uji Heterokedastisitas

Uji heteroskedastisitas bertujuan untuk menguji apakah variansI dari residual dalam model regresi bersifat konstan (homoskedastis) atau tidak (heteroskedastis). Dalam penelitian ini, uji yang digunakan adalah uji Park. Uji ini dilakukan dengan menganalisis hubungan antara logaritma kuadrat residual dengan logaritma variabel independen (Purba, D. et al. 2021).

Hipotesis dalam uji Park dirumuskan sebagai berikut:

  1. H0: Tidak terdapat heteroskedastisitas dalam model, atau \(\text{var}(e_i) = \sigma^2\)
  2. H1: Terdapat heteroskedastisitas dalam model, atau \(\text{var}(e_i) \neq \sigma^2\)

Langkah pengujian dimulai dengan menentukan taraf signifikansi \(\alpha\), kemudian menghitung nilai statistik uji dengan menggunakan uji t pada regresi logaritma kuadrat residual terhadap logaritma variabel independen. Kriteria pengambilan keputusan ditentukan sebagai berikut:

Tolak \(H_0\) jika \(|t_{\text{hitung}}| > t_{\frac{\alpha}{2}(n - p)}\) atau \(\text{p-value} < \alpha\)

Jika \(H_0\) ditolak, maka dapat disimpulkan bahwa terdapat heteroskedastisitas dalam model. Sebaliknya, jika \(H_0\) gagal ditolak, maka model dianggap bebas dari masalah heteroskedastisitas.

Uji Kruskal Wallis

Uji Kruskal-Wallis, diperkenalkan pertama kali oleh W.H. Kruskal dan W.A. Wallis tahun 1952, yang merupakan pengembangan dari uji wilcoxon dengan kategori lebih dari dua kelompok sampel yang saling bebas.Pengujian yang dapat digunakan pada analisis perbandingan untuk menguji lebih dari dua kelompok sampel yang saling bebas (Jamco, J. et al. 2022).

Pengujian hipotesis melalui metode kruskal-wallis merupakan pengembangan dari metode anova satu arah untuk kondisi dimana beberapa persyaratan tidak bisa terpenuhi untuk analisis parametris. Data harus berdistribusi normal, nilai varian populasi sebaiknya sama dan data yang menjadi sampel harus independent secara acak.

Adapun asumsi yang harus dipenuhi dalam menerapkan uji Kruskal-Wallis antara lain:

  1. Data merupakan sampel acak.
  2. Populasi (sampel) tidak mengikuti distribusi tertentu (non-parametrik).
  3. Jumlah sampel tidak harus besar.
  4. Jenis data adalah skala ordinal.
  5. Sampel berasal dari populasi yang saling independen.
  6. Variabel yang diamati bersifat kontinu.

Hipotesis yang diuji dalam Kruskal-Wallis adalah sebagai berikut:

H0 : μ1 = μ2 = … = μk
H1 : Setidaknya ada satu pasangan μi ≠ μj, untuk beberapa i ≠ j

Rumus umum statistik uji Kruskal-Wallis adalah sebagai berikut:

\[ H = \frac{12}{N(N + 1)} \sum_{i=1}^{k} \frac{R_{i}^{2}}{n_{i}} - 3(N + 1) \]

Dimana:

  • H: Nilai statistik Kruskal-Wallis
  • Ri: Jumlah peringkat pada kelompok ke-i
  • ni: Banyaknya observasi dalam kelompok ke-i
  • k: Banyaknya kelompok atau kategori
  • N: Jumlah seluruh observasi (N = n1 + n2 + … + nk)

Keputusan uji diambil dengan membandingkan nilai H hitung terhadap nilai kritis distribusi chi-kuadrat (χ²) pada taraf signifikansi tertentu dengan derajat kebebasan (k - 1). Jika H lebih besar dari nilai kritis, maka H0 ditolak, yang berarti terdapat perbedaan yang signifikan antara kelompok yang diuji.

Uji Dunn-Bonferonni

Melakukan uji perbandingan berganda dengan uji Dunn-Bonferroni. Uji Dunn dilakukan jika pada analisis Kruskal-Wallis menghasilkan keputusan tolak H0 (Haryanto, I., et al. 2024).

\[ z_i = \frac{y_i}{\sigma_i} \]

di mana i adalah salah satu kelompok dan \(y_i = \overline{W}_A - \overline{W}_B\) adalah selisih rata-rata jumlah peringkat. Kesalahan baku diberikan oleh:

\[\sigma_i = \sqrt{ \left( \frac{N(N+1)}{12} - \frac{ \sum_{s=1}^{r} \tau_s^3 - \tau_s }{12(N-1)} \right) \left( \frac{1}{n_A} + \frac{1}{n_B} \right) }\]

Di mana \(N\) merupakan jumlah semua kasus, \(r\) merupakan jumlah peringkat terhubung, dan \(\tau_s\) merupakan jumlah kasus pada peringkat tersebut.

Nilai p yang dihitung kemudian dapat disesuaikan menggunakan koreksi Bonferroni. Koreksi Bonferroni adalah metode paling sederhana untuk mengatasi masalah perbandingan ganda. Di sini, nilai p yang dihitung dikalikan dengan jumlah kelompok.

Jika nilai p yang disesuaikan dalam perbandingan berpasangan lebih kecil dari tingkat signifikansi (biasanya 0,05), hipotesis nol bahwa tidak ada perbedaan ditolak.

DATA

Pada bagian berikut ini, akan ditampilkan data yang terkait dengan coffe Shop, yang mencakup informasi penting untuk dianalisis dan dipahami lebih lanjut.

library(readxl)
library(reactable)

# Baca data
Data_Sim <- read_xlsx("E:/SEMESTER 4/Sistem Informasi Manajemen/Coffee Chain Datasets.xlsx")

# Tampilkan tabel
reactable(
  Data_Sim,
  searchable = TRUE,
  filterable = TRUE,
  pagination = TRUE,
  defaultPageSize = 10,
  highlight = TRUE,
  resizable = TRUE,
  striped = TRUE,
  bordered = TRUE,
  wrap = FALSE,
  defaultColDef = colDef(
    filterable = TRUE,
    align = "center",
    headerStyle = list(
      background = "#C2185B",
      color = "white",
      fontWeight = "bold"
    ),
    style = list(
      background = "#FFF0F5",
      color = "#4A148C"
    )
  ),
  style = list(
    fontFamily = "Verdana",
    fontSize = "13px",
    backgroundColor = "#FFF7FA",
    border = "1px solid #F8BBD0"
  ),
  theme = reactableTheme(
    highlightColor = "#F06292",
    borderColor = "#AD1457",
    stripedColor = "#FCE4EC",
    style = list(),
    inputStyle = list(
      color = "#4A148C",        
      backgroundColor = "white",
      fontWeight = "normal"
    )
  )
)

Visualisasi Data

Top 5 Keuntungan Tertinggi Per Negara Bagian

Pada bagian ini ditampilkan visualisasi lima negara bagian dengan total keuntungan tertinggi. Negara bagian dengan keuntungan tertinggi dari hasil penjualan akan dijadikan dasar untuk analisis selanjutnya.

  # (Kode plot R di sini)
  library(ggplot2)
  library(dplyr)

  Profit_Per_Negara <- Data_Sim %>%
    group_by(State) %>%
    summarise(Total_Profit = sum(Profit)) %>%
    arrange(desc(Total_Profit)) %>%
    slice_head(n = 5) %>%
    mutate(State = factor(State, levels = unique(State)))
  
# Plot Top 5 Keuntungan Tertinggi Per Negara Bagian
  ggplot(Profit_Per_Negara, aes(x = State, y = Total_Profit)) +
    geom_bar(stat = "identity", fill = "#C2185B", alpha = 0.85) +
    theme_minimal() +
    labs(
      title = "Top 5 Keuntungan Tertinggi Per Negara Bagian",
      x = "Negara Bagian",
      y = "Total Keuntungan (USD)"
    ) +
    theme(
      plot.title = element_text(size = 20, face = "bold", color = "#880E4F", hjust = 0.5),
      axis.title.x = element_text(size = 16, color = "#6A1B9A"),
      axis.title.y = element_text(size = 16, color = "#6A1B9A"),
      axis.text.x  = element_text(size = 14, color = "#4A148C"),
      axis.text.y  = element_text(size = 14, color = "#4A148C"),
      panel.grid.major = element_line(color = "#F8BBD0"),
      panel.grid.minor = element_blank()
    )

Berdasarkan grafik di atas yang menunjukkan Top 5 Keuntungan Tertinggi per Negara Bagian, dapat disimpulkan bahwa negara bagian California mencatatkan total keuntungan tertinggi di antara semua negara bagian lainnya. Hal ini menunjukkan bahwa California merupakan pasar yang sangat potensial dan memiliki kontribusi besar terhadap keseluruhan performa penjualan. Di urutan kedua, terdapat negara bagian Illinois, yang juga menunjukkan kinerja penjualan yang sangat baik dengan total keuntungan yang hampir menyamai California.

Selanjutnya, negara bagian Iowa, New York, dan Colorado masing-masing berada di peringkat ketiga hingga kelima. Meskipun total keuntungan mereka lebih rendah dibanding California dan Illinois, ketiga negara bagian ini masih termasuk dalam kategori dengan kinerja yang cukup tinggi, dan dapat menjadi fokus untuk strategi peningkatan penjualan lebih lanjut.

Secara keseluruhan, analisis ini memberikan wawasan penting bagi pengambilan keputusan bisnis, terutama dalam menentukan wilayah prioritas untuk ekspansi, promosi, atau penguatan distribusi. Tingginya keuntungan di California kemungkinan besar dipengaruhi oleh faktor-faktor seperti jumlah penduduk yang besar, daya beli konsumen yang tinggi, serta penetrasi produk yang lebih luas. Oleh karena itu, strategi pemasaran dan distribusi yang diterapkan di California dapat dijadikan acuan atau model untuk diterapkan di wilayah lainnya yang masih memiliki potensi untuk dikembangkan.

Tren Profit per Product Type di California

Visualisasi berikut menampilkan tren profit dari berbagai tipe produk di negara bagian California selama periode waktu tertentu. Grafik garis ini menggambarkan fluktuasi keuntungan dari masing-masing jenis produk, sehingga memudahkan dalam mengamati pola pertumbuhan, penurunan, maupun stabilitas profit secara temporal. Informasi ini penting untuk memahami performa tiap produk seiring waktu dan mendukung pengambilan keputusan strategis.

library(readxl)
library(dplyr)
library(tidyr)
library(xts)
library(dygraphs)

# Data
Data_Sim <- read_xlsx("E:/SEMESTER 4/Sistem Informasi Manajemen/Coffee Chain Datasets.xlsx")

california_data <- Data_Sim %>%
  filter(State == "California") %>%
  group_by(Date, `Product Type`) %>%
  summarise(Profit = sum(Profit), .groups = "drop") %>%
  pivot_wider(names_from = `Product Type`, values_from = Profit)

california_xts <- xts(california_data[,-1], order.by = california_data$Date)
dygraph(california_xts, 
        main = "<div style='text-align: center; font-size: 20px; font-weight: bold; color: #880E4F;'>Tren Profit per Product Type di California</div>") %>%
  dyAxis("y", label = "Profit ($)", 
         valueFormatter = "function(x) { return '$' + x.toFixed(2); }",
         axisLabelFormatter = "function(x) { return '$' + x; }") %>%
  dyOptions(stackedGraph = FALSE)

Berdasarkan grafik, terlihat bahwa produk Espresso cenderung memiliki tren profit yang paling tinggi dan stabil meningkat sepanjang waktu dibandingkan produk lainnya. Coffee juga menunjukkan peningkatan, meskipun dengan fluktuasi yang lebih tajam. Sementara itu, produk Tea dan Herbal Tea mencatat profit yang lebih rendah dan relatif stabil, tanpa lonjakan signifikan. Temuan ini mengindikasikan bahwa Espresso dan Coffee merupakan kontributor utama terhadap profit di California, serta berpotensi menjadi fokus dalam strategi penjualan dan pemasaran ke depannya.

Profit Berdasarkan Product Type di California

Visualisasi berikut menampilkan distribusi profit berdasarkan tipe produk di negara bagian California. Grafik pie ini memberikan gambaran proporsi keuntungan yang diperoleh dari masing-masing kategori produk, sehingga memudahkan dalam mengidentifikasi produk dengan kontribusi profit terbesar.

library(plotly)
library(dplyr)
library(scales)

Product_Type <- Data_Sim %>%
  filter(State == "California") %>%
  group_by(`Product Type`) %>%
  summarise(jumlah = sum(Profit, na.rm = TRUE)) %>%
  mutate(
    persen = round(jumlah / sum(jumlah) * 100, 1),
    label_hover = paste0(`Product Type`, ": ", dollar(jumlah), " (", persen, "%)")
  )

plot_ly(
  data = Product_Type,
  labels = ~`Product Type`,
  values = ~jumlah,
  type = "pie",
  text = ~paste0(persen, "%"),
  textinfo = "text",
  hoverinfo = "text",
  hovertext = ~label_hover,
  marker = list(colors = c("#C2185B", "#880E4F", "#F8BBD0", "#EC407A"))
) %>%
  layout(
    title = list(
      text = "Profit Berdasarkan Product Type di California",
      font = list(size = 20, color = "#880E4F", family = "Arial", bold = TRUE),
      x = 0.5,
      xanchor = "center"
    ),
    margin = list(t = 80),  
    legend = list(title = list(text = "<b>Tipe Produk</b>"))
  )

Berdasarkan visualisasi, produk Espresso memberikan kontribusi keuntungan terbesar di California, yakni sebesar $11.963 atau sekitar 37,6% dari total profit. Disusul oleh Herbal Tea dengan $10.257 (32,3%), dan Tea sebesar $7.107 (22,4%). Sementara itu, produk Coffee memiliki kontribusi paling kecil dengan $2.458 (7,7%). Hal ini menunjukkan bahwa Espresso merupakan produk yang paling menguntungkan di wilayah tersebut. Selanjutnya, akan dilakukan uji Kruskal-Wallis untuk mengetahui apakah terdapat perbedaan profit yang signifikan berdasarkan tipe produk.

Boxplot Profit & Product Type

Boxplot berikut ini menunjukkan distribusi data penjualan berdasarkan tipe produk. Visualisasi ini memberikan gambaran tentang sebaran nilai profit untuk tiap tipe produk, yang dapat membantu untuk mengidentifikasi perbedaan signifikan antar kategori produk.

Data_California <- subset(Data_Sim, State == "California")
View(Data_California)
# Boxplot
library(ggplot2)
ggplot(Data_California, aes(x = `Product Type`, y = Profit, fill = `Product Type`)) +
  geom_boxplot() +
  ggtitle("Boxplot Profit & Product Type") +
  scale_fill_manual(values = c(
    "Coffee"     = "#C2185B",  # pink maroon utama
    "Espresso"   = "#880E4F",  # maroon gelap
    "Herbal Tea" = "#F8BBD0",  # pink pastel
    "Tea"        = "#EC407A"   # pink terang
  )) +
  theme(
    plot.title = element_text(size = 20, face = "bold", color = "#880E4F", hjust = 0.5),
    axis.title.x = element_text(size = 14),
    axis.title.y = element_text(size = 14),
    axis.text.x = element_text(size = 12, angle = 45, hjust = 1),
    axis.text.y = element_text(size = 12),
    legend.position = "none"  
  )

Visualisasi boxplot memperlihatkan perbandingan distribusi keuntungan (profit) dari empat jenis produk: Coffee, Espresso, Herbal Tea, dan Tea. Produk Coffee memiliki sebaran keuntungan yang paling luas, dengan median profit yang justru berada di bawah nol. Ini menunjukkan bahwa sebagian besar transaksi produk Coffee cenderung merugi, meskipun terdapat beberapa transaksi dengan keuntungan sangat tinggi (ditunjukkan oleh whisker bagian atas yang panjang).

Produk Espresso menunjukkan performa yang relatif baik, dengan median profit berada cukup tinggi di atas nol dan distribusi yang lebih simetris. Herbal Tea memiliki persebaran keuntungan yang lebih sempit dibanding Espresso, dengan median masih positif, menandakan keuntungan stabil meski tidak setinggi Espresso. Sementara itu, produk Tea mencatatkan median profit paling rendah di antara produk yang masih untung, dengan distribusi yang sempit, yang mengindikasikan margin keuntungan yang kecil namun stabil.

Secara keseluruhan, produk Espresso dan Herbal Tea cenderung memberikan keuntungan yang lebih stabil dan konsisten, sedangkan Coffee meskipun berpotensi memberikan keuntungan besar, juga memiliki risiko kerugian yang tinggi. Hasil ini bisa menjadi dasar untuk evaluasi strategi pemasaran atau pengelolaan biaya per produk.

PEMBAHASAN DAN SOURCE CODE

One Way ANAVA

Uji ANOVA (Analysis of Variance) digunakan untuk mengetahui apakah terdapat perbedaan rata-rata yang signifikan antara beberapa kelompok perlakuan. Dalam konteks ini, ANOVA digunakan untuk mengevaluasi apakah jenis produk memberikan pengaruh yang berbeda terhadap profit yang dihasilkan. Dengan melakukan uji ini, kita dapat menentukan apakah perlu dilakukan analisis lebih lanjut guna mengetahui perlakuan mana yang paling berpengaruh.

Hipotesis
H0 : μ1 = μ2 = μ3 = μ4
H1 : Setidaknya terdapat sepasang μi ≠ μj

Taraf Signifikansi
α = 0,05

Daerah Kritis
H0 ditolak ketika P-Value < α = 0,05

Statistik Uji
Berikut adalah statistik uji dari ANAVA:

# Uji ANAVA
Anava <- aov(Profit ~ `Product Type`, data = subset(Data_Sim, State == "California"))
summary(Anava)
##                 Df  Sum Sq Mean Sq F value   Pr(>F)    
## `Product Type`   3  726376  242125    12.7 8.19e-08 ***
## Residuals      284 5414377   19065                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Kesimpulan

Karena p-value (8.19 × 10−8) < α (0.05), maka tolak H0. Dengan kata lain, setidaknya terdapat satu perlakuan yang memberikan pengaruh signifikan daripada perlakuan yang lainnya. Oleh karena itu, diperlukan uji lanjut untuk mengetahui perbandingan pengaruh antarperlakuan lebih dalam.

Uji Normalitas

Hipotesis
H0 : Nilai residu bersistribusi normal
H1 : Nilai residu tidak berdistribusi normal

Taraf Signifikansi
α = 0,05

Daerah Kritis
H0 ditolak ketika P-Value < α = 0,05

Statistik Uji
Berikut adalah statistik uji dari Uji Normalitas:

Anava <- aov(Profit ~ `Product Type`, data = subset(Data_Sim, State == "California"))
#Uji Normalitas
ks.test(Anava$residuals, "pnorm")
## 
##  Asymptotic one-sample Kolmogorov-Smirnov test
## 
## data:  Anava$residuals
## D = 0.53829, p-value < 2.2e-16
## alternative hypothesis: two-sided
# Plot Normalitas
library(ggpubr)
ggqqplot(Anava$residuals,ylab = "Raw Residuals")

Kesimpulan

Karena p-value (2.2 × e−16) < α (0.05), maka tolak H0. Dengan kata lain, Nilai residu tidak berdistribusi normal. Sehingga dapat disimpulkan bahwa terjadi pelanggaran asumsi normalitas.

Uji Heterokedastisitas

Hipotesis
H0 : Tidak terdapat heteroskedastisitas dalam model, atau \(\text{var}(e_i) = \sigma^2\)
H1 : Terdapat heteroskedastisitas dalam model, atau \(\text{var}(e_i) \neq \sigma^2\)

Taraf Signifikansi
α = 0,05

Daerah Kritis
H0 ditolak ketika P-Value < α = 0,05

Statistik Uji
Berikut adalah statistik uji dari Uji Heterokedastisitas:

Anava <- aov(Profit ~ `Product Type`, data = subset(Data_Sim, State == "California"))
#Uji Heterokedastisitas
library(lmtest)
bptest(Anava)
## 
##  studentized Breusch-Pagan test
## 
## data:  Anava
## BP = 115.59, df = 3, p-value < 2.2e-16

Kesimpulan

Karena p-value (2.2 × e−16) < α (0.05), maka tolak H0. Dengan kata lain, terdapat heteroskedastisitas dalam model, atau \(\text{var}(e_i) \neq \sigma^2\). Sehingga dapat disimpulkan bahwa terjadi pelanggaran asumsi keragaman antar perlakuan.

Kesimpulan 2 Uji Asumsi

Berdasarkan kedua pengujian asumsi yang telah diuji sebelumnya, diperoleh bahwa data tidak memenuhi asumsi normalitas dan tidak memenuhi asumsi homogenitas ragam sehingga analisis yang dapat dilakukan adalah dengan menggunakan uji Kruskall-Wallis sebagai uji alternatif bagi analisis One Way ANOVA.

Uji Kruskal Wallis

Uji Kruskal-Wallis digunakan untuk membandingkan ukuran pemusatan dari lebih dari dua kelompok yang independen, khususnya ketika asumsi statistik parametrik seperti normalitas dan homogenitas ragam tidak terpenuhi. Pada analisis ini, uji Kruskal-Wallis diterapkan untuk mengevaluasi apakah terdapat perbedaan profit yang signifikan berdasarkan jenis produk yang dijual oleh shop di negara bagian California. Penggunaan uji non-parametrik ini didasarkan pada hasil uji asumsi sebelumnya yang menunjukkan bahwa data tidak memenuhi asumsi homogenitas ragam. Dengan demikian, uji Kruskal-Wallis menjadi metode yang tepat untuk menguji apakah profit dari kategori produk Coffee, Espresso, Herbal Tea, dan Tea berasal dari populasi yang memiliki median profit yang sama.

Hipotesis

  • H0: μ1 = μ2 = μ3 = μ4 (Tidak terdapat perbedaan yang signifikan dalam median profit di antara keempat jenis produk (Coffee, Espresso, Herbal Tea, dan Tea)).
  • H1: μi ≠ μj (Terdapat paling tidak satu pasangan jenis produk yang memiliki perbedaan median profit yang signifikan).

Taraf Signifikansi
α = 0,05

Daerah Kritis
H0 ditolak ketika P-Value < α = 0,05

Statistik Uji
Berikut adalah statistik uji dari Uji Kruskal-Wallis:

# Uji Kruskal-Wallis
kruskal.test(Profit ~ `Product Type`, data = subset(Data_Sim, State == "California"))
## 
##  Kruskal-Wallis rank sum test
## 
## data:  Profit by Product Type
## Kruskal-Wallis chi-squared = 30.326, df = 3, p-value = 1.179e-06

Kesimpulan

Karena p-value (1.179 × e−06) < α (0.05), maka tolak H0. Dengan kata lain, Terdapat paling tidak satu pasangan jenis produk yang memiliki perbedaan median profit yang signifikan. Oleh karena itu, uji lanjut diperlukan untuk mengetahui letak perbedaan tersebut dengan menggunakan uji Dunn-Bonferroni.

Uji Dunn-Bonferroni

Setelah uji Kruskal-Wallis menunjukkan adanya perbedaan yang signifikan dalam median profit antar jenis produk, maka dilakukan uji lanjutan untuk mengetahui pasangan kelompok mana yang berbeda secara signifikan. Uji Dunn dengan koreksi Bonferroni digunakan sebagai analisis post-hoc karena sesuai untuk data non-parametrik dan mampu mengontrol tingkat kesalahan tipe I saat melakukan perbandingan ganda. Dalam konteks ini, uji Dunn-Bonferroni digunakan untuk membandingkan profit antar setiap pasangan jenis produk (Coffee, Espresso, Herbal Tea, dan Tea) guna mengidentifikasi kelompok mana yang secara statistik memiliki perbedaan profit yang nyata.

Hipotesis

  • H0: Tidak terdapat perbedaan median profit yang signifikan antara pasangan jenis produk yang dibandingkan.
  • H1: Terdapat perbedaan median profit yang signifikan antara pasangan jenis produk yang dibandingkan.

Taraf Signifikansi
α = 0,05

Daerah Kritis
H0 ditolak ketika P-Value < α = 0,05

Statistik Uji
Berikut adalah statistik uji dari Uji Dunn-Bonferroni :

library(FSA)
library(dplyr)
library(tidyr)
library(knitr)
library(kableExtra)
library(tibble)  

Uji_Dunn <- dunnTest(Profit ~ `Product Type`, data = subset(Data_Sim, State == "California"), method = "bonferroni")
dunn_result <- Uji_Dunn$res

dunn_result <- dunn_result %>%
  separate(Comparison, into = c("Group1", "Group2"), sep = " - ")

group_names <- sort(unique(c(dunn_result$Group1, dunn_result$Group2)))

mat <- matrix(NA, nrow = length(group_names), ncol = length(group_names),
              dimnames = list(group_names, group_names))

for (i in 1:nrow(dunn_result)) {
  g1 <- dunn_result$Group1[i]
  g2 <- dunn_result$Group2[i]
  pval <- dunn_result$P.adj[i]
  mat[g2, g1] <- formatC(pval, format = "e", digits = 2)
}

as.data.frame(mat) %>%
  rownames_to_column("Tipe Produk") %>%
  kbl(booktabs = TRUE,
      caption = "Tabel Hasil Uji antar Tipe Produk",
      align = "c") %>%
  kable_styling(full_width = FALSE,
                position = "center",
                bootstrap_options = c("striped", "hover", "condensed"),
                font_size = 14) %>%
  row_spec(0, bold = TRUE, color = "white", background = "#C2185B") %>%
  column_spec(1, bold = TRUE, background = "#F8BBD0")
Tabel Hasil Uji antar Tipe Produk
Tipe Produk Coffee Espresso Herbal Tea Tea
Coffee NA NA NA NA
Espresso 5.90e-06 NA NA NA
Herbal Tea 1.20e-04 1.00e+00 NA NA
Tea 3.36e-01 1.70e-02 1.11e-01 NA

Berdasarkan tabel di atas dapat diambil kesimpulan bahwa:

  • Rata-rata profit pada produk Coffee berbeda secara signifikan dengan produk Espresso dan Herbal Tea karena nilai p-value masing-masing adalah 5.90e-06 dan 1.20e-04, yang lebih kecil dari tingkat signifikansi 5%. Namun, tidak terdapat perbedaan signifikan antara Coffee dan Tea.
    → Artinya, Coffee menghasilkan profit yang berbeda dari Espresso dan Herbal Tea, tetapi besarnya profit mirip dengan Tea.

  • Rata-rata profit pada produk Espresso berbeda secara signifikan dengan produk Coffee dan Tea, tetapi tidak berbeda signifikan dengan Herbal Tea, karena nilai p-value sebesar 1 (p = 1.00e+00).
    → Ini menunjukkan bahwa Espresso dan Herbal Tea memiliki profit yang serupa, namun berbeda dari Coffee dan Tea.

  • Rata-rata profit pada produk Herbal Tea berbeda signifikan hanya dengan produk Coffee, dan tidak berbeda signifikan dengan produk Espresso maupun Tea, karena nilai p-value > 0.05.
    → Herbal Tea cenderung memiliki profit yang mirip dengan Espresso dan Tea, tetapi berbeda nyata dari Coffee.

KESIMPULAN

  • Berdasarkan hasil uji statistik, diperoleh bahwa terdapat perbedaan profit yang signifikan antar jenis produk, dengan p-value sebesar 8.19 × 10−8 untuk uji ANOVA yang menunjukkan bahwa terdapat perbedaan profit yang signifikan antar jenis produk. dan 1.179 × 10−6 untuk Uji Kruskal-Wallis yang menunjukkan bahwa setidaknya terdapat satu pasang jenis produk dengan perbedaan profit yang signifikan. Uji lanjut Dunn-Bonferroni menunjukkan bahwa produk Coffee memiliki perbedaan profit yang signifikan dibandingkan Espresso dan Herbal Tea, namun tidak berbeda secara signifikan dengan Tea. Hal ini menegaskan bahwa secara keseluruhan, Coffee memiliki kinerja profit paling rendah di antara produk lainnya.

  • Dibuktikan dalam visualisasi profit berdasarkan product type, menunjukkan bahwa produk Coffee justru mencatatkan profit paling rendah, hanya menyumbang 7,7% dari total profit. Hal ini menunjukkan bahwa Coffee memiliki potensi masalah dalam strategi harga atau biaya produksi, dan memerlukan evaluasi lebih lanjut untuk meningkatkan profitabilitasnya. Sebaliknya, produk Espresso dan Herbal Tea memiliki profit yang tidak berbeda signifikan satu sama lain, dengan masing-masing berkontribusi sebesar 37,6% dan 32,3% terhadap total profit. Kedua produk ini berada pada kelompok profit menengah ke atas, menunjukkan kestabilan yang lebih baik dalam kontribusinya terhadap total pendapatan. Tea, di sisi lain, menunjukkan profit yang relatif stabil dan konsisten, tanpa perbedaan signifikan dengan produk lainnya, yang menjadikannya sebagai produk penyeimbang dalam peningkatan profit. Dari segi visualisasi tren profit bulanan, Espresso sempat mencatatkan profit tertinggi, terutama di awal 2013, namun dengan fluktuasi tajam. Hal ini menunjukkan bahwa meskipun Espresso memiliki potensi profit tinggi, produk ini juga mengalami ketidakstabilan yang signifikan.

  • Secara keseluruhan, temuan ini memberikan wawasan penting bahwa Coffee memerlukan perhatian lebih dalam strategi peningkatan profitabilitas, sementara Tea dapat dijadikan produk penyeimbang yang konsisten. Pengetahuan ini bisa diterapkan dalam keputusan strategis seperti pemasaran, penetapan harga, dan pengelolaan produk, serta membantu dalam merencanakan langkah-langkah yang lebih efektif ke depan.

DAFTAR PUSTAKA

Belarq. Desain Interior “California Coffee” oleh Belarq Studio. belarq.com.br. Diakses pada 12 Mei 2025 dari bit.ly/calif-coffee

Bitka Origin. Serba-serbi Latte Art yang Wajib Pecinta Kopi Ketahui. bitkaorigin.com. Diakses pada 12 Mei 2025 dari bit.ly/latte-art-bitka

Haryanto, I., Divaio, P., & Indrasetianingsih, A. (2024). Analisis Kruskal-Wallis untuk Mengetahui Kemampuan Literasi Siswa SMP Miftahurrohman Gresik Berdasarkan Asesmen Kompetensi Minimum. Indonesian Journal of Multidisciplinary on Sosial and Technology.2(1), 32-36.

Jamco, J., & Balami, A. (2022). Analisis Kruskal-Wallis untuk Mengetahui Konsentrasi Belajar Mahasiswa Berdasarkan Bidang Minat Program Studi Statistika FMIPA UNPATTI. JURNAL MATEMATIKA, STATISTIKA, DAN TERAPANNYA.1(1), 29-34.

Purba, D., Tarigan, W., Sinaga, M., & Tarigan, V. (2021). Pelatihan Penggunaan Software SPPS Dalam Pengolahan Regresi Linear Berganda Untuk Mahasiswa Fakultas Ekonomi Universitas Simalungun Di Masa Pandemi Covid 19. Jurnal Karya Abdi.5(1), 202-208.

Wardani, I., Susanti, Y., Subanti, S.(2021). Pemodelan Indeks Kedalaman Kemiskinan di Indonesia Menggunakan Analisis Regresi Robust. Prosiding Seminar Nasional Aplikasi Sains dan Teknologi (SNAST).2(1).