Dalam dunia bisnis, khususnya di industri makanan dan minuman, pemahaman yang mendalam mengenai kinerja masing-masing produk sangat penting untuk pengambilan keputusan strategis. Profitabilitas menjadi salah satu indikator utama dalam menilai kontribusi suatu produk terhadap keseluruhan kinerja perusahaan.
Melalui analisis dataset Coffee Chain, dapat dilakukan evaluasi mengenai sejauh mana setiap jenis produk memberikan keuntungan (profit) bagi perusahaan. Dengan mengetahui apakah terdapat perbedaan yang signifikan dalam rata-rata profit antar jenis produk, manajemen dapat merancang strategi pemasaran, pengelolaan stok, dan pengembangan produk yang lebih tepat sasaran.
Oleh karena itu, penelitian ini bertujuan untuk menganalisis perbedaan rata-rata profit berdasarkan jenis produk yang terdapat pada dataset Coffee Chain. Hasil analisis ini diharapkan dapat memberikan gambaran kuantitatif yang berguna dalam pengambilan keputusan bisnis berbasis data.
Dataset Coffee Chain berisi 4.248 entri yang mencakup data penjualan, anggaran, dan informasi produk dari jaringan penjualan kopi selama periode Januari 2012 hingga Desember 2013. Data ini terdiri dari 20 kolom yang mencakup informasi geografis seperti kode area (Area Code), wilayah pasar (Market), ukuran pasar (Market Size), dan negara bagian (State). Selain itu, data juga mencatat rincian produk seperti nama produk (Product), lini produk (Product Line), jenis produk (Product Type), serta tipe produk (Type), yang mendukung analisis berdasarkan kategori penjualan. Secara finansial, dataset ini mencatat baik estimasi anggaran (seperti Budget Sales, Budget Profit, dan Budget COGS) maupun hasil aktual (Sales, Profit, COGS, Margin, dan Total Expenses).
library(readxl)
# Membaca Data
CoffeeChain<- read_excel("C:/Users/ajiro/Downloads/3. CM1 - Coffee Chain Datasets.xlsx", sheet = "data")
# Merubah Nama Kolom (menghilangkan spasi, menambahkan titik)
names(CoffeeChain) <- make.names(names(CoffeeChain))
# Melihat Tabel
View(CoffeeChain)
One-Way Anova adalah uji hipotesis untuk membandingkan \(k\) mean populasi \(\mu_1, \mu_2,...,\mu_k\), dari \(k\) perlakuan apakah sama atau tidak. Suatu sampel random diambil dari setiap populasi, misal \(n_1\) sampel dari populasi pertama, \(n_2\) sampel dari populasi kedua hingga \(n_k\) sampel dari populasi ke-\(k\). Dianggap populasi-populasi itu mempunyai variansi sama, yaitu \(\sigma^2\).
Hipotesis yang akan diuji berbentuk sebagaimana terlampir
\(H_0\): \(\mu_1 = \mu_2 = ... =\mu_k\)
\(H_1\): \(\mu_1 \neq \mu_j\), untuk paling sedikit
sebuah \(i\), \(j\)
Model matematik One-Way Anova : \[Y_{ij} =
\mu +\tau_i + \varepsilon_{ij} , i = 1,2,...,k ; j = 1,2,...
n\]
dengan
\(\mu\): mean keseluruhan
\(\tau_i\): efek perlakuan ke-i
\(\varepsilon_{ij}\): sesatan yang
diasumsikan berdistribusi normal, dan variansi sama, \(\sigma^2\).
dimana
\[
F = \frac{
\frac{1}{k - 1} \sum_{j=1}^{k} \left[ n_j \left( \bar{X}_j -
\bar{X}_{..} \right)^2 \right]
}{
\frac{1}{N - k} \sum_{j=1}^{k} \left( n_j - 1 \right) s_j^2
}
\]
Uji di R:
anova_model <- aov(Profit ~ Product.Type, data = CoffeeChain)
summary(anova_model)
## Df Sum Sq Mean Sq F value Pr(>F)
## Product.Type 3 141680 47227 4.577 0.00333 **
## Residuals 4244 43791957 10319
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Untuk menguji normalitas residu kita bisa menggunakan Uji Shapiro-Wilk.
shapiro.test(residuals(anova_model))
##
## Shapiro-Wilk normality test
##
## data: residuals(anova_model)
## W = 0.8063, p-value < 2.2e-16
Untuk menguji ada tidaknya heterokedastisitas kita bisa menggunakan Uji Breusch-Pagan.
library(lmtest)
bptest(anova_model)
##
## studentized Breusch-Pagan test
##
## data: anova_model
## BP = 26.511, df = 3, p-value = 7.455e-06
Diketahui bahwa residu dari uji anova sebelumnya, berdistribusi tidak
normal dan mempunyai heterokedastisitas. Tetapi karena dataset
CoffeeChain mempunyai sampel yang banyak, kita bisa mengabaikan
ketidaknormalannya. Meski begitu, perlu dilakukan sesuatu untuk
mengatasi heterokedastisitasnya sehingga perlu dilakukan pendekatan Uji
One-Way Anova yang berbeda, yaitu Uji Welch’s Anova.
Welch’s Anova adalah alternatif dari uji ANOVA klasik (one-way ANOVA)
yang digunakan untuk membandingkan mean dari tiga atau lebih kelompok
independen tanpa mengasumsikan kesamaan varians (homoskedastisitas).
Hipotesis yang akan diuji sama dengan Uji One-Way Anova, sebagaimana
terlampir.
\(H_0\): \(\mu_1 = \mu_2 = ... =\mu_k\)
\(H_1\): \(\mu_1 \neq \mu_j\), untuk paling sedikit
sebuah \(i\), \(j\)
Model matematik Welch’s Anova : \[Y_{ij} =
\mu + \varepsilon_{ij} , i = 1,2,...,k ; j = 1,2,... n\]
dengan
\(\mu\): mean keseluruhan
\(\varepsilon_{ij}\): sesatan yang
diasumsikan berdistribusi normal, tetapi variansi tidak sama.
dimana
\[
W =
\frac{
\frac{1}{k - 1} \sum_{j=1}^{k} \left[ w_j \left( \bar{X}_j -
\bar{X}' \right)^2 \right]
}{
1 + \frac{2(k - 2)}{k^2 - 1} \sum_{j=1}^{k} \left[
\left( \frac{1}{n_j - 1} \right) \left( 1 - \frac{w_j}{w} \right)^2
\right]
}
\]
Uji di R:
welch_result <- oneway.test(Profit ~ Product.Type, data = CoffeeChain, var.equal = FALSE)
welch_result
##
## One-way analysis of means (not assuming equal variances)
##
## data: Profit and Product.Type
## F = 3.5917, num df = 3.0, denom df = 2301.7, p-value = 0.01314
Setelah dilakukan uji Welch’s Anova dan diketahui bahwa setidaknya ada satu tipe produk yang memiliki rata-rata profit lebih signfikan dibanding yang lain, kita bisa melanjutkan uji post-hoc menggunakan Uji Games-Howell. Tujuannya untuk mengetahui Membandingkan rata-rata antar kelompok.
library(rstatix)
library(dplyr)
CoffeeChain %>%
games_howell_test(Profit ~ Product.Type)
## # A tibble: 6 × 8
## .y. group1 group2 estimate conf.low conf.high p.adj p.adj.signif
## * <chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <chr>
## 1 Profit Coffee Espresso -12.4 -24.0 -0.745 0.032 *
## 2 Profit Coffee Herbal Tea -10.8 -22.4 0.755 0.077 ns
## 3 Profit Coffee Tea -15.5 -28.6 -2.47 0.012 *
## 4 Profit Espresso Herbal Tea 1.55 -8.06 11.2 0.976 ns
## 5 Profit Espresso Tea -3.16 -14.5 8.19 0.891 ns
## 6 Profit Herbal Tea Tea -4.71 -16.0 6.59 0.707 ns
Berdasarkan analisis data dari Coffee Chain yang mencakup 4.248 observasi penjualan berbagai jenis produk, dilakukan serangkaian uji statistik untuk mengetahui apakah terdapat perbedaan rata-rata profit antar jenis produk (Product Type).
Uji awal menggunakan One-Way ANOVA menunjukkan bahwa terdapat perbedaan signifikan rata-rata profit antar kelompok produk (P-Value = 0.00333). Namun, asumsi-asumsi dasar dari ANOVA—yakni normalitas dan homogenitas varians—tidak terpenuhi berdasarkan hasil Uji Shapiro-Wilk (P-Value<0.05) dan Uji Breusch-Pagan (P-Value<0.05). Karena pelanggaran terhadap asumsi homogenitas, digunakan alternatif Welch’s ANOVA, yang tetap menunjukkan adanya perbedaan signifikan antar rata-rata profit (P-Value= 0.01314).
Untuk mengetahui kelompok mana yang berbeda secara signifikan, dilakukan
uji Games-Howell sebagai post-hoc test. Hasil uji menunjukkan
bahwa:
1. Produk Coffee memiliki rata-rata profit yang secara signifikan lebih
rendah dibandingkan dengan produk Espresso (P= 0.032) dan Tea
(P= 0.012).
2. Tidak ditemukan perbedaan signifikan antara pasangan produk lainnya,
seperti antara Espresso dan Herbal Tea, atau Herbal Tea dan Tea.
Dengan demikian, dapat disimpulkan bahwa perbedaan profit antar jenis produk terutama disebabkan oleh performa produk Coffee yang lebih rendah dibandingkan produk lain seperti Espresso dan Tea. Temuan ini dapat menjadi dasar bagi pihak manajemen untuk meninjau strategi penjualan dan pengembangan produk Coffee secara lebih mendalam.
Delacre, M., Leys, C., Mora, Y. L., & Lakens, D. (2019). Taking parametric assumptions seriously: Arguments for the use of Welch’s F-test instead of the classical F-test in one-way ANOVA. International Review of Social Psychology, 32(1), 1–12. https://doi.org/10.5334/irsp.198