8 May 2025Dalam industri minuman yang kompetitif, memahami profitabilitas antar lini produk merupakan kunci dalam merancang strategi bisnis yang efektif. Analisis ini berfokus pada perbandingan performa finansial antar kategori produk pada jaringan Coffee Chain di wilayah Mexico, berdasarkan data historis yang mencakup variabel penjualan, biaya, dan profit.
Data yang digunakan menyediakan informasi lengkap mengenai transaksi penjualan berdasarkan lokasi geografis dan kategori produk. Fokus diarahkan pada dua lini produk, yaitu Beans dan Leaves, dengan variabel Profit sebagai indikator utama untuk menilai kinerja finansial masing-masing kategori.
Karena data profit cenderung tidak berdistribusi normal, digunakan pendekatan non-parametrik untuk melakukan perbandingan yang lebih andal. Hasil analisis ini bertujuan memberikan wawasan strategis mengenai lini produk yang paling menguntungkan di pasar Mexico, serta menjadi dasar dalam pengambilan keputusan bisnis dan pengembangan produk ke depan.
Sebelum melakukan analisis data, langkah pertama yang perlu dilakukan adalah mengaktifkan beberapa library di R yang diperlukan untuk membaca data.
Input data yang akan digunakan dalam pengujian ini
data <- read_excel("C:/Users/Asus/Documents/SIM/3. CM1 - Coffee Chain Datasets/3. CM1 - Coffee Chain Datasets.xlsx")Untuk menganalisis pada pasar Mexico data yang digunakan mencakup 168 observasi dengan dua variabel, yaitu Product Line yang terdiri dari kategori Beans dan Leaves, serta Profit yang menunjukkan nilai keuntungan atau kerugian.
library(dplyr)
library(tidyverse)
data_Mexico <- data %>%
filter(State == "New Mexico") %>%
select(`Product Line`, Profit)
data_Mexico## # A tibble: 168 × 2
## `Product Line` Profit
## <chr> <dbl>
## 1 Beans -10
## 2 Beans 9
## 3 Leaves 11
## 4 Leaves 4
## 5 Beans -8
## 6 Beans 26
## 7 Beans -39
## 8 Beans -7
## 9 Beans 8
## 10 Leaves 10
## # ℹ 158 more rows
Uji normalitas adalah prosedur statistik yang digunakan untuk menentukan apakah suatu dataset mengikuti distribusi normal. Uji ini penting karena banyak metode analisis statistik, seperti t-test dan ANOVA, mengasumsikan bahwa data berdistribusi normal. Beberapa metode yang umum digunakan untuk uji normalitas termasuk uji Shapiro-Wilk, Kolmogorov-Smirnov, dan analisis grafik seperti histogram dan plot Q-Q. Hasil dari uji ini membantu peneliti memutuskan langkah selanjutnya dalam analisis data.
##
## Shapiro-Wilk normality test
##
## data: data_Mexico$Profit
## W = 0.97028, p-value = 0.001138
Grafik ini menunjukkan bahwa sumbu x merepresentasikan nilai
teoritis distribusi normal standar, sedangkan sumbu y menunjukkan nilai
sampel profit yang diamati, di mana titik data umumnya mengikuti garis
linear di tengah, tetapi menyimpang di ujung, mengindikasikan distribusi
profit memiliki ekor yang lebih tebal dengan beberapa nilai ekstrem.
Uji Mann-Whitney, atau uji Wilcoxon rank-sum, adalah metode statistik non-parametrik yang digunakan untuk menentukan apakah dua kelompok independen berasal dari distribusi yang sama atau tidak. Berbeda dengan uji parametrik seperti t-test, uji ini tidak memerlukan asumsi normalitas, sehingga lebih tahan terhadap outlier. Prosesnya melibatkan penggabungan data dari kedua kelompok, memberikan peringkat, dan membandingkan jumlah peringkat untuk mengidentifikasi perbedaan. Nilai p yang dihasilkan menunjukkan probabilitas perbedaan yang diamati terjadi secara kebetulan, dengan nilai p kecil (umumnya <0.05) mengindikasikan perbedaan yang signifikan secara statistik.
Rumus Uji Mann-Whitney (Z-transformasi) yang digunakan untuk sampel besar \[ Z = \frac{U - \frac{n_1 \cdot n_2}{2}}{\sqrt{\frac{n_1 \cdot n_2 \cdot (n_1 + n_2 + 1)}{12}}} \]
Keterangan :
Uji Mann-Whitney
1. Hipotesis
\(H_0\) : Tidak ada perbedaan distribusi
profit antara kelompok Product Line atau median profit kedua kelompok
adalah sama.
\(H_1\) : Ada
perbedaan distribusi profit antara kelompok Product Line atau median
profit kedua kelompok tidak sama.
2. Taraf Signifikansi
(\(\alpha\)) \(\alpha = 0.05\)
3. Daerah
Kritis Tolak \(H_0\) jika
p-value \(< \alpha\)
4. Statistik Uji Untuk melakukan uji Wilcoxon di R
dapat menggunakan syntax wilcox.test()
##
## Wilcoxon rank sum test with continuity correction
##
## data: Profit by Product Line
## W = 2015, p-value = 0.002397
## alternative hypothesis: true location shift is not equal to 0
Setelah melakukan Uji Mann-Whitney, ditemukan bahwa terdapat perbedaan signifikan dalam profit antara kategori Product Line di Mexico.
data_Mexico %>%
group_by(`Product Line`) %>%
summarise(
Median_Profit = median(Profit),
Mean_Profit = mean(Profit),
Count = n()
)## # A tibble: 2 × 4
## `Product Line` Median_Profit Mean_Profit Count
## <chr> <dbl> <dbl> <int>
## 1 Beans -4 1.85 120
## 2 Leaves 11 12.0 48
Data menunjukkan perbedaan pada mean profit, dengan Beans menghasilkan rata-rata 1.85 dari 120 transaksi, sementara Leaves menghasilkan rata-rata yang jauh lebih tinggi yaitu 12.0 dari 48 transaksi. Perbedaan ini secara statistik signifikan berdasarkan uji Mann-Whitney, mengindikasikan bahwa produk Leaves secara konsisten menghasilkan profit yang lebih tinggi dibandingkan Beans, meskipun Beans memiliki volume transaksi yang lebih banyak. Hal ini menunjukkan bahwa meskipun produk Beans lebih sering terjual, produk Leaves memberikan kontribusi profit yang lebih besar per transaksi.
Median profit untuk produk Beans
## [1] -4
Hasil uji menunjukkan perbedaan signifikan antara produk Beans dan Leaves. Dari analisis median profit, terlihat bahwa produk Beans memiliki median profit negatif sebesar -4.
Median profit untuk produk Leaves
## [1] 11
Hasil uji menunjukkan perbedaan signifikan antara produk Beans dan Leaves. Dari analisis median profit, terlihat bahwa produk Leaves memiliki median profit positif sebesar 11.
ggplot(data_Mexico, aes(x = `Product Line`, y = Profit, fill = `Product Line`)) +
geom_boxplot() +
scale_fill_manual(values = c("Beans" = "pink", "Leaves" = "skyblue")) +
labs(title = "Perbandingan Profit: Beans vs Leaves di Mexico") +
theme_minimal()
Produk Beans (warna pink) menunjukkan distribusi profit yang lebih
rendah dan bervariasi, dengan median sekitar -2 hingga 0, interkuartil
range yang lebar, serta outlier negatif ekstrem yang mencerminkan
kerugian signifikan. Sebaliknya, produk Leaves (warna biru muda)
memiliki profit yang lebih tinggi dan stabil, dengan median sekitar
11–12, kotak interkuartil sempit di wilayah positif, serta tidak
menunjukkan nilai ekstrem. Perbedaan distribusi ini sejalan dengan hasil
uji Mann-Whitney yang menunjukkan bahwa Leaves memberikan profit yang
secara signifikan lebih tinggi dan konsisten dibanding Beans.
ggplot(data_Mexico, aes(x = Profit, fill = `Product Line`)) +
geom_histogram(binwidth = 10, color = "black", alpha = 0.7) +
scale_fill_manual(values = c("Beans" = "pink", "Leaves" = "skyblue")) +
facet_wrap(~ `Product Line`, scales = "free_y") +
labs(title = "Distribusi Profit per Product Line di Mexico",
x = "Profit",
y = "Frekuensi") +
theme_minimal()
Pada Histogram menunjukkan perbedaan mencolok antara produk Beans
dan Leaves. Produk Beans (warna pink) memiliki distribusi profit yang
relatif normal namun sedikit miring ke kiri, dengan sebaran lebar dari
nilai negatif hingga positif rendah dan frekuensi tertinggi di sekitar
0, mencerminkan banyaknya transaksi dengan profit rendah atau bahkan
kerugian konsisten dengan median profit negatif (-4). Sebaliknya, produk
Leaves (warna biru muda) menunjukkan distribusi sempit dan terpusat
sepenuhnya di area positif, dengan puncak frekuensi pada profit 10–15
dan tanpa adanya transaksi merugi. Meskipun Beans memiliki volume
transaksi lebih banyak, Leaves secara konsisten memberikan profit yang
lebih tinggi dan stabil.
Berdasarkan seluruh analisis data yang telah dilakukan, dapat disimpulkan bahwa: Terdapat perbedaan profitabilitas yang signifikan antara produk Beans dan Leaves di Mexico, yang dikonfirmasi melalui uji Mann-Whitney. Produk Leaves secara konsisten menunjukkan performa profit yang lebih unggul dibandingkan Beans dengan median profit sebesar 11, jauh di atas Beans yang memiliki median profit negatif (-4).
Dari visualisasi QQ-plot, terlihat bahwa distribusi profit secara keseluruhan cenderung mendekati distribusi normal pada bagian tengah, namun memiliki ekor yang lebih tebal (heavy tails) di kedua ujungnya, yang mengindikasikan adanya beberapa nilai ekstrem baik pada profit negatif maupun positif.
Boxplot menunjukkan bahwa Beans memiliki variabilitas profit yang lebih tinggi dengan beberapa outlier negatif yang ekstrem, sementara Leaves menampilkan distribusi profit yang lebih stabil dan seluruhnya berada di area positif. Hal ini menunjukkan Leaves merupakan produk dengan risiko kerugian lebih rendah.
Histogram semakin memperkuat temuan tersebut dengan memperlihatkan distribusi Beans yang menyebar dari nilai negatif hingga positif rendah, sedangkan distribusi Leaves terkonsentrasi pada nilai profit positif yang lebih tinggi tanpa adanya transaksi yang mengalami kerugian.
Meskipun Beans memiliki volume transaksi lebih banyak (120 transaksi dibandingkan 48 transaksi Leaves), produk Leaves terbukti memberikan kontribusi profit per transaksi yang jauh lebih besar dan lebih konsisten. Temuan ini memberikan implikasi strategis penting bagi perusahaan untuk mempertimbangkan fokus lebih besar pada pengembangan dan pemasaran produk Leaves guna mengoptimalkan profitabilitas di pasar Mexico.