Analisis ini bertujuan untuk memahami keuntungan (Profit) dari berbagai produk dalam dataset rantai kopi, dengan fokus pada:
Dataset yang digunakan adalah:
“CM1 - Coffee Chain Datasets.xlsx”
Laporan ini terdiri dari tiga bab utama
Sebelum melakukan analisis statistik, kita perlu memeriksa apakah data memenuhi asumsi normalitas dan homogenitas varians.
Kita menggunakan Shapiro-Wilk Test untuk menguji normalitas distribusi Profit pada masing-masing kelompok produk.
Sensitivitas Tinggi
Shapiro-Wilk Test sangat sensitif dalam mendeteksi penyimpangan dari
normalitas, terutama pada sampel kecil hingga sedang.
Meskipun dataset memiliki 3.072 observasi, pembagian ke dalam tiga
kelompok membuatnya tetap relevan.
Efektivitas pada Distribusi Non-Normal
Test ini membandingkan distribusi data aktual dengan distribusi normal
teoretis menggunakan statistik W,
dan sangat efektif untuk analisis distribusi.
Penerapan per Kelompok
Cocok untuk menguji normalitas tiap kelompok (Kopi,
Teh Herbal, dan Teh) secara
terpisah.
## [1] "Shapiro-Wilk Test untuk Kopi:"
##
## Shapiro-Wilk normality test
##
## data: coffee_data$Profit
## W = 0.7661, p-value < 2.2e-16
## [1] "Shapiro-Wilk Test untuk Teh Herbal:"
##
## Shapiro-Wilk normality test
##
## data: herbal_tea_data$Profit
## W = 0.86788, p-value < 2.2e-16
## [1] "Shapiro-Wilk Test untuk Teh:"
##
## Shapiro-Wilk normality test
##
## data: tea_data$Profit
## W = 0.73214, p-value < 2.2e-16
Hasil uji Shapiro-Wilk untuk masing-masing kelompok produk adalah sebagai berikut:
Interpretasi
Karena untuk semua kelompok produk nilai p-value < 0.05, maka kita menolak hipotesis nol yang menyatakan bahwa data berdistribusi normal.
Kesimpulan:
Distribusi Profit untuk semua kelompok produk (Kopi, Teh Herbal, dan Teh) tidak berdistribusi normal.
Analisis visual distribusi Profit untuk masing-masing produk dilakukan menggunakan histogram. Tujuan visualisasi ini adalah untuk mengamati bentuk distribusi, simetri, serta adanya kemungkinan outlier pada data keuntungan.
Distribusi keuntungan pada produk Coffee menunjukkan kecenderungan
nilai yang positif, dengan sebagian besar observasi berada di atas
0.
Distribusinya tampak miring ke kanan (right-skewed), yang
mengindikasikan adanya beberapa transaksi dengan keuntungan yang sangat
tinggi.
Hal ini mencerminkan bahwa secara umum, Coffee merupakan produk yang
menghasilkan keuntungan.
Distribusi keuntungan pada Herbal Tea terlihat relatif simetris,
meskipun terdapat beberapa outlier di kedua sisi
distribusi.
Nilai keuntungan umumnya berkisar antara 0 hingga 150, menunjukkan
stabilitas yang relatif baik dibanding dua produk lainnya.
Hal ini mengindikasikan bahwa performa Herbal Tea cukup konsisten, walau
tidak selalu tinggi.
Berbeda dengan dua produk lainnya, Tea menunjukkan distribusi yang
miring ke kiri (left-skewed).
Terdapat banyak nilai keuntungan negatif, menandakan bahwa sebagian
besar transaksi mengalami kerugian.
Distribusi ini mencerminkan adanya risiko tinggi dalam penjualan produk
Tea.
Visualisasi berikut menggunakan scatter plot untuk memperlihatkan
sebaran keuntungan (Profit) dari masing-masing jenis produk:
Coffee, Herbal Tea, dan Tea.
Selain sebaran titik, ditampilkan juga titik merah besar yang
merepresentasikan nilai rata-rata (mean) keuntungan setiap kelompok
produk.
Titik-titik pada produk Coffee tersebar luas, menunjukkan bahwa
keuntungan bervariasi secara signifikan antar transaksi.
Terdapat beberapa nilai keuntungan yang sangat tinggi, menandakan
potensi keuntungan besar.
Rata-rata keuntungan berada di atas nol, memperkuat kesimpulan
sebelumnya bahwa Coffee merupakan produk yang menguntungkan secara
umum.
Sebaran titik pada Herbal Tea tampak lebih rapat dan simetris,
menandakan variasi keuntungan yang tidak sebesar Coffee.
Rata-rata keuntungan juga berada di atas nol, menunjukkan bahwa Herbal
Tea memiliki kinerja yang cukup stabil dan menguntungkan.
Titik-titik pada produk Tea tersebar luas dengan dominasi nilai
keuntungan negatif.
Rata-rata keuntungan produk ini berada sedikit di bawah rata-rata dua
produk lainnya, dan mendekati nol.
Hal ini mengindikasikan bahwa Tea memiliki risiko kerugian yang lebih
tinggi.
Sebelum melanjutkan ke analisis perbandingan mean antar kelompok,
kita perlu memastikan apakah varians keuntungan antar produk
homogen.
Untuk itu, digunakan Levene’s Test, yang lebih robust
dibandingkan uji Bartlett ketika data tidak berdistribusi normal.
## [1] "Levene's Test untuk Homogenitas Varians:"
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 2 6.2587 0.001938 **
## 3069
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Levene’s Test dilakukan untuk menguji apakah varians keuntungan (Profit) antar kelompok produk homogen.
Karena nilai p-value < 0.05, maka kita menolak
hipotesis nol yang menyatakan bahwa varians keuntungan antar kelompok
sama (homogen).
Artinya, terdapat perbedaan signifikan dalam varians keuntungan antara
produk Coffee, Herbal Tea, dan Tea.
Bab ini membandingkan keuntungan (Profit) dari tiga jenis produk — Kopi, Teh Herbal, dan Teh — menggunakan pendekatan non-parametrik, mengingat asumsi normalitas dan homogenitas varians tidak terpenuhi.
Statistik ini akan membantu memahami tren umum dan persebaran keuntungan sebelum dilakukan pengujian lebih lanjut.
## [1] "Rata-rata Keuntungan Kopi: 70.72"
## [1] "Rata-rata Keuntungan Teh Herbal: 59.9"
## [1] "Rata-rata Keuntungan Teh: 55.19"
Untuk melengkapi analisis uji normalitas secara statistik (Shapiro-Wilk Test), digunakan juga Q-Q Plot (Quantile-Quantile Plot) sebagai alat bantu visual untuk melihat sejauh mana distribusi keuntungan mendekati distribusi normal.
Q-Q Plot membandingkan kuantil data aktual dengan kuantil dari distribusi normal teoretis. Jika data berdistribusi normal, maka titik-titik akan membentuk garis lurus.
Titik-titik pada Q-Q Plot untuk Coffee tampak menyimpang secara
signifikan dari garis lurus, terutama di bagian ekor atas dan
bawah.
Hal ini menandakan adanya outlier dan distribusi yang memiliki ekor
panjang (heavy-tailed), sehingga tidak memenuhi asumsi
normalitas.
Distribusinya cenderung right-skewed.
Q-Q Plot untuk Herbal Tea menunjukkan penyimpangan yang lebih kecil
dibanding dua produk lainnya.
Titik-titik masih menyimpang di ujung, tetapi sebagian besar data
mengikuti garis lurus.
Ini menunjukkan bahwa distribusi keuntungan Herbal Tea mendekati normal,
meskipun tidak sempurna.
Pada produk Tea, penyimpangan sangat jelas terutama di kuantil bawah,
yang menunjukkan adanya kerugian ekstrem (outlier negatif).
Distribusi ini jauh dari normal dan menunjukkan skewness ke kiri
(left-skewed), yang konsisten dengan hasil histogram
sebelumnya.
## [1] "Kruskal-Wallis Test:"
##
## Kruskal-Wallis rank sum test
##
## data: Profit by Product
## Kruskal-Wallis chi-squared = 0.51032, df = 2, p-value = 0.7748
Uji Kruskal-Wallis digunakan untuk membandingkan median Profit antara tiga kelompok produk: Kopi, Teh Herbal, dan Teh, karena asumsi normalitas dan homogenitas varians tidak terpenuhi.
Karena nilai p-value > 0.05, maka kita gagal menolak hipotesis nol, yang menyatakan bahwa median keuntungan antar kelompok produk tidak berbeda secara signifikan.
Bab ini menganalisis bagaimana ukuran pasar (Market Size) memengaruhi
keuntungan (Profit) dari produk Kopi.karena dari analisis sebelumnya
kopilah yang mempunyai keuntungan paling tinggi
Karena data sebelumnya tidak berdistribusi normal, digunakan kembali
pendekatan non-parametrik, yaitu Uji Kruskal-Wallis, untuk menguji
apakah terdapat perbedaan signifikan dalam keuntungan kopi berdasarkan
ukuran pasar: Small, Medium, dan Large.
Statistik ini memberikan gambaran awal tentang bagaimana keuntungan kopi tersebar pada masing-masing ukuran pasar, serta mengidentifikasi potensi pola atau ketimpangan.
| Market Size | Mean_Profit | Median_Profit | SD_Profit |
|---|---|---|---|
| Major Market | 130.2206 | 105 | 170.93121 |
| Small Market | 33.2608 | 30 | 31.77716 |
Rata-rata Profit (Mean Profit): Keuntungan rata-rata di pasar besar sebesar 130.22, jauh lebih tinggi dibandingkan pasar kecil sebesar 33.26. Ini menunjukkan bahwa secara umum, kopi lebih menguntungkan di pasar besar.
Median Profit:
Median keuntungan di pasar besar adalah 105, sedangkan di pasar kecil
hanya 30. Artinya, separuh transaksi kopi di pasar besar menghasilkan
profit lebih dari 105, memperkuat kesimpulan bahwa distribusi keuntungan
di pasar besar lebih tinggi secara menyeluruh.
Standar Deviasi (SD Profit):
Variasi keuntungan jauh lebih besar di pasar besar (SD = 170.93)
dibanding pasar kecil (SD = 31.78). Hal ini menandakan bahwa selain
potensi keuntungan yang lebih tinggi, risiko fluktuasi keuntungan juga
lebih besar di pasar besar.
## [1] "Kruskal-Wallis Test untuk Kopi:"
##
## Kruskal-Wallis rank sum test
##
## data: Profit by Market Size
## Kruskal-Wallis chi-squared = 178.26, df = 1, p-value < 2.2e-16
Uji Kruskal-Wallis dilakukan untuk menguji apakah terdapat perbedaan keuntungan produk Kopi berdasarkan Market Size (Small, Medium, Large).
Karena nilai p-value < 0.05, maka kita
menolak hipotesis nol.
Artinya, terdapat perbedaan yang sangat signifikan dalam Profit
kopi berdasarkan Market Size.
Ini menunjukan bagaimana pergerkan profit kopi dari waktu ke waktu