Pendahuluan

Analisis ini bertujuan untuk memahami keuntungan (Profit) dari berbagai produk dalam dataset rantai kopi, dengan fokus pada:

  • Uji asumsi distribusi data
  • Perbandingan keuntungan antara kopi, teh herbal, dan teh
  • Analisis keuntungan kopi berdasarkan ukuran pasar

Dataset yang digunakan adalah:

“CM1 - Coffee Chain Datasets.xlsx”

Laporan ini terdiri dari tiga bab utama


Uji Asumsi

Sebelum melakukan analisis statistik, kita perlu memeriksa apakah data memenuhi asumsi normalitas dan homogenitas varians.

Uji Normalitas (Shapiro-Wilk Test)

Kita menggunakan Shapiro-Wilk Test untuk menguji normalitas distribusi Profit pada masing-masing kelompok produk.

Mengapa Menggunakan Shapiro-Wilk Test?

  • Sensitivitas Tinggi
    Shapiro-Wilk Test sangat sensitif dalam mendeteksi penyimpangan dari normalitas, terutama pada sampel kecil hingga sedang.
    Meskipun dataset memiliki 3.072 observasi, pembagian ke dalam tiga kelompok membuatnya tetap relevan.

  • Efektivitas pada Distribusi Non-Normal
    Test ini membandingkan distribusi data aktual dengan distribusi normal teoretis menggunakan statistik W,
    dan sangat efektif untuk analisis distribusi.

  • Penerapan per Kelompok
    Cocok untuk menguji normalitas tiap kelompok (Kopi, Teh Herbal, dan Teh) secara terpisah.

## [1] "Shapiro-Wilk Test untuk Kopi:"
## 
##  Shapiro-Wilk normality test
## 
## data:  coffee_data$Profit
## W = 0.7661, p-value < 2.2e-16
## [1] "Shapiro-Wilk Test untuk Teh Herbal:"
## 
##  Shapiro-Wilk normality test
## 
## data:  herbal_tea_data$Profit
## W = 0.86788, p-value < 2.2e-16
## [1] "Shapiro-Wilk Test untuk Teh:"
## 
##  Shapiro-Wilk normality test
## 
## data:  tea_data$Profit
## W = 0.73214, p-value < 2.2e-16

Shapiro-Wilk Test Hasil dan Interpretasi

Hasil uji Shapiro-Wilk untuk masing-masing kelompok produk adalah sebagai berikut:

  • Kopi: W = 0.7661, p-value < 2.2e-16
  • Teh Herbal: W = 0.8678, p-value < 2.2e-16
  • Teh: W = 0.73214, p-value < 2.2e-16

Interpretasi

Karena untuk semua kelompok produk nilai p-value < 0.05, maka kita menolak hipotesis nol yang menyatakan bahwa data berdistribusi normal.

Kesimpulan:
Distribusi Profit untuk semua kelompok produk (Kopi, Teh Herbal, dan Teh) tidak berdistribusi normal.


Histogram Distribusi Keuntungan per Produk

Analisis visual distribusi Profit untuk masing-masing produk dilakukan menggunakan histogram. Tujuan visualisasi ini adalah untuk mengamati bentuk distribusi, simetri, serta adanya kemungkinan outlier pada data keuntungan.

Interpretasi histogram

Coffee

Distribusi keuntungan pada produk Coffee menunjukkan kecenderungan nilai yang positif, dengan sebagian besar observasi berada di atas 0.
Distribusinya tampak miring ke kanan (right-skewed), yang mengindikasikan adanya beberapa transaksi dengan keuntungan yang sangat tinggi.
Hal ini mencerminkan bahwa secara umum, Coffee merupakan produk yang menghasilkan keuntungan.

Herbal Tea

Distribusi keuntungan pada Herbal Tea terlihat relatif simetris, meskipun terdapat beberapa outlier di kedua sisi distribusi.
Nilai keuntungan umumnya berkisar antara 0 hingga 150, menunjukkan stabilitas yang relatif baik dibanding dua produk lainnya.
Hal ini mengindikasikan bahwa performa Herbal Tea cukup konsisten, walau tidak selalu tinggi.

Tea

Berbeda dengan dua produk lainnya, Tea menunjukkan distribusi yang miring ke kiri (left-skewed).
Terdapat banyak nilai keuntungan negatif, menandakan bahwa sebagian besar transaksi mengalami kerugian.
Distribusi ini mencerminkan adanya risiko tinggi dalam penjualan produk Tea.



Scatter Plot Keuntungan vs Jenis Produk

Visualisasi berikut menggunakan scatter plot untuk memperlihatkan sebaran keuntungan (Profit) dari masing-masing jenis produk: Coffee, Herbal Tea, dan Tea.
Selain sebaran titik, ditampilkan juga titik merah besar yang merepresentasikan nilai rata-rata (mean) keuntungan setiap kelompok produk.

Interpretasi scatter plot

Coffee

Titik-titik pada produk Coffee tersebar luas, menunjukkan bahwa keuntungan bervariasi secara signifikan antar transaksi.
Terdapat beberapa nilai keuntungan yang sangat tinggi, menandakan potensi keuntungan besar.
Rata-rata keuntungan berada di atas nol, memperkuat kesimpulan sebelumnya bahwa Coffee merupakan produk yang menguntungkan secara umum.

Herbal Tea

Sebaran titik pada Herbal Tea tampak lebih rapat dan simetris, menandakan variasi keuntungan yang tidak sebesar Coffee.
Rata-rata keuntungan juga berada di atas nol, menunjukkan bahwa Herbal Tea memiliki kinerja yang cukup stabil dan menguntungkan.

Tea

Titik-titik pada produk Tea tersebar luas dengan dominasi nilai keuntungan negatif.
Rata-rata keuntungan produk ini berada sedikit di bawah rata-rata dua produk lainnya, dan mendekati nol.
Hal ini mengindikasikan bahwa Tea memiliki risiko kerugian yang lebih tinggi.


Uji Homogenitas Varians (Levene’s Test)

Sebelum melanjutkan ke analisis perbandingan mean antar kelompok, kita perlu memastikan apakah varians keuntungan antar produk homogen.
Untuk itu, digunakan Levene’s Test, yang lebih robust dibandingkan uji Bartlett ketika data tidak berdistribusi normal.

Alasan Penggunaan Levene’s Test

  • Tidak sensitif terhadap penyimpangan normalitas, sehingga cocok dengan data kita yang telah terbukti tidak normal.
  • Menguji apakah varians antar kelompok berbeda secara signifikan.
  • Lebih stabil ketika terdapat outlier dalam data.

## [1] "Levene's Test untuk Homogenitas Varians:"
## Levene's Test for Homogeneity of Variance (center = median)
##         Df F value   Pr(>F)   
## group    2  6.2587 0.001938 **
##       3069                    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Hasil dan Interpretasi Levene’s Test

Levene’s Test dilakukan untuk menguji apakah varians keuntungan (Profit) antar kelompok produk homogen.

Hasil Uji:

  • Df (group) = 2
  • Df (residual) = 3069
  • F value = 6.2587
  • p-value = 0.001938

Interpretasi:

Karena nilai p-value < 0.05, maka kita menolak hipotesis nol yang menyatakan bahwa varians keuntungan antar kelompok sama (homogen).
Artinya, terdapat perbedaan signifikan dalam varians keuntungan antara produk Coffee, Herbal Tea, dan Tea.


Analisis Keuntungan Produk: Kopi vs Teh dan Teh Herbal

Bab ini membandingkan keuntungan (Profit) dari tiga jenis produk — Kopi, Teh Herbal, dan Teh — menggunakan pendekatan non-parametrik, mengingat asumsi normalitas dan homogenitas varians tidak terpenuhi.

Statistik Deskriptif

Statistik ini akan membantu memahami tren umum dan persebaran keuntungan sebelum dilakukan pengujian lebih lanjut.

## [1] "Rata-rata Keuntungan Kopi: 70.72"
## [1] "Rata-rata Keuntungan Teh Herbal: 59.9"
## [1] "Rata-rata Keuntungan Teh: 55.19"


Q-Q Plot untuk Memeriksa Normalitas Keuntungan

Untuk melengkapi analisis uji normalitas secara statistik (Shapiro-Wilk Test), digunakan juga Q-Q Plot (Quantile-Quantile Plot) sebagai alat bantu visual untuk melihat sejauh mana distribusi keuntungan mendekati distribusi normal.

Q-Q Plot membandingkan kuantil data aktual dengan kuantil dari distribusi normal teoretis. Jika data berdistribusi normal, maka titik-titik akan membentuk garis lurus.

Interpretasi Q-Q Plot

Coffee

Titik-titik pada Q-Q Plot untuk Coffee tampak menyimpang secara signifikan dari garis lurus, terutama di bagian ekor atas dan bawah.
Hal ini menandakan adanya outlier dan distribusi yang memiliki ekor panjang (heavy-tailed), sehingga tidak memenuhi asumsi normalitas.
Distribusinya cenderung right-skewed.

Herbal Tea

Q-Q Plot untuk Herbal Tea menunjukkan penyimpangan yang lebih kecil dibanding dua produk lainnya.
Titik-titik masih menyimpang di ujung, tetapi sebagian besar data mengikuti garis lurus.
Ini menunjukkan bahwa distribusi keuntungan Herbal Tea mendekati normal, meskipun tidak sempurna.

Tea

Pada produk Tea, penyimpangan sangat jelas terutama di kuantil bawah, yang menunjukkan adanya kerugian ekstrem (outlier negatif).
Distribusi ini jauh dari normal dan menunjukkan skewness ke kiri (left-skewed), yang konsisten dengan hasil histogram sebelumnya.


## [1] "Kruskal-Wallis Test:"
## 
##  Kruskal-Wallis rank sum test
## 
## data:  Profit by Product
## Kruskal-Wallis chi-squared = 0.51032, df = 2, p-value = 0.7748

Uji Kruskal-Wallis

Uji Kruskal-Wallis digunakan untuk membandingkan median Profit antara tiga kelompok produk: Kopi, Teh Herbal, dan Teh, karena asumsi normalitas dan homogenitas varians tidak terpenuhi.

Hasil Uji

  • p-value = 0.7748

Interpretasi

Karena nilai p-value > 0.05, maka kita gagal menolak hipotesis nol, yang menyatakan bahwa median keuntungan antar kelompok produk tidak berbeda secara signifikan.


Analisis Keuntungan Produk Kopi Berdasarkan Ukuran Pasar

Bab ini menganalisis bagaimana ukuran pasar (Market Size) memengaruhi keuntungan (Profit) dari produk Kopi.karena dari analisis sebelumnya kopilah yang mempunyai keuntungan paling tinggi
Karena data sebelumnya tidak berdistribusi normal, digunakan kembali pendekatan non-parametrik, yaitu Uji Kruskal-Wallis, untuk menguji apakah terdapat perbedaan signifikan dalam keuntungan kopi berdasarkan ukuran pasar: Small, Medium, dan Large.

Statistik Deskriptif

Statistik ini memberikan gambaran awal tentang bagaimana keuntungan kopi tersebar pada masing-masing ukuran pasar, serta mengidentifikasi potensi pola atau ketimpangan.

Statistik Deskriptif
Market Size Mean_Profit Median_Profit SD_Profit
Major Market 130.2206 105 170.93121
Small Market 33.2608 30 31.77716

Interpretasi Statistik Deskriptif Keuntungan Kopi

  • Rata-rata Profit (Mean Profit): Keuntungan rata-rata di pasar besar sebesar 130.22, jauh lebih tinggi dibandingkan pasar kecil sebesar 33.26. Ini menunjukkan bahwa secara umum, kopi lebih menguntungkan di pasar besar.

  • Median Profit:
    Median keuntungan di pasar besar adalah 105, sedangkan di pasar kecil hanya 30. Artinya, separuh transaksi kopi di pasar besar menghasilkan profit lebih dari 105, memperkuat kesimpulan bahwa distribusi keuntungan di pasar besar lebih tinggi secara menyeluruh.

  • Standar Deviasi (SD Profit):
    Variasi keuntungan jauh lebih besar di pasar besar (SD = 170.93) dibanding pasar kecil (SD = 31.78). Hal ini menandakan bahwa selain potensi keuntungan yang lebih tinggi, risiko fluktuasi keuntungan juga lebih besar di pasar besar.


## [1] "Kruskal-Wallis Test untuk Kopi:"
## 
##  Kruskal-Wallis rank sum test
## 
## data:  Profit by Market Size
## Kruskal-Wallis chi-squared = 178.26, df = 1, p-value < 2.2e-16

Hasil dan Interpretasi Uji Kruskal-Wallis (Ukuran Pasar untuk Produk Kopi)

Uji Kruskal-Wallis dilakukan untuk menguji apakah terdapat perbedaan keuntungan produk Kopi berdasarkan Market Size (Small, Medium, Large).

Hasil Uji

  • Kruskal-Wallis chi-squared = 178.26
  • df = 1
  • p-value < 2.2e-16

Interpretasi

Karena nilai p-value < 0.05, maka kita menolak hipotesis nol.
Artinya, terdapat perbedaan yang sangat signifikan dalam Profit kopi berdasarkan Market Size.


Ini menunjukan bagaimana pergerkan profit kopi dari waktu ke waktu