Industri coffee chain telah menjadi salah satu sektor bisnis yang berkembang pesat dalam beberapa dekade terakhir. Coffee chain merupakan jaringan usaha yang mengelola dan mengoperasikan banyak kedai kopi dengan merek, standar pelayanan, serta kualitas produk yang seragam di berbagai lokasi.
Minuman berbasis kopi merupakan salah satu produk yang memiliki permintaan tinggi di berbagai wilayah, termasuk di negara bagian Texas, Amerika Serikat. Di antara beragam jenis produk kopi, dua yang paling populer dan sering dikonsumsi adalah coffee dan espresso. Meskipun keduanya berasal dari bahan dasar yang sama, perbedaan dalam metode penyajian, selera pasar, serta strategi penjualan dapat memengaruhi tingkat keuntungan atau profit yang dihasilkan.
Oleh karena itu, dilakukan analisis menggunakan uji Mann-Whitney untuk mengetahui apakah terdapat perbedaan signifikan dalam profit antara produk coffee dan espresso, khususnya di wilayah Texas yang merupakan pasar potensial. Analisis ini dilakukan untuk membantu pengambilan keputusan bisnis berbasis data, terutama dalam hal penentuan produk unggulan, alokasi sumber daya, dan strategi pemasaran di masa depan.
Uji Mann-Whitney (Wilcoxon rank-sum test) merupakan salah satu metode statistik non-parametrik yang digunakan untuk membandingkan dua kelompok independen. Uji ini berfungsi untuk menentukan apakah terdapat perbedaan yang signifikan dalam sebaran atau median antara dua populasi yang tidak berdistribusi normal atau ketika asumsi homogenitas varians tidak terpenuhi.
Syarat untuk uji Mann-Whitney tidak mengharuskan data berdistribusi normal maupun memiliki varians yang sama. Oleh karena itu, uji ini sangat cocok digunakan untuk data ordinal atau data interval yang tidak memenuhi asumsi parametrik. Uji ini bekerja dengan cara mengurutkan seluruh data dari kedua kelompok secara keseluruhan, kemudian menghitung jumlah peringkat (rank) dari masing-masing kelompok. Dari hasil tersebut, statistik uji dihitung dan dibandingkan dengan nilai kritis atau p-value untuk menentukan signifikansi perbedaan antar kelompok.
Rumus uji Mann-Whitney : \[U_1 = n_1 n_2 + \frac{n_2(n_2+1)}{2} - \sum R_2\] \[U_2 = n_1 n_2 + \frac{n_1(n_1+1)}{2} - \sum R_1\] \[U_{hitung} = min(U_1, U_2)\] Jika p-value < \(\alpha\) atau \(U_{hitung} < U_{(n_1,n_2,\alpha)}\), maka H₀ ditolak dan disimpulkan bahwa terdapat perbedaan signifikan antara kedua kelompok.
Uji normalitas bertujuan untuk memeriksa apakah data yang dimiliki memenuhi asumsi distribusi normal, baik secara keseluruhan maupun dalam kelompok tertentu. Jika data tidak terdistribusi normal, maka pendekatan non-parametrik dapat menjadi alternatif yang lebih tepat. Pendekatan utama untuk menguji kenormalan yang digunakan dalam artikel ini adalah pendekatan grafis dengan Q-Q Plot (Quantile-Quantile Plot) dan pendekatan statistik dengan Uji Shapiro-Wilk. Uji Shapiro-Wilk digunakan untuk sampel kecil hingga menengah (n < 50 atau n < 2000). Jika hasil uji normalitas menunjukkan p-value < \(\alpha\), maka dapat disimpulkan bahwa data tidak berdistribusi normal secara signifikan
library(readxl)
library(tidyverse)
library(ggplot2)
library(dplyr)
library(kableExtra)
library(car)
library(ggpubr)
library(flexdashboard)
library(DT)
Penjelasan fungsi dan kegunaan dari masing-masing package:
1. library(readxl) – membaca file Excel (.xlsx, .xls) ke
dalam R.
2. library(tidyverse) – kumpulan package penting untuk
manipulasi data, visualisasi, dan analisis.
3. library(ggplot2) – membuat visualisasi data (grafik
batang, garis, sebar, boxplot, dll.)
4. library(dplyr) – memanipulasi data secara efisien
(memfilter, memilih kolom, membuat kolom baru, dsb.).
5. library(kableExtra) – membuat tabel rapi dan menarik di
R Markdown atau HTML/PDF.
6. library(car) – menganalisis regresi dan uji asumsi
(misalnya uji normalitas, outlier, dll.)
7. library(ggpubr) – membuat grafik statistik yang lebih
mudah terutama untuk publikasi.
8. library(flexdashboard) – membuat dashboard interaktif
berbasis R Markdown.
9. library(DT) – membuat tabel interaktif di HTML R
Markdown.
Bagian ini digunakan untuk mengimpor data Excel ke dalam R, menyimpannya sebagai objek R, dan menampilkannya sebagai tabel interaktif.
X3_CM1_Coffee_Chain_Datasets <- read_excel("C:/Users/Asus/Documents/semester 4/sim/3. CM1 - Coffee Chain Datasets.xlsx")
View(X3_CM1_Coffee_Chain_Datasets)
data <- X3_CM1_Coffee_Chain_Datasets
datatable(data, options = list(pageLength = 10, scrollX = TRUE))
Pada bagian ini dilakukan filtering data dengan hanya memilih data dari State Texas dan produk Coffee atau Espresso, lalu menampilkan kolom Product Type dan Profit dalam bentuk tabel interaktif.
data_texas <- data %>%
filter(State == "Texas", `Product Type` %in% c("Coffee", "Espresso")) %>%
select(`Product Type`, Profit)
view(data_texas)
datatable(data_texas, options = list(pageLength = 10, scrollX = TRUE))
Pada bagian ini dilakukan uji normalitas terhadap data dengan menggunakan Shapiro-Wilk test. Uji ini digunakan untuk mengetahui apakah data menyebar secara normal, yang merupakan salah satu asumsi dalam banyak analisis statistik (misalnya uji-t, ANOVA, regresi linear).
shapiro.test(data_texas$Profit)
##
## Shapiro-Wilk normality test
##
## data: data_texas$Profit
## W = 0.91387, p-value = 1.079e-06
Output diatas menunjukkan hasil p-value = 1.079e-06 < \(\alpha\) = 0.05, artinya data tidak berdistribusi normal secara signifikan
Pada bagian ini dilakukan uji normalitas terhadap data dengan menggunakan visualisasi Q-Q Plot (Quantile-Quantile Plot) dari data profit untuk mengecek secara visual apakah data mengikuti distribusi normal. Pada grafik Q-Q plot, titik-titik hitam merepresentasikan observasi profit aktual, sedangkan garis diagonal menunjukkan distribusi normal teoritis. Jika data berdistribusi normal, maka titik-titik tersebut akan mengikuti garis diagonal secara konsisten.
ggqqplot(data_texas$Profit)
pada grafik yang ditampilkan diatas, terlihat bahwa beberapa titik
menyimpang dari garis tersebut, terutama pada bagian ekor. Pola ini
mengindikasikan bahwa data profit tidak mengikuti distribusi normal,
yang sejalan dengan hasil uji Shapiro-Wilk sebelumnya.
Setelah dilakukan uji normalitas, didapatkan hasil bahwa data tidak berdistribusi normal, maka dilakukan Uji Mann-Whitney (Wilcoxon Rank Sum Test) untuk membandingkan apakah terdapat perbedaan yang signifikan secara statistik antara profit produk coffee dan espresso di wilayah Texas.
wilcox.test(Profit ~ `Product Type`, data = data_texas)
##
## Wilcoxon rank sum test with continuity correction
##
## data: Profit by Product Type
## W = 2158, p-value = 0.02139
## alternative hypothesis: true location shift is not equal to 0
Setelah dilakukan Uji Mann-Whitney, didapatkan hasil bahwa terdapat perbedaan signifikan antara kedua kelompok. Maka pada bagian ini dilakukan uji median untuk mengetahui nilai dari masing-masing kelompok dan menyajikannya dalam bentuk tabel.
median_coffee <- median(data_texas$Profit[data_texas$`Product Type` == "Coffee"])
median_coffee
## [1] 132.5
median_espresso <- median(data_texas$Profit[data_texas$`Product Type` == "Espresso"])
median_espresso
## [1] 89.5
median_table <- data.frame(
`Product Type` = c("Coffee", "Espresso"),
`Median Profit` = c(median_coffee, median_espresso)
)
median_table %>%
kable() %>%
kable_styling(bootstrap_options = c("striped", "hover", "condensed"), full_width = FALSE, position = "center")
| Product.Type | Median.Profit |
|---|---|
| Coffee | 132.5 |
| Espresso | 89.5 |
Dari output diatas, diketahui bahwa Coffee memiliki median profit yang lebih tinggi daripada Espresso di Texas.
Bagian ini bertujuan untuk membuat visualisasi boxplot yang membandingkan distribusi profit antara dua jenis produk, yaitu Coffee dan Espresso, di negara bagian Texas. Visualisasi ini bermanfaat untuk memahami sebaran data profit masing-masing produk, termasuk median, rentang antar kuartil, serta potensi adanya outlier.
ggplot(data_texas, aes(x = `Product Type`, y = Profit, fill = `Product Type`)) +
geom_boxplot() +
labs(title = "Perbandingan Profit: Coffee vs Espresso di Texas") +
theme_minimal()
Dari output boxplot yang dihasilkan, terlihat bahwa produk Coffee memiliki median profit yang lebih tinggi dibandingkan dengan Espresso. Hal ini tampak dari garis horizontal tebal di dalam box (median) yang berada lebih tinggi pada Coffee. Selain itu, ukuran box untuk Coffee juga lebih besar, yang menunjukkan bahwa sebaran (variabilitas) profit Coffee lebih lebar dibandingkan Espresso. Garis memanjang dari masing-masing box juga memberikan gambaran rentang nilai profit yang dianggap masih dalam batas normal. Coffee memiliki garis atas yang lebih panjang, mengindikasikan adanya nilai profit tinggi yang tetap termasuk dalam kisaran normal. Jika terdapat titik-titik di luar garis, maka itu menunjukkan adanya outlier. Boxplot ini mendukung hasil analisis sebelumnya, yaitu Coffee cenderung memberikan profit yang lebih tinggi daripada Espresso di Texas.
Bagian ini bertujuan untuk menampilkan distribusi profit masing-masing jenis produk (Coffee dan Espresso) dalam bentuk histogram. Visualisasi ini berguna untuk memahami bagaimana sebaran nilai profit terbentuk pada kedua produk, serta untuk melihat apakah distribusinya simetris, menyebar luas, atau mengarah ke salah satu sisi.
ggplot(data_texas, aes(x = Profit, fill = `Product Type`)) +
geom_histogram(binwidth = 10, alpha = 0.6, position = "identity") +
labs(title = "Distribusi Profit per Produk", x = "Profit") +
theme_minimal()
Output yang dihasilkan adalah histogram tumpang tindih, di mana warna merah muda mewakili produk Coffee dan biru muda mewakili Espresso. Setiap batang mewakili jumlah observasi (count) pada rentang profit tertentu. Dari grafik ini terlihat bahwa distribusi profit Espresso cenderung berfokus pada kisaran profit yang lebih rendah, sementara Coffee memiliki distribusi yang lebih menyebar, bahkan hingga ke nilai profit yang tinggi di atas 200. Hal ini mengindikasikan bahwa produk Coffee memiliki variasi profit yang lebih besar dan potensi menghasilkan profit yang lebih tinggi dibandingkan Espresso.
Berdasarkan hasil analisis yang telah dilakukan, produk Coffee terbukti memiliki profit yang lebih tinggi secara median dibandingkan dengan produk Espresso di wilayah Texas. Ini menunjukkan bahwa Coffee memberikan kontribusi profit yang lebih besar, sehingga perusahaan dapat mempertimbangkan untuk meningkatkan promosi, memperluas ketersediaan stok, atau menambah variasi produk Coffee di wilayah tersebut guna memaksimalkan potensi keuntungan. Meskipun demikian, perbedaan profit antara kedua produk tergolong kecil, sehingga strategi optimalisasi terhadap produk Espresso juga tetap penting untuk dilakukan. Upaya ini diperlukan agar perusahaan tetap mampu mempertahankan daya saing dan menjangkau segmen pasar yang berbeda. Selain itu, disarankan untuk melakukan analisis lanjutan dengan mempertimbangkan faktor-faktor lain seperti lokasi outlet, waktu penjualan, serta strategi pemasaran yang diterapkan, guna memperoleh pemahaman yang lebih komprehensif dalam rangka meningkatkan profit secara keseluruhan.