Industri minuman berbasis kopi dan teh merupakan dua segmen pasar yang terus berkembang secara bersamaan. Dalam konteks bisnis retail minuman, pemahaman mendalam mengenai profitabilitas masing-masing kategori produk menjadi krusial bagi produsen dalam menentukan strategi alokasi sumber daya dan perencanaan anggaran yang tepat.
Penelitian ini bertujuan untuk membandingkan profitabilitas produk kopi dan teh secara statistik menggunakan Coffee Chain Dataset periode 2012–2013. Analisis tidak hanya dilakukan secara deskriptif, tetapi juga diperkuat dengan uji statistik inferensial untuk memastikan bahwa temuan yang dihasilkan bukan sekadar kebetulan, melainkan dapat dipertanggungjawabkan secara ilmiah.
Analisis dalam penelitian ini dilakukan menggunakan R dengan pendekatan deskriptif dan inferensial. Tahap awal berupa eksplorasi data (EDA) untuk memahami karakteristik dan distribusi profit tiap kategori produk.
Selanjutnya dilakukan uji normalitas Shapiro-Wilk yang menunjukkan data tidak berdistribusi normal, sehingga digunakan uji Mann-Whitney U untuk membandingkan profit kopi dan teh. Selain itu, dilakukan analisis korelasi Pearson untuk melihat hubungan antara biaya pemasaran dan profit.
Analisis juga mencakup ANOVA dua arah untuk menguji pengaruh wilayah dan kategori produk, dilanjutkan dengan uji Tukey HSD. Sebagai pelengkap, dilakukan analisis pola musiman, performa produk, dan evaluasi budget variance guna memberikan gambaran yang lebih komprehensif.
Pada tahap ini dilakukan pemahaman awal terhadap dataset yang digunakan, meliputi jumlah observasi, jumlah variabel, serta struktur data. Hal ini penting untuk memastikan data siap dianalisis dan tidak terdapat kesalahan struktur.
library(dplyr)
library(ggplot2)
library(readxl)
data = read_xlsx("C:/Users/Arida Fauziyah/Downloads/Coffee Chain Datasets.xlsx")
nrow(data)
## [1] 4248
ncol(data)
## [1] 20
str(data)
## tibble [4,248 × 20] (S3: tbl_df/tbl/data.frame)
## $ Area Code : num [1:4248] 719 970 970 303 303 720 970 719 970 719 ...
## $ Date : POSIXct[1:4248], format: "2012-01-01" "2012-01-01" ...
## $ Market : chr [1:4248] "Central" "Central" "Central" "Central" ...
## $ Market Size : chr [1:4248] "Major Market" "Major Market" "Major Market" "Major Market" ...
## $ Product : chr [1:4248] "Amaretto" "Colombian" "Decaf Irish Cream" "Green Tea" ...
## $ Product Line : chr [1:4248] "Beans" "Beans" "Beans" "Leaves" ...
## $ Product Type : chr [1:4248] "Coffee" "Coffee" "Coffee" "Tea" ...
## $ State : chr [1:4248] "Colorado" "Colorado" "Colorado" "Colorado" ...
## $ Type : chr [1:4248] "Regular" "Regular" "Decaf" "Regular" ...
## $ Budget COGS : num [1:4248] 90 80 100 30 60 80 140 50 50 40 ...
## $ Budget Margin : num [1:4248] 130 110 140 50 90 130 160 80 70 70 ...
## $ Budget Profit : num [1:4248] 100 80 110 30 70 80 110 20 40 20 ...
## $ Budget Sales : num [1:4248] 220 190 240 80 150 210 300 130 120 110 ...
## $ COGS : num [1:4248] 89 83 95 44 54 72 170 63 60 58 ...
## $ Inventory : num [1:4248] 777 623 821 623 456 ...
## $ Margin : num [1:4248] 130 107 139 56 80 108 171 87 80 72 ...
## $ Marketing : num [1:4248] 24 27 26 14 15 23 47 57 19 22 ...
## $ Profit : num [1:4248] 94 68 101 30 54 53 99 0 33 17 ...
## $ Sales : num [1:4248] 219 190 234 100 134 180 341 150 140 130 ...
## $ Total Expenses: num [1:4248] 36 39 38 26 26 55 72 87 47 55 ...
Berdasarkan hasil output, dataset terdiri dari 4.248 observasi dengan 20 variabel yang mencakup informasi terkait wilayah, waktu, kategori produk, serta komponen biaya dan profit. Struktur data berbentuk tibble yang menunjukkan bahwa data telah siap untuk dianalisis lebih lanjut.
Sebelum masuk ke analisis inferensial, dilakukan eksplorasi awal untuk memahami karakteristik data.
colSums(is.na(data))
## Area Code Date Market Market Size Product
## 0 0 0 0 0
## Product Line Product Type State Type Budget COGS
## 0 0 0 0 0
## Budget Margin Budget Profit Budget Sales COGS Inventory
## 0 0 0 0 0
## Margin Marketing Profit Sales Total Expenses
## 0 0 0 0 0
Berdasarkan hasil pengecekan data, tidak ditemukan nilai yang hilang (missing value) pada seluruh kolom dalam dataset.
data %>%
group_by(Product) %>%
summarise(total = sum(Sales)) %>%
ggplot(aes(x = reorder(Product, total), y = total)) +
geom_col() +
coord_flip()
Berdasarkan grafik, produk Colombian memiliki total penjualan tertinggi,
diikuti oleh Lemon dan Caffe Mocha. Sementara itu, produk seperti
Regular Espresso, Amaretto, dan Green Tea memiliki total penjualan
paling rendah.
# Profit bulanan keseluruhan
data %>%
mutate(YearMonth = format(Date, "%Y-%m")) %>%
group_by(YearMonth) %>%
summarise(Total_Profit = sum(Profit)) %>%
ggplot(aes(x = YearMonth, y = Total_Profit, group = 1)) +
geom_line(color = "steelblue", size = 1.2) +
geom_point(color = "steelblue", size = 2.5) +
labs(
title = "Profit Bulanan Keseluruhan",
x = "Bulan",
y = "Total Profit"
) +
theme_minimal() +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
# Sales bulanan keseluruhan
data %>%
mutate(YearMonth = format(Date, "%Y-%m")) %>%
group_by(YearMonth) %>%
summarise(Total_Sales = sum(Sales)) %>%
ggplot(aes(x = YearMonth, y = Total_Sales, group = 1)) +
geom_line(color = "darkgreen", size = 1.2) +
geom_point(color = "darkgreen", size = 2.5) +
labs(
title = "Sales Bulanan Keseluruhan",
x = "Bulan",
y = "Total Sales"
) +
theme_minimal() +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
Secara keseluruhan, data menunjukkan tren profit yang meningkat dari
tahun 2012 ke 2013, dengan lonjakan yang cukup signifikan pada awal
2013. Keempat wilayah menunjukkan pola pergerakan profit yang relatif
konsisten, di mana wilayah Central secara konsisten mencatatkan profit
tertinggi dibandingkan wilayah lainnya.
Eksplorasi awal juga mengungkap adanya anomali menarik, yaitu pola penjualan (Sales) yang tidak selalu seiring dengan pergerakan profit. Hal ini mengindikasikan adanya perbedaan struktur biaya antar periode yang perlu ditelaah lebih lanjut, dan menjadi salah satu motivasi dilakukannya analisis yang lebih mendalam pada penelitian ini.
Analisis deskriptif dilakukan untuk memberikan gambaran umum mengenai distribusi profit pada produk kopi dan teh.
# Kategorisasi kopi vs teh
data <- data %>%
mutate(Kategori = ifelse(`Product Type` %in% c("Coffee", "Espresso"),
"Kopi", "Teh"))
kopi <- data %>% filter(Kategori == "Kopi")
teh <- data %>% filter(Kategori == "Teh")
# Ringkasan statistik untuk profit
data %>%
group_by(Kategori) %>%
summarise(
Total_Profit = sum(Profit),
Rata_Profit = mean(Profit),
Median_Profit = median(Profit),
SD_Profit = sd(Profit),
Total_Sales = sum(Sales),
Profit_Margin = sum(Profit) / sum(Sales) * 100,
Budget_Profit = sum(`Budget Profit`),
Budget_Attain = sum(Profit) / sum(`Budget Profit`) * 100
)
## # A tibble: 2 × 9
## Kategori Total_Profit Rata_Profit Median_Profit SD_Profit Total_Sales
## <chr> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 Kopi 143303 64.2 40 105. 439824
## 2 Teh 116240 57.7 42 97.4 379987
## # ℹ 3 more variables: Profit_Margin <dbl>, Budget_Profit <dbl>,
## # Budget_Attain <dbl>
Hasil menunjukkan bahwa terdapat perbedaan rata-rata profit antara produk kopi dan teh pada data tahun 2012-2013. Produk kopi cenderung memiliki nilai profit yang lebih tinggi dibandingkan teh, meskipun terdapat variasi pada masing-masing kategori
Analisis ini dilakukan untuk melihat performa tiap produk berdasarkan total profit, penjualan, dan margin pada kategori kopi dan teh.
# Top produk per kategori
data %>%
group_by(Kategori, Product) %>%
summarise(
Total_Profit = sum(Profit),
Total_Sales = sum(Sales),
Margin = sum(Profit) / sum(Sales) * 100
) %>%
arrange(Kategori, desc(Total_Profit)) %>%
ggplot(aes(x = reorder(Product, Total_Profit),
y = Total_Profit, fill = Kategori)) +
geom_bar(stat = "identity") +
coord_flip() +
facet_wrap(~Kategori, scales = "free_y") +
labs(title = "Performa Profit per Produk: Kopi vs Teh",
x = "Produk", y = "Total Profit") +
theme_minimal()
Pada kategori kopi, produk Colombian mendominasi dengan total profit
tertinggi sebesar 55.804, jauh melampaui produk lainnya seperti Decaf
Espresso (29.502) dan Caffe Mocha (17.678). Konsentrasi profit yang
sangat tinggi pada satu produk ini mengindikasikan adanya risiko
ketergantungan yang perlu diwaspadai oleh perusahaan. Sebaliknya,
distribusi profit pada kategori teh jauh lebih merata. Tiga produk
teratas yaitu Lemon (29.869), Darjeeling (29.053), dan Chamomile
(27.231) menunjukkan selisih yang tidak terlalu jauh, mencerminkan
portofolio produk teh yang lebih seimbang dan tidak bergantung pada satu
produk saja. Pola ini membuat kategori teh lebih resilient terhadap
risiko penurunan performa produk tunggal.
Analisis ini bertujuan untuk melihat perbandingan proporsi total profit antara kategori kopi dan teh dalam bentuk persentase.
data %>%
group_by(Kategori) %>%
summarise(Total_Profit = sum(Profit), .groups = "drop") %>%
mutate(
Persentase = Total_Profit / sum(Total_Profit) * 100,
Label = paste0(Kategori, "\n", round(Persentase, 1), "%")
) %>%
ggplot(aes(x = "", y = Total_Profit, fill = Kategori)) +
geom_bar(stat = "identity", width = 1) +
coord_polar("y") +
geom_text(aes(label = Label),
position = position_stack(vjust = 0.5), size = 4) +
labs(title = "Proporsi Total Profit: Kopi vs Teh") +
theme_void() +
theme(legend.position = "none")
Dari grafik proporsi di atas terlihat bahwa kopi menyumbang 55,2% dari
total profit perusahaan sementara teh berkontribusi 44,8%. Selisih yang
tidak terlalu besar ini mengindikasikan bahwa kedua kategori memiliki
kontribusi yang relatif seimbang, dan menjadi motivasi untuk menguji
lebih lanjut apakah perbedaan tersebut signifikan secara statistik.
Bagian ini menyajikan pergerakan profit bulanan secara terpisah antara kategori kopi dan teh untuk melihat perbandingan tren keduanya dari waktu ke waktu.
data %>%
mutate(YearMonth = format(Date, "%Y-%m")) %>%
group_by(YearMonth, Kategori) %>%
summarise(Total_Profit = sum(Profit), .groups = "drop") %>%
ggplot(aes(x = YearMonth, y = Total_Profit,
color = Kategori, group = Kategori)) +
geom_line(size = 1.2) +
geom_point(size = 2.5) +
labs(title = "Tren Profit Bulanan: Kopi vs Teh",
x = "Bulan", y = "Total Profit") +
theme_minimal() +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
Grafik di atas memperlihatkan pergerakan profit bulanan kopi dan teh
secara berdampingan selama periode Januari 2012 hingga Desember 2013.
Kopi secara konsisten berada di atas teh di hampir setiap bulan, namun
jarak antara keduanya tidak terlalu jauh. Kedua kategori menunjukkan
tren yang bergerak beriringan, terutama terlihat pada lonjakan yang
terjadi secara bersamaan di awal 2013.
Sebelum melakukan uji beda, terlebih dahulu dilakukan uji normalitas Shapiro-Wilk pada data profit kedua kategori.
shapiro.test(kopi$Profit)
##
## Shapiro-Wilk normality test
##
## data: kopi$Profit
## W = 0.78677, p-value < 2.2e-16
shapiro.test(teh$Profit)
##
## Shapiro-Wilk normality test
##
## data: teh$Profit
## W = 0.79419, p-value < 2.2e-16
Hasil uji menunjukkan bahwa data profit kopi menghasilkan nilai W = 0,787 dengan p-value < 2,2e-16, sedangkan data profit teh menghasilkan nilai W = 0,794 dengan p-value < 2,2e-16. Karena kedua p-value jauh di bawah taraf signifikansi 0,05, maka H0 ditolak dan disimpulkan bahwa data profit kopi maupun teh tidak berdistribusi normal. Oleh karena itu, uji beda yang digunakan adalah uji non-parametrik Mann-Whitney U sebagai alternatif yang lebih tepat dibandingkan Independent Sample t-test.
# Ganti t-test dengan Mann-Whitney U
wilcox.test(kopi$Profit, teh$Profit, alternative = "two.sided")
##
## Wilcoxon rank sum test with continuity correction
##
## data: kopi$Profit and teh$Profit
## W = 2200291, p-value = 0.2143
## alternative hypothesis: true location shift is not equal to 0
Hasil uji Mann-Whitney U menunjukkan nilai W = 2.200.291 dengan p-value = 0,214. Karena p-value > 0,05, maka H0 gagal ditolak, yang berarti secara statistik tidak terdapat perbedaan yang signifikan antara profit kopi dan teh. Temuan ini menarik untuk dicermati. Meskipun secara deskriptif kopi tampak lebih unggul dengan selisih total profit sebesar 27.063, uji inferensial membuktikan bahwa perbedaan tersebut tidak cukup kuat untuk dinyatakan signifikan secara statistik. Dengan kata lain, teh adalah pesaing yang setara dengan kopi dalam hal profitabilitas, dan tidak semestinya diperlakukan sebagai produk kelas dua dalam strategi bisnis perusahaan.
Bagian ini mengkaji hubungan antara biaya pemasaran dan profit pada masing-masing kategori untuk mengetahui seberapa besar peran marketing terhadap profitabilitas kopi dan teh.
# Hitung korelasi
cor_kopi <- cor.test(kopi$Marketing, kopi$Profit, method = "pearson")
cor_teh <- cor.test(teh$Marketing, teh$Profit, method = "pearson")
# Buat dataframe hasil korelasi
cor_df <- data.frame(
Kategori = c("Kopi", "Teh"),
Korelasi = c(cor_kopi$estimate, cor_teh$estimate),
Signifikansi = c("Signifikan (p < 0.001)", "Signifikan (p < 0.001)")
)
# Visualisasi bar chart
ggplot(cor_df, aes(x = Kategori, y = Korelasi, fill = Kategori)) +
geom_bar(stat = "identity", width = 0.5) +
geom_text(aes(label = round(Korelasi, 3)),
vjust = -0.5, size = 4.5) +
labs(title = "Koefisien Korelasi Marketing vs Profit: Kopi vs Teh",
x = "Kategori", y = "Koefisien Korelasi (r)") +
ylim(0, 0.35) +
theme_minimal() +
theme(legend.position = "none")
Grafik di atas menunjukkan perbandingan koefisien korelasi antara biaya
marketing dan profit untuk kategori kopi (r = 0,255) dan teh (r =
0,186). Kedua nilai signifikan secara statistik (p < 0,001) namun
tergolong lemah, artinya peningkatan biaya pemasaran berdampak positif
terhadap profit tetapi bukan faktor yang dominan. Kopi menunjukkan
sensitivitas yang lebih tinggi terhadap biaya marketing dibandingkan
teh, mengimplikasikan bahwa investasi marketing pada kopi memberikan
return yang relatif lebih besar.
Analisis ini bertujuan untuk mengevaluasi pengaruh wilayah terhadap profit serta mengkaji perbedaan performa kategori produk kopi dan teh pada masing-masing market.
# ANOVA dua arah
anova_result <- aov(Profit ~ Market + Kategori + Market:Kategori, data = data)
summary(anova_result)
## Df Sum Sq Mean Sq F value Pr(>F)
## Market 3 288811 96270 9.484 3.05e-06 ***
## Kategori 1 78187 78187 7.702 0.00554 **
## Market:Kategori 3 525333 175111 17.250 3.94e-11 ***
## Residuals 4240 43041305 10151
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
# Visualisasi
data %>%
group_by(Market, Kategori) %>%
summarise(Total_Profit = sum(Profit)) %>%
ggplot(aes(x = Market, y = Total_Profit, fill = Kategori)) +
geom_bar(stat = "identity", position = "dodge") +
labs(title = "Perbandingan Profit Kopi vs Teh per Wilayah") +
theme_minimal()
# Post-hoc test jika ANOVA signifikan
TukeyHSD(anova_result)
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = Profit ~ Market + Kategori + Market:Kategori, data = data)
##
## $Market
## diff lwr upr p adj
## East-Central -3.144546 -14.342599 8.0535064 0.8884796
## South-Central -21.500000 -33.733832 -9.2661677 0.0000382
## West-Central -14.773810 -24.762692 -4.7849273 0.0008408
## South-East -18.355454 -31.594988 -5.1159194 0.0020978
## West-East -11.629263 -22.827316 -0.4312105 0.0382497
## West-South 6.726190 -5.507642 18.9600227 0.4911926
##
## $Kategori
## diff lwr upr p adj
## Teh-Kopi -8.470693 -14.5399 -2.401488 0.0062399
##
## $`Market:Kategori`
## diff lwr upr p adj
## East:Kopi-Central:Kopi 21.6739321 2.498571 40.8492927 0.0142442
## South:Kopi-Central:Kopi -13.9511905 -32.209786 4.3074049 0.2843361
## West:Kopi-Central:Kopi -21.0863095 -37.754050 -4.4185686 0.0031838
## Central:Teh-Central:Kopi 0.4791667 -16.188574 17.1469076 1.0000000
## East:Teh-Central:Kopi -23.7970238 -42.055619 -5.5384284 0.0020101
## South:Teh-Central:Kopi -39.5334821 -64.535094 -14.5318708 0.0000460
## West:Teh-Central:Kopi -7.9821429 -24.649884 8.6855981 0.8325652
## South:Kopi-East:Kopi -35.6251225 -56.198337 -15.0519076 0.0000044
## West:Kopi-East:Kopi -42.7602416 -61.935602 -23.5848810 0.0000000
## Central:Teh-East:Kopi -21.1947654 -40.370126 -2.0194048 0.0183989
## East:Teh-East:Kopi -45.4709559 -66.044171 -24.8977410 0.0000000
## South:Teh-East:Kopi -61.2074142 -87.946177 -34.4686514 0.0000000
## West:Teh-East:Kopi -29.6560749 -48.831436 -10.4807143 0.0000768
## West:Kopi-South:Kopi -7.1351190 -25.393714 11.1234763 0.9363782
## Central:Teh-South:Kopi 14.4303571 -3.828238 32.6889525 0.2430961
## East:Teh-South:Kopi -9.8458333 -29.567370 9.8757037 0.8002111
## South:Teh-South:Kopi -25.5822917 -51.671433 0.5068496 0.0592678
## West:Teh-South:Kopi 5.9690476 -12.289548 24.2276430 0.9757698
## Central:Teh-West:Kopi 21.5654762 4.897735 38.2332171 0.0022563
## East:Teh-West:Kopi -2.7107143 -20.969310 15.5478811 0.9998331
## South:Teh-West:Kopi -18.4471726 -43.448784 6.5544388 0.3293921
## West:Teh-West:Kopi 13.1041667 -3.563574 29.7719076 0.2493281
## East:Teh-Central:Teh -24.2761905 -42.534786 -6.0175951 0.0014534
## South:Teh-Central:Teh -40.0126488 -65.014260 -15.0110374 0.0000345
## West:Teh-Central:Teh -8.4613095 -25.129050 8.2064314 0.7860250
## South:Teh-East:Teh -15.7364583 -41.825600 10.3526829 0.6001143
## West:Teh-East:Teh 15.8148810 -2.443714 34.0734763 0.1465992
## West:Teh-South:Teh 31.5513393 6.549728 56.5529507 0.0033036
Hasil ANOVA dua arah menunjukkan bahwa wilayah (F = 9,484, p < 0,001), kategori produk (F = 7,702, p = 0,006), serta interaksi keduanya (F = 17,250, p < 0,001) berpengaruh signifikan terhadap profit. Hal ini berarti perbedaan profit antar wilayah bukan sekadar kebetulan, dan pola tersebut berbeda antara kopi dan teh. Uji post-hoc Tukey HSD mengungkap beberapa temuan penting. Wilayah South secara signifikan memiliki profit lebih rendah dibandingkan Central (p < 0,001) dan East (p = 0,002). Yang lebih menarik, terdapat pola preferensi geografis yang jelas: kopi mendominasi di wilayah East (East:Kopi vs West:Kopi, p < 0,001), sementara teh justru unggul di wilayah West (West:Teh vs South:Teh, p = 0,003). Temuan ini memberikan implikasi strategis yang penting bagi produsen dalam merancang distribusi dan promosi yang lebih tertarget per wilayah.
Analisis ini dilakukan untuk membandingkan antara profit yang dianggarkan (budget) dan profit aktual pada masing-masing kategori produk guna mengevaluasi pencapaian kinerja.
data %>%
group_by(Kategori) %>%
summarise(
Budget = sum(`Budget Profit`),
Aktual = sum(Profit),
Selisih = Aktual - Budget,
Attainment = Aktual / Budget * 100
) %>%
ggplot(aes(x = Kategori)) +
geom_bar(aes(y = Budget, fill = "Budget"),
stat = "identity", position = "dodge") +
geom_bar(aes(y = Aktual, fill = "Aktual"),
stat = "identity", position = "dodge") +
labs(title = "Budget vs Aktual Profit: Kopi vs Teh") +
theme_minimal()
Analisis budget variance menunjukkan hasil yang kontras antara kedua
kategori. Kopi ditetapkan target budget profit sebesar 155.780 namun
hanya berhasil merealisasikan 143.303, sehingga mengalami shortfall
sebesar 12.477 atau hanya mencapai 92% dari target. Sebaliknya, teh yang
memiliki target budget lebih konservatif sebesar 102.980 justru berhasil
melampaui target dengan realisasi 116.240, menghasilkan surplus sebesar
13.260 atau pencapaian 112,9%. Grafik budget vs aktual secara visual
memperlihatkan bahwa batang aktual kopi tidak mencapai garis budget,
sementara batang aktual teh melampaui budget yang ditetapkan. Kondisi
ini mengindikasikan dua hal sekaligus: perencanaan anggaran kopi yang
terlalu optimistis, dan potensi teh yang selama ini belum sepenuhnya
diakui dalam proses penetapan target bisnis.
Berdasarkan seluruh analisis yang telah dilakukan, terdapat empat insight utama yang dapat dijadikan dasar pengambilan keputusan bisnis. Pertama, meskipun kopi unggul secara nominal, uji statistik membuktikan bahwa perbedaan profitnya dengan teh tidak signifikan dimana teh adalah kategori yang setara dan tidak boleh diperlakukan sebagai produk sekunder. Kedua, teh secara konsisten melampaui target anggaran, menunjukkan bahwa penetapan target selama ini terlalu rendah dan perlu direvisi ke atas. Adapun rekomendasi yang dapat diberikan kepada produsen adalah sebagai berikut. Pertama, tinjau ulang metode penetapan target kopi agar lebih realistis dan berbasis data historis. Kedua, naikkan alokasi budget dan target profit untuk kategori teh mengingat realisasinya yang konsisten melampaui ekspektasi. Ketiga, manfaatkan pola preferensi geografis dengan memperkuat distribusi kopi di wilayah East dan teh di wilayah West. Keempat, diversifikasi produk kopi untuk mengurangi ketergantungan yang terlalu tinggi pada Colombian sebagai produk tunggal penyumbang profit terbesar.
Analisis komparatif profitabilitas kopi dan teh pada Coffee Chain Dataset 2012–2013 menghasilkan temuan yang melampaui ekspektasi awal. Secara statistik, uji Mann-Whitney U membuktikan bahwa tidak terdapat perbedaan profit yang signifikan antara kedua kategori (p = 0,214), meskipun kopi tampak lebih unggul secara deskriptif. ANOVA dua arah mengonfirmasi bahwa faktor wilayah dan interaksinya dengan kategori produk berpengaruh signifikan terhadap profit, dengan kopi mendominasi di East dan teh unggul di West. Temuan paling menonjol dalam analisis ini adalah paradoks budget attainment: kopi yang selama ini dianggap sebagai produk andalan justru gagal mencapai targetnya, sementara teh yang kurang mendapat perhatian berhasil melampaui budget secara konsisten. Hal ini menegaskan pentingnya pendekatan berbasis data dalam perencanaan bisnis, agar keputusan strategis tidak hanya didasarkan pada asumsi atau persepsi semata, melainkan pada bukti statistik yang dapat dipertanggungjawabkan.