Dataset yang digunakan adalah Coffee Chain Datasets yang mencatat transaksi penjualan produk dari berbagai wilayah di Amerika Serikat pada periode Januari 2012 hingga Desember 2013. Dataset ini terdiri dari 4.248 observasi dengan 20 variabel, mencakup informasi seperti jenis produk, wilayah pasar, serta data finansial seperti penjualan (sales), biaya (COGS), margin, profit, dan biaya pemasaran (marketing).
Dalam dataset ini terdapat empat tipe produk, yaitu Coffee, Tea, Espresso, dan Herbal Tea. Dari keempat tipe tersebut, Coffee dan Tea merupakan dua kategori utama yang paling banyak dikonsumsi dan menjadi pemasukan utama pada bisnis kedai kopi. Keduanya memiliki kriteria pelanggan yang berbeda, Coffee identik dengan minuman sehari-hari yang tinggi kafein, sementara Tea lebih sering dipilih sebagai alternatif yang lebih ringan.
Insight yang diambil: Manakah antara Coffee dan Tea yang lebih menguntungkan bagi perusahaan?
Pertanyaan ini menarik karena meskipun Coffee sering dianggap sebagai produk utama, tetapi bukan berarti Tea kalah menguntungkan. Bisa saja Tea memiliki biaya produksi lebih rendah sehingga margin keuntungannya justru lebih tinggi. Analisis ini akan menjawab pertanyaan tersebut melalui perbandingan statistik deskriptif, visualisasi data, serta uji statistik untuk melihat apakah perbedaan yang ada benar-benar signifikan.
library(readxl)
library(dplyr)
library(ggplot2)
library(knitr)
df <- read_excel("E:/SIM 2026/1. Tugas SIM 2025B - Coffee Chain Datasets.xlsx")
df_ct <- df %>%
filter(`Product Type` %in% c("Coffee", "Tea"))
cat("Jumlah data Coffee:", sum(df_ct$`Product Type` == "Coffee"), "\n")
## Jumlah data Coffee: 1056
cat("Jumlah data Tea :", sum(df_ct$`Product Type` == "Tea"), "\n")
## Jumlah data Tea : 960
df_avg <- df_ct %>%
group_by(`Product Type`) %>%
summarise(Avg_Profit = mean(Profit))
ggplot(df_avg, aes(x = `Product Type`, y = Avg_Profit, fill = `Product Type`)) +
geom_col(width = 0.5, alpha = 0.85) +
geom_text(aes(label = round(Avg_Profit, 1)), vjust = -0.5, size = 4) +
labs(title = "Rata-rata Profit: Coffee vs Tea",
x = "Tipe Produk", y = "Rata-rata Profit") +
theme_minimal() +
theme(legend.position = "none")
ggplot(df_ct, aes(x = `Product Type`, y = Profit, fill = `Product Type`)) +
geom_boxplot(alpha = 0.7) +
geom_hline(yintercept = 0, linetype = "dashed", color = "red") +
labs(title = "Distribusi Profit: Coffee vs Tea",
subtitle = "Garis merah = batas profit nol",
x = "Tipe Produk", y = "Profit") +
theme_minimal() +
theme(legend.position = "none")
df_produk <- df_ct %>%
group_by(`Product Type`, Product) %>%
summarise(Avg_Profit = mean(Profit), .groups = "drop")
ggplot(df_produk, aes(x = reorder(Product, Avg_Profit),
y = Avg_Profit, fill = `Product Type`)) +
geom_col(alpha = 0.85) +
geom_hline(yintercept = 0, linetype = "dashed", color = "red") +
coord_flip() +
labs(title = "Rata-rata Profit per Produk",
x = "Produk", y = "Rata-rata Profit", fill = "Tipe Produk") +
theme_minimal()
coffee <- df_ct$Profit[df_ct$`Product Type` == "Coffee"]
tea <- df_ct$Profit[df_ct$`Product Type` == "Tea"]
cat("=== Coffee ===\n")
## === Coffee ===
summary(coffee)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## -221.00 17.00 39.00 70.72 91.00 778.00
cat("\n=== Tea ===\n")
##
## === Tea ===
summary(tea)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## -638.00 15.00 44.00 55.19 103.00 362.00
Uji t dua sampel digunakan untuk menguji apakah rata-rata profit Coffee dan Tea berbeda secara signifikan.
t.test(coffee, tea)
##
## Welch Two Sample t-test
##
## data: coffee and tea
## t = 3.0582, df = 2013.8, p-value = 0.002256
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## 5.570448 25.487128
## sample estimates:
## mean of x mean of y
## 70.72254 55.19375
Dari bar chart terlihat jelas bahwa rata-rata profit Coffee lebih unggul. Boxplot memperkuat temuan ini, distribusi profit Tea memiliki nilai pencilan (outlier) negatif yang jauh lebih ekstrem dibanding Coffee, yang menjadi penyebab rata-rata Tea lebih rendah meskipun median-nya sedikit lebih tinggi.
Dari grafik per produk, terlihat bahwa Colombian adalah produk Coffee paling menguntungkan dengan rata-rata profit 116.26, diikuti Earl Grey (Tea) sebesar 83.90, dan Darjeeling (Tea) sebesar 75.66. Produk paling bermasalah adalah Green Tea dengan rata-rata profit -0.80 — satu-satunya produk yang rata-ratanya berada di bawah nol, dan menjadi penyebab utama rendahnya performa kategori Tea secara keseluruhan.
Berdasarkan hasil summary():
Hasil uji t menunjukkan p-value = 0.0024 < 0.05, sehingga \(H_0\) ditolak. Perbedaan rata-rata profit antara Coffee dan Tea signifikan secara statistik . Coffee terbukti secara konsisten lebih menguntungkan dibanding Tea.
Laporan ini dibuat menggunakan R-Markdown sebagai bagian dari Tugas Mata Kuliah Sistem Informasi Manajemen, Program Studi S1 Statistika, Universitas Sebelas Maret.