Dalam laporan ini, dataset Coffee Chain digunakan untuk mengevaluasi efektivitas strategi pemasaran dan memetakan performa penjualan berdasarkan varian produk. Insight utama yang hendak digali berpusat pada dua pertanyaan: 1. Produk manakah yang menghasilkan total pendapatan (Sales) tertinggi? 2. Sejauh mana besaran alokasi biaya pemasaran (Marketing) memiliki hubungan yang linier dan terbukti secara statistik terhadap peningkatan pendapatan (Sales)?
Untuk menjawab insight tersebut, analisis tidak dilakukan pada seluruh dataset, melainkan difokuskan pada variabel yang relevan. Tahapan pemilihan data (data selection & cleaning) dilakukan dengan mengambil kolom Product Type, Marketing, dan Sales, serta mengeliminasi baris yang memiliki nilai kosong (missing values).
library(readxl)
library(dplyr)
library(ggplot2)
df <- read_xlsx("CoffeeChain.xlsx")
df_clean <- df %>%
select(`Product Type`, Marketing, Sales) %>%
filter(!is.na(Marketing) & !is.na(Sales))
#Menampilkan 6 baris pertama sebagai gambaran dari struktur data yang siap dianalisis
head(df_clean)
## # A tibble: 6 × 3
## `Product Type` Marketing Sales
## <chr> <dbl> <dbl>
## 1 Coffee 24 219
## 2 Coffee 27 190
## 3 Coffee 26 234
## 4 Tea 14 100
## 5 Espresso 15 134
## 6 Espresso 23 180
Langkah pertama adalah menjumlahkan sales untuk menghitung total penjualan dari setiap tipe produk, lalu memvisualisasikannya ke dalam bentuk Bar Chart untuk melihat perbandingannya secara jelas.
#Menjumlahkan sales untuk masing-masing tipe produk
data_penjualan <- df_clean %>%
group_by(`Product Type`) %>%
summarise(Total_Sales = sum(Sales))
#Membuat diagram batang
ggplot(data_penjualan, aes(x = reorder(`Product Type`, -Total_Sales), y = Total_Sales, fill = `Product Type`)) +
geom_col(color = "black", alpha = 0.8) +
geom_text(aes(label = Total_Sales), vjust = -0.5, fontface = "bold") +
scale_fill_manual(values = c("Coffee" = "darkred",
"Espresso" = "brown",
"Herbal Tea" = "tomato",
"Tea" = "coral")) +
labs(title = "Perbandingan Total Penjualan Antar Tipe Produk",
subtitle = "Dataset Coffee Chain",
x = "Tipe Produk",
y = "Total Pendapatan (Sales)") +
theme_minimal() +
theme(legend.position = "none",
plot.title = element_text(face = "bold"))
Sebelum masuk ke uji hubungan, berikut adalah ringkasan statistik untuk memberikan gambaran umum data yang dianalisis.
summary(df_clean %>% select(Marketing, Sales))
## Marketing Sales
## Min. : 0.00 Min. : 17
## 1st Qu.: 13.00 1st Qu.:100
## Median : 22.00 Median :138
## Mean : 31.19 Mean :193
## 3rd Qu.: 39.00 3rd Qu.:230
## Max. :156.00 Max. :912
Setelah ringkasan data, analisis dilanjutkan dengan metode statistika Korelasi Pearson (cor.test). Metode ini dipilih karena tepat untuk mengukur kekuatan dan arah hubungan linear antara dua variabel numerik kontinu, yaitu biaya pemasaran (Marketing) dan pendapatan penjualan (Sales).
uji_korelasi <- cor.test(df_clean$Marketing, df_clean$Sales)
uji_korelasi
##
## Pearson's product-moment correlation
##
## data: df_clean$Marketing and df_clean$Sales
## t = 65.794, df = 4246, p-value < 2.2e-16
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.6952985 0.7250946
## sample estimates:
## cor
## 0.7105149
Berdasarkan output visualisasi dan uji statistika di atas, dapat ditarik interpretasi sebagai berikut:
A. Interpretasi Visualisasi (Performa Produk) Melalui Bar Chart, terlihat adanya ketimpangan performa penjualan antar varian produk. Espresso menjadi penyumbang total sales tertinggi, diikuti oleh produk Coffee di posisi kedua. Sebaliknya, produk teh (baik Tea maupun Herbal Tea) menunjukkan performa penjualan yang rendah. Hal ini mengindikasikan bahwa target utama dari perusahaan ini adalah konsumen peminum kopi pekat/reguler, bukan teh.
B. Interpretasi Uji Statistik (Efektivitas Pemasaran) Dari hasil Uji Korelasi Pearson, diperoleh metrik krusial berikut: 1. Angka estimasi korelasi (cor) sebesar 0.7105 menunjukkan adanya hubungan positif yang kuat antara biaya pemasaran dan penjualan (linear). Artinya, setiap peningkatan anggaran pemasaran secara konsisten diikuti oleh peningkatan angka penjualan. 2. Nilai p-value (< 2.2e-16) berada sangat jauh di bawah ambang batas signifikansi standar (\(\alpha = 0.05\)). Menunjukkan bahwa hubungan ini sangat signifikan. Pemasaran terbukti menjadi faktor pendorong utama dalam peningkatan angka penjualan di Coffee Chain.
Berdasarkan insight yang diperoleh, strategi pemasaran saat ini sangat efektif. Mengingat korelasi yang kuat, perusahaan disarankan untuk terus meningkatkan anggaran pemasaran, khususnya pada produk dengan volume penjualan tinggi seperti Espresso untuk memaksimalkan keuntungan.