Dalam laporan ini, dataset Coffee Chain digunakan untuk mengevaluasi efektivitas strategi pemasaran dan memetakan performa penjualan berdasarkan varian produk. Insight utama yang hendak digali berpusat pada dua pertanyaan: 1. Produk manakah yang menghasilkan total pendapatan (Sales) tertinggi? 2. Sejauh mana besaran alokasi biaya pemasaran (Marketing) memiliki hubungan yang linier dan terbukti secara statistik terhadap peningkatan pendapatan (Sales)?

Untuk menjawab insight tersebut, analisis tidak dilakukan pada seluruh dataset, melainkan difokuskan pada variabel yang relevan. Tahapan pemilihan data (data selection & cleaning) dilakukan dengan mengambil kolom Product Type, Marketing, dan Sales, serta mengeliminasi baris yang memiliki nilai kosong (missing values).

library(readxl)
library(dplyr)
library(ggplot2)

df <- read_xlsx("CoffeeChain.xlsx")

df_clean <- df %>%
  select(`Product Type`, Marketing, Sales) %>%
  filter(!is.na(Marketing) & !is.na(Sales))

#Menampilkan 6 baris pertama sebagai gambaran dari struktur data yang siap dianalisis
head(df_clean)
## # A tibble: 6 × 3
##   `Product Type` Marketing Sales
##   <chr>              <dbl> <dbl>
## 1 Coffee                24   219
## 2 Coffee                27   190
## 3 Coffee                26   234
## 4 Tea                   14   100
## 5 Espresso              15   134
## 6 Espresso              23   180

Langkah pertama adalah menjumlahkan sales untuk menghitung total penjualan dari setiap tipe produk, lalu memvisualisasikannya ke dalam bentuk Bar Chart untuk melihat perbandingannya secara jelas.

#Menjumlahkan sales untuk masing-masing tipe produk
data_penjualan <- df_clean %>%
  group_by(`Product Type`) %>%
  summarise(Total_Sales = sum(Sales))

#Membuat diagram batang
ggplot(data_penjualan, aes(x = reorder(`Product Type`, -Total_Sales), y = Total_Sales, fill = `Product Type`)) +
  geom_col(color = "black", alpha = 0.8) +
  geom_text(aes(label = Total_Sales), vjust = -0.5, fontface = "bold") +
  scale_fill_manual(values = c("Coffee" = "darkred", 
                               "Espresso" = "brown", 
                               "Herbal Tea" = "tomato", 
                               "Tea" = "coral")) +
  labs(title = "Perbandingan Total Penjualan Antar Tipe Produk",
       subtitle = "Dataset Coffee Chain",
       x = "Tipe Produk",
       y = "Total Pendapatan (Sales)") +
  theme_minimal() +
  theme(legend.position = "none",
        plot.title = element_text(face = "bold"))

Sebelum masuk ke uji hubungan, berikut adalah ringkasan statistik untuk memberikan gambaran umum data yang dianalisis.

summary(df_clean %>% select(Marketing, Sales))
##    Marketing          Sales    
##  Min.   :  0.00   Min.   : 17  
##  1st Qu.: 13.00   1st Qu.:100  
##  Median : 22.00   Median :138  
##  Mean   : 31.19   Mean   :193  
##  3rd Qu.: 39.00   3rd Qu.:230  
##  Max.   :156.00   Max.   :912

Setelah ringkasan data, analisis dilanjutkan dengan metode statistika Korelasi Pearson (cor.test). Metode ini dipilih karena tepat untuk mengukur kekuatan dan arah hubungan linear antara dua variabel numerik kontinu, yaitu biaya pemasaran (Marketing) dan pendapatan penjualan (Sales).

uji_korelasi <- cor.test(df_clean$Marketing, df_clean$Sales)
uji_korelasi
## 
##  Pearson's product-moment correlation
## 
## data:  df_clean$Marketing and df_clean$Sales
## t = 65.794, df = 4246, p-value < 2.2e-16
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.6952985 0.7250946
## sample estimates:
##       cor 
## 0.7105149

Berdasarkan output visualisasi dan uji statistika di atas, dapat ditarik interpretasi sebagai berikut:

A. Interpretasi Visualisasi (Performa Produk) Melalui Bar Chart, terlihat adanya ketimpangan performa penjualan antar varian produk. Espresso menjadi penyumbang total sales tertinggi, diikuti oleh produk Coffee di posisi kedua. Sebaliknya, produk teh (baik Tea maupun Herbal Tea) menunjukkan performa penjualan yang rendah. Hal ini mengindikasikan bahwa target utama dari perusahaan ini adalah konsumen peminum kopi pekat/reguler, bukan teh.

B. Interpretasi Uji Statistik (Efektivitas Pemasaran) Dari hasil Uji Korelasi Pearson, diperoleh metrik krusial berikut: 1. Angka estimasi korelasi (cor) sebesar 0.7105 menunjukkan adanya hubungan positif yang kuat antara biaya pemasaran dan penjualan (linear). Artinya, setiap peningkatan anggaran pemasaran secara konsisten diikuti oleh peningkatan angka penjualan. 2. Nilai p-value (< 2.2e-16) berada sangat jauh di bawah ambang batas signifikansi standar (\(\alpha = 0.05\)). Menunjukkan bahwa hubungan ini sangat signifikan. Pemasaran terbukti menjadi faktor pendorong utama dalam peningkatan angka penjualan di Coffee Chain.

Berdasarkan insight yang diperoleh, strategi pemasaran saat ini sangat efektif. Mengingat korelasi yang kuat, perusahaan disarankan untuk terus meningkatkan anggaran pemasaran, khususnya pada produk dengan volume penjualan tinggi seperti Espresso untuk memaksimalkan keuntungan.