1. Deskripsi

Dataset Coffee Chain memuat data transaksi penjualan produk kopi dan teh dari berbagai wilayah di Amerika Serikat. Dataset ini terdiri dari 4.248 baris dan 20 variabel, mencakup informasi biaya pemasaran (Marketing), penjualan (Sales) per produk dan berbagai informasi lainnya.

Insight yang diangkat:

Seberapa efektif biaya pemasaran yang dikeluarkan terhadap penjualan yang dihasilkan? Produk mana yang paling efisien dan paling tidak efisien dalam penggunaan anggaran marketing?

Efektivitas marketing diukur menggunakan rasio:

\[\text{Efektivitas} = \frac{\text{Total Sales}}{\text{Total Marketing}}\] Rasio ini menunjukkan berapa rupiah penjualan yang dihasilkan dari setiap 1 satuan biaya marketing. Semakin tinggi nilainya, semakin efisien penggunaan anggaran pemasaran produk tersebut.

Analisis ini meliputi:


2. Koneksi Database dan Pengambilan Data

2.1 Koneksi ke Database MySQL

library(DBI)

con <- DBI::dbConnect(odbc::odbc(),
  Driver   = "MySQL ODBC 8.0 ANSI Driver",
  Server   = "127.0.0.1",
  Database = "coffee_chain",
  UID      = "root",
  PWD      = "090108", 
  Port     = 3306)

2.2 Mengambil Data dengan Query SQL

Data diambil dari hasil JOIN antara tabel product dan facttable, lalu dikelompokkan per produk menggunakan GROUP BY.

# Ambil data Marketing, Sales, dan Profit per produk
dt <- dbGetQuery(con, "SELECT p.Product, p.`Product Line`, p.`Product Type`,
         SUM(f.Marketing) AS Total_Marketing,
         SUM(f.Sales)     AS Total_Sales,
         SUM(f.Profit)    AS Total_Profit
  FROM product p
  JOIN facttable f ON p.ProductId = f.ProductId
  GROUP BY p.Product, p.`Product Line`, p.`Product Type`
  ORDER BY Total_Sales DESC")
dt
##              Product Product Line Product Type Total_Marketing Total_Sales
## 1          Colombian        Beans       Coffee           17346      128311
## 2              Lemon       Leaves   Herbal Tea           15880       95926
## 3        Caffe Mocha        Beans     Espresso           19686       84904
## 4     Decaf Espresso        Beans     Espresso           10112       78162
## 5          Chamomile       Leaves   Herbal Tea           12166       75578
## 6         Darjeeling       Leaves          Tea            9766       73151
## 7          Earl Grey       Leaves          Tea            9846       66772
## 8  Decaf Irish Cream        Beans       Coffee           11362       62248
## 9        Caffe Latte        Beans     Espresso            5472       35899
## 10              Mint       Leaves   Herbal Tea            6108       35710
## 11         Green Tea       Leaves          Tea            7126       32850
## 12          Amaretto        Beans       Coffee            4658       26269
## 13  Regular Espresso        Beans     Espresso            2946       24031
##    Total_Profit
## 1         55804
## 2         29869
## 3         17678
## 4         29502
## 5         27231
## 6         29053
## 7         24164
## 8         13989
## 9         11375
## 10         6154
## 11         -231
## 12         4890
## 13        10065

2.3 Menghitung Rasio Efektivitas Marketing

# Hitung rasio efektivitas: Sales per unit Marketing
dt$Efektivitas <- round(dt$Total_Sales / dt$Total_Marketing, 2)

# Urutkan dari yang paling efektif
dt <- dt[order(dt$Efektivitas, decreasing = TRUE), ]
dt
##              Product Product Line Product Type Total_Marketing Total_Sales
## 13  Regular Espresso        Beans     Espresso            2946       24031
## 4     Decaf Espresso        Beans     Espresso           10112       78162
## 6         Darjeeling       Leaves          Tea            9766       73151
## 1          Colombian        Beans       Coffee           17346      128311
## 7          Earl Grey       Leaves          Tea            9846       66772
## 9        Caffe Latte        Beans     Espresso            5472       35899
## 5          Chamomile       Leaves   Herbal Tea           12166       75578
## 2              Lemon       Leaves   Herbal Tea           15880       95926
## 10              Mint       Leaves   Herbal Tea            6108       35710
## 12          Amaretto        Beans       Coffee            4658       26269
## 8  Decaf Irish Cream        Beans       Coffee           11362       62248
## 11         Green Tea       Leaves          Tea            7126       32850
## 3        Caffe Mocha        Beans     Espresso           19686       84904
##    Total_Profit Efektivitas
## 13        10065        8.16
## 4         29502        7.73
## 6         29053        7.49
## 1         55804        7.40
## 7         24164        6.78
## 9         11375        6.56
## 5         27231        6.21
## 2         29869        6.04
## 10         6154        5.85
## 12         4890        5.64
## 8         13989        5.48
## 11         -231        4.61
## 3         17678        4.31

3. Visualisasi Data

3.1 Perbandingan Total Marketing dan Sales per Produk

library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.5.2
# Buat data format panjang untuk grouped bar chart
dt_long <- data.frame(
  Product = rep(dt$Product, 2),
  Metrik  = c(rep("Total Marketing", nrow(dt)), rep("Total Sales", nrow(dt))),
  Nilai   = c(dt$Total_Marketing, dt$Total_Sales)
)

ggplot(dt_long, aes(x = reorder(Product, -Nilai), y = Nilai, fill = Metrik)) +
  geom_bar(stat = "identity", position = "dodge") +
  scale_fill_manual(values = c("Total Marketing" = "#e08214", "Total Sales" = "#2166ac")) +
  coord_flip() +
  labs(
    title   = "Perbandingan Total Marketing dan Sales per Produk",
    subtitle = "Coffee Chain Dataset",
    x       = "Produk",
    y       = "Nilai",
    fill    = "Keterangan"
  ) +
  theme_classic()

Interpretasi: Caffe Mocha memiliki biaya Marketing tertinggi, namun Sales-nya tidak sebanding (kalah jauh dari Colombian yang biaya marketingnya lebih rendah). Hal ini menunjukkan adanya perbedaan efisiensi antar produk dalam menggunakan anggaran pemasaran.


3.2 Rasio Efektivitas Marketing per Produk

ggplot(dt, aes(x = reorder(Product, Efektivitas), y = Efektivitas, fill = Efektivitas)) +
  geom_bar(stat = "identity", show.legend = FALSE) +
  scale_fill_gradient(low = "#f4a582", high = "#1a9641") +
  coord_flip() +
  geom_hline(yintercept = mean(dt$Efektivitas), linetype = "dashed", color = "gray30") +
  labs(
    title    = "Rasio Efektivitas Marketing per Produk",
    subtitle = "Rasio = Total Sales / Total Marketing | Garis putus = rata-rata",
    x        = "Produk",
    y        = "Efektivitas (Sales per unit Marketing)"
  ) +
  theme_classic()

Interpretasi: Regular Espresso memiliki rasio efektivitas tertinggi (8,16) artinya setiap 1 unit biaya marketing menghasilkan 8,16 unit penjualan. Diikuti oleh Decaf Espresso (7,73) dan Darjeeling (7,49). Sebaliknya, Caffe Mocha paling tidak efisien (4,31) dan Green Tea bahkan menghasilkan profit negatif meskipun tetap mengeluarkan biaya marketing.


3.3 Scatter Plot: Hubungan Marketing vs Sales

# Ambil data per baris (bukan per produk) untuk scatter plot
dt2 <- dbGetQuery(con, "SELECT f.Marketing, f.Sales FROM facttable f")

ggplot(dt2, aes(x = Marketing, y = Sales)) +
  geom_point(color = "#4393c3", alpha = 0.4, size = 1.5) +
  geom_smooth(method = "lm", color = "#d6604d", se = TRUE) +
  labs(
    title    = "Hubungan antara Biaya Marketing dan Sales",
    subtitle = "Tiap titik mewakili satu transaksi",
    x        = "Marketing",
    y        = "Sales"
  ) +
  theme_classic()
## `geom_smooth()` using formula = 'y ~ x'

Interpretasi: Scatter plot menunjukkan adanya tren positif antara biaya Marketing dan Sales, semakin besar biaya marketing, cenderung semakin besar pula penjualannya. Garis merah adalah garis regresi linear yang memperkuat pola tersebut.


4. Analisis Statistika

4.1 Uji Korelasi: Marketing vs Sales

Untuk mengetahui apakah terdapat hubungan yang signifikan antara biaya Marketing dan Sales, dilakukan uji korelasi Pearson.

Hipotesis:

  • H₀: Tidak terdapat korelasi signifikan antara Marketing dan Sales (ρ = 0)
  • H₁: Terdapat korelasi signifikan antara Marketing dan Sales (ρ ≠ 0)
uji_kor <- cor.test(dt2$Marketing, dt2$Sales, method = "pearson")
uji_kor
## 
##  Pearson's product-moment correlation
## 
## data:  dt2$Marketing and dt2$Sales
## t = 65.794, df = 4246, p-value < 2.2e-16
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.6952985 0.7250946
## sample estimates:
##       cor 
## 0.7105149

Interpretasi: Nilai koefisien korelasi Pearson sebesar 0.711 menunjukkan hubungan positif yang kuat antara biaya Marketing dan Sales. Dengan p-value jauh di bawah 0,05, H₀ ditolak: artinya secara statistik terdapat korelasi signifikan antara kedua variabel tersebut. Namun korelasi yang tidak sempurna (< 1,0) menunjukkan bahwa faktor lain seperti kualitas produk dan harga juga turut memengaruhi penjualan.


4.2 Statistik Deskriptif Efektivitas Marketing

cat("Rata-rata efektivitas marketing :", mean(dt$Efektivitas), "\n")
## Rata-rata efektivitas marketing : 6.327692
cat("Median efektivitas marketing     :", median(dt$Efektivitas), "\n")
## Median efektivitas marketing     : 6.21
cat("Standar deviasi                  :", round(sd(dt$Efektivitas), 2), "\n")
## Standar deviasi                  : 1.18
cat("Efektivitas tertinggi            :", max(dt$Efektivitas),":", dt$Product[which.max(dt$Efektivitas)], "\n")
## Efektivitas tertinggi            : 8.16 : Regular Espresso
cat("Efektivitas terendah             :", min(dt$Efektivitas),":", dt$Product[which.min(dt$Efektivitas)], "\n")
## Efektivitas terendah             : 4.31 : Caffe Mocha

5. Kesimpulan

Berdasarkan analisis efektivitas biaya pemasaran pada dataset Coffee Chain, diperoleh kesimpulan berikut:

  1. Regular Espresso adalah produk paling efisien secara marketing dengan rasio efektivitas 8,16, menghasilkan penjualan terbesar per unit biaya marketing.
  2. Caffe Mocha adalah produk paling tidak efisien dengan rasio 4,31, meskipun memiliki total biaya marketing tertinggi di antara semua produk.
  3. Green Tea menjadi kasus paling kritis: rasio efektivitas terendah (4,61) dan satu-satunya produk yang menghasilkan profit negatif, menandakan biaya yang dikeluarkan (termasuk marketing) tidak sebanding dengan pendapatan.
  4. Uji korelasi Pearson menunjukkan hubungan positif kuat dan signifikan antara Marketing dan Sales (r ≈ 0.711, p < 0,001), artinya pengeluaran marketing secara umum berdampak pada peningkatan penjualan.
  5. Meski demikian, besarnya anggaran marketing tidak selalu menjamin efisiensi, terbukti dari kasus Caffe Mocha yang berbiaya tinggi namun rasio efektivitasnya rendah.
dbDisconnect(con)