Dataset Coffee Chain memuat data transaksi penjualan produk kopi dan teh dari berbagai wilayah di Amerika Serikat. Dataset ini terdiri dari 4.248 baris dan 20 variabel, mencakup informasi biaya pemasaran (Marketing), penjualan (Sales) per produk dan berbagai informasi lainnya.
Insight yang diangkat:
Seberapa efektif biaya pemasaran yang dikeluarkan terhadap penjualan yang dihasilkan? Produk mana yang paling efisien dan paling tidak efisien dalam penggunaan anggaran marketing?
Efektivitas marketing diukur menggunakan rasio:
\[\text{Efektivitas} = \frac{\text{Total Sales}}{\text{Total Marketing}}\] Rasio ini menunjukkan berapa rupiah penjualan yang dihasilkan dari setiap 1 satuan biaya marketing. Semakin tinggi nilainya, semakin efisien penggunaan anggaran pemasaran produk tersebut.
Analisis ini meliputi:
library(DBI)
con <- DBI::dbConnect(odbc::odbc(),
Driver = "MySQL ODBC 8.0 ANSI Driver",
Server = "127.0.0.1",
Database = "coffee_chain",
UID = "root",
PWD = "090108",
Port = 3306)
Data diambil dari hasil JOIN antara tabel product dan
facttable, lalu dikelompokkan per produk menggunakan
GROUP BY.
# Ambil data Marketing, Sales, dan Profit per produk
dt <- dbGetQuery(con, "SELECT p.Product, p.`Product Line`, p.`Product Type`,
SUM(f.Marketing) AS Total_Marketing,
SUM(f.Sales) AS Total_Sales,
SUM(f.Profit) AS Total_Profit
FROM product p
JOIN facttable f ON p.ProductId = f.ProductId
GROUP BY p.Product, p.`Product Line`, p.`Product Type`
ORDER BY Total_Sales DESC")
dt
## Product Product Line Product Type Total_Marketing Total_Sales
## 1 Colombian Beans Coffee 17346 128311
## 2 Lemon Leaves Herbal Tea 15880 95926
## 3 Caffe Mocha Beans Espresso 19686 84904
## 4 Decaf Espresso Beans Espresso 10112 78162
## 5 Chamomile Leaves Herbal Tea 12166 75578
## 6 Darjeeling Leaves Tea 9766 73151
## 7 Earl Grey Leaves Tea 9846 66772
## 8 Decaf Irish Cream Beans Coffee 11362 62248
## 9 Caffe Latte Beans Espresso 5472 35899
## 10 Mint Leaves Herbal Tea 6108 35710
## 11 Green Tea Leaves Tea 7126 32850
## 12 Amaretto Beans Coffee 4658 26269
## 13 Regular Espresso Beans Espresso 2946 24031
## Total_Profit
## 1 55804
## 2 29869
## 3 17678
## 4 29502
## 5 27231
## 6 29053
## 7 24164
## 8 13989
## 9 11375
## 10 6154
## 11 -231
## 12 4890
## 13 10065
# Hitung rasio efektivitas: Sales per unit Marketing
dt$Efektivitas <- round(dt$Total_Sales / dt$Total_Marketing, 2)
# Urutkan dari yang paling efektif
dt <- dt[order(dt$Efektivitas, decreasing = TRUE), ]
dt
## Product Product Line Product Type Total_Marketing Total_Sales
## 13 Regular Espresso Beans Espresso 2946 24031
## 4 Decaf Espresso Beans Espresso 10112 78162
## 6 Darjeeling Leaves Tea 9766 73151
## 1 Colombian Beans Coffee 17346 128311
## 7 Earl Grey Leaves Tea 9846 66772
## 9 Caffe Latte Beans Espresso 5472 35899
## 5 Chamomile Leaves Herbal Tea 12166 75578
## 2 Lemon Leaves Herbal Tea 15880 95926
## 10 Mint Leaves Herbal Tea 6108 35710
## 12 Amaretto Beans Coffee 4658 26269
## 8 Decaf Irish Cream Beans Coffee 11362 62248
## 11 Green Tea Leaves Tea 7126 32850
## 3 Caffe Mocha Beans Espresso 19686 84904
## Total_Profit Efektivitas
## 13 10065 8.16
## 4 29502 7.73
## 6 29053 7.49
## 1 55804 7.40
## 7 24164 6.78
## 9 11375 6.56
## 5 27231 6.21
## 2 29869 6.04
## 10 6154 5.85
## 12 4890 5.64
## 8 13989 5.48
## 11 -231 4.61
## 3 17678 4.31
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.5.2
# Buat data format panjang untuk grouped bar chart
dt_long <- data.frame(
Product = rep(dt$Product, 2),
Metrik = c(rep("Total Marketing", nrow(dt)), rep("Total Sales", nrow(dt))),
Nilai = c(dt$Total_Marketing, dt$Total_Sales)
)
ggplot(dt_long, aes(x = reorder(Product, -Nilai), y = Nilai, fill = Metrik)) +
geom_bar(stat = "identity", position = "dodge") +
scale_fill_manual(values = c("Total Marketing" = "#e08214", "Total Sales" = "#2166ac")) +
coord_flip() +
labs(
title = "Perbandingan Total Marketing dan Sales per Produk",
subtitle = "Coffee Chain Dataset",
x = "Produk",
y = "Nilai",
fill = "Keterangan"
) +
theme_classic()
Interpretasi: Caffe Mocha memiliki biaya Marketing tertinggi, namun Sales-nya tidak sebanding (kalah jauh dari Colombian yang biaya marketingnya lebih rendah). Hal ini menunjukkan adanya perbedaan efisiensi antar produk dalam menggunakan anggaran pemasaran.
ggplot(dt, aes(x = reorder(Product, Efektivitas), y = Efektivitas, fill = Efektivitas)) +
geom_bar(stat = "identity", show.legend = FALSE) +
scale_fill_gradient(low = "#f4a582", high = "#1a9641") +
coord_flip() +
geom_hline(yintercept = mean(dt$Efektivitas), linetype = "dashed", color = "gray30") +
labs(
title = "Rasio Efektivitas Marketing per Produk",
subtitle = "Rasio = Total Sales / Total Marketing | Garis putus = rata-rata",
x = "Produk",
y = "Efektivitas (Sales per unit Marketing)"
) +
theme_classic()
Interpretasi: Regular Espresso memiliki rasio efektivitas tertinggi (8,16) artinya setiap 1 unit biaya marketing menghasilkan 8,16 unit penjualan. Diikuti oleh Decaf Espresso (7,73) dan Darjeeling (7,49). Sebaliknya, Caffe Mocha paling tidak efisien (4,31) dan Green Tea bahkan menghasilkan profit negatif meskipun tetap mengeluarkan biaya marketing.
# Ambil data per baris (bukan per produk) untuk scatter plot
dt2 <- dbGetQuery(con, "SELECT f.Marketing, f.Sales FROM facttable f")
ggplot(dt2, aes(x = Marketing, y = Sales)) +
geom_point(color = "#4393c3", alpha = 0.4, size = 1.5) +
geom_smooth(method = "lm", color = "#d6604d", se = TRUE) +
labs(
title = "Hubungan antara Biaya Marketing dan Sales",
subtitle = "Tiap titik mewakili satu transaksi",
x = "Marketing",
y = "Sales"
) +
theme_classic()
## `geom_smooth()` using formula = 'y ~ x'
Interpretasi: Scatter plot menunjukkan adanya tren positif antara biaya Marketing dan Sales, semakin besar biaya marketing, cenderung semakin besar pula penjualannya. Garis merah adalah garis regresi linear yang memperkuat pola tersebut.
Untuk mengetahui apakah terdapat hubungan yang signifikan antara biaya Marketing dan Sales, dilakukan uji korelasi Pearson.
Hipotesis:
uji_kor <- cor.test(dt2$Marketing, dt2$Sales, method = "pearson")
uji_kor
##
## Pearson's product-moment correlation
##
## data: dt2$Marketing and dt2$Sales
## t = 65.794, df = 4246, p-value < 2.2e-16
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.6952985 0.7250946
## sample estimates:
## cor
## 0.7105149
Interpretasi: Nilai koefisien korelasi Pearson sebesar 0.711 menunjukkan hubungan positif yang kuat antara biaya Marketing dan Sales. Dengan p-value jauh di bawah 0,05, H₀ ditolak: artinya secara statistik terdapat korelasi signifikan antara kedua variabel tersebut. Namun korelasi yang tidak sempurna (< 1,0) menunjukkan bahwa faktor lain seperti kualitas produk dan harga juga turut memengaruhi penjualan.
cat("Rata-rata efektivitas marketing :", mean(dt$Efektivitas), "\n")
## Rata-rata efektivitas marketing : 6.327692
cat("Median efektivitas marketing :", median(dt$Efektivitas), "\n")
## Median efektivitas marketing : 6.21
cat("Standar deviasi :", round(sd(dt$Efektivitas), 2), "\n")
## Standar deviasi : 1.18
cat("Efektivitas tertinggi :", max(dt$Efektivitas),":", dt$Product[which.max(dt$Efektivitas)], "\n")
## Efektivitas tertinggi : 8.16 : Regular Espresso
cat("Efektivitas terendah :", min(dt$Efektivitas),":", dt$Product[which.min(dt$Efektivitas)], "\n")
## Efektivitas terendah : 4.31 : Caffe Mocha
Berdasarkan analisis efektivitas biaya pemasaran pada dataset Coffee Chain, diperoleh kesimpulan berikut:
dbDisconnect(con)