🎯 Kasus: Pengaruh Iklan terhadap Penjualan Produk

💡 Judul: Analisis Regresi Linear: Pengaruh Biaya Iklan terhadap Penjualan di Perusahaan FMCG

📌 Tujuan:

Menganalisis apakah dan seberapa besar biaya iklan (TV, radio, surat kabar) memengaruhi penjualan produk.

📊 Dataset

  • Sumber data asli: https://www.statlearning.com/resources-second-edition (Cari file bernama Advertising.csv di bagian “Data Sets”)

  • Variabel:

TV: pengeluaran iklan di televisi (ribu dolar)

Radio: pengeluaran iklan di radio (ribu dolar)

Newspaper: pengeluaran iklan di surat kabar (ribu dolar)

Sales: penjualan produk (unit)

# 1. Load Data
url <- "https://www.statlearning.com/s/Advertising.csv"
download.file(url, destfile = "Advertising.csv", mode = "wb")
advertising <- read.csv("Advertising.csv")

# 2. Lihat struktur data
str(advertising)
'data.frame':   200 obs. of  5 variables:
 $ X        : int  1 2 3 4 5 6 7 8 9 10 ...
 $ TV       : num  230.1 44.5 17.2 151.5 180.8 ...
 $ radio    : num  37.8 39.3 45.9 41.3 10.8 48.9 32.8 19.6 2.1 2.6 ...
 $ newspaper: num  69.2 45.1 69.3 58.5 58.4 75 23.5 11.6 1 21.2 ...
 $ sales    : num  22.1 10.4 9.3 18.5 12.9 7.2 11.8 13.2 4.8 10.6 ...
# 3. Baca file yang sudah diunduh (opsional, sudah di-load di langkah 1)
advertising <- read.csv("Advertising.csv")

# 4. Cek beberapa baris pertama
head(advertising)
  X    TV radio newspaper sales
1 1 230.1  37.8      69.2  22.1
2 2  44.5  39.3      45.1  10.4
3 3  17.2  45.9      69.3   9.3
4 4 151.5  41.3      58.5  18.5
5 5 180.8  10.8      58.4  12.9
6 6   8.7  48.9      75.0   7.2
# 5. Lihat struktur data (ulang untuk memastikan)
str(advertising)
'data.frame':   200 obs. of  5 variables:
 $ X        : int  1 2 3 4 5 6 7 8 9 10 ...
 $ TV       : num  230.1 44.5 17.2 151.5 180.8 ...
 $ radio    : num  37.8 39.3 45.9 41.3 10.8 48.9 32.8 19.6 2.1 2.6 ...
 $ newspaper: num  69.2 45.1 69.3 58.5 58.4 75 23.5 11.6 1 21.2 ...
 $ sales    : num  22.1 10.4 9.3 18.5 12.9 7.2 11.8 13.2 4.8 10.6 ...
# 6. Model regresi linear berganda: sales diprediksi oleh TV, radio, dan newspaper
model <- lm(sales ~ TV + radio + newspaper, data = advertising)

# 7. Lihat ringkasan model (koefisien, R-squared, p-value, dll)
summary(model)

Call:
lm(formula = sales ~ TV + radio + newspaper, data = advertising)

Residuals:
    Min      1Q  Median      3Q     Max 
-8.8277 -0.8908  0.2418  1.1893  2.8292 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept)  2.938889   0.311908   9.422   <2e-16 ***
TV           0.045765   0.001395  32.809   <2e-16 ***
radio        0.188530   0.008611  21.893   <2e-16 ***
newspaper   -0.001037   0.005871  -0.177     0.86    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 1.686 on 196 degrees of freedom
Multiple R-squared:  0.8972,    Adjusted R-squared:  0.8956 
F-statistic: 570.3 on 3 and 196 DF,  p-value: < 2.2e-16
# 8. Visualisasi hubungan antara TV dan Penjualan dengan garis regresi
plot(advertising$TV, advertising$sales,
     main = "Hubungan Iklan TV dan Penjualan",
     xlab = "Biaya Iklan TV (ribu dolar)",
     ylab = "Penjualan (unit)")
abline(lm(sales ~ TV, data = advertising), col = "blue", lwd = 2)

# 9. Visualisasi hubungan antara Radio dan Penjualan dengan garis regresi (opsional)
plot(advertising$radio, advertising$sales,
     main = "Hubungan Iklan Radio dan Penjualan",
     xlab = "Biaya Iklan Radio (ribu dolar)",
     ylab = "Penjualan (unit)")
abline(lm(sales ~ radio, data = advertising), col = "red", lwd = 2)

# 10. Visualisasi hubungan antara Newspaper dan Penjualan dengan garis regresi (opsional)
plot(advertising$newspaper, advertising$sales,
     main = "Hubungan Iklan Newspaper dan Penjualan",
     xlab = "Biaya Iklan Newspaper (ribu dolar)",
     ylab = "Penjualan (unit)")
abline(lm(sales ~ newspaper, data = advertising), col = "green", lwd = 2)

# 11. Diagnostik model - plot residuals
par(mfrow = c(2, 2))  # menampilkan 4 plot diagnostik sekaligus
plot(model)

par(mfrow = c(1, 1))  # reset layout plot

Interpretasi Singkat

  • Model regresi linear berganda menggunakan variabel prediktor TV, radio, dan newspaper untuk memprediksi sales.

  • Dari output **summary*(model)**:

  • TV memiliki koefisien positif dan p-value sangat kecil (< 0.001), menunjukkan bahwa pengeluaran iklan di TV secara signifikan meningkatkan penjualan.

  • Radio juga berpengaruh positif dan signifikan (p-value < 0.05), menunjukkan iklan radio efektif untuk meningkatkan penjualan.

  • Newspaper memiliki koefisien kecil dengan p-value > 0.1, artinya iklan surat kabar tidak berkontribusi signifikan pada penjualan dalam model ini.

  • Nilai Adjusted R-squared mendekati 0.9, mengindikasikan model sangat baik menjelaskan variabilitas penjualan produk berdasarkan pengeluaran iklan.

  • Visualisasi scatter plot dengan garis regresi dari variabel TV, radio, dan newspaper mengkonfirmasi pola hubungan linear positif pada TV dan radio, sedangkan newspaper hubungan terlihat lebih lemah.

  • Diagnostik model (plot residuals) menunjukkan bahwa asumsi regresi (linearitas, homoskedastisitas, normalitas residual) secara umum terpenuhi, sehingga model valid digunakan.

Kesimpulan

  • Pengeluaran iklan di TV berpengaruh positif dan signifikan terhadap penjualan produk. Artinya, semakin besar biaya iklan di TV, semakin tinggi penjualan yang dicapai.

  • Pengeluaran iklan di radio juga berpengaruh positif dan signifikan terhadap penjualan. Ini menunjukkan efektivitas iklan radio dalam mendorong penjualan.

  • Pengeluaran iklan di surat kabar tidak berpengaruh signifikan terhadap penjualan produk. Oleh karena itu, iklan di media surat kabar kurang efektif dalam meningkatkan penjualan pada kasus ini.

  • Model regresi menjelaskan sekitar 90% variasi penjualan. Hal ini menandakan model regresi dalam menggambarkan hubungan antara pengeluaran iklan dan penjualan.

  • Analisis residual menunjukkan asumsi regresi terpenuhi, sehingga hasil model dapat diandalkan.

Manfaat untuk Bidang Manajemen

  • Optimalisasi Anggaran Pemasaran: Manajer pemasaran dapat memfokuskan pengeluaran iklan pada media yang terbukti efektif (TV dan radio), sehingga meningkatkan efisiensi biaya.

  • Pengambilan Keputusan Berbasis Data: Hasil regresi memberikan dasar analitik yang kuat untuk keputusan alokasi anggaran iklan, mengurangi spekulasi.

  • Evaluasi Strategi Pemasaran: Manajemen dapat melakukan evaluasi berkala dengan data dan analisis serupa untuk menyesuaikan strategi iklan sesuai tren pasar.

  • Perencanaan Kampanye yang Tepat Sasaran: Dengan mengetahui media mana yang berdampak signifikan, kampanye iklan dapat dirancang lebih terfokus dan efektif.