Pendahuluan

Media periklanan merupakan salah satu strategi pemasaran yang digunakan perusahaan untuk meningkatkan penjualan produk. Periklanan melalui media televisi dan radio menjadi sarana promosi yang banyak digunakan karena mampu menjangkau masyarakat secara luas.

Dataset yang digunakan pada penelitian ini diperoleh melalui website Kaggle: https://www.kaggle.com/

Melalui penelitian ini akan dilakukan analisis regresi linear berganda untuk mengetahui pengaruh biaya iklan televisi (TV) dan radio (RADIO) terhadap tingkat penjualan produk (Sales). Analisis ini diharapkan dapat memberikan gambaran mengenai hubungan antara media periklanan dengan peningkatan penjualan produk.

Regresi Linier Berganda

Regresi linear berganda merupakan metode statistik yang digunakan untuk mengetahui hubungan antara satu variabel dependen dengan dua atau lebih variabel independen.

Persamaan regresi linier berganda

\[ Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \varepsilon \] Keterangan:

  • Y = Variabel dependen (Sales)
  • X₁ = Variabel TV
  • X₂ = Variabel RADIO
  • \(\beta0\) = konstanta
  • \(\beta1 dan \beta2\) = koefisien regresi
  • \(\varepsilon\) = residual

Uji Asumsi Regresi

Uji asumsi regresi dilakukan untuk memastikan bahwa model regresi yang digunakan telah memenuhi asumsi dasar regresi linear.

Uji Normalitas

Uji normalitas dilakukan untuk mengetahui apakah residual pada model regresi berdistribusi normal atau tidak. Pengujian dilakukan menggunakan Shapiro-Wilk Test.

Hipotesis

  • \(H_0\) : Residual berdistribusi normal
  • \(H_1\) : Residual tidak berdistribusi normal

Uji LInieritas

Uji linearitas dilakukan untuk mengetahui apakah model regresi memenuhi asumsi linearitas. Pengujian dilakukan menggunakan Ramsey RESET Test.

Hipotesis

  • \(H_0\) : Model regresi sudah linier
  • \(H_1\) : Model regresi tidak linier

Pemeriksaan Sisaan (Residual)

Pemeriksaan sisaan dilakukan menggunakan grafik diagnostik regresi, yaitu: - Residual vs Fitted - Normal Q-Q - Scale-Location - Residual vs Leverage Grafik tersebut digunakan untuk melihat pola residual, mendeteksi heteroskedastisitas, normalitas residual, serta mengetahui adanya outlier atau data yang terlalu berpengaruh terhadap model.

Penerapan

Kasus

Diberikan data pengeluaran biaya iklan televisi (TV) dan radio (RADIO) terhadap tingkat penjualan produk (Sales). Analisis dilakukan untuk mengetahui pengaruh media periklanan terhadap penjualan produk menggunakan regresi linear berganda.

Penyelesaian

#Memasukkan data
data <- read.csv2("C:/Users/LENOVO/Downloads/Adveristing.csv")
names(data)
## [1] "TV"    "RADIO" "Sales"
head(data)
summary(data)
##        TV             RADIO            Sales      
##  Min.   :  8.60   Min.   : 1.400   Min.   : 2.22  
##  1st Qu.: 65.15   1st Qu.: 5.625   1st Qu.:11.68  
##  Median :131.55   Median :22.200   Median :14.65  
##  Mean   :141.84   Mean   :22.547   Mean   :14.69  
##  3rd Qu.:228.75   3rd Qu.:36.875   3rd Qu.:17.93  
##  Max.   :292.90   Max.   :49.400   Max.   :25.40
plot(data$TV, data$Sales,
     main = "TV vs Sales",
     xlab = "TV",
     ylab = "Sales",
     pch = 19,
     col = "blue")

abline(lm(Sales ~ TV, data=data),
       col = "red",
       lwd = 2)

plot(data$RADIO, data$Sales,
     main = "RADIO vs Sales",
     xlab = "RADIO",
     ylab = "Sales",
     pch = 19,
     col = "green")

abline(lm(Sales ~ RADIO, data=data),
       col = "red",
       lwd = 2)

#model regresi linier berganda
model <- lm(Sales ~ TV + RADIO, data=data)
summary(model)
## 
## Call:
## lm(formula = Sales ~ TV + RADIO, data = data)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -17.1206  -0.9277  -0.1056   1.3163  10.5860 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 7.354709   1.483772   4.957 1.61e-05 ***
## TV          0.040616   0.006562   6.190 3.48e-07 ***
## RADIO       0.069847   0.038251   1.826   0.0759 .  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.787 on 37 degrees of freedom
## Multiple R-squared:  0.5144, Adjusted R-squared:  0.4881 
## F-statistic:  19.6 on 2 and 37 DF,  p-value: 1.572e-06
coef(model)
## (Intercept)          TV       RADIO 
##  7.35470925  0.04061564  0.06984670
#pemeriksaan sisaan
par(mfrow=c(2,2))
plot(model)

#uji linieritas
library(lmtest)
resettest(model)
## 
##  RESET test
## 
## data:  model
## RESET = 1.2454, df1 = 2, df2 = 35, p-value = 0.3003
#uji normalitas
shapiro.test(residuals(model))
## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(model)
## W = 0.73598, p-value = 3.998e-07

Interpretasi Hasil

Statistik Deskriptif

Berdasarkan hasil statistik deskriptif pada dataset Advertising.csv, diperoleh bahwa variabel TV, RADIO, dan Sales memiliki variasi data yang cukup baik untuk dilakukan analisis regresi linear. Variabel TV memiliki rata-rata yang cukup besar dibandingkan variabel RADIO sehingga menunjukkan bahwa pengeluaran iklan televisi lebih dominan pada dataset yang digunakan.

Scatter Plot

Berdasarkan scatter plot, terlihat bahwa titik-titik data cenderung membentuk pola linear positif dan mengikuti arah garis regresi yang meningkat. Hal ini menunjukkan bahwa terdapat hubungan positif antara variabel TV terhadap Sales. Semakin besar biaya iklan TV yang dikeluarkan, maka nilai Sales cenderung meningkat. Pada scatter plot RADIO terhadap Sales, titik-titik data juga menunjukkan hubungan positif meskipun penyebarannya lebih besar dibandingkan variabel TV. Hal ini menunjukkan bahwa hubungan linear antara RADIO terhadap Sales tidak sekuat hubungan TV terhadap Sales.

Regresi Linier Berganda

Berdasarkan hasil regresi linear berganda diperoleh model regresi yang menunjukkan bahwa variabel TV dan RADIO berpengaruh terhadap Sales. Variabel TV memiliki pengaruh yang lebih signifikan dibandingkan variabel RADIO.

Uji Linieritas

Berdasarkan hasil Ramsey RESET Test diperoleh bahwa model regresi telah memenuhi asumsi linearitas sehingga model dapat digunakan untuk analisis regresi.

Uji Normalitas

Berdasarkan hasil Shapiro-Wilk Test diperoleh bahwa residual belum sepenuhnya berdistribusi normal sehingga asumsi normalitas belum terpenuhi secara sempurna.

Kesimpulan

Berdasarkan hasil analisis regresi linear berganda menggunakan dataset Advertising.csv diperoleh bahwa variabel TV dan RADIO memiliki hubungan positif terhadap Sales. Variabel TV memiliki pengaruh yang lebih besar dibandingkan variabel RADIO terhadap peningkatan penjualan produk.

Hasil pengujian menunjukkan bahwa model regresi telah memenuhi asumsi linearitas, namun asumsi normalitas residual belum sepenuhnya terpenuhi. Secara keseluruhan, model regresi yang terbentuk dapat digunakan untuk melihat hubungan antara media periklanan dan penjualan produk.

Referensi