Media periklanan merupakan salah satu strategi pemasaran yang digunakan perusahaan untuk meningkatkan penjualan produk. Periklanan melalui media televisi dan radio menjadi sarana promosi yang banyak digunakan karena mampu menjangkau masyarakat secara luas.
Dataset yang digunakan pada penelitian ini diperoleh melalui website Kaggle: https://www.kaggle.com/
Melalui penelitian ini akan dilakukan analisis regresi linear berganda untuk mengetahui pengaruh biaya iklan televisi (TV) dan radio (RADIO) terhadap tingkat penjualan produk (Sales). Analisis ini diharapkan dapat memberikan gambaran mengenai hubungan antara media periklanan dengan peningkatan penjualan produk.
Regresi linear berganda merupakan metode statistik yang digunakan untuk mengetahui hubungan antara satu variabel dependen dengan dua atau lebih variabel independen.
\[ Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \varepsilon \] Keterangan:
Uji asumsi regresi dilakukan untuk memastikan bahwa model regresi yang digunakan telah memenuhi asumsi dasar regresi linear.
Uji normalitas dilakukan untuk mengetahui apakah residual pada model regresi berdistribusi normal atau tidak. Pengujian dilakukan menggunakan Shapiro-Wilk Test.
Uji linearitas dilakukan untuk mengetahui apakah model regresi memenuhi asumsi linearitas. Pengujian dilakukan menggunakan Ramsey RESET Test.
Pemeriksaan sisaan dilakukan menggunakan grafik diagnostik regresi, yaitu: - Residual vs Fitted - Normal Q-Q - Scale-Location - Residual vs Leverage Grafik tersebut digunakan untuk melihat pola residual, mendeteksi heteroskedastisitas, normalitas residual, serta mengetahui adanya outlier atau data yang terlalu berpengaruh terhadap model.
Diberikan data pengeluaran biaya iklan televisi (TV) dan radio (RADIO) terhadap tingkat penjualan produk (Sales). Analisis dilakukan untuk mengetahui pengaruh media periklanan terhadap penjualan produk menggunakan regresi linear berganda.
#Memasukkan data
data <- read.csv2("C:/Users/LENOVO/Downloads/Adveristing.csv")
names(data)
## [1] "TV" "RADIO" "Sales"
head(data)
summary(data)
## TV RADIO Sales
## Min. : 8.60 Min. : 1.400 Min. : 2.22
## 1st Qu.: 65.15 1st Qu.: 5.625 1st Qu.:11.68
## Median :131.55 Median :22.200 Median :14.65
## Mean :141.84 Mean :22.547 Mean :14.69
## 3rd Qu.:228.75 3rd Qu.:36.875 3rd Qu.:17.93
## Max. :292.90 Max. :49.400 Max. :25.40
plot(data$TV, data$Sales,
main = "TV vs Sales",
xlab = "TV",
ylab = "Sales",
pch = 19,
col = "blue")
abline(lm(Sales ~ TV, data=data),
col = "red",
lwd = 2)
plot(data$RADIO, data$Sales,
main = "RADIO vs Sales",
xlab = "RADIO",
ylab = "Sales",
pch = 19,
col = "green")
abline(lm(Sales ~ RADIO, data=data),
col = "red",
lwd = 2)
#model regresi linier berganda
model <- lm(Sales ~ TV + RADIO, data=data)
summary(model)
##
## Call:
## lm(formula = Sales ~ TV + RADIO, data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -17.1206 -0.9277 -0.1056 1.3163 10.5860
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 7.354709 1.483772 4.957 1.61e-05 ***
## TV 0.040616 0.006562 6.190 3.48e-07 ***
## RADIO 0.069847 0.038251 1.826 0.0759 .
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3.787 on 37 degrees of freedom
## Multiple R-squared: 0.5144, Adjusted R-squared: 0.4881
## F-statistic: 19.6 on 2 and 37 DF, p-value: 1.572e-06
coef(model)
## (Intercept) TV RADIO
## 7.35470925 0.04061564 0.06984670
#pemeriksaan sisaan
par(mfrow=c(2,2))
plot(model)
#uji linieritas
library(lmtest)
resettest(model)
##
## RESET test
##
## data: model
## RESET = 1.2454, df1 = 2, df2 = 35, p-value = 0.3003
#uji normalitas
shapiro.test(residuals(model))
##
## Shapiro-Wilk normality test
##
## data: residuals(model)
## W = 0.73598, p-value = 3.998e-07
Berdasarkan hasil statistik deskriptif pada dataset Advertising.csv, diperoleh bahwa variabel TV, RADIO, dan Sales memiliki variasi data yang cukup baik untuk dilakukan analisis regresi linear. Variabel TV memiliki rata-rata yang cukup besar dibandingkan variabel RADIO sehingga menunjukkan bahwa pengeluaran iklan televisi lebih dominan pada dataset yang digunakan.
Berdasarkan scatter plot, terlihat bahwa titik-titik data cenderung membentuk pola linear positif dan mengikuti arah garis regresi yang meningkat. Hal ini menunjukkan bahwa terdapat hubungan positif antara variabel TV terhadap Sales. Semakin besar biaya iklan TV yang dikeluarkan, maka nilai Sales cenderung meningkat. Pada scatter plot RADIO terhadap Sales, titik-titik data juga menunjukkan hubungan positif meskipun penyebarannya lebih besar dibandingkan variabel TV. Hal ini menunjukkan bahwa hubungan linear antara RADIO terhadap Sales tidak sekuat hubungan TV terhadap Sales.
Berdasarkan hasil regresi linear berganda diperoleh model regresi yang menunjukkan bahwa variabel TV dan RADIO berpengaruh terhadap Sales. Variabel TV memiliki pengaruh yang lebih signifikan dibandingkan variabel RADIO.
Berdasarkan hasil Ramsey RESET Test diperoleh bahwa model regresi telah memenuhi asumsi linearitas sehingga model dapat digunakan untuk analisis regresi.
Berdasarkan hasil Shapiro-Wilk Test diperoleh bahwa residual belum sepenuhnya berdistribusi normal sehingga asumsi normalitas belum terpenuhi secara sempurna.
Berdasarkan hasil analisis regresi linear berganda menggunakan dataset Advertising.csv diperoleh bahwa variabel TV dan RADIO memiliki hubungan positif terhadap Sales. Variabel TV memiliki pengaruh yang lebih besar dibandingkan variabel RADIO terhadap peningkatan penjualan produk.
Hasil pengujian menunjukkan bahwa model regresi telah memenuhi asumsi linearitas, namun asumsi normalitas residual belum sepenuhnya terpenuhi. Secara keseluruhan, model regresi yang terbentuk dapat digunakan untuk melihat hubungan antara media periklanan dan penjualan produk.