library(tidyverse)
library(broom)
library(datarium)
library(ggplot2)
library(readxl)
data("marketing")
head(marketing, 3)
## youtube facebook newspaper sales
## 1 276.12 45.36 83.04 26.52
## 2 53.40 47.16 54.12 12.48
## 3 20.64 55.08 83.16 11.16
tail(marketing, 3)
## youtube facebook newspaper sales
## 198 212.40 11.16 7.68 15.36
## 199 340.32 50.40 79.44 30.60
## 200 278.52 10.32 10.44 16.08
str(marketing)
## 'data.frame': 200 obs. of 4 variables:
## $ youtube : num 276.1 53.4 20.6 181.8 217 ...
## $ facebook : num 45.4 47.2 55.1 49.6 13 ...
## $ newspaper: num 83 54.1 83.2 70.2 70.1 ...
## $ sales : num 26.5 12.5 11.2 22.2 15.5 ...
model <- lm(sales ~ youtube, data = marketing)
model
##
## Call:
## lm(formula = sales ~ youtube, data = marketing)
##
## Coefficients:
## (Intercept) youtube
## 8.43911 0.04754
Maka didapat sebuah model persamaan linier sebagai berikut Sales = 8.439 + 0.047 x Youtube
Dari persamaan tersebut, dapat diinterpretasikan bahwa ketika tidak ada pengeluaran iklan di YouTube (youtube = 0), nilai penjualan yang diprediksi adalah sebesar 8.43911 unit. Sementara itu, setiap peningkatan sebesar satu unit pengeluaran iklan di YouTube diperkirakan akan meningkatkan penjualan sebesar 0.04754 unit. Interpretasi ini berlaku dengan asumsi bahwa hubungan antara kedua variabel bersifat linier dan tidak dipengaruhi oleh variabel lain.
Bp Test untuk menguji Heterokedastisitas
library(lmtest)
bptest(model)
##
## studentized Breusch-Pagan test
##
## data: model
## BP = 48.038, df = 1, p-value = 4.18e-12
Hasil uji studentized Breusch-Pagan menunjukkan nilai statistik BP sebesar 48.038 dengan p-value 4.18e-12. Karena p-value jauh lebih kecil dari 0.05, maka hipotesis nol (yang menyatakan bahwa tidak ada heteroskedastisitas) ditolak. Artinya, terdapat indikasi kuat adanya heteroskedastisitas dalam model, sehingga varians residual tidak konstan. Hal ini melanggar asumsi klasik regresi dan dapat memengaruhi keakuratan estimasi model.
Durbin Watson test untuk menguji Autokorelasi
dwtest(model)
##
## Durbin-Watson test
##
## data: model
## DW = 1.9347, p-value = 0.3213
## alternative hypothesis: true autocorrelation is greater than 0
Hasil uji Durbin-Watson menunjukkan nilai DW sebesar 1.9347 dengan p-value 0.3213. Karena p-value lebih besar dari 0.05, maka tidak ada cukup bukti untuk menolak hipotesis nol, yang menyatakan tidak ada autokorelasi positif. Dengan demikian, residual dari model regresi tidak menunjukkan adanya autokorelasi, dan asumsi independensi residual terpenuhi.
Shapiro test untuk menguji normalitas
shapiro.test(residuals(model))
##
## Shapiro-Wilk normality test
##
## data: residuals(model)
## W = 0.99053, p-value = 0.2133
Hasil uji normalitas Shapiro-Wilk menunjukkan nilai W sebesar 0.99053 dengan p-value sebesar 0.2133. Karena p-value lebih besar dari 0.05, maka tidak ada cukup bukti untuk menolak hipotesis nol. Artinya, residual model regresi dapat dianggap berdistribusi normal. Ini menunjukkan bahwa asumsi normalitas residual terpenuhi.
Uji F
summary(model)
##
## Call:
## lm(formula = sales ~ youtube, data = marketing)
##
## Residuals:
## Min 1Q Median 3Q Max
## -10.0632 -2.3454 -0.2295 2.4805 8.6548
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 8.439112 0.549412 15.36 <2e-16 ***
## youtube 0.047537 0.002691 17.67 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3.91 on 198 degrees of freedom
## Multiple R-squared: 0.6119, Adjusted R-squared: 0.6099
## F-statistic: 312.1 on 1 and 198 DF, p-value: < 2.2e-16
Hasil regresi menunjukkan bahwa pengeluaran iklan di YouTube berpengaruh signifikan terhadap penjualan. Setiap peningkatan 1 unit pengeluaran iklan YouTube diperkirakan menaikkan penjualan sebesar 0,0475 unit. Model ini signifikan secara statistik (p-value < 2e-16) dan mampu menjelaskan sekitar 61,2% variasi penjualan (R² = 0,6119). Secara keseluruhan, model cukup baik dalam menjelaskan hubungan antara iklan YouTube dan penjualan.