Deskripsi Dataset

Data yang digunakan merupakan dataset Album Sales yang berisi 200 observasi dengan variabel:

  • Sales (Y);

  • Adverts (X1);

  • Airplay (X2);

  • Image (X3).

## Warning: package 'readxl' was built under R version 4.4.3
## # A tibble: 6 × 4
##   adverts sales airplay image
##     <dbl> <dbl>   <dbl> <dbl>
## 1    986.   120      28     7
## 2   1446.   360      35     7
## 3   1188.   270      33     7
## 4    575.   220      44     5
## 5    569.   170      19     5
## 6    472.    70      20     1

Model Regresi Linier Berganda

Model umum: \[ y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \beta_3X_3 + \epsilon \]

Model Awal

model <- lm(sales ~ adverts + airplay + image, data = df)
summary(model)
## 
## Call:
## lm(formula = sales ~ adverts + airplay + image, data = df)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -117.637  -26.901   -0.177   28.597  147.115 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -21.191130  17.358829  -1.221    0.224    
## adverts       0.086546   0.006898  12.547  < 2e-16 ***
## airplay       3.324031   0.275801  12.052  < 2e-16 ***
## image        10.233371   2.445324   4.185 4.31e-05 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 46.63 on 195 degrees of freedom
## Multiple R-squared:  0.668,  Adjusted R-squared:  0.6629 
## F-statistic: 130.8 on 3 and 195 DF,  p-value: < 2.2e-16

Berdasarkan output di atas, diperoleh model awal sebagai berikut: \[ \hat{y} = -21.191130 + 0.086546X_1 + 3.324031X_2 + 10.233371X_3 \]

Uji Signifikansi Model

Uji F

Uji F dilakukan untuk mengetahui apakah seluruh variabel independen secara bersama-sama berpengaruh terhadap profit.

Hipotesis:

H0 : β1 = β2 = β3 = 0

H1 : Minimal satu βi ≠ 0

Taraf Signifikansi: α = 0.05

Statistik Uji: \[p-value < 2.2e-16\] Keputusan dan Kesimpulan: berdasarkan hasil uji F diperoleh nilai p-value < 0.05, sehingga H0 ditolak. Artinya secara simultan variabel adverts (X1), airplay(X2), dan image(X3) berpengaruh signifikan terhadap Sales(Y).

Uji t

Uji t dilakukan untuk mengetahui pengaruh masing-masing variabel independen terhadap variabel dependen.

Hipotesis untuk setiap variabel:

H0 : βi = 0

H1 : βi ≠ 0

Taraf Signifikansi: α = 0.05

Statistik Uji:

summary(model)$coefficients
##                 Estimate   Std. Error   t value     Pr(>|t|)
## (Intercept) -21.19112994 17.358828531 -1.220770 2.236473e-01
## adverts       0.08654637  0.006897813 12.546928 7.378959e-27
## airplay       3.32403084  0.275800596 12.052298 2.319346e-25
## image        10.23337066  2.445323602  4.184874 4.313462e-05

Keputusan dan Kesimpulan: berdasarkan uji t, diperoleh nilai p-value untuk setiap variabel adalah adverts (X1) = 7.378959e-27, airplay(X2) = 2.319346e-25, dan image(X3) = 4.313462e-05. Sehingga dapat disimpulkan bahwa hanya seluruh variabel independen berpengaruh signifikan terhadap penjualan album.

Koefisien Determinasi (R^2)

Bertujuan mengukur seberapa besar variasi Sales dapat dijelaskan oleh model. Berdasarkan uji diperoleh \[R^2 = 0.668\] artinya sebesar 66.8% variasi Sales dapat dijelaskan oleh model.

Uji Asumsi Klasik

Normalitas Residual

Bertujuan untuk mengetahui apakah residual berdistribusi normal.

Hipotesis:

H0 : Residual berdistribusi normal

H1 : Residual tidak berdistribusi normal

Taraf Signifikansi: α = 0.05

Statistik Uji:

res <- resid(model)
res_std <- scale(res)

# Uji Kolmogorov-Smirnov
ks.test(res_std, "pnorm")
## 
##  Asymptotic one-sample Kolmogorov-Smirnov test
## 
## data:  res_std
## D = 0.035217, p-value = 0.966
## alternative hypothesis: two-sided
qqnorm(res)
qqline(res, col="red")

Diperoleh p-value sebesar 0.966 yang nilainya lebih dari 0.05. Sehingga dapat disimpulkan bahwa residual berdistribusi normal.

Uji Multikolinieritas

Bertujuan untuk mengetahui apakah terjadi korelasi tinggi antar variabel independen.

library(car)
## Warning: package 'car' was built under R version 4.4.3
## Loading required package: carData
vif(model)
##  adverts  airplay    image 
## 1.018894 1.039425 1.036438

Diperoleh nilai VIF masing-masing variabel yang kurang dari 10. Sehingga dapat disimpulkan bahwa tidak terjadi multikolinieritas.

Uji Heteroskedastisitas

Bertujuan untuk mengetahui apakah varians residual konstan.

Hipotesis:

H0 : Tidak terjadi heteroskedastisitas

H1 : Terjadi heteroskedastisitas

Taraf Signifikansi: α = 0.05

Statistik Uji:

library(lmtest)
## Warning: package 'lmtest' was built under R version 4.4.3
## Loading required package: zoo
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
bptest(model)
## 
##  studentized Breusch-Pagan test
## 
## data:  model
## BP = 4.3063, df = 3, p-value = 0.2302
plot(model$fitted.values, res)
abline(h=0, col="blue")

Diperoleh p-value sebesar 0.2302 yang nilainya lebih dari 0.05 dan dari plot dapat terlihat bahwa data menyebar dan tidak membentuk pola. Sehingga dapat disimpulkan bahwa tidak terjadi heteroskedastisitas.

Uji Autokorelasi

Bertujuan untuk mengetahui apakah residual saling berkorelasi.

Hipotesis:

H0 : Tidak ada autokorelasi

H1 : Ada autokorelasi

Taraf Signifikansi: α = 0.05

Statistik Uji:

dwtest(model)
## 
##  Durbin-Watson test
## 
## data:  model
## DW = 1.902, p-value = 0.2435
## alternative hypothesis: true autocorrelation is greater than 0

Diperoleh p-value sebesar 0.2435 yang lebih besar dari 0.05. Sehingga disimpulkan bahwa tidak ada autokorelasi.

Model Akhir

Berdasarkan uji signifikansi model dan uji asumsi klasik, diperoleh kesimpulan bahwa seluruh asumsi terpenuhi. Sehingga model akhirnya adalah sebagai berikut: \[ \hat{y} = -21.191130 + 0.086546X_1 + 3.324031X_2 + 10.233371X_3 \]