Data yang digunakan merupakan dataset Album Sales yang berisi 200 observasi dengan variabel:
Sales (Y);
Adverts (X1);
Airplay (X2);
Image (X3).
## Warning: package 'readxl' was built under R version 4.4.3
## # A tibble: 6 × 4
## adverts sales airplay image
## <dbl> <dbl> <dbl> <dbl>
## 1 986. 120 28 7
## 2 1446. 360 35 7
## 3 1188. 270 33 7
## 4 575. 220 44 5
## 5 569. 170 19 5
## 6 472. 70 20 1
Model umum: \[ y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \beta_3X_3 + \epsilon \]
##
## Call:
## lm(formula = sales ~ adverts + airplay + image, data = df)
##
## Residuals:
## Min 1Q Median 3Q Max
## -117.637 -26.901 -0.177 28.597 147.115
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -21.191130 17.358829 -1.221 0.224
## adverts 0.086546 0.006898 12.547 < 2e-16 ***
## airplay 3.324031 0.275801 12.052 < 2e-16 ***
## image 10.233371 2.445324 4.185 4.31e-05 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 46.63 on 195 degrees of freedom
## Multiple R-squared: 0.668, Adjusted R-squared: 0.6629
## F-statistic: 130.8 on 3 and 195 DF, p-value: < 2.2e-16
Berdasarkan output di atas, diperoleh model awal sebagai berikut: \[ \hat{y} = -21.191130 + 0.086546X_1 + 3.324031X_2 + 10.233371X_3 \]
Uji F dilakukan untuk mengetahui apakah seluruh variabel independen secara bersama-sama berpengaruh terhadap profit.
Hipotesis:
H0 : β1 = β2 = β3 = 0
H1 : Minimal satu βi ≠ 0
Taraf Signifikansi: α = 0.05
Statistik Uji: \[p-value < 2.2e-16\] Keputusan dan Kesimpulan: berdasarkan hasil uji F diperoleh nilai p-value < 0.05, sehingga H0 ditolak. Artinya secara simultan variabel adverts (X1), airplay(X2), dan image(X3) berpengaruh signifikan terhadap Sales(Y).
Uji t dilakukan untuk mengetahui pengaruh masing-masing variabel independen terhadap variabel dependen.
Hipotesis untuk setiap variabel:
H0 : βi = 0
H1 : βi ≠ 0
Taraf Signifikansi: α = 0.05
Statistik Uji:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -21.19112994 17.358828531 -1.220770 2.236473e-01
## adverts 0.08654637 0.006897813 12.546928 7.378959e-27
## airplay 3.32403084 0.275800596 12.052298 2.319346e-25
## image 10.23337066 2.445323602 4.184874 4.313462e-05
Keputusan dan Kesimpulan: berdasarkan uji t, diperoleh nilai p-value untuk setiap variabel adalah adverts (X1) = 7.378959e-27, airplay(X2) = 2.319346e-25, dan image(X3) = 4.313462e-05. Sehingga dapat disimpulkan bahwa hanya seluruh variabel independen berpengaruh signifikan terhadap penjualan album.
Bertujuan mengukur seberapa besar variasi Sales dapat dijelaskan oleh model. Berdasarkan uji diperoleh \[R^2 = 0.668\] artinya sebesar 66.8% variasi Sales dapat dijelaskan oleh model.
Bertujuan untuk mengetahui apakah residual berdistribusi normal.
Hipotesis:
H0 : Residual berdistribusi normal
H1 : Residual tidak berdistribusi normal
Taraf Signifikansi: α = 0.05
Statistik Uji:
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: res_std
## D = 0.035217, p-value = 0.966
## alternative hypothesis: two-sided
Diperoleh p-value sebesar 0.966 yang nilainya lebih dari 0.05. Sehingga dapat disimpulkan bahwa residual berdistribusi normal.
Bertujuan untuk mengetahui apakah terjadi korelasi tinggi antar variabel independen.
## Warning: package 'car' was built under R version 4.4.3
## Loading required package: carData
## adverts airplay image
## 1.018894 1.039425 1.036438
Diperoleh nilai VIF masing-masing variabel yang kurang dari 10. Sehingga dapat disimpulkan bahwa tidak terjadi multikolinieritas.
Bertujuan untuk mengetahui apakah varians residual konstan.
Hipotesis:
H0 : Tidak terjadi heteroskedastisitas
H1 : Terjadi heteroskedastisitas
Taraf Signifikansi: α = 0.05
Statistik Uji:
## Warning: package 'lmtest' was built under R version 4.4.3
## Loading required package: zoo
##
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
##
## studentized Breusch-Pagan test
##
## data: model
## BP = 4.3063, df = 3, p-value = 0.2302
Diperoleh p-value sebesar 0.2302 yang nilainya lebih dari 0.05 dan dari plot dapat terlihat bahwa data menyebar dan tidak membentuk pola. Sehingga dapat disimpulkan bahwa tidak terjadi heteroskedastisitas.
Bertujuan untuk mengetahui apakah residual saling berkorelasi.
Hipotesis:
H0 : Tidak ada autokorelasi
H1 : Ada autokorelasi
Taraf Signifikansi: α = 0.05
Statistik Uji:
##
## Durbin-Watson test
##
## data: model
## DW = 1.902, p-value = 0.2435
## alternative hypothesis: true autocorrelation is greater than 0
Diperoleh p-value sebesar 0.2435 yang lebih besar dari 0.05. Sehingga disimpulkan bahwa tidak ada autokorelasi.
Berdasarkan uji signifikansi model dan uji asumsi klasik, diperoleh kesimpulan bahwa seluruh asumsi terpenuhi. Sehingga model akhirnya adalah sebagai berikut: \[ \hat{y} = -21.191130 + 0.086546X_1 + 3.324031X_2 + 10.233371X_3 \]