Soal
Diberikan data tentang IQ dan tingkat kehadiran sepuluh siswa di kelas yang diperkirakan mempengaruhi nilai UAS.
| Siswa | IQ (X2) | Tingkat kehadiran (%) (X1) | Nilai UAS (Y) |
|---|---|---|---|
| 1 | 110 | 60 | 65 |
| 2 | 120 | 70 | 70 |
| 3 | 115 | 75 | 75 |
| 4 | 130 | 80 | 75 |
| 5 | 110 | 80 | 80 |
| 6 | 120 | 90 | 80 |
| 7 | 120 | 95 | 85 |
| 8 | 125 | 95 | 95 |
| 9 | 110 | 100 | 90 |
| 10 | 120 | 100 | 98 |
Pertanyaan:
- Buatlah persamaan regresi linier berganda! (hitung beta duga secara manual di R dan bandingkan dengan fungsi lm)
- Lakukan Uji-F! (interpretasikan hasilnya)
- Lakukan Uji-t! (interpretasikan hasilnya)
- Berapa koefisien determinasinya? Interpretasi hasil ini!
- Lakukan uji asumsi dan jelaskan hasilnya
Penyelesaian
Persamaan Regresi Linier Berganda
Buat input datanya
# Input Data
x1 <- c(60, 70, 75, 80, 80, 90, 95, 95, 100, 100)
x2 <- c(110, 120, 115, 130, 110, 120, 120, 125, 110, 120)
y <- c(65, 70, 75, 75, 80, 80, 85, 95, 90, 98)
n <- length(y)Hitung beta duga dengan rumus penduga parameter \(\beta\) adalah: \[\hat{\beta} = (X^T X)^{-1} X^T Y\]
# Membuat Matriks untuk hitung manual
X <- cbind(1, x1, x2)
Y <- matrix(y, ncol = 1)
# Perhitungan Manual
beta_manual <- solve(t(X) %*% X) %*% t(X) %*% Y
print(beta_manual)## [,1]
## 23.0544545
## x1 0.7372330
## x2 -0.0343275
Bandingkan dengan Fungsi lm()
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 23.0544545 25.5716101 0.9015644 0.3972467061
## x1 0.7372330 0.1091797 6.7524718 0.0002644133
## x2 -0.0343275 0.2205125 -0.1556715 0.8806860631
Hasilnya nilai intersep, koefisien \(x_1\), dan koefisien \(x_2\) dari kedua metode akan sama. Persamaannya akan berbentuk: \[Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2\]
Uji-F (Simultan)
Uji ini digunakan untuk melihat apakah \(X_1\) dan \(X_2\) secara bersama-sama berpengaruh signifikan terhadap \(Y\).
Hipotesis:
\(H_0\): Tidak ada pengaruh signifikan secara simultan.
\(H_1\): Minimal ada satu variabel independen yang berpengaruh signifikan.
Gunakan summary untuk melihat p-value nya
##
## Call:
## lm(formula = y ~ x1 + x2)
##
## Residuals:
## Min 1Q Median 3Q Max
## -5.2861 -2.8939 0.0296 1.6791 6.1993
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 23.05445 25.57161 0.902 0.397247
## x1 0.73723 0.10918 6.752 0.000264 ***
## x2 -0.03433 0.22051 -0.156 0.880686
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 4.346 on 7 degrees of freedom
## Multiple R-squared: 0.8719, Adjusted R-squared: 0.8353
## F-statistic: 23.82 on 2 and 7 DF, p-value: 0.0007523
Interpretasi: Lihat nilai F-statistic dan p-value pada output summary(model). karena p-value < 0.05, maka kita tolak \(H_0\) (berpengaruh signifikan).
Uji-t (Parsial)
Uji ini melihat pengaruh masing-masing variabel secara individu.
Gunakan summary untuk melihat p-value nya
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 23.0544545 25.5716101 0.9015644 0.3972467061
## x1 0.7372330 0.1091797 6.7524718 0.0002644133
## x2 -0.0343275 0.2205125 -0.1556715 0.8806860631
Interpretasi: Lihat nilai Pr(>|t|) pada output summary(model)
Tingkat Kehadiran (\(X_1\)): p-value < 0.05, maka kehadiran berpengaruh signifikan terhadap nilai UAS.
IQ (\(X_2\)): p-value > 0.05, maka IQ tidak ada pengaruh signifikan terhadap nilai UAS.
Koefisien Determinasi
Cek nilai Multiple R-squared pada output summary model.
##
## Call:
## lm(formula = y ~ x1 + x2)
##
## Residuals:
## Min 1Q Median 3Q Max
## -5.2861 -2.8939 0.0296 1.6791 6.1993
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 23.05445 25.57161 0.902 0.397247
## x1 0.73723 0.10918 6.752 0.000264 ***
## x2 -0.03433 0.22051 -0.156 0.880686
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 4.346 on 7 degrees of freedom
## Multiple R-squared: 0.8719, Adjusted R-squared: 0.8353
## F-statistic: 23.82 on 2 and 7 DF, p-value: 0.0007523
\(R^2 = 0.87.19\), artinya 87.19% variasi Nilai UAS dapat dijelaskan oleh Tingkat Kehadiran dan IQ, sedangkan 12.81% sisanya dijelaskan oleh variabel lain di luar model.
Uji Asumsi
## Loading required package: zoo
##
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
## Loading required package: carData
##
## Shapiro-Wilk normality test
##
## data: residuals(model)
## W = 0.95125, p-value = 0.6833
Hasil fungsi shapiro.test pada nilai residual model yang bertujuan untuk menguji kenormalan sebaran data. Output tersebut menunjukkan nilai probabilitas atau p-value sebesar 0.6833. Mengingat besaran nilai ini jauh melampaui tingkat signifikansi standar yaitu 0.05, kita tidak menolak hipotesis nol. Hal ini menunjukan bahwa galat atau residual dari model regresi kita telah menyebar secara normal.
##
## studentized Breusch-Pagan test
##
## data: model
## BP = 5.905, df = 2, p-value = 0.05221
Hasil Breusch-Pagan test dengan menggunakan fungsi bptest. Uji ini memastikan bahwa varians dari residual bersifat konstan di seluruh pengamatan. Dari hasil yang ada, kita mendapatkan nilai p-value sebesar 0.05221. Meskipun angka probabilitas ini berada sangat dekat dengan batas kritis pengujian, nilainya yang masih sedikit di atas 0.05. Ini menyimpulkan bahwa tidak terjadi masalah heteroskedastisitas pada pemodelan kita. Dengan demikian, kita dapat menyatakan bahwa asumsi ragam sisaan yang konstan atau homoskedastisitas telah terpenuhi.
## x1 x2
## 1.055571 1.055571
Nilai Variance Inflation Factor memperlihatkan bahwa variabel prediktor pertama maupun kedua memiliki nilai VIF yang identik, yaitu sebesar 1.055. Nilai tersebut berada sangat jauh di bawah ambang batas toleransi maksimal multikolinieritas yang umumnya ditetapkan pada angka 10. Oleh karena itu, kita dapat mempresentasikan bahwa kedua variabel prediktor tersebut saling independen, atau model kita sepenuhnya terbebas dari gangguan multikolinieritas. Sehingga, pemenuhan ketiga kriteria asumsi klasik ini memvalidasi keandalan dan ketangguhan model regresi linier berganda yang sedang kita teliti.
##
## Durbin-Watson test
##
## data: model
## DW = 2.594, p-value = 0.8013
## alternative hypothesis: true autocorrelation is greater than 0
Berdasarkan output yang ditampilkan, kita memperoleh nilai statistik Durbin-Watson atau DW sebesar 2.594 dengan nilai probabilitas atau p-value sebesar 0.8013. Hipotesis nol dari pengujian ini menyatakan bahwa tidak terdapat autokorelasi pada sisaan model. Mengingat nilai probabilitas yang kita peroleh tersebut jauh berada di atas tingkat signifikansi standar yaitu 0.05, Hal ini akan gagal menolak hipotesis nol. Keputusan statistik ini mengarahkan kita pada kesimpulan bahwa sisaan model kita saling bebas atau tidak mengalami masalah autokorelasi.