Soal

Diberikan data tentang IQ dan tingkat kehadiran sepuluh siswa di kelas yang diperkirakan mempengaruhi nilai UAS.

Siswa IQ (X2​) Tingkat kehadiran (%) (X1​) Nilai UAS (Y)
1 110 60 65
2 120 70 70
3 115 75 75
4 130 80 75
5 110 80 80
6 120 90 80
7 120 95 85
8 125 95 95
9 110 100 90
10 120 100 98

Pertanyaan:

  1. Buatlah persamaan regresi linier berganda! (hitung beta duga secara manual di R dan bandingkan dengan fungsi lm)
  2. Lakukan Uji-F! (interpretasikan hasilnya)
  3. Lakukan Uji-t! (interpretasikan hasilnya)
  4. Berapa koefisien determinasinya? Interpretasi hasil ini!
  5. Lakukan uji asumsi dan jelaskan hasilnya

Penyelesaian

Persamaan Regresi Linier Berganda

Buat input datanya

# Input Data
x1 <- c(60, 70, 75, 80, 80, 90, 95, 95, 100, 100)
x2 <- c(110, 120, 115, 130, 110, 120, 120, 125, 110, 120)
y <- c(65, 70, 75, 75, 80, 80, 85, 95, 90, 98)
n <- length(y)

Hitung beta duga dengan rumus penduga parameter \(\beta\) adalah: \[\hat{\beta} = (X^T X)^{-1} X^T Y\]

# Membuat Matriks untuk hitung manual
X <- cbind(1, x1, x2)
Y <- matrix(y, ncol = 1)

# Perhitungan Manual
beta_manual <- solve(t(X) %*% X) %*% t(X) %*% Y
print(beta_manual)
##          [,1]
##    23.0544545
## x1  0.7372330
## x2 -0.0343275

Bandingkan dengan Fungsi lm()

# Menggunakan fungsi bawaan R
model <- lm(y ~ x1 + x2)
summary(model)$coefficients
##               Estimate Std. Error    t value     Pr(>|t|)
## (Intercept) 23.0544545 25.5716101  0.9015644 0.3972467061
## x1           0.7372330  0.1091797  6.7524718 0.0002644133
## x2          -0.0343275  0.2205125 -0.1556715 0.8806860631

Hasilnya nilai intersep, koefisien \(x_1\), dan koefisien \(x_2\) dari kedua metode akan sama. Persamaannya akan berbentuk: \[Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2\]

Uji-F (Simultan)

Uji ini digunakan untuk melihat apakah \(X_1\) dan \(X_2\) secara bersama-sama berpengaruh signifikan terhadap \(Y\).

Hipotesis:

\(H_0\): Tidak ada pengaruh signifikan secara simultan.

\(H_1\): Minimal ada satu variabel independen yang berpengaruh signifikan.

Gunakan summary untuk melihat p-value nya

summary(model)
## 
## Call:
## lm(formula = y ~ x1 + x2)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -5.2861 -2.8939  0.0296  1.6791  6.1993 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 23.05445   25.57161   0.902 0.397247    
## x1           0.73723    0.10918   6.752 0.000264 ***
## x2          -0.03433    0.22051  -0.156 0.880686    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 4.346 on 7 degrees of freedom
## Multiple R-squared:  0.8719, Adjusted R-squared:  0.8353 
## F-statistic: 23.82 on 2 and 7 DF,  p-value: 0.0007523

Interpretasi: Lihat nilai F-statistic dan p-value pada output summary(model). karena p-value < 0.05, maka kita tolak \(H_0\) (berpengaruh signifikan).

Uji-t (Parsial)

Uji ini melihat pengaruh masing-masing variabel secara individu.

Gunakan summary untuk melihat p-value nya

summary(model)$coefficients
##               Estimate Std. Error    t value     Pr(>|t|)
## (Intercept) 23.0544545 25.5716101  0.9015644 0.3972467061
## x1           0.7372330  0.1091797  6.7524718 0.0002644133
## x2          -0.0343275  0.2205125 -0.1556715 0.8806860631

Interpretasi: Lihat nilai Pr(>|t|) pada output summary(model)

Tingkat Kehadiran (\(X_1\)): p-value < 0.05, maka kehadiran berpengaruh signifikan terhadap nilai UAS.

IQ (\(X_2\)): p-value > 0.05, maka IQ tidak ada pengaruh signifikan terhadap nilai UAS.

Koefisien Determinasi

Cek nilai Multiple R-squared pada output summary model.

summary(model)
## 
## Call:
## lm(formula = y ~ x1 + x2)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -5.2861 -2.8939  0.0296  1.6791  6.1993 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 23.05445   25.57161   0.902 0.397247    
## x1           0.73723    0.10918   6.752 0.000264 ***
## x2          -0.03433    0.22051  -0.156 0.880686    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 4.346 on 7 degrees of freedom
## Multiple R-squared:  0.8719, Adjusted R-squared:  0.8353 
## F-statistic: 23.82 on 2 and 7 DF,  p-value: 0.0007523

\(R^2 = 0.87.19\), artinya 87.19% variasi Nilai UAS dapat dijelaskan oleh Tingkat Kehadiran dan IQ, sedangkan 12.81% sisanya dijelaskan oleh variabel lain di luar model.

Uji Asumsi

library(lmtest)
## Loading required package: zoo
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
library(car)
## Loading required package: carData
shapiro.test(residuals(model))
## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(model)
## W = 0.95125, p-value = 0.6833

Hasil fungsi shapiro.test pada nilai residual model yang bertujuan untuk menguji kenormalan sebaran data. Output tersebut menunjukkan nilai probabilitas atau p-value sebesar 0.6833. Mengingat besaran nilai ini jauh melampaui tingkat signifikansi standar yaitu 0.05, kita tidak menolak hipotesis nol. Hal ini menunjukan bahwa galat atau residual dari model regresi kita telah menyebar secara normal.

bptest(model)
## 
##  studentized Breusch-Pagan test
## 
## data:  model
## BP = 5.905, df = 2, p-value = 0.05221

Hasil Breusch-Pagan test dengan menggunakan fungsi bptest. Uji ini memastikan bahwa varians dari residual bersifat konstan di seluruh pengamatan. Dari hasil yang ada, kita mendapatkan nilai p-value sebesar 0.05221. Meskipun angka probabilitas ini berada sangat dekat dengan batas kritis pengujian, nilainya yang masih sedikit di atas 0.05. Ini menyimpulkan bahwa tidak terjadi masalah heteroskedastisitas pada pemodelan kita. Dengan demikian, kita dapat menyatakan bahwa asumsi ragam sisaan yang konstan atau homoskedastisitas telah terpenuhi.

vif(model)
##       x1       x2 
## 1.055571 1.055571

Nilai Variance Inflation Factor memperlihatkan bahwa variabel prediktor pertama maupun kedua memiliki nilai VIF yang identik, yaitu sebesar 1.055. Nilai tersebut berada sangat jauh di bawah ambang batas toleransi maksimal multikolinieritas yang umumnya ditetapkan pada angka 10. Oleh karena itu, kita dapat mempresentasikan bahwa kedua variabel prediktor tersebut saling independen, atau model kita sepenuhnya terbebas dari gangguan multikolinieritas. Sehingga, pemenuhan ketiga kriteria asumsi klasik ini memvalidasi keandalan dan ketangguhan model regresi linier berganda yang sedang kita teliti.

dwtest(model)
## 
##  Durbin-Watson test
## 
## data:  model
## DW = 2.594, p-value = 0.8013
## alternative hypothesis: true autocorrelation is greater than 0

Berdasarkan output yang ditampilkan, kita memperoleh nilai statistik Durbin-Watson atau DW sebesar 2.594 dengan nilai probabilitas atau p-value sebesar 0.8013. Hipotesis nol dari pengujian ini menyatakan bahwa tidak terdapat autokorelasi pada sisaan model. Mengingat nilai probabilitas yang kita peroleh tersebut jauh berada di atas tingkat signifikansi standar yaitu 0.05, Hal ini akan gagal menolak hipotesis nol. Keputusan statistik ini mengarahkan kita pada kesimpulan bahwa sisaan model kita saling bebas atau tidak mengalami masalah autokorelasi.