Analisis Regresi Linier Berganda

Input Data

# Data dari soal
data <- data.frame(
  Siswa = 1:10,
  IQ = c(110,120,115,130,110,120,120,125,110,120),
  Kehadiran = c(60,70,75,80,80,90,95,95,100,100),
  Nilai_UAS = c(65,70,75,75,80,80,85,95,90,98)
)

data
##    Siswa  IQ Kehadiran Nilai_UAS
## 1      1 110        60        65
## 2      2 120        70        70
## 3      3 115        75        75
## 4      4 130        80        75
## 5      5 110        80        80
## 6      6 120        90        80
## 7      7 120        95        85
## 8      8 125        95        95
## 9      9 110       100        90
## 10    10 120       100        98

1. Persamaan Regresi Linier Berganda

Cara Manual

  1. Pendefinisian Variabel
X1 <- data$IQ
X2 <- data$Kehadiran
Y <- data$Nilai_UAS
  1. Menyusun Matriks
X <- cbind(1,X1,X2)  # 1 sebagai intersep
n <- nrow(X)    #JUMLAH OBSERVASU (baris data)
k <- ncol(X)-1  #JUMLAH VARIABEL BEBAS
  1. Estimasi Koefisien Regresi
XtX <- t (X) %*% X
XtY <- t (X) %*% Y
b <- solve (XtX) %*% XtY
b
##          [,1]
##    23.0544545
## X1 -0.0343275
## X2  0.7372330

Cara instan (membandingkan)

# Model regresi
model <- lm(Nilai_UAS ~ IQ + Kehadiran, data = data)
summary(model)
## 
## Call:
## lm(formula = Nilai_UAS ~ IQ + Kehadiran, data = data)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -5.2861 -2.8939  0.0296  1.6791  6.1993 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 23.05445   25.57161   0.902 0.397247    
## IQ          -0.03433    0.22051  -0.156 0.880686    
## Kehadiran    0.73723    0.10918   6.752 0.000264 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 4.346 on 7 degrees of freedom
## Multiple R-squared:  0.8719, Adjusted R-squared:  0.8353 
## F-statistic: 23.82 on 2 and 7 DF,  p-value: 0.0007523
#persamaan
coef(model)
## (Intercept)          IQ   Kehadiran 
##  23.0544545  -0.0343275   0.7372330

Berdasarkan hasil estimasi, diperoleh persamaan regresi sebagai berikut:

\[ Y = 23.054 - 0.034X_1 + 0.737X_2 \]

Interpretasi:

Konstanta sebesar 23.054 menunjukkan bahwa jika IQ dan Kehadiran bernilai 0, maka Nilai UAS sebesar 23.054. Koefisien IQ sebesar -0.034 menunjukkan bahwa setiap kenaikan 1 poin IQ akan menurunkan Nilai UAS sebesar 0.034, dengan asumsi variabel lain konstan. Koefisien Kehadiran sebesar 0.737 menunjukkan bahwa setiap kenaikan 1% kehadiran akan meningkatkan Nilai UAS sebesar 0.737.

2. UJI F (Simultan)

#UJI F SIMULTAN
anova(model)
## Analysis of Variance Table
## 
## Response: Nilai_UAS
##           Df Sum Sq Mean Sq F value    Pr(>F)    
## IQ         1  38.72   38.72  2.0502 0.1952857    
## Kehadiran  1 861.17  861.17 45.5959 0.0002644 ***
## Residuals  7 132.21   18.89                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Intepretasi:

Berdasarkan hasil uji F, diperoleh bahwa model regresi signifikan. Hal ini menunjukkan bahwa variabel IQ dan Kehadiran secara bersama-sama berpengaruh signifikan terhadap Nilai UAS.

3. UJI t (Parsial)

#UJI T PARSIAL
summary(model)$coefficients
##               Estimate Std. Error    t value     Pr(>|t|)
## (Intercept) 23.0544545 25.5716101  0.9015644 0.3972467061
## IQ          -0.0343275  0.2205125 -0.1556715 0.8806860631
## Kehadiran    0.7372330  0.1091797  6.7524718 0.0002644133

Interpretasi:

Variabel IQ memiliki p-value > 0.05, sehingga tidak berpengaruh signifikan terhadap Nilai UAS. Variabel Kehadiran memiliki p-value < 0.05, sehingga berpengaruh signifikan terhadap Nilai UAS. Dengan demikian, hanya variabel Kehadiran yang berpengaruh secara signifikan secara individu.

4. Koefisien Determinasi

summary(model)$r.squared
## [1] 0.8719029
summary(model)$adj.r.squared
## [1] 0.8353038

Interpretasi:

Nilai R²=0.8719 menunjukkan bahwa sebesar 87.19% variasi Nilai UAS dapat dijelaskan oleh variabel IQ dan Kehadiran, sedangkan sisanya sebesar 12.81% dijelaskan oleh faktor lain di luar model. Nilai Adjusted R² sebesar sekitar 0.83 menunjukkan bahwa setelah disesuaikan dengan jumlah variabel, model masih mampu menjelaskan sekitar 83% variasi Nilai UAS. Hal ini menunjukkan bahwa model memiliki kemampuan prediksi yang baik. Nilai Adjusted R² lebih kecil dari R², yang menunjukkan bahwa tidak semua variabel memberikan kontribusi yang signifikan dalam model.

5. Uji Asumsi Klasik

a. normalitas residual

shapiro.test(residuals(model))
## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(model)
## W = 0.95125, p-value = 0.6833
hist(residuals(model),
     main = "Histogram Residual",
     xlab = "Residual",
     col  = "skyblue",
     border = "black")

Berdasarkan hasil uji Shapiro-Wilk, diperoleh nilai p-value > 0.05, sehingga dapat disimpulkan bahwa residual berdistribusi normal. Hal ini juga didukung oleh histogram residual yang menunjukkan pola mendekati distribusi normal.

b. multikolinieritas

library(car)
## Loading required package: carData
vif(model)
##        IQ Kehadiran 
##  1.055571  1.055571

Berdasarkan hasil perhitungan Variance Inflation Factor (VIF), seluruh variabel independen memiliki nilai VIF < 10. Dengan demikian, dapat disimpulkan bahwa tidak terdapat masalah multikolinearitas dalam model regresi.

c. heteroskedastisitas

library(lmtest)
## Warning: package 'lmtest' was built under R version 4.5.2
## Loading required package: zoo
## Warning: package 'zoo' was built under R version 4.5.2
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
bptest(model)
## 
##  studentized Breusch-Pagan test
## 
## data:  model
## BP = 5.905, df = 2, p-value = 0.05221
plot(model)

Berdasarkan uji Breusch-Pagan, diperoleh nilai p-value > 0.05, sehingga tidak terdapat indikasi heteroskedastisitas. Hal ini menunjukkan bahwa varians residual bersifat konstan (homoskedastis). Selain itu, grafik residual menunjukkan pola penyebaran yang acak dan tidak membentuk pola tertentu.

d. autokorelasi

dwtest(model)
## 
##  Durbin-Watson test
## 
## data:  model
## DW = 2.594, p-value = 0.8013
## alternative hypothesis: true autocorrelation is greater than 0

Berdasarkan uji Durbin-Watson, diperoleh nilai statistik yang mendekati 2, sehingga dapat disimpulkan bahwa tidak terdapat autokorelasi dalam model.

Kesimpulan

Berdasarkan hasil analisis regresi linier berganda, diperoleh bahwa variabel Kehadiran berpengaruh positif dan signifikan terhadap Nilai UAS, sedangkan variabel IQ tidak berpengaruh signifikan. Secara simultan, variabel IQ dan Kehadiran berpengaruh signifikan terhadap Nilai UAS, yang ditunjukkan oleh hasil uji F dengan p-value < 0.05. Nilai koefisien determinasi (R²) sebesar 0.8719 menunjukkan bahwa model mampu menjelaskan sebesar 87.19% variasi Nilai UAS, sedangkan sisanya dijelaskan oleh faktor lain di luar model. Nilai Adjusted R² yang sedikit lebih rendah menunjukkan bahwa tidak semua variabel memberikan kontribusi signifikan dalam model. Berdasarkan uji asumsi klasik, model regresi telah memenuhi asumsi normalitas, tidak terjadi multikolinearitas, tidak terdapat heteroskedastisitas, serta tidak terdapat autokorelasi. Dengan terpenuhinya asumsi klasik, maka model regresi yang dihasilkan dapat dikatakan valid dan layak digunakan untuk analisis lebih lanjut hubungan antara Kehadiran dan Nilai UAS.