Pendahuluan

Regresi linier merupakan metode statistik yang digunakan untuk melihat hubungan antara variabel bebas dan variabel terikat. Pada regresi linier sederhana, hanya digunakan satu variabel bebas, sedangkan dalam kenyataannya suatu variabel terikat sering dipengaruhi oleh lebih dari satu faktor. Oleh karena itu, digunakan regresi linier berganda untuk menganalisis pengaruh beberapa variabel bebas secara bersamaan.

Dalam bidang pendidikan, hasil belajar siswa tidak hanya ditentukan oleh satu faktor saja. Misalnya, kemampuan intelektual yang dapat dilihat dari IQ serta kedisiplinan yang tercermin dari tingkat kehadiran diduga berpengaruh terhadap nilai UAS siswa.

Berdasarkan hal tersebut, analisis regresi linier berganda digunakan untuk mengetahui pengaruh IQ dan tingkat kehadiran terhadap nilai UAS. Selain itu, dilakukan uji F untuk melihat pengaruh variabel secara bersama-sama, uji t untuk melihat pengaruh masing-masing variabel, serta koefisien determinasi (R²) untuk mengukur kemampuan model dalam menjelaskan data. Pengujian asumsi klasik juga dilakukan agar model yang digunakan memenuhi syarat analisis yang baik.

Data

library(knitr)
## Warning: package 'knitr' was built under R version 4.4.2
library(lmtest)
## Warning: package 'lmtest' was built under R version 4.4.3
## Loading required package: zoo
## Warning: package 'zoo' was built under R version 4.4.3
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
library(car)
## Warning: package 'car' was built under R version 4.4.2
## Loading required package: carData
## Warning: package 'carData' was built under R version 4.4.2
iq <- c(110,120,115,130,110,120,120,125,110,120)
kehadiran <- c(60,70,75,80,80,90,95,95,100,100)
nilai <- c(65,70,75,75,80,80,85,95,90,98)

data <- data.frame(IQ = iq,
                   Kehadiran = kehadiran,
                   Nilai_UAS = nilai)

knitr::kable(data)
IQ Kehadiran Nilai_UAS
110 60 65
120 70 70
115 75 75
130 80 75
110 80 80
120 90 80
120 95 85
125 95 95
110 100 90
120 100 98

Beta Duga Manual

# Bentuk matriks X (dengan intercept) dan Y
X <- cbind(1, kehadiran, iq)
Y <- matrix(nilai, ncol = 1)

# Hitung koefisien regresi manual (beta)
beta <- solve(t(X) %*% X) %*% t(X) %*% Y

# Tampilkan hasil koefisien
beta
##                 [,1]
##           23.0544545
## kehadiran  0.7372330
## iq        -0.0343275

Berdasarkan hasil estimasi parameter regresi, diperoleh model persamaan 𝑌= 23.0545 + 0.7372𝑋1 − 0.0343X2. Koefisien variabel kehadiran sebesar 0.7372 menunjukkan bahwa setiap kenaikan kehadiran sebesar 1% akan diikuti peningkatan nilai UAS sebesar 0.737 poin, dengan asumsi variabel lain konstan. Di sisi lain, koefisien IQ sebesar -0.0343 menunjukkan adanya pengaruh negatif yang sangat kecil terhadap nilai UAS. Hal ini mengindikasikan bahwa variabel kehadiran memiliki peran yang lebih dominan dibandingkan IQ dalam menjelaskan variasi nilai UAS.

Model regresi

model <- lm(nilai ~ kehadiran + iq)
model
## 
## Call:
## lm(formula = nilai ~ kehadiran + iq)
## 
## Coefficients:
## (Intercept)    kehadiran           iq  
##    23.05445      0.73723     -0.03433

Terlihat bahwa hasil perbandingan estimasi koefisien regresi, dapat diketahui nilai beta yang diperoleh melalui perhitungan manual dengan metode matriks identik dengan hasil yang dihasilkan oleh fungsi lm() pada R. Hal ini menunjukkan bahwa prosedur perhitungan manual telah sesuai dengan metode Ordinary Least Squares (OLS) yang diterapkan dalam R, sehingga model regresi yang dihasilkan dapat dianggap valid dan konsisten.

Uji F dan Uji t

summary(model)
## 
## Call:
## lm(formula = nilai ~ kehadiran + iq)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -5.2861 -2.8939  0.0296  1.6791  6.1993 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 23.05445   25.57161   0.902 0.397247    
## kehadiran    0.73723    0.10918   6.752 0.000264 ***
## iq          -0.03433    0.22051  -0.156 0.880686    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 4.346 on 7 degrees of freedom
## Multiple R-squared:  0.8719, Adjusted R-squared:  0.8353 
## F-statistic: 23.82 on 2 and 7 DF,  p-value: 0.0007523

Berdasarkan hasil uji F, diperoleh nilai p-value yang lebih kecil dari 0,05 sehingga hipotesis nol ditolak. Hal ini mengindikasikan bahwa variabel kehadiran dan IQ secara bersama-sama memiliki pengaruh yang signifikan terhadap nilai UAS.

Berdasarkan hasil uji t, variabel kehadiran menunjukkan nilai p-value kurang dari 0,05 sehingga berpengaruh signifikan terhadap nilai UAS. Sebaliknya, variabel IQ memiliki nilai p-value lebih besar dari 0,05 sehingga tidak berpengaruh signifikan terhadap nilai UAS. Dengan demikian, secara parsial hanya variabel kehadiran yang terbukti berpengaruh terhadap nilai UAS.

Koefisien Determinasi

summary(model)$r.squared
## [1] 0.8719029

Berdasarkan hasil analisis, diperoleh nilai koefisien determinasi (R²) sebesar 0,87. Hal ini berarti bahwa 87% variasi nilai UAS mampu dijelaskan oleh variabel kehadiran dan IQ dalam model regresi, sedangkan sisanya sebesar 13% dipengaruhi oleh faktor lain yang tidak dimasukkan dalam model.

Uji Asumsi Klasik

1. Normalitas

shapiro.test(residuals(model))
## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(model)
## W = 0.95125, p-value = 0.6833

Berdasarkan hasil uji normalitas Shapiro-Wilk, diperoleh nilai p-value sebesar 0.6833 yang melebihi taraf signifikansi 0.05. Hal ini mengindikasikan bahwa tidak ada cukup bukti untuk menolak hipotesis nol, sehingga dapat disimpulkan bahwa residual dari model regresi mengikuti distribusi normal. Dengan demikian, asumsi normalitas pada model regresi telah terpenuhi.

2. Multikolinearitas

vif(model)
## kehadiran        iq 
##  1.055571  1.055571

VIF (Variance Inflation Factor) digunakan untuk melihat apakah ada multikolinearitas antar variabel bebas.

  • VIF = 1 → tidak ada korelasi antar variabel
  • VIF < 10 → aman (tidak ada multikolinearitas serius)
  • VIF > 10 → ada masalah multikolinearitas

Nilai VIF pada setiap variabel menunjukkan angka kurang dari 10, sehingga dapat disimpulkan bahwa tidak terdapat gejala multikolinearitas di antara variabel bebas dalam model.

3. Heteroskedastisitas

plot(model, which=1)

bptest(model)
## 
##  studentized Breusch-Pagan test
## 
## data:  model
## BP = 5.905, df = 2, p-value = 0.05221

Setiap titik pada grafik menunjukkan selisih antara nilai aktual dan nilai prediksi dari model untuk masing-masing observasi. Titik yang berada di atas garis nol menunjukkan bahwa model mengestimasi nilai yang lebih rendah dari nilai sebenarnya, sedangkan titik di bawah garis nol menunjukkan bahwa model mengestimasi nilai yang lebih tinggi dari nilai sebenarnya. Titik yang berada dekat dengan garis nol menunjukkan bahwa hasil prediksi model cukup akurat. Secara umum, penyebaran titik digunakan untuk menilai kesesuaian model terhadap data. Berdasarkan grafik scatterplot, sebaran residual tampak acak dan tidak membentuk pola tertentu. Selain itu, hasil uji Breusch-Pagan menunjukkan nilai p-value yang lebih besar dari 0,05, sehingga dapat disimpulkan bahwa model tidak mengalami heteroskedastisitas.

Kesimpulan

Berdasarkan keseluruhan hasil analisis, dapat disimpulkan bahwa model regresi yang diperoleh telah memenuhi asumsi klasik dan dinyatakan layak untuk digunakan. Secara simultan, variabel kehadiran dan IQ berpengaruh signifikan terhadap nilai UAS, namun secara parsial hanya tingkat kehadiran yang menunjukkan pengaruh signifikan dan dominan. Sementara itu, variabel IQ tidak memberikan pengaruh yang signifikan. Dengan demikian, tingkat kehadiran dapat dianggap sebagai faktor utama yang memengaruhi variasi nilai UAS dalam penelitian ini.