Regresi Linier Berganda: Pengaruh Tingkat Kehadiran dan IQ terhadap Nilai UAS

Dalam proses pembelajaran, hasil belajar siswa dipengaruhi oleh berbagai faktor, di antaranya tingkat kecerdasan (IQ) dan kehadiran di kelas. IQ mencerminkan kemampuan kognitif siswa dalam memahami materi, sedangkan kehadiran menunjukkan tingkat partisipasi dalam proses pembelajaran. Oleh karena itu, penting untuk mengetahui hubungan antara kedua faktor tersebut terhadap nilai Ujian Akhir Semester (UAS) sebagai indikator pencapaian akademik siswa.

Diberikan data tentang IQ dan tingkat kehadiran sepuluh siswa di kelas yang diperkirakan mempengaruhi nilai UAS.

Siswa	IQ (\(X_2\))	Tingkat Kehadiran (%) (\(X_1\))	Nilai UAS (Y)
1	110	60	65
2	120	70	70
3	115	75	75
4	130	80	75
5	110	80	80
6	120	90	80
7	120	95	85
8	125	95	95
9	110	100	90
10	120	100	98

Studi kasus ini menggunakan data dari sepuluh siswa untuk menganalisis hubungan antara tingkat kecerdasan (IQ) dan tingkat kehadiran terhadap nilai Ujian Akhir Semester (UAS). Variabel yang digunakan meliputi IQ sebagai variabel independen (X₂), tingkat kehadiran (%) sebagai variabel independen (X₁), dan nilai UAS sebagai variabel dependen (Y).

Data menunjukkan bahwa IQ siswa berada pada kisaran 110–130, tingkat kehadiran antara 60%–100%, dan nilai UAS berkisar 65–98. Variasi data ini mencerminkan adanya perbedaan kemampuan dan keaktifan siswa dalam proses pembelajaran.

Selanjutnya, data tersebut dianalisis menggunakan regresi linier berganda. Tujuan dari analisis ini adalah untuk:

Menentukan persamaan regresi linier berganda antara tingkat kehadiran dan IQ terhadap nilai UAS.
Menganalisis pengaruh variabel independen secara simultan terhadap nilai UAS melalui uji F.
Menganalisis pengaruh masing-masing variabel independen secara parsial terhadap nilai UAS melalui uji t.
Mengetahui besarnya koefisien determinasi dalam menjelaskan variasi nilai UAS.
Menguji asumsi-asumsi dalam model regresi linier berganda.

Load Library dan Input Data

# Load Library
library(lmtest)

## Loading required package: zoo

## 
## Attaching package: 'zoo'

## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric

library(car)

## Loading required package: carData

# Input Data
IQ <- c(110,120,115,130,110,120,120,125,110,120)
kehadiran <- c(60,70,75,80,80,90,95,95,100,100)
UAS <- c(65,70,75,75,80,80,85,95,90,98)

data <- data.frame(IQ, kehadiran, UAS)
DT::datatable(data)

Persamaan Regresi Linier Berganda

Regresi linier berganda merupakan metode analisis yang digunakan untuk menggambarkan hubungan antara satu variabel terikat (\(Y\)) dengan dua atau lebih variabel bebas (\(X\)). Model ini bertujuan untuk melihat bagaimana perubahan pada variabel independen dapat memengaruhi variabel dependen.

Secara umum, bentuk matematis dari model regresi linier berganda dapat dinyatakan sebagai berikut:

\[ Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \cdots + \beta_k X_k + \varepsilon \]

dengan keterangan:

- \(Y\) : variabel dependen
- \(X_k\) : variabel independen ke-\(k\)
- \(\beta_0\) : konstanta
- \(\beta_k\) : koefisien regresi
- \(\varepsilon\) : komponen error atau residual

Selain itu, dalam praktik analisis, model regresi digunakan untuk memperoleh nilai taksiran dari variabel dependen berdasarkan nilai variabel independen yang diketahui. Bentuk persamaan estimasinya adalah:

\[ \hat{Y} = \hat{\beta}_0 + \hat{\beta}_1 X_1 + \hat{\beta}_2 X_2 + \cdots + \hat{\beta}_k X_k \]

dengan keterangan:

- \(\hat{Y}\) : nilai prediksi dari variabel dependen
- \(\hat{\beta}_k\) : koefisien regresi hasil estimasi

Dalam penelitian ini, penentuan model dilakukan dengan dua pendekatan, yaitu perhitungan manual menggunakan metode matriks dan analisis menggunakan fungsi lm() pada perangkat lunak R.

Perhitungan Secara Manual (Metode Matriks)

Untuk memperoleh nilai koefisien regresi secara manual, digunakan pendekatan matriks dengan rumus:

\[ \beta = (X^T X)^{-1} X^T Y \]

# Membentuk matriks X (dengan intercept)
X <- cbind(1, kehadiran, IQ)

# Mengubah Y menjadi matriks
Y <- as.matrix(UAS)

# Menghitung koefisien regresi
beta <- solve(t(X) %*% X) %*% t(X) %*% Y
beta

##                 [,1]
##           23.0544545
## kehadiran  0.7372330
## IQ        -0.0343275

Berdasarkan hasil perhitungan koefisien regresi menggunakan metode matriks, diperoleh persamaan regresi linier berganda sebagai berikut:

\[ \hat{Y} = 23.054 + 0.737X_1 - 0.034X_2 \]

Menggunakan Fungsi lm

Untuk memverifikasi hasil perhitungan manual, dilakukan analisis regresi linier berganda menggunakan fungsi lm() pada R sebagai berikut:

model <- lm(UAS ~ kehadiran + IQ)
summary(model)

## 
## Call:
## lm(formula = UAS ~ kehadiran + IQ)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -5.2861 -2.8939  0.0296  1.6791  6.1993 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 23.05445   25.57161   0.902 0.397247    
## kehadiran    0.73723    0.10918   6.752 0.000264 ***
## IQ          -0.03433    0.22051  -0.156 0.880686    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 4.346 on 7 degrees of freedom
## Multiple R-squared:  0.8719, Adjusted R-squared:  0.8353 
## F-statistic: 23.82 on 2 and 7 DF,  p-value: 0.0007523

Berdasarkan hasil dari fungsi lm didapatkan bahwa koefisien regresi sama dengan perhitungan koefisien regresi menggunakan metode matriks, diperoleh persamaan regresi linier berganda sebagai berikut:

\[ \hat{Y} = 23.054 + 0.737X_1 - 0.034X_2 \]

Persamaan regresi yang diperoleh menunjukkan bahwa nilai konstanta sebesar 23.054 merepresentasikan nilai UAS ketika tingkat kehadiran dan IQ bernilai nol, meskipun kondisi tersebut tidak terjadi dalam praktik. Koefisien tingkat kehadiran sebesar 0.737 menunjukkan bahwa setiap peningkatan 1% kehadiran akan diikuti oleh peningkatan nilai UAS sebesar 0.737 poin, dengan asumsi variabel IQ tetap. Sementara itu, koefisien IQ sebesar -0.034 menunjukkan bahwa setiap kenaikan 1 poin IQ cenderung diikuti oleh penurunan nilai UAS sebesar 0.034 poin, dengan asumsi tingkat kehadiran tetap. Secara keseluruhan, model ini menunjukkan bahwa tingkat kehadiran memiliki hubungan positif terhadap nilai UAS, sedangkan IQ dalam model ini menunjukkan hubungan yang sangat lemah dan cenderung negatif.

Uji F (Simultan)

Uji F digunakan untuk mengetahui apakah variabel independen, yaitu tingkat kehadiran (\(X_1\)) dan IQ (\(X_2\)), secara bersama-sama berpengaruh terhadap variabel dependen yaitu nilai UAS (\(Y\)).

Hipotesis yang digunakan dalam uji F adalah:

- \(H_0\): \(\beta_1 = \beta_2 = 0\) (tidak terdapat pengaruh secara simultan)
- \(H_1\): minimal salah satu \(\beta \neq 0\) (terdapat pengaruh secara simultan)

Pengujian dilakukan menggunakan output dari model regresi sebagai berikut:

summary(model)

## 
## Call:
## lm(formula = UAS ~ kehadiran + IQ)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -5.2861 -2.8939  0.0296  1.6791  6.1993 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 23.05445   25.57161   0.902 0.397247    
## kehadiran    0.73723    0.10918   6.752 0.000264 ***
## IQ          -0.03433    0.22051  -0.156 0.880686    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 4.346 on 7 degrees of freedom
## Multiple R-squared:  0.8719, Adjusted R-squared:  0.8353 
## F-statistic: 23.82 on 2 and 7 DF,  p-value: 0.0007523

keputusan diambil dengan membandingkan nilai p-value dengan tingkat signifikansi sebesar 0.05. Apabila nilai p-value lebih kecil dari 0.05, maka hipotesis nol (\(H_0\)) ditolak dan dapat disimpulkan bahwa variabel tingkat kehadiran dan IQ secara bersama-sama berpengaruh signifikan terhadap nilai UAS. Sebaliknya, jika nilai p-value lebih besar dari 0.05, maka hipotesis nol tidak dapat ditolak, yang berarti kedua variabel tersebut tidak berpengaruh secara simultan terhadap nilai UAS.

Nilai p-value yang diperoleh sebesar 0.0007523 lebih kecil dari tingkat signifikansi 0.05. Hal ini menunjukkan bahwa hipotesis nol (\(H_0\)) ditolak. Dengan demikian, dapat disimpulkan bahwa variabel tingkat kehadiran dan IQ secara bersama-sama memiliki pengaruh yang signifikan terhadap nilai UAS.

Nilai F-statistic sebesar 23.82 juga menunjukkan bahwa model regresi yang dibentuk memiliki kemampuan yang cukup baik dalam menjelaskan hubungan antara variabel independen dan variabel dependen. Hal ini berarti kombinasi antara tingkat kehadiran dan IQ mampu menjelaskan variasi nilai UAS secara signifikan.

Berdasarkan uji F, dapat disimpulkan bahwa model regresi linier berganda yang digunakan layak dan signifikan. Variabel tingkat kehadiran dan IQ secara simultan berpengaruh terhadap nilai UAS, sehingga model dapat digunakan untuk analisis lebih lanjut.

Uji t (Parsial)

Uji t digunakan untuk mengetahui pengaruh masing-masing variabel independen secara individu terhadap variabel dependen.

Hipotesis yang digunakan adalah:

- \(H_0\): \(\beta_k = 0\) (variabel independen tidak berpengaruh terhadap nilai UAS)
- \(H_1\): \(\beta_k \neq 0\) (variabel independen berpengaruh terhadap nilai UAS)

Pengujian dilakukan berdasarkan nilai p-value dari masing-masing variabel pada output regresi.

summary(model)$coefficients

##               Estimate Std. Error    t value     Pr(>|t|)
## (Intercept) 23.0544545 25.5716101  0.9015644 0.3972467061
## kehadiran    0.7372330  0.1091797  6.7524718 0.0002644133
## IQ          -0.0343275  0.2205125 -0.1556715 0.8806860631

Berdasarkan hasil output regresi, variabel tingkat kehadiran memiliki nilai p-value sebesar 0.000264, yang lebih kecil dari tingkat signifikansi 0.05. Hal ini menunjukkan bahwa hipotesis nol (\(H_0\)) ditolak, sehingga dapat disimpulkan bahwa tingkat kehadiran berpengaruh signifikan terhadap nilai UAS. Selain itu, nilai koefisien yang positif menunjukkan bahwa peningkatan kehadiran akan meningkatkan nilai UAS.

Sementara itu, variabel IQ memiliki nilai p-value sebesar 0.880686, yang lebih besar dari 0.05. Hal ini menunjukkan bahwa hipotesis nol (\(H_0\)) tidak dapat ditolak, sehingga dapat disimpulkan bahwa IQ tidak berpengaruh signifikan terhadap nilai UAS dalam model ini.

Jadi berdasarkan uji t, dapat disimpulkan bahwa secara parsial hanya variabel tingkat kehadiran yang berpengaruh signifikan terhadap nilai UAS. Sedangkan variabel IQ tidak memiliki pengaruh yang signifikan dalam menjelaskan variasi nilai UAS.

Koefisien Determinasi (R²)

Secara matematis, koefisien determinasi (\(R^2\)) dapat dirumuskan sebagai berikut:

\[ R^2 = \frac{SSR}{SST} \]

atau dapat juga dituliskan sebagai:

\[ R^2 = 1 - \frac{SSE}{SST} \]

dengan keterangan:

- \(SSR\) (Sum of Squares Regression) = jumlah kuadrat regresi
- \(SSE\) (Sum of Squares Error) = jumlah kuadrat error (residual)
- \(SST\) (Total Sum of Squares) = jumlah kuadrat total

Hubungan antar komponen tersebut adalah:

\[ SST = SSR + SSE \]

Koefisien determinasi (\(R^2\)) menunjukkan proporsi variasi total pada variabel dependen yang dapat dijelaskan oleh model regresi. Nilai \(R^2\) berada pada rentang 0 hingga 1. Semakin mendekati 1, maka semakin besar kemampuan model dalam menjelaskan variasi data.

summary(model)$r.squared

## [1] 0.8719029

summary(model)$adj.r.squared

## [1] 0.8353038

Nilai \(R^2\) sebesar 0.8719 menunjukkan bahwa sebesar 87.19% variasi nilai UAS dapat dijelaskan oleh variabel tingkat kehadiran dan IQ dalam model regresi yang digunakan. Sementara itu, sisanya sebesar 12.81% dijelaskan oleh faktor lain di luar model.

Nilai Adjusted \(R^2\) sebesar 0.8353 menunjukkan bahwa setelah mempertimbangkan jumlah variabel dalam model, sekitar 83.53% variasi nilai UAS masih dapat dijelaskan oleh variabel independen. Nilai ini memberikan gambaran yang lebih akurat karena telah disesuaikan dengan jumlah variabel yang digunakan dalam model.

Berdasarkan nilai koefisien determinasi, dapat disimpulkan bahwa model regresi yang digunakan memiliki kemampuan yang cukup kuat dalam menjelaskan variasi nilai UAS. Variabel tingkat kehadiran dan IQ secara bersama-sama mampu menjelaskan sebagian besar perubahan pada nilai UAS.

Uji Asumsi Klasik

Uji asumsi klasik dilakukan untuk memastikan bahwa model regresi yang digunakan telah memenuhi syarat-syarat dalam analisis regresi linier, sehingga hasil yang diperoleh dapat dipercaya dan tidak bias.

1. Uji Normalitas

Uji normalitas bertujuan untuk mengetahui apakah residual dalam model regresi berdistribusi normal.

shapiro.test(residuals(model))

## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(model)
## W = 0.95125, p-value = 0.6833

Uji normalitas dilakukan menggunakan uji Shapiro-Wilk dengan melihat nilai p-value. Jika nilai p-value lebih besar dari 0.05, maka residual berdistribusi normal. Sebaliknya, jika nilai p-value lebih kecil dari 0.05, maka residual tidak berdistribusi normal.

Berdasarkan hasil uji normalitas, apabila nilai p-value lebih besar dari 0.05, maka dapat disimpulkan bahwa residual dalam model regresi berdistribusi normal sehingga asumsi normalitas terpenuhi.

2. Uji Multikolinearitas

Uji multikolinearitas digunakan untuk mengetahui apakah terdapat hubungan yang kuat antar variabel independen dalam model.

vif(model)

## kehadiran        IQ 
##  1.055571  1.055571

Uji multikolinearitas dilihat dari nilai Variance Inflation Factor (VIF). Jika nilai VIF kurang dari 10, maka tidak terjadi multikolinearitas dalam model. Sebaliknya, jika nilai VIF lebih dari 10, maka terdapat indikasi multikolinearitas.

Berdasarkan hasil uji multikolinearitas, apabila nilai VIF dari masing-masing variabel kurang dari 10, maka dapat disimpulkan bahwa tidak terdapat masalah multikolinearitas dalam model regresi.

3. Uji Heteroskedastisitas

Uji heteroskedastisitas bertujuan untuk mengetahui apakah terdapat ketidaksamaan varians pada residual.

plot(model)

Uji heteroskedastisitas dilakukan dengan melihat pola pada grafik residual. Jika titik-titik menyebar secara acak dan tidak membentuk pola tertentu, maka tidak terjadi heteroskedastisitas. Sebaliknya, jika terdapat pola tertentu, maka terjadi heteroskedastisitas.

Berdasarkan hasil pengamatan grafik residual, apabila tidak ditemukan pola tertentu dan titik-titik menyebar secara acak, maka dapat disimpulkan bahwa tidak terjadi heteroskedastisitas dalam model.

4. Uji Autokorelasi

Uji autokorelasi digunakan untuk mengetahui apakah terdapat korelasi antar residual dalam model regresi.

dwtest(model)

## 
##  Durbin-Watson test
## 
## data:  model
## DW = 2.594, p-value = 0.8013
## alternative hypothesis: true autocorrelation is greater than 0

Uji autokorelasi dilakukan menggunakan uji Durbin-Watson. Nilai statistik Durbin-Watson berada pada rentang 0 hingga 4. Nilai mendekati 2 menunjukkan tidak adanya autokorelasi. Selain itu, jika nilai p-value lebih besar dari 0.05, maka tidak terdapat autokorelasi.

Berdasarkan hasil uji Durbin-Watson, apabila nilai statistik mendekati 2 dan p-value lebih besar dari 0.05, maka dapat disimpulkan bahwa tidak terdapat autokorelasi dalam model regresi.

Siswa	IQ (\(X_2\))	Tingkat Kehadiran (%) (\(X_1\))	Nilai UAS (Y)
1	110	60	65
2	120	70	70
3	115	75	75
4	130	80	75
5	110	80	80
6	120	90	80
7	120	95	85
8	125	95	95
9	110	100	90
10	120	100	98

Siswa	IQ (\(X_2\))	Tingkat Kehadiran (%) (\(X_1\))	Nilai UAS (Y)
1	110	60	65
2	120	70	70
3	115	75	75
4	130	80	75
5	110	80	80
6	120	90	80
7	120	95	85
8	125	95	95
9	110	100	90
10	120	100	98

Siswa	IQ (\(X_2\))	Tingkat Kehadiran (%) (\(X_1\))	Nilai UAS (Y)
1	110	60	65
2	120	70	70
3	115	75	75
4	130	80	75
5	110	80	80
6	120	90	80
7	120	95	85
8	125	95	95
9	110	100	90
10	120	100	98