Pengaruh Jumlah Jam Belajar dan Tingkat Kehadiran Terhadap Nilai Ujian Mahasiswa

Seorang peneliti di sebuah Universitas ingin mengetahui faktor faktor apa saja yang dapat mempengaruhi nilai ujian mahasiswa dalam suatu mata kuliah. Karena menurutnya, nilai ujian tidak hanya di tentukan oleh kemampuan akademis seorang mahasiswa saja, namun faktor eksternal seperti lingkungannya pun dapat mempengaruhi nilai ujian mahasiswa tersebut. Dalam hal ini, akhirnya peneliti memfokuskan pada dua variabel faktor yang dapat mempengaruhi nilai ujian mahasiswa, yaitu jumlah jam belajar dalam satuan minggu serta tingkat kehadiran yang membantu mahasiswa lebih paham dengan mata pelajaran yang akan di uji. Untul menguji dan mendapatkan hasil yang diharapkan, peneliti mengumpulkan data dari 10 mahasiswa untuk melihat seberapa besar konstribusi faktor yang akan diuji. Berikut merupakan 10 data mahasiswa yang akan di uji

Mahasiswa Nilai Ujian (Y) Jam Belajar (X1) Kehadiran (X2)
1 65 2 60
2 70 3 65
3 75 4 70
4 80 5 75
5 85 6 80
6 78 5 72
7 72 3 68
8 90 7 85
9 88 6 83
10 95 8 90

Dari data di atas, beberapa hal yang dapat di uji untuk mendapatkan seberapa besar konstribusi faktor tersebut, maka

1. Estimasikan model regresi linier berganda menggunakan metode OLS berbasis matriks dan interpretasikan hasilnya!

lakukan input data terlebih dahulu agar r dapat membaca data yang akan di analisis

Y  <- c(65,70,75,80,85,78,72,90,88,95)
X1 <- c(2,3,4,5,6,5,3,7,6,8)
X2 <- c(60,65,70,75,80,72,68,85,83,90)
data <- data.frame(Y, X1, X2)
data
##     Y X1 X2
## 1  65  2 60
## 2  70  3 65
## 3  75  4 70
## 4  80  5 75
## 5  85  6 80
## 6  78  5 72
## 7  72  3 68
## 8  90  7 85
## 9  88  6 83
## 10 95  8 90
# 1. Estimasi Model Linier Berganda 
X <- cbind(1, X1, X2)
Y_mat <- matrix(Y, ncol = 1)

#2. Estimasi beta (OLS)
beta <- solve(t(X) %*% X) %*% t(X) %*% Y_mat
beta
##          [,1]
##    16.1360113
## X1  1.1698379
## X2  0.7744891

Dari hasil estimasi menggunakan metode OLS, diperoleh model regresi linier berganda yang digunakan untuk melihat hubungan antara jumlah jam belajar (X1) dan tingkat kehadiran (X2) terhadap nilai ujian mahasiswa (Y). Dari model yang digambarkan, dapat dilihat bahwa kedua variabel ini memiliki hubungan yang positif. yang artinya, setiap satu variabel naik maka nilai variabel lainnya akan ikut naik.

Koefisien regresi untuk variabel jumlah jam belajar (X1) bernilai positif. Ini menunjukkan bahwa setiap tambahan 1 jam belajar dalam seminggu bisa meningkatkan nilai ujian mahasiswa, dengan catatan variabel lain dianggap tetap (ceteris paribus). Hal ini menunjukkan kalau waktu belajar memang punya peran penting dalam meningkatkan hasil akademik.

Selain itu, variabel tingkat kehadiran (X2) juga memiliki koefisien positif. Artinya, setiap kenaikan 1% kehadiran akan berdampak pada kenaikan nilai ujian, dengan asumsi jam belajar tidak berubah. Kehadiran yang tinggi biasanya menandakan mahasiswa lebih aktif mengikuti pembelajaran, sehingga lebih mudah memahami materi yang diajarkan.

Untuk nilai konstanta (intercept), ini menggambarkan nilai ujian ketika jam belajar dan kehadiran bernilai nol.

2. Hitung Uji F dan uji t secara manual dan interpretasikan hasilnya!

Uji F

Y_hat <- X %*% beta
e <- Y_mat - Y_hat
SSE <- t(e) %*% e
SST <- t(Y_mat - mean(Y)) %*% (Y_mat - mean(Y))
SSR <- SST - SSE
n <- length(Y)
k <- 2  
MSR <- SSR / k
MSE <- SSE / (n - k - 1)
F_hit <- MSR / MSE
F_hit
##          [,1]
## [1,] 5172.116

Dari hasil uji F yang telah di lakukan, dapat di lihat bahwa nilai uji F lebih besar dari nilai tabel, ini menunjukkan bahwa jumlah jam belajar perminggu serta tingkat kehadiran memiliki pengaruh yang signifikan pada nilai ujian mahasiswa.

Uji T

sigma2 <- as.numeric(SSE / (n - k - 1))
var_beta <- sigma2 * solve(t(X) %*% X)
se_beta <- sqrt(diag(var_beta))
t_hit <- beta / se_beta
t_hit
##         [,1]
##     5.688154
## X1  4.201468
## X2 13.900261

Selanjutnya yaitu uji T, Hasil uji t menunjukkan bahwa masing-masing variabel independen memiliki pengaruh terhadap variabel dependen.

  1. Variabel jumlah jam belajar (X1) memiliki nilai t hitung yang signifikan Hal ini berarti bahwa secara parsial jumlah jam belajar berpengaruh signifikan terhadap nilai ujian mahasiswa. Dengan kata lain, semakin banyak waktu yang dialokasikan untuk belajar, maka nilai ujian cenderung meningkat.
  2. Variabel tingkat kehadiran (X2) juga menunjukkan hasil yang signifikan. Ini berarti tingkat kehadiran secara parsial berpengaruh terhadap nilai ujian mahasiswa. Mahasiswa dengan tingkat kehadiran yang lebih tinggi cenderung memperoleh nilai yang lebih baik dibandingkan mahasiswa dengan kehadiran rendah.

Dengan demikian, kedua variabel independen terbukti berpengaruh baik secara individu maupun bersama-sama terhadap nilai ujian mahasiswa.

3. Hitung nilai R² dan Adjusted R² secara manual dan interpretasikan hasilnya!

R-squared

R2 <- as.numeric(SSR / SST)
R2
## [1] 0.9993238

Hasil nilai R-squared mengartikan bahwa sebesar 99,93% variasi nilai ujian dapat dijelaskan oleh kedua variabel tersebut, yaitu jumlah jam belajar perminggu serta tingkat kehadiran mahasiswa.

Adjusted R2

Adj_R2 <- 1 - ((SSE/(n-k-1)) / (SST/(n-1)))
Adj_R2
##           [,1]
## [1,] 0.9991305

Selanjutnya, nilai Adjustred R2 mengartikan bahwa sebesar 99,91% variasi nilai ujian masih dapat dijelaskan oleh kedua variabel independen tersebut. Nilai ini sangat dekat dengan R², yang berarti model tidak mengalami overfitting dan variabel yang digunakan sudah relevan.

4. Bandingkan hasil no 1 s.d 3 dengan fungsi lm.

model <- lm(Y ~ X1 + X2, data = data)
summary(model)
## 
## Call:
## lm(formula = Y ~ X1 + X2, data = data)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.31078 -0.14588 -0.05074  0.04440  0.56237 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 16.13601    2.83677   5.688 0.000744 ***
## X1           1.16984    0.27844   4.201 0.004028 ** 
## X2           0.77449    0.05572  13.900 2.36e-06 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.2834 on 7 degrees of freedom
## Multiple R-squared:  0.9993, Adjusted R-squared:  0.9991 
## F-statistic:  5172 on 2 and 7 DF,  p-value: 8.042e-12

Berdasarkan hasil estimasi, maka diperoleh persamaan regresi sebagai berikut: \[ \hat{Y} = 16.13601 + 1.16984 X_1 + 0.77449 X_2\]

  1. Konstanta dengan niali 16.13601 menunjukkan nilai ujian ketika jam belajar dan kehadiran = 0. Secara matematis ada arti, tapi secara nyata kurang relevan.
  2. Selanjutnya setiap tambahan 1 jam belajar, maka nilai ujian akan naik sebesar 1.17 point
  3. Lalu yang terakhir, setiap tambahan 1% kehadiran, maka nilai ujian akan naik sebesar 0.77 point.

5. Prediksikan nilai ujian mahasiswa jika jumlah jam belajar 1 jam/minggu namun kehadirannya 100%!

X_new <- matrix(c(1, 1, 100), nrow = 1)
Y_pred <- X_new %*% beta
Y_pred
##          [,1]
## [1,] 94.75476

Hasil tersebut menunjukkan bahwa walaupun jumlah jam belajar tergolong rendah (hanya 1 jam per minggu), tingkat kehadiran yang mencapai 100% tetap memberikan pengaruh yang besar terhadap nilai ujian. Akibatnya, nilai yang diprediksi masih tinggi, yaitu sekitar 94,75.

Hal ini sejalan dengan hasil analisis sebelumnya yang menunjukkan bahwa variabel kehadiran (X2) memiliki pengaruh yang cukup dominan dalam meningkatkan nilai ujian mahasiswa.

Nilai prediksi sebesar 94.75 menunjukkan bahwa model mengindikasikan tingkat kehadiran memiliki peran yang sangat besar dalam meningkatkan nilai ujian, bahkan ketika jam belajar relatif rendah.