Seorang peneliti di sebuah Universitas ingin mengetahui faktor faktor apa saja yang dapat mempengaruhi nilai ujian mahasiswa dalam suatu mata kuliah. Karena menurutnya, nilai ujian tidak hanya di tentukan oleh kemampuan akademis seorang mahasiswa saja, namun faktor eksternal seperti lingkungannya pun dapat mempengaruhi nilai ujian mahasiswa tersebut. Dalam hal ini, akhirnya peneliti memfokuskan pada dua variabel faktor yang dapat mempengaruhi nilai ujian mahasiswa, yaitu jumlah jam belajar dalam satuan minggu serta tingkat kehadiran yang membantu mahasiswa lebih paham dengan mata pelajaran yang akan di uji. Untul menguji dan mendapatkan hasil yang diharapkan, peneliti mengumpulkan data dari 10 mahasiswa untuk melihat seberapa besar konstribusi faktor yang akan diuji. Berikut merupakan 10 data mahasiswa yang akan di uji
| Mahasiswa | Nilai Ujian (Y) | Jam Belajar (X1) | Kehadiran (X2) |
|---|---|---|---|
| 1 | 65 | 2 | 60 |
| 2 | 70 | 3 | 65 |
| 3 | 75 | 4 | 70 |
| 4 | 80 | 5 | 75 |
| 5 | 85 | 6 | 80 |
| 6 | 78 | 5 | 72 |
| 7 | 72 | 3 | 68 |
| 8 | 90 | 7 | 85 |
| 9 | 88 | 6 | 83 |
| 10 | 95 | 8 | 90 |
Dari data di atas, beberapa hal yang dapat di uji untuk mendapatkan seberapa besar konstribusi faktor tersebut, maka
lakukan input data terlebih dahulu agar r dapat membaca data yang akan di analisis
Y <- c(65,70,75,80,85,78,72,90,88,95)
X1 <- c(2,3,4,5,6,5,3,7,6,8)
X2 <- c(60,65,70,75,80,72,68,85,83,90)
data <- data.frame(Y, X1, X2)
data## Y X1 X2
## 1 65 2 60
## 2 70 3 65
## 3 75 4 70
## 4 80 5 75
## 5 85 6 80
## 6 78 5 72
## 7 72 3 68
## 8 90 7 85
## 9 88 6 83
## 10 95 8 90
# 1. Estimasi Model Linier Berganda
X <- cbind(1, X1, X2)
Y_mat <- matrix(Y, ncol = 1)
#2. Estimasi beta (OLS)
beta <- solve(t(X) %*% X) %*% t(X) %*% Y_mat
beta## [,1]
## 16.1360113
## X1 1.1698379
## X2 0.7744891
Dari hasil estimasi menggunakan metode OLS, diperoleh model regresi linier berganda yang digunakan untuk melihat hubungan antara jumlah jam belajar (X1) dan tingkat kehadiran (X2) terhadap nilai ujian mahasiswa (Y). Dari model yang digambarkan, dapat dilihat bahwa kedua variabel ini memiliki hubungan yang positif. yang artinya, setiap satu variabel naik maka nilai variabel lainnya akan ikut naik.
Koefisien regresi untuk variabel jumlah jam belajar (X1) bernilai positif. Ini menunjukkan bahwa setiap tambahan 1 jam belajar dalam seminggu bisa meningkatkan nilai ujian mahasiswa, dengan catatan variabel lain dianggap tetap (ceteris paribus). Hal ini menunjukkan kalau waktu belajar memang punya peran penting dalam meningkatkan hasil akademik.
Selain itu, variabel tingkat kehadiran (X2) juga memiliki koefisien positif. Artinya, setiap kenaikan 1% kehadiran akan berdampak pada kenaikan nilai ujian, dengan asumsi jam belajar tidak berubah. Kehadiran yang tinggi biasanya menandakan mahasiswa lebih aktif mengikuti pembelajaran, sehingga lebih mudah memahami materi yang diajarkan.
Untuk nilai konstanta (intercept), ini menggambarkan nilai ujian ketika jam belajar dan kehadiran bernilai nol.
Y_hat <- X %*% beta
e <- Y_mat - Y_hat
SSE <- t(e) %*% e
SST <- t(Y_mat - mean(Y)) %*% (Y_mat - mean(Y))
SSR <- SST - SSE
n <- length(Y)
k <- 2
MSR <- SSR / k
MSE <- SSE / (n - k - 1)
F_hit <- MSR / MSE
F_hit## [,1]
## [1,] 5172.116
Dari hasil uji F yang telah di lakukan, dapat di lihat bahwa nilai uji F lebih besar dari nilai tabel, ini menunjukkan bahwa jumlah jam belajar perminggu serta tingkat kehadiran memiliki pengaruh yang signifikan pada nilai ujian mahasiswa.
sigma2 <- as.numeric(SSE / (n - k - 1))
var_beta <- sigma2 * solve(t(X) %*% X)
se_beta <- sqrt(diag(var_beta))
t_hit <- beta / se_beta
t_hit## [,1]
## 5.688154
## X1 4.201468
## X2 13.900261
Selanjutnya yaitu uji T, Hasil uji t menunjukkan bahwa masing-masing variabel independen memiliki pengaruh terhadap variabel dependen.
Dengan demikian, kedua variabel independen terbukti berpengaruh baik secara individu maupun bersama-sama terhadap nilai ujian mahasiswa.
## [1] 0.9993238
Hasil nilai R-squared mengartikan bahwa sebesar 99,93% variasi nilai ujian dapat dijelaskan oleh kedua variabel tersebut, yaitu jumlah jam belajar perminggu serta tingkat kehadiran mahasiswa.
## [,1]
## [1,] 0.9991305
Selanjutnya, nilai Adjustred R2 mengartikan bahwa sebesar 99,91% variasi nilai ujian masih dapat dijelaskan oleh kedua variabel independen tersebut. Nilai ini sangat dekat dengan R², yang berarti model tidak mengalami overfitting dan variabel yang digunakan sudah relevan.
##
## Call:
## lm(formula = Y ~ X1 + X2, data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.31078 -0.14588 -0.05074 0.04440 0.56237
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 16.13601 2.83677 5.688 0.000744 ***
## X1 1.16984 0.27844 4.201 0.004028 **
## X2 0.77449 0.05572 13.900 2.36e-06 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.2834 on 7 degrees of freedom
## Multiple R-squared: 0.9993, Adjusted R-squared: 0.9991
## F-statistic: 5172 on 2 and 7 DF, p-value: 8.042e-12
Berdasarkan hasil estimasi, maka diperoleh persamaan regresi sebagai berikut: \[ \hat{Y} = 16.13601 + 1.16984 X_1 + 0.77449 X_2\]
## [,1]
## [1,] 94.75476
Hasil tersebut menunjukkan bahwa walaupun jumlah jam belajar tergolong rendah (hanya 1 jam per minggu), tingkat kehadiran yang mencapai 100% tetap memberikan pengaruh yang besar terhadap nilai ujian. Akibatnya, nilai yang diprediksi masih tinggi, yaitu sekitar 94,75.
Hal ini sejalan dengan hasil analisis sebelumnya yang menunjukkan bahwa variabel kehadiran (X2) memiliki pengaruh yang cukup dominan dalam meningkatkan nilai ujian mahasiswa.
Nilai prediksi sebesar 94.75 menunjukkan bahwa model mengindikasikan tingkat kehadiran memiliki peran yang sangat besar dalam meningkatkan nilai ujian, bahkan ketika jam belajar relatif rendah.