Tugas ke 2 Pengantar Model Linier. analisis faktor jumlah jam belajar (jam/minggu) dan tingkat kehadiran (%) mempengaruhi nilai ujian mahasiswa
Data Soal
Seorang peneliti ingin menganalisis faktor-faktor yang mempengaruhi nilai ujian mahasiswa (Y). Diduga bahwa nilai ujian dipengaruhi oleh:
X_1= Jumlah jam belajar (jam/minggu)
X_2 = Tingkat Kehadiran (%)
Peneliti mengumpulkan data dari 10 mahasiswa sebagai berikut:
Pertanyaan
1. Estimasikan model regresi linier berganda menggunakan metode OLS berbasis matriks dan interpretasikan hasilnya?
2. Hitung Uji F dan uji t secara manual dan interpretasikan hasilnya?
3. Hitung nilai R² dan Adjusted R² secara manual dan interpretasikan hasilnya?
4. Bandingkan hasil no 1 s.d 3 dengan fungsi lm.
5. Prediksikan nilai ujian mahasiswa jika jumlah jam belajar 1 jam/minggu namun kehadirannya 100%?
Pengerjaan Soal
1. Estimasikan model regresi linier berganda menggunakan metode OLS berbasis matriks dan interpretasikan hasilnya?
# Matriks X (dengan intercept)
X <- cbind(1, X1, X2)
# Estimasi beta
beta_hat <- solve(t(X) %*% X) %*% t(X) %*% Y
beta_hat## [,1]
## 16.1360113
## X1 1.1698379
## X2 0.7744891
Jawaban
Berdasarkan perhitungan OLS berbasis matriks menggunakan rumus:
\[\hat{\beta} = (X'X)^{-1}X'Y\]
Diperoleh nilai koefisien sebagai berikut:
| Parameter | Simbol | Nilai |
|---|---|---|
| Intercept | \(\beta_0\) | 16.1360113 |
| Jam Belajar (\(X_1\)) | \(\beta_1\) | 1.1698379 |
| Tingkat Kehadiran (\(X_2\)) | \(\beta_2\) | 0.7744891 |
Sehingga model regresi linier berganda yang terbentuk adalah:
\[\hat{Y} = 16{,}1360 + 1{,}1698 \cdot X_1 + 0{,}7745 \cdot X_2\]
Interpretasi Koefisien:
\(\beta_0 = 16,1360\): Jika jumlah jam belajar (\(X_1\)) dan tingkat kehadiran (\(X_2\)) bernilai 0, maka nilai ujian diprediksi sebesar 16,1360. Secara praktis nilai ini tidak bermakna karena kondisi tersebut tidak realistis, namun tetap diperlukan sebagai konstanta penyeimbang dalam model.
\(\beta_1 = 1,1698\): Setiap penambahan 1 jam belajar per minggu, nilai ujian mahasiswa diprediksi meningkat sebesar 1,1698 poin, dengan asumsi tingkat kehadiran (\(X_2\)) dianggap konstan.
\(\beta_2 = 0,7745\): Setiap penambahan 1% tingkat kehadiran, nilai ujian mahasiswa diprediksi meningkat sebesar 0,7745 poin, dengan asumsi jumlah jam belajar (\(X_1\)) dianggap konstan.
Kesimpulan: Kedua variabel memiliki pengaruh positif terhadap nilai ujian mahasiswa. Pengaruh jam belajar (\(\beta_1 = 1{,}17\)) sedikit lebih besar dibandingkan kehadiran (\(\beta_2 = 0{,}77\)) per satu satuan perubahannya. Namun karena satuan \(X_2\) adalah persen (skala 0–100), secara keseluruhan tingkat kehadiran berkontribusi sangat besar terhadap nilai ujian akhir.
2. Hitung Uji F dan uji t secara manual dan interpretasikan hasilnya?
Uji F
Hipotesis Uji
\(H_0: \beta_1 = \beta_2 = 0\) (Secara simultan, Jumlah jam belajar (jam/minggu) dan Tingkat Kehadiran (%) tidak berpengaruh signifikan terhadap Nilai Ujian).
\(H_1: \text{Minimal ada satu } \beta_i \neq 0\) (Secara simultan, Jumlah jam belajar (jam/minggu) dan Tingkat Kehadiran (%) tidak berpengaruh signifikan terhadap Nilai Ujian).
Tingkat Signifikansi
Digunakan taraf nyata \(\alpha = 0,05\) (5%).Perhitungan
# Prediksi
Y_hat <- X %*% beta_hat
# Residual
e <- Y - Y_hat
# Rata-rata Y
Y_mean <- mean(Y)
n <- nrow(X) # jumlah observasi = 10
k <- 2 # jumlah variabel independen
# SST (Total Sum of Squares)
SST <- sum((Y - Y_mean)^2)
# SSE (Error Sum of Squares)
SSE <- sum(e^2)
# SSR (Regression Sum of Squares)
SSR <- SST - SSE
MSR <- SSR / k
MSE <- SSE / (n - k - 1)
# --- Uji F ---
F_Hitung <- MSR / MSE
F_Hitung## [1] 5172.116
## [1] 4.737414
Kriteria Pengambilan Keputusan
Tolak \(H_0\) jika \(F_{hitung} > F_{tabel}\), dan gagal tolak \(H_0\) jika \(F_{hitung} \leq F_{tabel}\).Interpretasi Hasil
Berdasarkan hasil perhitungan diperoleh nilai \(F_{hitung} = 5172,116\) dan \(F_{tabel} = 4,737\) pada taraf nyata \(\alpha = 0{,}05\) dengan \(df_1 = k = 2\) dan \(df_2 = n-k-1 = 7\).
Karena \(F_{hitung} (5172,116) > F_{tabel} (4,737)\), maka \(H_0\) ditolak.
Kesimpulan
Artinya, secara simultan jumlah jam belajar (\(X_1\)) dan tingkat kehadiran (\(X_2\)) berpengaruh signifikan terhadap nilai ujian mahasiswa (\(Y\)) pada taraf nyata 5%.
Uji t
Hipotesis Uji
Untuk \(\beta_1\) (Jam Belajar):
\(H_0: \beta_1 = 0\) (Jumlah jam belajar tidak berpengaruh signifikan secara parsial terhadap nilai ujian)
\(H_1: \beta_1 \neq 0\) (Jumlah jam belajar berpengaruh signifikan secara parsial terhadap nilai ujian)
Untuk \(\beta_2\) (Tingkat Kehadiran):
\(H_0: \beta_2 = 0\) (Tingkat kehadiran tidak berpengaruh signifikan secara parsial terhadap nilai ujian)
\(H_1: \beta_2 \neq 0\) (Tingkat kehadiran berpengaruh signifikan secara parsial terhadap nilai ujian)Tingkat Signifikansi Digunakan taraf nyata \(\alpha = 0,05\) (5%).
Perhitungan
# --- Uji t ---
SE_beta <- sqrt(diag(MSE * solve(t(X) %*% X)))
t_Hitung <- beta_hat / SE_beta
t_Hitung## [,1]
## 5.688154
## X1 4.201468
## X2 13.900261
## [1] 2.364624
Kriteria Pengambilan Keputusan Tolak \(H_0\) jika \(|t_{hitung}| > t_{tabel}\), dan gagal tolak \(H_0\) jika \(|t_{hitung}| \leq t_{tabel}\).
Interpretasi Hasil
Intercept (\(\beta_0\)): Nilai \(t_{hitung} = 5{,}6882 > t_{tabel} = 2,3646\), maka \(H_0\) ditolak.
Jam Belajar (\(X_1\)): Nilai \(t_{hitung} = 4{,}2015 > t_{tabel} = 2,3646\), maka \(H_0\) ditolak.
Artinya, jumlah jam belajar berpengaruh signifikan secara parsial terhadap nilai ujian mahasiswa pada taraf nyata 5%. Setiap penambahan 1 jam belajar per minggu akan meningkatkan nilai ujian sebesar 1,1698 poin, dengan asumsi tingkat kehadiran konstan.
Tingkat Kehadiran (\(X_2\)): Nilai \(t_{hitung} = 13{,}9003 > t_{tabel} = 2,3646\), maka \(H_0\) ditolak.
Artinya, tingkat kehadiran berpengaruh signifikan secara parsial terhadap nilai ujian mahasiswa pada taraf nyata 5%. Setiap penambahan 1% tingkat kehadiran akan meningkatkan nilai ujian sebesar 0,7745 poin, dengan asumsi jumlah jam belajar konstan.Kesimpulan
Artinya, Secara parsial, baik jumlah jam belajar (\(X_1\)) maupun tingkat kehadiran (\(X_2\)) masing-masing berpengaruh signifikan terhadap nilai ujian mahasiswa (\(Y\)) pada taraf nyata \(\alpha = 5\%\).
3. Hitung nilai R² dan Adjusted R² secara manual dan interpretasikan hasilnya?
## [1] 0.9993238
#Hitung Adjusted R Square
n <- nrow(X)
k <- 2 # jumlah variabel independen
Adj_R2 <- 1 - ((SSE/(n-k-1)) / (SST/(n-1)))
Adj_R2## [1] 0.9991305
Berdasarkan hasil perhitungan diperoleh nilai \(R^2 = 0,9993\) dan \(R^2\ Adjusted = 0,9991\).
Durasi belajar (\(X_1\)) dan tingkat kehadiran (\(X_2\)) mampu menjelaskan keragaman/variasi dari persentase nilai ujian mahasiswa (\(Y\)) sebesar 99,91%, sedangkan sisanya sebesar 0,09% dijelaskan oleh variabel lain di luar model.
4. Bandingkan hasil no 1 s.d 3 dengan fungsi lm.
##
## Call:
## lm(formula = Y ~ X1 + X2)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.31078 -0.14588 -0.05074 0.04440 0.56237
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 16.13601 2.83677 5.688 0.000744 ***
## X1 1.16984 0.27844 4.201 0.004028 **
## X2 0.77449 0.05572 13.900 2.36e-06 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.2834 on 7 degrees of freedom
## Multiple R-squared: 0.9993, Adjusted R-squared: 0.9991
## F-statistic: 5172 on 2 and 7 DF, p-value: 8.042e-12
Berdasarkan output fungsi lm(), diperoleh hasil sebagai
berikut:
| Parameter | Manual (Matriks) | lm() |
Keterangan |
|---|---|---|---|
| \(\beta_0\) (Intercept) | 16,1360 | 16,13601 | Sama |
| \(\beta_1\) (Jam Belajar) | 1,1698 | 1,16984 | Sama |
| \(\beta_2\) (Kehadiran) | 0,7745 | 0,77449 | Sama |
| \(F_{hitung}\) | 5172,116 | 5172 | Sama |
| \(t_{\beta_0}\) (Intercept) | 5,688 | 5,688 | Sama |
| \(t_{\beta_1}\) (Jam Belajar) | 4,201 | 4,201 | Sama |
| \(t_{\beta_2}\) (Kehadiran) | 13,900 | 13,900 | Sama |
| \(R^2\) | 0,9993 | 0,9993 | Sama |
| \(Adjusted\ R^2\) | 0,9991 | 0,9991 | Sama |
Berdasarkan perbandingan di atas, hasil perhitungan manual
menggunakan metode OLS berbasis matriks menghasilkan nilai yang identik
dengan hasil fungsi lm() di R. Hal ini membuktikan bahwa
perhitungan manual yang dilakukan sudah benar dan valid.
5. Prediksikan nilai ujian mahasiswa jika jumlah jam belajar 1 jam/minggu namun kehadirannya 100%?
X_new <- matrix(c(1, 1, 100), nrow=1) # [intercept, X1=1, X2=100]
Y_pred <- X_new %*% beta_hat
Y_pred## [,1]
## [1,] 94.75476
Berdasarkan hasil perhitungan prediksi menggunakan model regresi yang telah terbentuk, dengan memasukkan nilai \(X_1 = 1\) (jam belajar 1 jam/minggu) dan \(X_2 = 100\) (tingkat kehadiran 100%), diperoleh:
\[\hat{Y} = 16{,}1360 + 1{,}1698 \cdot (1) + 0{,}7745 \cdot (100) = 94{,}7548\]
Kesimpulan: Mahasiswa yang hanya belajar 1 jam per minggu namun memiliki tingkat kehadiran 100% diprediksi akan memperoleh nilai ujian sebesar 94,75.
Hal ini menunjukkan bahwa tingkat kehadiran yang sangat tinggi mampu memberikan kontribusi besar terhadap nilai ujian, meskipun jam belajar mandiri mahasiswa tersebut tergolong sangat rendah.