Tugas ke 2 Pengantar Model Linier. analisis faktor jumlah jam belajar (jam/minggu) dan tingkat kehadiran (%) mempengaruhi nilai ujian mahasiswa

Data Soal

Seorang peneliti ingin menganalisis faktor-faktor yang mempengaruhi nilai ujian mahasiswa (Y). Diduga bahwa nilai ujian dipengaruhi oleh:

  • X_1= Jumlah jam belajar (jam/minggu)

  • X_2 = Tingkat Kehadiran (%)

Peneliti mengumpulkan data dari 10 mahasiswa sebagai berikut:

Y  <- matrix(c(65, 70, 75, 80, 85, 78, 72, 90, 88, 95), ncol=1)

X1 <- c(2, 3, 4, 5, 6, 5, 3, 7, 6, 8)
X2 <- c(60, 65, 70, 75, 80, 72, 68, 85, 83, 90)

Pertanyaan

1. Estimasikan model regresi linier berganda menggunakan metode OLS berbasis matriks dan interpretasikan hasilnya?

2. Hitung Uji F dan uji t secara manual dan interpretasikan hasilnya?

3. Hitung nilai R² dan Adjusted R² secara manual dan interpretasikan hasilnya?

4. Bandingkan hasil no 1 s.d 3 dengan fungsi lm.

5. Prediksikan nilai ujian mahasiswa jika jumlah jam belajar 1 jam/minggu namun kehadirannya 100%?

Pengerjaan Soal

1. Estimasikan model regresi linier berganda menggunakan metode OLS berbasis matriks dan interpretasikan hasilnya?

# Matriks X (dengan intercept)
X <- cbind(1, X1, X2)

# Estimasi beta
beta_hat <- solve(t(X) %*% X) %*% t(X) %*% Y
beta_hat
##          [,1]
##    16.1360113
## X1  1.1698379
## X2  0.7744891

Jawaban

Berdasarkan perhitungan OLS berbasis matriks menggunakan rumus:

\[\hat{\beta} = (X'X)^{-1}X'Y\]

Diperoleh nilai koefisien sebagai berikut:

Parameter Simbol Nilai
Intercept \(\beta_0\) 16.1360113
Jam Belajar (\(X_1\)) \(\beta_1\) 1.1698379
Tingkat Kehadiran (\(X_2\)) \(\beta_2\) 0.7744891

Sehingga model regresi linier berganda yang terbentuk adalah:

\[\hat{Y} = 16{,}1360 + 1{,}1698 \cdot X_1 + 0{,}7745 \cdot X_2\]

Interpretasi Koefisien:

  • \(\beta_0 = 16,1360\): Jika jumlah jam belajar (\(X_1\)) dan tingkat kehadiran (\(X_2\)) bernilai 0, maka nilai ujian diprediksi sebesar 16,1360. Secara praktis nilai ini tidak bermakna karena kondisi tersebut tidak realistis, namun tetap diperlukan sebagai konstanta penyeimbang dalam model.

  • \(\beta_1 = 1,1698\): Setiap penambahan 1 jam belajar per minggu, nilai ujian mahasiswa diprediksi meningkat sebesar 1,1698 poin, dengan asumsi tingkat kehadiran (\(X_2\)) dianggap konstan.

  • \(\beta_2 = 0,7745\): Setiap penambahan 1% tingkat kehadiran, nilai ujian mahasiswa diprediksi meningkat sebesar 0,7745 poin, dengan asumsi jumlah jam belajar (\(X_1\)) dianggap konstan.

Kesimpulan: Kedua variabel memiliki pengaruh positif terhadap nilai ujian mahasiswa. Pengaruh jam belajar (\(\beta_1 = 1{,}17\)) sedikit lebih besar dibandingkan kehadiran (\(\beta_2 = 0{,}77\)) per satu satuan perubahannya. Namun karena satuan \(X_2\) adalah persen (skala 0–100), secara keseluruhan tingkat kehadiran berkontribusi sangat besar terhadap nilai ujian akhir.

2. Hitung Uji F dan uji t secara manual dan interpretasikan hasilnya?

Uji F

  • Hipotesis Uji
    \(H_0: \beta_1 = \beta_2 = 0\) (Secara simultan, Jumlah jam belajar (jam/minggu) dan Tingkat Kehadiran (%) tidak berpengaruh signifikan terhadap Nilai Ujian).
    \(H_1: \text{Minimal ada satu } \beta_i \neq 0\) (Secara simultan, Jumlah jam belajar (jam/minggu) dan Tingkat Kehadiran (%) tidak berpengaruh signifikan terhadap Nilai Ujian).

  • Tingkat Signifikansi
    Digunakan taraf nyata \(\alpha = 0,05\) (5%).

  • Perhitungan

# Prediksi
Y_hat <- X %*% beta_hat

# Residual
e <- Y - Y_hat

# Rata-rata Y
Y_mean <- mean(Y)

n <- nrow(X)   # jumlah observasi = 10
k <- 2         # jumlah variabel independen

# SST (Total Sum of Squares)
SST <- sum((Y - Y_mean)^2)

# SSE (Error Sum of Squares)
SSE <- sum(e^2)

# SSR (Regression Sum of Squares)
SSR <- SST - SSE

MSR <- SSR / k

MSE <- SSE / (n - k - 1)

# --- Uji F ---
F_Hitung  <- MSR / MSE
F_Hitung
## [1] 5172.116
F_tabel <- qf(0.95, df1 = k, df2 = n - k - 1)
F_tabel
## [1] 4.737414
  • Kriteria Pengambilan Keputusan
    Tolak \(H_0\) jika \(F_{hitung} > F_{tabel}\), dan gagal tolak \(H_0\) jika \(F_{hitung} \leq F_{tabel}\).

  • Interpretasi Hasil
    Berdasarkan hasil perhitungan diperoleh nilai \(F_{hitung} = 5172,116\) dan \(F_{tabel} = 4,737\) pada taraf nyata \(\alpha = 0{,}05\) dengan \(df_1 = k = 2\) dan \(df_2 = n-k-1 = 7\).
    Karena \(F_{hitung} (5172,116) > F_{tabel} (4,737)\), maka \(H_0\) ditolak.

  • Kesimpulan
    Artinya, secara simultan jumlah jam belajar (\(X_1\)) dan tingkat kehadiran (\(X_2\)) berpengaruh signifikan terhadap nilai ujian mahasiswa (\(Y\)) pada taraf nyata 5%.

Uji t

  • Hipotesis Uji 

    Untuk \(\beta_1\) (Jam Belajar):
    \(H_0: \beta_1 = 0\) (Jumlah jam belajar tidak berpengaruh signifikan secara parsial terhadap nilai ujian)
    \(H_1: \beta_1 \neq 0\) (Jumlah jam belajar berpengaruh signifikan secara parsial terhadap nilai ujian)


    Untuk \(\beta_2\) (Tingkat Kehadiran):
    \(H_0: \beta_2 = 0\) (Tingkat kehadiran tidak berpengaruh signifikan secara parsial terhadap nilai ujian)
    \(H_1: \beta_2 \neq 0\) (Tingkat kehadiran berpengaruh signifikan secara parsial terhadap nilai ujian)

  • Tingkat Signifikansi  Digunakan taraf nyata \(\alpha = 0,05\) (5%).

  • Perhitungan

# --- Uji t ---
SE_beta <- sqrt(diag(MSE * solve(t(X) %*% X)))
t_Hitung  <- beta_hat / SE_beta
t_Hitung
##         [,1]
##     5.688154
## X1  4.201468
## X2 13.900261
t_tabel <- qt(0.975, df = n - k - 1)
t_tabel
## [1] 2.364624
  • Kriteria Pengambilan Keputusan  Tolak \(H_0\) jika \(|t_{hitung}| > t_{tabel}\), dan gagal tolak \(H_0\) jika \(|t_{hitung}| \leq t_{tabel}\).

  • Interpretasi Hasil 
    Intercept (\(\beta_0\)): Nilai \(t_{hitung} = 5{,}6882 > t_{tabel} = 2,3646\), maka \(H_0\) ditolak.


    Jam Belajar (\(X_1\)): Nilai \(t_{hitung} = 4{,}2015 > t_{tabel} = 2,3646\), maka \(H_0\) ditolak.
    Artinya, jumlah jam belajar berpengaruh signifikan secara parsial terhadap nilai ujian mahasiswa pada taraf nyata 5%. Setiap penambahan 1 jam belajar per minggu akan meningkatkan nilai ujian sebesar 1,1698 poin, dengan asumsi tingkat kehadiran konstan.


    Tingkat Kehadiran (\(X_2\)): Nilai \(t_{hitung} = 13{,}9003 > t_{tabel} = 2,3646\), maka \(H_0\) ditolak.
    Artinya, tingkat kehadiran berpengaruh signifikan secara parsial terhadap nilai ujian mahasiswa pada taraf nyata 5%. Setiap penambahan 1% tingkat kehadiran akan meningkatkan nilai ujian sebesar 0,7745 poin, dengan asumsi jumlah jam belajar konstan.

  • Kesimpulan
    Artinya, Secara parsial, baik jumlah jam belajar (\(X_1\)) maupun tingkat kehadiran (\(X_2\)) masing-masing berpengaruh signifikan terhadap nilai ujian mahasiswa (\(Y\)) pada taraf nyata \(\alpha = 5\%\).

3. Hitung nilai R² dan Adjusted R² secara manual dan interpretasikan hasilnya?

#Hitung R Square
R2 <- SSR / SST
R2
## [1] 0.9993238
#Hitung Adjusted R Square
n <- nrow(X)
k <- 2  # jumlah variabel independen

Adj_R2 <- 1 - ((SSE/(n-k-1)) / (SST/(n-1)))
Adj_R2
## [1] 0.9991305

Berdasarkan hasil perhitungan diperoleh nilai \(R^2 = 0,9993\) dan \(R^2\ Adjusted = 0,9991\).

Durasi belajar (\(X_1\)) dan tingkat kehadiran (\(X_2\)) mampu menjelaskan keragaman/variasi dari persentase nilai ujian mahasiswa (\(Y\)) sebesar 99,91%, sedangkan sisanya sebesar 0,09% dijelaskan oleh variabel lain di luar model.

4. Bandingkan hasil no 1 s.d 3 dengan fungsi lm.

model <- lm(Y ~ X1 + X2)
summary(model)
## 
## Call:
## lm(formula = Y ~ X1 + X2)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.31078 -0.14588 -0.05074  0.04440  0.56237 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 16.13601    2.83677   5.688 0.000744 ***
## X1           1.16984    0.27844   4.201 0.004028 ** 
## X2           0.77449    0.05572  13.900 2.36e-06 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.2834 on 7 degrees of freedom
## Multiple R-squared:  0.9993, Adjusted R-squared:  0.9991 
## F-statistic:  5172 on 2 and 7 DF,  p-value: 8.042e-12

Berdasarkan output fungsi lm(), diperoleh hasil sebagai berikut:

Parameter Manual (Matriks) lm() Keterangan
\(\beta_0\) (Intercept) 16,1360 16,13601 Sama
\(\beta_1\) (Jam Belajar) 1,1698 1,16984 Sama
\(\beta_2\) (Kehadiran) 0,7745 0,77449 Sama
\(F_{hitung}\) 5172,116 5172 Sama
\(t_{\beta_0}\) (Intercept) 5,688 5,688 Sama
\(t_{\beta_1}\) (Jam Belajar) 4,201 4,201 Sama
\(t_{\beta_2}\) (Kehadiran) 13,900 13,900 Sama
\(R^2\) 0,9993 0,9993 Sama
\(Adjusted\ R^2\) 0,9991 0,9991 Sama

Berdasarkan perbandingan di atas, hasil perhitungan manual menggunakan metode OLS berbasis matriks menghasilkan nilai yang identik dengan hasil fungsi lm() di R. Hal ini membuktikan bahwa perhitungan manual yang dilakukan sudah benar dan valid.

5. Prediksikan nilai ujian mahasiswa jika jumlah jam belajar 1 jam/minggu namun kehadirannya 100%?

X_new    <- matrix(c(1, 1, 100), nrow=1)  # [intercept, X1=1, X2=100]
Y_pred   <- X_new %*% beta_hat
Y_pred
##          [,1]
## [1,] 94.75476

Berdasarkan hasil perhitungan prediksi menggunakan model regresi yang telah terbentuk, dengan memasukkan nilai \(X_1 = 1\) (jam belajar 1 jam/minggu) dan \(X_2 = 100\) (tingkat kehadiran 100%), diperoleh:

\[\hat{Y} = 16{,}1360 + 1{,}1698 \cdot (1) + 0{,}7745 \cdot (100) = 94{,}7548\]

Kesimpulan: Mahasiswa yang hanya belajar 1 jam per minggu namun memiliki tingkat kehadiran 100% diprediksi akan memperoleh nilai ujian sebesar 94,75.

Hal ini menunjukkan bahwa tingkat kehadiran yang sangat tinggi mampu memberikan kontribusi besar terhadap nilai ujian, meskipun jam belajar mandiri mahasiswa tersebut tergolong sangat rendah.