Analisis Regresi Linear Berganda: Pengaruh Jumlah Belajar (jam/minggu) dan Tingkat Kehadiran (%) terhadap Nilai Ujian Mahasiswa

I. Pendahuluan

Regresi linear berganda merupakan metode analisis statistik yang digunakan untuk mengetahui hubungan antara satu variabel terikat (dependent variable) dengan dua atau lebih variabel bebas (independent variable). Metode ini memungkinkan peneliti untuk melihat pengaruh beberapa variabel prediktor terhadap suatu variabel respon secara simultan maupun parsial serta membentuk model persamaan yang dapat menjelaskan hubungan antar variabel tersebut (Sugiyono, 2012; Yuliara, 2016). Melalui analisis regresi berganda, dapat diketahui arah dan besar pengaruh masing-masing variabel bebas terhadap variabel terikat.

II. Deskripsi Kerja

2.1 Studi Kasus

Penelitian ini menggunakan data hasil pengamatan terhadap sepuluh siswa yang meliputi jumlah jam belajar (jam/mingu), tingkat kehadiran (dalam persentase), serta nilai Ujian Mahasiswa. Data tersebut digunakan untuk menganalisis faktor-faktor yang diduga memengaruhi hasil belajar mahasiswa.

Permasalahan yang dikaji dalam penelitian ini adalah apakah tingkat kehadiran dan jumlah jam belajar berpengaruh terhadap nilai Ujian Mahasiswa, baik secara simultan maupun parsial. Selain itu, analisis ini juga bertujuan untuk mengetahui variabel mana yang memiliki pengaruh lebih dominan terhadap nilai UAS.

Variabel yang digunakan dalam penelitian ini didefinisikan sebagai berikut:

Variabel Terikat (Y) Nilai Ujian Mahasiswa.
Variabel Bebas (X₁) Jumlah Jam Belajar.
Variabel Bebas (X₂) Tingkat Kehadiran (%).

2.2 Persiapan Data

Input Data

Pada tahap ini, data penelitian dimasukkan secara langsung ke dalam perangkat lunak R menggunakan fungsi data.frame(). Data yang digunakan terdiri dari tiga variabel, yaitu nilai ujian mahasiswa $(Y)$ sebagai variabel dependen, jumlah jam belajar per minggu $(X_1)$ , dan tingkat kehadiran $(X_2)$ sebagai variabel independen.

Metode input data secara langsung dipilih karena jumlah observasi relatif sedikit, yaitu sebanyak 10 mahasiswa, sehingga lebih praktis dan memudahkan proses analisis. Setelah data dimasukkan, dataset ditampilkan untuk memastikan bahwa seluruh nilai telah tersusun dengan benar sebelum dilakukan analisis regresi linier berganda.
```
# Input data secara langsung ke dalam R
datareg <- data.frame(
  Y  = c(65, 70, 75, 80, 85, 78, 72, 90, 88, 95),
  X1 = c(2, 3, 4, 5, 6, 5, 3, 7, 6, 8),
  X2 = c(60, 65, 70, 75, 80, 72, 68, 85, 83, 90)
)

# Menampilkan dataset
datareg
```
```
##     Y X1 X2
## 1  65  2 60
## 2  70  3 65
## 3  75  4 70
## 4  80  5 75
## 5  85  6 80
## 6  78  5 72
## 7  72  3 68
## 8  90  7 85
## 9  88  6 83
## 10 95  8 90
```
```
# Definisi Variabel
Y <- as.matrix(datareg$Y)
X1 <- datareg$X1
X2 <- datareg$X2

n <- length(Y)
```
Ringkasan Data

Setelah data dimasukkan, dilakukan ringkasan data untuk memahami statistik deskriptif seperti nilai minimum, maksimum, rata-rata, dan ukuran pemusatan lainnya. Tahap ini bertujuan untuk memberikan gambaran awal mengenai karakteristik data serta memastikan bahwa data telah siap digunakan dalam proses analisis lebih lanjut.
```
# Ringkasan Data 
summary(datareg)
```
```
##        Y               X1             X2       
##  Min.   :65.00   Min.   :2.00   Min.   :60.00  
##  1st Qu.:72.75   1st Qu.:3.25   1st Qu.:68.50  
##  Median :79.00   Median :5.00   Median :73.50  
##  Mean   :79.80   Mean   :4.90   Mean   :74.80  
##  3rd Qu.:87.25   3rd Qu.:6.00   3rd Qu.:82.25  
##  Max.   :95.00   Max.   :8.00   Max.   :90.00
```
Berdasarkan hasil ringkasan data, variabel Y (nilai ujian mahasiswa) memiliki nilai minimum sebesar 65 dan maksimum sebesar 95, dengan rata-rata 79,8 serta median 79, yang menunjukkan bahwa nilai ujian mahasiswa secara umum berada pada kategori cukup tinggi dan relatif terpusat di sekitar rata-ratanya. Variabel $X_1$ (jumlah jam belajar per minggu) memiliki rentang dari 2 jam hingga 8 jam, dengan rata-rata 4,9 jam dan median 5 jam, sehingga dapat dikatakan bahwa sebagian besar mahasiswa belajar sekitar 5 jam per minggu. Sementara itu, variabel $X_2$ (tingkat kehadiran) berkisar antara 60% hingga 90%, dengan rata-rata 74,8% dan median 73,5%, yang menunjukkan bahwa tingkat kehadiran mahasiswa cenderung cukup baik. Secara keseluruhan, ketiga variabel memiliki sebaran data yang cukup wajar tanpa adanya nilai yang tampak ekstrem, sehingga data dinilai layak untuk digunakan dalam analisis regresi linier berganda.
Eksplorasi Data

Pada tahap ini dilakukan visualisasi data untuk melihat pola hubungan antara variabel bebas dengan variabel terikat. Visualisasi yang digunakan berupa scatter plot dan matriks plot untuk mengetahui kecenderungan hubungan antar variabell
```
# Scatter plot Jumlah jam belajar vs Nilai Ujian 

plot(datareg$X1, datareg$Y, main = "Jam belajar vs Nilai Ujian", xlab = "Jam Belajar", ylab = "Nilai Ujian", pch = 16)

# garis regresi
abline(lm(Y ~ X1, data = datareg),
       lwd = 2, col = "red" )
```
```
# Scatter plot IQ vs Nilai UAS
plot(datareg$X2, datareg$Y,
     main = "Kehadiran vs Nilai Ujian",
     xlab = "Kehadiran",
     ylab = "Nilai Ujian",
     pch = 16)

# Tambah garis regresi
abline(lm(Y ~ X2, data = datareg),
       lwd = 2, col = "blue")
```
```
# matriks hubungan antar variabel
```
Berdasarkan kedua scatter plot tersebut, terlihat bahwa jumlah jam belajar (X1) maupun tingkat kehadiran (X2) sama-sama memiliki hubungan positif dengan nilai ujian mahasiswa (Y), yang ditunjukkan oleh pola titik data yang cenderung naik seiring bertambahnya nilai variabel bebas. Pada plot Jam Belajar vs Nilai Ujian, titik-titik data mengikuti garis regresi merah dengan cukup baik, sehingga menunjukkan bahwa semakin banyak jam belajar per minggu, nilai ujian cenderung meningkat, meskipun masih terdapat sedikit variasi antar mahasiswa pada jam belajar yang sama.

Sementara itu, pada plot Kehadiran vs Nilai Ujian, titik-titik data tampak lebih rapat dan hampir sejajar dengan garis regresi biru, yang mengindikasikan bahwa hubungan antara tingkat kehadiran dan nilai ujian terlihat lebih kuat dan lebih konsisten dibandingkan hubungan jam belajar dengan nilai ujian. Secara keseluruhan, kedua variabel bebas berpotensi memberikan pengaruh positif terhadap nilai ujian dan layak untuk dimasukkan dalam model regresi linier berganda.

2.3 Tahapan Pengolahan Data

Regresi linear berganda dapat dituliskan dalam bentuk persamaan matriks sebagai berikut:

\[ \hat{\beta} = (X^T X)^{-1} X^T Y \]

di mana:

$X$ adalah matriks variabel bebas (termasuk intercept)
$Y$ adalah vektor variabel terikat
$\hat{\beta}$ adalah vektor koefisien regresi

Metode ini digunakan untuk memperoleh estimasi parameter secara manual menggunakan operasi matriks.

Membentuk Matriks Desain

Pada tahap ini dilakukan pembentukan matriks desain dan perhitungan parameter regresi secara manual menggunakan operasi matriks di R.
```
# Matriks desain 
X <- cbind(1, X1, X2) 
X
```
Perhitungan Manual Regresi
```
# hitung beta manual 
XtX <- t(X) %*% X 
XtX_inv <- solve(XtX) 
XtY <- t(X) %*% Y

beta_manual <- XtX_inv %*% XtY 
beta_manual
```
Berdasarkan hasil perhitungan manual, diperoleh nilai koefisien regresi sebagai berikut:

$\beta_0$ = intercept

$\beta_1$ = koefisien tingkat kehadiran

$\beta_2$ = koefisien IQ

Sehingga model regresi yang terbentuk adalah:

\[Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2\]

Nilai koefisien ini menunjukkan bahwa setiap perubahan pada variabel bebas akan memengaruhi nilai UAS sesuai dengan besar koefisiennya.

Menghitung Prediksi & Residual

# prediksi dan residual 
Y_hat <- X %*% beta_manual 
residual <- Y - Y_hat

Uji Signifikansi (ANOVA/Uji F)

Menghitung SST, SSR, SSE, lalu F-value dan p-value.

# Uji F (simultan)
mean_y <- mean(Y)

SST <- sum((Y - mean_y)^2)
SSR <- sum((Y_hat - mean_y)^2)
SSE <- sum((Y - Y_hat)^2)

df_reg <- ncol(X) - 1
df_er <- n - ncol(X)

MSR <- SSR / df_reg
MSE <- SSE / df_er

F_value <- MSR / MSE
pvalue_F <- pf(F_value, df_reg, df_er, lower.tail = FALSE)

F_value
pvalue_F

Uji Parsial

# =========================
# UJI PARSIAL (UJI t) MANUAL
# =========================

# Varians galat (MSE sudah dihitung sebelumnya)
sigma2 <- MSE

# Matriks kovarians koefisien beta
cov_beta <- sigma2 * XtX_inv
cov_beta

# Standar error masing-masing koefisien
SE_beta <- sqrt(diag(cov_beta))
SE_beta

# t hitung untuk masing-masing koefisien
t_hit <- as.vector(beta_manual) / SE_beta
t_hit

# p-value uji t (dua sisi)
pvalue_t <- 2 * pt(abs(t_hit), df = df_er, lower.tail = FALSE)
pvalue_t

# t tabel (alpha = 0.05, dua sisi)
alpha <- 0.05
t_tabel <- qt(1 - alpha/2, df = df_er)
t_tabel

# Gabungkan hasil dalam tabel biar rapi
hasil_uji_t <- data.frame(
  Koefisien = c("Intercept", "X1", "X2"),
  Beta = as.vector(beta_manual),
  Std_Error = SE_beta,
  t_hitung = t_hit,
  p_value = pvalue_t
)

hasil_uji_t

Koefisien Determinasi $R^2$

# koefisien determinasi 
R2_manual <- SSR / SST 
R2_manual

Adjusted $R^2$

#hitung Adjusted RSquare
n <- nrow(X)
k <- 2
Adj_R2 <- 1-((SSE/(n-k-1))/(SST/(n-1)))
Adj_R2

Perhitungan Otomatis dengan lm()

Menggunakan fungsi lm() untuk regresi berganda

# perhitungan otomatis (lm)
model <- lm(Y ~ X1 + X2, data = datareg)

summary(model)
anova(model)

III. Hasil dan Pembahasan

Sebelum membahas persamaan regresi dan interpretasinya, penting untuk meninjau kesesuaian hasil perhitungan manual dengan hasil otomatis menggunakan fungsi lm(). Hal ini bertujuan untuk memastikan bahwa perhitungan manual yang dilakukan melalui operasi matriks (transpos, perkalian, invers, dll.) telah memberikan estimasi koefisien yang konsisten dengan metode standar di R.

XtX <- t(X) %*% X
XtX_inv <- solve(XtX)
XtY <- t(X) %*% Y
beta_manual <- XtX_inv %*% XtY

# --- Perhitungan otomatis menggunakan lm() ---
model <- lm(Y~ X1+X2, data = datareg)
beta_lm <- coef(model)

# --- Tabel perbandingan koefisien ---
comparison <- data.frame( 
  Koefisien = c("Intercept", "X1", "X2"), 
  Manual = round(beta_manual, 4), 
  LM = round(beta_lm, 4))

comparison

##    Koefisien  Manual      LM
##    Intercept 16.1360 16.1360
## X1        X1  1.1698  1.1698
## X2        X2  0.7745  0.7745

Selain koefisien, kita juga bisa membandingkan nilai F, p-value, R², Adj R², dan nilai t yang akan memperkuat kesimpulan tentang kesesuaian kedua metode:

summary_lm <- summary(model)$coefficients

t_comparison <- data.frame(
  Parameter = c("Intercept", "X1", "X2"),
  t_Manual = t_hit,
  t_lm = summary_lm[, "t value"],
  p_val_Manual = pvalue_t,
  p_val_lm = summary_lm[, "Pr(>|t|)"]
)

# 2. Membuat Tabel Perbandingan untuk Statistik Model (F dan R2)
model_comparison <- data.frame(
  Statistik = c("F-Statistic", "P-value F", "R-Squared", "Adj R-Squared"),
  Manual = c(F_value, pvalue_F, R2_manual, Adj_R2),
  Otomatis_lm = c(
    summary(model)$fstatistic[1],
    pf(summary(model)$fstatistic[1], summary(model)$fstatistic[2], summary(model)$fstatistic[3], lower.tail = FALSE),
    summary(model)$r.squared,
    summary(model)$adj.r.squared
  )
)

# Menampilkan Hasil
cat("\n--- PERBANDINGAN UJI T (PARSIAL) ---\n")

## 
## --- PERBANDINGAN UJI T (PARSIAL) ---

print(t_comparison)

##    Parameter  t_Manual      t_lm p_val_Manual     p_val_lm
##    Intercept  5.688154  5.688154 7.444177e-04 7.444177e-04
## X1        X1  4.201468  4.201468 4.028204e-03 4.028204e-03
## X2        X2 13.900261 13.900261 2.357834e-06 2.357834e-06

cat("\n--- PERBANDINGAN MODEL (F & R-SQUARE) ---\n")

## 
## --- PERBANDINGAN MODEL (F & R-SQUARE) ---

print(model_comparison)

##       Statistik       Manual  Otomatis_lm
## 1   F-Statistic 5.172116e+03 5.172116e+03
## 2     P-value F 8.042129e-12 8.042129e-12
## 3     R-Squared 9.993238e-01 9.993238e-01
## 4 Adj R-Squared 9.991305e-01 9.991305e-01

Berdasarkan perbandingan antara perhitungan manual dan hasil regresi menggunakan fungsi lm(), dapat disimpulkan bahwa kedua metode menghasilkan nilai koefisien, F-value, p-value, dan R², Adj R², maupun t-value yang sangat konsisten. Hal ini menunjukkan bahwa prosedur perhitungan manual yang dilakukan melalui operasi matriks dapat dipercaya dan valid, serta memberikan hasil yang sebanding dengan metode standar di R.

Kesamaan hasil ini memberikan dasar yang kuat untuk melanjutkan ke pembahasan persamaan regresi berganda. Dengan mengetahui bahwa model manual dan otomatis saling mendukung, interpretasi terhadap koefisien, pengaruh masing-masing variabel bebas, dan kemampuan model dalam menjelaskan variasi Nilai Ujian Mahasiswa dapat dilakukan dengan lebih meyakinkan.

3.1 Persamaan Regresi Berganda

Berdasarkan hasil pengolahan data menggunakan metode regresi linear berganda, diperoleh model regresi sebagai berikut:

# persamaan regresi 
coef_model <- coef(model)
beta0 <- coef_model[1] 
beta1 <- coef_model[2] 
beta2 <- coef_model[3]

cat("Persamaan regresi: Y = ", round(beta0,4), "+", round(beta1,4), "X1 +", round(beta2,4), "X2\n")

## Persamaan regresi: Y =  16.136 + 1.1698 X1 + 0.7745 X2

\[Y = 16.136 + 1.1698 X_1 + 0.7745 X_2\] Pada persamaan regresi yang diperoleh, terdapat tiga parameter utama yaitu intercept ($β_0$) serta dua koefisien slope ($β_1$) dan ($β_2$). Nilai intercept ($β_0$)=16.136 menunjukkan nilai prediksi Nilai Ujian Mahasiswa (Y) ketika variabel jumlah jam belajar (X1) dan tingkat kehadiran ($X_2$) bernilai nol. Secara matematis, nilai ini merupakan titik potong garis regresi dengan sumbu Y. Meskipun dalam konteks nyata kondisi tersebut tidak terjadi, nilai intercept tetap penting sebagai dasar pembentukan model regresi.

Selanjutnya, nilai koefisien slope $β_1$=1.1698 menunjukkan bahwa setiap peningkatan satu jam pada jumlah jam belajar ($X_1$) akan meningkatkan Nilai Ujian Mahasiswa sebesar 1.1698 poin, dengan asumsi variabel tingkat kehadiran ($X_2$) konstan. Tanda positif pada koefisien ini menunjukkan bahwa hubungan antara jam belajar dan nilai ujian bersifat searah, artinya semakin lama waktu yang dialokasikan mahasiswa untuk belajar, maka semakin tinggi pula nilai ujian yang diperoleh.

Sementara itu, nilai koefisien slope $β_2$ = 0.7745 menunjukkan bahwa setiap peningkatan sebesar 1% pada tingkat kehadiran ($X_2$) akan diikuti dengan peningkatan Nilai Ujian Mahasiswa sebesar 0.7745 poin, dengan asumsi jumlah jam belajar ($X_1$) tetap. Tanda positif pada koefisien ini menunjukkan bahwa kehadiran di kelas juga memberikan kontribusi positif, di mana tingkat kehadiran yang lebih tinggi cenderung diikuti oleh pencapaian nilai ujian yang lebih baik.

Secara keseluruhan, model regresi ini menunjukkan bahwa variabel jumlah jam belajar memiliki pengaruh yang lebih dominan terhadap Nilai Ujian Mahasiswa dibandingkan dengan variabel tingkat kehadiran, dilihat dari besaran koefisiennya (β1>β2). Dengan demikian, model ini dapat digunakan untuk menjelaskan bahwa meskipun kehadiran mahasiswa di kelas berperan penting, intensitas belajar mandiri melalui jumlah jam belajar memberikan dampak yang lebih signifikan terhadap hasil belajar dalam penelitian ini.

3.2 Pengujian Hipotesis

Pengujian hipotesis dilakukan untuk mengetahui apakah variabel bebas, yaitu jam belajar $(X_1)$ dan tingkat kehadiran $(X_2)$, berpengaruh signifikan terhadap variabel terikat, yaitu Nilai Ujian Mahasiswa $(Y)$, baik secara simultan maupun parsial. Pengujian ini bertujuan untuk memastikan apakah model regresi yang terbentuk memiliki kemampuan yang signifikan dalam menjelaskan hubungan antar variabel.

Uji Simultan

Uji simultan (Uji F) dilakukan untuk mengetahui apakah variabel Jam Belajar $(X_1)$ dan Tingkat Kehadiran $(X_2)$ secara bersama-sama berpengaruh signifikan terhadap Nilai Ujian Mahasiswa $(Y)$.
```
##     Sumber DF          SS           MS  F_Value      P_Value
## 1  Regresi  2 831.0376321 415.51881607 5172.116 8.042129e-12
## 2 Residual  7   0.5623679   0.08033827       NA           NA
## 3    Total  9 831.6000000           NA       NA           NA
```
Hipotesis: \[ H_0: \beta_1 = \beta_2 = 0 \] \[ H_1: \beta_1 \ne 0 \ \text{atau} \ \beta_2 \ne 0 \] Taraf Signifikansi: \[ \alpha = 0.05 \]Statistik Uji: \[ F_{hitung} = 5172.116 \]Kriteria Keputusan: \[ \text{Tolak } H_0 \text{ jika } p\text{-value} < \alpha \]

Keputusan:

Karena $p\text{-value} = 8.042129e-12< 0.05$, maka $H_0$ ditolak.

Kesimpulan:

Pada taraf signifikansi 5%, dapat disimpulkan bahwa variabel jam belajar $(X_1)$ dan tingkat kehadiran $(X_2)$ dan secara simultan berpengaruh signifikan terhadap Nilai Ujian Mahasiswa $(Y)$. Hal ini menunjukkan bahwa model regresi yang digunakan sudah layak untuk menjelaskan hubungan antara variabel bebas dan variabel terikat.
Uji Parsial (Uji t)

Uji parsial (Uji t) dilakukan untuk mengetahui pengaruh masing-masing variabel bebas, yaitu tingkat kehadiran $(X_1)$ dan IQ $(X_2)$, terhadap variabel terikat Nilai UAS $(Y)$.
```
##    Koefisien       Beta  Std_Error  t_hitung      p_value
##    Intercept 16.1360113 2.83677490  5.688154 7.444177e-04
## X1        X1  1.1698379 0.27843551  4.201468 4.028204e-03
## X2        X2  0.7744891 0.05571759 13.900261 2.357834e-06
```
Dari hasil diatas di dapatkan hasil berikut:
- Variabel Jam Belajar $(X_1)$
Hipotesis:

\[ \begin{aligned} H_0 &: \beta_1 = 0 \\ H_1 &: \beta_1 \ne 0 \end{aligned} \]Taraf Signifikansi:

\[ \alpha = 0.05 \]Statistik Uji

\[ t_{hitung} = 4.201468 \] \[ p\text{-value} = 4.028204e-03 \]Kriteria Keputusan:

\[ \text{Tolak } H_0 \text{ jika } p\text{-value} < \alpha \]Keputusan:

Karena $p\text{-value} = 4.028204e-03 < 0.05$, maka $H_0$ ditolak.

Kesimpulan:

pada taraf signifikansi 5% variabel jam belajar $(X_1)$ terbukti berpengaruh signifikan terhadap Nilai Ujian Mahasiswa $(Y)$ . Hal ini menunjukkan bahwa semakin tinggi tingkat jam belajar, maka nilai Ujian cenderung meningkat secara signifikan.
- Variabel Variabel Tingkat Kehadiran$(X_2)$
Hipotesis:

\[ \begin{aligned} H_0 &: \beta_2 = 0 \\ H_1 &: \beta_2 \ne 0 \end{aligned} \]Taraf Signifikansi:

\[ \alpha = 0.05 \]Statistik Uji:

\[ t_{hitung} = 13.900261 \] \[ p\text{-value} = 2.357834e-06 \]Krtiteria Keputusan:

\[ \text{Tolak } H_0 \text{ jika } p\text{-value} < \alpha \]Keputusan: Karena $p\text{-value} = 2.357834e-06 > 0.05$ , maka $H_0$ ditolak.

Kesimpulan:

Pada taraf signifikansi 5% variabel Tingkat Kehadiran $(X_2)$ berpengaruh signifikan terhadap Nilai Ujian $(Y)$ . Hal ini menunjukkan bahwa semakin tinggi tingkat kehadiran, maka nilai Ujian cenderung meningkat secara signifikan.

3.3 Koefisien Determinasi

Koefisien determinasi $(R^2)$ digunakan untuk mengetahui sejauh mana model regresi mampu menjelaskan variasi data.

## [1] 0.9993238

Berdasarkan hasil perhitungan manual pada praktikum ini, diperoleh nilai $R^2$ sebesar 0.9993, artinya sekitar 99,93% variasi Nilai Ujian Mahasiswa (Y) dapat dijelaskan oleh variabel Jumlah Jam Belajar ($X_1$) dan Tingkat Kehadiran ($X_2$) yang dimasukkan ke dalam model regresi. Sementara sisanya yang sangat kecil, yaitu sebesar 0,07%, dijelaskan oleh faktor-faktor lain di luar model, seperti bakat akademis, kondisi kesehatan saat ujian, atau faktor eksternal lainnya.

Nilai $R^2$ yang sangat tinggi ini menunjukkan bahwa model regresi berganda yang dibentuk memiliki tingkat kecocokan (goodness of fit) yang sangat baik, artinya model mampu merepresentasikan hubungan antara Nilai Ujian Mahasiswa dengan kedua variabel independennya secara sangat akurat. Model ini memiliki tingkat keandalan yang sangat tinggi untuk digunakan dalam memprediksi Nilai Ujian Mahasiswa berdasarkan jumlah jam belajar dan tingkat kehadiran mahasiswa.

3.4 Adjusted $R^2$

## [1] 0.9991305

Berdasarkan hasil perhitungan manual, diperoleh nilai Adjusted $R^2$ sebesar 0.9991. Nilai ini menunjukkan bahwa setelah mempertimbangkan jumlah variabel independen dan ukuran sampel dalam model, sekitar 99,91% variasi Nilai Ujian Mahasiswa (Y) dapat dijelaskan secara efektif oleh variabel Jumlah Jam Belajar ($X_1$) dan Tingkat Kehadiran ($X_2$).

Berbeda dengan $R^2$ standar, nilai Adjusted $R^2$ memberikan gambaran yang lebih akurat karena telah memberikan “penalti” terhadap penambahan variabel yang tidak berkontribusi signifikan. Karena nilai Adjusted $R^2$ (0.9991) sangat mendekati nilai $R^2$ (0.9993), hal ini mengindikasikan bahwa kedua variabel bebas yang digunakan memang memiliki kontribusi yang sangat kuat dan relevan dalam menjelaskan perubahan pada Nilai Ujian Mahasiswa, serta model terhindar dari masalah overfitting (model yang terlalu kompleks namun tidak efisien).

3.5 Prediksi Nilai Ujian Mahasiswa

Berdasarkan model regresi linier berganda yang telah diestimasi, dilakukan simulasi prediksi untuk mengetahui estimasi Nilai Ujian Mahasiswa (Y) pada kondisi spesifik, yaitu dengan Jumlah Jam Belajar (X1) sebesar 1 jam/minggu dan Tingkat Kehadiran (X2) sebesar 100%. Dengan menyubstitusikan nilai-nilai tersebut ke dalam persamaan regresi $Y=β_0+β_1(1)+β_2(100)$

# 1. Definisikan nilai X yang ingin diprediksi
X1_pred <- 1    # Jam Belajar
X2_pred <- 100  # Kehadiran

# 2. Hitung Prediksi Y menggunakan koefisien yang sudah disimpan
Y_pred <- beta0 + (beta1 * X1_pred) + (beta2 * X2_pred)

# 3. Tampilkan Hasilnya dengan Rapi
cat("--- PREDIKSI NILAI UJIAN ---\n")

## --- PREDIKSI NILAI UJIAN ---

cat("Jika Jam Belajar =", X1_pred, "jam/minggu dan Kehadiran =", X2_pred, "%\n")

## Jika Jam Belajar = 1 jam/minggu dan Kehadiran = 100 %

cat("Maka Prediksi Nilai Ujian (Y) adalah:", round(Y_pred, 4), "\n")

## Maka Prediksi Nilai Ujian (Y) adalah: 94.7548

menunjukkan bahwa meskipun waktu belajar mandiri berada pada level minimal, kontribusi maksimal dari tingkat kehadiran tetap mampu memberikan estimasi capaian nilai yang signifikan dalam model ini.

IV Kesimpulan

Berdasarkan hasil analisis regresi linear berganda terhadap faktor-faktor yang memengaruhi capaian akademik mahasiswa, dapat disimpulkan bahwa prosedur perhitungan manual menggunakan operasi matriks menghasilkan nilai koefisien, statistik F, p-value, R2, hingga Adjusted R2 yang identik dan konsisten dengan hasil otomatis fungsi lm() di R. Validitas perhitungan ini menghasilkan persamaan regresi

\[Y = 16.136 + 1.1698 X_1 + 0.7745 X_2\]yang menunjukkan bahwa baik Jumlah Jam Belajar (maupun Tingkat Kehadiran (X2) memiliki hubungan positif yang sangat kuat terhadap Nilai Ujian Mahasiswa.

Hasil pengujian hipotesis secara simultan (Uji F) menunjukkan bahwa Jumlah Jam Belajar dan Tingkat Kehadiran secara bersama-sama berpengaruh signifikan terhadap Nilai Ujian Mahasiswa . Berbeda dengan model sebelumnya, melalui pengujian secara parsial (Uji t), ditemukan bahwa kedua variabel independen, yaitu Jumlah Jam Belajar dan Tingkat Kehadiran , masing-masing memberikan pengaruh yang signifikan secara statistik terhadap hasil ujian. Kekuatan model ini tergolong sangat istimewa, di mana nilai koefisien determinasi sebesar 0.9993 menunjukkan bahwa 99,93% variasi Nilai Ujian Mahasiswa dapat dijelaskan dengan sangat akurat oleh kedua variabel bebas tersebut dalam penelitian ini.

Analisis Regresi Linear Berganda: Pengaruh Jumlah Belajar (jam/minggu) dan Tingkat Kehadiran (%) terhadap Nilai Ujian Mahasiswa