Prestasi akademik mahasiswa merupakan salah satu indikator penting dalam menilai keberhasilan proses pembelajaran. Nilai ujian yang diperoleh tidak hanya dipengaruhi oleh satu faktor saja, melainkan oleh berbagai faktor yang saling berkaitan, baik yang berasal dari dalam diri mahasiswa maupun dari lingkungan belajar.

Dua faktor yang sering dianggap memiliki peranan penting adalah jumlah jam belajar dan tingkat kehadiran. Jumlah jam belajar mencerminkan seberapa besar usaha mahasiswa dalam memahami materi secara mandiri di luar perkuliahan. Semakin banyak waktu yang digunakan untuk belajar, maka secara teori tingkat pemahaman terhadap materi akan semakin meningkat.

Sementara itu, tingkat kehadiran menggambarkan keaktifan mahasiswa dalam mengikuti kegiatan pembelajaran di kelas. Kehadiran yang tinggi memungkinkan mahasiswa untuk memperoleh penjelasan langsung dari dosen, terlibat dalam diskusi, serta memahami materi secara lebih menyeluruh.

No	Y	X1	X2
1	65	2	60
2	70	3	65
3	75	4	70
4	80	5	75
5	85	6	80
6	78	5	72
7	72	3	68
8	90	7	85
9	88	6	83
10	95	8	90

Dalam penelitian ini, digunakan data dari 10 mahasiswa yang terdiri atas nilai ujian (Y), jumlah jam belajar per minggu (X1), serta tingkat kehadiran (X2). Analisis dilakukan menggunakan metode regresi linier berganda untuk mengetahui hubungan dan pengaruh kedua variabel independen tersebut terhadap nilai ujian mahasiswa. Adapun tujuan dari analisis ini meliputi:

Menentukan model persamaan regresi linier berganda yang dapat menggambarkan hubungan antara jumlah jam belajar dan tingkat kehadiran terhadap nilai ujian.
Mengetahui pengaruh kedua variabel independen terhadap variabel dependen secara bersama-sama (simultan).
Menilai pengaruh masing-masing variabel independen terhadap variabel dependen secara terpisah (parsial).
Menghitung nilai koefisien determinasi (R²) dan adjusted R² untuk melihat seberapa besar variasi nilai ujian yang dapat dijelaskan oleh variabel dalam model.
Membandingkan hasil perhitungan manual dengan hasil yang diperoleh menggunakan fungsi lm() dalam R.
Menguji apakah model regresi telah memenuhi asumsi-asumsi klasik sehingga hasil analisis dapat diinterpretasikan dengan baik.
Menggunakan model yang terbentuk untuk melakukan prediksi nilai ujian berdasarkan nilai variabel independen tertentu.

Persamaan Regresi Linier Berganda

Regresi linier berganda merupakan metode analisis yang digunakan untuk menjelaskan hubungan antara satu variabel terikat dengan dua atau lebih variabel bebas. Pada penelitian ini, variabel terikat yang digunakan adalah nilai ujian (Y), sedangkan variabel bebasnya terdiri dari jumlah jam belajar (X1) dan tingkat kehadiran (X2).

Secara matematis, model regresi linier berganda dapat dinyatakan dalam bentuk: \[Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \varepsilon\]

dengan keterangan: \(Y\) : variabel dependen
\(X_k\) : variabel independen ke-\(k\)
\(\beta_k\) : koefisien regresi dari variabel \(X_k\)

Persamaan tersebut menunjukkan bahwa nilai ujian dipengaruhi oleh konstanta, kontribusi masing-masing variabel independen, serta komponen kesalahan yang mencerminkan faktor lain di luar model.

Selain digunakan untuk menjelaskan hubungan antar variabel, model ini juga dapat dimanfaatkan untuk memperkirakan nilai variabel dependen berdasarkan nilai variabel independen yang diketahui, yang dinyatakan sebagai:

\[\hat{Y} = \hat{\beta}_0 + \hat{\beta}_1 X_1 + \hat{\beta}_2 X_2 + \cdots + \hat{\beta}_k X_k\]

dengan keterangan:

\(\hat{Y}\) : nilai taksiran dari \(Y\)
\(\hat{\beta}_k\) : koefisien regresi hasil estimasi

Pada analisis ini, pemodelan dilakukan melalui dua pendekatan, yaitu secara manual menggunakan perhitungan matriks, serta menggunakan fungsi lm pada R.

Menggunakan Cara Manual

Dalam pendekatan manual, model regresi dinyatakan dalam bentuk matriks agar perhitungan parameter dapat dilakukan secara sistematis. Bentuk umum dari model tersebut adalah:

\[Y = X \beta + \varepsilon\]

di mana Y merupakan vektor variabel dependen, X adalah matriks yang memuat variabel independen beserta konstanta, \(β\) adalah vektor parameter yang akan diestimasi, dan ϵ merupakan vektor residual.

Estimasi parameter dilakukan dengan metode Ordinary Least Squares (OLS), yaitu dengan meminimalkan jumlah kuadrat dari residual. Secara matematis, estimasi parameter dapat dihitung menggunakan rumus:

\[\hat{\beta} = (X'X)^{-1} X'Y\]

Berikut merupakan langkah penyelesaian secara manual menggunakan R:

##          [,1]
##    16.1360113
## X1  1.1698379
## X2  0.7744891

Berdasarkan hasil perhitungan, diperoleh nilai koefisien regresi yaitu intercept (\(\hat{\beta}_0\)) sebesar 16,136, koefisien untuk variabel \(X_1\) (\(\hat{\beta}_1\)) sebesar 1,1698, dan koefisien untuk variabel \(X_2\) (\(\hat{\beta}_2\)) sebesar 0,7745. Oleh karena itu, persamaan regresi linier berganda yang terbentuk dapat dituliskan sebagai:

\[\hat{Y} = 16.136 + 1.1698X_1 + 0.7745X_2\]

Menggunakan Fungsi lm

Selain menggunakan pendekatan manual dengan perhitungan matriks, estimasi parameter dalam model regresi linier berganda juga dapat dilakukan dengan bantuan software statistik, salah satunya menggunakan bahasa pemrograman R. Dalam R, fungsi yang umum digunakan untuk membentuk model regresi linier adalah fungsi lm().

Fungsi lm() (linear model) digunakan untuk mengestimasi parameter model regresi secara otomatis dengan metode Ordinary Least Squares (OLS), sehingga tidak diperlukan lagi perhitungan secara manual seperti pada metode sebelumnya. Hasil dari fungsi ini kemudian dapat ditampilkan dalam bentuk ringkasan model menggunakan fungsi summary(), yang memuat informasi mengenai nilai koefisien regresi, nilai statistik uji, tingkat signifikansi, serta ukuran goodness of fit dari model yang dibentuk.

Dengan menggunakan fungsi lm(), proses analisis menjadi lebih efisien dan meminimalkan kemungkinan kesalahan perhitungan, sekaligus mempermudah dalam melakukan interpretasi hasil.

## 
## Call:
## lm(formula = Y ~ X1 + X2)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.31078 -0.14588 -0.05074  0.04440  0.56237 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 16.13601    2.83677   5.688 0.000744 ***
## X1           1.16984    0.27844   4.201 0.004028 ** 
## X2           0.77449    0.05572  13.900 2.36e-06 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.2834 on 7 degrees of freedom
## Multiple R-squared:  0.9993, Adjusted R-squared:  0.9991 
## F-statistic:  5172 on 2 and 7 DF,  p-value: 8.042e-12

Berdasarkan hasil estimasi menggunakan fungsi lm(), diperoleh nilai koefisien regresi yaitu intercept (\(\hat{\beta}_0\)) sebesar 16.136, koefisien untuk variabel \(X_1\) (\(\hat{\beta}_1\)) sebesar 1.1698, dan koefisien untuk variabel \(X_2\) (\(\hat{\beta}_2\)) sebesar 0.7745. Oleh karena itu, persamaan regresi linier berganda yang terbentuk dapat dituliskan sebagai berikut:

\[\hat{Y} = 16.136 + 1.1698X_1 + 0.7745X_2\]

Dari persamaan tersebut dapat diinterpretasikan bahwa setiap kenaikan 1 jam belajar (\(X_1\)) akan meningkatkan nilai ujian (\(Y\)) sebesar 1.1698, dengan asumsi tingkat kehadiran (\(X_2\)) tetap. Sementara itu, setiap kenaikan 1% tingkat kehadiran (\(X_2\)) akan meningkatkan nilai ujian sebesar 0.7745, dengan asumsi jumlah jam belajar (\(X_1\)) konstan.

Nilai intercept sebesar 16.136 menunjukkan perkiraan nilai ujian ketika jumlah jam belajar dan tingkat kehadiran bernilai nol.

Dengan demikian, hasil estimasi menggunakan fungsi lm() menghasilkan model yang sama dengan perhitungan manual, sehingga dapat disimpulkan bahwa metode yang digunakan telah sesuai dan konsisten.

Uji Simultan dan Parsial

Dalam analisis regresi linier berganda, dilakukan pengujian secara simultan dan parsial untuk mengetahui apakah variabel independen berpengaruh terhadap variabel dependen. Uji simultan (uji F) bertujuan untuk melihat apakah seluruh variabel independen dalam model secara bersama-sama memberikan pengaruh yang signifikan terhadap variabel dependen. Sedangkan uji parsial (uji t) digunakan untuk menilai pengaruh masing-masing variabel independen secara individu terhadap variabel dependen.

Adapun hipotesis yang digunakan adalah sebagai berikut:

Hipotesis uji simultan (uji F):
\(H_0\): \(\beta_1 = \beta_2 = 0\) (variabel \(X_1\) dan \(X_2\) secara bersama-sama tidak berpengaruh terhadap \(Y\))
\(H_1\): minimal terdapat satu \(\beta_k \neq 0\) (setidaknya ada satu variabel independen yang berpengaruh terhadap \(Y\))

Hipotesis uji parsial (uji t):
\(H_0\): \(\beta_k = 0\) (variabel independen tidak berpengaruh terhadap \(Y\))
\(H_1\): \(\beta_k \neq 0\) (variabel independen berpengaruh terhadap \(Y\))

## 
## Call:
## lm(formula = Y ~ X1 + X2)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.31078 -0.14588 -0.05074  0.04440  0.56237 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 16.13601    2.83677   5.688 0.000744 ***
## X1           1.16984    0.27844   4.201 0.004028 ** 
## X2           0.77449    0.05572  13.900 2.36e-06 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.2834 on 7 degrees of freedom
## Multiple R-squared:  0.9993, Adjusted R-squared:  0.9991 
## F-statistic:  5172 on 2 and 7 DF,  p-value: 8.042e-12

Berdasarkan hasil pengujian, diperoleh nilai F-statistic yang menunjukkan signifikansi model secara keseluruhan. Jika nilai p-value lebih kecil dari taraf signifikansi 0,05, maka \(H_0\) ditolak, sehingga dapat disimpulkan bahwa variabel \(X_1\) dan \(X_2\) secara bersama-sama berpengaruh signifikan terhadap variabel \(Y\).

Pada uji parsial (uji t), masing-masing variabel independen diuji secara terpisah. Variabel dengan nilai p-value lebih kecil dari 0,05 dinyatakan berpengaruh signifikan terhadap variabel dependen. Sebaliknya, jika nilai p-value lebih besar dari 0,05, maka variabel tersebut tidak berpengaruh signifikan.

Dengan demikian, hasil uji parsial dapat digunakan untuk mengetahui variabel mana yang memiliki pengaruh signifikan dalam model regresi.

Koefisien Determinasi

Koefisien determinasi (\(R^2\)) merupakan ukuran statistik yang digunakan untuk mengetahui seberapa besar kemampuan variabel independen dalam menjelaskan variasi variabel dependen dalam suatu model regresi. Nilai \(R^2\) berada pada rentang 0 hingga 1, di mana semakin mendekati 1 menunjukkan bahwa model semakin baik dalam menjelaskan variasi data.

Secara matematis, koefisien determinasi dirumuskan sebagai:

\[ R^2 = \frac{SSR}{SST} \]

dengan keterangan:
\(SSR\) : jumlah kuadrat regresi
\(SST\) : jumlah kuadrat total

Namun demikian, nilai \(R^2\) memiliki kelemahan karena cenderung meningkat ketika jumlah variabel independen ditambah, meskipun variabel tersebut tidak memberikan kontribusi yang signifikan terhadap model. Oleh karena itu, digunakan adjusted \(R^2\) sebagai bentuk penyesuaian terhadap jumlah variabel dalam model.

Adjusted \(R^2\) dapat mengalami kenaikan atau penurunan tergantung pada kontribusi variabel independen yang digunakan. Secara matematis, adjusted \(R^2\) dirumuskan sebagai:

\[ R^2_{adj} = 1 - \frac{(1 - R^2)(n - 1)}{(n - k - 1)} \]

dengan keterangan:
\(n\) : jumlah observasi
\(k\) : jumlah variabel independen

## 
## Call:
## lm(formula = Y ~ X1 + X2)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.31078 -0.14588 -0.05074  0.04440  0.56237 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 16.13601    2.83677   5.688 0.000744 ***
## X1           1.16984    0.27844   4.201 0.004028 ** 
## X2           0.77449    0.05572  13.900 2.36e-06 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.2834 on 7 degrees of freedom
## Multiple R-squared:  0.9993, Adjusted R-squared:  0.9991 
## F-statistic:  5172 on 2 and 7 DF,  p-value: 8.042e-12

Berdasarkan hasil analisis, diperoleh nilai koefisien determinasi (\(R^2\)) yang menunjukkan proporsi variasi variabel dependen yang dapat dijelaskan oleh variabel independen dalam model. Semakin besar nilai \(R^2\), maka semakin baik kemampuan model dalam menjelaskan hubungan antar variabel.

Selain itu, nilai adjusted \(R^2\) memberikan gambaran yang lebih akurat karena telah mempertimbangkan jumlah variabel independen yang digunakan dalam model. Oleh karena itu, adjusted \(R^2\) sering digunakan sebagai acuan utama dalam mengevaluasi kebaikan model regresi.

Prediksi Nilai Y

Setelah diperoleh model regresi linier berganda, selanjutnya model tersebut dapat digunakan untuk melakukan prediksi nilai variabel dependen berdasarkan nilai variabel independen yang diketahui.

Model regresi yang diperoleh adalah:

\[ \hat{Y} = 16.136 + 1.1698X_1 + 0.7745X_2 \]

Sebagai contoh, akan dilakukan prediksi nilai ujian mahasiswa jika diketahui jumlah jam belajar (\(X_1\)) sebesar 7 jam dan tingkat kehadiran (\(X_2\)) sebesar 85%.

\[ \hat{Y} = 16.136 + 1.1698(7) + 0.7745(85) \]

\[ \hat{Y} = 16.136 + 8.1886 + 65.8325 \]

\[ \hat{Y} = 90.1571 \]

Berdasarkan hasil perhitungan tersebut, diperoleh nilai prediksi ujian mahasiswa sebesar 90.16. Hal ini menunjukkan bahwa dengan jumlah jam belajar 7 jam dan tingkat kehadiran 85%, nilai ujian yang diperkirakan akan diperoleh mahasiswa adalah sekitar 90.

Kesimpulan

Berdasarkan analisis yang telah dilakukan, dapat disimpulkan bahwa model regresi linier berganda dapat digunakan untuk menjelaskan hubungan antara jumlah jam belajar dan tingkat kehadiran terhadap nilai ujian mahasiswa. Variabel-variabel tersebut secara umum memberikan kontribusi terhadap perubahan nilai ujian, baik secara bersama-sama maupun secara individu.

Hasil analisis menunjukkan bahwa kedua variabel independen memiliki pengaruh positif terhadap nilai ujian, di mana peningkatan jumlah jam belajar dan tingkat kehadiran cenderung diikuti oleh peningkatan nilai ujian mahasiswa. Selain itu, model yang diperoleh juga mampu menjelaskan sebagian besar variasi nilai ujian, sehingga dapat dikatakan bahwa model memiliki kemampuan yang cukup baik dalam menggambarkan hubungan antar variabel.

Pengujian asumsi klasik yang telah dilakukan menunjukkan bahwa model regresi telah memenuhi asumsi-asumsi dasar, seperti linearitas, normalitas, homoskedastisitas, tidak adanya autokorelasi, serta tidak terjadi multikolinearitas. Dengan terpenuhinya asumsi tersebut, model regresi yang dihasilkan dapat dianggap valid dan dapat digunakan untuk keperluan analisis maupun prediksi.

Dengan demikian, model regresi linier berganda yang diperoleh tidak hanya mampu menjelaskan hubungan antar variabel, tetapi juga dapat digunakan sebagai alat untuk memprediksi nilai ujian mahasiswa berdasarkan jumlah jam belajar dan tingkat kehadiran yang dimiliki.

Studi Kasus Regresi Linier Berganda: Pengaruh Jumlah Jam Belajar dan Tingkat Kehadiran terhadap Nilai Ujian Mahasiswa

Octa Syahira (0039)

2026-04-03