Pendahuluan

Pendidikan merupakan salah satu faktor penting dalam pengembangan kualitas sumber daya manusia. Dalam proses pembelajaran, hasil akademik mahasiswa dapat dipengaruhi oleh berbagai faktor, baik yang berasal dari kebiasaan belajar maupun faktor pendukung lainnya. Beberapa faktor yang sering dikaitkan dengan pencapaian akademik adalah jam belajar, tingkat kehadiran, dan jam tidur.

Jam belajar mencerminkan usaha mahasiswa dalam memahami materi perkuliahan. Kehadiran menunjukkan tingkat partisipasi mahasiswa dalam proses pembelajaran di kelas. Sementara itu, jam tidur dapat memengaruhi kondisi fisik dan konsentrasi mahasiswa dalam mengikuti pembelajaran maupun saat mengerjakan ujian.

Berdasarkan hal tersebut, laporan ini bertujuan untuk menganalisis pengaruh jam belajar, kehadiran, dan jam tidur terhadap nilai ujian mahasiswa dengan menggunakan model regresi linear berganda.

Tinjauan Pustaka

Regresi Linear Berganda

Regresi linear berganda merupakan metode analisis statistika yang digunakan untuk mengetahui hubungan antara satu variabel dependen dengan lebih dari satu variabel independen. Dalam penelitian ini, variabel dependen yang digunakan adalah nilai ujian, sedangkan variabel independennya adalah jam belajar, kehadiran, dan jam tidur.

Secara umum, model regresi linear berganda dapat dituliskan sebagai berikut:

\[ Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \beta_3 X_3 + \epsilon \]

dengan: - \(Y\) : variabel dependen - \(X_1, X_2, X_3\) : variabel independen - \(\beta_0\) : intercept - \(\beta_1, \beta_2, \beta_3\) : koefisien regresi - \(\epsilon\) : galat

Koefisien regresi menunjukkan besarnya perubahan rata-rata pada variabel dependen akibat perubahan satu satuan variabel independen, dengan asumsi variabel lain konstan.

Asumsi Regresi Linear

Agar model regresi linear memberikan hasil yang baik, terdapat beberapa asumsi yang perlu diperhatikan, yaitu: 1. residual berdistribusi normal, 2. tidak terjadi multikolinearitas antarvariabel independen, 3. varians residual bersifat konstan atau homoskedastisitas, 4. tidak terjadi autokorelasi residual, 5. hubungan antara variabel independen dan dependen bersifat linear.

Pengujian terhadap asumsi-asumsi tersebut penting dilakukan agar hasil estimasi model dapat diinterpretasikan dengan baik.

Import Data

library(readxl)
data_mahasiswa <- read_excel("dataset R.xlsx")
data_mahasiswa
## # A tibble: 30 × 5
##       No Jam_Belajar Kehadiran Jam_Tidur Nilai_Ujian
##    <dbl>       <dbl>     <dbl>     <dbl>       <dbl>
##  1     1           6        88         7          78
##  2     2           7        90         6          80
##  3     3           5        85         7          74
##  4     4           8        92         6          84
##  5     5           4        80         8          70
##  6     6           9        95         6          88
##  7     7           3        78         7          68
##  8     8          10        96         5          90
##  9     9           6        87         8          79
## 10    10           7        89         7          81
## # ℹ 20 more rows

Deskripsi Data

summary(data_mahasiswa)
##        No         Jam_Belajar     Kehadiran       Jam_Tidur      Nilai_Ujian   
##  Min.   : 1.00   Min.   : 3.0   Min.   :76.00   Min.   :5.000   Min.   :66.00  
##  1st Qu.: 8.25   1st Qu.: 5.0   1st Qu.:84.00   1st Qu.:6.000   1st Qu.:73.25  
##  Median :15.50   Median : 6.5   Median :88.50   Median :7.000   Median :79.50  
##  Mean   :15.50   Mean   : 6.5   Mean   :87.83   Mean   :6.733   Mean   :79.17  
##  3rd Qu.:22.75   3rd Qu.: 8.0   3rd Qu.:92.00   3rd Qu.:7.000   3rd Qu.:85.00  
##  Max.   :30.00   Max.   :10.0   Max.   :97.00   Max.   :8.000   Max.   :91.00

Jumlah data yang dianalisis adalah 30 observasi.

Rata-rata jam belajar adalah 6.5 jam.
Rata-rata kehadiran adalah 87.83 persen.
Rata-rata jam tidur adalah 6.73 jam.
Rata-rata nilai ujian adalah 79.17.

Model Regresi

Model regresi linear berganda yang digunakan dalam penelitian ini adalah:

\[ Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \beta_3 X_3 + \epsilon \]

dengan:

  • \(Y\) = Nilai Ujian
  • \(X_1\) = Jam Belajar
  • \(X_2\) = Kehadiran
  • \(X_3\) = Jam Tidur

Estimasi Parameter

model <- lm(Nilai_Ujian ~ Jam_Belajar + Kehadiran + Jam_Tidur, data = data_mahasiswa)
summary(model)
## 
## Call:
## lm(formula = Nilai_Ujian ~ Jam_Belajar + Kehadiran + Jam_Tidur, 
##     data = data_mahasiswa)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -1.37161 -0.36720 -0.06557  0.29296  1.74956 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  12.9206     9.7908   1.320 0.198448    
## Jam_Belajar   2.1817     0.4017   5.431 1.08e-05 ***
## Kehadiran     0.5516     0.1395   3.954 0.000527 ***
## Jam_Tidur     0.5376     0.2018   2.664 0.013074 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.7109 on 26 degrees of freedom
## Multiple R-squared:  0.9913, Adjusted R-squared:  0.9903 
## F-statistic: 988.8 on 3 and 26 DF,  p-value: < 2.2e-16

Berdasarkan output di atas, model regresi diestimasi menggunakan metode kuadrat terkecil. Nilai koefisien masing-masing variabel digunakan untuk membentuk persamaan regresi akhir.

Persamaan Regresi

Persamaan regresi yang diperoleh adalah:

\[ \hat{Y} = 12.921 + 2.182X_1 + 0.552X_2 + 0.538X_3 \]

Persamaan tersebut menunjukkan hubungan antara jam belajar, kehadiran, dan jam tidur terhadap nilai ujian mahasiswa.

Uji Signifikansi Model

Uji Simultan

Uji simultan digunakan untuk mengetahui apakah variabel jam belajar, kehadiran, dan jam tidur secara bersama-sama berpengaruh terhadap nilai ujian.

Interpretasi uji simultan dapat dilihat pada nilai F-statistic dan p-value pada output summary(model). Jika p-value kurang dari 0.05, maka dapat disimpulkan bahwa variabel independen secara simultan berpengaruh signifikan terhadap nilai ujian.

Uji Parsial

Uji parsial digunakan untuk mengetahui pengaruh masing-masing variabel independen terhadap nilai ujian. Interpretasi dilakukan berdasarkan nilai t-statistic dan p-value masing-masing koefisien regresi.

Pengujian Asumsi Regresi

Uji Normalitas Residual

Uji normalitas residual dilakukan menggunakan uji Shapiro-Wilk.

res <- residuals(model)
shapiro.test(res)
## 
##  Shapiro-Wilk normality test
## 
## data:  res
## W = 0.97188, p-value = 0.5918

Interpretasi: jika p-value > 0.05, maka residual berdistribusi normal.

Visualisasi Normalitas Residual

Uji Multikolinearitas

Uji multikolinearitas dilakukan dengan menghitung Variance Inflation Factor (VIF).

library(car)
vif(model)
## Jam_Belajar   Kehadiran   Jam_Tidur 
##   38.156708   36.199599    2.083773

Interpretasi: jika seluruh nilai VIF < 10, maka tidak terdapat multikolinearitas yang serius antarvariabel independen.

Uji Heteroskedastisitas

Uji heteroskedastisitas dilakukan menggunakan uji Breusch-Pagan.

library(lmtest)
bptest(model)
## 
##  studentized Breusch-Pagan test
## 
## data:  model
## BP = 2.5326, df = 3, p-value = 0.4694

Interpretasi: jika p-value > 0.05, maka tidak terdapat heteroskedastisitas.

Plot Residual terhadap Nilai Prediksi

Uji Autokorelasi

Uji autokorelasi dilakukan menggunakan uji Durbin-Watson.

dwtest(model)
## 
##  Durbin-Watson test
## 
## data:  model
## DW = 2.1179, p-value = 0.6942
## alternative hypothesis: true autocorrelation is greater than 0

Interpretasi: jika p-value > 0.05, maka tidak terdapat autokorelasi pada residual.

Uji Linearitas

Uji linearitas model dilakukan menggunakan Ramsey RESET Test.

resettest(model)
## 
##  RESET test
## 
## data:  model
## RESET = 5.2883, df1 = 2, df2 = 24, p-value = 0.01251

Interpretasi: jika p-value > 0.05, maka model linear sudah memadai.

Component + Residual Plot

Uji Outlier dan Pengamatan Berpengaruh

Pengamatan berpengaruh dapat dilihat menggunakan Cook’s Distance.

cooksD <- cooks.distance(model)
cooksD
##            1            2            3            4            5            6 
## 8.014597e-03 5.897279e-02 1.833579e-02 3.698818e-03 4.785471e-04 1.704011e-03 
##            7            8            9           10           11           12 
## 4.789536e-01 2.946552e-02 4.608627e-02 5.767166e-05 2.001891e-02 4.331933e-02 
##           13           14           15           16           17           18 
## 2.947637e-03 2.667409e-02 1.040248e-03 3.091361e-03 7.956356e-02 7.303757e-02 
##           19           20           21           22           23           24 
## 3.333843e-02 6.497461e-04 8.190752e-03 3.198918e-02 2.395359e-02 3.559224e-02 
##           25           26           27           28           29           30 
## 2.021955e-04 8.656875e-04 4.608627e-02 1.792806e-04 5.659276e-05 9.813824e-02

outlierTest(model)
## No Studentized residuals with Bonferroni p < 0.05
## Largest |rstudent|:
##   rstudent unadjusted p-value Bonferroni p
## 7 3.209566          0.0036298      0.10889

Interpretasi: observasi yang memiliki nilai Cook’s Distance tinggi atau teridentifikasi pada outlier test perlu diperhatikan karena dapat memengaruhi hasil estimasi model.

Visualisasi

Scatterplot Jam Belajar dan Nilai Ujian

Plot Diagnostik Model

Interpretasi

Berdasarkan hasil estimasi model regresi linear berganda, pengaruh jam belajar, kehadiran, dan jam tidur terhadap nilai ujian mahasiswa dapat dianalisis melalui tanda koefisien dan nilai signifikansinya. Koefisien yang bernilai positif menunjukkan bahwa peningkatan variabel tersebut cenderung diikuti oleh peningkatan nilai ujian, dengan asumsi variabel lain tetap.

Apabila hasil uji parsial menunjukkan nilai p-value kurang dari 0.05, maka variabel tersebut dapat dikatakan berpengaruh signifikan terhadap nilai ujian. Selain itu, hasil uji asumsi regresi digunakan untuk memastikan bahwa model yang diperoleh telah memenuhi syarat dasar regresi linear.

Kesimpulan

Berdasarkan hasil analisis regresi linear berganda, model digunakan untuk menjelaskan hubungan antara jam belajar, kehadiran, dan jam tidur terhadap nilai ujian mahasiswa. Hasil pengujian parameter menunjukkan apakah variabel independen berpengaruh secara simultan maupun parsial terhadap nilai ujian.

Selain itu, pengujian asumsi regresi dilakukan melalui uji normalitas, multikolinearitas, heteroskedastisitas, autokorelasi, linearitas, serta pengamatan berpengaruh. Jika asumsi-asumsi tersebut terpenuhi, maka model regresi yang diperoleh dapat digunakan sebagai model yang layak untuk menjelaskan hubungan antarvariabel dalam penelitian ini.