Pendahuluan

Prestasi akademik mahasiswa dapat dipengaruhi oleh berbagai faktor, diantaranya waktu belajar dan tingkat kehadiran di kelas. Mahasiswa yang memiliki waktu belajar lebih banyak serta tingkat kehadiran yang tinggi cenderung memiliki pemahaman materi yang lebih baik.

Pada laporan ini dilakukan analisis regresi linear berganda untuk mengetahui pengaruh jam belajar dan kehadiran terhadap nilai ujian mahasiswa.

Data

Data yang digunakan merupakan data simulasi yang terdiri dari jam belajar per minggu, persentase kehadiran, dan nilai ujian mahasiswa.

data <- data.frame(
  Jam_Belajar = c(5,7,4,6,8,9,3,10,6,7,5,8),
  Kehadiran = c(80,85,75,90,88,92,70,95,87,83,78,91),
  Nilai_Ujian = c(68,72,60,75,80,85,55,90,78,74,69,82)
)

data
##    Jam_Belajar Kehadiran Nilai_Ujian
## 1            5        80          68
## 2            7        85          72
## 3            4        75          60
## 4            6        90          75
## 5            8        88          80
## 6            9        92          85
## 7            3        70          55
## 8           10        95          90
## 9            6        87          78
## 10           7        83          74
## 11           5        78          69
## 12           8        91          82

Statistik Deskriptif

summary(data)
##   Jam_Belajar     Kehadiran      Nilai_Ujian   
##  Min.   : 3.0   Min.   :70.00   Min.   :55.00  
##  1st Qu.: 5.0   1st Qu.:79.50   1st Qu.:68.75  
##  Median : 6.5   Median :86.00   Median :74.50  
##  Mean   : 6.5   Mean   :84.50   Mean   :74.00  
##  3rd Qu.: 8.0   3rd Qu.:90.25   3rd Qu.:80.50  
##  Max.   :10.0   Max.   :95.00   Max.   :90.00

Visualisasi Hubungan Variabel

pairs(data)

Model Regresi Linear Berganda

Model regresi:

Y = β0 + β1X1 + β2X2 + ε

Dimana:

Y = Nilai Ujian
X1 = Jam Belajar
X2 = Kehadiran

model <- lm(Nilai_Ujian ~ Jam_Belajar + Kehadiran, data=data)

summary(model)
## 
## Call:
## lm(formula = Nilai_Ujian ~ Jam_Belajar + Kehadiran, data = data)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -3.4458 -0.7983  0.0295  0.5946  3.1796 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)   
## (Intercept)  -3.7165    13.3804  -0.278  0.78747   
## Jam_Belajar   2.1362     0.7665   2.787  0.02116 * 
## Kehadiran     0.7554     0.2105   3.588  0.00586 **
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 2.09 on 9 degrees of freedom
## Multiple R-squared:  0.9648, Adjusted R-squared:  0.9569 
## F-statistic: 123.2 on 2 and 9 DF,  p-value: 2.891e-07

Uji Asumsi Regresi

1. Uji Normalitas Residual

residuals_model <- residuals(model)

shapiro.test(residuals_model)
## 
##  Shapiro-Wilk normality test
## 
## data:  residuals_model
## W = 0.93326, p-value = 0.416

Uji normalitas dilakukan menggunakan Shapiro-Wilk test untuk mengetahui apakah residual model regresi berdistribusi normal.

Jika nilai p-value > 0.05, maka residual berdistribusi normal sehingga asumsi normalitas terpenuhi. Sebaliknya, jika p-value < 0.05, maka residual tidak berdistribusi normal.

Berdasarkan hasil pengujian, diperoleh nilai p-value yang lebih besar dari 0.05 sehingga dapat disimpulkan bahwa residual model berdistribusi normal dan asumsi normalitas terpenuhi.

2. Uji Multikolinearitas

library(car)
## Warning: package 'car' was built under R version 4.4.3
## Loading required package: carData
## Warning: package 'carData' was built under R version 4.4.3
vif(model)
## Jam_Belajar   Kehadiran 
##    6.321459    6.321459

Uji multikolinearitas dilakukan untuk mengetahui apakah terdapat hubungan yang kuat antar variabel independen dalam model regresi.

Nilai Variance Inflation Factor (VIF) digunakan sebagai indikator. Jika nilai VIF < 10, maka tidak terdapat masalah multikolinearitas dalam model.

Berdasarkan hasil perhitungan VIF, seluruh variabel independen memiliki nilai VIF kurang dari 10. Oleh karena itu dapat disimpulkan bahwa tidak terjadi multikolinearitas antar variabel bebas dalam model regresi.

3. Uji Homoskedastisitas

library(lmtest)
## Warning: package 'lmtest' was built under R version 4.4.3
## Loading required package: zoo
## Warning: package 'zoo' was built under R version 4.4.3
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
bptest(model)
## 
##  studentized Breusch-Pagan test
## 
## data:  model
## BP = 1.4135, df = 2, p-value = 0.4932

Uji homoskedastisitas dilakukan menggunakan Breusch-Pagan test untuk mengetahui apakah varians residual konstan.

Jika nilai p-value > 0.05, maka tidak terjadi heteroskedastisitas sehingga asumsi homoskedastisitas terpenuhi. Sebaliknya, jika p-value < 0.05, maka terjadi heteroskedastisitas.

Berdasarkan hasil pengujian, nilai p-value lebih besar dari 0.05 sehingga dapat disimpulkan bahwa tidak terjadi heteroskedastisitas pada model regresi.

4. Uji Autokorelasi

dwtest(model)
## 
##  Durbin-Watson test
## 
## data:  model
## DW = 1.6136, p-value = 0.3503
## alternative hypothesis: true autocorrelation is greater than 0

Uji autokorelasi dilakukan menggunakan Durbin-Watson test untuk mengetahui apakah terdapat korelasi antar residual.

Jika nilai p-value > 0.05, maka tidak terdapat autokorelasi pada model regresi.

Berdasarkan hasil pengujian, diperoleh nilai p-value yang lebih besar dari 0.05 sehingga dapat disimpulkan bahwa tidak terdapat autokorelasi pada model regresi.

Plot Diagnostik

par(mfrow=c(2,2))
plot(model)

Plot diagnostik digunakan untuk mengevaluasi kesesuaian model regresi. Grafik residual menunjukkan bahwa titik-titik residual tersebar secara acak di sekitar garis nol, sehingga tidak menunjukkan pola tertentu.

Hal ini menunjukkan bahwa model regresi yang digunakan cukup baik untuk menjelaskan hubungan antara variabel jam belajar, kehadiran, dan nilai ujian.

Kesimpulan

Berdasarkan analisis regresi linear berganda, variabel jam belajar dan kehadiran memiliki pengaruh terhadap nilai ujian mahasiswa. Hasil uji asumsi menunjukkan bahwa model regresi memenuhi asumsi normalitas, tidak terdapat multikolinearitas, serta tidak terjadi heteroskedastisitas dan autokorelasi sehingga model regresi dapat digunakan untuk analisis.