1 Pendahuluan

1.1 Latar Belakang

Perkuliahan merupakan masa dimana seorang manusia mengalami transisi kehidupan. Mahasiswa tidak hanya dituntut untuk fokus di akademiknya, namun mahasiswa juga sangat diharapkan untuk dapat ikut serta dalam kegiatan lain baik akademik maupun nonakademik. Prestasi akademik merupakan salah satu tujuan yang ingin dicapai oleh seluruh mahasiswa. Jika ingin mendapatkan prestasi akademik, banyak faktor yang dapat mempengaruhinya. Usaha belajar merupakan salah satu contoh faktor yang mempengaruhi prestasi akademik. Tanpa adanya usaha, akademik tidak akan berjalan sebagaimana mestinya. Usaha belajar sendiri dapat diukur melalui berbagai hal, contohnya adalah jam belajar dan jam tidur. Umumnya mahasiswa yang memiliki jumlah belajar yang banyak akan memiliki peluang yang lebih besar dalam mendapatkan prestasi akademik. Mahasiswa dapat lebih memahami materi karena belajar lebih lama. Pada saat mahasiswa mendapatkan nilai yang tidak sesuai harapan saat ujian sebelumnya, mahasiswa cenderung akan termotivasi untuk mendapatkan nilai yang lebih baik saat ujian berikutnya.

1.2 Regresi Linier Berganda

Regresi Linear Berganda merupakan metode statistika yang digunakan dalam menganalisis keterkaitan hubungan antara dua atau lebih variabel prediktor (X1, X2,..) dengan variabel respon (Y). Regresi Linear digunakan untuk memprediksi nilai Y berdasarkan nilai X. Selain untuk memprediksi nilai, regresi linear juga dapat digunakan untuk menarik kesimpulan tentang arah hubungan, kekuatan hubungan, dan keakuratan model dalam memprediksi nilai Y. Berikut merupakan model regresi linear berganda : \[Y = β_0 + β_1 X_1+β_2X_2+...+β_kX_k+εn, n=1,2,3,dst \]

1.3 Uji Asumsi

Di dalam regresi berganda perlu dilakukan uji asumsi untuk mengetahui apakah asumsi-asumsi dasar terpenuhi atau tidak. Uji asumsi penting untuk memastikan bahwa model regresi sesuai dengan data. Otomatis, intepretasi yang keluar akan tepat dan valid sesuai hasil analisis. Risiko kesalahan juga minimum dalam pengambilan keputusan. Jika uji asumsi terlanggar, maka hasil analisis akan menjadi tidak tepat sehingga perlu dilakukan berberapa cara untuk mengatasi masalah tersebut.

1.3.1 Normalitas

Uji normalitas residual merupakan salah satu asumsi yang harus dipenuhi dalam analisis regresi linear. Uji normalitas residual mencari selisi antara nilai Y aktual dan nilai Y prediksi dari model regresi. Hasil uji akan menunjukkan hasil residual berdistribusi normal. Jika tidak berdistribusi normal, maka akan melanggar asumsi normalitas sehingga perlu dilakukan cara lain untuk mengatasi pelanggaran.

1.3.2 Homokedastisitas

Asumsi lain yang harus dipenuhi adalah uji homoskedastisitas. Uji ini menyatakan bahwa varian dari residual pada setiap obsevarsi cenderung konstan.Jika asumsi homoskedastisitas terlanggar, akan menyebabkan heteroskedastisitas. Ada berberapa cara lain untuk mengatasi pelanggaran.

1.3.3 Non Autokorelasi

Asumsi berikutnya yang harus dipenuhi adalah uji non autokorelasi. Hasil dari uji non autokorelasi adalah tidak adanya hubungan atau korelasi dari residual setiap observasi. Sehingga nilai residual dari satu observasi dengan observasi lain tidak bergantungan. Pelanggaran terhadap asumsi ini dapat menyebabkan autokorelasi.

1.3.4 Multikolinearitas

Multikolinearitas merupakan keadaan dimana variabel X dan model regresi memiliki korelasi yang tinggi. Kondisi ini menyebabkan koefisien regresi tidak stabil, standar error dari koefisien regresi meningkat sehingga tidak mampu memprediksi hasil nilai dengan akurat. Salah satu cara untuk mendeteksi multikolinearitas adalah menghitung nilai VIF, jika nilai VIF > 10 maka menandakan adanya multikolinearitas.

1.4 Uji Simultan

Uji simultan merupakan metode statistik yang bertujuan untuk mengetahui apakah variabael independen (X) memiliki pengaruh terhadap variabel dependen (Y). Uji simultan dilakukan menggunakan uji F.

1.5 Uji Parsial

Uji parsial merupakan metode statistik yang bertujuan untuk mengetahui apakah terdapat pengaruh signifikan antara variabel independen (X) dengan variabel dependen (Y). Uji parsial menggunakan uji t.

1.6 Data

Data untuk analisis regresi berganda diambil dari Kaggle.com yang berjudul Student Perfromance (https://www.kaggle.com/datasets/nikhil7280/student-performance-multiple-linear-regression). Di dalam data tersebut terdapat 5 variabel prediktor dan 1 variabel respon. Namun untuk data yang akan dipakai, akan diambil 2 varibel prediktor yaitu Jam Belajar (X1) dan Jam Tidur (X2) dengan variabel respon Nilai Ujian. Sampel yang diambil berjumlah 49 sampel.

2 Source Code

2.1 Library yang Dibutuhkan

> library("car") 
> library("zoo") 
> library("readxl") 
> library("lmtest")

2.2 Mengimport Data Excel

> library(readxl) 
> Data_Kom <-read_excel("Data_Kom.xlsx") 

2.3 Menampilkan Data

> Data_Kom
# A tibble: 49 × 3
      X1    X2     Y
   <dbl> <dbl> <dbl>
 1     7     9    91
 2     4     4    65
 3     8     7    45
 4     5     5    36
 5     7     8    66
 6     3     9    61
 7     7     5    63
 8     8     4    42
 9     5     8    61
10     4     4    69
# ℹ 39 more rows

2.4 Pendefinisian Vektor

> X1 <- Data_Kom$`X1`
> X2 <- Data_Kom$`X2`
> Y <- Data_Kom$`Y`
> Data <- data.frame(Y, X1, X2)
> View(Data)

2.5 Analisis Regresi Berganda

> regresi <-lm(Y~X1+X2, data=Data_Kom)
> summary(regresi)

Call:
lm(formula = Y ~ X1 + X2, data = Data_Kom)

Residuals:
   Min     1Q Median     3Q    Max 
-29.12 -12.24   2.39  10.87  30.06 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)  44.6519     9.0596   4.929 1.12e-05 ***
X1            2.5188     0.9824   2.564   0.0137 *  
X2           -0.1496     1.3388  -0.112   0.9115    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 16.36 on 46 degrees of freedom
Multiple R-squared:   0.13, Adjusted R-squared:  0.09218 
F-statistic: 3.437 on 2 and 46 DF,  p-value: 0.04063

2.6 Hubungan Variabel Independen dengan variabel dependen

2.6.1 Nilai Ujian (Y) dengan Jam Belajar (X1)

> plot(Data_Kom$X1, Data_Kom$Y,
+      col = "blue", xlab = "Jam Belajar", ylab = "Nilai Ujian", pch = 16)

2.6.2 Nilai Ujian (Y) dengan Jam Tidur (X2)

> plot(Data_Kom$X2, Data_Kom$Y,
+      col = "blue", xlab = "Jam Tidur", ylab = "Nilai Ujian", pch = 16)

Jika plot membentuk suatu pola garis lurus, diasumsikan bahwa variabel-variabel X memiliki hubungan dengan variabel Y

2.7 Uji Asumsi

> #Uji Normalitas Residual
> sisa<-residuals(regresi)
> shapiro.test(sisa)

    Shapiro-Wilk normality test

data:  sisa
W = 0.96034, p-value = 0.09788
> 
> #Uji Homoskedastisitas
> bptest(regresi)

    studentized Breusch-Pagan test

data:  regresi
BP = 2.6109, df = 2, p-value = 0.271
> 
> #Uji Non Autokorelasi
> dwtest(regresi)

    Durbin-Watson test

data:  regresi
DW = 1.6016, p-value = 0.08376
alternative hypothesis: true autocorrelation is greater than 0
> 
> #Pendektesian Multikolinieritas
> car::vif(regresi)
      X1       X2 
1.066999 1.066999 

3 Pembahasan

3.1 Persamaan Regresi

Variabel Pendugaan Parameter
Konstanta 44.6519
Jam Belajar (X1) 2.5188
Jam Tidur (X2) -0.1496

Diperoleh bentuk persamaan dari hasil analisis regresi berganda diatas yaitu : \[ Ŷ = 44.6519 + 2.5188(X_1)-0.1496(X_2) \] Interpretasi:

  1. Ketika variabel X1 dan X2 bernilai 0, maka nilai Y rata-rata adalah 44.6519
  2. Ketika varibel X1 mengalami peningkatan sebanyak 1 satuan, maka nilai Y akan meningkat sebanyak 2.5188
  3. Ketika variabel X2 mengalami peningkatan sebanyak 1 satuan, maka nilai Y akan menurun sebanyak 0.1496

3.2 Uji Asumsi

Uji Asumsi P-Value
Normalitas (Shapiro) 0.09788
Homoskedastitas 0.271
Non Autokorelasi 0.08376
Multikoliniearitas Nilai VIF
Jam Belajar (X1) 1.066999
Jam Tidur (X2) 1.066999

3.3 Interpretasi Hasil Uji Asumsi

  1. Uji Normalitas Residual Shapiro
Hipotesis:

H~0~ : Residual berdistribusi normal

H~1~: Residual tidak berdistribusi normal

P-Value (0.09788) > α (0.05) maka keputusannya adalah H0 diterima. Dapat disimpulkan bahwa residual berdistribusi normal.

  1. Uji Homoskedastisitas
    Hipotesis:

    H~0~ : δ~2~ = δ~3~ = 0

    H~1~ : Paling tidak terdapat satu δ~j~ ≠ 2,3

P-Value (0.271) < α (0.05) maka keputusannya adalah H0 diterima. Dapat disimpulkan bahwa varian residual bersifat homoskedastisitas.

  1. Uji Non Autokorelasi
    Hipotesis:

    H~0~ : ρ = 0

    H~1~ : ρ ≠ 0

P-Value (0.08376) > α (0.05) maka keputusannya adalah H0 diterima. Dapat disimpulkan bahwa tidak terjadi autokorelasi, sehingga asumsi sudah terpenuhi.

  1. Pendeteksian Multikolinieritas Karena nilai VIF (1.066999) < 10, maka asumsi non-multikolinieritas sudah terpenuhi.

3.4 Uji Hipotesis

3.4.1 Hasil Uji Hipotesis Parsial

  1. Uji Simultan
    Hipotesis:

    H~0~ : β~0~ = β~1~ = β~2~ = 0

    H~1~ : minimal terdapat β dimana β~i~ ≠ 0,i = 0,1,2

P-Value (0,04063) < α (0.05) maka keputusannya adalah H0 ditolak. Dapat disimpulkan bahwa Jam Belajar dan Jam Tidur berpengaruh terhadap Nilai Ujian.

  1. Uji Parsial
    Hipotesis:

    H~0~ : β~i~ = 0

    H~1~ : β~i~ ≠ 0

Kesimpulan :

  • P-Value (0.0137) < α (0.05) maka keputusan H0 ditolak. Dapat disimpulkan bahwa semakin tinggi semakin tinggi Jam Belajar (X1), semakin tinggi juga hasil Nilai Ujian (Y).

  • P-Value (0.9115) > α (0.05) maka keputusan H0 diterima. Dapat disimpulkan bahwa semakin tinggi Jam Tidur (X2), semakin turun hasil Nilai Ujian (Y).

  1. Koefisien Determinasi

Diperoleh nilai koefisien determinasi sebesar 0.13 atau 13%. Makaa dapat disimpulkan bahwa Nilai Ujian (Y) dapat dijelaskan oleh Jam Belajar (X1) dan Jam Belajar (X2) dalam model regresi ini.

4 Kesimpulan

Kesimpulannya adalah saat jam belajar bertambah, nilai ujian akan bertambah juga. Sebaliknya, saat jam tidur bertambah, nilai ujian akan turun. Data tentang hubungan antara Jam Belajar (X1) dan Jam Belajar (X2) dengan Nilai Ujian (Y) telah memenuhi uji asumsi. Sehingga dapat disimpulkan bahwa model regresi yang dihasilkan valid. Jadi tingkatkan jam belajar sehingga nilai ujian menjadi bagus.

Saran

Dijelaskan bahwa koefisien determinasi hanya mencapai angka 13%, sehingga dapat dilakukan pengecekan ulang terhadap kualitas dan relevansi data. Dapat dilakukan juga transformasi data, mengumpulkan lebih banyak data, maupun melakukan uji metode lain.

5 Daftar Pustaka

Kurniawan, R. 2016. Analisis Regresi. Prenada Media

Efendi, A., Wardhani, N. W. S., Fitriani, R., & Sumarminingsih, E. 2020. Analisis Regresi : teori dan aplikasi dengan R. Universitas Brawijaya Press.

Yuliara, I. M. 2016. Regresi Linier Berganda. Universitas Udayana.