1 Pendahuluan
1.1 Latar Belakang
Perkuliahan merupakan masa dimana seorang manusia mengalami transisi kehidupan. Mahasiswa tidak hanya dituntut untuk fokus di akademiknya, namun mahasiswa juga sangat diharapkan untuk dapat ikut serta dalam kegiatan lain baik akademik maupun nonakademik. Prestasi akademik merupakan salah satu tujuan yang ingin dicapai oleh seluruh mahasiswa. Jika ingin mendapatkan prestasi akademik, banyak faktor yang dapat mempengaruhinya. Usaha belajar merupakan salah satu contoh faktor yang mempengaruhi prestasi akademik. Tanpa adanya usaha, akademik tidak akan berjalan sebagaimana mestinya. Usaha belajar sendiri dapat diukur melalui berbagai hal, contohnya adalah jam belajar dan jam tidur. Umumnya mahasiswa yang memiliki jumlah belajar yang banyak akan memiliki peluang yang lebih besar dalam mendapatkan prestasi akademik. Mahasiswa dapat lebih memahami materi karena belajar lebih lama. Pada saat mahasiswa mendapatkan nilai yang tidak sesuai harapan saat ujian sebelumnya, mahasiswa cenderung akan termotivasi untuk mendapatkan nilai yang lebih baik saat ujian berikutnya.
1.2 Regresi Linier Berganda
Regresi Linear Berganda merupakan metode statistika yang digunakan dalam menganalisis keterkaitan hubungan antara dua atau lebih variabel prediktor (X1, X2,..) dengan variabel respon (Y). Regresi Linear digunakan untuk memprediksi nilai Y berdasarkan nilai X. Selain untuk memprediksi nilai, regresi linear juga dapat digunakan untuk menarik kesimpulan tentang arah hubungan, kekuatan hubungan, dan keakuratan model dalam memprediksi nilai Y. Berikut merupakan model regresi linear berganda : \[Y = β_0 + β_1 X_1+β_2X_2+...+β_kX_k+εn, n=1,2,3,dst \]
1.3 Uji Asumsi
Di dalam regresi berganda perlu dilakukan uji asumsi untuk mengetahui apakah asumsi-asumsi dasar terpenuhi atau tidak. Uji asumsi penting untuk memastikan bahwa model regresi sesuai dengan data. Otomatis, intepretasi yang keluar akan tepat dan valid sesuai hasil analisis. Risiko kesalahan juga minimum dalam pengambilan keputusan. Jika uji asumsi terlanggar, maka hasil analisis akan menjadi tidak tepat sehingga perlu dilakukan berberapa cara untuk mengatasi masalah tersebut.
1.3.1 Normalitas
Uji normalitas residual merupakan salah satu asumsi yang harus dipenuhi dalam analisis regresi linear. Uji normalitas residual mencari selisi antara nilai Y aktual dan nilai Y prediksi dari model regresi. Hasil uji akan menunjukkan hasil residual berdistribusi normal. Jika tidak berdistribusi normal, maka akan melanggar asumsi normalitas sehingga perlu dilakukan cara lain untuk mengatasi pelanggaran.
1.3.2 Homokedastisitas
Asumsi lain yang harus dipenuhi adalah uji homoskedastisitas. Uji ini menyatakan bahwa varian dari residual pada setiap obsevarsi cenderung konstan.Jika asumsi homoskedastisitas terlanggar, akan menyebabkan heteroskedastisitas. Ada berberapa cara lain untuk mengatasi pelanggaran.
1.3.3 Non Autokorelasi
Asumsi berikutnya yang harus dipenuhi adalah uji non autokorelasi. Hasil dari uji non autokorelasi adalah tidak adanya hubungan atau korelasi dari residual setiap observasi. Sehingga nilai residual dari satu observasi dengan observasi lain tidak bergantungan. Pelanggaran terhadap asumsi ini dapat menyebabkan autokorelasi.
1.3.4 Multikolinearitas
Multikolinearitas merupakan keadaan dimana variabel X dan model regresi memiliki korelasi yang tinggi. Kondisi ini menyebabkan koefisien regresi tidak stabil, standar error dari koefisien regresi meningkat sehingga tidak mampu memprediksi hasil nilai dengan akurat. Salah satu cara untuk mendeteksi multikolinearitas adalah menghitung nilai VIF, jika nilai VIF > 10 maka menandakan adanya multikolinearitas.
1.4 Uji Simultan
Uji simultan merupakan metode statistik yang bertujuan untuk mengetahui apakah variabael independen (X) memiliki pengaruh terhadap variabel dependen (Y). Uji simultan dilakukan menggunakan uji F.
1.5 Uji Parsial
Uji parsial merupakan metode statistik yang bertujuan untuk mengetahui apakah terdapat pengaruh signifikan antara variabel independen (X) dengan variabel dependen (Y). Uji parsial menggunakan uji t.
1.6 Data
Data untuk analisis regresi berganda diambil dari Kaggle.com yang berjudul Student Perfromance (https://www.kaggle.com/datasets/nikhil7280/student-performance-multiple-linear-regression). Di dalam data tersebut terdapat 5 variabel prediktor dan 1 variabel respon. Namun untuk data yang akan dipakai, akan diambil 2 varibel prediktor yaitu Jam Belajar (X1) dan Jam Tidur (X2) dengan variabel respon Nilai Ujian. Sampel yang diambil berjumlah 49 sampel.
2 Source Code
2.1 Library yang Dibutuhkan
2.3 Menampilkan Data
2.4 Pendefinisian Vektor
2.5 Analisis Regresi Berganda
> regresi <-lm(Y~X1+X2, data=Data_Kom)
> summary(regresi)
Call:
lm(formula = Y ~ X1 + X2, data = Data_Kom)
Residuals:
Min 1Q Median 3Q Max
-29.12 -12.24 2.39 10.87 30.06
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 44.6519 9.0596 4.929 1.12e-05 ***
X1 2.5188 0.9824 2.564 0.0137 *
X2 -0.1496 1.3388 -0.112 0.9115
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 16.36 on 46 degrees of freedom
Multiple R-squared: 0.13, Adjusted R-squared: 0.09218
F-statistic: 3.437 on 2 and 46 DF, p-value: 0.040632.6 Hubungan Variabel Independen dengan variabel dependen
2.7 Uji Asumsi
> #Uji Normalitas Residual
> sisa<-residuals(regresi)
> shapiro.test(sisa)
Shapiro-Wilk normality test
data: sisa
W = 0.96034, p-value = 0.09788>
> #Uji Homoskedastisitas
> bptest(regresi)
studentized Breusch-Pagan test
data: regresi
BP = 2.6109, df = 2, p-value = 0.2713 Pembahasan
3.1 Persamaan Regresi
| Variabel | Pendugaan Parameter |
|---|---|
| Konstanta | 44.6519 |
| Jam Belajar (X1) | 2.5188 |
| Jam Tidur (X2) | -0.1496 |
Diperoleh bentuk persamaan dari hasil analisis regresi berganda diatas yaitu : \[ Ŷ = 44.6519 + 2.5188(X_1)-0.1496(X_2) \] Interpretasi:
- Ketika variabel X1 dan X2 bernilai 0, maka nilai Y rata-rata adalah 44.6519
- Ketika varibel X1 mengalami peningkatan sebanyak 1 satuan, maka nilai Y akan meningkat sebanyak 2.5188
- Ketika variabel X2 mengalami peningkatan sebanyak 1 satuan, maka nilai Y akan menurun sebanyak 0.1496
3.2 Uji Asumsi
| Uji Asumsi | P-Value |
|---|---|
| Normalitas (Shapiro) | 0.09788 |
| Homoskedastitas | 0.271 |
| Non Autokorelasi | 0.08376 |
| Multikoliniearitas | Nilai VIF |
|---|---|
| Jam Belajar (X1) | 1.066999 |
| Jam Tidur (X2) | 1.066999 |
3.3 Interpretasi Hasil Uji Asumsi
- Uji Normalitas Residual Shapiro
Hipotesis:
H~0~ : Residual berdistribusi normal
H~1~: Residual tidak berdistribusi normal
P-Value (0.09788) > α (0.05) maka keputusannya adalah H0 diterima. Dapat disimpulkan bahwa residual berdistribusi normal.
- Uji Homoskedastisitas
Hipotesis:
H~0~ : δ~2~ = δ~3~ = 0
H~1~ : Paling tidak terdapat satu δ~j~ ≠ 2,3
P-Value (0.271) < α (0.05) maka keputusannya adalah H0 diterima. Dapat disimpulkan bahwa varian residual bersifat homoskedastisitas.
- Uji Non Autokorelasi
Hipotesis:
H~0~ : ρ = 0
H~1~ : ρ ≠ 0
P-Value (0.08376) > α (0.05) maka keputusannya adalah H0 diterima. Dapat disimpulkan bahwa tidak terjadi autokorelasi, sehingga asumsi sudah terpenuhi.
- Pendeteksian Multikolinieritas Karena nilai VIF (1.066999) < 10, maka asumsi non-multikolinieritas sudah terpenuhi.
3.4 Uji Hipotesis
3.4.1 Hasil Uji Hipotesis Parsial
- Uji Simultan
Hipotesis:
H~0~ : β~0~ = β~1~ = β~2~ = 0
H~1~ : minimal terdapat β dimana β~i~ ≠ 0,i = 0,1,2
P-Value (0,04063) < α (0.05) maka keputusannya adalah H0 ditolak. Dapat disimpulkan bahwa Jam Belajar dan Jam Tidur berpengaruh terhadap Nilai Ujian.
- Uji Parsial
Hipotesis:
H~0~ : β~i~ = 0
H~1~ : β~i~ ≠ 0
Kesimpulan :
P-Value (0.0137) < α (0.05) maka keputusan H0 ditolak. Dapat disimpulkan bahwa semakin tinggi semakin tinggi Jam Belajar (X1), semakin tinggi juga hasil Nilai Ujian (Y).
P-Value (0.9115) > α (0.05) maka keputusan H0 diterima. Dapat disimpulkan bahwa semakin tinggi Jam Tidur (X2), semakin turun hasil Nilai Ujian (Y).
- Koefisien Determinasi
Diperoleh nilai koefisien determinasi sebesar 0.13 atau 13%. Makaa dapat disimpulkan bahwa Nilai Ujian (Y) dapat dijelaskan oleh Jam Belajar (X1) dan Jam Belajar (X2) dalam model regresi ini.
4 Kesimpulan
Kesimpulannya adalah saat jam belajar bertambah, nilai ujian akan bertambah juga. Sebaliknya, saat jam tidur bertambah, nilai ujian akan turun. Data tentang hubungan antara Jam Belajar (X1) dan Jam Belajar (X2) dengan Nilai Ujian (Y) telah memenuhi uji asumsi. Sehingga dapat disimpulkan bahwa model regresi yang dihasilkan valid. Jadi tingkatkan jam belajar sehingga nilai ujian menjadi bagus.
Saran
Dijelaskan bahwa koefisien determinasi hanya mencapai angka 13%, sehingga dapat dilakukan pengecekan ulang terhadap kualitas dan relevansi data. Dapat dilakukan juga transformasi data, mengumpulkan lebih banyak data, maupun melakukan uji metode lain.
5 Daftar Pustaka
Kurniawan, R. 2016. Analisis Regresi. Prenada Media
Efendi, A., Wardhani, N. W. S., Fitriani, R., & Sumarminingsih, E. 2020. Analisis Regresi : teori dan aplikasi dengan R. Universitas Brawijaya Press.
Yuliara, I. M. 2016. Regresi Linier Berganda. Universitas Udayana.