1 PENDAHULUAN
1.1 Latar Belakang
Analisis regresi merupakan metode statistik yang melibatkan pemahaman dasar tentang statistika, metode pengumpulan data, dan mempelajari hubungan antara satu atau lebih variabel independen (variabel prediktor) dan satu variabel dependen (variabel respons). Analisis regresi membantu dalam memahami bagaimana perubahan dalam variabel independen dapat mempengaruhi variabel dependen. Dengan adanya regresi, seseorang dapat menentukan model yang dapat menduga atau meramalkan nilai dari peubah respon yang dipengaruhi peubah prediktor.
Dalam perkembangannya, analisis regresi menjadi salah satu alat statistik yang banyak digunakan di berbagi bidang, misalnya bidang sosial, ekonomi, ilmu alam, dan ilmu kesehatan. Namun, banyak sekali hal yang perlu diperhatikan dan dipelajari dalam analisis regresi agar hasilnya dapat dimaksimalkan sebaik mungkin sesuai dengan tujuan penelitian.
Dalam analisis regresi juga perlu memperhatikan asumsi-asumsi yang harus dipenuhi agar hasil yang dianalisis valid dan dapat dipercaya. Asumsi-asumsi ini penting untuk memastikan bahwa model regresi yang dibangun memiliki sifat-sifat statistik yang optimal.
1.2 Tinjauan Pustaka
1.2.1 Analisis Regresi Linier
Regresi linier adalah metode statistika yang digunakan untuk membentuk model hubungan antara variabel dependen (respons; Y) dengan satu atau lebih variabel independen (prediktor; X). Apabila banyaknya variabel bebas hanya ada satu, disebut sebagai regresi linier sederhana, sedangkan apabila terdapat lebih dari 1 variabel bebas, disebut sebagai regresi linier berganda.
Model Regresi Linier Sederhana
Model regresi linier yang melibatkan satu variabel independen atau model regresi sederhana dinyatakan dalam persamaan sebagai berikut:
\[Y=\beta_{0}+\beta_{1}X_{1}+\epsilon\]
Keterangan:
\(Y\) = variabel Respons
\(X\) = Variabel Prediktor
\(\beta_{0}\) = Parameter Intersep
\(\beta_{1}\) = Koefisien Regresi
\(\epsilon\) = galat acak (random error)
Model Regresi Linier Berganda
Model regresi linier yang melibatkan lebih dari satu variabel independen atau model regresi linier berganda dapat dinyatakan dalam persamaan sebagai berikut:
\[Y=\beta_{0}+\beta_{1}X_{1}+...+\beta_{k}X_{k}+\epsilon\]
Keterangan:
\(Y\) = variabel Respons
\(X_{1},..,X_{k}\) = Variabel Prediktor
\(\beta_{0},..,\beta_{k}\) = Koefisien Regresi
\(\epsilon\) = galat acak (random error)
1.2.2 Asumsi Analisis Regresi
Asumsi dalam analisis regresi harus dipenuhi untuk memastikan validitas, reliabilitas, dan keamanan dari hasil analisis regresi. Analisis regresi diantaranya yaitu asumsi normalitas, homoskedastisitas, non-autokorelasi, dan non multikolinieritas.
1.2.3 Asumsi Normalitas
Uji normalitas bertujuan untuk menguji apakah dalam model regresi, variabel terikat dan variabel bebas keduanya memiliki distribusi data normal atau tidak. Model regresi yang baik adalah memiliki distribusi data normal atau mendekati normal.(Gozali, 2009)
1.2.4 Asumsi Homoskedastisitas
Homoskedastisitas adalah asumsi dalam analisis regresi yang menyatakan bahwa varian residual (selisih antara nilai aktual dan nilai prediksi) konstan untuk semua nilai variabel independen (X). Artinya, tidak boleh ada pola heterogenitas (ketidakseimbangan) dalam variabilitas residual.
1.2.5 Asumsi Non_autokorelasi
Non-autokorelasi adalah asumsi dalam analisis regresi yang menyatakan bahwa tidak ada korelasi antar residual (selisih antara nilai aktual dan nilai prediksi) dalam model regresi. Artinya, residual pada satu pengamatan tidak boleh berkorelasi dengan residual pada pengamatan lain.
1.2.6 Asumsi Multikolinieritas
Uji ini bertujuan untuk menguji apakah model regresi ditemukan adanya korelasi antar variabel bebas (independen). Jika nilai tolerance lebih besar dari 0,1 atau nilai VIF lebih kecil dari 10, maka dapat disimpulkan tidak terjadi multikolinieritas pada data yang akan diolah. (Ghozali, 2009)
1.2.7 Uji-F
Uji F merupakan uji statistik penting dalam analisis regresi linier untuk menilai apakah model regresi secara keseluruhan memiliki daya prediksi yang signifikan. Uji F merupakan uji statistik yang membandingkan varian terjelas (varian yang dijelaskan oleh model) dengan varian tak terjelaskan
1.3 Data
Data yang digunakan merupakan data yang diperoleh dari modul Regresi Linier Berganda. Modul tersebut menganalisis Tingkat kehadiran(X1) dan IQ (X2) terhadap Nilai UAS (Y). Berikut merupakan data yang digunakan.
| Y (Nilai UAS) | X1 ( Tingkat Kehadiran) | X2 (IQ) |
|---|---|---|
| 65 | 60 | 110 |
| 70 | 70 | 120 |
| 75 | 75 | 115 |
| 75 | 80 | 130 |
| 80 | 80 | 110 |
| 80 | 90 | 120 |
| 85 | 95 | 120 |
| 95 | 95 | 125 |
| 90 | 100 | 110 |
| 98 | 100 | 120 |
1.4 Tujuan
Analisis regresi ini bertujuan untuk mengetahui ada atau tidaknya pengaruh yang signifikan dari variabel Tingkat Kehadiran dan IQ terhadap Nilai UAS. Dengan demikian dapat mengetahui variabel mana yang memiliki kemungkinan lebih besar untuk meningkatkan nilai UAS.
2 SOURCE CODE
2.2 Impor Data
> Nilai_UAS <-c(65,70,75,75,80,80,85,95,90,98)
> Tingkat_Kehadiran <-c(60,70,75,80,80,90,95,95,100,100)
> IQ <-c(110,120,115,130,110,120,120,125,110,120)
> datareg<-data.frame(X1=Tingkat_Kehadiran,X2=IQ,Y=Nilai_UAS)
> str(datareg)
'data.frame': 10 obs. of 3 variables:
$ X1: num 60 70 75 80 80 90 95 95 100 100
$ X2: num 110 120 115 130 110 120 120 125 110 120
$ Y : num 65 70 75 75 80 80 85 95 90 98
> head(datareg)
X1 X2 Y
1 60 110 65
2 70 120 70
3 75 115 75
4 80 130 75
5 80 110 80
6 90 120 802.3 Statistika deskriptif
2.4 Plot
> plot(Nilai_UAS~IQ,datareg=datareg, xlab = "IQ", ylab = "Nilai_UAS", main = "Hubungan antara IQ dan Nilai UAS")> plot(Nilai_UAS~Tingkat_Kehadiran, datareg=datareg, xlab = "Tingkat_Kehadiran", ylab = "Nilai_UAS", main = "Hubungan antara Tingkat Kehadiran dan Nilai UAS")2.5 Analisis Regresi
> reg <- lm(Y~X1+X2,data=datareg)
> summary(reg)
Call:
lm(formula = Y ~ X1 + X2, data = datareg)
Residuals:
Min 1Q Median 3Q Max
-5.2861 -2.8939 0.0296 1.6791 6.1993
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 23.05445 25.57161 0.902 0.397247
X1 0.73723 0.10918 6.752 0.000264 ***
X2 -0.03433 0.22051 -0.156 0.880686
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 4.346 on 7 degrees of freedom
Multiple R-squared: 0.8719, Adjusted R-squared: 0.8353
F-statistic: 23.82 on 2 and 7 DF, p-value: 0.0007523Keterangan :
\(Y\) = Nilai UAS
\(X_{1}\) = Tingkat Kehadiran
\(X_{2}\) = IQ
2.6 Asumsi
> #Asumsi Normalitas
> sisareg<-residuals(reg)
> jarque.bera.test(sisareg)
Jarque Bera Test
data: sisareg
X-squared = 0.58528, df = 2, p-value = 0.7463
> shapiro.test(sisareg)
Shapiro-Wilk normality test
data: sisareg
W = 0.95125, p-value = 0.6833
> #Asumsi Homoskedastisitas
> bptest(reg)
studentized Breusch-Pagan test
data: reg
BP = 5.905, df = 2, p-value = 0.05221
> #Asumsi NonAutokorelasi
> dwtest(reg)
Durbin-Watson test
data: reg
DW = 2.594, p-value = 0.8013
alternative hypothesis: true autocorrelation is greater than 0
> #Asumsi Nonmultikolinieritas
> vif(reg)
X1 X2
1.055571 1.055571 3 HASIL DAN PEMBAHASAN
3.1 Analisis Regresi Berganda
> reg <- lm(Y~X1+X2,data=datareg)
> summary(reg)
Call:
lm(formula = Y ~ X1 + X2, data = datareg)
Residuals:
Min 1Q Median 3Q Max
-5.2861 -2.8939 0.0296 1.6791 6.1993
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 23.05445 25.57161 0.902 0.397247
X1 0.73723 0.10918 6.752 0.000264 ***
X2 -0.03433 0.22051 -0.156 0.880686
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 4.346 on 7 degrees of freedom
Multiple R-squared: 0.8719, Adjusted R-squared: 0.8353
F-statistic: 23.82 on 2 and 7 DF, p-value: 0.0007523Dari analisis regresi, diperoleh \(\beta_{0}=23.05445\), \(\beta_{1}=0.73723\),\(\beta_{2}=-0.03433\), sehingga persamaan regresinya adalah \(Y=23.05445+0.73723X_{1}-0.03433X_{2}\)
dimana,
\(Y\) = Nilai UAS
\(X_{1}\) = Tingkat Kehadiran
\(X_{2}\) = IQ
Intepretasi:
-Nilai intersep pada persamaan regresi adalah 23.05445, menunjukkan bahwa ketika Tingkat Kehadiran(X1) dan IQ(X2) bernilai nol. Diperkirakan Nilai UAS (Y) akan menjadi 23.05445.
-Nilai koefisien X1 adalah 0,2124, menunjukkan bahwa setiap pengingkatan Tingkat Kehadiran sebanyak 1 unit akan mengingkatkan Nilai UAS sebesar 0.73723, dengan nilai IQ yang konstan.
-Nilai Koefisien X2 adalah -0.03433, menunjukkan bahwa setiap pengingkatan IQ sebanyak 1 unit akan menurunkan Nilai UAS sebesar 0.03433, dengan nilai Tingkat Kehadiran yang konstan.
3.2 Uji F
3.2.1 Hipotesis
Hipotesis yang diuji:
\(H_0\): \(\beta_0=\beta_1=\beta_2=0\) (Tidak terdapat pengaruh terhadap Nilai UAS)
\(H_1\): \(\beta_k≠0\) (Terdapat pengaruh Tingkat Kehadiran dan IQ dengan Nilai UAS)
Hipotesis bagi variabel \(X_{1}\)
\(H_0\): \(\beta_1=0\) (Tingkat Kehadiran secara parsial tidak berpengaruh terhadap Nilai UAS)
\(H_1\): \(\beta_1≠0\) (Tingkat Kehadiran secara parsial berpengaruh terhadap Nilai UAS)
Hipotesis bagi variabel \(X_{2}\)
\(H_0\): \(\beta_2=0\) (IQ secara parsial tidak berpengaruh terhadap Nilai UAS)
\(H_1\): \(\beta_2≠0\) (IQ secara parsial tidak berpengaruh terhadap Nilai UAS)
3.2.2 Statistik Uji F
> summary(reg)
Call:
lm(formula = Y ~ X1 + X2, data = datareg)
Residuals:
Min 1Q Median 3Q Max
-5.2861 -2.8939 0.0296 1.6791 6.1993
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 23.05445 25.57161 0.902 0.397247
X1 0.73723 0.10918 6.752 0.000264 ***
X2 -0.03433 0.22051 -0.156 0.880686
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 4.346 on 7 degrees of freedom
Multiple R-squared: 0.8719, Adjusted R-squared: 0.8353
F-statistic: 23.82 on 2 and 7 DF, p-value: 0.0007523Interpretasi:
-P-Value untuk Tingkat kehadiran sebesar 0.000264 artinya p-value kurang dari \(\alpha\)(0,05), sehingga dapat disimpulkan bahwa Tingkat kehadiran berpengaruh secara nyata terhadap Nilai UAS.
-P-value untuk IQ sebesar 0.880686 artinya p-value lebih besar dari \(\alpha\)(0,05), sehingga dapat disimpulkan bahwa IQ tidak berpengaruh secara nyata terhadap Nilai UAS.
-P-value pada variabel Tingkat Kehadiran dan IQ sebsar 0.0007523 artinya p-value kurang dari \(\alpha\)(0,05), yang berarti bahwa variabel prediktor secara bersama-sama memengaruhi variabel respon secara nyata atau signifikan.
3.3 Uji Asumsi
3.3.1 Asumsi Normalitas
> sisareg<-residuals(reg)
> jarque.bera.test(sisareg)
Jarque Bera Test
data: sisareg
X-squared = 0.58528, df = 2, p-value = 0.7463
> shapiro.test(sisareg)
Shapiro-Wilk normality test
data: sisareg
W = 0.95125, p-value = 0.6833Hipotesis:
\(Ho\): Galat berdistribusi normal (Asumsi normalitas terpenuhi).
\(H1\): Galat tidak berdistribusi normal (Asumsi normalitas tidak terpenuhi).
Dengan uji jarque bera didapatkan p-value sebesar 0.6631. Nilai p tersebut cukup besar lebih besar dari \(\alpha\)(0,05), maka tidak terbukti ada pelanggaran asumsi normalitas galat pada model Nilai UAS sebagai fungsi dari Tingkat kehadiran dan IQ.
Dengan uji Shapiro-wilk didapatkan p-value sebesar 0.455. Nilai p-value tersebut cukup besar lebih besar dari \(\alpha\)(0,05), maka tidak terbukti ada pelanggaran asumsi normalitas galat pada model Nilai UAS sebagai fungsi dari Tingkat kehadiran dan IQ.
3.3.2 Asumsi Homoskedastisitas
Hipotesis:
\(Ho:\sigma_i^2=\sigma_j^2,i≠j\) (Asumsi homoskedastisitas terpenuhi)
\(Ho:\sigma_i^2≠\sigma_j^2,i≠j\) (Asumsi homoskedastisitas tidak terpenuhi)
Dengan uji Breusch-Pagan didapatkan p-value sebesar 0.5992. Nilai p-value tersebut cukup besar lebih besar dari \(\alpha\)(0,05), Maka tidak terbukti ada pelanggaran asumsi homogenitas ragam galat pada model Nilai UAS sebagai fungsi dari Tingkat Kehadiran dan IQ.
3.3.3 Asumsi NonAutokorelasi
> dwtest(reg)
Durbin-Watson test
data: reg
DW = 2.594, p-value = 0.8013
alternative hypothesis: true autocorrelation is greater than 0Hipotesis:
\(Ho\): Tidak terjadi autokorelasi.
\(H1\): Tidak terjadi autokorelasi
Dengan uji durbin-watson didapatkan p-value sebesar 0.1833. Nilai p tersebut cukup besar, maka tidak terbukti ada masalah autokorelasi pada model Nilai UAS sebagai fungsi dari Tingkat Kehadiran dan IQ.
4 KESIMPULAN
Dari pengujian yang telah dilakukan, bahwa Tingkat Kehadiran berpengaruh secara signifikan terhadap Nilai UAS, sedangkan IQ tidak berpengaruh secara signifikan terhadap Nilai UAS. Berdasarkan uji asumsi, didapatkan informasi bahwa tidak terdapat pelanggaran asumsi normalitas, tidak terdapat pelanggaran homogenitas, tidak ada masalah autokorelasi, dan tidak terdapat multikolinieritas. Sehingga dapat disimpulkan bahwa model tersebut merupakan model regresi yang baik.
5 DAFTAR PUSTAKA
Ghozali, Imam. (2009). Metode Penelitian Ekonometri. Jakarta: Penerbit Universitas Indonesia.
Tulandi Riry Anggia, Lotje Kawet, & Imelda Ogi. (2015). Analisis Pengaruh Strategi Promosi, Harga, dan Kepuasan Terhadap Loyalitas Konsumen Surat Kabar Manado Post. Jurnal EMBA, 3(2), 1041-1050.
Ningrum, Astriawati. (2016). PENERAPAN ANALISIS REGRESI LINIER BERGANDA UNTUK MENENTUKAN PENGARUH PELAYANAN PENDIDIKAN TERHADAP EFEKTIFITAS BELAJAR TARUNA DI AKADEMI MARITIM YOGYAKARTA. Jurnal Ilmu-ilmu Kemaritiman, Manajemen dan Transportasi. Volume(14), 22-26.