\[ Y_i= \beta_0+\beta_1X_1+\beta_2X_2+...+\beta_kX_k \] Pada pemodelan regresi terdapat syarat-syarat yang harus dipenuhi yaitu dengan memenuhi uji multikolinearitas dan uji asumsi residual yakni uji normalitas, uji homokedastisitas, dan uji autokorelasi.
Menurut Levine, dkk (2003) sisaan (eijk) merupakan selisih antara nilai pengamatan (Yijk) dengan nilai dugaan (Ytopiijk). Nilai sisaan secara umum dirumuskan sebagai berikut: \[ e_{ijk}=Y_{ijk}-\bar Y_{ijk} \] Plot yang terbentuk dari nilai sisaan (eijk) terhadap hi disebut sebagai plot peluang normal (normal probability plot). Plot tersebut digunakan untuk mendeteksi apakah galat menyebar secara normal atau tidak. Persamaan hi diatas merupakan hasil perkalian dari akar Kuadrat Tengah Galat dengan normal score (skor normal).
\[ VIF = \frac{1}{1-R_{Yj1}^2} \] dengan \[ R_{Yj1}^2=\frac{r_{yj}^2+r_{y1}^2+2r_{y1}r_{yj}}{1-r_{j1}^2} \]
H0 : residual mengikuti distribusi normal
H1 : residual tidak mengikuti distribusi normal
Statistik uji untuk uji Jarque-Bera test : \[ JB=\frac{n}{6}(S^2+\frac{(K-3)^2}{4}) \] sedangkan Statistik uji untuk shapiro test yaitu: \[ T_3=\frac{1}{D}[\Sigma^k_{i=1}a_i(X_{(n-i+1)}-X_i]^2 \]
Hipotesis uji Breusch-Pagan
H0 : tidak terjadi masalah heterokedastisitas
H1 : terjadi masalah heterokedastisitas
Rumus Uji Breusch-Pagan sebagai berikut: \[ LM=\frac{NT}{2(t-1)}[\frac{\Sigma_{i=1}^N(\Sigma_{i=1}^Tu_{it})^2}{\Sigma_{i=1}^N\Sigma_{i=1}^T u_{it}^it}-1] \]
\[ d=\frac{\Sigma_{i=2}^n(e_i-e_{i-1})^2}{\Sigma^n_{i=1}e_i^2} \]
Data yang digunakan adalah data real. Data ini diambil dari dari website Badan Pusat Statistik (BPS) yang diupload pada tanggal 31 Januari 2022 dengan judul “Indeks Pembangunan Manusia (IPM) Bojonegoro Tahun 2021”.
> # Library(rmarkdown)
> # Library(markdown)
> # Library(prettydoc)
> # Library(tinytex)
> # Library(readr)
> # Library(equtiomatic)
> # Library(car)
> # Library(tseries)
> # Library(lmtest)> #Data IPM Kabupaten Bojonegoro
> library(readr)
> DATA <- read.csv("C:/Users/asus/Downloads/Data IPM Kab Bojonegoro.csv", header = TRUE, sep = ",")> #Data IPM Kabupaten Bojonegoro
> View(DATA)> #Data IPM Kabupaten Bojonegoro
> DATA
TAHUN Y X1 X2
1 2010 62.19 5.51 8087
2 2011 63.22 5.70 8413
3 2012 64.20 5.80 8809
4 2013 64.85 5.90 8934
5 2014 65.27 6.14 8964
6 2015 66.17 6.64 8993
7 2016 66.73 6.65 9420
8 2017 67.28 6.71 9553
9 2018 67.85 6.77 9926
10 2019 68.75 7.09 10265
11 2020 69.04 7.33 10121
12 2021 69.59 7.38 10221> #Analisis regresi dengan fungsi lm
> REGRESI<-lm(Y~X1+X2,data=DATA)
> summary(REGRESI)
Call:
lm(formula = Y ~ X1 + X2, data = DATA)
Residuals:
Min 1Q Median 3Q Max
-0.26285 -0.13783 0.00161 0.13466 0.26057
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 3.877e+01 8.556e-01 45.318 6.2e-12 ***
X1 1.836e+00 2.862e-01 6.415 0.000123 ***
X2 1.677e-03 2.546e-04 6.588 0.000101 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 0.1953 on 9 degrees of freedom
Multiple R-squared: 0.9944, Adjusted R-squared: 0.9932
F-statistic: 805.8 on 2 and 9 DF, p-value: 7.088e-11REGRESI<-lm(Y~X1+X2,data=DATA)
Perintah untuk analisis regresi dengan fungsi lm, Y sebagai respons, X1 dan X2 prediktor dan data yang digunakan pada obyek DATA dan disimpan pada obyek REGRESI.
summary(REGRESI)
Perintah untuk menampilkan hasil analisis regresi
> #Pemeriksaan sisaan
> par(mfrow=c(2,2))
> plot(REGRESI)par(mfrow=c(2,2))
Perintah untuk menamilkan semua plot dalam satu layar, yang mengatur tampilan gambar pada dua baris, masing-masing baris berisi dua gambar
plot(REGRESI)
untuk membuat plot dari objek REGRESI
> #Pendeteksian Multikolinieritas
> library(car)
> vif(REGRESI)
X1 X2
9.788321 9.788321 library(car)
Mengaktifkan packages car
vif(REGRESI)
Digunakan fungsi vif untuk mendeteksi multikolinieritas
> #uji normalitas galat
> sisa<-residuals(REGRESI)
> library(tseries)
> jarque.bera.test(sisa)
Jarque Bera Test
data: sisa
X-squared = 0.8216, df = 2, p-value = 0.6631
> shapiro.test(sisa)
Shapiro-Wilk normality test
data: sisa
W = 0.94301, p-value = 0.5381sisa<-residuals(REGRESI)
Perintah untuk memperoleh sisaan dengan fungsi residuals dari obyek REGRESI dan disimpan ke obyek sisa
library(tseries)
Mengaktifkan packages tseries
jarque.bera.test(sisa)
Melakukan uji jarque bera pada obyek sisa
shapiro.test(sisa)
Melakukan uji shapiro pada obyek sisa
> #uji Heterokedastisitas ragam galat
> library(lmtest)
> bptest(REGRESI)
studentized Breusch-Pagan test
data: REGRESI
BP = 0.76957, df = 2, p-value = 0.6806library(lmtest)
Mengaktifkan packages lmtest
bptest(REGRESI)
untuk uji Breusch Pagan pada obyek REGRESI
> #uji non autokorelasi galat
> dwtest(REGRESI)
Durbin-Watson test
data: REGRESI
DW = 1.0894, p-value = 0.01517
alternative hypothesis: true autocorrelation is greater than 0dwtest(REGRESI)
Perintah untuk uji Durbin Watson pada obyek REGRESI
> #Plot Analisis Regresi
> plot(REGRESI)plot(REGRESI)
untuk membuat plot dari objek REGRESI
> par(mfrow=c(2,2))
> plot(REGRESI)
Dari plot Residuals vs Fitted, Plot Normal Q-Q, dan Plot Scale-location
menunjukan tidak adanaya pelanggaran normalitas
Sedangkan dari Plot Residuals vs Reverage terdapat titik 1 yang diberi “warning” sebagai amatan berpengaruh karena sedikit dibawah jarak cook. sehingga dapat dipastikan dengan membentuk regresi tanpa titik tersebut
suatu data dikatakan terdapat multikolinieritas jika nilai: \[ vif>10\]
sedangkan, suatu data dikatakan tidak terdapat multikolinieritas jika nilai : \[vif<10\]
Dari perhitungan manual maupun perhitungan Rstudio menunjukan hasil:
\[ x_1 : vif= 9.788 \] \[ x_2 : vif= 9.788 \] karena nilai vif dari x1 dan x2 < 10, maka dapat dikatakan bahwa data tersebut tidak terdapat multikolinieritas
1. jarque bera test
Hipotesis
H0 : residual mengikuti distribusi normal
H1 : residual tidak mengikuti distribusi normal
tingkat signifikansi: \[ \alpha = 0.05 \] Statistik Uji : \[ X^2 = 0.8216 \] \[ df = 2 \] \[ p-value = 0.6631 \] keputusan : \[ p-value(0.6631) > \alpha (0.05) \] Maka, terima H0
keismpulan : jadi dapat disimpulkan bahwa residual dari data mengikuti distribusi normal
2. shapiro.test
Hipotesis
H0 : residual mengikuti distribusi normal
H1 : residual tidak mengikuti distribusi normal
tingkat signifikansi: \[ \alpha = 0.05 \] Statistik Uji : \[ w = 0.94301 \]
\[ p-value = 0.5381 \] keputusan : \[ p-value(0.5381) > \alpha (0.05) \] Maka, terima H0
keismpulan : jadi dapat disimpulkan bahwa residual dari data mengikuti distribusi normal
Hipotesis
H0 : tidak terjadi masalah heterokedastisitas
H1 : terjadi masalah heterokedastisitas
tingkat signifikansi: \[ \alpha = 0.05 \] Statistik Uji : \[ BP = 0.76957 \] \[ df = 2 \] \[ p-value = 0.6806 \] keputusan : \[ p-value(0.6806) > \alpha (0.05) \] Maka, terima H0
keismpulan : jadi dapat disimpulkan bahwa tidak terjadi masalah heterokedastisitas pada data
Dari perhitungan manual dan perhitungan software diperoleh : \[ dw = 1.0894 \]
\[ p-value = 0.6806 \] keputusan :
karena \[ Nilai-p > 0 \] Maka, tidak terdapat masalah autokorelasi
Karena data telah memenuhi seluruh asumsi (sisaan, multikolinieritas, normalitas, Heterokedastisitas dan autokorelasi) maka dapat dilanjutkan ke Analisis Regresi Linier Berganda
Dari hasil perhitungan manual dan juga perhitungan software, maka diperoleh: \[ intercept : 38.77 \] \[ coefficient X_1 : 1.836 \] \[ coefficient X_2 : 0.001677 \] \[ R-Squared : 0.9944 \] \[ R-Squared (Adjusted) : 0.9932 \] \[ P-value = 0.00000000007088 \]
sehingga diperoleh model regresi \[ Y = 38.77+1.836X_1+0.001677X_2 \] interpretasi :
Jika X1 (lama rata rata sekolah) DAN X2 (pengeluaran perkapita) bernilai 0 maka Y(IPM) bernilai 38.77
Jika X1 mengalami kenaikan 1% maka nilai Y mengalami kenaikan sebesar 1.8638 dengan asumsi variabel X2 tetap
Jika X2 mengalami kenaikan 1% maka nilai Y mengalami kenaikan sebesar 0.001677 dengan asumsi variabel X1 tetap
telah diketahui bahwa: \[ Nilai-p = 0.00000000007088 \] dan dengan tingkat signifikansi : \[ \alpha =0.05 \] maka: \[ Nilai-p(0.00000000007088)<\alpha(0.05) \] Maka nilai harapan sisaan tidak sama dengan nol
telah diketahui bahwa: \[ Nilai-p = 0.00000000007088 \] dan dengan tingkat signifikansi : \[ \alpha =0.05 \] maka: \[ Nilai-p(0.00000000007088)<\alpha(0.05) \] Maka, variabel X1 dan X2 secara simultan perbengaruh terhadap Y
\[ Y = 38.77+1.836X_1+0.001677X_2 \] kesimpulan :
Jika X1 (lama rata rata sekolah) DAN X2 (pengeluaran perkapita) bernilai 0 maka Y(IPM) bernilai 38.77
Jika X1 mengalami kenaikan 1% maka nilai Y mengalami kenaikan sebesar 1.8638 dengan asumsi variabel X2 tetap
Jika X2 mengalami kenaikan 1% maka nilai Y mengalami kenaikan sebesar 0.001677 dengan asumsi variabel X1 tetap
Arofah, I., & Rohimah, S. (2019). Analisis Jalur Untuk Pengaruh Angka Harapan Hidup, Harapan Lama Sekolah, Rata-Rata Lama Sekolah Terhadap Indeks Pembangunan Manusia Melalui Pengeluaran Riil Per Kapita Di Provinsi Nusa Tenggara Timur. Jurnal Saintika Unpam: Jurnal Sains Dan Matematika Unpam, 2(1), 76-87.
Mahya, A. J., & Widowati, W. (2021). ANALISIS PENGARUH ANGKA HARAPAN LAMA SEKOLAH, RATA-RATA LAMA SEKOLAH, DAN PENGELUARAN PER KAPITA TERHADAP INDEKS PEMBANGUNAN MANUSIA. Prismatika: Jurnal Pendidikan dan Riset Matematika, 3(2), 126-139.
Asmawani, E. P. (2021). Pengaruh Angka Harapan Hidup, Rata-Rata Lama Sekolah, Pertumbuhan Ekonomi Dan Pengeluaran Perkapita Terhadap Indeks Pembangunan Manusia di Provinsi Sumatera Utara. Jurnal Sains Ekonomi (JSE), 2(1), 96-109.