Analisis regresi linier merupakan metode yang digunakan untuk menjelaskan pengaruh variabel independen terhadap variabel dependen, di mana salah satu dari dua variabel tersebut mempengaruhi variabel lain. Secara umum model linier dibagi menjadi dua yakni model regresi linier sederhana dan model regresi linier berganda. Model regresi linier sederhana hanya melibatkan satu variabel independen yang mempengaruhi variabel dependen, sehingga mendapat hasil analisis yang lebih sederhana. Penggunaan model regresi linier sederhana digunakan ketika terdapat keyakinan bahwa hanya satu variabel independen yang mempengaruhi variabel dependen. Sementara model regresi linier berganda melibatkan dua atau lebih variabel independen yang mempengaruhi variabel dependen, sehingga mendapat hasil analisis yang lebih kompleks. penggunaan model regresi linier berganda digunakan ketika terdapat keyakinan bahwa lebih dari satu variabel independen mempengaruhi variabel dependen.
Analisis regresi dapat diterapkan dalam berbagai bidang dan memiliki kegunaan untuk mengetahui variabel-variabel independen yang berpengaruh terhadap suatu variabel dependen, berguna untuk permodelan, pendugaan, serta peramalan yang dapat memecahkan suatu permasalahan. Pada kesempatan kali ini akan dilakukan penerapan metode regresi linier khususnya model regresi linier berganda beserta uji asumsinya untuk mengestimasi laju pertumbuhan penduduk di Kabupaten Musi Banyuasin dengan dua variabel independen yaitu jumlah kelahiran dan jumlah kematian dan variabel dependen yaitu jumlah penduduk.
Analisis regresi adalah metode sederhana yang digunakan untuk melakukan investigasi mengenai hubungan fungsional di antara beberapa variabel yang diwujudkan dalam suatu model matematis. Terdapat dua macam variabel pada model regresi yaitu variabel respons(Y) atau yang biasa disebut variabel dependen (dependent variable) serta variabel penduga(X) atau prediktor yang biasa disebut variabel bebas (independent variable). Terdapat beberapa tahap untuk melakukan analisis regresi antara lain perumusan masalah, penyeleksian variabel potensial yang relevan, pengumpulan data, spesifikasi model, pemilihan metode yang tepat, penyesuaian model, validasi model, serta penerapan model yang terpilih sebagai penyelesaian masalah.
Regresi linier sederhana menjelaskan hubungan antar dua variabel yang dinyatakan dalam suatu garis regresi dan merupakan teknik dalam statistika parametrik yang digunakan secara umum untuk menganalisis rata-rata respons dari variabel Y yang berubah sehubungan dengan besarnya intervensi dari variabel X.
Berikut ini adalah model yang digunakan dalam regresi linier sederhana :
\[ \hat{Y_{i}}=\beta_{0}+\beta{1}X_{i}+\epsilon_{i}\\ i = 1,2,3,...,n \]
Keterangan :
\(\hat{Y_{i}}\) = variabel respons ke-i
\(\beta_{0}\) dan \(\beta_{1}\) = parameter
\(X_{i}\) = variabel independen ke-i
\(\epsilon_{i}\) = residual (error) untuk pengamatan ke-i
Regresi linier berganda merupakan lanjutan dari regresi linier sederhana dimana pada regresi linier berganda terdapat lebih dari satu variabel independen. Regresi linier berganda digunakan apabila terdapat lebih dari satu variabel X yang mempengaruhi variabel Y.
Berikut ini adalah model yang digunakan dalam regresi linier berganda :
\[ \hat{Y_{i}}=\beta_{0}+\beta_{1}X_{1i}+\beta_{2}X_{2i}+...+ \beta_{p}X_{pi}+\epsilon_{i}\\i = 1,2,3,...,n\\ p = 1,2,3,...,n \]
Keterangan :
\(\hat{Y_{i}}\) = nilai output atau variabel respons ke-i
\(\beta_{0}\) = intersep
\(\beta_{1},\beta_{2},...,\beta_{p}\) = koefisien regresi parsial dari variabel dependen ke-i
\(X_{1i},X_{2i},...,X_{pi}\) = variabel-variabel independen ke-i dengan parameternya
\(\epsilon_{i}\) = residual (error) untuk pengamatan ke-i
Uji asumsi klasik merupakan serangkaian pengujian yang digunakan untuk memastikan bahwa data yang digunakan dalam analisis regresi linier memenuhi asumsi-asumsi yang mendasarinya. Asumsi-asumsi tersebut harus dipenuhi agar estimasi parameter regresi menjadi valid.
Uji normalitas memastikan bahwa resiadual atau kesalahan prediksi dari model regresi berdistribusi normal. Galat harus memiliki rata-rata mendekati nol serta varians yang konstan pada semua tingkat variabel independen.
Adapun hipotesis Uji Normalitas Galat adalah sebagai berikut :
\(h_{0}\) : Residual berdistribusi normal
\(h_{1}\) : Residual tidak berdistribusi normal
Apabila asumsi tersebut terpenuhi, maka estimasi parameter regresi dapat dikatakan efisien. Pengujian dapat menggunakan Uji kolmogorov-Smirnov, Uji Shaphiro-Wilk, dan analisis grafik.
Pemeriksaan multikolinieritas perlu dilakukan untuk melihat adanya hubungan antar dua variabel bebas. Hasil pemeriksaan harus menunjukkan tidak terdapat multikolinieritas karena multikolinieritas menyebabkan semakin melebarnya nilai confidence interval sehingga menyulitkan pengambilan keputusan statistik terhadap hipotesis nol dan hipotesis alternatif.
Pemeriksaan multikolinieritas dapat dilakukan dengan memeriksa nilai tolerance dan Variance Inflating Factor (VIF)
\[TOL_{j} = \frac {1}{VIF_{i}}\\ VIF_{j} = \frac {1} {1-R^2}\\ j = 1,2,3,...,k\]
Kriteria pemeriksaan, terjadi multikolinieritas apabila : \(TOL<0.1\\VIF>10\)
Homoskedastisitas menyatakan bahwa varians dari residual konstan pada setiap variabel. Asumsi tersebut harus dipenuhi karena apabila terjadi heteroskedastisitas karena varians dari residual tidak konstan. Heteroskedastisitas menyebabkan peningkatan varians residual sehingga estimasi parameter menjadi tidak efisien. Heteroskedastisitas dapat dideteksi dengan beberapa cara antara lain menggunakan grafik dan Rank Korelasi Spearman.
Adapun Hipotesis Uji Asumsi Homoskedastisitas adalah sebagai berikut :
\(h_{0}\) : Tidak terjadi gejala heteroskedastisitas
\(h_{1}\) : Terjadi gejala heteroskedastisitas
Berikut statistik uji untuk Uji Korelasi rank Spearman menggunakan uji t :
\[t=\frac{r \sqrt(n-2)}{\sqrt(1-r^2)}\]
Kriteria pengujian :
\(t_{hitung}> t_{tabel}\) maka \(H_{0}\) ditolak atau dapat disimpulkan bahwa terjadi heteroskedastisitas.
Asumsi non autokorelasi merupakan asumsi yang menyatakan bahwa residual dari model regresi tidak berkorelasi satu sama lain. Asumsi tersebut tidak boleh dilanggar. Apabila terdapat autokorelasi maka akan menyebabkan estimasi parameter tidak efisien. Pengujian dapat dilakukan menggunakan Uji Durbin Waston.
Adapun hipotesis untuk Uji asumsi Non Autokorelasi adalah sebagai berikut :
\(h_{0}\) : Tidak terjadi autokorelasi
\(h_{1}\) : Terjadi autokorelasi
> jumlah_penduduk <- c(587325,592400,602027,611506,620738,629791,638625,647072,622186,627070)
> kelahiran <- c(12687,12954,13291,13382,13498,13518,13795,13898,13865,13952)
> kematian <- c(550,1056,1145,1527,1458, 1389,1375,1239,2472,2315)
> X0 <- rep(1,10)
> X1 <- kelahiran
> X2 <- kematian
> Y <- jumlah_penduduk
> X <- matrix(c(X0,X1,X2), nrow = 10)
> X
[,1] [,2] [,3]
[1,] 1 12687 550
[2,] 1 12954 1056
[3,] 1 13291 1145
[4,] 1 13382 1527
[5,] 1 13498 1458
[6,] 1 13518 1389
[7,] 1 13795 1375
[8,] 1 13898 1239
[9,] 1 13865 2472
[10,] 1 13952 2315
> df <- data.frame(X1,X2,Y)
> df
X1 X2 Y
1 12687 550 587325
2 12954 1056 592400
3 13291 1145 602027
4 13382 1527 611506
5 13498 1458 620738
6 13518 1389 629791
7 13795 1375 638625
8 13898 1239 647072
9 13865 2472 622186
10 13952 2315 627070> analisis_regresi <- lm(Y~X1+X2, data = df)
> summary(analisis_regresi)
Call:
lm(formula = Y ~ X1 + X2, data = df)
Residuals:
Min 1Q Median 3Q Max
-9908.7 -559.9 311.4 1340.9 8568.8
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -1.886e+05 8.154e+04 -2.313 0.05392 .
X1 6.192e+01 6.432e+00 9.627 2.75e-05 ***
X2 -1.954e+01 4.765e+00 -4.102 0.00456 **
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 5194 on 7 degrees of freedom
Multiple R-squared: 0.9446, Adjusted R-squared: 0.9288
F-statistic: 59.7 on 2 and 7 DF, p-value: 3.996e-05Berdasarkan hasil analisis regresi linier berganda diperoleh bentuk persamaan sebagai betikut :
\[\hat{Y}=-188625.22+61.92X_{1}-19.54X_{2}\]
interpretasi :
Apabila jumlah kelahiran bernilai konstan, maka setiap peningkatan 1 orang dalam jumlah kelahiran akan menyebabkan peningkatan jumlah penduduk sebesar 61.92 dalam jumlah penduduk. Dengan kata lain, untuk setiap bayi yang lahir di kabupaten Musi Banyuasin, maka populasi akan bertambah sekitar 62 orang.
Apabila jumlah kelahiran bernilai konstan, maka setiap peningkatan 1 orang dalam jumlah kematian akan menyebabkan penurunan jumlah penduduk sebesar 19.54 dalam jumlah penduduk. Dengan kata lain, untuk setiap orang yang meninggal di Kabupaten Musi Banyuasin, maka populasi akan berkurang sekitar 19 orang.
Apabila tidak terdapat bayi yang lahir dan orang yang meninggal di Kabupaten Musi Banyuasin, maka jumlah penduduk akan bernilai -188625.22 atau berkurang sebanyak 188625 orang.
\(h_{0}\) : Residual berdistribusi normal
\(h_{1}\) : Residual tidak berdistribusi normal
Keputusan :
\(Jarque\ Bera\ P-value (0.6204) > \alpha(0.05)\) maka \(h_{0}\) diterima.
\(Saphiro\ Wilk\ P-value (0.1373) > \alpha(0.05)\) maka \(h_{0}\) diterima.
Kesimpulan :
Dengan taraf signifikansi sebesar 5% sudah cukup bukti bahwa residual berdistribusi normal.
Keputusan :
\(VIF(2.449222)<10\) maka tidak terdapat multikolinieritas
Kesimpulan :
Berdasarkan hasil pemeriksaan multikolinieritas, didapatkan hasil tidak terdapat gejala multikolinieritas.
Hipotesis :
\(h_{0}\) : Tidak terjadi gejala heteroskedastisitas
\(h_{1}\) : Terjadi gejala heteroskedastisitas
Keputusan :
\(P-value (0.884) > \alpha(0.05)\) maka \(h_{0}\) diterima.
Kesimpulan :
Dengan taraf signifikansi sebesar 5% sudah cukup bukti bahwa tidak terjadi heteroskedastisitas.
Hipotesis :
\(h_{0}\) : Tidak terjadi autokorelasi
\(h_{1}\) : Terjadi autokorelasi
Keputusan :
\(P-value (0.2036) > \alpha(0.05)\) maka \(h_{0}\) diterima.
Kesimpulan :
Dengan taraf signifikansi sebesar 5% sudah cukup bukti bahwa tidak terjadi autokorelasi.
Berdasarkan analisis regresi berganda terhadap laju pertumbuhan penduduk di Kabupaten Musi Banyuasin dapat ditarik kesimpulan bahwa untuk setiap bayi yang lahir, maka populasi akan bertambah sekitar 62 orang dan untuk setiap orang yang meninggal, maka populasi akan berkurang sekitar 19 orang. Namun, apabila tidak terdapat bayi yang lahir dan orang yang meninggal di Kabupaten Musi Banyuasin, maka jumlah penduduk berkurang sebanyak 188625 orang. Berdasarkan hasil uji asumsi dapat ditarik kesimpulan bahwa tidak terdapat asumsi yang dilanggar.
Rahmat, C. A., Kurniabudi, & Novianto, Y.(2023). Penerapan Metode regresi Linier Berganda untuk Mengestimasi laju Pertumbuhan penduduk Kabupaten Musi Banyuasin. Jurnal Informatika dan Rekayasa Komputer (JAKAKOM) 3(1) 359-369
Nawari,(2010). Analisis Regresi dengan MS excel 2007 dan SPSS 17. Jakarta : Elex Media Komputindo
Kurniawan, R., Yuniarto, B., (2016). ANALISIS REGRESI : Dasar dan Penerapannya dengan R . Jakarta : KENCANA