1 PENDAHULUAN
1.1 Latar Belakang
Jawa Timur merupakan salah satu provinsi di Indonesia yang terletak di Pulau Jawa. Provinsi ini memiliki luas wilayah sekitar 47.799,75 kilometer persegi dan merupakan provinsi terbesar kedua setelah Papua. Menurut data BPS (Badan Pusat Statistik) pada tahun 2020, jumlah penduduk Jawa Timur mencapai sekitar 40,9 juta jiwa, menjadikannya provinsi dengan populasi terbanyak di Indonesia.
Meskipun Jawa Timur memiliki jumlah penduduk yang besar, provinsi ini juga menghadapi tantangan dalam hal kemiskinan. Tingkat kemiskinan di Jawa Timur masih cukup signifikan. Menurut data BPS pada Maret 2020, tingkat kemiskinan di Jawa Timur mencapai 13,47 persen, di mana sekitar 4,9 juta penduduk hidup di bawah garis kemiskinan.
Tujuan dari penelitian ini adalah mengetahui pengaruh jumlah penduduk dengan jumlah kemisikinan di Jawa Timur pada tahun 2020. Oleh karena itu, analisis regresi linier sederhana dapat digunakan untuk mengetahui apakah terdapat pengaruh antara jumlah penduduk dengan jumlah kemiskinan di Jawa Timur.
2 TINJAUAN PUSTAKA
2.1 Regresi Linier Sederhana
Menurut Kurniawan (2008) Regresi linier adalah suatu teknik statistika yang digunakan untuk mengembangkan model matematis yang menjelaskan hubungan antara variabel dependen (variabel respon atau Y) dengan satu atau lebih variabel independen (variabel prediktor atau X). Ketika hanya terdapat satu variabel independen, metode ini disebut sebagai regresi linier sederhana, sedangkan jika terdapat lebih dari satu variabel independen, metode ini disebut sebagai regresi linier berganda.
Menurut Yuliara,I. (2016) persamaan regresi linier sederhana secara matematis dapat dituliskan sebagai berikut : \[ \hat{Y} = \beta_0 + \beta_1 X \ \] dimana, \[ \hat{Y} = variabel~terikat\ \] \[ \beta_0 = intercept\ \] \[ \beta_1 = koefisien~variabel~X~(slope)\ \] \[ \ X = variabel~bebas\ \]
2.2 Uji Asumsi Klasik
Sebelum melakukan analisis dengan regresi linier sederhana perlu dilakukan uji asumsi klasik. Uji asumsi klasik secara umum dapat dilakukan dengan cara melakukan uji normalitas, uji Homoskesdastisitas, uji autokorelasi, uji linieritas, dan uji multikolinearitas.
2.2.1 Uji Normalitas
Uji normalitas adalah suatu metode statistik yang digunakan untuk mengevaluasi apakah data atau sampel yang dianalisis mengikuti distribusi normal atau tidak. Distribusi normal adalah distribusi yang simetris di sekitar nilai rata-rata, dimana sebagian besar data terkumpul di sekitar nilai tengah dan secara teratur menyebar ke kiri dan kanan.
Dalam menguji asumsi normalitas terdapat berbagai macam uji yang dapat digunakan, salah satunya adalah uji Shapiro Wilk. Menurut Statistikian (dalam Quraisy, A. 2020) Uji Shapiro Wilk adalah sebuah metode atau rumus perhitungan sebaran data yang dibuat oleh shapiro dan wilk. Metode shapiro wilk adalah metode uji normalitas yang efektif dan valid digunakan untuk sampel berjumlah kecil.
Hipotesis yang diuji dalam asumsi normalitas adalah sebagai berikut.
H0 : Residual berasal dari populasi yang berdistribusi normal.
H1 : Residual berasal dari populasi yang tidak berdistribusi normal.
Kriteria Pengujian bagi asumsi Normalitas adalah sebagai berikut.
Terima H0 jika P-value > alpha (0,05).
Tolak H0 jika P-value < alpha (0,05).
2.2.2 Uji Homoskesdastisitas
Asumsi homoskedastisitas adalah salah satu asumsi penting dalam analisis regresi. Asumsi ini menyatakan bahwa variansi dari kesalahan (error) dalam model regresi adalah konstan di semua tingkat nilai variabel independen. Dalam konteks regresi linier, homoskedastisitas menunjukkan bahwa dispersi (variabilitas) dari nilai residual (selisih antara nilai observasi aktual dan nilai yang diprediksi oleh model) adalah konstan di seluruh rentang nilai prediktor. Jika asumsi homoskedastisitas dilanggar, hal ini dapat mengarah pada estimasi koefisien regresi yang tidak efisien, menghasilkan interval kepercayaan dan uji hipotesis yang tidak akurat. Oleh karena itu, penting untuk menguji homoskedastisitas dalam analisis regresi.
Salah satu uji yang umum digunakan untuk menguji homoskedastisitas adalah uji Breusch-Pagan (juga dikenal sebagai uji White). Uji ini memperkirakan model tambahan yang menggunakan kuadrat dari nilai prediktor sebagai variabel independen untuk menguji apakah variansi residual bervariasi secara sistematis dengan nilai prediktor.
Hipotesis yang diuji dalam asumsi homoskesdastisitas adalah sebagai berikut menurut Andirani (2017).
H0 : Variasi galat bersifat homoskesdastisitas.
H1 : Variasi galat bersifat heteroskesdastisitas.
Kriteria Pengujian bagi asumsi homoskesdastisitas adalah sebagai berikut.
Terima H0 jika P-value > alpha (0,05).
Tolak H0 jika P-value < alpha (0,05).
2.2.3 Uji Autokorelasi
Dalam Kurniawan, D. (2008), adanya autokorelasi pada kesalahan (error) menunjukkan bahwa terdapat satu atau beberapa faktor atau variabel yang berpengaruh signifikan terhadap variabel terikat Y namun tidak dimasukkan ke dalam model regresi. Autokorelasi sering kali terjadi pada data dengan unsur waktu (data time series). Untuk menguji asumsi autokorelasi, statistik uji yang sering digunakan adalah Durbin-Watson statistics (DW-statistics). Hipotesis yang sering digunakan dalam uji asumsi autokorelasi adalah:
Hipotesis yang diuji dalam asumsi Autokorelasi adalah sebagai berikut.
H0 : Tidak ada autokorelasi dalam error (kesalahan) atau tidak ada korelasi antara error pada waktu yang berbeda.
H1 : Terdapat autokorelasi dalam error atau ada korelasi antara error pada waktu yang berbeda.
Kriteria Pengujian bagi asumsi autokorelasi adalah sebagai berikut.
Terima H0 jika P-value > alpha (0,05).
Tolak H0 jika P-value < alpha (0,05).
2.2.4 Uji Multikolinearitas
Menurut Kurniawan, D. (2008), asumsi multikolinearitas hanya berlaku khusus untuk regresi linier berganda. Multikolinieritas terjadi ketika terdapat hubungan linier yang kuat antara variabel bebas. Oleh karena itu kita tidak memerlukan pengujian asumsi multikolinearitas karena menggunakan regresi linier sederhana.
3 SOURCE CODE
3.1 Input Data
> x <- c(586.1,949.3,731.1,1635.3,2654.4,1223.7,2536.7,1606,
+ 2082.8,1119.2,1318.1,1344.2,1311.2,744.4,1708.1,1301.6)
> y <- c(80.82,86.74,81.06,179.93,265.56,108.55,247.99,151.43,
+ 127.05,118.8,187.13,164.68,164.05,78.3,130.37,161.1)
> data <- data.frame(X=x, Y=y)
> data
X Y
1 586.1 80.82
2 949.3 86.74
3 731.1 81.06
4 1635.3 179.93
5 2654.4 265.56
6 1223.7 108.55
7 2536.7 247.99
8 1606.0 151.43
9 2082.8 127.05
10 1119.2 118.80
11 1318.1 187.13
12 1344.2 164.68
13 1311.2 164.05
14 744.4 78.30
15 1708.1 130.37
16 1301.6 161.10Dalam syntax tersebut dibuat data frame dengan nama data yang berisi kolom-kolom X dan Y yang sesuai dengan nilai-nilai yang diberikan.
3.2 Persamaan regresi linier sederhana
> library (stats)
> x <- c(586.1,949.3,731.1,1635.3,2654.4,1223.7,2536.7,1606,
+ 2082.8,1119.2,1318.1,1344.2,1311.2,744.4,1708.1,1301.6)
> y <- c(80.82,86.74,81.06,179.93,265.56,108.55,247.99,151.43,
+ 127.05,118.8,187.13,164.68,164.05,78.3,130.37,161.1)
> reg <- lm(y~x)
> reg
Call:
lm(formula = y ~ x)
Coefficients:
(Intercept) x
31.50836 0.08005
> summary(reg)
Call:
lm(formula = y ~ x)
Residuals:
Min 1Q Median 3Q Max
-71.196 -14.792 0.043 22.514 50.102
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 31.50836 20.40465 1.544 0.145
x 0.08005 0.01323 6.049 2.99e-05 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 30.73 on 14 degrees of freedom
Multiple R-squared: 0.7233, Adjusted R-squared: 0.7035
F-statistic: 36.59 on 1 and 14 DF, p-value: 2.994e-05Dalam syntax tersebut dibuat variabel x dan y dimana variabel x menggambarkan jumlah penduduk dan variabel y menggambarkan jumlah kemiskinan di Jawa Timur pada tahun 2020. Kemudian dibuat variabel bernama reg dengan fungsi lm() yang digunakan untuk melakukan regresi linier sederhana dengan memasukkan formula y~x, yang berarti variabel y dijelaskan oleh variabel x. Kemudian ditampilkan ringkasan dari regresi tersebut sehingga didapatkan koefisien regresi, nilai R-squared, p-value, dan informasi lainnya yang relevan dengan analisis regresi.
3.3 Asumsi Normalitas
> #menghitung residual
> residual<- resid(reg)
> #uji shapiro wilk
> shapiro.test(reg$residual)
Shapiro-Wilk normality test
data: reg$residual
W = 0.95841, p-value = 0.633Dalam syntax tersebut, pertama menghitung residual dari model regresi yang telah dibentuk sebelumnya. ‘reg’ merujuk pada model regresi yang telah dihasilkan menggunakan fungsi lm(). Dalam kasus ini, residual akan berisi sisa kesalahan (residual) dari model regresi. Kemudian dilakukan uji Shapiro Wilk menggunakan fungsi shapiro.test() pada residual yang dihasilkan sebelumnya. reg$residual merujuk pada kolom residual dari model regresi reg. Uji Shapiro-Wilk ini digunakan untuk menguji asumsi normalitas pada residual, yaitu apakah residual mengikuti distribusi normal atau tidak.
3.4 Asumsi Homoskesdastisitas
> #memanggil packages lmtest
> library(lmtest)
> #melakukan uji breusch pagan
> bptest(reg)
studentized Breusch-Pagan test
data: reg
BP = 1.513, df = 1, p-value = 0.2187Dalam syntax ini, dilakukan uji Breusch-Pagan pada model regresi yang telah dibentuk sebelumnya. reg merujuk pada model regresi yang telah dihasilkan menggunakan fungsi lm(). Uji Breusch-Pagan digunakan untuk menguji asumsi homoskedastisitas pada model regresi, yaitu apakah varians residual konstan atau tidak.
3.5 Asumsi Autokorelasi
> #memanggil packages lmtest
> library(lmtest)
> #melakukan uji Durbin Watson
> dwtest(reg)
Durbin-Watson test
data: reg
DW = 1.7497, p-value = 0.2789
alternative hypothesis: true autocorrelation is greater than 0Dalam syntax ini, dilakukan uji Durbin-Watson pada model regresi yang telah dibentuk sebelumnya. reg merujuk pada model regresi yang telah dihasilkan menggunakan fungsi lm(). Uji Durbin-Watson digunakan untuk menguji keberadaan autokorelasi (korelasi antar residual) pada model regresi.
4 HASIL DAN PEMBAHASAN
4.1 Regresi Linier Sederhana
Berdasarkan perhitungan yang sudah dilakukan diatas didapatkan output sebagai berikut.
Call:
lm(formula = y ~ x)
Coefficients:
(Intercept) x
31.50836 0.08005
Call:
lm(formula = y ~ x)
Residuals:
Min 1Q Median 3Q Max
-71.196 -14.792 0.043 22.514 50.102
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 31.50836 20.40465 1.544 0.145
x 0.08005 0.01323 6.049 2.99e-05 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 30.73 on 14 degrees of freedom
Multiple R-squared: 0.7233, Adjusted R-squared: 0.7035
F-statistic: 36.59 on 1 and 14 DF, p-value: 2.994e-05
4.1.1 Persamaan Regresi Linier Sederhana
Pada output tersebut didapatkan \[ \ b_0 = 31.50835\ \] \[ \ b_1 = 0.08005\ \] Sehingga persamaan regresi linier yang terbentuk adalah \[ \hat{Y} = \ 31.50835 + 0.08005 X \ \] Dari persamaan regresi tersebut dapat disimpulkan :
Jika nilai variabel X (Jumlah penduduk) konstan, maka nilai variabel Y (Jumlah kemiskinan) sebesar 31.50835.
Jika nilai variabel X (Jumlah penduduk) meningkat sebesar sat satuan, maka akan meningkatkan variabel Y (Jumlah kemiskinan) sebesar 0.08005.
4.1.2 Uji Simultan
Hipotesis yang akan diuji pada uji simultan adalah sebagai berikut. \[ H_0:β_0=β_1=0 \] \[ \ H_1:minimal~ada~satu~i~dimana~ β_i≠ 0 \ \] Pada output tersebut didapatkan \[ \ F-statistic = 36.59 \ \] \[ \ P-value = 2.994e-05 \ \] Keputusan : Karena p-value(2.994e-05)<alpha(0.05), maka tolak H0
Interpretasi : Dengan taraf nyata 5% dapat disimpulkan bahwa jumlah penduduk berpengaruh terhadap jumlah kemiskinan di Jawa Timur pada tahun 2020.
4.1.3 Uji Parsial
- Untuk β_0 Hipotesis yang akan diuji pada uji parsial adalah sebagai berikut. \[ H_0:β_0=0 \] \[ \ H_1:β_0≠ 0 \ \] Pada output tersebut didapatkan \[ \ t-value = 1.544 \ \] \[ \ p-value = 0.145 \ \]
- Untuk β_1 Hipotesis yang akan diuji pada uji parsial adalah sebagai berikut. \[ H_0:β_1=0 \] \[ H_1:β_1≠0 \] Pada output tersebut didapatkan \[ \ t-value = 6.049 \ \] \[ \ p-value = 2.99e-05 \ \] keputusan : karena p-value(2.99e-05) < alpha(0.05), maka tolak H0
Interpretasi : Dengan taraf nyata 5% dapat disimpulkan bahwa jumlah penduduk berpengaruh terhadap jumlah kemiskinan di Jawa Timur pada tahun 2020.
4.1.4 Koefisien Determinasi
Pada output tersebut didapatkan \[ R^{2}=0.7035 \] Interpretasi : Nilai R-squared sebesar 70.35% menandakan bahwa keragaman jumlah kemiskinan mampu dijelaskan oleh jumlah penduduk dalam model, sedangkan sisanya 11% akan dijelaskan oleh peubah lain diluar model.
4.2 Asumsi Klasik
4.2.1 Asumsi Normalitas
Hipotesis yang akan diuji pada uji simultan adalah sebagai berikut. \[ H_0:Residual~berasal~dari~populasi~yang~berdistribusi~normal \] \[ H_1:Residual~berasal~dari~populasi~yang~tidak~berdistribusi~normal \] Berdasarkan perhitungan yang sudah dilakukan diatas didapatkan output sebagai berikut.
Shapiro-Wilk normality test
data: reg$residual
W = 0.95841, p-value = 0.633
Pada output tersebut didapatkan \[ W=0.95841 \] \[ p-value=0.633 \] keputusan : karena p-value(0.633) > alpha(0.05), maka terima H0
Interpretasi : Dengan taraf nyata 5% dapat disimpulkan bahwa residual berasal dari populasi yang berdistribusi normal dan asumsi normalitas terpenuhi.
4.2.2 Asumsi Homoskesdastisitas
Hipotesis yang akan diuji pada uji simultan adalah sebagai berikut. \[ H_0:Variasi~galat~bersifat~homoskesdastisitas \] \[ H_1:Variasi~galat~bersifat~heteroskesdastisitas \]
studentized Breusch-Pagan test
data: reg
BP = 1.513, df = 1, p-value = 0.2187
Pada output tersebut didapatkan \[ BP=1.513 \] \[ p-value=0.2187 \] keputusan : karena p-value(0.2187) > alpha(0.05), maka terima H0
Interpretasi : Dengan taraf nyata 5% dapat disimpulkan bahwa variasi galat bersifat homoskesdastisitas. Dengan kata lain asumsi kehomogenan ragam sisaan terpenuhi.
4.2.3 Asumsi Autokorelasi
Hipotesis yang akan diuji pada uji simultan adalah sebagai berikut. \[ H_0:Tidak~ada~autokorelasi~dalam~error~(kesalahan)\] \[ H_1:Terdapat~autokorelasi~dalam~error~(kesalahan)\]
Durbin-Watson test
data: reg
DW = 1.7497, p-value = 0.2789
alternative hypothesis: true autocorrelation is greater than 0
Pada output tersebut didapatkan \[ DW=1.7497 \] \[ p-value=0.2187 \] keputusan : karena p-value(0.2187) > alpha(0.05), maka terima H0
Interpretasi : Dengan taraf nyata 5% dapat disimpulkan bahwa tidak ada autokorelasi dalam error atau kesalahan sisaan dan asumsi terpenuhi.
5 KESIMPULAN
Berdasarkan hasil analisis regresi linier sederhana yang telah dilakukan, dapat disimpulkan bahwa : a. Persamaan regresi linier sederhana yang terbentuk adalah sebagai berikut. \[ \hat{Y} = \ 31.50835 + 0.08005 X \ \] Hal ini menunjukkan variabel dari Jumlah Penduduk (X) memiliki pengaruh positif terhadap variabel Jumlah Kemiskinan (Y) di Kota Palembang (b = 0.08005).
- Secara simultan dan parsial, dapat disimpulkan variabel Jumlah Penduduk (X) memiliki pengaruh terhadap Jumlah Kemiskinan (Y) di provinsi Jawa Timur pada tahun 2020.
Berdasarkan kesimpulan yang telah disampaikan mengenai hubungan antara pertumbuhan jumlah penduduk dan peningkatan kemiskinan, didapatkan saran untuk mengendalikan pertumbuhan populasi antara lain :
Mendorong program Keluarga Berencana (KB) untuk mengurangi angka kelahiran.
Menunda usia perkawinan untuk mengurangi angka kelahiran yang tinggi.
Melaksanakan kebijakan kependudukan yang bertujuan untuk mengurangi kemiskinan.
Dengan mengimplementasikan hal tersebut, diharapkan dapat mengendalikan pertumbuhan populasi dan akhirnya mengurangi jumlah kemiskinan di Jawa Timur.
6 DAFTAR PUSTAKA
Andriani 2017 Uji Park Dan Uji Breusch Pagan Godfrey dalam Pendeteksian Heteroskedastisitas pada Analisis Regresi Al-Jabar J. Pendidik. Mat.
Kurniawan, Deny. (2008). Regresi linier (lin-ear regression). Vienna, Austria: R Foundation for Statistical Computing.
Quraisy, A. (2020). Normalitas Data Menggunakan Uji Kolmogorov-Smirnov dan Saphiro-Wilk. J-HEST: Journal of Healt, Education, Economics, Science, and Technology, 3(1), 7–11.
Yuliara, I. M. (2016). Regresi linier sederhana. REGRESI LINIER SEDERHANA, 13.
Sumber data :
BPS Provinsi Jawa Timur. Penduduk dan Laju Pertumbuhan Penduduk Menurut Kabupaten/Kota di Provinsi Jawa Timur, 2020 dan 2022.https://jatim.bps.go.id/statictable/2023/04/06/2634/penduduk-dan-laju-pertumbuhan-penduduk-menurut-kabupaten-kota-di-provinsi-jawa-timur-2020-dan-2022.html
BPS. Jumlah dan Persentase Penduduk Miskin Menurut Kabupaten/Kota di Provinsi Jawa Timur, 2020.https://www.bps.go.id/indikator/indikator/view_data_pub/3500/api_pub/REdXbUdSVjIzUlJTT0Z5Vy9Rd3ZmQT09/da_04/3