Kemiskinan adalah masalah bagi negara-negara di dunia terutama pada negara yang sedang berkembang. Menurut Bappenas (2006), Kemiskinan adalah terbatasnya kecukupan dan mutu pangan, terbatasnya akses dan rendahnya mutu layanan kesehatan, terbatasnya akses dan rendahnya mutu layanan pendidikan, terbatasnya kesempatan kerja dan berusaha, terbatasnya akses layanan perumahan dan sanitasi, terbatasnya akses terhadap air bersih, lemahnya kepastian kepemilikan dan penguasaan tanah, memburuknya kondisi lingkungan hidup dan sumberdaya alam, lemahnya jaminan rasa aman, lemahnya partisipasi, dan besarnya beban kependudukan yang disebabkan oleh besarnya tanggungan keluarga.
Salah satu akar permasalahan kemiskinan yaitu pertumbuhan penduduk yang tinggi, di mana tingkat kelahiran penduduk masih sangat tinggi, sedangkan tingkat kematiannya juga masih tinggi namun relatif sudah jauh lebih rendah. Tingkat pertumbuhan penduduk yang tinggi seharusnya diimbangi dengan meningkatnya pula unsur-unsur perkembangan yang lain sehingga akan menaikkan pendapatan dan akan menaikkan permintaan. Namun, jika tidak, maka akan menurunkan upah para pekerja sehingga kemiskinan dapat terjadi.
Kemiskinan merupakan suatu masalah yang sangat mempengaruhi tingkat kesejahteraan bukan karena adanya pengangguran saja tetapi juga bisa di lihat dari sisi banyaknya jumlah penduduk atau bisa dikatakan suatu kuantitas tidak mengimbangi kualitas.
Statistika Deskriptif mempunyai tujuan untuk mendeskripsikan atau memberi gambaran objek yang diteliti sebagaimana adanya tanpa menarik kesimpulan atau generalisasi. Dalam statistika deskriptif ini dikemukakan cara-cara penyajian data dalam bentuk tabel maupun diagram, penentuan rata-rata (mean), modus, median, rentang serta simpangan baku.
Sedangkan statistika inferensial mempunyai tujuan untuk penarikan kesimpulan. Sebelum menarik kesimpulan dilakukan suatu dugaanyang diperoleh dari statistika deskriptif. Diantaranya pengujian hipotesis , penyimpangan asumsi klasik, berbagai motode analisis.
Pengertian regresi secara umum adalah sebuah alat statistik yang memberikan penjelasan tentang pola hubungan (model) antara dua variabel atau lebih. Hubungan yang diperoleh dinyatakan dalam persamaan matematika yang menyatakan hubungan fungsional antara variabel-variabel. Hubungan fungsional antara satu variabel prediktor dengan satu variabel respon disebut analisis regresi sederhana (tunggal), sedangkan hubungan fungsional yang lebih dari satu variabel disebut analisis regresi ganda.
Model persamaan regresi linear sederhana adalah sebagai berikut: \[ Y = b_0 + b_1 X_i + \varepsilon \] Di mana: Y = variabel respons (dependen) X = Variabel prediktor (independen) \(b_0\)= konstanta \(b_1\)= koefisien regresi atau besaran respons yang ditimbulkan oleh prediktor
Menentukan koefisien persamaan \(b_0\) dan \(b_1\) dapat dengan menggunakan MKT (Metode Kuadrat Terkecil), yaitu cara yang dipakai untuk menentukan koefisien persamaan dan dari jumlah pangkat dua (kuadrat) antara titik-titik dengan garis regresi yang dicari ysng terkecil.
Nilai-nilai a dan b dapat dihitung dengan menggunakan rumus berikut:
\[
b_0 = \overline{Y}-b_1 \overline{X}
\] \[
b_1 = \frac{n(\Sigma xy)-(\Sigma x)(\Sigma y)}{n(\Sigma x^2)-(\Sigma x)^2}
\]
Pada penelitian ini, digunakan data sekunder yaitu data yang diambil dari sumber yang telah ada. Data sekunder yang digunakan bersumber dari website resmi BPS, yaitu data Survei Sosial Ekonomi Nasional (Susenas) dan data Proyeksi Penduduk Indonesia 2010–2035, BPS Provinsi Jawa Timur
Asumsi Normalitas.
Asumsi normalitas bertujuan untuk melihat apakah nilai residu terdistribusi normal atau tidak. Model regresi yang baik adalah memiliki residu yang terdistribusi normal. Uji normalitas tidak dilakukan untuk setiap variabel, tetapi untuk nilai residual. Menguji asumsi normalitas dapat dilakukan dengan uji Shapiro Wilk dan uji Kolmogorov-Smirnov.
Asumsi Linearitas Uji linearitas bertujuan untuk mengetahui apakah dua variabel mempunyai hubungan yang linear atau tidak secara signifikan. Untuk mendeteksi asumsi linearitas dapat dilakukan dengan membentuk scatter plot.
Asumsi Homoskedastisitas Uji ini bertujuan untuk mengetahui apakah ada ketidaksamaan variasi dari nilai residual yang muncul dari satu pengamatan ke pengamatan lain. Apabila model regresinya benar, umumnya yang terjadi adalah homokedastisitas (nilai Sig. lebih besar dari 0.05). Sedangkan data dapat masuk kedalam kategori heterokedastisitas apabila menunjukkan indikasi nilai Sig (Signifikansi) lebih kecil dari 0,05. Uji statistik yang dapat digunakan adalah Uji Gletser dan Uji Park atau Uji White.
Asumsi Autokorelasi Uji autokorelasi adalah uji yang berdasarkan pada ada tidaknya korelasi atau hubungan antara periode waktu satu dengan periode waktu yang sebelumnya. Nantinya dari pengujian akan ditemukan ada tidaknya pengaruh dari satu variabel dengan variabel lainnya. Uji statistik yang dapat digunakan yaitu run test dan uji Durbin-Watson.
> # Library(rmarkdown) #untuk membuat dokumen dengan format html
> # Library(lmtest) #untuk pengujian asumsi
> # Library(readxl) #untuk mengimpor data dalam format excel
> # Library(tseries) #untuk pengujian asumsi
> # Library(car) #untuk analisis regresi
> > library(readxl)
> Data_Anreg<- read_excel("C:/Users/HP/Downloads/Data Analisis.xlsx")
> View(Data_Anreg)Source Code library(readxl) digunakan untuk mengaktifkan paket readxl. Selanjutnya dipanggil data yang akan dianalisis sesuai dengan alur penyimpanan data. Perintah view digunakan untuk menampilkan data.
> library(rmarkdown)
> paged_table(Data_Anreg)Terlebih dahulu paket rmarkdown diaktifkan dengan library(rmarkdown). Perintah paged_table digunakan untuk menampilkan data.
Dari kasus di atas, dapat diketahui bahwa:
1. Variabel respon (Y) : Jumlah Penduduk Miskin di Jawa Timur 2. Variabel prediktor (X) : Jumlah Penduduk di Jawa Timur.
> model<-lm(Data_Anreg$Y~Data_Anreg$X, data = Data_Anreg)
> ringkasan <- summary(model)
> ringkasan
Call:
lm(formula = Data_Anreg$Y ~ Data_Anreg$X, data = Data_Anreg)
Residuals:
Min 1Q Median 3Q Max
-332.99 -119.03 23.32 52.49 333.93
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.923e+04 3.239e+03 5.936 0.000348 ***
Data_Anreg$X -3.723e-04 8.304e-05 -4.484 0.002045 **
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 208.9 on 8 degrees of freedom
Multiple R-squared: 0.7154, Adjusted R-squared: 0.6798
F-statistic: 20.11 on 1 and 8 DF, p-value: 0.002045Dari data diatas diperoleh model persamaan regresi \(Y = 19230 - 3.723e-04 X_1\)
Sebelum melakukan interpretasi model, terlebih dahulu kita harus memeriksa apakah asumsi klasik sudah terpenuhi
Source code lm digunakan untuk membentuk model regresi dengan variabel X dan Y yang diambil dari Data_Anreg yang telh dibangkitkan sebelumnya.
> par(mfrow = c(2,2))
> plot(model)Pada plot pertama merupakan plot Residuals vs Fitted yang digunakan untuk melihat ketepatan model. Pada plot tersebut garis berbentuk garis lurus atau linier.
Pada plot kedua merupakan plot normal Q-Q yang digunakan untuk melihat normalitas. Pada plot tersebut tidak terlihat adanya pelanggaran normalitas.
Pada plot ketiga merupakan plot scale-location yang digunakan untuk melihat kesamaan ragam. Pada plot tersebut dapat dilihat bahwa garis pada plot tidak mendatar sehingga dapat disimpulkan bahwa terdapat masalah heteroskedastisitas.
Plot keempat merupakan plot Residuals vs Leverage yang dibakukan. Pada plot tersebut terlihat bahwa terdapat titik warning pada titik ke 4 dan 5.
Source code par() digunakan untuk membagi tampilan plot menjadi (2,2) atau 2X2. Perintah plot() digunakan untuk mengetahui asumsi pada residual.
> scatter.smooth(x=Data_Anreg$X, y=Data_Anreg$y, xlab= "Jumlah Penduduk(X)", ylab="Jumlah Penduduk Miskin(Y)", main="Jumlah Penduduk dan Jumlah Penduduk Miskin di Jawa Timur") Plot antara variabel X dan Variabel Y berbentuk linear tidak menunjukkan adanya kejanggalan. Dengan demikian, maka asumsi linearitas telah terpenuhi.
> residual<-residuals(model)
> library(tseries)
> jarque.bera.test(residual)
Jarque Bera Test
data: residual
X-squared = 0.12865, df = 2, p-value = 0.9377
> shapiro.test(residual)
Shapiro-Wilk normality test
data: residual
W = 0.96592, p-value = 0.8507Berdasarkan hasil uji normalitas Jarque Bera dan Shapiro Wilk di atas, kedua p-value lebih besar dari \(\alpha\) (0.05) sehingga Terima \(H_0\). Dari hasil yang diperoleh dapat disimpulkan bahwa asumsi normalitas telah terpenuhi yaitu nilai residual menyebar secara normal.
> library(lmtest)
> bptest(model)
studentized Breusch-Pagan test
data: model
BP = 3.1431, df = 1, p-value = 0.07625Berdasarkan uji Breusch-Pagan di atas, diperoleh p-value = 0.07625 (p-value > \(\alpha\) = 0.05) maka Terima \(H_0\). Dari hasil yang diperoleh, dapat disimpulkan bahwa asumsi homoskedastistas telah terpenuhi yaitu tidak adanya ketidaksamaan variasi dari nilai residual yang muncul dari satu pengamatan ke pengamatan lain.
> library(lmtest)
> dwtest(model)
Durbin-Watson test
data: model
DW = 1.7151, p-value = 0.188
alternative hypothesis: true autocorrelation is greater than 0Berdasarkan uji Durbin-Watson di atas, diperoleh p-value = 0.188 (p-value > \(\alpha\) = 0.05) maka Terima \(H_0\). Dari hasil yang diperoleh, dapat disimpulkan bahwa asumsi non-autokorelasi telah terpenuhi yaitu tidak ada pengaruh antara variabel satu dengan variabel lainnya.
> Anova <- aov(Data_Anreg$Y~Data_Anreg$X, data=Data_Anreg)
> summary(Anova)
Df Sum Sq Mean Sq F value Pr(>F)
Data_Anreg$X 1 877275 877275 20.11 0.00205 **
Residuals 8 349077 43635
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1Berdasarkan hasil uji asumsi klasik, model telah memenuhi semua asumsi yakni linearitas, normalitas, homoskedastisitas, dan non-autokorelasi. Sehingga model yang diperoleh yaitu, \(Y = 19230 - 3.723e-04 X_1\) dapat diinterpretasikan, bahwa ketika jumlah penduduk turun sebesar 1 maka akan menurunkan sebanyak 3.723e-04 jumlah penduduk yang mengalami kemiskinan di Jawa Timur.
Suhandi, N. Putri Kartika. Agnisa, S. (2018). Analisis Pengaruh Jumlah Penduduk terhadap Jumlah Kemiskinan Menggunakan Metode Regresi Linear di Kota Palembang. JURNAL ILMIAH INFORMATIKA GLOBAL Volume 09 No. 2 Desember 2018. http://ejournal.uigm.ac.id/index.php/IG/article/view/543.
Yitnosumarto, S. (1990). Dasar-dasar Statistika. Jakarta: CV. Rajawali.
Astuti, A. B., Efendi, A., Astutik, S., & Sumarminingsih, E. (2020). Analisis Data Kategorik Menggunakan R: Teori dan Aplikasinya pada Berbagai Bidang. Malang: Universitas Brawijaya Press.
```