Prediksi Jumlah Angka Kemiskinan Berdasarkan Nilai IPM, Tingkat Pengangguran, dan Rata-Rata Lama Sekolah di Kota Semarang

Kali ini kita akan mencari persamaan Regresi Linear Berganda (Multiple Linear Regression) dari data di kota Semarang pada tahun 2012 hingga 2019 dengan angka kemiskinan sebagai variabel dependen/target(y) dan nilai IPM, Tingkat pengangguran, Rata-rata sekolah sebagai variabel independen/prediktor(x). Silahkan menggunakan data yang sama yang disiapkan disini.

IPM menjelaskan bagaimana penduduk dapat mengakses hasil pembangunan dalam memperoleh pendapatan, kesehatan, pendidikan, dan sebagainya.

Penelitian mempunyai tujuan menganalisis pengaruh Rata-Rata Lama Sekolah, Pengangguran Terbuka dan nilai IPM terhadap Kemiskinan di Kota Semarang.

Implementasi dengan R

1. Import dataset

Dibawah ini merupakan sample data jumlah penduduk miskin, nilai IPM, tingkat pengangguran dan rata-rata lama sekolah di kota Semarang pada tahun 2012 sampai 2019

library(dplyr)
dataset = read_csv('data.csv')
dataset
  Tahun JumlahPenduduk RataRataSekolah TingkatPengangguran JumlahPendudukMiskin NilaiIPM
1  2012        1559198            9.92                6.01                83346    78.04
2  2013        1572105           10.06                6.02                86734    78.68
3  2014        1559198           10.19                7.76                84640    79.24
4  2015        1595187           10.20                5.77                84270    80.22
5  2016        1602717           10.49                6.00                83590    81.19
6  2017        1753092           10.50                6.61                80860    82.01
7  2018        1786114           10.51                5.29                73650    82.72
8  2019        1814110           10.52                4.54                71969    83.19

2. Menentukan Variabel Dependen dan Independen

> y = dataset$JumlahPendudukMiskin
> x1 = dataset$RataRataSekolah
> x2 = dataset$NilaiIPM
> x3 = dataset$TingkatPengangguran

3. Tingkat Korelasi Variabel Independen Terhadap Variabel Iependen

Nilai korelasi berada di kisaran -1 < x < 1 yang berarti bahwa nilai hasil perhitungan korelasi berada antara minus 1 dan 1. Semakin mendekati 1 atau -1 maka hubungan korelasi kedua variabel tersebut kuat. Sedangkan apabilai nilai korelasi mendekati 0 mengidikasikan lemahnya hubungan antara dua variabel tersebut.

Tanda positif dan negatif memberikan informasi mengenai arah hubungan antara variabel jka positif maka kedua variabel memiliki hubungan yang searah misalkan y mengalami peningkatan maka x juga akan mengalami peningkatan. Sedangkan jika negatif maka kedua variabel memiliki hubungan yang berlawanan contoh jika y mengalami peningkatan maka x mengalami penurunan.

y vs x1

 cor.test(y,x1)

    Pearson's product-moment correlation

data:  y and x1
t = -2.2486, df = 6, p-value = 0.06557
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 -0.93524453  0.05430623
sample estimates:
       cor 
-0.6762453

Hasil perhitungan diatas menunjukkan -0,67 atau mendekati -1, kesimpulanya korelasi variabel y dan x1 cukup kuat

y vs x2

cor.test(y,x2)

    Pearson's product-moment correlation

data:  y and x2
t = -3.7855, df = 6, p-value = 0.009122
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 -0.9702307 -0.3303041
sample estimates:
       cor 
-0.8395633

Hasil perhitungan diatas menunjukkan -0,84 atau mendekati -1, kesimpulanya korelasi variabel y dan x1 cukup kuat

y vs x3

cor.test(y,x3)

    Pearson's product-moment correlation

data:  y and x3
t = 2.268, df = 6, p-value = 0.06384
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 -0.04849206  0.93597111
sample estimates:
      cor 
0.6793966

Hasil perhitungan diatas menunjukkan 0,64 atau mendekati 1, kesimpulanya korelasi variabel y dan x1 cukup kuat

4. Regresi Linear

Langkah pertama adalah membuat definisi model dengan fungsi lm. Lm sendiri adalah singkatan Linear Model

regresi = lm(y~x1+x2+x3)

Tampilkan hasil dengan mengetikan regresi pada console

regresi

Call:
lm(formula = y ~ x1 + x2 + x3)

Coefficients:
(Intercept)           x1           x2           x3  
   251159.7      32488.3      -6241.8       -190.8

Gunakan fungsi summary untuk output yang lebih kompleks

summary(lm(y~x1+x2+x3))

Call:
lm(formula = y ~ x1 + x2 + x3)

Residuals:
      1       2       3       4       5       6       7       8 
-1840.8   995.5 -1494.6  3547.8  -455.4  1724.4 -1630.7  -846.1 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)  
(Intercept) 251159.7    54841.6   4.580   0.0102 *
x1           32488.3    18512.8   1.755   0.1541  
x2           -6241.8     2555.2  -2.443   0.0710 .
x3            -190.8     1677.4  -0.114   0.9149  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 2538 on 4 degrees of freedom
Multiple R-squared:  0.8741,    Adjusted R-squared:  0.7796 
F-statistic: 9.253 on 3 and 4 DF,  p-value: 0.02846

R akan memunculkan nilai koefisian sebesar 251159.7, x1 sebesar 32488.3, x2 sebesar -6241.8 dan x3 sebesar -190.8. Yang jika dimasukan ke dalam rumus yaitu y = 251159.7 + 32488.3 x1 + -6241.8 x2 + -190.8 x3

5. Pengujian

Langkah selanjutnya pengecekan hasil analisis Untuk melakukan prediksi di tahun yang akan datang, kita harus memiliki data x1, x2, dan x3. Karena kami belum memiliki data tersebut kita cek persamaan dengan memasukkan data di tahun sebelumnya jika hasil mendekati nilai sebenarnya maka bisa dikatakan persamaan yang terbentuk sudah cukup baik karena prediksi tidak akan selalu tepat.

sebagai contoh gunakan data tahun 2019 kemudian masukkan kedalam persamaan

y = 251159.7 + (10.52 * 32488.3) + (83.19*(-6241.8)) + (4.54*(-190.8))
y
[1] 72815.04

Berdasarkan output diatas diketahui hasil prediksi 72815.04 mendekati angka sebenarnya 71969

6. Kesimpulan

Berdasarkan penelitian tingkat kemiskinan di Kota Semarang kami menemukan beberapa faktor yang cukup mempengaruhi angka kemiskinan dengan korelasi antar variabel yang cukup kuat diantaranya yaitu rata-rata lama sekolah, nilai IPM, dan jumlah pengangguran. Kemudian didapatkan persamaan untuk prediksi di tahun mendatang yaitu y = 251159.7 + 32488.3 x1 + -6241.8 x2 + -190.8 x3.

```