Kali ini kita akan mencari persamaan Regresi Linear Berganda (Multiple Linear Regression) dari data di kota Semarang pada tahun 2012 hingga 2019 dengan angka kemiskinan sebagai variabel dependen/target(y) dan nilai IPM, Tingkat pengangguran, Rata-rata sekolah sebagai variabel independen/prediktor(x). Silahkan menggunakan data yang sama yang disiapkan disini.
IPM menjelaskan bagaimana penduduk dapat mengakses hasil pembangunan dalam memperoleh pendapatan, kesehatan, pendidikan, dan sebagainya.
Penelitian mempunyai tujuan menganalisis pengaruh Rata-Rata Lama Sekolah, Pengangguran Terbuka dan nilai IPM terhadap Kemiskinan di Kota Semarang.
Dibawah ini merupakan sample data jumlah penduduk miskin, nilai IPM, tingkat pengangguran dan rata-rata lama sekolah di kota Semarang pada tahun 2012 sampai 2019
library(dplyr)
dataset = read_csv('data.csv')
dataset
Tahun JumlahPenduduk RataRataSekolah TingkatPengangguran JumlahPendudukMiskin NilaiIPM
1 2012 1559198 9.92 6.01 83346 78.04
2 2013 1572105 10.06 6.02 86734 78.68
3 2014 1559198 10.19 7.76 84640 79.24
4 2015 1595187 10.20 5.77 84270 80.22
5 2016 1602717 10.49 6.00 83590 81.19
6 2017 1753092 10.50 6.61 80860 82.01
7 2018 1786114 10.51 5.29 73650 82.72
8 2019 1814110 10.52 4.54 71969 83.19
> y = dataset$JumlahPendudukMiskin
> x1 = dataset$RataRataSekolah
> x2 = dataset$NilaiIPM
> x3 = dataset$TingkatPengangguran
Nilai korelasi berada di kisaran -1 < x < 1 yang berarti bahwa nilai hasil perhitungan korelasi berada antara minus 1 dan 1. Semakin mendekati 1 atau -1 maka hubungan korelasi kedua variabel tersebut kuat. Sedangkan apabilai nilai korelasi mendekati 0 mengidikasikan lemahnya hubungan antara dua variabel tersebut.
Tanda positif dan negatif memberikan informasi mengenai arah hubungan antara variabel jka positif maka kedua variabel memiliki hubungan yang searah misalkan y mengalami peningkatan maka x juga akan mengalami peningkatan. Sedangkan jika negatif maka kedua variabel memiliki hubungan yang berlawanan contoh jika y mengalami peningkatan maka x mengalami penurunan.
y vs x1
cor.test(y,x1)
Pearson's product-moment correlation
data: y and x1
t = -2.2486, df = 6, p-value = 0.06557
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.93524453 0.05430623
sample estimates:
cor
-0.6762453
Hasil perhitungan diatas menunjukkan -0,67 atau mendekati -1, kesimpulanya korelasi variabel y dan x1 cukup kuat
y vs x2
cor.test(y,x2)
Pearson's product-moment correlation
data: y and x2
t = -3.7855, df = 6, p-value = 0.009122
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.9702307 -0.3303041
sample estimates:
cor
-0.8395633
Hasil perhitungan diatas menunjukkan -0,84 atau mendekati -1, kesimpulanya korelasi variabel y dan x1 cukup kuat
y vs x3
cor.test(y,x3)
Pearson's product-moment correlation
data: y and x3
t = 2.268, df = 6, p-value = 0.06384
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.04849206 0.93597111
sample estimates:
cor
0.6793966
Hasil perhitungan diatas menunjukkan 0,64 atau mendekati 1, kesimpulanya korelasi variabel y dan x1 cukup kuat
Langkah pertama adalah membuat definisi model dengan fungsi lm. Lm sendiri adalah singkatan Linear Model
regresi = lm(y~x1+x2+x3)
Tampilkan hasil dengan mengetikan regresi pada console
regresi
Call:
lm(formula = y ~ x1 + x2 + x3)
Coefficients:
(Intercept) x1 x2 x3
251159.7 32488.3 -6241.8 -190.8
Gunakan fungsi summary untuk output yang lebih kompleks
summary(lm(y~x1+x2+x3))
Call:
lm(formula = y ~ x1 + x2 + x3)
Residuals:
1 2 3 4 5 6 7 8
-1840.8 995.5 -1494.6 3547.8 -455.4 1724.4 -1630.7 -846.1
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 251159.7 54841.6 4.580 0.0102 *
x1 32488.3 18512.8 1.755 0.1541
x2 -6241.8 2555.2 -2.443 0.0710 .
x3 -190.8 1677.4 -0.114 0.9149
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 2538 on 4 degrees of freedom
Multiple R-squared: 0.8741, Adjusted R-squared: 0.7796
F-statistic: 9.253 on 3 and 4 DF, p-value: 0.02846
R akan memunculkan nilai koefisian sebesar 251159.7, x1 sebesar 32488.3, x2 sebesar -6241.8 dan x3 sebesar -190.8. Yang jika dimasukan ke dalam rumus yaitu y = 251159.7 + 32488.3 x1 + -6241.8 x2 + -190.8 x3
Langkah selanjutnya pengecekan hasil analisis Untuk melakukan prediksi di tahun yang akan datang, kita harus memiliki data x1, x2, dan x3. Karena kami belum memiliki data tersebut kita cek persamaan dengan memasukkan data di tahun sebelumnya jika hasil mendekati nilai sebenarnya maka bisa dikatakan persamaan yang terbentuk sudah cukup baik karena prediksi tidak akan selalu tepat.
sebagai contoh gunakan data tahun 2019 kemudian masukkan kedalam persamaan
y = 251159.7 + (10.52 * 32488.3) + (83.19*(-6241.8)) + (4.54*(-190.8))
y
[1] 72815.04
Berdasarkan output diatas diketahui hasil prediksi 72815.04 mendekati angka sebenarnya 71969
Berdasarkan penelitian tingkat kemiskinan di Kota Semarang kami menemukan beberapa faktor yang cukup mempengaruhi angka kemiskinan dengan korelasi antar variabel yang cukup kuat diantaranya yaitu rata-rata lama sekolah, nilai IPM, dan jumlah pengangguran. Kemudian didapatkan persamaan untuk prediksi di tahun mendatang yaitu y = 251159.7 + 32488.3 x1 + -6241.8 x2 + -190.8 x3.
```