ANALISIS REGRESI DAN UJI ASUMSI DATA PENGARUH ANGKA MELEK HURUF, LAJU PERTUMBUHAN PENDUDUK, DAN RATA-RATA LAMA SEKOLAH TERHADAP PRESENTASE PENDUDUK MISKIN DI INDONESIA MENGGUNAKAN R-STUDIO

Sahira Ayunani

31 Mei 2023


1 PENDAHULUAN

1.1 Latar Belakang

Penelitian ini bertujuan untuk menganalisis pengaruh angka melek huruf, laju pertumbuhan penduduk, dan rata-rata lama sekolah terhadap presentase penduduk miskin di Indonesia. Presentase penduduk miskin menjadi indikator penting dalam mengukur tingkat kemiskinan suatu negara, sedangkan angka melek huruf, laju pertumbuhan penduduk, dan rata-rata lama sekolah merupakan faktor-faktor yang dapat berpotensi mempengaruhi tingkat kemiskinan.

Angka melek huruf adalah persentase penduduk yang memiliki keterampilan membaca dan menulis. Laju pertumbuhan penduduk mengacu pada perubahan jumlah penduduk dari waktu ke waktu, yang dapat mempengaruhi alokasi sumber daya dan pembangunan ekonomi. Rata-rata lama sekolah merupakan indikator dari tingkat pendidikan suatu negara, yang berhubungan erat dengan kualitas sumber daya manusia dan kesempatan ekonomi.

Metode yang digunakan dalam penelitian ini adalah analisis regresi, yang dapat menguji hubungan antara variabel dependen (presentase penduduk miskin) dengan variabel independen (angka melek huruf, laju pertumbuhan penduduk, dan rata-rata lama sekolah). Analisis regresi dapat memberikan pemahaman tentang sejauh mana variabel independen tersebut berpengaruh terhadap variabel dependen.

Selain itu, penelitian ini juga akan melakukan uji asumsi untuk memastikan kecocokan data dengan model regresi. Salah satu uji asumsi yang dapat dilakukan adalah uji asumsi normalitas data menggunakan uji Shapiro-Wilk. Uji ini digunakan untuk menguji apakah data mengikuti distribusi normal atau tidak. Untuk melakukan analisis regresi dan uji asumsi, penelitian ini menggunakan R-Studio. R-Studio menyediakan berbagai fungsi dan paket statistik yang dapat digunakan untuk analisis regresi, uji asumsi, dan visualisasi data. Dengan melakukan penelitian ini, diharapkan dapat memberikan pemahaman lebih lanjut tentang faktor-faktor yang berpengaruh terhadap tingkat kemiskinan di Indonesia dan memberikan rekomendasi kebijakan yang dapat mengurangi tingkat kemiskinan tersebut.

2 TINJAUAN PUSTAKA

2.1 Analisis Regresi

Regresi linier adalah suatu metode yang digunakan untuk membentuk model hubungan antara variabel terikat atau respon (Y) dengan satu atau lebih variabel bebas atau prediktor (X).. Umumnya analisis regresi digunakan untuk mengidentifikasi seberapa berpengaruh variabel bebas dapat mempengaruhi perubahan terhadap variabel terikatnya atau simpelnya untuk mengetahui ada tidaknya pengaruh yang signifikan antara satu atau lebih variabel bebas terhadap variabel terikatnya baik secara simultan atau parsial (Sunyoto:2011). Biasanya variabel bebas dilambangkan dalam X dan variabel terikat adalah Y. Regresi linier dikategorikan berdasarkan banyaknya variabel bebas atau prediktor apabila hanya terdapat 1 variabel bebas atau prediktor maka disebut sebagai regresi linier sederhana sedangkan jika terdapat dua atau lebih variabel bebas atau prediktor disebut sebagai regresi linier berganda. Dalam model regresi nantinya akan ditemui beberapa koefisien yang merupakan nilai penduga parameter di dalam model regresi untuk menggambarkan kondisi yang sebenarnya atau dapat dikatakan koefisien dari model regresi merupakan nilai rata-rata yang memiliki peluang untuk terjadi. \[ \\Y=\alpha + \beta X \] Koefisien pada model regresi linier adalah sebagai berikut:

  1. Intersep : Definisi secara statistika adalah nilai rata-rata pada variabel Y apabila nilai pada variabel X bernilai 0. Dengan kata lain, apabila X tidak memberikan kontribusi, maka secara rata-rata, variabel Y akan bernilai sebesar intersep.

  2. Slope : Dalam konsep statistika, slope merupakan suatu nilai yang menunjukkan seberapa besar kontribusi (sumbangan) yang diberikan suatu variabel X terhadap variabel Y. Nilai slope dapat pula diartikan sebagai rata-rata pertambahan (atau pengurangan) yang terjadi pada variabel Y untuk setiap peningkatan satu satuan variabel X.

Berikut adalah contoh model regresi:

Y = 7.2 + 0.8 X

Angka 7.2 merupakan intersep, 0.8 merupakan slope. Di dalam konsep regresi linier, residual adalah semua hal yang mungkin mempengaruhi variabel terikat Y, yang tidak diamati oleh peneliti.

2.2 Uji Asumsi Klasik

Parameter regresi diduga melalui teknik perhitungan yang disebut Ordinary Least Square (OLS). Dengan menggunakan OLS kesalah-kesalahan dalam menduga adalah kesalahan yang paling minimum dengan syarat memenuhi beberapa asumsi yang disebut asumsi klasik regresi linier. Secara manual, dalam melakukan uji asumsi klasik regresi linier, kita harus terlebih dahulu mendapatkan data residual.

Asumsi klasik regresi linier:

  1. Uji kenormalan galat Statistik uji yang paling sering digunakan untuk menguji asumsi kenormalan residual dengan menggunakan data residual adalah Kolmogorov-Smirnov normality test. Kolmogorov-Smirnov test bekerja dengan cara membandingkan 2 buah distribusi/sebaran data.

Hipotesis dalam uji normalitas adalah:

H0 : Data menyebar normal

H1 : Data tidak menyebar normal

  1. Uji homoskedastisitas Maksud dari ragam bersifat homogen adalah bahwa residual memiliki nilai ragam yang sama antara residual ke-i dan residual ke-j. Apabila kita temukan bahwa residual memiliki ragam yang homogen, maka kita dapat mengatakan bahwa error juga memiliki ragam yang homogen. Statistik uji yang sering digunakan adalah Breusch-Pagan test.

Hipotesis yang berlaku dalam uji homoskedastisitas ragam residual adalah:

H0 : Ragam residual bersifat homoskedastik

H1 : Ragam residual bersifat heteroskedastik

  1. Uji Non-Autokorelasi Adanya autokorelasi pada residual mengindikasikan bahwa ada satu atau beberapa faktor (variabel) penting yang mempengaruhi variabel terikat Y yang tidak dimasukkan ke dalam model regresi.Statistik uji yang sering dipakai adalah Durbin-Watson statistics (DW-statistics).

Hipotesis untuk uji asumsi autokorelasi yang sering dipakai adalah:

H0 :=0

H1 :≠0

  1. Uji Non-Multikolinieritas Hanya tepat untuk model linier berganda. Multikolinieritas berarti bahwa terjadi korelasi linier yang erat antar variabel bebas. Statistik uji yang tepat adalah dengan Variance Inflation Factor (VIF). Nilai VIF yang lebih besar dari 10 mengindikasikan adanya multikolinieritas yang serius. Apabila asumsi-asumsi di atas terpenuhi, maka model regresi linier yang diperoleh bersifat BLUE (Best Linear Unbiased Estimator).

2.3 Uji Asumsi

Dalam analisis regresi, terdapat beberapa asumsi penting yang harus diperiksa sebelum dapat mengandalkan hasil dan interpretasi model regresi. Uji asumsi ini penting untuk memastikan bahwa asumsi yang mendasari analisis regresi terpenuhi. Uji asumsi klasik terdiri dari: uji normalitas, uji homogenitas, uji multikolinearitas, uji linieritas, dan uji heteroskedastisitas. Selain uji-uji tersebut masih terdapat beberapa uji yang tentunya memiliki kegunaan yang berbeda-beda sesuai dengan tujuan yang diinginkan.

3 SOURCE CODE

3.1 Library

> library(knitr)
> library(rmarkdown)
> library(prettydoc)
> library(readxl)
> library(lmtest)
> library(car)

3.2 Data

> library(readxl)
> data <- read_xlsx("C:/Users/dyah/Downloads/DATA1.xlsx")
> data
# A tibble: 34 × 4
   Lama_Sekolah Persentase_Penduduk_M…¹ Angka_Melek_Huruf Laju_Pertumbuhan_Pen…²
          <dbl>                   <dbl>             <dbl>                  <dbl>
 1         9.37                   14.1              100.                    1.49
 2         9.58                    9                 99.9                   1.23
 3         9.07                    6.61              99.9                   1.10
 4         9.19                    7.02              99.9                   2.08
 5         8.6                     8.97              99.9                   1.39
 6         8.3                    12.7              100.                    1.32
 7         8.87                   15.2               99.9                   1.48
 8         8.08                   11.7               99.9                   1.10
 9         8.08                    5.1               99.8                   1.60
10        10.2                     8.41              99.9                   3.48
# ℹ 24 more rows
# ℹ abbreviated names: ¹​Persentase_Penduduk_Miskin, ²​Laju_Pertumbuhan_Penduduk

Variabel terikat atau respon:

Y : persentase penduduk miskin

Variabel bebas atau prediktor:

X1 : angka melek huruf

x2 : laju pertumbuhan penduduk

x3 : rata-rata lama sekolah

3.3 Analisis Regresi

> reg <- lm(Persentase_Penduduk_Miskin ~ 
+           Angka_Melek_Huruf + Laju_Pertumbuhan_Penduduk + Lama_Sekolah, 
+           data=data) 
> summary(reg)

Call:
lm(formula = Persentase_Penduduk_Miskin ~ Angka_Melek_Huruf + 
    Laju_Pertumbuhan_Penduduk + Lama_Sekolah, data = data)

Residuals:
    Min      1Q  Median      3Q     Max 
-5.8711 -2.5813 -0.6325  2.1993  8.4958 

Coefficients:
                          Estimate Std. Error t value Pr(>|t|)  
(Intercept)               114.8627    46.5771   2.466   0.0196 *
Angka_Melek_Huruf          -0.9436     0.4902  -1.925   0.0637 .
Laju_Pertumbuhan_Penduduk   0.4631     1.2195   0.380   0.7068  
Lama_Sekolah               -1.2893     0.7942  -1.623   0.1150  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.863 on 30 degrees of freedom
Multiple R-squared:  0.2672,    Adjusted R-squared:  0.194 
F-statistic: 3.647 on 3 and 30 DF,  p-value: 0.02357

3.4 Uji Asumsi Normalitas

> library(tseries)
> sisa <- residuals(reg)
> jarque.bera.test(sisa)

    Jarque Bera Test

data:  sisa
X-squared = 1.264, df = 2, p-value = 0.5315
> shapiro.test(sisa)

    Shapiro-Wilk normality test

data:  sisa
W = 0.96721, p-value = 0.3889

3.5 Uji Asumsi Homoskedastisitas

> bptest(reg)

    studentized Breusch-Pagan test

data:  reg
BP = 1.1488, df = 3, p-value = 0.7653

3.6 Uji Asumsi Non-autokorelasi

> dwtest(reg)

    Durbin-Watson test

data:  reg
DW = 1.8713, p-value = 0.3283
alternative hypothesis: true autocorrelation is greater than 0

3.7 Uji Asumsi Non-multikolinieritas

> vif(reg)
        Angka_Melek_Huruf Laju_Pertumbuhan_Penduduk              Lama_Sekolah 
                 1.206485                  1.005334                  1.202125 

4 HASIL DAN PEMBAHASAN

4.1 Analisis Regresi

Berdasarkan Data yang digunakan, diperoleh hasil model regresi linier sebagai berikut: \[ \\Y=114.8427-0.9436X_1+0.4631X_2-1.2893X_3 \] Apabila angka melek huruf (X1), laju pertumbuhan penduduk (X2), dan rata-rata lama sekolah (X3) bernilai 0, maka Presentase jumlah penduduk miskin sebesar 114.8427. Dengan asumsi angka melek huruf (X1), laju pertumbuhan penduduk (X2), dan rata-rata lama sekolah (X3) adalah bernilai tetap maka setiap peningkatan satu persen angka melek huruf akan menurunkan presentase jumlah penduduk miskin sebesar 0.9436, setiap peningkatan satu persen laju pertumbuhan penduduk akan meningkatkan presentase jumlah penduduk miskin sebesar 0.4631, dan setiap peningkatam satu tahun rata-rata lama sekolah akan menurunkan presentase jumlah penduduk miskin sebesar 1.2893.

4.2 Uji Asumsi Normalitas

Berdasarkan uji normalitas Jarque-Bera didapatkan p-value(0.5315) yang mana lebih besar dari nilai alpha 0.05, sehingga berdasarkan uji normalitas jarque bera data berdistribusi normal.

Menggunakan uji normalitas Shapiro-Wilk didapatkan p-value(0.3889) yang mana lebih besar dari nilai alpha 0.05, sehingga berdasarkan uji normalitas jarque bera data berdistribusi normal.

4.3 Uji Asumsi Homoskedastisitas

Berdasarkan hasil uji homoskedastisitas menggunakan uji studentized Breusch-Pagandidapatkan nilai p sebesar 0.7653 (p>0.05), sehingga dapat disimpulkan bahwa tidak terjadi heteroskedastisitas atau residual memiliki ragam homogen.

4.4 Uji Asumsi Non-autokorelasi

Berdasarkan hasil pengujian autokrelasi menggunakan uji Durbin-Watson didapatkan nilainnya adalah sebesar 1.8713 yang mana berada dantara nilai 1.5776 dan 2.4224 maka tidak terjadi autokorelasi pada model regresi ini.

5 KESIMPULAN

Berdasarkan beberapa uji yang sudah dilakukan data yang digunakan dapat dilakukan analisis regresi (data sesuai) dan data yang digunakan telah memnuhi uji asumsi yang ada. Variabel angka melek huruf dan rata-rata lama sekolah memberikan pengeruh penurunan kepada variabel persentase penduduk miskin. Sedangkan variabel tingkat pertumbuhann penduduk memberikan pengaruh penurunan kepada variabel persentase penduduk miskin.

6 DAFTAR PUSTAKA

Kurniawan, R., 2016. Analisis regresi. Prenada Media.

Kurniawan, D., 2008. Regresi linier.

https://www.bps.go.id/indicator/23/192/1/persentase-penduduk-miskin-menurut-provinsi.html

https://www.bps.go.id/indicator/26/4/1/angka-melek-huruf.html

https://www.bps.go.id/dynamictable/2020/02/18/1773/rata-rata-lama-sekolah-menurut-provinsi-metode-baru-2010-2019.html#:~:text=Rata-Rata%20Lama%20Sekolah%20Menurut%20Provinsi%20%5BMetode%20Baru%5D%2C%202010-2019,3842508%2C%203810291%2C%20Faks%20%2862-21%29%203857046%2C%20Mailbox%20%3A%20bpshq%40bps.go.id

https://www.bps.go.id/indicator/12/1976/1/laju-pertumbuhan-penduduk.html