1 PENDAHULUAN

1.1 Latar Belakang

Analisis regresi linier adalah metode statistika yang digunakan untuk mempelajari dan mengukur hubungan sebab akibat antara satu variabel respons dengan satu atau lebih variabel prediktor yang bentuk fungsinya linier. Analisis regresi linier yang memiliki satu variabel prediktor disebut dengan analisis regresi linier sederhana, sedangkan analisis regresi yang memiliki lebih dari satu variabel prediktor disebut dengan analisis regresi linier berganda.

Metode statistika kini sudah umum digunakan di berbagai bidang penelitian, salah satunya di bidang sosial ekonomi. Indonesia sebagai negara berkembang tidak lepas dari permasalahan kemiskinan. Kemiskinan tidak hanya menjadi perhatian negara, tetapi juga bagi tiap daerah di Indonesia. Kemiskinan diartikan sebagai ketidakmampuan ekonomi untuk memenuhi kebutuhan dasar makanan dan bukan makanan yang diukur dari pengeluaran. Untuk mengukur kemiskinan, BPS menggunakan menggunakan konsep kemampuan memenuhi kebutuhan dasar (basic needs approach).

Menurut World Bank , salah satu sebab kemiskinan adalah karena kurangnya pendapatan dan aset (lack of income and assets) untuk memenuhi kebutuhan dasar seperti makanan, pakaian, perumahan dan tingkat kesehatan dan pendidikan yang dapat diterima (acceptable). Di samping itu kemiskinan juga berkaitan dengan keterbatasan lapangan pekerjaan dan biasanya mereka yang dikategorikan miskin (the poor) tidak memiliki pekerjaan (pengangguran), serta tingkat pendidikan dan kesehatan mereka pada umumnya tidak memadai.

Oleh karena itu, pada tulisan ini akan dibahas mengenai analisis regresi linier berganda untuk mengetahui besarnya pengaruh distribusi PDRB ADHK (Atas Dasar Harga Konstan), Indeks Pembangunan Manusia (IPM), dan tingkat pengagguran terbuka terhadap persentase kemiskinan Provinsi Papua tahun 2020.

1.2 Statistika Deskriptif

Statistika deskriptif merupakan metode-metode terkait dengan pengumpulan dan penyajian suatu gugus data sehingga memberikan informasi yang berguna (Walpole, 2015). Pemakaian statistika deskriptif sangat terbatas, tidak digunakan untuk membuat kesimpulan yang melibatkan analisis, tetapi hanya sekadar menyederhanakan dan menata data untuk memperoleh gambaran secara keseluruhan dari peubah atau karakteristik yang diamati (Yitnosumarto, 1990).

Statistika deskriptif bersifat eksplorasi, yaitu mendeskripsikan data dengan menggunakan tabel, grafik, dan gambar untuk memunculkan informasi-informasi umum mengenai karakteristik variabel pengamatan, biasanya terfokus pada ukuran pemusatan dan ukuran penyebaran data (Widodo dan Andawaningtyas, 2017).

1.3 Analisis Regresi Linier Berganda

Analisis regresi linier berganda digunakan untuk mengetahui besarnya pengaruh dari suatu variabel prediktor terhadap variabel respons. Analisis regresi adalah studi ketergantungan dari variabel respons pada satu atau lebih variabel prediktor, dengan tujuan untuk mengestimasi dan/atau memprediksi rata-rata populasi dan nilai rata-rata variabel respons berdasarkan nilai variabel prediktor yang diketahui (Gujarati, 2010). Selain mengukur kekuatan hubungan antara dua variabel atau lebih, juga menunjukkan arah hubungan antara variabel respons dengan variabel prediktor. Model regresi linier berganda dapat ditulis sebagai berikut: \[ Y=\beta_{0}+\beta_{1} X_1+...+\beta_{k} X_k+e \]

1.4 Asumsi dalam Analisis Regresi

Asumsi-asumsi dalam analisis regresi antara lain yaitu:
1. Asumsi kenormalan galat, model regresi yang baik adalah yang mempunyai distribusi normal atau mendekati normal.
2. Asumsi nonmultikolinieritas, multikolinearitas berarti adanya hubungan liniar (korelasi) yang sempurna atau pasti, diantara beberapa atau semua variabel yang menjelaskan dari model regresi, dalam regresi tidak diperbolehkan adanya multikolinieritas.
3. Asumsi nonautokorelasi, autokorelasi adalah keadaan dimana galat pada periode tertentu berkorelasi dengan galat pada periode lain, dengan kata lain galat tidak acak, autokorelasi tidak diperbolehkan dalam regresi.
4. Asumsi homoskedastisitas, heteroskedastisitas terjadi apabila galat tidak mempunyai varian yang sama untuk semua observasi, heteroskedastisitas tidak diperbolehkan dalam regresi.

1.5 Uji Signifikansi Model

Suatu model regresi dikatakan model yang baik atau tidak, dapat dilihat melalui beberapa indikator, yaitu uji hipotesis bagi parameter dalam model regresi dan koefisien determinasi (R2). Tujuan pengujian hipotesis tersebut bertujuan untuk mengetahui secara simultan ataupun parsial pengaruh peubah prediktor terhadap peubah respons, serta untuk mengetahui proporsi peubah prediktor dalam menjelaskan perubahan peubah respons (Nachrowi dan Hardius, 2006).

  1. Uji simultan dilakukan menggunakan uji F untuk menguji koefisien regresi secara bersamaan. Uji statistik F digunakan untuk menentukan apakah semua peubah prediktor dalam model mempunyai pengaruh secara bersama-sama terhadap peubah respons (Kuncoro, 2011). Hipotesis untuk uji simultan adalah sebagai berikut. \[H_{0}:\beta_{1}=\beta_{2}=...=\beta_{j}=0\] \[H_{1}: \beta_{j}≠0 ; j=1,2,...,k\] Kriteria uji, apabila pvalue lebih kecil dari alfa maka H0 ditolak, artinya hubungan antara semua variabel prediktor dan variabel respons berpengaruh signifikan.

  2. Uji parsial dilakukan menggunakan uji t untuk mengetahui pengaruh setiap peubah prediktor terhadap peubah respons secara individu. Hipotesis untuk uji parsial adalah sebagai berikut: \[H_{0}:\beta_{j}=0\] \[H_{1}: \beta_{j}≠0 ; j=0,1,2,...,k\]

Kriteria uji, apabila pvalue lebih kecil dari alfa maka H0 ditolak, artinya hubungan antara semua variabel prediktor dan variabel respons berpengaruh signifikan.

  1. Kebaikan model regresi dapat dilihat pada koefisien determinasi. Koefisien determinasi (R2) adalah ukuran yang digunakan dalam mengukur goodness of fit dari garis regresi. Nilai (R2) dapat mengukur seberapa dekatkah garis regresi yang terestimasi dengan data sesungguhnya (Nachrowi dan Hardius, 2006). Koefisien determinasi juga digunakan untuk mengukur besarnya kontribusi X terhadap Y. Nilai R2 merefleksikan seberapa besar keragaman peubah respons dapat diterangkan oleh peubah prediktor. Nilai R2 berkisar antara nol sampai 1. Jika nilai R2=0, berarti keragaman peubah respons sama sekali tidak dapat diterangkan oleh peubah prediktor. Sedangkan nilai R2=1, berarti bahwa keragaman peubah respons secara keseluruhan dapat diterangkan oleh peubah prediktor (Kuncoro, 2011). Semakin besar nilai R^2, maka ketepatan model dalam menerangkan keragaman data akan semakin besar, dalam kata lain bahwa model semakin baik (Kutner, dkk, 2004).

1.6 Data

Data yang digunakan pada analisis ini merupakan data sekunder. Data diperoleh melalui website resmi Badan Pusat Statistik (BPS) Provinsi Papua. Data yang digunakan terdiri atas satu variabel respons (Y) dan tiga variabel prediktor (X). Variabel-variabel tersebut yaitu persentase kemiskinan (Y), distribusi PDRB Atas Dasar Harga Konstan (ADHK) sebagai X1, IPM sebagai X2, dan tingkat pengangguran terbuka sebagai X3.
Data dapat diunduh melalui tautan berikut https://bit.ly/data_ARLB

2 SOURCE CODE

2.1 Library yang Dibutuhkan

Library yang dibutuhkan yaitu readxl (untuk memanggil fungsi read_excel yang digunakan untuk memasukkan file excel), corrplot (untuk membentuk matriks korelasi),olsrr (untuk memanggil fungsi ols_vif_tol yang digunakan untuk pendeteksian multikolinieritas), dan lmtest (untuk memanggil fungsi yang digunakan untuk pendeteksian autokorelasi dan heteroskedastisitas).

> library(readxl)
> library(olsrr)
> library(lmtest)
> library(corrplot)

2.2 Impor Data

Memasukkan data berupa file excel dengan fungsi read_excel. Argumen file.choose() digunakan untuk memilih file dari penyimpanan komputer. Ketika dieksekusi akan terbuka jendela baru yang mengarahkan pada penyimpanan komputer.

> data=read_excel(file.choose())
> data
# A tibble: 29 x 4
      X1    X2    X3     Y
   <dbl> <dbl> <dbl> <dbl>
 1  7.33  70.1  3.43  10.0
 2  3.26  58.0  2.51  37.2
 3  6.82  71.7 10.3   12.4
 4  5.28  68.8  6.65  24.2
 5  1.98  67.7  5.3   26.3
 6  2.34  72.2 10.4   24.6
 7  2.17  56.3  0.83  36.7
 8  0.7   48.4  1.5   34.7
 9 36.5   74.2  7.8   14.3
10  2.29  61.5  8.09  19.4
# ... with 19 more rows

2.3 Ringkasan Data

Fungsi summary menampilkan statistik deskriptif data antara lain nilai minimum, nilai maksimum, median, rata-rata, dan kuartil.

> summary(data)
       X1               X2              X3               Y        
 Min.   : 0.540   Min.   :31.55   Min.   : 0.210   Min.   :10.03  
 1st Qu.: 0.640   1st Qu.:48.37   1st Qu.: 0.930   1st Qu.:24.15  
 Median : 1.090   Median :56.31   Median : 2.560   Median :29.54  
 Mean   : 3.448   Mean   :57.29   Mean   : 3.806   Mean   :28.21  
 3rd Qu.: 2.290   3rd Qu.:66.40   3rd Qu.: 5.300   3rd Qu.:36.72  
 Max.   :36.470   Max.   :79.94   Max.   :11.620   Max.   :41.76  

2.4 Matriks Korelasi

Fungsi corrplot digunakan untuk memvisualisasikan matriks korelasi. Argumen yang digunakan adalah matriks berisi nilai korelasi. Argumen method dan type adalah argumen tambahan yang digunakan untuk memilih bentuk visualisasinya.

> corrplot(cor(data),method="number",type="full")

## Pembentukan Model Regresi Pembentukan model regresi dilakukan menggunakan fungsi lm() dengan argumen di dalamnya yaitu persamaan regresi yang akan dibentuk dan data yang digunakan untuk analisis. Hasil analisis regresi disimpan dalam objek bernama reg, ketika objek tersebut dipanggil akan menampilkan koefisien model regresi.

> reg<-lm(Y~X1+X2+X3,data=data)
> reg

Call:
lm(formula = Y ~ X1 + X2 + X3, data = data)

Coefficients:
(Intercept)           X1           X2           X3  
    56.8941      -0.1701      -0.4472      -0.6501  

2.5 Uji Shapiro Wilk

Fungsi shapiro.test() digunakan untuk mendeteksi kenormalan. Pada pengujian ini, objek yang diuji adalah residual regresi.

> shapiro.test(reg$residuals)

    Shapiro-Wilk normality test

data:  reg$residuals
W = 0.97834, p-value = 0.7945

2.6 Nilai VIF

Perintah ols_vif_tol() digunakan untuk menampilkan nilai toleransi dan indikator VIF.

> ols_vif_tol(reg)
  Variables Tolerance      VIF
1        X1 0.6860028 1.457720
2        X2 0.3404580 2.937220
3        X3 0.3652023 2.738208

2.7 Uji Durbin Watson

Fungsi dw.test() digunakan untuk mendeteksi autokorelasi. Objek yang diuji adalah reg, yang menyimpan model regresi.

> dwtest(reg)

    Durbin-Watson test

data:  reg
DW = 1.8217, p-value = 0.2659
alternative hypothesis: true autocorrelation is greater than 0

2.8 Uji Breusch Pagan

Fungsi bp.test() digunakan untuk mendeteksi heteroskedastisitas. Objek yang diuji adalah reg, yang menyimpan model regresi.

> bptest(reg)

    studentized Breusch-Pagan test

data:  reg
BP = 7.6126, df = 3, p-value = 0.05473

2.9 Hasil Analisis Regresi

Perintah summary(reg) digunakan untuk menampilkan hasil analisis regresi secara lengkap.

> summary(reg)

Call:
lm(formula = Y ~ X1 + X2 + X3, data = data)

Residuals:
     Min       1Q   Median       3Q      Max 
-12.0424  -3.5755   0.3117   4.9608  10.6491 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)  56.8941     8.6169   6.603 6.44e-07 ***
X1           -0.1701     0.1997  -0.852   0.4024    
X2           -0.4472     0.1788  -2.502   0.0193 *  
X3           -0.6501     0.5928  -1.096   0.2833    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 6.229 on 25 degrees of freedom
Multiple R-squared:  0.6257,    Adjusted R-squared:  0.5808 
F-statistic: 13.93 on 3 and 25 DF,  p-value: 1.537e-05

3 HASIL DAN PEMBAHASAN

3.1 Statistika Deskriptif

Berdasarkan ringkasan data, dapat diketahui hasil sebagai berikut:
1. Persentase kemiskinan Provinsi Papua tahun 2020 (Y) memiliki rata-rata sebesar 28.21%, dengan persentase terendah sebesar 10.03% dan persentase tertinggi sebesar 41.76%.
2. Distribusi PDRB ADHK Provinsi Papua tahun 2020 (X1) memiliki rata-rata sebesar 3.448%, dengan distribusi terendah sebesar 0.54% dan distribusi tertinggi sebesar 36.47%
3. IPM wilayah kabupaten/kota di Provinsi Papua tahun 2020 (X2) memiliki rata-rata sebesar 57.29, dengan IPM terendah sebesar 31.55 dan IPM tertinggi sebesar 79.94.
4. Tingkat pengangguran terbuka Provinsi Papua tahun 2020 (X3) memiliki rata-rata sebesar 3.806%, dengan pengangguran terendah sebesar 0.21% dan pengangguran tertinggi sebesar 11.62%.

3.2 Korelasi

Berdasarkan plot matriks korelasi, diketahui ada tiga pasang variabel yang memiliki hubungan yang kuat. Variabel IPM (X2) dengan tingkat pengangguran terbuka (X3) memiliki hubungan positif yang kuat, yaitu sebesar 0.79. Variabel IPM (X2) dengan variabel persentase kemiskinan (Y) memiliki hubungan negatif yang kuat, yaitu sebesar 0.77. Variabel tingkat pengangguran terbuka (X3) dengan variabel persentase kemiskinan (Y) memiliki hubungan negatif yang kuat, yaitu sebesar 0.7.

3.3 Model Regresi Linier Berganda

Berdasarkan hasil pembentukan model regresi, diperoleh penduga parameter model regresi yaitu \[\beta_{0}=56.8941, \beta_{1}=-0.1701, \beta_{2}=-0.4472, \beta_{3}=-0.6501 \] Sehingga dapat dituliskan model penduga regresi sebagai berikut:
\[ Y=56.8941-0.1701 X_1 - 0.4472 X_2 -0.6501 X_3 \] Model regresi tersebut dapat diartikan sebagai berikut: - Estimasi rata-rata persentase kemiskinan Provinsi Papua tahun 2020 (Y) sebesar 56.8941% tanpa dipengaruhi variabel distribrusi PDRB ADHK (X1), IPM (X2), dan tingkat pengangguran terbuka (X3).
- Setiap kenaikan distribrusi PDRB ADHK (X1) sebesar 1% akan menurunkan persentase kemiskinan (Y) sebesar 0.1701%, dengan asumsi variabel IPM (X2) dan tingkat pengangguran terbuka (X3) tetap.
- Setiap kenaikan IPM (X2) sebesar 1 satuan akan menurunkan persentase kemiskinan (Y) sebesar 0.4472%, dengan asumsi variabel distribrusi PDRB ADHK (X1) dan tingkat pengangguran terbuka (X3) tetap.
- Setiap kenaikan tingkat pengangguran terbuka (X3) sebesar 1% akan menurunkan persentase kemiskinan (Y) sebesar 0.6501%, dengan asumsi variabel distribrusi PDRB ADHK (X1) dan IPM (X2) tetap.

3.4 Pemenuhan Asumsi Regresi

Berdasarkan pendeteksian asumsi regresi dengan beberapa pengujian, diperoleh hasil sebagai berikut:
- Berdasarkan uji Shapiro Wilk diperoleh pvalue=0.7945, nilai tersebut lebih besar dari alfa 5%. Sehingga dapat disimpulkan bahwa residual menyebar normal.
- Berdasarkan indikator nilai VIF, tidak terdapat nilai VIF yang lebih besar dari 10. Sehingga dapat disimpulkan bahwa tidak terdapat multikolinieritas/korelasi antarprediktor.
- Berdasarkan uji Durbin Watson diperoleh pvalue=0.2659, nilai tersebut lebih besar dari alfa 5%. Sehingga dapat disimpulkan bahwa dalam model regresi tidak terjadi autokorelasi.
- Berdasarkan uji Breusch Pagan diperoleh pvalue=0.05473, nilai tersebut lebih besar dari alfa 5%. Sehingga dapat disimpulkan bahwa dalam model regresi tidak terjadi heteroskedastisitas.

Secara keseluruhan hasil pendeteksian asumsi regresi tidak terdapat pelanggaran asumsi.

3.5 Kesesuaian Model

Berdasarkan hasil analisis regresi, uji simultan dengan uji F diperoleh pvalue=1.537e-05, nilai tersebut lebih kecil dari alfa 5%. Pada taraf nyata 5% dapat disimpulkan bahwa secara simultan variabel prediktor X (PDRB,IPM, dan pengangguran) berpengaruh signifikan terhadap variabel respons Y (persentase kemiskinan Provinsi Papua tahun 2020)

Uji parsial dengan uji t diperoleh hasil bahwa pvalue untuk koefisien intersep dan X2 kurang dari alfa 5%. Hal ini berarti keberadaan intersep dalam model regresi linier berganda berpengaruh signifikan, serta variabel IPM (X2) berpengaruh signifikan terhadap persentase kemiskinan Provinsi Papua tahun 2020.

Koefisien Determinasi (R-squared) diperoleh sebesar 0.6257, artinya secara simultan variabel distribusi PDRB ADHK (X1), IPM (X2), dan tingkat pengangguran terbuka (X3) mampu menjelaskan keragaman variabel persentase kemiskinan Provinsi Papua tahun 2020 (Y) sebesar 62.57%, sedangkan 37.43% lainnya dijelaskan oleh variabel lain yang tidak dimasukkan dalam model.

4 DAFTAR PUSTAKA

Gujarati, D.N. dan D.C. Porter. 2010. Dasar-Dasar Ekonometrika, Edisi 5. Jakarta: Salemba Empat.

Nachrowi, N. D. dan Hardius, U. 2006. Pendekatan Populer dan Praktis Ekonometrika untuk Analisis Ekonomi dan Keuangan. Jakarta: Lembaga Penerbit FE Universitas Indonesia.

Kuncoro, M. 2011. Metode Kuantitatif Teori dan Aplikasi untuk Bisnis dan Ekonomi. Yogyakarta: UPP STIM YKPN.

Kutner, M. H., Nachtsheim, J. C., Neter, J., dan Li, W. 2004. Applied Linier Statistical Model. 5th edition. New York: McGraw Hill.

Walpole, R. E. 2015. Pengantar Statistika. Edisi ketiga. Jakarta: PT Gramedia Pustaka Utama.

Widodo, A. dan Andawaningtyas, K. 2017. Pengantar Statistika. Malang: UB Press.

Yitnosumarto, S. 1990. Dasar-Dasar Statistika dengan Penekanan Terapan dalam Bidang Agrokompleks, Teknologi, dan Sosial. Jakarta: CV Rajawali.