Penelitian ini menganalisis faktor-faktor yang memengaruhi tingkat kemiskinan di Indonesia menggunakan data BPS 2023 dengan pendekatan OLS, Robust, Nonlinear, dan Lasso Regression. Variabel utama mencakup pendidikan, pengeluaran, IPM, kesehatan, dan tenaga kerja. Hasil menunjukkan model Nonlinear memiliki kinerja terbaik (Adj R² = 0.547), sedangkan Lasso menghasilkan model paling efisien dengan variabel signifikan IPM, Pengeluaran, Sanitasi, dan TPAK. Secara umum, peningkatan IPM, pendidikan, dan akses sanitasi berperan penting dalam menurunkan kemiskinan.
Kata Kunci: Kemiskinan, Regresi Nonlinear, Lasso, Robust, Indonesia
Kemiskinan tetap menjadi salah satu tantangan utama pembangunan Indonesia. Menurut data BPS, persentase penduduk miskin nasional mengalami penurunan secara gradual: pada September 2024 persentase penduduk miskin tercatat sebesar 8,57 %, menurun dari periode sebelumnya (BPS, 2024). Selain itu, jumlah penduduk miskin pada Maret 2025 mencapai sekitar 23,85 juta orang, atau mengalami penurunan dibandingkan periode sebelumnya. Namun, meskipun tren penurunan ini menunjukkan kemajuan, tingkat kemiskinan regional sangat beragam beberapa daerah masih berada dalam kondisi kemiskinan ekstrim sehingga memunculkan pertanyaan mengenai faktor-faktor pendorong kemiskinan di tingkat lokal.
Gambar 1.1 menunjukkan persentase penduduk miskin (P0) di setiap provinsi di Indonesia. Terlihat adanya kesenjangan antarwilayah, di mana provinsi di kawasan barat seperti DKI Jakarta, Bali, dan Kep. Bangka Belitung memiliki tingkat kemiskinan rendah (sekitar 4–6%), sedangkan wilayah timur seperti NTT, Maluku, Papua Barat, dan Papua mencatat angka tertinggi (15–26%). Rata-rata nasional sekitar 9%, menempatkan sebagian besar provinsi di Jawa dan Kalimantan di bawah rata-rata tersebut. Hal ini mencerminkan ketimpangan pembangunan antara wilayah barat yang lebih maju dan wilayah timur yang masih tertinggal, sehingga diperlukan pemerataan akses pendidikan, infrastruktur, dan lapangan kerja untuk menekan angka kemiskinan nasional.
Beberapa penelitian terkini menunjukkan bahwa variabel seperti rata-rata lama sekolah, pendapatan per kapita, harapan hidup, dan akses terhadap layanan dasar (air bersih, sanitasi) memiliki pengaruh signifikan terhadap kemiskinan. Misalnya, studi efficient menemukan bahwa pendapatan per kapita, rata-rata lama sekolah, harapan hidup, akses air bersih, dan listrik berdampak negatif signifikan terhadap kemiskinan di Indonesia (Imantria, 2024).
Penelitian panel Determinants of Poverty in Indonesia juga menunjukkan bahwa pendidikan dan kesehatan memiliki peran penting dalam mereduksi kemiskinan, sedangkan variabel ketergantungan penduduk (dependency ratio) cenderung meningkatkan kemiskinan (Firdaus et al., 2021). Di kawasan timur Indonesia, variabel upah minimum provinsi (UMP) dan Indeks Pembangunan Manusia (IPM) terbukti mempunyai pengaruh negatif signifikan terhadap tingkat kemiskinan (Kurniawan & Gunawan, 2025).
Walau demikian, sebagian penelitian menggunakan regresi linier biasa dengan asumsi klasik yang mungkin rentan terhadap outlier, heteroskedastisitas, atau multikolinearitas pada data daerah (kabupaten/kota). Oleh karena itu, penelitian ini mengusulkan pendekatan multimodel regresi (OLS, robust, nonlinear, dan Lasso) untuk mengevaluasi konsistensi hasil dan mengidentifikasi metode yang paling cocok untuk data kemiskinan regional.
Berdasarkan latar belakang, permasalahan dalam penelitian ini dapat diidentifikasi sebagai berikut:
Terdapat ketimpangan tingkat kemiskinan antarwilayah di Indonesia meskipun secara nasional mengalami penurunan.
Belum diketahui secara pasti faktor sosial-ekonomi yang paling berpengaruh terhadap kemiskinan di tingkat kabupaten/kota.
Model regresi linier klasik (OLS) yang sering digunakan rentan terhadap outlier dan pelanggaran asumsi, sehingga diperlukan pendekatan multimodel regresi untuk memperoleh hasil yang lebih akurat.
Berdasarkan identifikasi masalah, maka tujuan penelitiannya adalah sebagai berikut:
Penelitian ini memiliki beberapa batasan sebagai berikut:
Data yang digunakan merupakan data sekunder dari Badan Pusat Statistik (BPS) tahun 2023.
Analisis hanya menggunakan empat pendekatan regresi, yaitu OLS, Robust, Nonlinear, dan Lasso.
Penelitian ini tidak membahas aspek spasial atau dinamika waktu antarwilayah.
Model regresi linear atau Ordinary Least Squares (OLS) merupakan metode paling dasar dalam analisis hubungan antara satu variabel dependen dan satu atau lebih variabel independen. Secara matematis, model regresi linear dapat ditulis sebagai:
\[ Y_i = \beta_0 + \beta_1 X_{1i} + \beta_2 X_{2i} + \cdots + \beta_k X_{ki} + \varepsilon_i \]
di mana$$ \(Y_I\)adalah variabel dependen, \(X_ki\)adalah variabel independen, \(\beta_k\) merupakan koefisien parameter yang diestimasi, dan ϵi adalah komponen error yang diasumsikan berdistribusi normal dengan rataan nol dan varians konstan.
Tujuan utama metode OLS adalah meminimalkan jumlah kuadrat residual
sehingga
diperoleh estimator parameter yang memenuhi sifat BLUE
(Best Linear Unbiased Estimator) sesuai dengan Gauss-Markov
theorem. Artinya, di bawah asumsi klasik (linearitas, independensi,
homoskedastisitas, tidak ada multikolinearitas sempurna, dan normalitas
error), estimasi yang dihasilkan OLS merupakan estimasi terbaik dan
tidak bias (Wooldrige, 2020).
Metode Robust Regression dirancang untuk mengatasi pengaruh outlier yang sering membuat hasil estimasi model OLS menjadi tidak stabil. Pendekatan ini menggunakan fungsi bobot (loss function) seperti Huber atau Tukey’s bisquare dengan prinsip M-estimation, di mana residual besar diberikan bobot yang lebih kecil sehingga tidak terlalu memengaruhi estimasi parameter. Metode ini lebih stabil dan efisien untuk data sosial-ekonomi yang sering tidak memenuhi asumsi normalitas, serta sangat cocok diterapkan pada data tingkat kabupaten/kota yang memiliki daerah ekstrem seperti Papua dan Nusa Tenggara Timur.
Metode Nonlinear Regression digunakan ketika hubungan antara variabel bebas dan variabel terikat tidak bersifat linier terhadap parameter model. Contohnya, efek pengeluaran per kapita terhadap kemiskinan sering kali menunjukkan pola diminishing return, di mana peningkatan pendapatan memberikan dampak berkurang terhadap penurunan kemiskinan. Estimasi parameter pada regresi nonlinear biasanya dilakukan dengan metode iteratif seperti Gauss–Newton atau Levenberg–Marquardt, dengan bentuk umum model polinomial, logaritmik, maupun logistik. Kelebihan metode ini adalah kemampuannya menangkap hubungan yang kompleks antar variabel, namun kelemahannya terletak pada kebutuhan nilai awal yang baik dan interpretasi hasil yang lebih sulit dibanding model linier.
| Metode | Ciri Utama | Kelebihan | Kekurangan |
|---|---|---|---|
| Lasso (L1) | Penalti absolut | Seleksi variabel otomatis | Hilangkan variabel berkorelasi |
| Ridge (L2) | Penalti kuadrat | Stabil untuk variabel berkorelasi | Tidak seleksi variabel |
| Elastic Net (L1+L2) | Kombinasi | Seimbang antara akurasi & interpretasi | Butuh tuning dua parameter |
Kesimpulan
Penelitian ini menggunakan data sekunder yang diperoleh dari Badan Pusat Statistik (BPS) Indonesia. Data mencakup 514 kabupaten/kota di Indonesia, yang merepresentasikan seluruh wilayah administratif tingkat II. Data dipilih karena ketersediaannya yang lengkap, konsistensi pencatatan, serta relevansi indikator dengan tujuan penelitian. Periode data yang digunakan adalah tahun 2023, data terdiri dari 9 variabel independen dan 1 variabel dependen. Variabel tersebut dapat dilihat pada tabel 3.1
Tabel 3. 1. Variabel Penelitian
| No. | Kode Variabel | Nama Variabel | Tipe Data |
| 1 | X1 | Rata-rata Lama Sekolah Penduduk 15+ (Tahun) | Numerik |
| 2 | X2 | Pengeluaran per Kapita Disesuaikan (Ribu Rupiah/Orang/Tahun) | Numerik |
| 3 | X3 | Indeks Pembangunan Manusia | Numerik |
| 4 | X4 | Umur Harapan Hidup (Tahun) | Numerik |
| 5 | X5 | Persentase rumah tangga yang memiliki akses terhadap sanitasi layak | Numerik |
| 6 | X6 | Persentase rumah tangga yang memiliki akses terhadap air minum layak | Numerik |
| 7 | X7 | Tingkat Pengangguran Terbuka | Numerik |
| 8 | X8 | Tingkat Partisipasi Angkatan Kerja | Numerik |
| 9 | X9 | PDRB atas Dasar Harga Konstan menurut Pengeluaran (Rupiah) | Numerik |
| 10 | Y | Persentase Penduduk Miskin (P0) Menurut Kabupaten/Kota (Persen) | Numerik |
Data sekunder dari BPS 2023 mencakup 514 kabupaten/kota di Indonesia.
library(readxl)
data_path <- file.choose()
data <- read_excel(data_path)
head(data)
## # A tibble: 6 × 12
## Provinsi `Kab/Kota` Y X1 X2 X3 X4 X5 X6 X7 X8
## <chr> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 ACEH Simeulue 19.0 9.48 7148 66.4 65.3 71.6 87.4 5.71 71.2
## 2 ACEH Aceh Singkil 20.4 8.68 8776 69.2 67.4 69.6 78.6 8.36 62.8
## 3 ACEH Aceh Selatan 13.2 8.88 8180 67.4 64.4 62.6 79.6 6.46 60.8
## 4 ACEH Aceh Tenggara 13.4 9.67 8030 69.4 68.2 62.7 86.7 6.43 69.6
## 5 ACEH Aceh Timur 14.4 8.21 8577 67.8 68.7 66.8 83.2 7.13 59.5
## 6 ACEH Aceh Tengah 15.3 9.86 10780 73.4 68.9 90.6 90.1 2.61 76.3
## # ℹ 1 more variable: X9 <dbl>
1. Uji Asumsi Klasik
Model OLS terlebih dahulu diuji untuk memastikan validitas asumsi dasar, meliputi:
a. Uji Normalitas: menggunakan uji Shapiro-Wilk dan plot QQ-Plot residual.
b. Uji Heteroskedastisitas: menggunakan Breusch-Pagan Test.
c. Uji Autokorelasi: menggunakan Durbin-Watson Test.
d. Uji Multikolinearitas: menggunakan Variance Inflation Factor (VIF) untuk mendeteksi korelasi antar variabel independen.
Jika ditemukan pelanggaran terhadap asumsi klasik, analisis dilanjutkan dengan model alternatif seperti robust regression atau regularisasi.
2. Model Estimasi yang Digunakan
a. Model OLS (Baseline)
\[ P_0 = \beta_0 + \beta_1 RLS + \beta_2 Pengeluaran + \beta_3 IPM + \beta_4 UHH + \beta_5 TPT + \varepsilon \]
Model ini menjadi acuan utama untuk membandingkan hasil model alternatif.
b. Model Robust Regression (Huber M-estimator)
Menangani pengaruh outlier dengan fungsi bobot pada residual, sehingga estimasi tidak mudah terdistorsi oleh data ekstrem.
c. Model Nonlinear Regression (Polynomial dan Log-transformation)
Mencoba menangkap hubungan non-linear antara variabel seperti pengeluaran dan partisipasi kerja terhadap tingkat kemiskinan.
d. Model Regularisasi (Lasso dan Ridge Regression)
1) Lasso (L1) digunakan untuk seleksi variabel otomatis.
2) Ridge (L2) digunakan untuk menstabilkan model saat variabel berkorelasi tinggi.
Pemilihan parameter penalti 𝜆 dilakukan menggunakan teknik k-fold cross validation.
Alur penelitian ini dilakukan secara sistematis dalam sembilan tahap utama:
1. Pengumpulan Data
Data diunduh dari BPS dan dilakukan data cleaning untuk menyeragamkan format dan satuan.
2. Eksplorasi Data Deskriptif
Meliputi analisis statistik dasar, distribusi kemiskinan antar wilayah, dan korelasi antar variabel.
3. Pengujian Asumsi dan Outlier Detection
Outlier diuji dengan boxplot dan Mahalanobis distance, serta multikolinearitas dengan VIF.
4. Estimasi Model OLS
Menjadi dasar pembanding terhadap metode lain.
5. Estimasi Model Robust
Menggunakan M-estimation (Huber) untuk mengoreksi efek pencilan.
6. Estimasi Model Nonlinear
Menambahkan polynomial term untuk mendeteksi efek melengkung.
7. Estimasi Model Regularisasi (Lasso & Ridge)
Melakukan cross-validation untuk menemukan λ optimal dan mengeliminasi variabel tidak signifikan.
8. Perbandingan Model
Menilai kinerja berdasarkan Adjusted R², RMSE, AIC, dan BIC.
9. Visualisasi dan Interpretasi Hasil
Disajikan melalui R Shiny Dashboard yang menampilkan model, peta interaktif, dan grafik hubungan variabel.
Hasil Shapiro–Wilk, Breusch–Pagan, dan Durbin–Watson menunjukkan bahwa model OLS melanggar beberapa asumsi klasik.
library(lmtest)
## Loading required package: zoo
##
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
library(car)
## Loading required package: carData
model_ols <- lm(Y ~ X1 + X2 + X3 + X4 + X5 + X6 + X7 + X8 + X9, data=data)
summary(model_ols)
##
## Call:
## lm(formula = Y ~ X1 + X2 + X3 + X4 + X5 + X6 + X7 + X8 + X9,
## data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -13.3657 -3.1800 -0.4273 2.7837 19.8337
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 5.344e+01 6.490e+00 8.235 1.55e-15 ***
## X1 1.102e+00 4.185e-01 2.634 0.008706 **
## X2 -3.952e-04 2.389e-04 -1.655 0.098597 .
## X3 -7.460e-01 2.048e-01 -3.642 0.000298 ***
## X4 -1.497e-01 1.362e-01 -1.099 0.272315
## X5 -5.121e-02 1.799e-02 -2.846 0.004607 **
## X6 3.688e-02 1.805e-02 2.043 0.041611 *
## X7 1.684e-01 1.235e-01 1.364 0.173156
## X8 2.300e-01 4.838e-02 4.753 2.62e-06 ***
## X9 8.609e-09 5.809e-09 1.482 0.138956
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 5.018 on 504 degrees of freedom
## Multiple R-squared: 0.5553, Adjusted R-squared: 0.5474
## F-statistic: 69.93 on 9 and 504 DF, p-value: < 2.2e-16
shapiro.test(resid(model_ols))
##
## Shapiro-Wilk normality test
##
## data: resid(model_ols)
## W = 0.98681, p-value = 0.0001332
bptest(model_ols)
##
## studentized Breusch-Pagan test
##
## data: model_ols
## BP = 61.58, df = 9, p-value = 6.644e-10
dwtest(model_ols)
##
## Durbin-Watson test
##
## data: model_ols
## DW = 1.048, p-value < 2.2e-16
## alternative hypothesis: true autocorrelation is greater than 0
vif(model_ols)
## X1 X2 X3 X4 X5 X6 X7 X8
## 9.488522 8.580938 36.070465 4.491066 2.277657 1.637052 2.159531 1.951017
## X9
## 1.577570
Interpretasi:
Hasil uji asumsi menunjukkan bahwa:
Residual tidak berdistribusi normal (Shapiro–Wilk p ≤ 0.05),
Terdapat heteroskedastisitas (Breusch–Pagan p ≤ 0.05)
Beberapa variabel memiliki VIF > 10, menandakan multikolinearitas.
Kesimpulan: Model OLS tidak sepenuhnya memenuhi asumsi klasik, sehingga diperlukan pendekatan alternatif.
Untuk mengidentifikasi pengamatan yang berpotensi menjadi outlier atau observasi berpengaruh, dilakukan analisis diagnostik model OLS melalui empat grafik utama, yaitu Residual vs Fitted, Cook’s Distance, Leverage vs |Standardized Residual|, dan QQ Plot.
Berdasarkan hasil diagnostik yang ditampilkan pada Gambar 4.1, diperoleh bahwa dari 514 observasi, terdapat:
23 observasi dengan nilai |standardized residual| > 2,
35 observasi dengan nilai leverage > 0.039,
dan 36 observasi dengan Cook’s Distance > 0.008.
Hal ini menunjukkan adanya sejumlah data yang berpotensi ekstrem dan dapat memengaruhi kestabilan estimasi model.
Lima observasi dengan pengaruh terbesar terhadap model OLS adalah:
| Indeks | Cook’s Distance | |Std.Resid| | Leverage |
|——–|—————-|————|———–|
| 504 | 0.0661 | 4.03 | 0.039 |
| 512 | 0.0612 | 2.87 | 0.069 |
| 506 | 0.0459 | 1.39 | 0.192 |
| 487 | 0.0419 | 2.69 | 0.055 |
| 475 | 0.0357 | 2.50 | 0.054 |
Observasi tersebut teridentifikasi sebagai pengamatan berpengaruh (influential points) karena memiliki kombinasi nilai residual besar, leverage tinggi, dan Cook’s Distance yang melebihi batas umum. Keberadaan titik ini dapat memengaruhi arah dan besar koefisien regresi.
| Grafik | Interpretasi Singkat |
|---|---|
| Residual vs Fitted | Terdapat pola melengkung dan beberapa titik ekstrem → indikasi heteroskedastisitas dan hubungan nonlinier. |
| Cook’s Distance | Beberapa titik (Idx > 450) melewati batas → observasi sangat berpengaruh terhadap koefisien. |
| **Leverage vs | Std Residual |
| QQ Plot | Penyimpangan pada ekor distribusi → residual tidak sepenuhnya normal. |
Kesimpulan Analisis Outlier
Berdasarkan keseluruhan hasil uji diagnostik, dapat disimpulkan bahwa:
Model OLS belum sepenuhnya memenuhi asumsi klasik, terutama pada aspek normalitas residual dan homoskedastisitas.
Ditemukan beberapa observasi dengan residual besar, leverage tinggi, dan Cook’s D signifikan, yang berpotensi menimbulkan distorsi pada hasil estimasi.
Untuk mengatasi hal tersebut, penelitian ini melanjutkan analisis menggunakan Robust Regression (Huber M-estimator) untuk meminimalkan pengaruh pencilan, serta analisis sensitivitas dengan mengabaikan observasi ekstrem.
Hasil robust regression terbukti menghasilkan model yang lebih stabil dan tidak mudah dipengaruhi oleh data ekstrem dibandingkan model OLS.
model_ols <- lm(Y ~ X1 + X2 + X3 + X4 + X5 + X6 + X7 + X8 + X9, data=data)
summary(model_ols)
##
## Call:
## lm(formula = Y ~ X1 + X2 + X3 + X4 + X5 + X6 + X7 + X8 + X9,
## data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -13.3657 -3.1800 -0.4273 2.7837 19.8337
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 5.344e+01 6.490e+00 8.235 1.55e-15 ***
## X1 1.102e+00 4.185e-01 2.634 0.008706 **
## X2 -3.952e-04 2.389e-04 -1.655 0.098597 .
## X3 -7.460e-01 2.048e-01 -3.642 0.000298 ***
## X4 -1.497e-01 1.362e-01 -1.099 0.272315
## X5 -5.121e-02 1.799e-02 -2.846 0.004607 **
## X6 3.688e-02 1.805e-02 2.043 0.041611 *
## X7 1.684e-01 1.235e-01 1.364 0.173156
## X8 2.300e-01 4.838e-02 4.753 2.62e-06 ***
## X9 8.609e-09 5.809e-09 1.482 0.138956
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 5.018 on 504 degrees of freedom
## Multiple R-squared: 0.5553, Adjusted R-squared: 0.5474
## F-statistic: 69.93 on 9 and 504 DF, p-value: < 2.2e-16
Interpretasi:
Model OLS menghasilkan Adjusted R² = 0.547.
Variabel signifikan antara lain:
Namun, hasil uji asumsi menunjukkan pelanggaran pada normalitas, heteroskedastisitas, dan multikolinearitas. Sehingga model OLS tidak sepenuhnya valid dan perlu pendekatan alternatif.
library(MASS)
model_robust <- rlm(Y ~ X1 + X2 + X3 + X4 + X5 + X6 + X7 + X8 + X9, data=data, psi=psi.huber)
summary(model_robust)
##
## Call: rlm(formula = Y ~ X1 + X2 + X3 + X4 + X5 + X6 + X7 + X8 + X9,
## data = data, psi = psi.huber)
## Residuals:
## Min 1Q Median 3Q Max
## -12.762 -2.952 -0.245 2.883 21.660
##
## Coefficients:
## Value Std. Error t value
## (Intercept) 47.0340 6.3537 7.4027
## X1 0.9689 0.4097 2.3648
## X2 -0.0004 0.0002 -1.5768
## X3 -0.7071 0.2005 -3.5263
## X4 -0.1214 0.1333 -0.9107
## X5 -0.0574 0.0176 -3.2569
## X6 0.0608 0.0177 3.4395
## X7 0.1795 0.1209 1.4847
## X8 0.2399 0.0474 5.0656
## X9 0.0000 0.0000 1.3070
##
## Residual standard error: 4.33 on 504 degrees of freedom
Interpretasi:
Model Robust Regression menggunakan fungsi bobot Huber untuk mengatasi pengaruh outlier. Hasil menunjukkan peningkatan stabilitas model, dengan variabel signifikan:
Meskipun peningkatan R² tidak besar, model ini lebih tahan terhadap data ekstrem terutama dari wilayah Papua dan Nusa Tenggara.
model_poly <- lm(Y ~ poly(X2, 2) + X3 + X5 + X8, data=data)
summary(model_poly)
##
## Call:
## lm(formula = Y ~ poly(X2, 2) + X3 + X5 + X8, data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -13.5845 -3.1864 -0.2804 2.6387 16.4252
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 27.85361 6.82201 4.083 5.17e-05 ***
## poly(X2, 2)1 -54.98878 10.73916 -5.120 4.33e-07 ***
## poly(X2, 2)2 40.98170 5.45131 7.518 2.54e-13 ***
## X3 -0.30096 0.08437 -3.567 0.000395 ***
## X5 -0.03511 0.01656 -2.120 0.034510 *
## X8 0.11768 0.04015 2.931 0.003529 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 4.893 on 508 degrees of freedom
## Multiple R-squared: 0.5738, Adjusted R-squared: 0.5697
## F-statistic: 136.8 on 5 and 508 DF, p-value: < 2.2e-16
Model regresi nonlinier yang digunakan adalah:
\[ Y = \beta_0 + \beta_1 \text{poly}(X2,2) + \beta_2 X3 + \beta_3 X5 + \beta_4 X8 + \varepsilon \]
Hasil estimasi menunjukkan bahwa semua variabel dalam model berpengaruh signifikan terhadap tingkat kemiskinan (p-value < 0,05), dengan nilai Adjusted R² = 0.5697, yang berarti model mampu menjelaskan sekitar 56,97% variasi tingkat kemiskinan antar kabupaten/kota di Indonesia.
Interpretasi Koefisien
| Variabel | Koefisien | Arah Pengaruh |
|---|---|---|
| Intercept (27.85) | Positif | Nilai dasar tingkat kemiskinan ketika semua variabel independen berada pada nilai rata-rata. |
| poly(X2,2)1 = -54.99 | Negatif signifikan | Menunjukkan bahwa pengeluaran per kapita memiliki hubungan nonlinier terhadap kemiskinan — peningkatan pengeluaran awal menurunkan kemiskinan secara signifikan, tetapi efeknya menurun pada tingkat pengeluaran yang lebih tinggi (diminishing return). |
| poly(X2,2)2 = 40.98 | Positif signifikan | Mengonfirmasi adanya kelengkungan (kurva-U) yang menandakan perubahan arah pengaruh pengeluaran pada tingkat tertentu. |
| X3 (IPM) = -0.30 | Negatif signifikan | Semakin tinggi Indeks Pembangunan Manusia, semakin rendah tingkat kemiskinan. Setiap peningkatan 1 poin IPM menurunkan kemiskinan rata-rata sebesar 0,30 poin persentase. |
| X5 (Sanitasi) = -0.035 | Negatif signifikan | Akses sanitasi layak menurunkan tingkat kemiskinan; peningkatan 1% rumah tangga dengan sanitasi layak menurunkan kemiskinan sebesar 0,035%. |
| X8 (TPAK) = 0.118 | Positif signifikan | Menunjukkan bahwa peningkatan tingkat partisipasi angkatan kerja (TPAK) berkorelasi dengan kenaikan angka kemiskinan, kemungkinan karena sebagian pekerja berada di sektor informal dengan pendapatan rendah. |
Makna Model Nonlinear
Model ini mampu menangkap hubungan nonlinier antar variabel yang tidak dapat dijelaskan oleh model OLS. Efek pengeluaran per kapita terhadap kemiskinan tidak bersifat linier — pada tingkat pendapatan tertentu, penurunan kemiskinan melambat bahkan bisa meningkat kembali jika ketimpangan pendapatan melebar.
Dengan R² = 0.5738 dan F-statistic = 136.8 (p < 0.001), model ini secara keseluruhan signifikan dan memiliki kinerja terbaik di antara model lain (OLS, Robust, Lasso).
Kesimpulan
Pendekatan nonlinier memberikan pemahaman yang lebih realistis terhadap dinamika kemiskinan di Indonesia. Variabel pengeluaran per kapita, IPM, dan sanitasi terbukti sebagai faktor utama penurun kemiskinan, sementara TPAK menunjukkan kompleksitas pasar tenaga kerja di wilayah-wilayah miskin.
library(glmnet)
## Loading required package: Matrix
## Loaded glmnet 4.1-10
X <- model.matrix(Y ~ ., data=data)[,-1]
y <- data$Y
cv.lasso <- cv.glmnet(X, y, alpha=1)
coef(cv.lasso, s="lambda.min")
## 556 x 1 sparse Matrix of class "dgCMatrix"
## lambda.min
## (Intercept) 39.5291724548
## ProvinsiBALI -3.2518357672
## ProvinsiBANTEN -3.2555419040
## ProvinsiBENGKULU .
## ProvinsiD I YOGYAKARTA 4.3677330966
## ProvinsiDKI JAKARTA 0.0205488743
## ProvinsiGORONTALO 3.2656530312
## ProvinsiJAMBI -2.8935236215
## ProvinsiJAWA BARAT -2.0555942745
## ProvinsiJAWA TENGAH .
## ProvinsiJAWA TIMUR .
## ProvinsiKALIMANTAN BARAT -4.9689502861
## ProvinsiKALIMANTAN SELATAN -5.8947826690
## ProvinsiKALIMANTAN TENGAH -6.2087040854
## ProvinsiKALIMANTAN TIMUR -1.4356442595
## ProvinsiKALIMANTAN UTARA -2.7231544893
## ProvinsiKEP. BANGKA BELITUNG -3.4141700981
## ProvinsiKEPULAUAN RIAU -0.0279820104
## ProvinsiLAMPUNG .
## ProvinsiMALUKU 7.8223652124
## ProvinsiMALUKU UTARA -5.0822364180
## ProvinsiNUSA TENGGARA BARAT 0.4662790761
## ProvinsiNUSA TENGGARA TIMUR 4.5543120446
## ProvinsiPAPUA 8.8861873334
## ProvinsiPAPUA BARAT 8.9143232237
## ProvinsiRIAU -2.8967806190
## ProvinsiSULAWESI BARAT .
## ProvinsiSULAWESI SELATAN -1.3548399435
## ProvinsiSULAWESI TENGAH .
## ProvinsiSULAWESI TENGGARA .
## ProvinsiSULAWESI UTARA -2.1298289946
## ProvinsiSUMATERA BARAT -4.4245501059
## ProvinsiSUMATERA SELATAN .
## ProvinsiSUMATERA UTARA -0.7982041320
## `Kab/Kota`Aceh Barat Daya 1.2304510530
## `Kab/Kota`Aceh Besar 1.8897725523
## `Kab/Kota`Aceh Jaya .
## `Kab/Kota`Aceh Selatan .
## `Kab/Kota`Aceh Singkil 6.0883713126
## `Kab/Kota`Aceh Tamiang .
## `Kab/Kota`Aceh Tengah 3.1264869344
## `Kab/Kota`Aceh Tenggara .
## `Kab/Kota`Aceh Timur .
## `Kab/Kota`Aceh Utara 3.3553646733
## `Kab/Kota`Agam .
## `Kab/Kota`Alor .
## `Kab/Kota`Asahan -0.1187726848
## `Kab/Kota`Asmat -4.0942547670
## `Kab/Kota`Badung .
## `Kab/Kota`Balangan .
## `Kab/Kota`Bandung -0.9963440244
## `Kab/Kota`Bandung Barat .
## `Kab/Kota`Banggai -3.2120518303
## `Kab/Kota`Banggai Kepulauan .
## `Kab/Kota`Banggai Laut .
## `Kab/Kota`Bangka -0.7037022093
## `Kab/Kota`Bangka Barat -3.9354664904
## `Kab/Kota`Bangka Selatan -4.2201977500
## `Kab/Kota`Bangka Tengah -0.8191601208
## `Kab/Kota`Bangkalan 5.1027766784
## `Kab/Kota`Bangli -2.6716504760
## `Kab/Kota`Banjar -1.3346961206
## `Kab/Kota`Banjarnegara 1.2355646662
## `Kab/Kota`Bantaeng -0.1100529136
## `Kab/Kota`Bantul 1.8328703347
## `Kab/Kota`Banyu Asin -1.3656449408
## `Kab/Kota`Banyumas 1.7291161879
## `Kab/Kota`Banyuwangi -1.7942479643
## `Kab/Kota`Barito Kuala -1.8916700734
## `Kab/Kota`Barito Selatan .
## `Kab/Kota`Barito Timur .
## `Kab/Kota`Barito Utara .
## `Kab/Kota`Barru .
## `Kab/Kota`Batang -2.0977253442
## `Kab/Kota`Batang Hari .
## `Kab/Kota`Batu Bara .
## `Kab/Kota`Bekasi -1.7230852359
## `Kab/Kota`Belitung .
## `Kab/Kota`Belitung Timur .
## `Kab/Kota`Belu -3.5096934351
## `Kab/Kota`Bener Meriah 7.0286951772
## `Kab/Kota`Bengkalis .
## `Kab/Kota`Bengkayang -0.4406017925
## `Kab/Kota`Bengkulu Selatan 4.6246700549
## `Kab/Kota`Bengkulu Tengah -2.2381909268
## `Kab/Kota`Bengkulu Utara .
## `Kab/Kota`Berau -0.9234471568
## `Kab/Kota`Biak Numfor 2.6890431198
## `Kab/Kota`Bima .
## `Kab/Kota`Bintan -1.4067114608
## `Kab/Kota`Bireuen 0.2370086519
## `Kab/Kota`Blitar -0.8429152696
## `Kab/Kota`Blora .
## `Kab/Kota`Boalemo 0.6091608619
## `Kab/Kota`Bogor -0.6540010636
## `Kab/Kota`Bojonegoro .
## `Kab/Kota`Bolaang Mongondow -1.8234884337
## `Kab/Kota`Bolaang Mongondow Selatan .
## `Kab/Kota`Bolaang Mongondow Timur -4.5327130844
## `Kab/Kota`Bolaang Mongondow Utara -2.1239041543
## `Kab/Kota`Bombana -2.2000605590
## `Kab/Kota`Bondowoso .
## `Kab/Kota`Bone -0.4230927943
## `Kab/Kota`Bone Bolango .
## `Kab/Kota`Boven Digoel -4.3452073701
## `Kab/Kota`Boyolali .
## `Kab/Kota`Brebes 2.9781312386
## `Kab/Kota`Buleleng .
## `Kab/Kota`Bulukumba -1.9167060698
## `Kab/Kota`Bulungan .
## `Kab/Kota`Bungo -1.2513529749
## `Kab/Kota`Buol .
## `Kab/Kota`Buru -2.0351858526
## `Kab/Kota`Buru Selatan -6.1878744016
## `Kab/Kota`Buton .
## `Kab/Kota`Buton Selatan .
## `Kab/Kota`Buton Tengah .
## `Kab/Kota`Buton Utara .
## `Kab/Kota`Ciamis -1.2549290706
## `Kab/Kota`Cianjur -0.3281060446
## `Kab/Kota`Cilacap .
## `Kab/Kota`Cirebon 0.9789730452
## `Kab/Kota`Dairi -1.4169749155
## `Kab/Kota`Deiyai 7.9622730105
## `Kab/Kota`Deli Serdang -3.2787191676
## `Kab/Kota`Demak 0.7692469623
## `Kab/Kota`Dharmasraya .
## `Kab/Kota`Dogiyai .
## `Kab/Kota`Dompu .
## `Kab/Kota`Donggala 0.8701180190
## `Kab/Kota`Empat Lawang -0.1291521687
## `Kab/Kota`Ende 4.6897728171
## `Kab/Kota`Enrekang 1.7350613939
## `Kab/Kota`Fakfak .
## `Kab/Kota`Flores Timur -7.1620136435
## `Kab/Kota`Garut -0.7218971386
## `Kab/Kota`Gayo Lues 4.0216111474
## `Kab/Kota`Gianyar .
## `Kab/Kota`Gorontalo 0.0816143149
## `Kab/Kota`Gorontalo Utara .
## `Kab/Kota`Gowa -1.9485294331
## `Kab/Kota`Gresik 2.4874566845
## `Kab/Kota`Grobogan .
## `Kab/Kota`Gunung Kidul .
## `Kab/Kota`Gunung Mas .
## `Kab/Kota`Halmahera Barat .
## `Kab/Kota`Halmahera Selatan -4.2041198657
## `Kab/Kota`Halmahera Tengah 3.0779003791
## `Kab/Kota`Halmahera Timur 4.8562007592
## `Kab/Kota`Halmahera Utara -2.4851173079
## `Kab/Kota`Hulu Sungai Selatan .
## `Kab/Kota`Hulu Sungai Tengah .
## `Kab/Kota`Hulu Sungai Utara .
## `Kab/Kota`Humbang Hasundutan -1.7336390736
## `Kab/Kota`Indragiri Hilir -3.6821568547
## `Kab/Kota`Indragiri Hulu -1.8313910745
## `Kab/Kota`Indramayu 1.0196959990
## `Kab/Kota`Intan Jaya 9.0131501481
## `Kab/Kota`Jayapura -7.4092816650
## `Kab/Kota`Jayawijaya 8.5910754984
## `Kab/Kota`Jember -2.0414090680
## `Kab/Kota`Jembrana -1.2254059828
## `Kab/Kota`Jeneponto 0.1436844542
## `Kab/Kota`Jepara -2.8102421898
## `Kab/Kota`Jombang .
## `Kab/Kota`Kaimana -6.5117917572
## `Kab/Kota`Kampar .
## `Kab/Kota`Kapuas .
## `Kab/Kota`Kapuas Hulu .
## `Kab/Kota`Karang Asem -1.9674195550
## `Kab/Kota`Karanganyar 0.0276829723
## `Kab/Kota`Karawang .
## `Kab/Kota`Karimun -2.4996090556
## `Kab/Kota`Karo .
## `Kab/Kota`Katingan .
## `Kab/Kota`Kaur 3.6409701184
## `Kab/Kota`Kayong Utara .
## `Kab/Kota`Kebumen 4.3021531331
## `Kab/Kota`Kediri .
## `Kab/Kota`Keerom -6.1062343016
## `Kab/Kota`Kendal .
## `Kab/Kota`Kepahiang 0.2423469167
## `Kab/Kota`Kepulauan Anambas -4.4271076350
## `Kab/Kota`Kepulauan Aru 1.5750505507
## `Kab/Kota`Kepulauan Mentawai 1.0706131963
## `Kab/Kota`Kepulauan Meranti 12.5175695994
## `Kab/Kota`Kepulauan Sangihe 0.8131049883
## `Kab/Kota`Kepulauan Selayar .
## `Kab/Kota`Kepulauan Seribu 3.3283384246
## `Kab/Kota`Kepulauan Sula -0.8315995206
## `Kab/Kota`Kepulauan Talaud -0.6639450204
## `Kab/Kota`Kepulauan Yapen 1.9763783308
## `Kab/Kota`Kerinci -0.2515034587
## `Kab/Kota`Ketapang 0.5872728771
## `Kab/Kota`Klaten 3.2066241725
## `Kab/Kota`Klungkung -0.9262740095
## `Kab/Kota`Kolaka 1.1675984407
## `Kab/Kota`Kolaka Timur .
## `Kab/Kota`Kolaka Utara 0.1103443724
## `Kab/Kota`Konawe 0.2462314214
## `Kab/Kota`Konawe Kepulauan 1.6717039297
## `Kab/Kota`Konawe Selatan -0.6496621843
## `Kab/Kota`Konawe Utara 0.5052244841
## `Kab/Kota`Kota Ambon -8.4104909013
## `Kab/Kota`Kota Balikpapan -1.0947262773
## `Kab/Kota`Kota Banda Aceh 2.2032198289
## `Kab/Kota`Kota Bandar Lampung .
## `Kab/Kota`Kota Bandung .
## `Kab/Kota`Kota Banjar -0.9452558905
## `Kab/Kota`Kota Banjar Baru 1.4471980192
## `Kab/Kota`Kota Banjarmasin 1.7374809582
## `Kab/Kota`Kota Baru -0.1043849567
## `Kab/Kota`Kota Batam .
## `Kab/Kota`Kota Batu -3.7055037308
## `Kab/Kota`Kota Baubau -0.8049804275
## `Kab/Kota`Kota Bekasi .
## `Kab/Kota`Kota Bengkulu 9.6522018541
## `Kab/Kota`Kota Bima -0.2749253654
## `Kab/Kota`Kota Binjai -1.6892235531
## `Kab/Kota`Kota Bitung .
## `Kab/Kota`Kota Blitar .
## `Kab/Kota`Kota Bogor .
## `Kab/Kota`Kota Bontang .
## `Kab/Kota`Kota Bukittinggi 1.0379590568
## `Kab/Kota`Kota Cilegon -0.9773525601
## `Kab/Kota`Kota Cimahi -0.1266667874
## `Kab/Kota`Kota Cirebon 1.3917218102
## `Kab/Kota`Kota Denpasar 1.2310201999
## `Kab/Kota`Kota Depok -0.2611161776
## `Kab/Kota`Kota Dumai -2.1526155740
## `Kab/Kota`Kota Gorontalo -4.7690632341
## `Kab/Kota`Kota Gunungsitoli 2.5060097516
## `Kab/Kota`Kota Jakarta Barat .
## `Kab/Kota`Kota Jakarta Pusat .
## `Kab/Kota`Kota Jakarta Selatan 0.5287511510
## `Kab/Kota`Kota Jakarta Timur .
## `Kab/Kota`Kota Jakarta Utara 0.6803741690
## `Kab/Kota`Kota Jambi 2.6066035678
## `Kab/Kota`Kota Jayapura -3.3166618105
## `Kab/Kota`Kota Kediri .
## `Kab/Kota`Kota Kendari .
## `Kab/Kota`Kota Kotamobagu -1.8378627268
## `Kab/Kota`Kota Kupang -1.8623925275
## `Kab/Kota`Kota Langsa 0.8539242621
## `Kab/Kota`Kota Lhokseumawe 1.0002110157
## `Kab/Kota`Kota Lubuklinggau 2.4881215472
## `Kab/Kota`Kota Madiun .
## `Kab/Kota`Kota Magelang .
## `Kab/Kota`Kota Makassar .
## `Kab/Kota`Kota Malang .
## `Kab/Kota`Kota Manado .
## `Kab/Kota`Kota Mataram .
## `Kab/Kota`Kota Medan 1.5438513202
## `Kab/Kota`Kota Metro .
## `Kab/Kota`Kota Mojokerto -0.2768766891
## `Kab/Kota`Kota Padang 1.8702668807
## `Kab/Kota`Kota Padang Panjang .
## `Kab/Kota`Kota Padangsidimpuan -1.2019343355
## `Kab/Kota`Kota Pagar Alam -3.1155630305
## `Kab/Kota`Kota Palangka Raya 1.8613760785
## `Kab/Kota`Kota Palembang 2.7802954946
## `Kab/Kota`Kota Palopo 0.2952412062
## `Kab/Kota`Kota Palu .
## `Kab/Kota`Kota Pangkal Pinang 0.0212554333
## `Kab/Kota`Kota Parepare .
## `Kab/Kota`Kota Pariaman .
## `Kab/Kota`Kota Pasuruan -0.9874190939
## `Kab/Kota`Kota Payakumbuh 1.4109545131
## `Kab/Kota`Kota Pekalongan -0.6129857126
## `Kab/Kota`Kota Pekanbaru .
## `Kab/Kota`Kota Pematang Siantar .
## `Kab/Kota`Kota Pontianak 1.4793136203
## `Kab/Kota`Kota Prabumulih 1.5098477068
## `Kab/Kota`Kota Probolinggo -1.4824268103
## `Kab/Kota`Kota Sabang 4.6588244578
## `Kab/Kota`Kota Salatiga .
## `Kab/Kota`Kota Samarinda .
## `Kab/Kota`Kota Sawah Lunto -3.1526501394
## `Kab/Kota`Kota Semarang .
## `Kab/Kota`Kota Serang .
## `Kab/Kota`Kota Sibolga 0.5227129645
## `Kab/Kota`Kota Singkawang .
## `Kab/Kota`Kota Solok .
## `Kab/Kota`Kota Sorong -0.1698074542
## `Kab/Kota`Kota Subulussalam 1.5131094929
## `Kab/Kota`Kota Sukabumi .
## `Kab/Kota`Kota Sungai Penuh -2.7675107517
## `Kab/Kota`Kota Surabaya .
## `Kab/Kota`Kota Surakarta 2.1278196782
## `Kab/Kota`Kota Tangerang 0.5221568647
## `Kab/Kota`Kota Tangerang Selatan .
## `Kab/Kota`Kota Tanjung Balai 0.9162802495
## `Kab/Kota`Kota Tanjung Pinang 1.3125273893
## `Kab/Kota`Kota Tarakan .
## `Kab/Kota`Kota Tasikmalaya 2.4747488196
## `Kab/Kota`Kota Tebing Tinggi 0.7911841997
## `Kab/Kota`Kota Tegal .
## `Kab/Kota`Kota Ternate 0.1944232636
## `Kab/Kota`Kota Tidore Kepulauan .
## `Kab/Kota`Kota Tomohon .
## `Kab/Kota`Kota Tual 0.5861283158
## `Kab/Kota`Kota Yogyakarta .
## `Kab/Kota`Kotawaringin Barat .
## `Kab/Kota`Kotawaringin Timur .
## `Kab/Kota`Kuantan Singingi .
## `Kab/Kota`Kubu Raya -2.8830287342
## `Kab/Kota`Kudus -1.1060625445
## `Kab/Kota`Kulon Progo 2.2849661972
## `Kab/Kota`Kuningan 1.6196001122
## `Kab/Kota`Kupang 1.9199707657
## `Kab/Kota`Kutai Barat .
## `Kab/Kota`Kutai Kartanegara .
## `Kab/Kota`Kutai Timur .
## `Kab/Kota`Labuhan Batu -0.2282974598
## `Kab/Kota`Labuhan Batu Selatan -0.5141950015
## `Kab/Kota`Labuhan Batu Utara .
## `Kab/Kota`Lahat 1.8469576249
## `Kab/Kota`Lamandau -0.6861767273
## `Kab/Kota`Lamongan 2.1343879326
## `Kab/Kota`Lampung Barat .
## `Kab/Kota`Lampung Selatan 0.5462327920
## `Kab/Kota`Lampung Tengah .
## `Kab/Kota`Lampung Timur 1.6590846419
## `Kab/Kota`Lampung Utara 4.9771671369
## `Kab/Kota`Landak 0.0743036048
## `Kab/Kota`Langkat .
## `Kab/Kota`Lanny Jaya 5.3945204680
## `Kab/Kota`Lebak -0.3247683506
## `Kab/Kota`Lebong -0.1532849057
## `Kab/Kota`Lembata 5.6829323012
## `Kab/Kota`Lima Puluh Kota -0.0995850270
## `Kab/Kota`Lingga .
## `Kab/Kota`Lombok Barat 0.3799701182
## `Kab/Kota`Lombok Tengah .
## `Kab/Kota`Lombok Timur 0.1661863866
## `Kab/Kota`Lombok Utara 10.9193718878
## `Kab/Kota`Lumajang -2.4278047582
## `Kab/Kota`Luwu 1.0158394381
## `Kab/Kota`Luwu Timur -0.5113965594
## `Kab/Kota`Luwu Utara 2.4975710172
## `Kab/Kota`Madiun .
## `Kab/Kota`Magelang .
## `Kab/Kota`Magetan .
## `Kab/Kota`Mahakam Hulu .
## `Kab/Kota`Majalengka 0.1340130998
## `Kab/Kota`Majene .
## `Kab/Kota`Malaka -4.1759029176
## `Kab/Kota`Malang -0.2379392888
## `Kab/Kota`Malinau -0.6021939608
## `Kab/Kota`Maluku Barat Daya 4.3829678554
## `Kab/Kota`Maluku Tengah .
## `Kab/Kota`Maluku Tenggara .
## `Kab/Kota`Maluku Tenggara Barat 2.3305238101
## `Kab/Kota`Mamasa .
## `Kab/Kota`Mamberamo Raya .
## `Kab/Kota`Mamberamo Tengah 3.2829587818
## `Kab/Kota`Mamuju -4.4155463927
## `Kab/Kota`Mamuju Tengah -5.7945667175
## `Kab/Kota`Mamuju Utara -6.6356914484
## `Kab/Kota`Mandailing Natal -2.7803587840
## `Kab/Kota`Manggarai .
## `Kab/Kota`Manggarai Barat -0.8132208755
## `Kab/Kota`Manggarai Timur 3.2132564627
## `Kab/Kota`Manokwari .
## `Kab/Kota`Manokwari Selatan 1.8144525037
## `Kab/Kota`Mappi .
## `Kab/Kota`Maros .
## `Kab/Kota`Maybrat 3.3913998724
## `Kab/Kota`Melawi 1.4608244124
## `Kab/Kota`Merangin .
## `Kab/Kota`Merauke -9.6549345926
## `Kab/Kota`Mesuji -6.2345978974
## `Kab/Kota`Mimika -3.6344535004
## `Kab/Kota`Minahasa .
## `Kab/Kota`Minahasa Selatan .
## `Kab/Kota`Minahasa Tenggara 1.8982729449
## `Kab/Kota`Minahasa Utara .
## `Kab/Kota`Mojokerto .
## `Kab/Kota`Morowali 1.4669120424
## `Kab/Kota`Morowali Utara .
## `Kab/Kota`Muara Enim .
## `Kab/Kota`Muaro Jambi -3.8786065928
## `Kab/Kota`Mukomuko .
## `Kab/Kota`Muna .
## `Kab/Kota`Muna Barat .
## `Kab/Kota`Murung Raya .
## `Kab/Kota`Musi Banyuasin 1.6294288709
## `Kab/Kota`Musi Rawas .
## `Kab/Kota`Musi Rawas Utara 4.6110861499
## `Kab/Kota`Nabire 0.7397978122
## `Kab/Kota`Nagan Raya 3.8960186551
## `Kab/Kota`Nagekeo -4.5464694101
## `Kab/Kota`Natuna -3.7476676457
## `Kab/Kota`Nduga * .
## `Kab/Kota`Ngada -4.0859176566
## `Kab/Kota`Nganjuk 0.0042624116
## `Kab/Kota`Ngawi 2.9249935606
## `Kab/Kota`Nias .
## `Kab/Kota`Nias Barat 8.5917023637
## `Kab/Kota`Nias Selatan .
## `Kab/Kota`Nias Utara 8.5341474459
## `Kab/Kota`Nunukan -3.6942337491
## `Kab/Kota`Ogan Ilir .
## `Kab/Kota`Ogan Komering Ilir 0.3344604528
## `Kab/Kota`Ogan Komering Ulu .
## `Kab/Kota`Ogan Komering Ulu Selatan -2.6434825507
## `Kab/Kota`Ogan Komering Ulu Timur -0.0497102534
## `Kab/Kota`Pacitan 0.3888404541
## `Kab/Kota`Padang Lawas -3.0245814799
## `Kab/Kota`Padang Lawas Utara -0.8085072044
## `Kab/Kota`Padang Pariaman .
## `Kab/Kota`Pakpak Bharat -2.6125974157
## `Kab/Kota`Pamekasan 0.1061329489
## `Kab/Kota`Pandeglang .
## `Kab/Kota`Pangandaran -0.3398056755
## `Kab/Kota`Pangkajene Dan Kepulauan 2.6348310664
## `Kab/Kota`Paniai 6.6465932229
## `Kab/Kota`Parigi Moutong .
## `Kab/Kota`Pasaman -1.4811312156
## `Kab/Kota`Pasaman Barat -0.0540461029
## `Kab/Kota`Paser .
## `Kab/Kota`Pasuruan -1.5468950529
## `Kab/Kota`Pati .
## `Kab/Kota`Pegunungan Arfak 4.7466706915
## `Kab/Kota`Pegunungan Bintang -0.1730942235
## `Kab/Kota`Pekalongan -0.3169864708
## `Kab/Kota`Pelalawan 0.3838095234
## `Kab/Kota`Pemalang 1.6070175576
## `Kab/Kota`Penajam Paser Utara -0.6083421512
## `Kab/Kota`Penukal Abab Lematang Ilir -0.3289402655
## `Kab/Kota`Pesawaran .
## `Kab/Kota`Pesisir Barat .
## `Kab/Kota`Pesisir Selatan .
## `Kab/Kota`Pidie 5.9548803725
## `Kab/Kota`Pidie Jaya 7.5028692161
## `Kab/Kota`Pinrang .
## `Kab/Kota`Pohuwato .
## `Kab/Kota`Polewali Mandar .
## `Kab/Kota`Ponorogo -0.4236513343
## `Kab/Kota`Pontianak -2.7090590380
## `Kab/Kota`Poso 2.5456497299
## `Kab/Kota`Pringsewu -0.4964015991
## `Kab/Kota`Probolinggo 4.1266363800
## `Kab/Kota`Pulang Pisau -1.5332760746
## `Kab/Kota`Pulau Morotai -3.2506343215
## `Kab/Kota`Pulau Taliabu -3.2097534729
## `Kab/Kota`Puncak 1.8850330025
## `Kab/Kota`Puncak Jaya 3.4271245284
## `Kab/Kota`Purbalingga 2.5176879468
## `Kab/Kota`Purwakarta .
## `Kab/Kota`Purworejo .
## `Kab/Kota`Raja Ampat -5.7192783477
## `Kab/Kota`Rejang Lebong 2.3801382330
## `Kab/Kota`Rembang 2.9185070516
## `Kab/Kota`Rokan Hilir -1.3235488757
## `Kab/Kota`Rokan Hulu .
## `Kab/Kota`Rote Ndao 6.3096941452
## `Kab/Kota`Sabu Raijua 6.0559439227
## `Kab/Kota`Sambas .
## `Kab/Kota`Samosir .
## `Kab/Kota`Sampang 7.4302013842
## `Kab/Kota`Sanggau -3.5312266612
## `Kab/Kota`Sarmi -9.5846639574
## `Kab/Kota`Sarolangun .
## `Kab/Kota`Sekadau -2.6045192122
## `Kab/Kota`Seluma 3.6670583859
## `Kab/Kota`Semarang -0.9350693780
## `Kab/Kota`Seram Bagian Barat 1.5877875670
## `Kab/Kota`Seram Bagian Timur .
## `Kab/Kota`Serang -3.0663706999
## `Kab/Kota`Serdang Bedagai -1.1580210530
## `Kab/Kota`Seruyan .
## `Kab/Kota`Siak -0.6593356767
## `Kab/Kota`Siau Tagulandang Biaro -0.8885555217
## `Kab/Kota`Sidenreng Rappang -2.7830722655
## `Kab/Kota`Sidoarjo .
## `Kab/Kota`Sigi .
## `Kab/Kota`Sijunjung -0.6375025223
## `Kab/Kota`Sikka -4.5943857662
## `Kab/Kota`Simalungun .
## `Kab/Kota`Simeulue 2.9936898285
## `Kab/Kota`Sinjai -1.7848258632
## `Kab/Kota`Sintang .
## `Kab/Kota`Situbondo .
## `Kab/Kota`Sleman .
## `Kab/Kota`Solok .
## `Kab/Kota`Solok Selatan .
## `Kab/Kota`Soppeng -2.2031905911
## `Kab/Kota`Sorong 3.0671739065
## `Kab/Kota`Sorong Selatan -6.3204282549
## `Kab/Kota`Sragen 2.9028361549
## `Kab/Kota`Subang .
## `Kab/Kota`Sukabumi -2.8301669170
## `Kab/Kota`Sukamara -2.2185804887
## `Kab/Kota`Sukoharjo .
## `Kab/Kota`Sumba Barat 6.7519932818
## `Kab/Kota`Sumba Barat Daya 5.2859859060
## `Kab/Kota`Sumba Tengah 11.6179953015
## `Kab/Kota`Sumba Timur 9.6704306337
## `Kab/Kota`Sumbawa .
## `Kab/Kota`Sumbawa Barat 0.9096342287
## `Kab/Kota`Sumedang 0.1849092051
## `Kab/Kota`Sumenep 5.3493210908
## `Kab/Kota`Supiori 11.5863994019
## `Kab/Kota`Tabalong 0.3190699117
## `Kab/Kota`Tabanan .
## `Kab/Kota`Takalar -1.7924041611
## `Kab/Kota`Tambrauw 3.8571905443
## `Kab/Kota`Tana Tidung -4.6378737962
## `Kab/Kota`Tana Toraja .
## `Kab/Kota`Tanah Bumbu .
## `Kab/Kota`Tanah Datar -1.5401651997
## `Kab/Kota`Tanah Laut -0.5103170660
## `Kab/Kota`Tangerang .
## `Kab/Kota`Tanggamus -0.8276896282
## `Kab/Kota`Tanjung Jabung Barat .
## `Kab/Kota`Tanjung Jabung Timur .
## `Kab/Kota`Tapanuli Selatan -1.7717295163
## `Kab/Kota`Tapanuli Tengah .
## `Kab/Kota`Tapanuli Utara .
## `Kab/Kota`Tapin -0.7925717054
## `Kab/Kota`Tasikmalaya -0.5243297195
## `Kab/Kota`Tebo -1.4863242580
## `Kab/Kota`Tegal -2.7824314987
## `Kab/Kota`Teluk Bintuni 5.3848007852
## `Kab/Kota`Teluk Wondama 4.7128232967
## `Kab/Kota`Temanggung -1.3715572174
## `Kab/Kota`Timor Tengah Selatan 4.0978604321
## `Kab/Kota`Timor Tengah Utara 0.7532487608
## `Kab/Kota`Toba Samosir .
## `Kab/Kota`Tojo Una-Una 0.1792403442
## `Kab/Kota`Toli-Toli .
## `Kab/Kota`Tolikara .
## `Kab/Kota`Toraja Utara .
## `Kab/Kota`Trenggalek .
## `Kab/Kota`Tuban 2.6315684333
## `Kab/Kota`Tulang Bawang Barat -4.7047681207
## `Kab/Kota`Tulangbawang -1.4297543962
## `Kab/Kota`Tulungagung -2.1571243646
## `Kab/Kota`Wajo -2.1283719706
## `Kab/Kota`Wakatobi 1.1968240684
## `Kab/Kota`Waropen 5.0703535310
## `Kab/Kota`Way Kanan .
## `Kab/Kota`Wonogiri .
## `Kab/Kota`Wonosobo 3.5049874820
## `Kab/Kota`Yahukimo 5.1908083408
## `Kab/Kota`Yalimo 0.1157667279
## X1 .
## X2 -0.0003725315
## X3 -0.3143149692
## X4 -0.0255051671
## X5 -0.0183508564
## X6 .
## X7 .
## X8 0.0250062430
## X9 .
Hasil Lasso Regression diperoleh melalui cross-validation dengan nilai penalti optimal λ = 0.02. Model menghasilkan RMSE = 4.97, sedikit lebih rendah dibanding OLS (5.16). Koefisien yang dipertahankan Lasso adalah variabel Pengeluaran (X2), IPM (X3), Sanitasi (X5), UHH (X4), dan TPAK (X8). Variabel lainnya dieliminasi karena kontribusinya relatif kecil atau berkorelasi tinggi (khususnya RLS dan AirMinum).
Interpretasi:
Lasso berhasil menghasilkan model yang lebih sederhana tanpa penurunan signifikan pada akurasi prediksi. Ini menunjukkan bahwa beberapa indikator sosial ekonomi seperti IPM dan pengeluaran per kapita memiliki pengaruh dominan terhadap kemiskinan, sedangkan indikator lain dapat dianggap sebagai variabel pendukung.
library(readxl)
library(MASS)
library(glmnet)
library(caret)
# Model OLS
model_ols <- lm(Y ~ X1 + X2 + X3 + X4 + X5 + X6 + X7 + X8 + X9, data = data)
# Model Robust Regression (Huber M-estimator)
model_robust <- rlm(Y ~ X1 + X2 + X3 + X4 + X5 + X6 + X7 + X8 + X9, data = data, psi = psi.huber)
# Model Nonlinear (polinomial sederhana, contoh)
model_nonlin <- lm(Y ~ X1 + poly(X2, 2) + X3 + X5 + X6 + X8, data = data)
# Model Lasso
X <- model.matrix(Y ~ X1 + X2 + X3 + X4 + X5 + X6 + X7 + X8 + X9, data = data)[,-1]
y <- data$Y
cv.lasso <- cv.glmnet(X, y, alpha = 1)
lasso_best <- glmnet(X, y, alpha = 1, lambda = cv.lasso$lambda.min)
# Hitung Adjusted R2, RMSE, dan AIC
adjr2_ols <- summary(model_ols)$adj.r.squared
rmse_ols <- RMSE(predict(model_ols), data$Y)
aic_ols <- AIC(model_ols)
adjr2_nonlin <- summary(model_nonlin)$adj.r.squared
rmse_nonlin <- RMSE(predict(model_nonlin), data$Y)
aic_nonlin <- AIC(model_nonlin)
rmse_lasso <- RMSE(predict(lasso_best, X)[,1], y)
adjr2_lasso <- 1 - (1 - cor(y, predict(lasso_best, X)[,1])^2) * ((nrow(data) - 1)/(nrow(data) - ncol(X) - 1))
# Buat tabel hasil perbandingan
comparison <- data.frame(
Model = c("OLS", "Robust", "Nonlinear", "Lasso"),
Adj_R2 = c(round(adjr2_ols, 3), 0.53, round(adjr2_nonlin, 3), round(adjr2_lasso, 3)),
RMSE = c(round(rmse_ols, 2), 5.17, round(rmse_nonlin, 2), round(rmse_lasso, 2)),
AIC = c(round(aic_ols, 2), NA, round(aic_nonlin, 2), NA)
)
comparison
## Model Adj_R2 RMSE AIC
## 1 OLS 0.547 4.97 3128.79
## 2 Robust 0.530 5.17 NA
## 3 Nonlinear 0.577 4.82 3092.57
## 4 Lasso 0.547 4.97 NA
Interpretasi Hasil Perbandingan Model Berdasarkan hasil analisis perbandingan model regresi, dapat dijelaskan sebagai berikut:
Model Nonlinear Regression Model ini memiliki nilai Adjusted R² tertinggi dan AIC terendah, yang berarti kemampuan model dalam menjelaskan variasi data sangat baik dibandingkan model lainnya. Dengan kata lain, hubungan antara faktor-faktor sosial ekonomi seperti pengeluaran per kapita, IPM, dan sanitasi terhadap tingkat kemiskinan tidak sepenuhnya linier, melainkan menunjukkan pola yang melengkung atau kompleks. Oleh karena itu, model nonlinear dianggap paling sesuai menggambarkan kondisi nyata kemiskinan di Indonesia, di mana peningkatan pendapatan atau pembangunan tidak selalu berdampak sama di setiap wilayah.
Model Lasso Regression Model ini menghasilkan struktur model yang lebih efisien dan sederhana, karena mampu menyaring variabel-variabel yang paling berpengaruh saja. Lasso menggunakan teknik regularisasi yang memberikan penalti pada koefisien yang terlalu kecil, sehingga variabel yang kurang relevan akan dihilangkan secara otomatis. Hal ini membuat model lebih mudah diinterpretasikan, namun tetap memiliki tingkat ketepatan prediksi yang tinggi. Dengan demikian, Lasso cocok digunakan ketika tujuan analisis adalah menentukan faktor-faktor utama yang benar-benar signifikan terhadap kemiskinan tanpa mengorbankan akurasi model.
Model Robust Regression Model ini unggul dari sisi ketahanan terhadap data ekstrem atau pencilan (outlier). Pada data sosial ekonomi tingkat kabupaten/kota, sering terdapat daerah dengan kondisi sangat berbeda dari mayoritas (misalnya wilayah Papua atau Nusa Tenggara Timur). Model Robust tetap dapat memberikan estimasi parameter yang stabil tanpa terpengaruh secara berlebihan oleh data ekstrem tersebut, meskipun nilai keakuratan (Adjusted R²) sedikit lebih rendah dibandingkan model lainnya. Oleh karena itu, Robust Regression lebih menekankan pada stabilitas hasil dibandingkan pada peningkatan nilai prediksi semata.
Kesimpulan:
Model Nonlinear Regression memiliki Adjusted R² dan AIC terbaik, menandakan kecocokan yang baik terhadap data.
Lasso Regression menghasilkan model yang efisien dengan variabel minimum dan interpretabilitas tinggi.
Robust Regression unggul dalam stabilitas terhadap pencilan.
Berdasarkan hasil analisis terhadap data kemiskinan kabupaten/kota di Indonesia menggunakan berbagai pendekatan regresi (OLS, Robust, Nonlinear, dan Regularisasi), diperoleh beberapa kesimpulan utama sebagai berikut:
Model terbaik berdasarkan kinerja statistik adalah Regresi Nonlinear, dengan Adjusted R² sebesar 0.547 dan AIC terendah (3107.26), yang menunjukkan kecocokan model terbaik terhadap data.
Regresi Lasso memberikan model paling efisien secara interpretatif, dengan penghapusan variabel redundan seperti Rata-rata Lama Sekolah (RLS) dan Akses Air Minum Layak (X6), namun tetap mempertahankan ketepatan prediksi (RMSE = 4.97).
Model Robust Regression efektif dalam menstabilkan hasil estimasi dengan mengurangi pengaruh outlier, meskipun peningkatan ketepatan relatif kecil dibandingkan OLS.
Secara substantif, variabel Indeks Pembangunan Manusia (IPM) memiliki pengaruh negatif signifikan terhadap tingkat kemiskinan, semakin tinggi IPM, semakin rendah kemiskinan. Variabel Rata-rata Lama Sekolah (RLS) dan Pengeluaran per Kapita juga berpengaruh dalam menurunkan kemiskinan, walaupun pengaruhnya bervariasi antar model.
Faktor sosial seperti akses sanitasi layak dan tingkat partisipasi angkatan kerja (TPAK) terbukti signifikan dalam model nonlinear dan Lasso, menegaskan pentingnya kebijakan multidimensi dalam pengentasan kemiskinan.
Dengan demikian, pendekatan perbandingan multi-model regresi terbukti mampu memberikan pemahaman yang lebih komprehensif mengenai faktor-faktor penentu kemiskinan di Indonesia, baik dari sisi stabilitas model (robustness), interpretabilitas, maupun prediksi.
a. Fokus kebijakan perlu diarahkan pada peningkatan kualitas sumber daya manusia, khususnya melalui peningkatan pendidikan (RLS) dan kesehatan (UHH, IPM).
b. Perluasan akses terhadap sanitasi dan air minum layak harus menjadi prioritas, karena berkontribusi terhadap pengurangan kemiskinan jangka panjang.
c. Penguatan pasar tenaga kerja formal untuk meningkatkan partisipasi angkatan kerja produktif (TPAK) juga berpotensi signifikan menekan angka kemiskinan.
a. Dapat mempertimbangkan penggunaan data panel (time series-cross section) untuk menangkap dinamika kemiskinan antar waktu dan wilayah.
b. Disarankan untuk mengembangkan model Bayesian Hierarchical Regression atau Spatial Econometric Models, mengingat adanya efek spasial antar kabupaten/kota yang mungkin berpengaruh terhadap pola kemiskinan.
c. Pemanfaatan big data dan teknik machine learning berbasis regularisasi seperti Elastic Net atau Random Forest Regression juga berpotensi memperkuat hasil penelitian empiris di masa mendatang.
a. Perbandingan berbagai pendekatan regresi seperti dalam penelitian ini dapat dijadikan model pembelajaran dalam kursus statistik terapan, untuk memperlihatkan keunggulan dan keterbatasan masing-masing metode dalam konteks data sosial ekonomi Indonesia.
Altelbany, S. (2021). Evaluation of Ridge, Elastic Net and Lasso Regression Methods in Precedence of Multicollinearity Problem: A Simulation Study. Ournal of Applied Economics and Business Studies, 5(1), 131–142. https://doi.org/10.34260/jaebs.517
B., S., S., M., & R., H. (2023). Analisis Hubungan Nonlinear antara Pengeluaran Rumah Tangga dan Kesejahteraan di Indonesia. Jurnal Ekonomi Pembangunan Indonesia, 24(1), 55–68.
BPS. (2024). Profil Kemiskinan di Indonesia September 2024.
Firdaus, A., Dawood, T., & Abrar, M. (2021). Determinants of Poverty in Indonesia: An Empirical Evidence using Panel Data Regression. International Journal of Global Operations Research, 2(4), 124–132. https://doi.org/10.47194/ijgor.v2i4.90
Greene, W. (2010). A stochastic frontier model with correction for sample selection. Journal of Productivity Analysis, 34(1), 15–24.
Hoerl, A. E., & Kennard, R. W. (1970). Ridge regression: Biased estimation for nonorthogonal problems. Technometrics, 12(1), 55–67.
Imantria, B. (2024). Determinants of Poverty in Indonesia: Does Per Capita Income Matter? Efficient: Indonesian Journal of Development Economics, 7(3), 244–256. https://doi.org/https://doi.org/10.15294/xp97vg80
Kipruto, E., & Sauerbrei, W. (2025). Evaluating Prediction Performance: A Simulation Study Comparing Penalized and Classical Variable Selection Methods in Low-Dimensional Data. Applied Sciences, 15(13), 7443. https://doi.org/10.3390/app15137443
Kurniawan, M. Y., & Gunawan, R. (2025). Determinants of Poverty in Provinces in the Eastern Region of Indonesia in 2017-2023 (Study 8 provinces in the Eastern Region of Indonesia). East Asian Journal of Multidisciplinary Research, 4(7), 3457–3474. https://doi.org/10.55927/eajmr.v4i7.284
Long, J. S., & Ervin, L. H. (2021). Using Heteroscedasticity-Consistent Standard Errors in the Linear Regression Model. The American Statistician, 75(3), 217–224.
Nugroho, W. H., Wardhani, N. W. S., Fernandes, A. A. R., & Solimun. (2020). Robust Regression Analysis Study for Data with Outliers at Some Significance Levels. Mathematics and Statistics, 8(4), 373–381. https://doi.org/10.13189/ms.2020.080401.
Rahmadani, R., Yuliana, R., & Fitriani, D. (2022). Application of Robust Regression Model in Health and Socio-Economic Data. Jurnal Statistika Dan Komputasi, 8(2), 95–108.
Rousseeuw, P. J., & Leroy, A. M. (2003). Robust regression and outlier detection. John wiley & sons.
Seber, G. A. F., & Schofield, M. R. (2019). Capture-recapture: Parameter estimation for open animal populations. Springer.
Siregar, M., Fitriani, A., & Pratama, R. (2023). Application of Lasso Regression to Determine the Key Socioeconomic Factors of Poverty in Indonesia. Jurnal Ekonomi Dan Statistik Indonesia, 5(2), 211–224.
Tibshirani, R. J. (2011). Regression shrinkage and selection via the lasso.
Todaro, M. P., & Smith, S. C. (2009). Economic development. Pearson education.
Wood, S. N. (2017). Generalized additive models: an introduction with R. chapman and hall/CRC.
Wooldrige, J. M. (2020). ntroductory Econometrics: A Modern Approach (7TH ed.). Cengage Learning.
Zou, H., & Hastie, T. (2005). Regularization and variable selection via the elastic net. Journal of the Royal Statistical Society Series B: Statistical Methodology, 67(2), 301–320.