Pembangunan manusia menjadi salah satu fokus utama pemerintah untuk meningkatkan kualitas hidup masyarakat. Indeks Pembangunan Manusia (IPM) digunakan secara luas sebagai indikator komposit untuk mengukur capaian pembangunan manusia dalam suatu wilayah, yang mencakup dimensi pendidikan, kesehatan, dan standar hidup. IPM yang tinggi mencerminkan kualitas hidup yang lebih baik dan pemerataan kesejahteraan yang lebih merata.
Berbagai faktor dapat memengaruhi IPM, baik secara langsung maupun tidak langsung. Di antaranya adalah faktor ekonomi, ketenagakerjaan, dan distribusi pendapatan. Tingkat Pengangguran Terbuka (TPT) merupakan indikator yang mencerminkan proporsi angkatan kerja yang tidak bekerja tetapi aktif mencari pekerjaan. Tingginya TPT dapat menurunkan pendapatan rumah tangga dan membatasi akses masyarakat terhadap layanan dasar, sehingga berpotensi menurunkan IPM.
Gini Rasio mengukur tingkat ketimpangan distribusi pendapatan. Ketimpangan yang tinggi dapat menghambat pemerataan kesejahteraan dan membatasi peningkatan IPM di beberapa wilayah. Produk Domestik Regional Bruto (PDRB) per kapita menggambarkan kapasitas ekonomi suatu wilayah dalam menyediakan kebutuhan dasar bagi masyarakat, sementara Tingkat Partisipasi Angkatan Kerja (TPAK) menunjukkan sejauh mana penduduk usia produktif terlibat dalam kegiatan ekonomi, yang berdampak pada produktivitas dan kesejahteraan masyarakat. Pendapatan Per Kapita juga menjadi faktor penting, karena semakin tinggi pendapatan individu, semakin besar kemampuan masyarakat dalam memenuhi kebutuhan dasar, sehingga meningkatkan kualitas hidup.
Secara umum, penelitian mengenai faktor-faktor yang memengaruhi IPM sangat penting untuk merumuskan kebijakan pembangunan yang tepat sasaran. Namun, di tingkat regional, seperti di provinsi Jawa Timur, analisis empiris masih diperlukan untuk memahami pengaruh relatif masing-masing faktor tersebut terhadap IPM, mengingat adanya variasi kondisi ekonomi, sosial, dan demografis antar kabupaten/kota.
Selain itu, dalam analisis data, kehadiran outlier dan pelanggaran asumsi klasik pada regresi linear berganda sering kali mengganggu hasil estimasi. Oleh karena itu, penggunaan metode robust regression, khususnya MM-Estimator, dapat memberikan hasil yang lebih andal dan stabil dibandingkan regresi OLS konvensional.
Dengan latar belakang tersebut, penelitian ini akan menganalisis pengaruh TPT, Gini Rasio, PDRB, TPAK, dan Pendapatan Per Kapita terhadap IPM di kabupaten/kota Jawa Timur menggunakan pendekatan regresi robust MM-Estimator. Penelitian ini diharapkan dapat memberikan gambaran empiris mengenai faktor-faktor dominan yang memengaruhi IPM dan memberikan dasar rekomendasi kebijakan pembangunan manusia yang lebih efektif.
Bagaimana pengaruh TPT, Gini Rasio, PDRB, TPAK, dan Pendapatan Per Kapita terhadap IPM?
Mengidentifikasi pengaruh TPT, Gini Rasio, PDRB, TPAK, dan Pendapatan Per Kapita terhadap IPM.
Data sekunder dari BPS.
Fokus pada kabupaten/kota di Jawa Timur.
Variabel yang dianalisis terbatas pada TPT, Gini, PDRB, TPAK, dan Pendapatan Per Kapita.
Indeks Pembangunan Manusia (IPM) adalah indikator komposit yang digunakan untuk mengukur capaian pembangunan manusia dalam suatu wilayah. IPM menggabungkan tiga dimensi utama, yaitu pendidikan, kesehatan, dan standar hidup (UNDP, 2022). Dimensi pendidikan diukur melalui rata-rata lama sekolah dan harapan lama sekolah, dimensi kesehatan melalui harapan hidup saat lahir, dan dimensi standar hidup melalui pendapatan per kapita. IPM digunakan sebagai tolok ukur kualitas hidup, pemerataan kesejahteraan, serta efektivitas pembangunan ekonomi di tingkat regional maupun nasional.
Tingkat Pengangguran Terbuka (TPT) mencerminkan proporsi angkatan kerja yang tidak memiliki pekerjaan namun aktif mencari pekerjaan. TPT yang tinggi dapat menurunkan pendapatan rumah tangga dan membatasi akses masyarakat terhadap layanan dasar, sehingga berdampak negatif pada IPM (Filzmoser & Götz, 2021).
Gini Rasio digunakan untuk mengukur ketimpangan distribusi pendapatan dalam suatu wilayah. Semakin tinggi nilai Gini, semakin besar ketimpangan pendapatan, yang berpotensi menghambat pemerataan kesejahteraan dan menurunkan efektivitas peningkatan IPM (Singgih, 2022).
PDRB menunjukkan total nilai barang dan jasa yang dihasilkan di suatu wilayah dalam periode tertentu. PDRB per kapita digunakan sebagai indikator standar hidup, karena menunjukkan kapasitas ekonomi wilayah dalam menyediakan kebutuhan dasar bagi masyarakat (Yang, 2018).
TPAK mengukur persentase penduduk usia kerja yang aktif terlibat dalam kegiatan ekonomi, baik bekerja maupun mencari pekerjaan. Tingkat partisipasi yang tinggi dapat meningkatkan produktivitas ekonomi, meningkatkan pendapatan rumah tangga, dan berdampak positif terhadap IPM (Filzmoser & Götz, 2021).
Pendapatan Per Kapita menggambarkan rata-rata pendapatan individu dalam suatu wilayah. Pendapatan yang lebih tinggi memungkinkan masyarakat memenuhi kebutuhan dasar dan meningkatkan kualitas hidup, sehingga berdampak positif pada IPM (UNDP, 2022).
\[ Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \cdots + \beta_i X_i + \epsilon_i \]
dimana:
\(Y\) : variabel dependen (respon)
\(X_1, X_2, \ldots, X_i\) : variabel independen (prediktor)
\(\beta_0\) : intercept
\(\beta_1, \beta_2, \ldots, \beta_i\) : koefisien regresi
\(\epsilon\) : galat (error)
MM-Estimator menggabungkan dua pendekatan:
S-Estimator: Digunakan untuk menemukan estimasi awal koefisien yang tahan terhadap outlier.
M-Estimator: Digunakan untuk memperoleh estimasi koefisien akhir yang efisien dan stabil, dengan memberikan bobot lebih rendah pada observasi yang ekstrem.
Keunggulan MM-Estimator untuk data non-normal antara lain:
Tahan terhadap outlier dan leverage point: Koefisien estimasi tidak terdistorsi oleh nilai ekstrem dalam variabel dependen atau independen.
Efisien dalam kondisi non-normal: Meskipun distribusi residual menyimpang dari normalitas, MM-Estimator tetap menghasilkan estimasi yang relatif tidak bias dan varians yang rendah.
Interpretasi koefisien yang valid: Hasil analisis dapat dipercaya karena estimasi koefisien merefleksikan hubungan sebenarnya antarvariabel, bukan dipengaruhi oleh observasi ekstrem.
Secara matematis, MM-Estimator meminimalkan fungsi objektif yang menurunkan bobot observasi dengan residual besar, sehingga residual yang menyimpang tidak mendominasi estimasi parameter:
\[ \hat{\beta}_{MM} = \arg \min_\beta \sum_{i=1}^{n} \rho \Bigg( \frac{y_i - x_i^\top \beta}{s} \Bigg) \]
dengan:
\(\rho\) : fungsi loss robust, memberikan bobot lebih rendah untuk residual besar
\(s\) : skala estimasi dari residual awal
Penelitian ini termasuk penelitian kuantitatif dengan pendekatan ekplanatori (explanatory research).
Penelitian dilakukan di provinsi Jawa Timur, dengan unit analisis berupa kabupaten/kota. Data yang digunakan adalah data sekunder dari Badan Pusat Statistik (BPS).
## WILAYAH IPM TPT GINIRASIO PDRB TPAK PENDAPATANPERKAPITA
## 1 Kabupaten Pacitan 71.49 1.56 0.327 0.65 86.62 10099
## 2 Kabupaten Ponorogo 73.70 4.19 0.326 0.85 78.75 11065
## 3 Kabupaten Trenggalek 72.47 3.90 0.350 0.77 80.08 10872
## 4 Kabupaten Tulungagung 75.13 4.12 0.321 1.61 75.57 11966
## 5 Kabupaten Blitar 73.44 4.77 0.353 1.51 72.36 12020
## 6 Kabupaten Kediri 75.18 5.10 0.300 1.72 71.31 12588
## 7 Kabupaten Malang 73.53 5.13 0.343 4.36 72.90 11190
## 8 Kabupaten Lumajang 70.31 3.28 0.363 1.36 70.86 10124
## 9 Kabupaten Jember 70.93 3.23 0.321 3.24 73.76 10700
## 10 Kabupaten Banyuwangi 74.30 4.03 0.312 3.43 75.36 13320
## 11 Kabupaten Bondowoso 71.22 3.63 0.333 0.84 75.10 11689
## 12 Kabupaten Situbondo 71.22 3.15 0.385 0.85 76.66 11216
## 13 Kabupaten Probolinggo 70.85 3.00 0.339 1.44 73.18 12258
## 14 Kabupaten Pasuruan 72.36 5.02 0.331 6.35 75.31 11617
## 15 Kabupaten Sidoarjo 82.67 6.49 0.327 9.35 68.37 15710
## 16 Kabupaten Mojokerto 76.69 3.87 0.337 3.56 73.94 13905
## 17 Kabupaten Jombang 75.67 3.75 0.302 1.70 71.88 12454
## 18 Kabupaten Nganjuk 75.24 3.87 0.289 1.14 69.79 13376
## 19 Kabupaten Madiun 74.81 4.34 0.309 0.81 72.34 12668
## 20 Kabupaten Magetan 76.77 3.28 0.371 0.77 77.04 12915
## 21 Kabupaten Ngawi 73.91 2.40 0.289 0.82 75.73 12414
## 22 Kabupaten Bojonegoro 72.75 4.42 0.310 3.21 73.86 11204
## 23 Kabupaten Tuban 72.31 4.28 0.335 2.74 74.55 11579
## 24 Kabupaten Lamongan 75.90 4.34 0.281 1.64 74.80 12419
## 25 Kabupaten Gresik 78.93 6.45 0.322 5.94 71.61 14356
## 26 Kabupaten Bangkalan 67.33 5.35 0.301 0.91 70.48 9841
## 27 Kabupaten Sampang 66.72 2.50 0.233 0.78 73.62 9782
## 28 Kabupaten Pamekasan 70.85 1.64 0.301 0.71 79.13 9811
## 29 Kabupaten Sumenep 69.78 1.69 0.308 1.42 78.16 10156
## 30 Kota Kediri 81.88 3.91 0.337 5.32 70.74 13670
## 31 Kota Blitar 81.44 5.11 0.353 0.29 70.44 14933
## 32 Kota Malang 84.68 6.10 0.422 3.15 67.52 17791
## 33 Kota Probolinggo 77.79 4.44 0.344 0.48 67.55 13405
## 34 Kota Pasuruan 78.90 4.63 0.334 0.35 72.72 14664
## 35 Kota Mojokerto 81.76 3.76 0.357 0.27 72.68 14842
## 36 Kota Madiun 84.51 4.30 0.435 0.59 70.60 17518
## 37 Kota Surabaya 84.69 4.91 0.381 24.34 70.49 19666
## 38 Kota Batu 79.69 3.63 0.327 0.70 73.53 14253
Variabel Penelitian
| Variabel | Jenis | Definisi_Operasional |
|---|---|---|
| IPM | Dependen | Indeks Pembangunan Manusia di Jawa Timur |
| TPT | Independen | Persentase angkatan kerja yang tidak bekerja tetapi aktif mencari pekerjaan |
| Gini Rasio | Independen | Ukuran ketimpangan distribusi pendapatan |
| PDRB | Independen | Produk Domestik Regional Bruto per kapita |
| TPAK | Independen | Persentase partisipasi angkatan kerja usia produktif |
| Pendapatan Per Kapita | Independen | Rata-rata pendapatan per individu |
\[ IPM_i = \beta_0 + \beta_1 TPT_i + \beta_2 GINI_i + \beta_3 PDRB_i + \beta_4 TPAK_i + \beta_5 PENDPK_i + \epsilon_i \]
dengan keterangan:
\(IPM_i\) : Indeks Pembangunan Manusia pada kabupaten/kota ke-\(i\)
\(TPT_i\) : Tingkat Pengangguran Terbuka pada kabupaten/kota ke-\(i\)
\(GINI_i\) : Gini Rasio pada kabupaten/kota ke-\(i\)
\(PDRB_i\) : Produk Domestik Regional Bruto per kapita pada kabupaten/kota ke-\(i\)
\(TPAK_i\) : Tingkat Partisipasi Angkatan Kerja pada kabupaten/kota ke-\(i\)
\(PENDPK_i\) : Pendapatan per kapita pada kabupaten/kota ke-\(i\)
\(\epsilon_i\) : komponen error (gangguan)
##
## Call:
## lm(formula = IPM ~ TPT + GINIRASIO + PDRB + TPAK + PENDAPATANPERKAPITA,
## data = dataset)
##
## Residuals:
## Min 1Q Median 3Q Max
## -3.1812 -0.9589 0.0272 0.9680 5.5049
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 37.9718361 9.5392987 3.981 0.00037 ***
## TPT 0.4133766 0.3350969 1.234 0.22634
## GINIRASIO 1.1022978 9.4233868 0.117 0.90761
## PDRB -0.1729865 0.0826173 -2.094 0.04428 *
## TPAK 0.1246869 0.1096352 1.137 0.26386
## PENDAPATANPERKAPITA 0.0020860 0.0002038 10.235 1.28e-11 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1.705 on 32 degrees of freedom
## Multiple R-squared: 0.889, Adjusted R-squared: 0.8717
## F-statistic: 51.26 on 5 and 32 DF, p-value: 2.425e-14
Interpretasi:
Intercept (37.97): Ketika semua variabel independen bernilai nol, nilai IPM diperkirakan sebesar 37.97. Nilai ini tidak memiliki makna praktis langsung, tetapi berfungsi sebagai titik awal model.
TPT (0.413): Koefisien positif menunjukkan bahwa setiap kenaikan 1% dalam Tingkat Pengangguran Terbuka diperkirakan meningkatkan IPM sebesar 0.41 poin. Namun, nilai p = 0.226 > 0.05, sehingga pengaruh ini tidak signifikan secara statistik.
GINIRASIO (1.10): Koefisien positif sangat kecil dan tidak signifikan (p = 0.907), menunjukkan bahwa ketimpangan pendapatan tidak memiliki pengaruh yang berarti terhadap IPM dalam model ini.
PDRB (-0.173): Koefisien negatif dan signifikan (p = 0.044 < 0.05), menunjukkan bahwa peningkatan PDRB per kapita justru berkorelasi negatif dengan IPM. Hal ini bisa mengindikasikan bahwa pertumbuhan ekonomi belum merata atau belum berdampak langsung pada kualitas hidup.
TPAK (0.125): Koefisien positif namun tidak signifikan (p = 0.263), menunjukkan bahwa partisipasi angkatan kerja belum memberikan pengaruh yang cukup kuat terhadap IPM.
Pendapatan Per Kapita (0.002086): Koefisien positif dan sangat signifikan (p < 0.001), menunjukkan bahwa setiap kenaikan Rp1.000 dalam pendapatan per kapita diperkirakan meningkatkan IPM sebesar 2 poin. Ini adalah variabel paling berpengaruh dalam model.
R-squared (0.889) dan Adjusted R-squared (0.8717) menunjukkan bahwa model mampu menjelaskan sekitar 89% variasi IPM.
Hasil regresi menunjukkan bahwa dari lima variabel independen yang dianalisis, hanya Pendapatan Per Kapita dan PDRB yang memiliki pengaruh signifikan terhadap IPM. Pendapatan Per Kapita memiliki pengaruh positif yang sangat kuat, yang sejalan dengan teori bahwa peningkatan pendapatan memungkinkan masyarakat memenuhi kebutuhan dasar dan meningkatkan kualitas hidup.
Sebaliknya, PDRB menunjukkan pengaruh negatif yang signifikan. Hal ini bisa terjadi jika pertumbuhan ekonomi tidak merata atau hanya dinikmati oleh kelompok tertentu, sehingga tidak berdampak langsung pada pembangunan manusia secara keseluruhan.
Variabel lain seperti TPT, Gini Rasio, dan TPAK tidak menunjukkan pengaruh signifikan. Ini bisa disebabkan oleh beberapa hal, seperti:
Variasi data antar kabupaten/kota yang tidak cukup besar.
Adanya multikolinearitas atau interaksi antar variabel yang tidak tertangkap oleh model linear.
Faktor-faktor lain yang lebih dominan dalam mempengaruhi IPM, seperti kualitas pendidikan dan layanan kesehatan, yang tidak dimasukkan dalam model.
Secara keseluruhan, model regresi ini memberikan gambaran bahwa pendapatan masyarakat adalah faktor utama dalam peningkatan IPM, sementara pertumbuhan ekonomi makro seperti PDRB perlu dikaji lebih lanjut agar dampaknya lebih merata. Penelitian lanjutan dapat mempertimbangkan pendekatan non-linear atau segmentasi wilayah untuk menangkap dinamika yang lebih kompleks.
Uji Linearitas
##
## RESET test
##
## data: fit_ols
## RESET = 2.8378, df1 = 2, df2 = 30, p-value = 0.07434
##
## Family: gaussian
## Link function: identity
##
## Formula:
## IPM ~ s(TPT) + s(TPAK) + s(PDRB) + s(GINIRASIO) + s(PENDAPATANPERKAPITA)
##
## Parametric coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 75.3105 0.2469 305.1 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Approximate significance of smooth terms:
## edf Ref.df F p-value
## s(TPT) 1.000 1.000 0.008 0.929
## s(TPAK) 1.761 2.209 1.235 0.337
## s(PDRB) 1.000 1.000 0.408 0.528
## s(GINIRASIO) 1.000 1.000 0.951 0.338
## s(PENDAPATANPERKAPITA) 3.021 3.619 36.916 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## R-sq.(adj) = 0.898 Deviance explained = 91.9%
## GCV = 3.0118 Scale est. = 2.3158 n = 38
Hasil model GAM menunjukkan bahwa dari lima variabel independen, hanya Pendapatan Per Kapita yang memiliki pengaruh signifikan terhadap IPM, dan hubungan tersebut bersifat non-linear. Hal ini terlihat dari nilai edf (effective degrees of freedom) sebesar 3.021 dan F-statistik yang sangat tinggi, menandakan bahwa peningkatan pendapatan memiliki dampak yang semakin besar terhadap IPM, terutama pada tingkat pendapatan yang lebih tinggi.
Visualisasi smooth function dari plot GAM memperkuat interpretasi ini:
s(PENDAPATANPERKAPITA) menunjukkan kurva yang naik tajam, menandakan bahwa efek pendapatan terhadap IPM tidak konstan, melainkan semakin kuat pada level pendapatan tertentu.
Variabel lain seperti TPT, TPAK, PDRB, dan GINIRASIO menunjukkan pola yang datar atau tidak signifikan, yang berarti hubungan mereka terhadap IPM tidak cukup kuat atau tidak berbentuk non-linear yang berarti.
Pendapatan Per Kapita tetap menjadi faktor dominan dalam peningkatan IPM, dan efeknya bersifat non-linear. Kebijakan peningkatan pendapatan harus mempertimbangkan bahwa dampaknya terhadap pembangunan manusia bisa meningkat secara eksponensial.
Uji Multikolinearitas
## TPT GINIRASIO PDRB TPAK
## 1.979928 1.558474 1.483305 2.137617
## PENDAPATANPERKAPITA
## 2.795514
Berdasarkan hasil VIF di atas, tidak ditemukan multikolinearitas yang serius di antara variabel-variabel independen. Semua nilai VIF berada di bawah ambang batas umum yaitu 5, bahkan sebagian besar di bawah 2, yang menunjukkan bahwa masing-masing variabel memberikan informasi yang relatif unik terhadap model.
Namun, Pendapatan Per Kapita memiliki VIF tertinggi (2.80), yang bisa dimaklumi karena variabel ini juga merupakan prediktor paling dominan dan signifikan dalam model. Nilai ini masih dalam batas wajar dan tidak memerlukan tindakan korektif seperti penghapusan atau transformasi.
Secara keseluruhan, model regresi tidak terganggu oleh multikolinearitas, sehingga interpretasi koefisien dapat dilakukan.
Uji Heteroskedastisitas
##
## studentized Breusch-Pagan test
##
## data: fit_ols
## BP = 3.5939, df = 5, p-value = 0.6092
Karena nilai p-value > 0.05, maka varians residual adalah konstan. Dengan kata lain, model tidak mengalami heteroskedastisitas secara signifikan.
Hasil ini menunjukkan bahwa model regresi memenuhi asumsi homoskedastisitas, sehingga:
Estimasi koefisien regresi dapat dianggap efisien.
Uji t dan F tetap valid karena tidak terganggu oleh varians residual yang berubah-ubah.
Tidak diperlukan transformasi variabel atau penggunaan metode robust standard error untuk mengatasi heteroskedastisitas.
Namun, meskipun hasil uji formal menunjukkan tidak ada heteroskedastisitas, tetap disarankan untuk memeriksa plot diagnostik seperti Scale-Location plot dan Residuals vs Fitted untuk melihat pola visual yang mungkin tidak tertangkap oleh uji statistik.
Uji Autokorelasi
## lag Autocorrelation D-W Statistic p-value
## 1 0.08184438 1.817617 0.378
## Alternative hypothesis: rho != 0
Nilai Durbin-Watson mendekati 2, yang menunjukkan bahwa tidak terdapat autokorelasi positif maupun negatif yang signifikan dalam residual. Nilai p-value > 0.05 memperkuat kesimpulan bahwa tidak ada autokorelasi yang perlu dikhawatirkan.
Uji Normalitas
##
## Shapiro-Wilk normality test
##
## data: resid_ols
## W = 0.9395, p-value = 0.04035
Karena nilai p-value < 0.05, maka residual dari model tidak berdistribusi normal secara signifikan. Dalam konteks ini, karena jumlah observasi cukup memadai (n > 30) dan model menunjukkan R-squared tinggi serta residual yang relatif kecil, maka pelanggaran normalitas tidak terlalu mengganggu interpretasi model secara keseluruhan.
Outlier
Deteksi outlier dilakukan dengan menggunakan tiga indikator utama:
Studentized Residual: nilai absolut > 2 dianggap mencurigakan.
Cook’s Distance: nilai > 4/n (dalam hal ini, 4/38 ≈ 0.105) menunjukkan observasi yang sangat memengaruhi model.
Leverage: nilai > 2 × rata-rata leverage (rata-rata ≈ 0.13, sehingga ambang ≈ 0.26) menunjukkan observasi ekstrem dalam ruang prediktor.
Berdasarkan kriteria, ditemukan 8 observasi terindikasi sebagai outlier:
## Observasi yang dicurigai outlier:
## [1] 13 30 37 26 27 1 8 36
## WILAYAH IPM TPT GINIRASIO PDRB TPAK PENDAPATANPERKAPITA
## 13 Kabupaten Probolinggo 70.85 3.00 0.339 1.44 73.18 12258
## 30 Kota Kediri 81.88 3.91 0.337 5.32 70.74 13670
## 37 Kota Surabaya 84.69 4.91 0.381 24.34 70.49 19666
## 26 Kabupaten Bangkalan 67.33 5.35 0.301 0.91 70.48 9841
## 27 Kabupaten Sampang 66.72 2.50 0.233 0.78 73.62 9782
## 1 Kabupaten Pacitan 71.49 1.56 0.327 0.65 86.62 10099
## 8 Kabupaten Lumajang 70.31 3.28 0.363 1.36 70.86 10124
## 36 Kota Madiun 84.51 4.30 0.435 0.59 70.60 17518
## Observasi Studentized_Residual Cooks_Distance Leverage Is_Outlier
## 1 1 0.55766923 3.206384e-02 0.37705786 Ya
## 8 8 0.61189761 3.106335e-02 0.32798132 Ya
## 13 13 -2.03898156 5.458231e-02 0.07965188 Ya
## 26 26 -1.58800711 1.096238e-01 0.21459590 Ya
## 27 27 -1.38810985 1.159819e-01 0.27093277 Ya
## 30 30 4.11598342 1.589271e-01 0.07776820 Ya
## 36 36 -0.68580800 3.997664e-02 0.33401618 Ya
## 37 37 -2.03536254 3.248333e+00 0.83783874 Ya
## 2 2 0.55054654 7.959001e-03 0.13353901 Tidak
## 3 3 -0.01933277 1.367476e-05 0.17537122 Tidak
## 4 4 0.59204873 2.838704e-03 0.04544162 Tidak
## 5 5 -0.43911344 2.839590e-03 0.07930052 Tidak
## 6 6 -0.05028428 4.320951e-05 0.09036124 Tidak
## 7 7 0.87293820 2.154775e-02 0.14412935 Tidak
## 9 9 0.19014893 6.739575e-04 0.09785648 Tidak
## 10 10 -1.40165827 2.396242e-02 0.07010215 Tidak
## 11 11 -1.34409407 1.110315e-02 0.03642784 Tidak
## 12 12 -0.82578108 2.407060e-02 0.17333930 Tidak
## 14 14 -0.35997667 3.656669e-03 0.14141482 Tidak
## 15 15 1.30020907 6.365221e-02 0.18751143 Tidak
## 16 16 -0.51096876 1.983008e-03 0.04262112 Tidak
## 17 17 0.70322299 5.914524e-03 0.06596778 Tidak
## 18 18 -0.66623524 1.315668e-02 0.14875834 Tidak
## 19 19 -0.35792826 1.264871e-03 0.05448496 Tidak
## 20 20 0.37813557 2.698816e-03 0.09927336 Tidak
## 21 21 -0.35643440 3.779869e-03 0.14795198 Tidak
## 22 22 0.34891311 1.400869e-03 0.06292217 Tidak
## 23 23 -0.46126325 1.966464e-03 0.05131494 Tidak
## 24 24 0.54317521 7.213064e-03 0.12545774 Tidak
## 25 25 0.05735848 1.358612e-04 0.19358364 Tidak
## 28 28 1.05489334 3.151776e-02 0.14569099 Tidak
## 29 29 0.05297855 8.157102e-05 0.14452569 Tidak
## 31 31 0.66618070 8.820948e-03 0.10489211 Tidak
## 32 32 -0.86001259 4.417038e-02 0.26221358 Tidak
## 33 33 0.82253247 1.967751e-02 0.14729909 Tidak
## 34 34 -0.58382080 7.050208e-03 0.10837677 Tidak
## 35 35 1.16243780 2.609448e-02 0.10485628 Tidak
## 38 38 0.65917651 7.754197e-03 0.09517165 Tidak
Dari delapan observasi tersebut, Kota Kediri dan Kota Surabaya menunjukkan nilai residual yang sangat ekstrem, dengan Kota Surabaya juga memiliki leverage dan Cook’s Distance yang tinggi, menandakan pengaruh yang signifikan terhadap estimasi model. Observasi lainnya memiliki residual moderat dan leverage cukup tinggi, menunjukkan posisi unik pada ruang prediktor, namun pengaruhnya terhadap koefisien regresi relatif sedang. Kondisi ini menunjukkan bahwa beberapa kota besar dengan IPM tinggi dan PDRB besar serta beberapa kabupaten dengan karakteristik khusus dapat memengaruhi hasil model OLS secara signifikan. Oleh karena itu, disarankan untuk melakukan regresi robust atau analisis sensitivitas untuk mengurangi pengaruh outlier ekstrem dan memastikan hasil regresi lebih stabil dan representatif.
Tanpa Outlier
##
## Call:
## lm(formula = IPM ~ TPT + GINIRASIO + PDRB + TPAK + PENDAPATANPERKAPITA,
## data = dataset_clean)
##
## Residuals:
## Min 1Q Median 3Q Max
## -2.35309 -0.86088 0.00489 0.97869 1.99469
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 44.2022467 10.5423179 4.193 0.000323 ***
## TPT 0.3969409 0.3519976 1.128 0.270603
## GINIRASIO -3.3096268 8.9098920 -0.371 0.713558
## PDRB -0.1472635 0.1433200 -1.028 0.314423
## TPAK 0.0706692 0.1196469 0.591 0.560278
## PENDAPATANPERKAPITA 0.0020318 0.0002141 9.491 1.35e-09 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1.253 on 24 degrees of freedom
## Multiple R-squared: 0.9112, Adjusted R-squared: 0.8927
## F-statistic: 49.23 on 5 and 24 DF, p-value: 7.71e-12
Perbandingan OLS dengan outlier dan tanpa outlier
## Variabel Dengan_Outlier Tanpa_Outlier
## (Intercept) (Intercept) 37.971836078 44.202246718
## TPT TPT 0.413376605 0.396940878
## GINIRASIO GINIRASIO 1.102297794 -3.309626776
## PDRB PDRB -0.172986461 -0.147263540
## TPAK TPAK 0.124686927 0.070669169
## PENDAPATANPERKAPITA PENDAPATANPERKAPITA 0.002085988 0.002031776
## Model R_squared Adj_R_squared
## 1 Dengan Outlier 0.8889998 0.8716560
## 2 Tanpa Outlier 0.9111602 0.8926519
Berdasarkan hasil analisis OLS terhadap pengaruh TPT, Gini Rasio, PDRB, TPAK, dan Pendapatan Per Kapita terhadap IPM, ditemukan beberapa permasalahan yang menunjukkan perlunya model alternatif.
Pertama, terdapat delapan observasi yang terindikasi sebagai outlier, seperti Kota Surabaya dan Kota Kediri, yang memiliki leverage dan Cook’s Distance tinggi, sehingga berpengaruh besar terhadap estimasi koefisien. Hal ini terlihat dari perubahan arah koefisien Gini Rasio sebelum dan sesudah outlier dihapus.
Kedua, uji Shapiro-Wilk menunjukkan residual tidak normal (p < 0,05), yang dapat memengaruhi validitas uji t dan F dalam OLS.
Ketiga, meskipun R-squared relatif tinggi, hanya Pendapatan Per Kapita dan PDRB yang signifikan, sementara variabel lain tampak tidak berpengaruh, kemungkinan karena terdistorsi oleh outlier.
Keempat, hasil GAM menunjukkan bahwa hubungan Pendapatan Per Kapita terhadap IPM bersifat non-linear, sehingga model linear OLS tidak sepenuhnya menangkap dinamika ini. Kondisi tersebut menimbulkan gap karena OLS sensitif terhadap outlier, mengasumsikan normalitas residual, dan tidak mampu menangkap efek non-linear.
Oleh karena itu, penggunaan Robust Regression menjadi relevan, karena model ini mampu mempertahankan semua observasi, mengurangi pengaruh outlier ekstrem, tidak terlalu sensitif terhadap normalitas residual, dan memberikan estimasi koefisien yang lebih stabil serta representatif. Dengan demikian, Robust Regression dapat menjadi solusi efektif untuk mengeksplorasi pengaruh variabel independen terhadap IPM dengan lebih andal.
Robust Regression MM-estimator
Pendekatan ini sangat sesuai untuk kasus analisis IPM, di mana terdapat observasi dengan leverage tinggi, seperti Kota Surabaya yang memiliki leverage sebesar 0,8378 dan Cook’s Distance 3,248, sehingga berpotensi mendominasi model OLS. Selain itu, hasil OLS menunjukkan adanya perubahan arah koefisien akibat outlier, dan residual tidak berdistribusi normal, sehingga penggunaan MM-Estimator yang kurang sensitif terhadap distribusi residual menjadi lebih aman dan menghasilkan estimasi yang lebih andal serta representatif.
##
## Call:
## lmrob(formula = IPM ~ TPT + GINIRASIO + PDRB + TPAK + PENDAPATANPERKAPITA,
## data = dataset, method = "MM")
## \--> method = "MM"
## Residuals:
## Min 1Q Median 3Q Max
## -2.926555 -0.735143 0.002109 1.101432 5.869403
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 33.5615252 7.7773800 4.315 0.000143 ***
## TPT 0.5543842 0.2665855 2.080 0.045659 *
## GINIRASIO 0.3276716 7.2172707 0.045 0.964070
## PDRB -0.2028971 0.0449557 -4.513 8.13e-05 ***
## TPAK 0.1788661 0.0866195 2.065 0.047108 *
## PENDAPATANPERKAPITA 0.0020920 0.0001756 11.913 2.66e-13 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Robust residual standard error: 1.559
## Multiple R-squared: 0.9096, Adjusted R-squared: 0.8954
## Convergence in 11 IRWLS iterations
##
## Robustness weights:
## 2 weights are ~= 1. The remaining 36 ones are summarized as
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.1257 0.8997 0.9662 0.9152 0.9849 0.9978
## Algorithmic parameters:
## tuning.chi bb tuning.psi refine.tol
## 1.548e+00 5.000e-01 4.685e+00 1.000e-07
## rel.tol scale.tol solve.tol zero.tol
## 1.000e-07 1.000e-10 1.000e-07 1.000e-10
## eps.outlier eps.x warn.limit.reject warn.limit.meanrw
## 2.632e-03 3.577e-08 5.000e-01 5.000e-01
## nResample max.it best.r.s k.fast.s k.max
## 500 50 2 1 200
## maxit.scale trace.lev mts compute.rd fast.s.large.n
## 200 0 1000 0 2000
## psi subsampling cov
## "bisquare" "nonsingular" ".vcov.avar1"
## compute.outlier.stats
## "SM"
## seed : int(0)
Berdasarkan analisis menggunakan MM-estimator pada model robust regression, ditemukan bahwa model ini efektif dalam menangani outlier ekstrem dan pelanggaran asumsi normalitas residual yang muncul pada regresi OLS sebelumnya. Koefisien Intercept sebesar 33,56 menunjukkan titik awal teoretis IPM saat seluruh variabel independen bernilai nol. Variabel Tingkat Pengangguran Terbuka (TPT) memiliki pengaruh positif dan signifikan terhadap IPM (0,554; p=0,046), menandakan bahwa setiap kenaikan 1% TPT dapat meningkatkan IPM sebesar 0,55 poin, yang sebelumnya tidak terlihat pada model OLS karena pengaruh outlier. Partisipasi Angkatan Kerja (TPAK) juga signifikan positif (0,179; p=0,047), sementara PDRB menunjukkan pengaruh negatif yang signifikan (-0,203; p<0,001), yang mengindikasikan bahwa pertumbuhan ekonomi yang tidak merata dapat menurunkan IPM di beberapa wilayah. Gini Rasio tidak menunjukkan pengaruh signifikan, menandakan ketimpangan pendapatan regional tidak menjadi faktor dominan dalam variasi IPM pada dataset ini.
Secara empiris, Pendapatan Per Kapita terbukti menjadi variabel paling dominan dan signifikan (0,00209; p<0,001), di mana setiap kenaikan Rp1.000 per kapita diperkirakan meningkatkan IPM sekitar 2 poin. Hal ini sesuai dengan teori pembangunan manusia, yang menekankan bahwa peningkatan pendapatan memungkinkan masyarakat memenuhi kebutuhan dasar seperti pendidikan, kesehatan, dan gizi, sehingga kualitas hidup meningkat. Pengaruh signifikan TPT dan TPAK juga menunjukkan secara empiris bahwa pengurangan pengangguran dan peningkatan partisipasi angkatan kerja berperan dalam meningkatkan kualitas hidup. Sementara itu, pengaruh negatif PDRB menekankan perlunya pemerataan pertumbuhan ekonomi agar manfaatnya dirasakan secara merata oleh seluruh masyarakat. Hasil ini menunjukkan bahwa model robust regression tidak hanya memberikan estimasi koefisien yang lebih andal secara statistik, tetapi juga menyajikan bukti empiris yang konsisten, menegaskan bahwa faktor-faktor ekonomi yang langsung memengaruhi kesejahteraan individu, terutama pendapatan per kapita dan dinamika tenaga kerja, menjadi kunci dalam menentukan Indeks Pembangunan Manusia.
Kesimpulan
Berdasarkan hasil analisis regresi linear berganda menggunakan
MM-Estimator, dapat disimpulkan bahwa Pendapatan Per Kapita merupakan
faktor paling dominan dan signifikan dalam mempengaruhi Indeks
Pembangunan Manusia (IPM) di Jawa Timur, dengan setiap kenaikan Rp1.000
per kapita meningkatkan IPM sekitar 2 poin. Tingkat Pengangguran Terbuka
(TPT) dan Partisipasi Angkatan Kerja (TPAK) juga berpengaruh signifikan
terhadap IPM setelah pengaruh outlier ekstrem dikendalikan, sedangkan
PDRB memiliki pengaruh negatif yang signifikan, menunjukkan bahwa
pertumbuhan ekonomi makro yang tidak merata dapat menurunkan IPM di
beberapa wilayah. Gini Rasio tidak signifikan, menandakan bahwa
ketimpangan pendapatan regional tidak menjadi faktor utama dalam variasi
IPM. Model robust regression menggunakan MM-Estimator terbukti efektif
dalam menangani outlier dan residual yang tidak normal, sehingga
menghasilkan estimasi koefisien yang lebih andal dibandingkan OLS.
Saran
Kebijakan Peningkatan Pendapatan: Pemerintah daerah perlu fokus pada peningkatan pendapatan per kapita melalui program ekonomi yang langsung meningkatkan kesejahteraan masyarakat, seperti bantuan sosial, pelatihan kerja, dan pengembangan UMKM.
Pemerataan Pertumbuhan Ekonomi: Pertumbuhan PDRB harus diarahkan agar lebih merata di seluruh kabupaten/kota, sehingga peningkatan ekonomi makro berdampak positif secara luas terhadap pembangunan manusia.
Pengembangan Tenaga Kerja: Meningkatkan partisipasi angkatan kerja dan menurunkan tingkat pengangguran dapat memberikan kontribusi signifikan terhadap IPM, sehingga program pelatihan keterampilan dan penyerapan tenaga kerja perlu ditingkatkan.
Analisis Lanjutan: Penelitian selanjutnya dapat mempertimbangkan pendekatan non-linear atau segmentasi wilayah untuk menangkap dinamika IPM yang lebih kompleks, serta memasukkan variabel lain seperti kualitas pendidikan dan layanan kesehatan.
Penggunaan MM-Estimator: Metode robust regression seperti MM-Estimator direkomendasikan untuk analisis data dengan potensi outlier ekstrem, karena mampu memberikan estimasi yang lebih stabil dan andal dibandingkan OLS.