Disusun oleh:
Rahma Aulia Putri — 140610230037
Dosen Pengampu:
I Gede Nyoman Mindra Jaya, M.Si., Ph.D.
Indeks Pembangunan Manusia (IPM) merupakan indikator komposit yang digunakan secara luas untuk mengukur capaian pembangunan manusia melalui tiga dimensi dasar, yaitu umur panjang dan hidup sehat, pengetahuan, serta standar hidup layak. Di Indonesia, IPM menjadi salah satu indikator strategis pembangunan nasional dan daerah, serta digunakan sebagai dasar pengambilan keputusan berbasis data (evidence-based policy) untuk mendorong kesejahteraan masyarakat yang merata dan berkelanjutan (Badan Pusat Statistik, 2025).
Provinsi Jawa Timur merupakan salah satu provinsi dengan jumlah penduduk terbesar di Indonesia dan memiliki karakteristik wilayah yang sangat beragam, baik dari sisi sosial, ekonomi, maupun geografis. Berdasarkan data Badan Pusat Statistik (BPS), nilai IPM Provinsi Jawa Timur tahun 2024 mencapai 74,09 yang tergolong dalam kategori “tinggi”. Namun, capaian tersebut masih menyembunyikan ketimpangan yang cukup besar antar kabupaten/kota. Beberapa daerah perkotaan seperti Kota Surabaya, Kota Malang, dan Kota Madiun memiliki IPM yang jauh lebih tinggi, sementara sejumlah kabupaten di wilayah tapal kuda dan bagian selatan Jawa Timur masih tertinggal (BPS Jawa Timur, 2024). Perbedaan ini mengindikasikan bahwa pembangunan manusia di Jawa Timur belum berlangsung secara merata.
Ketimpangan IPM menjadi persoalan penting karena wilayah dengan IPM rendah cenderung menghadapi keterbatasan akses pendidikan, layanan kesehatan, serta peluang ekonomi, yang dapat menghambat pembangunan regional secara keseluruhan. Oleh karena itu, pemahaman yang mendalam mengenai faktor-faktor yang memengaruhi IPM di tingkat daerah menjadi sangat krusial untuk mendukung perencanaan pembangunan yang lebih adil dan efektif.
IPM merupakan indikator multidimensi yang dipengaruhi oleh berbagai aspek sosial, ekonomi, dan kependudukan. Faktor pendidikan, yang tercermin melalui Indeks Pembangunan Literasi Masyarakat (IPLM), mencerminkan kualitas sumber daya manusia. Faktor kesehatan, ketersediaan tenaga kesehatan, kondisi ekonomi masyarakat, serta karakteristik kependudukan juga berperan penting dalam membentuk capaian IPM suatu wilayah. Temuan penelitian menunjukkan bahwa pengaruh faktor-faktor tersebut tidak hanya bersifat lokal, tetapi juga dapat menyebar ke wilayah tetangga, sehingga kondisi di satu kabupaten/kota dapat memengaruhi IPM di wilayah sekitar.
Dalam konteks kewilayahan, pembangunan manusia tidak berlangsung secara terisolasi. Wilayah yang saling berdekatan cenderung memiliki keterkaitan sosial dan ekonomi, seperti mobilitas penduduk, akses bersama terhadap fasilitas pendidikan dan kesehatan, serta keterhubungan pasar tenaga kerja. Prinsip ini sejalan dengan hukum pertama geografi yang menyatakan bahwa wilayah yang berdekatan memiliki keterkaitan lebih kuat dibandingkan wilayah yang berjauhan (Tobler, 1970). Kondisi tersebut membuka kemungkinan adanya spillover effect dalam capaian IPM, sehingga analisis yang mengabaikan dimensi spasial berisiko menghasilkan kesimpulan yang kurang tepat.
Selain ketimpangan antar kabupaten/kota, tantangan lain dalam analisis IPM adalah keterbatasan ketersediaan data pada tingkat wilayah yang lebih kecil, seperti kecamatan. Padahal, perencanaan pembangunan yang efektif membutuhkan informasi yang lebih rinci untuk mengidentifikasi wilayah-wilayah prioritas. Oleh karena itu, diperlukan pendekatan analisis yang tidak hanya mampu menjelaskan faktor-faktor yang memengaruhi IPM secara kewilayahan, tetapi juga mampu menangkap efek antarwilayah dan memberikan gambaran sebaran IPM pada tingkat wilayah yang lebih mikro.
Berdasarkan kondisi tersebut, penelitian ini mengkaji IPM di Provinsi Jawa Timur dengan mengombinasikan analisis ekonometrikam spasial untuk memahami hubungan antarwilayah dan faktor-faktor penentu IPM, serta analisis interpolasi spasial untuk memperkirakan sebaran IPM pada tingkat kecamatan. Pendekatan ini diharapkan dapat memberikan pemahaman yang lebih komprehensif mengenai ketimpangan pembangunan manusia dan menjadi dasar dalam perumusan kebijakan pembangunan yang lebih tepat sasaran dan berbasis wilayah.
Berdasarkan latar belakang tersebut, dapat diidentifikasi beberapa permasalahan utama sebagai berikut :
Terdapat ketimpangan capaian Indeks Pembangunan Manusia antar kabupaten/kota di Provinsi Jawa Timur, meskipun secara agregat IPM provinsi tergolong tinggi.
Adanya keterkaitan antarwilayah yang berdekatan mengindikasikan bahwa capaian IPM suatu kabupaten/kota berpotensi dipengaruhi oleh kondisi wilayah sekitarnya.
Faktor-faktor pendidikan, kesehatan, dan sosial ekonomi telah diketahui secara umum berperan terhadap IPM, namun besaran pengaruh dan peran relatif masing-masing faktor dalam menjelaskan variasi IPM antar kabupaten/kota di Provinsi Jawa Timur belum terpetakan secara komprehensif dalam kerangka spasial.
Informasi IPM pada tingkat kecamatan masih terbatas, sehingga menyulitkan identifikasi wilayah prioritas pembangunan manusia secara lebih rinci.
Berdasarkan latar belakang dan identifikasi masalah, penelitian ini bertujuan untuk :
Menganalisis pola distribusi spasial IPM kabupaten/kota di Provinsi Jawa Timur.
Mengidentifikasi adanya autokorelasi spasial IPM menggunakan indeks Moran’s I dan indikator spasial lainnya.
Menganalisis pengaruh faktor pendidikan, kesehatan, dan sosial ekonomi terhadap IPM menggunakan model regresi spasial.
Membandingkan beberapa model ekonometrika spasial untuk menentukan model terbaik berdasarkan kriteria statistik dan interpretasi substantif.
Melakukan interpolasi IPM menggunakan metode Ordinary Kriging untuk memperoleh estimasi IPM pada tingkat kecamatan di Provinsi Jawa Timur.
Penelitian ini memiliki beberapa batasan yang perlu diperhatikan dalam interpretasi hasil, yaitu sebagai berikut :
Analisis dilakukan menggunakan data IPM dan variabel penjelas pada satu periode waktu (cross-section), sehingga hasil penelitian hanya menggambarkan kondisi spasial pada periode tersebut dan belum mampu menangkap dinamika perubahan IPM dari waktu ke waktu. Implikasinya, kesimpulan yang diperoleh tidak dapat digunakan untuk menilai tren pembangunan manusia secara temporal.
Unit analisis regresi spasial dibatasi pada tingkat kabupaten/kota karena keterbatasan ketersediaan data IPM dan variabel penjelas pada level kecamatan. Implikasinya, hasil estimasi regresi merefleksikan hubungan antarvariabel pada skala makro wilayah dan belum tentu sepenuhnya menggambarkan variasi kondisi pada tingkat lokal yang lebih kecil.
Interpolasi IPM ke tingkat kecamatan dilakukan menggunakan metode Ordinary Kriging yang mengandalkan asumsi stasioneritas dan struktur variogram tertentu. Oleh karena itu, hasil interpolasi bersifat estimatif dan tidak dapat disamakan dengan data IPM resmi, melainkan digunakan sebagai pendekatan untuk memperoleh gambaran spasial yang lebih rinci.
Model regresi spasial yang digunakan dibatasi pada beberapa spesifikasi tertentu (SAR, SEM, SDM, SDEM, SAC) berdasarkan hasil LM test. Implikasinya, masih dimungkinkan adanya pendekatan atau spesifikasi model lain yang juga relevan namun tidak dieksplorasi dalam penelitian ini.
Variabel penjelas yang digunakan merepresentasikan faktor pendidikan, kesehatan, dan sosial ekonomi berdasarkan ketersediaan data sekunder. Dengan demikian, faktor-faktor lain di luar model, seperti kualitas layanan, kebijakan lokal spesifik, atau aspek kultural, belum tercakup dan dapat memengaruhi capaian IPM secara tidak langsung.
Batasan-batasan tersebut menegaskan bahwa hasil penelitian ini perlu ditafsirkan secara kontekstual dan digunakan sebagai dasar analisis kebijakan berbasis wilayah, bukan sebagai penilaian absolut terhadap kinerja pembangunan manusia di setiap kecamatan atau kabupaten/kota.
Ketergantungan spasial (spatial dependence) mengacu pada fenomena ketika nilai suatu variabel di satu wilayah tidak bersifat independen, tetapi dipengaruhi oleh nilai variabel di wilayah sekitarnya (Anselin & Bera, 1998). Artinya, informasi di satu lokasi mengandung nilai prediktif terhadap lokasi lain. Hal ini umum dijumpai pada data sosial, ekonomi, kesehatan, atau lingkungan karena wilayah berdekatan biasanya saling berinteraksi melalui mobilitas penduduk, kebijakan publik, maupun kondisi geografis yang serupa. Secara umum, terdapat dua bentuk utama ketergantungan spasial, yaitu spatial lag dependence dan spatial error dependence (LeSage & Pace, 2009) :
Spatial Lag Dependence
Ketergantungan spasial ini terjadi ketika nilai variabel dependen pada
suatu wilayah secara langsung dipengaruhi oleh nilai variabel dependen
di wilayah-wilayah tetangganya. Persamaannya dapat ditulis sebagai
:
\[ Y = \rho WY + X\beta +
\varepsilon \]
dengan W sebagai matriks bobot spasial yang merepresentasikan kedekatan antarwilayah, ρ menunjukkan kekuatan efek lag, dan ε adalah error acak.
Spatial Error Dependence
Spatial Error Dependence muncul ketika ketergantungan spasial
berada pada komponen error, bukan pada variabel dependen. Kondisi ini
biasanya terjadi karena terdapat variabel atau faktor yang berpengaruh
terhadap variabel dependen (Y) namun tidak dimasukkan ke dalam model,
dan variabel tersebut memiliki pola spasial (spatially
autocorrelated omitted variable). Model spatial error menuliskan
kesalahan sebagai :
\[ \varepsilon = \lambda W\varepsilon +
u \]
dengan \(λ\) mengukur intensitas autokorelasi pada residual, \(u\) merupakan error i.i.d., dan \(W\) kembali merupakan matriks bobot spasial (spatial weight matrix).
Mengabaikan dependensi spasial dapat menyebabkan estimasi koefisien regresi standar (OLS) menjadi bias dan tidak efisien, serta mengakibatkan kesalahan dalam uji signifikansi (LeSage & Pace, 2009). Oleh karena itu, identifikasi dan penanganan dependensi spasial merupakan tahap penting sebelum melakukan interpretasi terhadap hubungan antarvariabel.
Autokorelasi spasial menggambarkan sejauh mana nilai suatu variabel di satu lokasi berkorelasi dengan nilai variabel yang sama di lokasi lain. Secara matematis, autokorelasi spasial dapat dinyatakan melalui kondisi momen sebagai berikut:
\[ \text{cov}[y_i , y_j] = E[y_i y_j] - E[y_i]E[y_j] \neq 0 \]
di mana \(i\) dan \(j\) merujuk pada pengamatan individual (lokasi), dan \(y_i\) adalah nilai variabel acak yang diamati pada lokasi tersebut. Berikut adalah ukuran yang biasa digunakan untuk mendeteksi autokorelasi spasial pada data :
Ukuran global yang paling umum digunakan untuk mengukur autokorelasi spasial adalah Moran’s I (Moran, 1950) dengan rumus perhitungan sebagai berikut :
\[ I = \frac{n}{\sum_i \sum_j w_{ij}} \frac{\sum_i \sum_j w_{ij} (Y_i - \bar{Y})(Y_j - \bar{Y})} {\sum_i (Y_i - \bar{Y})^2} \]
dimana \(n\) adalah jumlah wilayah atau lokasi, \(Y_i\) adalah nilai variabel yang diamati di wilayah \(i\), \(\bar{Y}\) adalah rata-rata dari semua nilai, dan \(w_{ij}\) adalah elemen matriks pembobot spasial yang menunjukkan kedekatan spasial antara wilayah \(i\) dan \(j\) dengan \(w_{ii}= 0\).
Adapun interpretasi Moran’s I adalah sebagai berikut :
Moran’s I bersifat global, artinya hanya mengukur kecenderungan keseluruhan data, bukan lokasi spesifik di mana pengelompokan terjadi.
Indeks Geary’s C (Geary, 1954) merupakan ukuran autokorelasi spasial yang berfungsi sebagai alternatif dari Moran’s I. Berbeda dengan Moran’s I yang menilai kemiripan nilai antarwilayah secara keseluruhan (global similarity), Geary’s C lebih sensitif terhadap perbedaan nilai antar pasangan wilayah (local dissimilarity). Dengan demikian, Geary’s C lebih menekankan pada variasi spasial lokal daripada pola global.
Secara matematis, Geary’s C dapat dihitung menggunakan rumus berikut :
\[ C = \frac{(n-1)\sum_i \sum_j w_{ij} (Y_i - Y_j)^2}{2W \sum_i (Y_i - \bar{Y})^2} \]
dengan:
\(n\) : jumlah wilayah atau lokasi
pengamatan,
\(Y_i\) : nilai variabel yang diamati
di wilayah ke-\(i\),
\(\bar{Y}\) : rata-rata dari seluruh
nilai variabel,
\(w_{ij}\) : elemen matriks pembobot
spasial antara wilayah \(i\) dan \(j\), dan
\(W = \sum_i \sum_j w_{ij}\) : total
bobot spasial.
Adapun interpretasi dari nilai Geary’s C adalah sebagai berikut :
Untuk mengidentifikasi dimana pola spasial terjadi, digunakan ukuran lokal yaitu Local Moran’s I (Anselin, 1995). Berbeda dari Moran’s I yang bersifat global dan hanya memberikan informasi mengenai ada tidaknya autokorelasi spasial secara keseluruhan, LISA memungkinkan identifikasi lokasi spesifik tempat terjadinya pengelompokan nilai yang serupa atau berbeda secara signifikan. Dengan kata lain, ukuran ini dapat mengungkap pola spasial lokal seperti hotspots, coldspots, dan spatial outliers.
Rumus umum Local Moran’s I untuk wilayah ke-\(i\) adalah sebagai berikut :
\[ I_i = z_i \sum_j w_{ij} z_j \]
dengan:
\(I_i\) : nilai indeks lokal untuk
wilayah ke-\(i\),
\(z_i\) dan \(z_j\) : nilai standar dari variabel pada
wilayah \(i\) dan \(j\) (yakni \(z_i
= Y_i - \bar{Y}\)),
\(w_{ij}\) : elemen dari matriks bobot
spasial yang menggambarkan kedekatan wilayah \(i\) dan \(j\).
Nilai \(I_i\) yang signifikan menunjukkan bahwa wilayah \(i\) memiliki keterkaitan spasial dengan wilayah di sekitarnya. Berdasarkan hasil tersebut, pola spasial dapat diklasifikasikan menjadi beberapa tipe :
Interpretasi Local Moran’s I umumnya divisualisasikan melalui peta LISA cluster dan LISA significance map. Peta-peta ini membantu peneliti mengidentifikasi secara geografis wilayah yang membentuk klaster signifikan, sehingga dapat digunakan untuk analisis spasial berbasis lokasi, seperti penentuan daerah prioritas kebijakan atau pemeriksaan anomali lokal. Dengan demikian, LISA merupakan alat analisis penting dalam eksplorasi data spasial karena memberikan informasi lokal yang tidak dapat ditangkap oleh ukuran global seperti Moran’s I dan Geary’s C.
Ukuran lokal lain yang populer adalah Getis–Ord Gi* (Getis & Ord, 1992; 1996), merupakan salah satu indikator asosiasi spasial lokal yang digunakan untuk mengidentifikasi klaster nilai tinggi (hotspot) dan klaster nilai rendah (coldspot) dalam suatu wilayah. Berbeda dengan Local Moran’s I yang menilai hubungan antara satu wilayah dengan nilai tetangganya secara relatif terhadap rata-rata global, ukuran Gi* lebih menekankan pada intensitas nilai absolut di sekitar suatu lokasi dibandingkan dengan rata-rata keseluruhan wilayah.
Rumus umum statistik Getis–Ord Gi* adalah sebagai berikut :
\[ G_i^* = \frac{ \sum_j w_{ij} x_j - \bar{X} \sum_j w_{ij} } { S \sqrt{ \frac{ n \sum_j w_{ij}^2 - (\sum_j w_{ij})^2 }{n-1} } } \]
dengan:
\(G_i^*\) : nilai statistik Getis–Ord
untuk wilayah ke-\(i\),
\(x_j\) : nilai variabel pada wilayah
\(j\),
\(w_{ij}\) : elemen matriks bobot
spasial yang menunjukkan kedekatan antara wilayah \(i\) dan \(j\),
\(\bar{X}\) : rata-rata nilai variabel
seluruh wilayah,
\(S\) : simpangan baku variabel,
dan
\(n\) : jumlah total wilayah
pengamatan.
Nilai \(G_i^*\) kemudian diuji secara statistik dengan distribusi normal baku (z-score). Interpretasinya adalah :
Kelebihan utama metode ini adalah kemampuannya dalam mengidentifikasi area dengan konsentrasi ekstrem tanpa terpengaruh oleh nilai rata-rata global, sehingga lebih peka terhadap fenomena lokal. Secara visual, hasil analisis Gi* biasanya disajikan dalam bentuk peta hotspot (Hotspot Map) yang menampilkan area-area signifikan berdasarkan nilai z-score. Peta ini memberikan informasi strategis bagi pengambil kebijakan untuk menentukan wilayah prioritas intervensi, misalnya daerah dengan tingkat pendidikan rendah (coldspot) yang memerlukan peningkatan akses atau sarana pendidikan.
Model dasar dalam analisis ekonometrika wilayah adalah Ordinary Least Squares (OLS), yang mengasumsikan bahwa setiap observasi bersifat independen satu sama lain. Dalam konteks spasial, OLS memodelkan hubungan antara variabel dependen \(Y\) dan sejumlah variabel independen \((X_i)\) tanpa mempertimbangkan lokasi geografis setiap unit. Bentuk umum model OLS adalah :
\[ Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \ldots + \beta_k X_k + \varepsilon \]
Namun, asumsi independensi observasi sering tidak terpenuhi dalam
data wilayah karena fenomena ekonomi dan sosial tidak tersebar secara
acak di ruang. Wilayah yang berdekatan biasanya memiliki karakteristik
yang saling berhubungan akibat interaksi sosial, kebijakan publik,
mobilitas tenaga kerja, dan kesamaan kondisi geografis.
Ketika terdapat dependensi spasial (spatial dependence) baik
pada lag maupun pada error, penggunaan OLS menjadi
tidak tepat. Dua sumber utama dependensi adalah efek lag
spasial dan efek error spasial sebagaimana yang sudah
dijelaskan pada 2.1. Jika kedua jenis efek ini muncul, maka model OLS
menghasilkan koefisien yang bias dan tidak efisien. Residual yang
menunjukkan autokorelasi spasial mengindikasikan bahwa model OLS gagal
menangkap hubungan antarwilayah. Oleh karena itu, dibutuhkan model
spatial econometrics yang secara eksplisit mengakomodasi
struktur ketergantungan spasial.
Model spatial econometric merupakan pendekatan dalam analisis ekonometrika yang secara eksplisit mempertimbangkan adanya ketergantungan spasial (spatial dependence) dan/atau heterogenitas spasial (spatial heterogeneity) antarwilayah dalam data. Beberapa model spasial ekonometrik yang dapat digunakan adalah sebagai berikut :
Model ini memasukkan lag spasial dari variabel dependen ke dalam persamaan regresi. Berikut adalah persamaannya:
\[ Y = \rho WY + X\beta + \varepsilon \]
dimana
- \(Y\) : Variabel dependen
- \(W\) : Matriks bobot spasial
(spatial weight matrix), yang menunjukkan hubungan kedekatan
antarwilayah (misalnya berbatasan langsung, atau berjarak dalam radius
tertentu).
- \(WY\) : Lag spasial dari
variabel dependen, yaitu rata-rata tertimbang variabel dependen di
wilayah-wilayah tetangga.
- \(\rho\) : Koefisien lag
spasial, mengukur seberapa besar pengaruh variabel dependen di daerah
tetangga terhadap daerah bersangkutan.
- \(X\) : Matriks variabel
independen.
- \(\beta\) : Vektor koefisien regresi,
menunjukkan besarnya pengaruh masing-masing variabel \(X\) terhadap variabel dependen.
- \(\varepsilon\) : Komponen
error acak, diasumsikan identik dan independen.
Model SAR digunakan ketika terdapat efek spillover antarwilayah (misalnya daerah dengan rata-rata lama sekolah tinggi memengaruhi wilayah tetangganya melalui pertukaran sumber daya pendidikan atau kebijakan).
Model SEM digunakan ketika pengaruh spasial tidak berasal dari hubungan langsung antarwilayah, tetapi dari faktor tak teramati yang berpola spasial (misalnya kualitas infrastruktur atau kebijakan regional yang tidak dimasukkan ke model). Model SEM cocok digunakan ketika uji LM-error signifikan, atau ketika pola spasial hanya muncul pada residu model OLS. Model ini memfokuskan pada korelasi spasial di dalam komponen error. Berikut adalah persamaanya:
\[ Y = X\beta + u, \quad u = \lambda W u + \varepsilon \]
dimana
- \(u\) : Error yang memiliki
dependensi spasial.
- \(\lambda\) : Koefisien autokorelasi
spasial pada error, menunjukkan seberapa kuat keterkaitan
error antarwilayah.
- \(Wu\) : Lag spasial dari
error, yaitu rata-rata kesalahan prediksi di wilayah
tetangga.
- \(\varepsilon\) : Komponen
error acak yang bersifat independen.
Model ini merupakan pengembangan dari SAR, karena selain memasukkan lag spasial pada variabel dependen, juga memasukkan lag spasial pada variabel independen (\(WX\)). Oleh karena itu, model SDM dapat digunakan ketika efek spasial tidak hanya berasal dari hasil (\(Y\)), tetapi juga dari faktor penentu (\(X\)). Berikut adalah persamaannya:
\[ Y = \rho WY + X\beta + W X\theta + \varepsilon \]
dimana
- \(WX\) : Lag spasial dari
variabel independen, yaitu rata-rata tertimbang dari nilai
variabel-variabel penjelas di wilayah sekitar.
- \(\theta\) : Koefisien efek tidak
langsung (spillover) dari variabel independen di wilayah
sekitar.
Model ini memperluas SEM dengan menambahkan lag spasial pada variabel independen (\(WX\)). Model ini digunakan untuk menangkap pengaruh spasial yang berasal dari faktor penjelas di wilayah sekitar (spatially lagged X) dan korelasi error spasial secara bersamaan. Berikut adalah persamaannya:
\[ Y = X\beta + W X\theta + u, \quad u = \lambda W u + \varepsilon \]
Model SDEM tidak memasukkan lag spasial pada \(Y\), sehingga tidak mengasumsikan adanya ketergantungan langsung antarhasil antarwilayah. Namun, SDEM efektif menangkap efek antarwilayah melalui faktor penjelas (\(X\)) dan komponen error spasial (\(u\)).
Model SAC menggabungkan efek lag spasial (SAR) dan error spasial (SEM) merupakan kombinasi antara model SAR dan SEM, sehingga mengakomodasi efek lag spasial pada variabel dependen (\(WY\)) dan autokorelasi spasial pada error (\(Wu\)) secara bersamaan. Model ini relevan ketika terdapat interaksi langsung antarwilayah dan juga variabel tak teramati yang berpola spasial. Berikut adalah persamaanya:
\[ Y = \rho WY + X\beta + u, \quad u = \lambda W u + \varepsilon \]
Model GNS adalah bentuk paling umum dari model spasial, karena menggabungkan semua kemungkinan dependensi. GNS bersifat nests terhadap model-model lain (SAR, SEM, SDM, SDEM, SAC), sehingga digunakan sebagai model general untuk kemudian disederhanakan bila parameter tertentu tidak signifikan. Berikut adalah persamaannya:
\[ Y = \rho WY + X\beta + W X\theta + u, \quad u = \lambda W u + \varepsilon \]
Berdasarkan teori yang dipaparkan di atas, dapat diketahui bahwa masing-masing model memiliki asumsi dan struktur ketergantungan spasial yang berbeda. Beberapa model menekankan adanya dependensi langsung antar wilayah (melalui lag spasial pada variabel dependen \(WY\)), sementara yang lain menangkap hubungan tidak langsung melalui variabel penjelas (lag spasial pada variabel independen \(WX\)) atau dependensi spasial pada error (\(Wu\)). Untuk memberikan gambaran yang lebih jelas, berikut disajikan tabel perbandingan model-model spasial ekonometrik berdasarkan keberadaan unsur spasial pada variabel dependen (\(Y\)), variabel independen (\(X\)), dan komponen error (\(u\)) :
Ordinary Kriging (OK) merupakan metode interpolasi geostatistik yang paling luas digunakan untuk menaksir nilai pada lokasi yang tidak tersampel berdasarkan data titik di sekitarnya. Berbeda dengan metode deterministik seperti Inverse Distance Weighting (IDW), Ordinary Kriging mempertimbangkan korelasi spasial antar pengamatan yang direpresentasikan melalui fungsi autokorelasi atau semivariogram (Cressie, 1993). Metode ini sering disebut sebagai Best Linear Unbiased Estimator (BLUE) karena mampu menghasilkan estimasi dengan varians kesalahan minimum dan nilai harapan kesalahan sebesar nol (Isaaks & Srivastava, 1989).
Ordinary Kriging beroperasi di bawah asumsi stasioneritas intrinsik, di mana nilai rata-rata (mean) dari variabel yang diamati dianggap konstan namun tidak diketahui secara pasti di seluruh wilayah penelitian (Webster & Oliver, 2007). Model matematis untuk penaksiran nilai \(\hat{Z}\) pada lokasi \(s_0\) dinyatakan sebagai bobot rata-rata tertimbang dari data pengamatan di sekitarnya:
\[\hat{Z}(s_0) = \sum_{i=1}^{n} \lambda_i Z(s_i)\]
dengan \(\lambda_i\) merupakan bobot kriging yang diberikan kepada pengamatan pada lokasi \(s_i\). Untuk memastikan penaksir bersifat tidak bias (unbiased), jumlah seluruh bobot harus sama dengan satu (\(\sum \lambda_i = 1\)). Penentuan bobot ini tidak hanya bergantung pada jarak fisik antara titik sampel dan titik prediksi, tetapi juga pada struktur spasial data (Deutsch, 2002).
Selain stasioneritas, terdapat dua aspek krusial dalam distribusi data yang memengaruhi keandalan estimasi, yaitu normalitas dan keberadaan pencilan (outlier). Meskipun Ordinary Kriging dapat memberikan estimasi titik tanpa asumsi normalitas, distribusi data yang mendekati normal sangat diperlukan agar varians kriging dapat menjadi ukuran ketidakpastian yang valid dan dapat diinterpretasikan dalam bentuk interval kepercayaan (Cressie, 1993). Di sisi lain, keberadaan outlier dapat menyebabkan estimasi semivariogram menjadi bias, yang sering kali ditunjukkan dengan peningkatan efek nugget secara semu atau distorsi pada nilai sill, sehingga menurunkan akurasi prediksi secara keseluruhan (Goovaerts, 1997; Chiles & Delfiner, 2012).
Inti dari analisis kriging adalah penggunaan semivariogram eksperimental untuk mendeskripsikan variabilitas spasial data. Semivariogram mengukur tingkat kemiripan rata-rata antara dua pengamatan sebagai fungsi dari jarak pemisah \(h\) (Matheron, 1963). Secara empiris, semivariogram (\(\gamma\)) dihitung dengan rumus:
\[\gamma(h) = \frac{1}{2N(h)} \sum_{i=1}^{N(h)} [Z(s_i) - Z(s_i + h)]^2\]
Hasil dari semivariogram eksperimental kemudian dicocokkan (fitting) dengan model teoritis (seperti model Spherical, Exponential, atau Gaussian) untuk mendapatkan parameter-parameter utama (Chiles & Delfiner, 2012):
Salah satu keunggulan utama Ordinary Kriging dibandingkan metode interpolasi lainnya adalah kemampuannya memberikan nilai estimasi ketidakpastian dalam bentuk varians kriging (Goovaerts, 1997). Varians ini menunjukkan tingkat kepercayaan dari hasil interpolasi pada setiap lokasi; nilai varians yang rendah mengindikasikan bahwa lokasi tersebut dekat dengan titik pengamatan asli, sementara varians yang tinggi menunjukkan tingkat ketidakpastian yang lebih besar karena minimnya data sampel di sekitar lokasi tersebut (Webster & Oliver, 2007).
Penelitian ini menggunakan data sekunder yang bersumber dari Badan Pusat Statistik (BPS) dan instansi resmi terkait. Data yang digunakan bersifat cross-section dan merepresentasikan kondisi kabupaten/kota di Provinsi Jawa Timur pada satu periode pengamatan, yaitu pada tahun 2024.
Variabel dependen dalam analisis ini adalah Indeks Pembangunan Manusia (IPM) yang sekaligus akan menjadi variabel yang dilakukan interpolasi ke tingkat kecamatan. Adapun variabel independen mencakup tiga variabel yang merepresentasikan pendidikan, kesehatan, dan sosial ekonomi yang secara konseptual berkaitan dengan pembangunan manusia. Berikut adalah tabel deskripsi variabel yang digunakan.
| Nama Variabel | Deskripsi |
|---|---|
| Kabupaten/Kota | Unit administrasi kabupaten dan kota di Provinsi Jawa Timur yang menjadi wilayah analisis penelitian. |
| Indeks Pembangunan Manusia | Indikator komposit yang menggambarkan capaian pembangunan manusia melalui tiga dimensi dasar, yaitu umur panjang dan hidup sehat, pengetahuan, serta standar hidup layak, sebagaimana didefinisikan oleh Badan Pusat Statistik. |
| Indeks Pembangunan Literasi Masyarakat | Indeks yang menggambarkan tingkat pengembangan budaya literasi masyarakat yang disusun oleh Badan Pusat Statistik berdasarkan beberapa dimensi literasi, seperti kecakapan literasi dan akses terhadap bahan bacaan. |
| Jumlah Tenaga Kesehatan Masyarakat | Jumlah tenaga kesehatan yang berperan dalam pelayanan kesehatan masyarakat, termasuk kegiatan promotif dan preventif, sesuai klasifikasi Badan Pusat Statistik. |
| Persentase Penduduk Miskin | Persentase penduduk yang berada di bawah garis kemiskinan berdasarkan konsep kemampuan memenuhi kebutuhan dasar makanan dan nonmakanan menurut Badan Pusat Statistik. |
Unit spasial dalam penelitian ini adalah kabupaten dan kota di Provinsi Jawa Timur, yang berjumlah 38 wilayah administrasi, terdiri atas 29 kabupaten dan 9 kota. Setiap kabupaten/kota diperlakukan sebagai satu unit observasi dalam analisis, dengan nilai Indeks Pembangunan Manusia (IPM) serta variabel penjelas yang diasosiasikan pada wilayah administrasi tersebut.
Representasi spasial wilayah penelitian diperoleh dari data batas administrasi kabupaten/kota Provinsi Jawa Timur dalam format shapefile yang bersumber dari instansi resmi. Setiap unit wilayah direpresentasikan oleh satu poligon, yang selanjutnya digunakan untuk membangun matriks bobot spasial (spatial weight matrix). Matriks bobot spasial tersebut merefleksikan struktur kedekatan antarwilayah berdasarkan kriteria tertentu.
Metode analisis dalam penelitian ini disusun secara bertahap dan terintegrasi untuk menjawab tujuan penelitian yang telah dirumuskan. Secara umum, analisis mencakup eksplorasi spasial, pemodelan regresi spasial, serta interpolasi spasial untuk memperoleh gambaran IPM pada tingkat wilayah yang lebih rinci. Tahapan analisis dilakukan sebagai berikut.
Tahap pertama adalah eksplorasi data analisis. Pada tahap ini, dilakukan analisis deskriptif terhadap variabel IPM dan variabel penjelas, serta visualisasi peta sebaran untuk mengamati pola sebaran masing-masing variabel di Provinsi Jawa Timur. Selanjutnya, dilakukan pengujian autokorelasi spasial global menggunakan Moran’s I dan Geary’s C untuk mendeteksi adanya ketergantungan spasial secara keseluruhan. Untuk mengidentifikasi pola spasial lokal, digunakan Local Moran’s I (LISA) dan Getis–Ord Gi* guna mengungkap keberadaan klaster hotspot, coldspot, maupun spatial outliers.
Tahap kedua adalah pemodelan regresi non-spasial menggunakan Ordinary Least Squares (OLS) sebagai model dasar. Model OLS digunakan untuk mengestimasi pengaruh faktor yang merepresentasikan pendidikan, kesehatan, dan ekonomi terhadap IPM tanpa mempertimbangkan efek spasial. Hasil model OLS kemudian dievaluasi melalui uji asumsi klasik dan pemeriksaan autokorelasi spasial pada residual menggunakan indeks Moran’s I. Keberadaan autokorelasi spasial pada residual menjadi indikasi bahwa model OLS tidak memadai dan perlu dikembangkan ke dalam model regresi spasial.
Tahap ketiga adalah penyusunan dan estimasi model regresi spasial. Pada tahap ini, dilakukan pembentukan matriks bobot spasial sebagai dasar pemodelan. Selanjutnya, dilakukan pengujian Lagrange Multiplier (LM test) dan robust LM test untuk menentukan bentuk dependensi spasial yang dominan, apakah berupa efek lag spasial, error spasial, atau kombinasi keduanya. Pemilihan model terbaik dilakukan dengan mempertimbangkan kriteria statistik (seperti AIC dan log-likelihood), signifikansi parameter, serta interpretasi substantif dari hasil estimasi.
Tahap keempat adalah analisis interpolasi spasial IPM menggunakan metode Ordinary Kriging. Analisis ini diawali dengan pemeriksaan karakteristik data, termasuk distribusi nilai IPM dan keberadaan pencilan. Selanjutnya, dibangun semivariogram eksperimental yang kemudian dicocokkan dengan model teoritis yang sesuai untuk memperoleh parameter nugget, sill, dan range. Model semivariogram terpilih digunakan sebagai dasar dalam proses kriging untuk memperkirakan nilai IPM pada tingkat kecamatan di Provinsi Jawa Timur.
Seluruh tahapan analisis tersebut disusun secara sistematis dan saling berurutan, mulai dari eksplorasi spasial hingga estimasi dan prediksi spasial. Untuk memperjelas alur dan keterkaitan antar tahapan analisis, berikut gambar yag menyajikan diagram alur kerja penelitian.
Statistika deskriptif digunakan untuk memberikan gambaran awal mengenai karakteristik data Indeks Pembangunan Manusia (IPM) serta variabel penjelas yang digunakan dalam analisis, yaitu Indeks Pembangunan Literasi Masyarakat (IPLM), Persentase Penduduk Miskin, dan Jumlah Tenaga Kesehatan Masyarakat pada tingkat kabupaten/kota di Provinsi Jawa Timur.
# Import Data
library(openxlsx)
data <- read.xlsx("C:/Users/DEDEN GUNAWAN/OneDrive/Documents/Bahan Kuliah/Semester 5/Analisis Spasial/UAS SPASIAL/data ipm2.xlsx")
# Ringkasan
data_num <- data[, sapply(data, is.numeric)]
deskriptif <- data.frame(
Min = sapply(data_num, min, na.rm = TRUE),
Q1 = sapply(data_num, quantile, 0.25, na.rm = TRUE),
Median = sapply(data_num, median, na.rm = TRUE),
Mean = sapply(data_num, mean, na.rm = TRUE),
Q3 = sapply(data_num, quantile, 0.75, na.rm = TRUE),
Max = sapply(data_num, max, na.rm = TRUE),
SD = sapply(data_num, sd, na.rm = TRUE)
)
print(deskriptif)
## Min Q1 Median Mean Q3
## IPM 66.72 71.6950 74.555 75.310526 78.6225
## IPLM 29.04 56.1550 61.260 65.821842 76.8450
## Jumlah.Tenaga.Kesehatan.Masyarakat 26.00 59.7500 84.500 96.631579 97.7500
## Persentase.Penduduk.Miskin 3.06 6.5175 9.215 9.782368 12.0425
## Max SD
## IPM 84.69 4.758222
## IPLM 100.00 16.606513
## Jumlah.Tenaga.Kesehatan.Masyarakat 532.00 82.295913
## Persentase.Penduduk.Miskin 20.83 4.213447
Secara umum, nilai IPM memiliki rata-rata sebesar 75,31 dengan median 74,56, yang menunjukkan bahwa sebagian besar kabupaten/kota berada pada kategori pembangunan manusia menengah hingga tinggi. Nilai IPM terendah tercatat sebesar 66,72, sementara nilai tertinggi mencapai 84,69. Simpangan baku sebesar 4,76 mengindikasikan adanya variasi capaian IPM antarwilayah di Jawa Timur.
Pada aspek pendidikan dan literasi, IPLM memiliki nilai rata-rata sebesar 65,82 dengan rentang yang cukup lebar, yaitu dari 29,04 hingga 100, serta simpangan baku sebesar 16,61. Hal ini menunjukkan adanya ketimpangan tingkat literasi masyarakat yang relatif besar antar kabupaten/kota, di mana beberapa wilayah telah mencapai capaian literasi yang sangat tinggi, sementara wilayah lainnya masih tertinggal.
Variabel kesehatan yang diwakili oleh Jumlah Tenaga Kesehatan Masyarakat menunjukkan sebaran yang cukup timpang. Rata-rata jumlah tenaga kesehatan masyarakat tercatat sebesar 96,63, dengan nilai maksimum yang sangat tinggi mencapai 532 dan simpangan baku sebesar 82,30. Kondisi ini mengindikasikan adanya konsentrasi tenaga kesehatan pada wilayah tertentu, khususnya daerah perkotaan, dibandingkan wilayah lainnya.
Pada aspek ekonomi dan kesejahteraan, Persentase Penduduk Miskin memiliki nilai rata-rata sebesar 9,78, dengan rentang antara 3,06 hingga 20,83. Variasi ini mencerminkan perbedaan tingkat kemiskinan yang cukup nyata antar kabupaten/kota di Provinsi Jawa Timur.
par(
mfrow = c(2, 2),
mar = c(5, 4, 3, 1), # margin diperkecil
oma = c(0, 0, 2, 0) # outer margin kecil
)
for (v in names(data_num)) {
hist(
data_num[[v]],
main = paste(v),
xlab = v,
col = "lightskyblue",
border = "black"
)
}
par(
mfrow = c(2, 2),
mar = c(5, 4, 3, 1), # margin diperkecil
oma = c(0, 0, 2, 0) # outer margin kecil
)
for (v in names(data_num)) {
boxplot(
data_num[[v]],
main = paste(v),
ylab = v,
col = 'plum1'
)
}
Hasil visualisasi melalui histogram dan boxplot memperkuat temuan statistik deskriptif tersebut. Variabel IPM dan IPLM cenderung memiliki distribusi yang relatif simetris, sementara variabel Jumlah Tenaga Kesehatan Masyarakat menunjukkan pola right skewed dan keberadaan outlier, yang mengindikasikan adanya wilayah dengan jumlah tenaga kesehatan yang jauh lebih tinggi dibandingkan wilayah lainnya. Persentase Penduduk Miskin memperlihatkan sebaran yang relatif moderat tanpa pencilan ekstrem.
# Import Peta
library(sp)
library(sf)
## Linking to GEOS 3.13.0, GDAL 3.10.1, PROJ 9.5.1; sf_use_s2() is TRUE
library(spdep)
## Loading required package: spData
## To access larger datasets in this package, install the spDataLarge
## package with: `install.packages('spDataLarge',
## repos='https://nowosad.github.io/drat/', type='source')`
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
Indo <- st_read("C:/Users/DEDEN GUNAWAN/OneDrive/Documents/Bahan Kuliah/Semester 5/Epidemiologi/UAS Epidemiologi/gadm41_IDN_2.json")
## Reading layer `gadm41_IDN_2' from data source
## `C:\Users\DEDEN GUNAWAN\OneDrive\Documents\Bahan Kuliah\Semester 5\Epidemiologi\UAS Epidemiologi\gadm41_IDN_2.json'
## using driver `GeoJSON'
## Simple feature collection with 502 features and 13 fields
## Geometry type: MULTIPOLYGON
## Dimension: XY
## Bounding box: xmin: 95.0102 ymin: -11.0075 xmax: 141.0194 ymax: 6.0766
## Geodetic CRS: WGS 84
jatim <- Indo[Indo$NAME_1 == "JawaTimur",]
jatim$NAME_2 <- dplyr::recode(
jatim$NAME_2,
"Bangkalan" = "Kab. Bangkalan",
"Banyuwangi" = "Kab. Banyuwangi",
"Batu" = "Kota Batu",
"Blitar" = "Kab. Blitar",
"Bojonegoro" = "Kab. Bojonegoro",
"Bondowoso" = "Kab. Bondowoso",
"Gresik" = "Kab. Gresik",
"Jember" = "Kab. Jember",
"Jombang" = "Kab. Jombang",
"Kediri" = "Kab. Kediri",
"KotaBlitar" = "Kota Blitar",
"KotaKediri" = "Kota Kediri",
"KotaMadiun" = "Kota Madiun",
"KotaMalang" = "Kota Malang",
"KotaMojokerto" = "Kota Mojokerto",
"KotaPasuruan" = "Kota Pasuruan",
"KotaProbolinggo" = "Kota Probolinggo",
"Lamongan" = "Kab. Lamongan",
"Lumajang" = "Kab. Lumajang",
"Madiun" = "Kab. Madiun",
"Magetan" = "Kab. Magetan",
"Malang" = "Kab. Malang",
"Mojokerto" = "Kab. Mojokerto",
"Nganjuk" = "Kab. Nganjuk",
"Ngawi" = "Kab. Ngawi",
"Pacitan" = "Kab. Pacitan",
"Pamekasan" = "Kab. Pamekasan",
"Pasuruan" = "Kab. Pasuruan",
"Ponorogo" = "Kab. Ponorogo",
"Probolinggo" = "Kab. Probolinggo",
"Sampang" = "Kab. Sampang",
"Sidoarjo" = "Kab. Sidoarjo",
"Situbondo" = "Kab. Situbondo",
"Sumenep" = "Kab. Sumenep",
"Surabaya" = "Kota Surabaya",
"Trenggalek" = "Kab. Trenggalek",
"Tuban" = "Kab. Tuban",
"Tulungagung" = "Kab. Tulungagung"
)
jatim_sf <- st_as_sf(jatim)
jatim_merged <- jatim_sf %>%
left_join(data, by = c("NAME_2" = "Kabupaten.Kota"))
# Buat Peta Sebaran
vars_num <- jatim_merged %>%
st_drop_geometry() %>%
select(where(is.numeric)) %>%
names()
library(ggplot2)
for (v in vars_num) {
p <- ggplot(jatim_merged) +
geom_sf(aes(fill = .data[[v]]), color = "white", linewidth = 0.2) +
scale_fill_viridis_c(option = "C", na.value = "grey90") +
labs(
title = paste("Sebaran", v, "di Jawa Timur"),
fill = v
) +
theme_minimal()
print(p)
}
Peta sebaran spasial menunjukkan adanya variasi antarwilayah yang cukup jelas pada IPM dan IPLM, di mana nilai yang lebih tinggi cenderung terkonsentrasi pada wilayah perkotaan dan pusat aktivitas ekonomi. Jumlah Tenaga Kesehatan Masyarakat juga memperlihatkan pola spasial yang timpang, dengan konsentrasi tinggi pada beberapa kabupaten/kota tertentu. Sementara itu, Persentase Penduduk Miskin menunjukkan variasi spasial menengah, di mana perbedaan antarwilayah masih terlihat namun tidak se-ekstrem variabel tenaga kesehatan. Secara keseluruhan, analisis deskriptif dan spasial ini memberikan indikasi awal bahwa ketiga variabel penjelas memiliki karakteristik dan pola sebaran yang beragam, yang berpotensi memengaruhi variasi IPM antar kabupaten/kota di Provinsi Jawa Timur.
Uji autokorelasi spasial dilakukan untuk mendeteksi apakah terdapat keterkaitan spasial antarwilayah pada variabel dependen maupun variabel-variabel penjelas.
# Plot Ketetanggaan
jatim_sp <- as_Spatial(jatim_merged)
sf::sf_use_s2(FALSE)
## Spherical geometry (s2) switched off
row.names(jatim_sp) <- jatim_sp$NAME_2
# Buat daftar ketetanggaan (queen contiguity)
W <- poly2nb(jatim_sp, row.names = row.names(jatim_sp), queen = TRUE)
## although coordinates are longitude/latitude, st_intersects assumes that they
## are planar
## Warning in poly2nb(jatim_sp, row.names = row.names(jatim_sp), queen = TRUE): neighbour object has 2 sub-graphs;
## if this sub-graph count seems unexpected, try increasing the snap argument.
WL <- nb2listw(W, style = "W", zero.policy = TRUE)
lwB <- nb2listw(W,style = "B", zero.policy = TRUE)
# MORAN I
x <- jatim_merged$IPM
x[is.na(x)] <- 0
moran_res <- moran.test(x, WL, zero.policy = TRUE)
moran_summary <- data.frame(
variable = "Prevalensi Stunting",
I = moran_res$estimate[1],
expected = moran_res$estimate[2],
variance = moran_res$estimate[3],
Z = as.numeric(moran_res$statistic),
p_value = moran_res$p.value
)
moran_summary
## variable I expected variance Z
## Moran I statistic Prevalensi Stunting 0.3838593 -0.02702703 0.0171842 3.134419
## p_value
## Moran I statistic 0.000860974
Hasil uji autokorelasi spasial global menunjukkan bahwa Indeks Pembangunan Manusia (IPM) di Provinsi Jawa Timur memiliki autokorelasi spasial yang signifikan. Nilai Moran’s I sebesar 0,3839 dengan p-value < 0,05 mengindikasikan adanya pengelompokan spasial yang positif, di mana kabupaten/kota dengan nilai IPM tinggi cenderung bertetangga dengan wilayah bernilai IPM tinggi, dan demikian pula untuk wilayah dengan IPM rendah.
geary_res <- geary.test(x, WL, zero.policy = TRUE)
geary_summary <- data.frame(
variable = "Prevalensi Stunting",
C = geary_res$estimate[1],
expected = geary_res$estimate[2],
Z = as.numeric(geary_res$statistic),
p_value = geary_res$p.value
)
geary_summary
## variable C expected Z p_value
## Geary C statistic Prevalensi Stunting 0.4408453 1 3.863985 5.577607e-05
Temuan ini diperkuat oleh nilai Geary’s C sebesar 0,4408 (lebih kecil dari 1) dengan p-value yang sangat signifikan, yang menegaskan bahwa kemiripan nilai IPM lebih kuat terjadi pada wilayah-wilayah yang saling berdekatan. Secara substantif, hasil ini menunjukkan bahwa capaian pembangunan manusia tidak tersebar secara acak, melainkan dipengaruhi oleh keterkaitan spasial antarwilayah, baik melalui keterhubungan ekonomi, akses infrastruktur, maupun mobilitas penduduk.
library(spdep)
library(ggplot2)
Gz <- as.numeric(localG(x, listw = lwB, zero.policy = TRUE))
jatim_merged$z_Gistar <- Gz
jatim_merged$hotcold <- factor(
ifelse(Gz >= 1.96, "Hot spot",
ifelse(Gz <= -1.96, "Cold spot", "Not significant")),
levels = c("Hot spot", "Cold spot", "Not significant")
)
ggplot(jatim_merged) +
geom_sf(aes(fill = hotcold), color = "white", linewidth = 0.2) +
scale_fill_manual(values = c(
"Hot spot" = "#b2182b",
"Cold spot" = "#2166ac",
"Not significant" = "grey85"
)) +
labs(
title = "Getis-Ord G* — Indeks Pembangunan Manusia",
fill = "Hot / Cold"
) +
theme_minimal()
Fenomena spasial tersebut terlihat lebih jelas pada analisis autokorelasi lokal. Berdasarkan Getis–Ord Gi*, teridentifikasi hotspot IPM di Kabupaten Gresik, yang menandakan adanya konsentrasi nilai IPM tinggi yang signifikan secara spasial. Sebaliknya, Kabupaten Sampang dan Kabupaten Pamekasan teridentifikasi sebagai cold spot, yaitu wilayah dengan nilai IPM rendah yang saling berdekatan dan berbeda secara signifikan dari wilayah sekitarnya. Pola ini mengindikasikan adanya ketimpangan pembangunan manusia yang bersifat lokal, di mana wilayah tertentu tertinggal secara sistematis dibandingkan wilayah lain yang berdekatan.
local_res <- localmoran(x, WL, zero.policy = TRUE)
colnames(local_res) <- c("Ii","E.Ii","Var.Ii","Z.Ii","P.value")
mean_x <- mean(x, na.rm = TRUE)
mean_lag <- lag.listw(WL, x)
cluster <- rep(NA, length(x))
cluster[x >= mean_x & mean_lag >= mean(mean_lag)] <- "High-High"
cluster[x <= mean_x & mean_lag <= mean(mean_lag)] <- "Low-Low"
cluster[x >= mean_x & mean_lag <= mean(mean_lag)] <- "High-Low"
cluster[x <= mean_x & mean_lag >= mean(mean_lag)] <- "Low-High"
cluster[local_res[, "P.value"] > 0.05] <- "Non-significant"
jatim_merged$cluster <- factor(
cluster,
levels = c("High-High","Low-Low","High-Low","Low-High","Non-significant")
)
ggplot(jatim_merged) +
geom_sf(aes(fill = cluster), color = "white", linewidth = 0.2) +
scale_fill_manual(values = c(
"High-High" = "red",
"Low-Low" = "blue",
"High-Low" = "orange",
"Low-High" = "green",
"Non-significant" = "grey80"
)) +
labs(
title = "Local Moran’s I (LISA) — Indeks Pembangunan Manusia",
fill = "Cluster type"
) +
theme_minimal()
Hasil Local Moran’s I (LISA) memberikan konfirmasi lebih lanjut terhadap pola tersebut. Kabupaten Gresik termasuk dalam kategori high–high, yang berarti wilayah ini memiliki IPM tinggi dan dikelilingi oleh wilayah dengan IPM tinggi pula. Sementara itu, Kabupaten Sampang dan Kabupaten Pamekasan tergolong dalam klaster low–low, yaitu wilayah dengan IPM rendah yang bertetangga dengan wilayah lain yang juga memiliki IPM rendah. Tidak ditemukannya klaster high–low atau low–high menunjukkan bahwa pola IPM di Jawa Timur cenderung membentuk pengelompokan yang relatif stabil, bukan wilayah anomali yang menyimpang dari kondisi sekitarnya.
Menariknya, meskipun secara umum IPM tinggi sering diasosiasikan dengan wilayah perkotaan, hotspot dan klaster high–high IPM justru muncul di Kabupaten Gresik, yang secara administratif merupakan wilayah kabupaten. Hal ini dapat dijelaskan oleh karakteristik Gresik sebagai kabupaten industri dan penyangga utama Kota Surabaya, dengan tingkat industrialisasi tinggi, upah relatif besar, serta akses pendidikan dan kesehatan yang baik. Interaksi ekonomi yang kuat dengan kawasan metropolitan Surabaya mendorong peningkatan kualitas hidup penduduk, sehingga capaian IPM Gresik tidak hanya tinggi secara absolut, tetapi juga serupa dengan wilayah sekitarnya. Sebaliknya, Sampang dan Pamekasan, yang berada di Pulau Madura, menghadapi keterbatasan infrastruktur, tingkat kemiskinan yang relatif tinggi, serta akses layanan pendidikan dan kesehatan yang lebih terbatas, sehingga membentuk klaster IPM rendah yang saling menguatkan secara spasial.
exclude_vars <- c("IPM", "z_Gistar")
num_vars <- sapply(jatim_merged, is.numeric)
num_cols <- setdiff(names(jatim_merged)[num_vars], exclude_vars)
# MORAN'S I
moran_summary <- do.call(rbind,
lapply(num_cols, function(var) {
x <- jatim_merged[[var]]
if(any(is.na(x))) x[is.na(x)] <- 0
res <- moran.test(x, WL, zero.policy = TRUE)
data.frame(
variable = var,
I = res$estimate[1],
expected = res$estimate[2],
variance = res$estimate[3],
Z = as.numeric(res$statistic),
p_value = res$p.value,
stringsAsFactors = FALSE
)
})
)
rownames(moran_summary) <- NULL
moran_summary
## variable I expected variance
## 1 IPLM 0.03144891 -0.02702703 0.017016080
## 2 Jumlah.Tenaga.Kesehatan.Masyarakat 0.20020206 -0.02702703 0.007344989
## 3 Persentase.Penduduk.Miskin 0.40985712 -0.02702703 0.016832704
## Z p_value
## 1 0.448278 0.3269762777
## 2 2.651358 0.0040084426
## 3 3.367358 0.0003794599
Selain IPM, hasil uji Moran’s I pada variabel penjelas yang digunakan dalam analisis menunjukkan adanya perbedaan karakteristik autokorelasi spasial. Variabel Persentase Penduduk Miskin dan Jumlah Tenaga Kesehatan Masyarakat memiliki nilai Moran’s I yang positif dan signifikan (p-value < 0,05), yang mengindikasikan adanya pengelompokan spasial. Hal ini menunjukkan bahwa wilayah dengan tingkat kemiskinan yang relatif tinggi atau rendah, serta ketersediaan tenaga kesehatan masyarakat yang serupa, cenderung berdekatan secara geografis.
Sebaliknya, variabel Indeks Pembangunan Literasi Masyarakat (IPLM) tidak menunjukkan autokorelasi spasial yang signifikan. Kondisi ini mengindikasikan bahwa variasi tingkat literasi masyarakat antar kabupaten/kota tidak sepenuhnya dipengaruhi oleh kedekatan geografis, melainkan lebih ditentukan oleh faktor-faktor lokal, seperti kebijakan daerah, karakteristik sosial budaya, dan program pembangunan literasi yang spesifik pada masing-masing wilayah.
Secara keseluruhan, hasil uji autokorelasi spasial global menunjukkan bahwa IPM serta sebagian variabel penjelas memiliki keterkaitan spasial yang nyata. Temuan ini menegaskan bahwa asumsi independensi antarwilayah tidak sepenuhnya terpenuhi, sehingga penggunaan pendekatan pemodelan spasial menjadi relevan dan diperlukan pada tahap analisis selanjutnya.
Estimasi parameter dilakukan menggunakan metode Ordinary Least Squares (OLS) dengan IPM sebagai variabel dependen dan tiga variabel independen.
ols_model <- lm(
IPM ~
IPLM +
Jumlah.Tenaga.Kesehatan.Masyarakat +
Persentase.Penduduk.Miskin,
data = jatim_merged
)
summary(ols_model)
##
## Call:
## lm(formula = IPM ~ IPLM + Jumlah.Tenaga.Kesehatan.Masyarakat +
## Persentase.Penduduk.Miskin, data = jatim_merged)
##
## Residuals:
## Min 1Q Median 3Q Max
## -4.2139 -1.8610 0.2693 1.3333 5.9422
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 76.115062 2.904290 26.208 < 2e-16 ***
## IPLM 0.090158 0.030494 2.957 0.00562 **
## Jumlah.Tenaga.Kesehatan.Masyarakat 0.002209 0.005332 0.414 0.68123
## Persentase.Penduduk.Miskin -0.710703 0.121897 -5.830 1.43e-06 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 2.535 on 34 degrees of freedom
## Multiple R-squared: 0.7392, Adjusted R-squared: 0.7162
## F-statistic: 32.12 on 3 and 34 DF, p-value: 4.929e-10
Hasil estimasi menunjukkan bahwa model OLS yang dibangun memiliki kemampuan penjelasan yang cukup baik, dengan nilai Adjusted R-squared sebesar 0,7162, yang berarti sekitar 71,62% variasi IPM antar kabupaten/kota di Jawa Timur dapat dijelaskan oleh variabel-variabel dalam model. Uji simultan melalui statistik F menghasilkan p-value < 0,05, sehingga dapat disimpulkan bahwa seluruh variabel independen secara bersama-sama berpengaruh signifikan terhadap IPM.
Uji multikolinearitas dilakukan menggunakan Variance Inflation Factor (VIF).
Hipotesis
H0 : Tidak terdapat multikolinearitas antar variabel independen
H1 : Terdapat multikolinearitas antar variabel independen
Kriteria Uji
Tolak H0 jika nilai VIF > 10
library(car)
## Loading required package: carData
##
## Attaching package: 'car'
## The following object is masked from 'package:dplyr':
##
## recode
vif(ols_model)
## IPLM Jumlah.Tenaga.Kesehatan.Masyarakat
## 1.476643 1.108634
## Persentase.Penduduk.Miskin
## 1.518975
Seluruh variabel memiliki nilai VIF <10, sehingga dapat disimpulkan bahwa tidak terdapat masalah multikolinearitas yang serius dalam model OLS.
Uji normalitas residual dilakukan menggunakan uji Shapiro–Wilk.
Hipotesis
H0 : Residual berdistribusi normal
H1 : Residual tidak berdistribusi normal
Kriteria Uji
Tolak H0 jika p-value ≤ α (5%)
shapiro.test(residuals(ols_model))
##
## Shapiro-Wilk normality test
##
## data: residuals(ols_model)
## W = 0.96817, p-value = 0.3448
Hasil uji Shapiro–Wilk menunjukkan p-value sebesar 0,3448 (> 0,05), sehingga H0 tidak ditolak. Dengan demikian, residual model OLS dapat dianggap berdistribusi normal.
Uji homoskedastisitas dilakukan menggunakan uji Breusch–Pagan.
Hipotesis
H0 : Residual bersifat homoskedastis
H1 : Residual bersifat heteroskedastis
Kriteria Uji
Tolak H0 jika p-value ≤ α (5%)
library(lmtest)
## Loading required package: zoo
##
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
bptest(ols_model)
##
## studentized Breusch-Pagan test
##
## data: ols_model
## BP = 7.5342, df = 3, p-value = 0.05669
Nilai p-value uji Breusch–Pagan sebesar 0,05669 (> 0,05), sehingga tidak terdapat indikasi heteroskedastisitas. Residual model OLS memenuhi asumsi homoskedastisitas.
Uji linearitas dilakukan menggunakan uji Harvest.
Hipotesis
H0 : Model telah terestimasi secara linear dan spesifikasi model sudah
tepat
H1 : Model tidak linear atau terdapat kesalahan spesifikasi
Kriteria Uji:
Tolak H0 jika p-value ≤ α (5%)
library(lmtest)
harvtest(ols_model)
##
## Harvey-Collier test
##
## data: ols_model
## HC = 0.96032, df = 33, p-value = 0.3439
Hasil uji RESET menghasilkan p-value sebesar 0,3439(> 0,05), sehingga H0 diterima. Dengan demikian, hubungan antara variabel independen dan IPM dapat dianggap linear.
Uji independensi residual secara spasial dilakukan menggunakan uji Moran’s I terhadap residual OLS.
Hipotesis
H0 : Tidak terdapat autokorelasi spasial pada residual
H1 : Terdapat autokorelasi spasial pada residual
Kriteria Uji
Tolak H0 jika p-value ≤ α (5%)
jatim_merged$residual_ols <- residuals(ols_model)
moran_res <- moran.test(
jatim_merged$residual_ols,
WL,
zero.policy = TRUE
)
moran_res
##
## Moran I test under randomisation
##
## data: jatim_merged$residual_ols
## weights: WL
##
## Moran I statistic standard deviate = 2.8224, p-value = 0.002383
## alternative hypothesis: greater
## sample estimates:
## Moran I statistic Expectation Variance
## 0.34058936 -0.02702703 0.01696455
Hasil uji Moran’s I menunjukkan nilai p-value sebesar 0,00283 (< 0,05), sehingga H0 ditolak. Artinya, residual model OLS masih mengandung autokorelasi spasial, sehingga residual belum bersifat white noise. Kondisi ini mengindikasikan bahwa model OLS belum mampu menangkap sepenuhnya ketergantungan spasial antar wilayah. Oleh karena itu, diperlukan pengembangan model menggunakan pendekatan model ekonometrika spasial agar estimasi parameter menjadi lebih efisien dan tidak bias.
Uji Lagrange Multiplier (LM) dilakukan untuk mengidentifikasi bentuk ketergantungan spasial yang terdapat pada model OLS, apakah bersumber dari komponen lag variabel dependen (spatial lag), komponen error (spatial error), atau kombinasi keduanya.
lm.RStests(ols_model, listw = WL, zero.policy = TRUE, test = "all")
##
## Rao's score (a.k.a Lagrange multiplier) diagnostics for spatial
## dependence
##
## data:
## model: lm(formula = IPM ~ IPLM + Jumlah.Tenaga.Kesehatan.Masyarakat +
## Persentase.Penduduk.Miskin, data = jatim_merged)
## test weights: WL
##
## RSerr = 6.2038, df = 1, p-value = 0.01275
##
##
## Rao's score (a.k.a Lagrange multiplier) diagnostics for spatial
## dependence
##
## data:
## model: lm(formula = IPM ~ IPLM + Jumlah.Tenaga.Kesehatan.Masyarakat +
## Persentase.Penduduk.Miskin, data = jatim_merged)
## test weights: WL
##
## RSlag = 5.7412, df = 1, p-value = 0.01657
##
##
## Rao's score (a.k.a Lagrange multiplier) diagnostics for spatial
## dependence
##
## data:
## model: lm(formula = IPM ~ IPLM + Jumlah.Tenaga.Kesehatan.Masyarakat +
## Persentase.Penduduk.Miskin, data = jatim_merged)
## test weights: WL
##
## adjRSerr = 1.2832, df = 1, p-value = 0.2573
##
##
## Rao's score (a.k.a Lagrange multiplier) diagnostics for spatial
## dependence
##
## data:
## model: lm(formula = IPM ~ IPLM + Jumlah.Tenaga.Kesehatan.Masyarakat +
## Persentase.Penduduk.Miskin, data = jatim_merged)
## test weights: WL
##
## adjRSlag = 0.82066, df = 1, p-value = 0.365
##
##
## Rao's score (a.k.a Lagrange multiplier) diagnostics for spatial
## dependence
##
## data:
## model: lm(formula = IPM ~ IPLM + Jumlah.Tenaga.Kesehatan.Masyarakat +
## Persentase.Penduduk.Miskin, data = jatim_merged)
## test weights: WL
##
## SARMA = 7.0245, df = 2, p-value = 0.02983
Hasil uji LM menunjukkan bahwa LM Error (RSerr) dan LM Lag (RSlag) sama-sama signifikan pada taraf 5%, dengan p-value masing-masing sebesar 0,01275 dan 0,01657. Temuan ini mengindikasikan bahwa baik ketergantungan spasial pada komponen error maupun pengaruh spasial melalui lag variabel dependen terdeteksi pada model OLS.
Meskipun demikian, hasil LM Robust menunjukkan bahwa baik Robust LM Error (adjRSerr) maupun Robust LM Lag (adjRSlag) tidak signifikan pada taraf 5%. Kondisi ini mengindikasikan bahwa tidak terdapat bukti yang cukup kuat untuk menyimpulkan dominasi satu bentuk ketergantungan spasial secara tunggal, sehingga struktur spasial pada data cenderung bersifat kompleks dan tidak dapat dijelaskan hanya oleh satu mekanisme saja.
Uji SARMA yang signifikan (p-value = 0,02983) semakin memperkuat indikasi adanya ketergantungan spasial gabungan antara komponen lag dan error. Selain itu, hasil uji autokorelasi spasial sebelumnya menunjukkan bahwa beberapa variabel independen memiliki autokorelasi spasial, yang mengindikasikan adanya kemungkinan spillover effect dari variabel penjelas antarwilayah.
Berdasarkan pertimbangan tersebut, maka model ekonometrika spasial yang relevan untuk dianalisis dan dibandingkan meliputi Spatial Autoregressive Model (SAR) dan Spatial Error Model (SEM) sebagai model dasar, serta Spatial Durbin Model (SDM) dan Spatial Durbin Error Model (SDEM) untuk menangkap pengaruh spasial pada variabel independen. Selain itu, Spatial Autoregressive Combined Model (SAC) juga dipertimbangkan untuk merepresentasikan ketergantungan spasial gabungan pada komponen lag dan error. Model General Nested Spatial Model (GNS) tidak dipertimbangkan lebih lanjut karena kompleksitasnya yang tinggi dan keterbatasan interpretasi dalam konteks penelitian ini.
Pemilihan model terbaik dilakukan dengan menggunakan kriteria Akaike Information Criterion (AIC), di mana model dengan nilai AIC terkecil dipilih sebagai model yang paling sesuai. Empat model yang dibandingkan adalah SEM, SDEM, SAC, dan GNS.
library(spatialreg)
## Loading required package: Matrix
##
## Attaching package: 'spatialreg'
## The following objects are masked from 'package:spdep':
##
## get.ClusterOption, get.coresOption, get.mcOption,
## get.VerboseOption, get.ZeroPolicyOption, set.ClusterOption,
## set.coresOption, set.mcOption, set.VerboseOption,
## set.ZeroPolicyOption
# SAR (Spatial Autoregressive Model)
sar_model <- lagsarlm(
IPM ~
IPLM +
Jumlah.Tenaga.Kesehatan.Masyarakat +
Persentase.Penduduk.Miskin,
data = jatim_merged,
listw = WL,
method = "eigen"
)
# SEM
sem_model <- errorsarlm(
IPM ~
IPLM +
Jumlah.Tenaga.Kesehatan.Masyarakat +
Persentase.Penduduk.Miskin,
data = jatim_merged,
listw = WL,
method = "eigen"
)
# SDEM
sdem_model <- errorsarlm(
IPM ~
IPLM +
Jumlah.Tenaga.Kesehatan.Masyarakat +
Persentase.Penduduk.Miskin,
data = jatim_merged,
listw = WL,
Durbin = TRUE,
method = "eigen"
)
# SDM (Spatial Durbin Model)
sdm_model <- lagsarlm(
IPM ~
IPLM +
Jumlah.Tenaga.Kesehatan.Masyarakat +
Persentase.Penduduk.Miskin,
data = jatim_merged,
listw = WL,
Durbin = TRUE,
method = "eigen"
)
# SAC
sac_model <- sacsarlm(
IPM ~
IPLM +
Jumlah.Tenaga.Kesehatan.Masyarakat +
Persentase.Penduduk.Miskin,
data = jatim_merged,
listw = WL,
method = "eigen"
)
# Perbandingan Model
aic_values <- c(
SAR = AIC(sar_model),
SEM = AIC(sem_model),
SDEM = AIC(sdem_model),
SDM = AIC(sdm_model),
SAC = AIC(sac_model)
)
aic_values[order(aic_values)]
## SDM SEM SDEM SAC SAR
## 175.9575 176.4855 176.9566 177.3604 178.8638
Hasil perbandingan AIC menunjukkan bahwa model Spatial Durbin Model (SDM) memiliki nilai AIC paling kecil, yaitu 175,96, dibandingkan dengan SEM (176,49), SDEM (176,96), SAC (177,36), dan SAR (178,86). Hal ini menandakan bahwa SDM memberikan kecocokan model terbaik untuk data IPM Jawa Timur di antara model-model spasial yang dibandingkan.
Secara teoritis, terpilihnya SDM sejalan dengan temuan uji Lagrange Multiplier (LM) dan uji SARMA yang menunjukkan adanya indikasi ketergantungan spasial pada variabel dependen dan uji autokorelasi spasial yang signifikan pada beberapa variabel independen. Model SDM mampu menangkap pengaruh spasial langsung (lag) pada IPM serta spillover effect dari variabel independen secara simultan, sehingga lebih fleksibel dalam menjelaskan variasi IPM antar kabupaten/kota. Dengan demikian, SDM dianggap paling sesuai untuk menggambarkan proses spasial IPM di Jawa Timur, yang dipengaruhi baik oleh keterkaitan wilayah tetangga maupun faktor-faktor laten pada variabel penjelas yang memiliki autokorelasi spasial.
summary(sdm_model)
##
## Call:lagsarlm(formula = IPM ~ IPLM + Jumlah.Tenaga.Kesehatan.Masyarakat +
## Persentase.Penduduk.Miskin, data = jatim_merged, listw = WL,
## Durbin = TRUE, method = "eigen")
##
## Residuals:
## Min 1Q Median 3Q Max
## -3.05172 -1.05548 -0.09548 0.81616 5.86944
##
## Type: mixed
## Coefficients: (asymptotic standard errors)
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 33.2365865 10.9354002 3.0394 0.002371
## IPLM 0.1140934 0.0232318 4.9111 9.057e-07
## Jumlah.Tenaga.Kesehatan.Masyarakat -0.0104178 0.0046421 -2.2442 0.024818
## Persentase.Penduduk.Miskin -0.6267768 0.1005960 -6.2306 4.646e-10
## lag.IPLM -0.1333700 0.0680376 -1.9602 0.049968
## lag.Jumlah.Tenaga.Kesehatan.Masyarakat 0.0291802 0.0116471 2.5054 0.012232
## lag.Persentase.Penduduk.Miskin 0.2747565 0.1636437 1.6790 0.093154
##
## Rho: 0.59722, LR test value: 11.073, p-value: 0.00087599
## Asymptotic standard error: 0.12238
## z-value: 4.88, p-value: 1.0609e-06
## Wald statistic: 23.814, p-value: 1.0609e-06
##
## Log likelihood: -78.97873 for mixed model
## ML residual variance (sigma squared): 3.3122, (sigma: 1.8199)
## Number of observations: 38
## Number of parameters estimated: 9
## AIC: 175.96, (AIC for lm: 185.03)
## LM test for residual autocorrelation
## test value: 0.10584, p-value: 0.74493
Hasil estimasi Spatial Durbin Model (SDM) menunjukkan bahwa model ini memberikan peningkatan kinerja dibandingkan model OLS. Hal ini ditunjukkan oleh nilai AIC yang lebih kecil (175,96 vs 184,3) dan Likelihood Ratio (LR) test yang signifikan (p-value = 0,00088), yang menandakan bahwa penambahan komponen spasial secara signifikan meningkatkan kualitas model.
Parameter ρ (rho) bernilai positif dan signifikan (ρ = 0,5972; p-value < 0,001), menunjukkan adanya pengaruh langsung IPM wilayah tetangga terhadap IPM suatu wilayah. Hal ini menandakan bahwa pembangunan manusia antar kabupaten/kota saling terkait, sehingga perubahan IPM di suatu wilayah dapat memengaruhi wilayah sekitarnya.
Selain itu, beberapa lag variabel independen juga signifikan, yaitu lag.IPLM (p-value = 0,04997) dan lag.Persentase Penduduk Miskin (p-value = 0,0932), yang menandakan bahwa kondisi literasi dan tingkat kemiskinan di wilayah tetangga turut memengaruhi IPM wilayah tertentu. Temuan ini menegaskan bahwa model SDM mampu menangkap spillover effect, di mana pembangunan manusia di satu wilayah tidak dapat dipandang terisolasi, melainkan saling terkait dengan wilayah sekitarnya.
moran.test(residuals(sdm_model), WL, zero.policy = TRUE)
##
## Moran I test under randomisation
##
## data: residuals(sdm_model)
## weights: WL
##
## Moran I statistic standard deviate = 0.36297, p-value = 0.3583
## alternative hypothesis: greater
## sample estimates:
## Moran I statistic Expectation Variance
## 0.01926154 -0.02702703 0.01626310
Uji independensi residual model SDM dilakukan menggunakan uji Moran’s I. Hasilnya menunjukkan p-value sebesar 0,3583 (> 0,05), sehingga tidak terdapat autokorelasi spasial pada residual model SDM. Dengan demikian, residual model dapat dianggap telah memenuhi asumsi independensi spasial atau bersifat white noise, yang menandakan bahwa model SDM telah berhasil menangkap ketergantungan spasial yang sebelumnya masih tersisa pada model OLS.
Efek langsung menggambarkan pengaruh variabel independen terhadap Indeks Pembangunan Manusia (IPM) di wilayah yang sama. Berdasarkan hasil estimasi model SDM, beberapa variabel menunjukkan pengaruh signifikan. Berdasarkan hasil summary pada model, diperoleh intepretasi berikut :
IPLM berpengaruh positif dan signifikan (β = 0,1141; p-value < 0,001), menunjukkan bahwa peningkatan literasi masyarakat secara langsung meningkatkan capaian pembangunan manusia.
Jumlah Tenaga Kesehatan Masyarakat berpengaruh negatif dan signifikan (β = −0,0104; p-value = 0,0248). Meski kecil, hasil ini dapat menunjukkan distribusi tenaga kesehatan yang tidak merata atau konsentrasi di wilayah tertentu.
Persentase Penduduk Miskin berpengaruh negatif dan sangat signifikan (β = −0,6268; p-value < 0,001), yang menegaskan bahwa kemiskinan secara langsung menurunkan capaian pembangunan manusia di wilayah tersebut.
Efek tidak langsung (spillover) mencerminkan pengaruh variabel independen di wilayah tetangga terhadap IPM di suatu wilayah tertentu:
lag.IPLM memiliki efek negatif dan signifikan (β = −0,1334; p-value = 0,04997), menunjukkan bahwa peningkatan literasi di wilayah tetangga sedikit menurunkan IPM wilayah sekitar setelah memperhitungkan efek langsung.
lag.Jumlah Tenaga Kesehatan Masyarakat berpengaruh positif dan signifikan (β = 0,02918; p-value = 0,0122), mengindikasikan bahwa distribusi tenaga kesehatan di wilayah tetangga berkontribusi terhadap peningkatan IPM wilayah sekitarnya.
lag.Persentase Penduduk Miskin bersifat positif tetapi tidak signifikan (β = 0,2748; p-value = 0,0932), sehingga efek kemiskinan tetangga terhadap IPM tidak cukup kuat secara statistik.
Secara keseluruhan, hasil model SDM menegaskan bahwa pembangunan manusia di Jawa Timur dipengaruhi baik oleh kondisi internal wilayah sendiri maupun oleh kondisi wilayah tetangga. Dengan demikian, kebijakan pembangunan manusia sebaiknya mempertimbangkan koordinasi regional antar kabupaten/kota untuk memaksimalkan efek positif spillover dan meminimalkan disparitas antarwilayah.
Ordinary Kriging digunakan untuk mengestimasi nilai Indeks Pembangunan Manusia (IPM) pada tingkat kecamatan di Provinsi Jawa Timur tahun 2024 berdasarkan data IPM kabupaten/kota. Metode ini memanfaatkan struktur ketergantungan spasial antarwilayah dengan asumsi rata-rata IPM bersifat konstan tetapi tidak diketahui, sehingga estimasi dilakukan secara lokal berdasarkan pola spasial yang terbentuk.
Sebelum penerapan Ordinary Kriging, diperlukan pengujian terhadap beberapa asumsi dasar. Asumsi utama berupa autokorelasi spasial pada variabel IPM telah dibuktikan dan dipenuhi pada Subbab 4.2, sehingga pada tahap ini pengujian difokuskan pada asumsi lain yang berkaitan dengan distribusi data dan sifat stasioner proses spasial.
Uji normalitas dilakukan menggunakan uji Shapiro–Wilk terhadap data IPM kabupaten/kota di Jawa Timur.
shapiro.test(jatim_merged$IPM)
##
## Shapiro-Wilk normality test
##
## data: jatim_merged$IPM
## W = 0.9518, p-value = 0.1021
Hasil pengujian menunjukkan nilai statistik W=0,9518 dengan p-value sebesar 0,1021, yang lebih besar dari taraf signifikansi 5%. Dengan demikian, tidak terdapat cukup bukti untuk menolak hipotesis nol, sehingga data IPM dapat dianggap berdistribusi normal.
qqnorm(jatim_merged$IPM, main="Q-Q Plot IPM")
qqline(jatim_merged$IPM, col = "red", lwd = 2)
boxplot(jatim_merged$IPM,
main="Boxplot IPM untuk Cek Outlier",
col="plum1",
horizontal=TRUE)
Selain itu, pemeriksaan visual melalui Q–Q plot menunjukkan bahwa titik-titik data mengikuti garis diagonal, serta boxplot tidak memperlihatkan adanya outlier yang ekstrem. Hal ini mengindikasikan bahwa data IPM memenuhi asumsi normalitas dan tidak mengandung nilai ekstrem yang berpotensi mendistorsi estimasi kriging.
Asumsi stasioneritas diuji untuk memastikan bahwa rata-rata IPM tidak menunjukkan tren spasial yang kuat terhadap arah geografis tertentu.
coords_centroid <- st_coordinates(st_centroid(st_geometry(jatim_merged)))
## Warning in st_centroid.sfc(st_geometry(jatim_merged)): st_centroid does not
## give correct centroids for longitude/latitude data
jatim_merged$X_coord <- coords_centroid[,1]
jatim_merged$Y_coord <- coords_centroid[,2]
par(mfrow=c(1,2))
# Tren Barat - Timur (Berdasarkan Longitude)
plot(jatim_merged$X_coord, jatim_merged$IPM,
main="Tren Barat-Timur",
xlab="Longitude (X)",
ylab="IPM",
pch=19, col="darkblue")
abline(lm(IPM ~ X_coord, data=jatim_merged), col="red", lwd=2)
# Tren Utara - Selatan (Berdasarkan Latitude)
plot(jatim_merged$Y_coord, jatim_merged$IPM,
main="Tren Utara-Selatan",
xlab="Latitude (Y)",
ylab="IPM",
pch=19, col="darkgreen")
abline(lm(IPM ~ Y_coord, data=jatim_merged), col="red", lwd=2)
Identifikasi awal dilakukan melalui plot tren Barat–Timur (longitude) dan Utara–Selatan (latitude), yang secara visual menunjukkan kecenderungan tren yang relatif lemah.
Untuk mengonfirmasi secara statistik, dilakukan pemodelan regresi linier dengan IPM sebagai variabel dependen dan koordinat geografis sebagai prediktor.
model_tren <- lm(IPM ~ X_coord + Y_coord, data = jatim_merged)
summary(model_tren)
##
## Call:
## lm(formula = IPM ~ X_coord + Y_coord, data = jatim_merged)
##
## Residuals:
## Min 1Q Median 3Q Max
## -7.051 -3.144 -1.578 3.914 9.889
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 262.7426 104.2483 2.520 0.0164 *
## X_coord -1.7026 0.9127 -1.865 0.0705 .
## Y_coord -0.5472 1.8806 -0.291 0.7728
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 4.658 on 35 degrees of freedom
## Multiple R-squared: 0.09346, Adjusted R-squared: 0.04165
## F-statistic: 1.804 on 2 and 35 DF, p-value: 0.1796
Hasil regresi menunjukkan bahwa baik koordinat longitude maupun latitude tidak signifikan secara statistik pada taraf 5%, dengan nilai p-value masing-masing sebesar 0,0705 dan 0,7728. Uji simultan melalui statistik F juga menghasilkan p-value sebesar 0,1796, yang menandakan bahwa model tren spasial tidak signifikan secara keseluruhan.
Dengan demikian, tidak terdapat tren spasial global yang kuat pada data IPM. Artinya, struktur ketergantungan spasial (variogram) sama ke segala arah, baik barat–timur maupun utara–selatan, sehingga asumsi stasioneritas orde pertama dapat dianggap terpenuhi dan Ordinary Kriging layak untuk diterapkan.
Pemodelan variogram dilakukan untuk menggambarkan pola ketergantungan spasial IPM berdasarkan jarak antarwilayah.
Uji anisotropi dilakukan dengan membandingkan variogram berdasarkan beberapa arah utama.
library(gstat)
v_dir <- variogram(IPM ~ 1, data = jatim_sp, alpha = c(0, 45, 90, 135))
plot(v_dir, main = "Variogram Berdasarkan Arah")
Berdasarkan variogram segala arah yang ditampilkan, tidak terlihat perbedaan pola semivarians yang mencolok antararah. Hal ini menunjukkan bahwa ketergantungan spasial IPM bersifat relatif seragam ke segala arah, sehingga asumsi isotropi dapat diterima dan pemodelan variogram dilakukan tanpa mempertimbangkan arah tertentu.
Variogram eksperimental dibangun menggunakan setengah jarak maksimum antarwilayah sebagai batas cutoff. Untuk meningkatkan stabilitas estimasi, lag dengan jumlah pasangan data kurang dari 10 dihilangkan. Variogram hasil pembersihan menunjukkan pola peningkatan semivarians seiring bertambahnya jarak hingga mendekati nilai sill.
dist_max <- max(spDists(jatim_sp))
v_exp <- variogram(IPM ~ 1, data = jatim_sp, cutoff = dist_max/2, width = dist_max/20)
# Menghilangkan lag yang tidak stabil (np < 10)
v_exp_clean <- v_exp[v_exp$np > 10, ]
plot(v_exp_clean, main = "Variogram Eksperimental")
Selanjutnya dilakukan kompetisi tiga model variogram teoritis, yaitu Spherical, Exponential, dan Gaussian. Evaluasi dilakukan berdasarkan nilai Sum of Squared Errors (SSE).
init_nugget <- 10
init_psill <- 15
init_range <- 100
m_sph <- fit.variogram(v_exp_clean, vgm(init_psill, "Sph", init_range, init_nugget))
m_exp <- fit.variogram(v_exp_clean, vgm(init_psill, "Exp", init_range, init_nugget))
m_gau <- fit.variogram(v_exp_clean, vgm(init_psill, "Gau", init_range, init_nugget))
## Warning in fit.variogram(v_exp_clean, vgm(init_psill, "Gau", init_range, : No
## convergence after 200 iterations: try different initial values?
sse <- c(
"SSE Spherical" = attr(m_sph, "SSErr"),
"SSE Exponential" = attr(m_exp, "SSErr"),
"SSE Gaussian" = attr(m_gau, "SSErr")
)
sse
## SSE Spherical SSE Exponential SSE Gaussian
## 0.2028167 0.1255077 0.2467126
Hasil perbandingan menunjukkan bahwa model Exponential memiliki nilai SSE terkecil sebesar 0,1255, dibandingkan model Spherical (0,2028) dan Gaussian (0,2467). Oleh karena itu, model variogram Exponential dipilih sebagai model terbaik untuk proses interpolasi Ordinary Kriging.
Interpolasi dilakukan dengan menggunakan Ordinary Kriging, di mana IPM dimodelkan sebagai proses spasial dengan rata-rata konstan namun tidak diketahui. Titik sumber berupa centroid kabupaten/kota digunakan untuk membangun prediksi, sedangkan titik target berupa centroid kecamatan di seluruh Provinsi Jawa Timur.
Proses interpolasi menghasilkan estimasi nilai IPM pada seluruh kecamatan di Jawa Timur.
# Load Peta Kecamatan
kec_indo <- readRDS("C:/Users/DEDEN GUNAWAN/OneDrive/Documents/Bahan Kuliah/Semester 5/Analisis Spasial/gadm36_IDN_3_sp.rds")
kec_jatim <- kec_indo[kec_indo$NAME_1 == "Jawa Timur",]
# Ambil centroid dari tiap kabupaten
titik_kab_coords <- coordinates(jatim_sp)
jatim_points <- SpatialPointsDataFrame(coords = titik_kab_coords, data = jatim_sp@data)
proj4string(jatim_points) <- CRS(as.character(NA))
# Ambil centroid dari tiap kecamatan
titik_kecamatan <- coordinates(kec_jatim)
kec_pred_grid <- SpatialPoints(titik_kecamatan)
proj4string(kec_pred_grid) <- CRS(as.character(NA))
# Jalankan Prediksi Kriging ke Kecamatan
hasil_kecamatan <- krige(IPM ~ 1,
jatim_points,
kec_pred_grid,
model = m_exp)
## [using ordinary kriging]
# Hasil interpolasi
hasil_df <- as.data.frame(hasil_kecamatan)
hasil_lengkap <- data.frame(
Kab_Kota = kec_jatim$NAME_2,
Kecamatan = kec_jatim$NAME_3,
Longitude = hasil_df$coords.x1,
Latitude = hasil_df$coords.x2,
IPM_Prediksi = hasil_df$var1.pred,
Error_Var = hasil_df$var1.var
)
head(hasil_lengkap)
## Kab_Kota Kecamatan Longitude Latitude IPM_Prediksi Error_Var
## 1 Bangkalan Arosbaya 112.8393 -6.972611 69.67665 0.10348753
## 2 Bangkalan Bangkalan 112.7400 -7.028984 73.72595 0.11551473
## 3 Bangkalan Blega 113.0489 -7.124263 69.45154 0.09705397
## 4 Bangkalan Burneh 112.8034 -7.033128 72.04290 0.09596054
## 5 Bangkalan Galis 112.9632 -7.088463 68.93730 0.05164303
## 6 Bangkalan Geger 112.9325 -7.002308 67.31881 0.04337282
Nilai hasil interpolasi tersebut kemudian divisualisasikan dalam bentuk peta sebaran sebagai berikut.
library(sf)
library(ggplot2)
library(viridis)
## Loading required package: viridisLite
kec_sf <- st_as_sf(kec_jatim)
st_crs(kec_sf) <- 4326
kec_sf$IPM_Prediksi <- hasil_lengkap$IPM_Prediksi
# Peta Sebaran
ggplot(data = kec_sf) +
geom_sf(
aes(fill = IPM_Prediksi),
color = "white",
linewidth = 0.2
) +
scale_fill_viridis_c(option = "C", na.value = "grey90") +
labs(
title = "Sebaran Prediksi IPM Tingkat Kecamatan Jawa Timur",
fill = "Prediksi IPM"
) +
theme_minimal()
Peta sebaran hasil interpolasi menunjukkan adanya variasi spasial IPM yang cukup jelas. Wilayah dengan IPM relatif tinggi cenderung terkonsentrasi di kawasan perkotaan dan pusat pertumbuhan ekonomi, seperti wilayah metropolitan dan kota-kota besar. Sebaliknya, wilayah dengan IPM lebih rendah umumnya berada di daerah pinggiran dan kawasan perdesaan.
Secara umum, pola spasial hasil interpolasi konsisten dengan distribusi IPM kabupaten/kota, namun memberikan gambaran yang lebih rinci pada skala kecamatan. Dengan demikian, hasil interpolasi ini mampu memperkaya informasi spasial IPM yang sebelumnya hanya tersedia pada tingkat administrasi yang lebih kasar.
Selain nilai prediksi, Ordinary Kriging juga menghasilkan peta error variance yang merepresentasikan tingkat ketidakpastian estimasi.
kec_sf$Error_Var <- hasil_lengkap$Error_Var
ggplot(data = kec_sf) +
geom_sf(aes(fill = Error_Var), color = "white", linewidth = 0.1) +
scale_fill_viridis_c(option = "A", direction = -1) +
labs(title = "Peta Ketidakpastian (Error Variance) Prediksi IPM",
fill = "Varians Error") +
theme_minimal()
Peta ketidakpastian (error variance) menunjukkan bahwa sebagian besar wilayah kecamatan di Provinsi Jawa Timur memiliki nilai varians error yang relatif kecil, yaitu berada pada kisaran ≤ 0,4. Pola ini mengindikasikan bahwa hasil interpolasi Ordinary Kriging secara umum memiliki tingkat ketidakpastian yang rendah dan estimasi IPM yang dihasilkan cukup stabil di sebagian besar wilayah kajian.
Nilai varians error yang rendah tersebut mencerminkan bahwa informasi spasial dari titik kabupaten/kota mampu menjelaskan variasi IPM secara memadai pada tingkat kecamatan. Meskipun terdapat beberapa wilayah dengan varians error yang relatif lebih tinggi, wilayah-wilayah tersebut hanya mencakup area yang terbatas. Oleh karena itu, secara keseluruhan, hasil interpolasi IPM dapat dianggap andal untuk menggambarkan pola spasial IPM di Jawa Timur, dengan tetap memperhatikan kehati-hatian pada area dengan ketidakpastian yang lebih besar.
Evaluasi kinerja model spasial dilakukan menggunakan metode Leave-One-Out Cross Validation (LOOCV) karena metode ini mampu memberikan gambaran yang lebih objektif terhadap kemampuan prediksi model, terutama ketika jumlah data pengamatan relatif terbatas. Metode ini dilakukan dengan cara mengeluarkan satu wilayah pengamatan (kabupaten/kota) secara bergantian, kemudian memprediksi nilai IPM pada wilayah yang dikeluarkan tersebut menggunakan data dari wilayah lainnya. Prosedur ini diulang hingga setiap wilayah pernah berperan sebagai data uji satu kali.
cv_res <- krige.cv(IPM ~ 1, jatim_points, model = m_exp)
actual <- cv_res$observed
predicted <- cv_res$var1.pred
error <- cv_res$residual
krig_var <- cv_res$var1.var
rmse_val <- sqrt(mean(error^2))
mae_val <- mean(abs(error))
mape_val <- mean(abs(error / actual)) * 100
r_val <- cor(actual, predicted)
# Tampilkan Tabel Evaluasi
evaluasi_tabel <- data.frame(
Metrik = c("RMSE", "MAE", "MAPE (%)", "Korelasi (R)"),
Nilai = c(rmse_val, mae_val, mape_val, r_val)
)
print(evaluasi_tabel)
## Metrik Nilai
## 1 RMSE 4.4940237
## 2 MAE 3.5064379
## 3 MAPE (%) 4.5969378
## 4 Korelasi (R) 0.4433143
Berdasarkan hasil evaluasi, diperoleh nilai RMSE sebesar 4,49 dan MAE sebesar 3,51. Nilai ini menunjukkan bahwa secara rata-rata, prediksi IPM yang dihasilkan model menyimpang sekitar 3–4 poin dari nilai aktual. Mengingat rentang nilai IPM antar kabupaten/kota di Jawa Timur relatif sempit (sekitar 65–85), besaran galat ini masih tergolong moderat dan dapat diterima untuk analisis spasial tingkat regional.
Nilai MAPE sebesar 4,60% mengindikasikan bahwa kesalahan prediksi rata-rata kurang dari 5 persen terhadap nilai IPM aktual. Hal ini menunjukkan bahwa secara proporsional, model memiliki tingkat akurasi yang cukup baik dalam memprediksi IPM.
Sementara itu, nilai koefisien korelasi (R) sebesar 0,44 menunjukkan adanya hubungan positif antara IPM aktual dan IPM hasil prediksi. Korelasi positif ini berarti bahwa wilayah dengan IPM aktual yang lebih tinggi cenderung diprediksi memiliki IPM yang lebih tinggi pula oleh model, dan sebaliknya. Namun, karena nilainya belum mendekati 1, kekuatan hubungan tersebut masih tergolong sedang, yang menandakan bahwa model telah menangkap arah dan pola umum variasi IPM, tetapi belum sepenuhnya mampu merepresentasikan perbedaan nilai IPM secara presisi pada setiap wilayah.
nama_wilayah <- jatim_points$NAME_2
tabel_validasi_kab <- data.frame(
No = 1:length(nama_wilayah),
Kabupaten_Kota = nama_wilayah,
IPM_Aktual = actual,
IPM_Prediksi = round(predicted, 2),
Selisih_Error = round(error, 2)
)
tabel_validasi_kab
## No Kabupaten_Kota IPM_Aktual IPM_Prediksi Selisih_Error
## 1 1 Kab. Bangkalan 67.33 75.24 -7.91
## 2 2 Kab. Banyuwangi 74.30 70.43 3.87
## 3 3 Kota Batu 79.69 79.70 -0.01
## 4 4 Kab. Blitar 73.44 80.26 -6.82
## 5 5 Kab. Bojonegoro 72.75 74.12 -1.37
## 6 6 Kab. Bondowoso 71.22 71.52 -0.30
## 7 7 Kab. Gresik 78.93 78.94 -0.01
## 8 8 Kab. Jember 70.93 70.87 0.06
## 9 9 Kab. Jombang 75.67 77.91 -2.24
## 10 10 Kab. Kediri 75.18 81.10 -5.92
## 11 11 Kota Blitar 81.44 74.24 7.20
## 12 12 Kota Kediri 81.88 75.38 6.50
## 13 13 Kota Madiun 84.51 75.27 9.24
## 14 14 Kota Malang 84.68 75.34 9.34
## 15 15 Kota Mojokerto 81.76 77.40 4.36
## 16 16 Kota Pasuruan 78.90 75.03 3.87
## 17 17 Kota Probolinggo 77.79 72.55 5.24
## 18 18 Kab. Lamongan 75.90 76.68 -0.78
## 19 19 Kab. Lumajang 70.31 72.69 -2.38
## 20 20 Kab. Madiun 74.81 81.40 -6.59
## 21 21 Kab. Magetan 76.77 78.41 -1.64
## 22 22 Kab. Malang 73.53 80.42 -6.89
## 23 23 Kab. Mojokerto 76.69 81.02 -4.33
## 24 24 Kab. Nganjuk 75.24 76.46 -1.22
## 25 25 Kab. Ngawi 73.91 77.33 -3.42
## 26 26 Kab. Pacitan 71.49 72.25 -0.76
## 27 27 Kab. Pamekasan 70.85 68.39 2.46
## 28 28 Kab. Pasuruan 72.36 79.98 -7.62
## 29 29 Kab. Ponorogo 73.70 75.91 -2.21
## 30 30 Kab. Probolinggo 70.85 74.96 -4.11
## 31 31 Kab. Sampang 66.72 70.01 -3.29
## 32 32 Kab. Sidoarjo 82.67 81.26 1.41
## 33 33 Kab. Situbondo 71.22 71.45 -0.23
## 34 34 Kab. Sumenep 69.78 70.22 -0.44
## 35 35 Kota Surabaya 84.69 78.68 6.01
## 36 36 Kab. Trenggalek 72.47 73.41 -0.94
## 37 37 Kab. Tuban 72.31 72.32 -0.01
## 38 38 Kab. Tulungagung 75.13 77.39 -2.26
Berdasarkan tabel perbandingan di atas, terlihat bahwa model menghasilkan baik overestimasi maupun underestimasi pada beberapa wilayah.
Wilayah dengan IPM aktual tinggi, khususnya kota-kota seperti Kota Madiun, Kota Malang, Kota Surabaya, Kota Kediri, dan Kota Blitar, cenderung mengalami underestimasi, di mana nilai IPM prediksi lebih rendah dibandingkan nilai aktual. Sebaliknya, beberapa kabupaten dengan IPM relatif rendah, seperti Kabupaten Bangkalan, Kabupaten Sampang, dan Kabupaten Pasuruan, cenderung mengalami overestimasi, dengan nilai prediksi lebih tinggi daripada nilai aktual. Pola ini menunjukkan adanya efek smoothing yang umum terjadi pada metode kriging, di mana nilai ekstrem, baik sangat tinggi maupun sangat rendah, ditarik mendekati nilai rata-rata wilayah di sekitarnya. Akibatnya, perbedaan IPM yang tajam antarwilayah menjadi lebih halus pada hasil prediksi.
Meskipun demikian, sebagian besar kabupaten/kota menunjukkan selisih antara IPM aktual dan prediksi yang relatif kecil, bahkan mendekati nol, seperti pada Kota Batu, Kabupaten Gresik, Kabupaten Tuban, dan Kabupaten Bondowoso. Hal ini mengindikasikan bahwa model bekerja cukup baik pada wilayah dengan karakteristik IPM yang tidak ekstrem dan memiliki kedekatan spasial yang kuat dengan wilayah sekitarnya.
Dengan demikian, tabel perbandingan ini menegaskan bahwa meskipun model belum sepenuhnya akurat pada wilayah dengan IPM ekstrem, secara umum Ordinary Kriging mampu memberikan estimasi IPM yang cukup representatif dan informatif untuk analisis spasial lanjutan, khususnya pada tingkat kecamatan.
Penelitian ini bertujuan untuk memahami bagaimana Indeks Pembangunan Manusia (IPM) tersebar secara spasial di Provinsi Jawa Timur, faktor-faktor yang memengaruhinya, serta bagaimana pendekatan analisis spasial dapat memberikan gambaran yang lebih komprehensif dibandingkan analisis nonspasial. Berdasarkan seluruh tahapan analisis, beberapa kesimpulan utama dapat ditarik :
Variasi spasial IPM
Hasil analisis statistik deskriptif dan visualisasi peta sebaran
menunjukkan bahwa IPM kabupaten/kota di Jawa Timur memiliki variasi
spasial yang cukup jelas. Wilayah dengan IPM tinggi cenderung
terkonsentrasi pada kawasan perkotaan dan pusat pertumbuhan ekonomi,
sementara wilayah dengan IPM lebih rendah banyak ditemukan di daerah
pinggiran dan perdesaan. Hal ini menunjukkan bahwa pembangunan manusia
di Jawa Timur belum merata secara spasial dan masih terdapat kesenjangan
antarwilayah.
Autokorelasi spasial IPM
Hasil uji autokorelasi spasial global menggunakan Moran’s I dan Geary’s
C membuktikan bahwa IPM tidak terdistribusi secara acak, melainkan
memiliki autokorelasi spasial yang signifikan dan positif. Analisis
autokorelasi lokal (Getis–Ord Gi* dan Local Moran’s I) mengidentifikasi
adanya klaster wilayah dengan IPM tinggi (hot spot) dan klaster wilayah
dengan IPM rendah (cold spot). Temuan ini menegaskan bahwa capaian
pembangunan manusia di suatu wilayah dipengaruhi oleh kondisi wilayah
sekitarnya, baik melalui interaksi ekonomi, infrastruktur, maupun faktor
sosial lainnya.
Keterbatasan model OLS
Analisis regresi OLS menunjukkan bahwa variabel IPLM, jumlah tenaga
kesehatan masyarakat, dan persentase penduduk miskin secara simultan
berpengaruh signifikan terhadap IPM. Namun, uji Moran’s I terhadap
residual OLS mengungkapkan adanya autokorelasi spasial yang tersisa,
menandakan bahwa model OLS belum sepenuhnya menangkap ketergantungan
spasial antarwilayah. Hal ini menegaskan pentingnya penerapan model
ekonometrika spasial.
Model SDM sebagai model terbaik dan efek
spillover
Berdasarkan uji Lagrange Multiplier dan perbandingan beberapa model
ekonometrika spasial, Spatial Durbin Model (SDM) terpilih sebagai model
terbaik dengan nilai AIC terkecil (175,96). Model ini mampu menangkap
pengaruh langsung variabel independen pada IPM wilayah yang sama serta
efek tidak langsung (spillover) dari variabel independen di
wilayah tetangga.
Hasil estimasi SDM menunjukkan bahwa:
Efek langsung : IPLM berpengaruh positif signifikan terhadap IPM, sementara jumlah tenaga kesehatan masyarakat berpengaruh negatif dan persentase penduduk miskin berpengaruh negatif signifikan.
Efek spillover : Lag variabel IPLM dan lag persentase penduduk miskin signifikan, menunjukkan bahwa kondisi literasi dan kemiskinan di wilayah tetangga turut memengaruhi IPM suatu wilayah. Parameter rho (ρ) positif dan signifikan menegaskan adanya keterkaitan IPM antarwilayah.
Uji Moran’s I pada residual SDM menunjukkan p-value = 0,3583 (> 0,05), menandakan bahwa residual model bebas dari autokorelasi spasial dan model telah berhasil menangkap ketergantungan spasial.
Estimasi IPM pada skala lebih kecil
Penerapan metode Ordinary Kriging berhasil menghasilkan estimasi IPM
pada tingkat kecamatan. Hasil interpolasi menunjukkan pola spasial yang
konsisten dengan data kabupaten/kota, namun dengan detail lebih tinggi.
Evaluasi menggunakan LOOCV menunjukkan kesalahan prediksi yang moderat
dan pola variasi umum yang tertangkap dengan baik, meskipun terdapat
efek smoothing pada nilai ekstrem.
Secara keseluruhan, penelitian ini menegaskan bahwa IPM di Jawa Timur dipengaruhi baik oleh faktor sosial ekonomi lokal maupun oleh keterkaitan spasial antarwilayah. Dengan demikian, penerapan analisis spasial menjadi sangat relevan untuk memahami dinamika pembangunan manusia dan merumuskan kebijakan pembangunan yang lebih efektif dan terkoordinasi antar kabupaten/kota.
Berdasarkan hasil dan temuan penelitian ini, beberapa saran dapat diajukan baik dari sisi kebijakan maupun pengembangan analisis di masa mendatang.
Dari sisi kebijakan, temuan model Spatial Durbin Model (SDM) menunjukkan bahwa pembangunan manusia di Jawa Timur tidak hanya dipengaruhi oleh kondisi masing-masing kabupaten/kota, tetapi juga oleh kondisi wilayah tetangga melalui spillover effect. Oleh karena itu, perencanaan pembangunan manusia sebaiknya bersifat regional dan terkoordinasi antarwilayah. Intervensi yang difokuskan pada peningkatan literasi masyarakat (IPLM), pengentasan kemiskinan, dan distribusi tenaga kesehatan perlu mempertimbangkan keterkaitan spasial, sehingga upaya di satu wilayah dapat memberikan efek positif ke wilayah sekitarnya. Wilayah dengan capaian IPM tinggi dapat dijadikan pusat pertumbuhan yang memberikan efek limpahan (spillover) bagi wilayah tetangga, sementara wilayah dengan IPM rendah perlu mendapatkan perhatian prioritas untuk mengurangi ketimpangan antarwilayah.
Dari sisi metodologi, penelitian selanjutnya disarankan untuk mengembangkan analisis dengan menggunakan data panel spasial, sehingga dinamika IPM antarwaktu serta pengaruh kebijakan pembangunan dapat dianalisis lebih mendalam. Penggunaan pendekatan seperti Geographically Weighted Regression (GWR) atau model spasial nonlinier dapat dipertimbangkan untuk menangkap variasi pengaruh variabel independen yang mungkin berbeda antarwilayah. Selain itu, pada tahap interpolasi, penelitian mendatang dapat membandingkan Ordinary Kriging dengan metode lain, seperti Universal Kriging atau pendekatan machine learning berbasis spasial, untuk memperoleh estimasi IPM tingkat kecamatan yang lebih akurat. Penambahan variabel kontekstual, misalnya kualitas infrastruktur, akses transportasi, atau indikator tata kelola daerah, juga berpotensi meningkatkan kualitas model dan memperkuat interpretasi spillover effect.
Dengan pengembangan tersebut, diharapkan analisis spasial IPM tidak hanya berfungsi sebagai alat pemetaan, tetapi juga menjadi dasar perumusan kebijakan pembangunan manusia yang lebih adil, efektif, dan berkelanjutan, dengan memperhatikan keterkaitan antarwilayah di Provinsi Jawa Timur.
Badan Pusat Statistik Provinsi Jawa Timur. (2021). Statistik Pendidikan Provinsi Jawa Timur 2021. Badan Pusat Statistik, 1–66. https://jatim.bps.go.id/id/publication/2025/03/27/334d65e97462d4c013976174/statistik-pendidikan-provinsi-jawa-timur-2024.html
BPS. (2025). Indeks Pembangunan Manusia Indonesia 2024. Badan Pusat Statistik, 19, 1–196. https://www.bps.go.id/id/publication/2025/05/15/dd9a3ce7dfae1c733e46338f/indeks-pembangunan-manusia-2024.html
BPS Jawa Timur. (2017). Provinsi Jawa Timur dalam Angka. Jawa Timur Province in Figures 2017. 382. https://jatim.bps.go.id/id/publication/2025/02/28/5ae8b994b1bebd8cbc2e0781
Indeks Pembangunan Manusia Provinsi Jawa Timur 2024 - Badan Pusat Statistik Provinsi Jawa Timur. (t.t.). Diambil 23 Desember 2025, dari https://jatim.bps.go.id/id/publication/2025/05/27/47fde052cb353c601c21c209/indeks-pembangunan-manusia-provinsi-jawa-timur-2024.html
Tobler, W. R. (1970). A Computer Movie Simulating Urban Growth in the Detroit Region. Economic Geography, 46, 234. https://doi.org/10.2307/143141
Anselin, L. (1995). Local indicators of spatial association—LISA. Geographical Analysis, 27(2), 93–115. https://doi.org/10.1111/j.1538-4632.1995.tb00338.x
Geary, R. C. (1954). The contiguity ratio and statistical mapping. The Incorporated Statistician, 5(3), 115–146. https://doi.org/10.2307/2986645
Getis, A., & Ord, J. K. (1992). The analysis of spatial association by use of distance statistics. Geographical Analysis, 24(3), 189–206. https://doi.org/10.1111/j.1538-4632.1992.tb00261.x
Getis, A. and Ord, J.K. (1996) Local spatial statistics: An overview. In: Longley, P. and Batty, M., Eds., Spatial Analysis: Modeling in A GIS Environment, John Wiley & Sons, New York, 261-277.
Moran, P. A. P. (1950). Notes on continuous stochastic phenomena. Biometrika, 37(1–2), 17–23. https://doi.org/10.2307/2332142
LeSage, J., & Pace, R. K. (2009). Introduction to spatial econometrics (1st ed.). Chapman and Hall/CRC.https://doi.org/10.1201/9781420064254
L. Anselin and A. K. Bera, “Spatial Dependence in Linear Regression Models with an Introduction to Spatial Econometrics,” In: A. Ullah and D. E. A. Giles, Eds., Handbook of Applied Economic Statistics, Marcel Dekker, New York, 1998.
Chilès, J. P., & Delfiner, P. (2012). Geostatistics: Modeling Spatial Uncertainty: Second Edition. Geostatistics: Modeling Spatial Uncertainty: Second Edition, 1–699. https://doi.org/10.1002/9781118136188
Cressie, N. A. C. (1993). Statistics for spatial data revised edition. Statistics for Spatial Data, 1–900. https://doi.org/10.1002/9781119115151
Deutsch, C. v. (2002). Geostatistical Reservoir Modeling. Geostatistical Reservoir Modeling. https://doi.org/10.1093/OSO/9780195138061.001.0001
Goovaerts, P. (1997). Geostatistics for Natural Resources Evaluation. https://doi.org/10.1093/OSO/9780195115383.001.0001
Isaaks, E. H., & Srivastava, R. M. (1994). An Introduction to Applied Geostatistics, by E. H. Isaaks and R. M. Srivastava. Geographical Analysis, 26(3), 282–283. https://doi.org/10.1111/J.1538-4632.1994.TB00325.X
Matheron, G. (1963). Principles of geostatistics. Economic Geology, 58(8), 1246–1266. https://doi.org/10.2113/GSECONGEO.58.8.1246
Webster, R., & Oliver, M. A. (2008). Geostatistics for Environmental Scientists: Second Edition. Geostatistics for Environmental Scientists: Second Edition, 1–315. https://doi.org/10.1002/9780470517277
Dashboard : https://dashboard-spasial-ipm-jatim.streamlit.app/
Syntax Dashboard : https://github.com/rahmaauliaputri/Dashboard-Spasial-IPM-Jawa-Timur-2024-