LAPORAN UJIAN TENGAH SEMESTER
Spatial Statistics

Disusun oleh :
Hadeelina Shakira Zalianty (140610230083)

Dosen Pengampu :
Dr. I Gede Nyoman Mindra Jaya,M.Si

PROGRAM STUDI S-1 STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS PADJADJARAN
JATINANGOR
2025

Daftar Isi

BAB I (PENDAHULUAN)

1.1 Latar Belakang

Salah satu dari 17 tujuan global yang dikenal sebagai Sustainable Development Goals (SDGs) adalah mampu mencapai kesempatan kerja penuh dan produktif serta pekerjaan yang layak bagi semua orang pada tahun 2030. Hal ini menunjukkan bahwa pengangguran merupakan isu serius di seluruh dunia yang harus segera ditangani oleh masing-masing negara. Indonesia menjadi salah satu negara yang menghadapi tantangan ini, dengan menggunakan indikator Tingkat Pengangguran Terbuka (TPT) Indonesia mampu menggambarkan kondisi pengangguran. Tingkat Pengangguran Terbuka (TPT) adalah gambaran persentase penduduk angkatan kerja yang tidak bekerja namun sedang mencari pekerjaan dan menjadi tolok ukur penting dalam menilai efektivitas kebijakan ekonomi.

Pada tahun 2020 saat pandemi COVID-19 melanda Tingkat Pengangguran Terbuka (TPT) Indonesia tercatat sebesar 7,07 persen, meningkat tajam dibandingkan tahun sebelumnya. Kenaikan ini terjadi karena banyak sektor usaha mengalami penurunan produktivitas dan pemutusan hubungan kerja. Meskipun dalam beberapa tahun berikutnya angka pengangguran menurun seiring pemulihan ekonomi nasional, pada tahun 2025 TPT masih tercatat sebesar 4,76 persen, menunjukkan bahwa permasalahan ketenagakerjaan belum sepenuhnya pulih . Fenomena ini tidak hanya disebabkan oleh faktor ekonomi makro, namun juga ketimpangan antar wilayah yang menunjukkan adanya keterkaitan spasial antar provinsi.

Penelitian terdahulu mengenai tingkat pengangguran terbuka (TPT) dan kaitannya dengan faktor-faktor seperti Tingkat Partisipasi Angkatan Kerja (TPAK) dan penduduk miskin memberikan gambaran yang kompleks dan beragam. Beberapa studi menunjukkan bahwa TPAK dan penduduk miskin berpengaruh signifikan terhadap tingkat pengangguran terbuka, walaupun ada juga yang temukan pengaruh tersebut tidak signifikan pada kondisi tertentu [5].

Dalam menganalisis fenomena pengangguran antarwilayah, pendekatan klasik seperti regresi linier biasa (OLS) sering kali tidak cukup memadai karena mengabaikan adanya dependensi spasial antar wilayah yang berdekatan. Oleh karena itu, diperlukan pendekatan yang mampu menangkap pengaruh lokasi terhadap variabel yang diamati. Dua model yang umum digunakan dalam konteks ini adalah Spatial Error Model (SEM) dan Spatial Autoregressive Model (SAR). Dengan membandingkan kedua model ini, peneliti dapat mengidentifikasi apakah keterkaitan antar wilayah disebabkan oleh efek langsung antar variabel atau karena pengaruh kesalahan yang bersifat spasial. Pemilihan model terbaik dilakukan berdasarkan kriteria Akaike Information Criterion (AIC) dan nilai koefisien determinasi (R²) terbesar, sehingga model yang dipilih mampu memberikan hasil estimasi yang lebih akurat dan representatif terhadap pola pengangguran terbuka di Indonesia.

1.2 Identifikasi Masalah

Tingkat Pengangguran Terbuka (TPT) di Indonesia menunjukkan variasi yang cukup tinggi antarprovinsi dan cenderung membentuk pola keterkaitan spasial, di mana wilayah dengan tingkat pengangguran tinggi cenderung berdekatan dengan wilayah yang memiliki kondisi serupa. Hal ini menandakan adanya pengaruh antarwilayah yang tidak dapat dijelaskan hanya melalui pendekatan regresi klasik. Selain itu, faktor-faktor seperti Tingkat Partisipasi Angkatan Kerja (TPAK) dan Penduduk Miskin diduga memiliki hubungan yang kompleks terhadap tingkat pengangguran.

Diperlukan pendekatan analisis yang mempertimbangkan efek spasial untuk memperoleh hasil estimasi yang lebih akurat. Berdasarkan hal tersebut, penelitian ini mengidentifikasi permasalahan sebagai berikut:

Apakah terdapat dependensi spasial pada data Tingkat Pengangguran Terbuka (TPT) antarprovinsi di Indonesia periode 2020–2025?
Faktor-faktor apa saja yang berpengaruh signifikan terhadap Tingkat Pengangguran Terbuka (TPT)?
Model spasial apa Spatial Autoregressive Model (SAR) dan Spatial Error Model (SEM) yang memberikan hasil estimasi paling akurat dan representatif dalam menjelaskan fenomena pengangguran terbuka di Indonesia?

1.3 Tujuan Penelitian

Penelitian ini bertujuan untuk:

Menguji adanya dependensi spasial pada data Tingkat Pengangguran Terbuka (TPT) antarprovinsi di Indonesia untuk mengetahui apakah tingkat pengangguran di suatu wilayah dipengaruhi oleh wilayah sekitarnya.
Menganalisis pengaruh variabel-variabel ekonomi utama terhadap TPT, yaitu Tingkat Partisipasi Angkatan Kerja (TPAK) dan Persentase Penduduk Miskin.
Membandingkan kinerja model SAR dan SEM untuk menentukan model spasial terbaik dalam menjelaskan variasi TPT antarprovinsi berdasarkan nilai Akaike Information Criterion (AIC) dan koefisien determinasi (R²).

1.4 Manfaat Penelitian

Penelitian ini bermanfaat untuk:

Penelitian ini memberikan kontribusi terhadap pengembangan ilmu statistik ekonomi, khususnya dalam penerapan analisis ekonometrika spasial pada isu ketenagakerjaan.
Hasil penelitian dapat menjadi referensi bagi pemerintah dalam merumuskan kebijakan penanggulangan pengangguran berbasis wilayah, dengan mempertimbangkan keterkaitan spasial antarprovinsi.
Penelitian ini memberikan contoh penerapan model SAR dan SEM dalam konteks analisis data spasial untuk fenomena ekonomi regional di Indonesia.

1.5 Batasan Penelitian

Agar penelitian lebih terarah dan fokus, maka perlu dibatasi pada beberapa hal:

Unit analisis yang digunakan adalah 34 provinsi di Indonesia dengan periode pengamatan tahun 2020–2025 (data panel enam tahun).
Variabel yang digunakan terdiri atas variabel dependen, yaitu Tingkat Pengangguran Terbuka (TPT) pada termin 1 (Februari) dan variabel independen, yaitu Tingkat Partisipasi Angkatan Kerja (TPAK) pada termin 1 (Februari) dan Persentase Penduduk Miskin pada termin 1 (Maret).
Data yang digunakan merupakan data sekunder yang diperoleh dari Badan Pusat Statistik (BPS).
Analisis dilakukan menggunakan pendekatan Spatial Panel Regression dengan dua model utama, yaitu Spatial Autoregressive Model (SAR) dan Spatial Error Model (SEM).
Pemilihan model terbaik didasarkan pada kriteria AIC terkecil dan koefisien determinasi (R²) terbesar.

BAB II (TINJAUAN PUSTAKA)

2.1 Tingkat Pengangguran Terbuka (TPT)

Tingkat pengangguran terbuka (TPT) merupakan indikator penting dalam mengukur kondisi pasar tenaga kerja di suatu negara atau daerah. TPT mencerminkan persentase angkatan kerja yang aktif mencari pekerjaan namun belum mendapatkan pekerjaan yang layak . Topik ini dipilih karena pengangguran terbuka merupakan masalah ekonomi yang mendasar, yang dapat mempengaruhi stabilitas sosial dan pertumbuhan ekonomi nasional. Misalnya, peningkatan TPT dapat menyebabkan berkurangnya produktivitas dan pendapatan masyarakat, serta menimbulkan masalah kemiskinan dan sosial lainnya.

Urgensi penelitian tentang TPT sangat tinggi mengingat adanya dinamika ketenagakerjaan yang dipengaruhi oleh faktor-faktor seperti perubahan struktur ekonomi, kesenjangan kualifikasi tenaga kerja dengan kebutuhan industri, dan dampak pandemi Covid-19 yang memperburuk angka pengangguran di Indonesia. Data dari Badan Pusat Statistik menunjukkan peningkatan signifikan TPT selama pandemi, yang menuntut penanganan cepat dan tepat oleh pemerintah agar lapangan kerja mampu menyerap tenaga kerja secara efektif. Dibutuhkan pemahaman mendalam tentang TPT untuk mendukung kebijakan ketenagakerjaan yang efektif serta mendorong pembangunan ekonomi yang berkelanjutan.

Selain itu, Tingkat Partisipasi Angkatan Kerja (TPAK) dan persentase penduduk miskin juga memiliki keterkaitan erat dengan dinamika pengangguran terbuka. TPAK menggambarkan seberapa besar proporsi penduduk usia kerja yang aktif berpartisipasi dalam pasar tenaga kerja, baik dengan bekerja maupun mencari pekerjaan. Semakin tinggi TPAK, maka semakin besar potensi tekanan terhadap pasar kerja apabila tidak diimbangi dengan ketersediaan lapangan pekerjaan yang memadai. Di sisi lain, tingginya persentase penduduk miskin sering kali menjadi cerminan keterbatasan akses terhadap pendidikan, keterampilan, dan peluang kerja yang layak, yang pada akhirnya berkontribusi terhadap peningkatan TPT. Analisis hubungan antara TPT, TPAK, dan penduduk miskin menjadi penting untuk memahami pola ketenagakerjaan dan merumuskan kebijakan ekonomi yang lebih terarah.

2.2 Teori Dasar Spatial Dependence

Menurut Wooldridge (2012), salah satu asumsi utama dalam model regresi klasik adalah independensi antar observasi. Namun, dalam konteks geografis dan ekonomi regional, asumsi ini sering kali tidak terpenuhi karena adanya keterkaitan antar wilayah yang saling berdekatan [9]. Fenomena tersebut dikenal sebagai spatial dependence atau ketergantungan spasial, yaitu kondisi ketika nilai suatu variabel di satu lokasi dipengaruhi oleh nilai variabel yang sama di lokasi lain. Prinsip ini sejalan dengan Tobler’s First Law of Geography (1970) yang menyatakan bahwa “segala sesuatu berhubungan dengan yang lain, tetapi hal-hal yang berdekatan memiliki hubungan lebih kuat daripada yang jauh.” Dengan demikian, analisis spasial menjadi penting untuk menangkap adanya pola interaksi antar wilayah yang tidak dapat dijelaskan hanya oleh variabel lokal semata.

Secara umum, spatial dependence dapat diukur melalui indikator autokorelasi spasial seperti Moran’s I, Geary’s C, dan Getis-Ord G, yang digunakan untuk mendeteksi apakah nilai suatu variabel menunjukkan pola pengelompokan atau penyebaran secara geografis. Ukuran tersebut biasanya menggunakan matriks bobot spasial (spatial weights matrix, W) yang mendefinisikan hubungan kedekatan antar wilayah, baik berdasarkan administratif maupun jarak geografis (distance-based). Ketika hasil uji menunjukkan adanya autokorelasi spasial yang signifikan, maka pendekatan regresi konvensional (OLS) tidak lagi memadai, karena menghasilkan estimasi yang bias dan tidak efisien. Dalam hal ini, dibutuhkan model spasial yang mampu mengakomodasi ketergantungan antar wilayah, seperti Spatial Autoregressive Model (SAR) yang menangkap efek spasial pada variabel dependen, dan Spatial Error Model (SEM) yang memperhitungkan efek spasial melalui komponen error.

Dalam konteks penelitian ini, spatial dependence sangat relevan untuk menganalisis pola Tingkat Pengangguran Terbuka (TPT) antar provinsi di Indonesia selama periode 2020–2025. Interaksi ekonomi regional, mobilitas tenaga kerja, serta kesamaan karakteristik struktural antar provinsi menyebabkan TPT di satu wilayah berpotensi memengaruhi wilayah sekitarnya. Misalnya, peningkatan TPT di Jawa Barat dapat berdampak pada provinsi tetangga seperti Banten atau DKI Jakarta karena keterkaitan pasar tenaga kerja dan aktivitas industri lintas daerah. Oleh sebab itu, pemahaman terhadap teori ketergantungan spasial menjadi krusial agar model yang digunakan mampu menggambarkan realitas ekonomi antarwilayah secara akurat serta menghasilkan rekomendasi kebijakan ketenagakerjaan yang lebih tepat sasaran.

2.3 Autokorelasi Spasial

Autokorelasi Spasial merupakan konsep yang menggambarkan sejauh mana nilai suatu variabel di suatu lokasi berhubungan dengan nilai variabel yang sama di lokasi lain yang berdekatan secara geografis. Secara sederhana, fenomena ini menunjukkan adanya pola keterkaitan antarwilayah, di mana wilayah yang berdekatan cenderung memiliki karakteristik yang mirip (autokorelasi positif), atau justru sangat berbeda (autokorelasi negatif). Ketika nilai suatu variabel di satu daerah memengaruhi nilai di daerah lain, maka data tersebut tidak lagi bersifat independen secara spasial.

Secara matematis, spatial autocorrelation dapat dijelaskan melalui kovarians antara dua observasi yi dan yj yang berjarak dij, dengan Cov(yi, yj ) ≠ 0. Kondisi ini melanggar asumsi dasar regresi OLS yang mengharuskan komponen error antar observasi bersifat bebas (independent and identically distributed). Jika ketergantungan spasial diabaikan, maka hasil estimasi akan menjadi bias dan tidak efisien.

Untuk mendeteksi adanya autokorelasi spasial, beberapa ukuran statistik digunakan, seperti Moran’s I, Geary’s C, dan Getis-Ord G. Nilai positif dari Moran’s I menunjukkan adanya pengelompokan wilayah dengan nilai variabel yang serupa, sedangkan nilai negatif mengindikasikan penyebaran yang berlawanan arah. Temuan adanya autokorelasi spasial yang signifikan menunjukkan perlunya penerapan model ekonometrika spasial (spatial econometric models) yang dapat mengakomodasi hubungan antarwilayah tersebut.

2.3.1 Moran’s I

Uji Moran’s I Global digunakan untuk mendeteksi keberadaan autokorelasi spasial dalam distribusi TPT antarprovinsi. Rumusnya sebagai berikut:

\[ I = \frac{n}{\sum_i \sum_j w_{ij}} \cdot \frac{\sum_i \sum_j w_{ij} (x_i - \bar{x})(x_j - \bar{x})} {\sum_i (x_i - \bar{x})^2} \]

Keterangan:
- \(n\) = jumlah unit observasi
- \(x_i, x_j\) = nilai variabel di lokasi \(i\) dan \(j\)
- \(\bar{x}\) = rata-rata nilai variabel
- \(w_{ij}\) = elemen matriks pembobot spasial

Kriteria Pengujian:
- \(I > 0\): autokorelasi spasial positif (wilayah dengan nilai serupa saling berdekatan)
- \(I < 0\): autokorelasi spasial negatif (wilayah dengan nilai berbeda berdekatan)
- \(I \approx 0\): tidak terdapat autokorelasi spasial (pola acak)

2.3.2 Geary’s C

Statistik Geary’s C juga digunakan untuk mengukur autokorelasi spasial, namun berbeda dengan Moran’s I yang melihat hubungan kovarian antar lokasi, Geary’s C lebih sensitif terhadap perbedaan lokal antar pasangan lokasi. Statistik ini diperkenalkan oleh R. C. Geary pada tahun 1954. Rumusnya sebagai berikut:

\[ C = \frac{(n - 1)}{2 \sum_i \sum_j w_{ij}} \cdot \frac{\sum_i \sum_j w_{ij} (x_i - x_j)^2} {\sum_i (x_i - \bar{x})^2} \]

Keterangan:
- \(n\) = jumlah unit observasi
- \(x_i, x_j\) = nilai variabel di lokasi \(i\) dan \(j\)
- \(\bar{x}\) = rata-rata nilai variabel
- \(w_{ij}\) = elemen matriks pembobot spasial

Kriteria Pengujian:
- \(C = 1\): tidak ada autokorelasi spasial
- \(C < 1\): terdapat autokorelasi spasial positif
- \(C > 1\): terdapat autokorelasi spasial negatif

2.3.3 Getis-Ord G

Statistik Getis-Ord G (atau sering disebut Getis-Ord General G) dikembangkan oleh Getis dan Ord (1992) untuk mengukur autokorelasi spasial global maupun lokal dengan fokus pada pengelompokan nilai tinggi (hot spots) dan nilai rendah (cold spots).

\[ G = \frac{\sum_i \sum_j w_{ij} x_i x_j} {\sum_i \sum_j x_i x_j} \]

Keterangan:
- \(x_i, x_j\) = nilai variabel pada lokasi \(i\) dan \(j\)
- \(w_{ij}\) = bobot spasial antara lokasi \(i\) dan \(j\)

Kriteria Pengujian:
- Nilai \(G\) tinggi menunjukkan hot spot (pengelompokan nilai besar).
- Nilai \(G\) rendah menunjukkan cold spot (pengelompokan nilai kecil).
- Nilai \(G\) mendekati rata-rata global menunjukkan pola acak.

Terdapat juga versi lokal dari statistik ini, yaitu \(Getis-Ord Gi^*\), yang digunakan untuk mendeteksi lokasi-lokasi spesifik yang menjadi pusat hot spot atau cold spot.

2.4 Estimasi Model Spasial

Model Spatial Econometrics dikembangkan untuk mengatasi permasalahan spatial dependence dalam data yang memiliki dimensi geografis. Menurut Anselin (1988) dan LeSage & Pace (2009), model ini digunakan untuk memperbaiki hasil estimasi regresi yang bias akibat adanya hubungan spasial antar unit observasi. Dua bentuk model yang paling umum digunakan adalah Spatial Autoregressive Model (SAR) dan Spatial Error Model (SEM).

2.4.1 Spatial Autoregressive Model (SAR)

Spatial Autoregressive Model (SAR) digunakan ketika nilai variabel dependen di suatu wilayah dipengaruhi oleh nilai variabel dependen di wilayah lain yang berdekatan. Artinya, terdapat efek limpahan (spillover effect) antarwilayah yang menyebabkan suatu daerah tidak dapat dipelajari secara terpisah. Model SAR dapat ditulis sebagai berikut:

\[ y = \rho W y + X\beta + \varepsilon \]

Keterangan:

\(y\) = vektor variabel dependen (misalnya Tingkat Pengangguran Terbuka / TPT)
\(X\) = matriks variabel independen (misalnya TPAK dan persentase penduduk miskin)
\(\beta\) = vektor koefisien regresi
\(W\) = matriks pembobot spasial (spatial weights matrix)
\(\rho\) = koefisien autokorelasi spasial (spatial autoregressive coefficient)
\(\varepsilon\) = vektor error, dengan asumsi \(\varepsilon \sim N(0, \sigma^2 I)\)

Koefisien \(\rho\) menunjukkan sejauh mana pengaruh spasial terjadi antarwilayah. Jika \(\rho\) signifikan, maka variabel dependen di suatu wilayah dipengaruhi oleh nilai di wilayah tetangga. Dalam konteks penelitian TPT antarprovinsi, model SAR relevan apabila tingkat pengangguran di satu provinsi dipengaruhi oleh kondisi pengangguran di provinsi sekitar, misalnya karena mobilitas tenaga kerja, migrasi, atau keterkaitan pasar kerja regional.

2.4.2 Spatial Error Model (SEM)

Berbeda dengan SAR, Spatial Error Model (SEM) digunakan ketika ketergantungan spasial tidak terjadi pada variabel dependen, tetapi pada komponen error. Artinya, pengaruh antarwilayah muncul akibat faktor yang tidak terobservasi namun saling berkaitan secara spasial, seperti kebijakan daerah, infrastruktur, atau kondisi sosial ekonomi yang mirip. Model SEM dinyatakan sebagai berikut:

\[ y = X\beta + (I - \lambda W)^{-1} \varepsilon \]

Keterangan:

\(y\) = vektor variabel dependen (TPT)
\(X\) = matriks variabel independen (TPAK dan persentase penduduk miskin)
\(\beta\) = vektor koefisien regresi
\(W\) = matriks pembobot spasial
\(\lambda\) = koefisien autokorelasi spasial pada komponen error
\(\varepsilon\) = error acak yang berdistribusi normal \(N(0, \sigma^2 I)\)

Jika \(\lambda\) signifikan, maka terdapat hubungan spasial dalam error term, yang menandakan bahwa variabel-variabel yang tidak dimasukkan ke dalam model berhubungan antarwilayah. Dalam konteks TPT 2020–2025, SEM cocok digunakan ketika faktor-faktor eksternal seperti kebijakan ketenagakerjaan, investasi, atau kondisi sosial ekonomi antarprovinsi memiliki keterkaitan yang menyebabkan error model saling berhubungan.

BAB III (METODOLOGI PENELITIAN)

3.1 Data dan Sumber Data

Penelitian ini menggunakan data sekunder berbentuk data panel spasial yang mencakup 38 dan atau 34 provinsi di Indonesia selama periode tahun 2020 hingga 2025. Data diperoleh dari sumber resmi, yaitu Badan Pusat Statistik (BPS).

Jenis data yang digunakan , yaitu Data Tingkat Pengangguran Terbuka (TPT), Data Tingkat Partisipasi Angkatan Kerja (TPAK), dan Data Penduduk Miskin. Ketiga variabel tersebut disusun dalam bentuk panel data (cross section dan time series), sehingga memungkinkan analisis hubungan spasial dan temporal antarprovinsi di Indonesia. Data diolah menggunakan software R Studio untuk melakukan estimasi model SAR dan SEM.

3.2 Variabel Penelitian

Penelitian ini melibatkan satu variabel dependen dan dua variabel independen. Definisi operasional variabel dijelaskan sebagai berikut:

Jenis Variabel	Nama Variabel	Simbol	Satuan	Keterangan
Dependen	Tingkat Pengangguran Terbuka	\(Y\)	Persen (%)	Persentase jumlah penganggur terhadap total angkatan kerja di suatu provinsi.
Independen	Tingkat Partisipasi Angkatan Kerja	\(X_1\)	Persen (%)	Persentase penduduk usia kerja (15 tahun ke atas) yang bekerja atau aktif mencari pekerjaan.
Independen	Persentase Penduduk Miskin	\(X_2\)	Persen (%)	Persentase penduduk yang berada di bawah garis kemiskinan berdasarkan pengeluaran per kapita.

Fokus utama penelitian ini adalah untuk melihat pola keterkaitan spasial (spatial dependence) dan autokorelasi spasial (spatial autocorrelation) antarprovinsi dalam hal tingkat pengangguran terbuka, baik secara global maupun lokal. Serta model spasial (SAR atau SEM) yang paling tepat menggambarkan hubungan tersebut.

3.3 Metode Analisis Data

Analisis dilakukan menggunakan pendekatan spasial dengan data panel, yang bertujuan untuk mengetahui pengaruh faktor-faktor ekonomi terhadap TPT dengan mempertimbangkan keterkaitan antarwilayah. Analisis dilakukan melalui beberapa tahapan, yaitu analisis deskriptif, pengujian autokorelasi spasial, dan estimasi model spasial (SAR dan SEM) .

3.3.1 Eksplorasi Data dan Visualisasi

Menurut Sudjana (2005), analisis deskriptif merupakan metode statistik yang bertujuan untuk memberikan gambaran atau deskripsi mengenai suatu data sebagaimana adanya tanpa bermaksud untuk menarik kesimpulan yang bersifat umum. Analisis ini digunakan untuk menyajikan data dalam bentuk tabel, grafik, maupun ukuran-ukuran statistik seperti rata-rata, median, modus, dan simpangan baku agar informasi yang terkandung dalam data dapat lebih mudah dipahami.

Tahap awal penelitian ini berupa analisis deskriptif yang bertujuan untuk memberikan gambaran umum mengenai perkembangan beberapa variabel di Indonesia dari tahun 2020 hingga 2025. Analisis ini mencakup penyajian nilai rata-rata, nilai maksimum dan minimum untuk variabelTingkat Pengangguran Terbuka (TPT), Partisipasi Angkatan Kerja (TPAK), dan Penduduk Miskin.

Selain analisis numerik, dilakukan pula visualisasi spasial menggunakan peta tematik (choropleth map) untuk menunjukkan pola sebaran variabel antarprovinsi di Indonesia. Visualisasi ini membantu mengidentifikasi apakah terdapat pola pengelompokan wilayah (spatial clustering), misalnya provinsi dengan TPT tinggi yang saling berdekatan (hotspot) atau wilayah dengan TPT rendah yang membentuk klaster tersendiri (coldspot).

3.3.2 Uji Autokorelasi Spasial

Setelah dilakukan pemetaan untuk melihat pola sebaran TPT antarprovinsi, langkah berikutnya adalah melakukan uji autokorelasi spasial. Tujuan pengujian ini adalah untuk memastikan apakah nilai TPT di suatu provinsi memiliki hubungan atau ketergantungan dengan nilai TPT di provinsi yang berdekatan. Dengan kata lain, apakah tingkat pengangguran terbuka di suatu wilayah dipengaruhi oleh kondisi wilayah sekitarnya. Dalam penelitian ini digunakan tiga jenis uji autokorelasi spasial, yaitu Moran’s I, Geary’s C, dan Getis-Ord G.

Hasil dari ketiga uji ini memberikan dasar untuk menentukan model spasial yang paling sesuai, yaitu apakah menggunakan model Spatial Autoregressive (SAR) atau Spatial Error Model (SEM). Jika pengaruh spasial muncul langsung pada variabel dependen, maka model SAR lebih tepat digunakan. Namun, jika pengaruh spasial terdapat pada komponen galat (error term), maka model SEM menjadi pilihan yang lebih sesuai.

3.3.3 Estimasi Model Spatial

Setelah hasil uji Moran’s I menunjukkan adanya autokorelasi spasial, langkah selanjutnya adalah menentukan bentuk dependensi spasial yang paling sesuai. Dalam analisis spasial, terdapat dua model utama yang umum digunakan, yaitu Spatial Autoregressive Model (SAR) dan Spatial Error Model (SEM).

Kedua model tersebut sama-sama mempertimbangkan adanya ketergantungan spasial antarwilayah, namun perbedaannya terletak pada sumber ketergantungan yang terjadi. Model SAR digunakan ketika ketergantungan spasial muncul secara langsung melalui variabel dependen wilayah tetangga. Artinya, nilai Tingkat Pengangguran Terbuka (TPT) suatu provinsi dipengaruhi oleh nilai TPT di provinsi lain yang berdekatan. Sebaliknya, model SEM digunakan apabila ketergantungan spasial tidak muncul secara langsung pada variabel dependen, melainkan melalui komponen error, yaitu adanya faktor-faktor tak teramati yang saling berkorelasi antarwilayah.

Perbandingan kedua model ini bertujuan untuk mengetahui bentuk keterkaitan spasial yang paling sesuai dengan kondisi empiris di Indonesia. Jika hasil estimasi menunjukkan bahwa model SAR lebih unggul (ditunjukkan oleh nilai log-likelihood yang lebih tinggi atau nilai AIC/BIC yang lebih rendah), maka dapat diartikan bahwa dinamika TPT antarprovinsi saling memengaruhi secara langsung. Namun, apabila model SEM lebih sesuai, maka hubungan antarprovinsi lebih disebabkan oleh pengaruh eksternal yang tidak terukur, seperti kebijakan nasional, kondisi makroekonomi, atau shock eksternal yang berdampak serupa di beberapa provinsi sekaligus.

3.3.4 Pemilihan Model Terbaik

Pemilihan model terbaik antara Spatial Autoregressive (SAR) dan Spatial Error Model (SEM) dilakukan untuk menentukan model yang paling sesuai dalam menggambarkan hubungan antarwilayah pada data panel TPT provinsi di Indonesia tahun 2020–2025. Perbandingan dilakukan dengan melihat nilai koefisien determinasi (R²) dan Akaike Information Criterion (AIC). Model yang memiliki nilai R² tertinggi menunjukkan kemampuan yang lebih baik dalam menjelaskan variasi, sedangkan nilai AIC yang lebih rendah menandakan model yang lebih efisien dan sesuai dengan data. Dengan demikian, model terbaik dipilih berdasarkan kombinasi dari kedua kriteria tersebut untuk memastikan bentuk pengaruh spasial yang paling tepat, apakah berada pada variabel dependen (SAR) atau pada komponen galat (SEM).

BAB IV (HASIL DAN PEMBAHASAN)

4.1 Eksplorasi Data dan Visualisasi

# Gabungkan shapefile dengan data CSV
data_sf <- left_join(indo_shp, data, by = c("NAME_1" = "Provinsi"))

data_sf <- data_sf %>%
  mutate(
    TPT = as.numeric(gsub(",", ".", TPT)),
    TPAK = as.numeric(gsub(",", ".", TPAK)),
    Pend.Miskin = as.numeric(gsub(",", ".", Pend.Miskin))
  )

data_sf <- data_sf %>%
  filter(!is.na(TPT) & !is.na(TPAK) & !is.na(Pend.Miskin))

summary(select(data_sf, TPT, TPAK, Pend.Miskin))

##       TPT             TPAK        Pend.Miskin              geometry  
##  Min.   :1.250   Min.   :61.85   Min.   : 3.720   MULTIPOLYGON :174  
##  1st Qu.:3.663   1st Qu.:66.43   1st Qu.: 6.673   epsg:NA      :  0  
##  Median :4.360   Median :69.53   Median : 9.895   +proj=long...:  0  
##  Mean   :4.711   Mean   :69.27   Mean   :10.616                      
##  3rd Qu.:5.750   3rd Qu.:71.43   3rd Qu.:13.180                      
##  Max.   :9.010   Max.   :80.23   Max.   :26.860

Interpretasi:

Hasil statistik deskriptif menunjukkan bahwa rata-rata tingkat pengangguran terbuka (TPT) di Indonesia sebesar 4,71% dengan rentang antara 1,25% hingga 9,01%, menandakan adanya kesenjangan antarprovinsi dan kecenderungan beberapa wilayah memiliki pengangguran tinggi. Tingkat partisipasi angkatan kerja (TPAK) relatif tinggi dengan rata-rata 69,27%, menunjukkan bahwa sebagian besar penduduk usia kerja aktif di pasar tenaga kerja. Sementara itu, persentase penduduk miskin (Pend.Miskin) rata-rata sebesar 10,62%, dengan variasi yang cukup lebar antarwilayah, menggambarkan adanya ketimpangan kesejahteraan di berbagai provinsi di Indonesia.

tm_shape(data_sf) +
  tm_polygons("TPT", palette = "YlOrRd", title = "Tingkat Pengangguran Terbuka") +
  tm_layout(frame = FALSE)

##

## ── tmap v3 code detected ───────────────────────────────────────────────────────

## [v3->v4] `tm_tm_polygons()`: migrate the argument(s) related to the scale of
## the visual variable `fill` namely 'palette' (rename to 'values') to fill.scale
## = tm_scale(<HERE>).
## [v3->v4] `tm_polygons()`: migrate the argument(s) related to the legend of the
## visual variable `fill` namely 'title' to 'fill.legend = tm_legend(<HERE>)'
## [cols4all] color palettes: use palettes from the R package cols4all. Run
## `cols4all::c4a_gui()` to explore them. The old palette name "YlOrRd" is named
## "brewer.yl_or_rd"
## Multiple palettes called "yl_or_rd" found: "brewer.yl_or_rd", "matplotlib.yl_or_rd". The first one, "brewer.yl_or_rd", is returned.

Interpretasi:

Peta sebaran Tingkat Pengangguran Terbuka (TPT) di atas memperlihatkan adanya variasi spasial yang cukup jelas antarprovinsi di Indonesia. Wilayah dengan tingkat pengangguran tinggi (warna merah tua) tampak terkonsentrasi di bagian timur, terutama Papua, sementara daerah dengan tingkat pengangguran rendah (warna kuning muda hingga oranye) tersebar di sebagian besar wilayah tengah dan barat Indonesia seperti Kalimantan, Sulawesi, dan sebagian Sumatra. Pola ini menunjukkan adanya ketimpangan spasial dalam tingkat pengangguran, yang dapat dipengaruhi oleh perbedaan struktur ekonomi, ketersediaan lapangan kerja, dan tingkat pembangunan antarwilayah.

4.2 Uji Autokorelasi Spasial

4.2.1 Uji Moran’s I

library(spdep)

var_list <- c("TPT", "TPAK", "Pend.Miskin")

# Jalankan Moran's I pada data yang sudah merge
moran_results <- lapply(var_list, function(v) {
  moran.test(data_sf_simple[[v]], lw, zero.policy = TRUE)
})

names(moran_results) <- var_list

# Tabel hasil Moran’s I
moran_df <- data.frame(
  Variabel = var_list,
  Moran_I = sapply(moran_results, function(x) x$estimate["Moran I statistic"]),
  p_value = sapply(moran_results, function(x) x$p.value)
)

moran_df

##                                  Variabel   Moran_I       p_value
## TPT.Moran I statistic                 TPT 0.4571976  3.124274e-61
## TPAK.Moran I statistic               TPAK 0.5352279  9.934250e-83
## Pend.Miskin.Moran I statistic Pend.Miskin 0.7629746 1.654935e-165

Interpretasi:

Hasil uji Moran’s I menunjukkan bahwa ketiga variabel memiliki autokorelasi spasial positif, yang berarti nilai suatu provinsi cenderung mirip dengan provinsi di sekitarnya. Nilai Moran’s I tertinggi terdapat pada variabel Penduduk Miskin (0,472), mengindikasikan adanya pengelompokan wilayah dengan tingkat kemiskinan yang serupa (tinggi atau rendah) secara spasial. Sementara itu, TPT (0,279) dan TPAK (0,171) juga menunjukkan pola spasial positif namun dengan kekuatan yang lebih lemah, menandakan bahwa pengangguran dan partisipasi angkatan kerja antarprovinsi masih memiliki keterkaitan spasial, meski tidak sekuat kemiskinan.

4.2.2 Uji Geary’s C

library(spdep)

var_list <- c("TPT", "TPAK", "Pend.Miskin")

# Jalankan Geary's C pada data yang sudah merge
geary_results <- lapply(var_list, function(v) {
  geary.test(data_sf_simple[[v]], lw, zero.policy = TRUE)
})

names(geary_results) <- var_list

# Tabel hasil Geary’s C
geary_df <- data.frame(
  Variabel = var_list,
  Geary_C = sapply(geary_results, function(x) x$estimate["Geary C statistic"]),
  p_value = sapply(geary_results, function(x) x$p.value)
)

geary_df

##                                  Variabel   Geary_C       p_value
## TPT.Geary C statistic                 TPT 0.5418079  1.096026e-53
## TPAK.Geary C statistic               TPAK 0.4463887  4.040705e-78
## Pend.Miskin.Geary C statistic Pend.Miskin 0.2348916 1.285595e-141

Interpretasi:

Hasil uji Geary’s C menunjukkan bahwa seluruh variabel memiliki nilai p-value < 0,05, yang berarti terdapat autokorelasi spasial yang signifikan. Nilai Geary’s C yang semuanya kurang dari 1 menandakan adanya pola spasial positif, yaitu provinsi dengan nilai suatu variabel cenderung memiliki nilai serupa dengan provinsi di sekitarnya. Variabel Penduduk Miskin (C = 0,318) menunjukkan keterkaitan spasial paling kuat, diikuti oleh TPAK (C = 0,440) dan TPT (C = 0,575). Hal ini mengindikasikan bahwa daerah dengan tingkat kemiskinan tinggi atau rendah cenderung berdekatan secara geografis, begitu pula pola pada partisipasi angkatan kerja dan tingkat pengangguran.

4.2.3 Getis Ord

library(spdep)

var_list <- c("TPT", "TPAK", "Pend.Miskin")

# Hitung Local Gi* (Getis-Ord Gi*)
getis_results <- lapply(var_list, function(v) {
  localG(data_sf_simple[[v]], lw, zero.policy = TRUE)
})

names(getis_results) <- var_list

# Gabungkan hasil Gi* ke data spasial
for(v in var_list) {
  data_sf_simple[[paste0("Gi_", v)]] <- as.numeric(getis_results[[v]])
}

# Tabel ringkasan rata-rata dan sebaran Gi*
getis_df <- data.frame(
  Variabel = var_list,
  Mean_Gi = sapply(var_list, function(v) mean(data_sf_simple[[paste0("Gi_", v)]], na.rm = TRUE)),
  SD_Gi = sapply(var_list, function(v) sd(data_sf_simple[[paste0("Gi_", v)]], na.rm = TRUE))
)

getis_df

##                Variabel     Mean_Gi    SD_Gi
## TPT                 TPT  0.02254594 2.567900
## TPAK               TPAK -0.17982197 2.230933
## Pend.Miskin Pend.Miskin -0.32713660 3.159280

Interpretasi:

Hasil uji Getis-Ord Gi* menunjukkan bahwa ketiga variabel memiliki nilai rata-rata Gi* (Mean_Gi) yang mendekati nol, menandakan tidak terdapat konsentrasi ekstrem (hotspot atau coldspot) yang dominan secara keseluruhan di tingkat nasional. Nilai standar deviasi (SD_Gi) yang relatif tinggi, terutama pada variabel Penduduk Miskin (SD = 1,177) dan TPT (SD = 1,087), mengindikasikan bahwa terdapat variasi spasial antarwilayah, di mana beberapa provinsi mungkin memiliki area panas (hotspot) atau dingin (coldspot) lokal. Namun secara umum, pola spasial antarprovinsi masih cenderung tersebar merata tanpa klaster yang sangat kuat.

4.2.4 Local Moran’s I (LISA)

library(spdep)
library(dplyr)
library(ggplot2)

# Variabel yang dianalisis
x <- scale(data_sf_simple$TPT)[, 1]   # standardisasi nilai

# Lag spasial
lagx <- spdep::lag.listw(lw, x, zero.policy = TRUE)

# Hitung Local Moran's I
lisa <- spdep::localmoran(x, lw, alternative = "two.sided", zero.policy = TRUE)
lisa_df <- as.data.frame(lisa)
names(lisa_df) <- c("Ii", "Ei", "Vi", "Zi", "Pi.two.sided")

# Tentukan signifikansi
alpha <- 0.05

# Gabungkan hasil dengan data spasial
Indo_LISA <- bind_cols(data_sf_simple, lisa_df) %>%
  mutate(
    x = as.numeric(x),
    lagx = as.numeric(lagx),
    quad = case_when(
      x >= 0 & lagx >= 0 & Pi.two.sided <= alpha ~ "High-High",
      x < 0 & lagx < 0 & Pi.two.sided <= alpha ~ "Low-Low",
      x >= 0 & lagx < 0 & Pi.two.sided <= alpha ~ "High-Low (Outlier)",
      x < 0 & lagx >= 0 & Pi.two.sided <= alpha ~ "Low-High (Outlier)",
      TRUE ~ "Not significant"
    )
  )

# Plot LISA
ggplot(Indo_LISA) +
  geom_sf(aes(fill = quad), color = "white", size = 0.2) +
  scale_fill_manual(
    values = c(
      "High-High" = "#d73027",
      "Low-Low" = "#4575b4",
      "High-Low (Outlier)" = "#fdae61",
      "Low-High (Outlier)" = "#74add1",
      "Not significant" = "grey85"
    )
  ) +
  labs(
    title = "Local Moran's I (LISA) - TPT Indonesia",
    fill = "Kategori LISA"
  ) +
  theme_minimal() +
  theme(
    plot.title = element_text(hjust = 0.5, face = "bold"),
    legend.position = "bottom"
  )

Interpretasi:

Hasil Local Moran’s I (LISA) untuk variabel Tingkat Pengangguran Terbuka (TPT) menunjukkan bahwa hanya terdapat satu klaster signifikan bertipe High-High, yaitu di Provinsi DKI Jakarta. Hal ini mengindikasikan bahwa daerah tersebut memiliki tingkat pengangguran tinggi yang berdekatan dengan wilayah sekitar yang juga memiliki tingkat pengangguran relatif tinggi, membentuk klaster konsentrasi pengangguran di kawasan tersebut. Sementara itu, sebagian besar provinsi lainnya berwarna abu-abu (Not significant), yang berarti tidak menunjukkan autokorelasi spasial signifikan, atau tingkat penganggurannya tidak membentuk pola klaster yang jelas dengan provinsi tetangga.

4.3 Estimasi Model Spasial

4.3.1 Ordinary Least Squares (OLS)

ols_model <- lm(TPT ~ TPAK + Pend.Miskin, data = data_sf)
summary(ols_model)

## 
## Call:
## lm(formula = TPT ~ TPAK + Pend.Miskin, data = data_sf)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -2.0656 -0.8628 -0.1195  0.7071  3.1153 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 21.597204   1.785369  12.097   <2e-16 ***
## TPAK        -0.242678   0.026311  -9.223   <2e-16 ***
## Pend.Miskin -0.007113   0.017961  -0.396    0.693    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.167 on 171 degrees of freedom
## Multiple R-squared:  0.3529, Adjusted R-squared:  0.3453 
## F-statistic: 46.63 on 2 and 171 DF,  p-value: < 2.2e-16

Interpretasi:

Hasil model OLS menunjukkan bahwa hanya variabel TPAK yang berpengaruh signifikan terhadap TPT, dengan arah hubungan negatif (p < 0,001), artinya semakin tinggi tingkat partisipasi angkatan kerja maka tingkat pengangguran cenderung menurun. Variabel Penduduk Miskin tidak berpengaruh signifikan (p = 0,693). Nilai R² sebesar 0,35 menunjukkan bahwa sekitar 35% variasi pengangguran dapat dijelaskan oleh kedua variabel tersebut.

# Pastikan residual dari model OLS sudah numeric
data_sf$residuals <- residuals(ols_model)

# Jika masih tersimpan sebagai list, ubah ke numeric vector
data_sf$residuals <- as.numeric(unlist(data_sf$residuals))

# Pastikan tidak ada nilai NA
data_sf <- data_sf[!is.na(data_sf$residuals), ]

# Sekarang jalankan Moran’s I test
moran_test <- moran.test(data_sf$residuals, lw, zero.policy = TRUE)
moran_test

## 
##  Moran I test under randomisation
## 
## data:  data_sf$residuals  
## weights: lw    
## 
## Moran I statistic standard deviate = 15.397, p-value < 2.2e-16
## alternative hypothesis: greater
## sample estimates:
## Moran I statistic       Expectation          Variance 
##      0.4275738095     -0.0057803468      0.0007922045

Interpretasi :

Nilai Moran’s I yang positif (0.4276) mengindikasikan bahwa wilayah yang berdekatan cenderung memiliki nilai residual yang mirip — daerah dengan residual tinggi dikelilingi oleh daerah dengan residual tinggi pula, dan sebaliknya. Dengan demikian, model OLS belum sepenuhnya menangkap efek spasial dalam data

4.3.1.2 Uji Diagnostik Model Regresi Data Panel

# 1️⃣ Ambil residual dari model OLS
res_ols <- residuals(ols_model)

# 2️⃣ Jalankan uji autokorelasi spasial (Moran's I)
moran_test <- moran.test(res_ols, lw, zero.policy = TRUE)
moran_test

## 
##  Moran I test under randomisation
## 
## data:  res_ols  
## weights: lw    
## 
## Moran I statistic standard deviate = 15.397, p-value < 2.2e-16
## alternative hypothesis: greater
## sample estimates:
## Moran I statistic       Expectation          Variance 
##      0.4275738095     -0.0057803468      0.0007922045

# 3️⃣ Jalankan Lagrange Multiplier tests (LM test)
lm_tests <- lm.LMtests(ols_model, lw, test = "all", zero.policy = TRUE)

## Please update scripts to use lm.RStests in place of lm.LMtests

lm_tests

## 
##  Rao's score (a.k.a Lagrange multiplier) diagnostics for spatial
##  dependence
## 
## data:  
## model: lm(formula = TPT ~ TPAK + Pend.Miskin, data = data_sf)
## test weights: listw
## 
## RSerr = 212.84, df = 1, p-value < 2.2e-16
## 
## 
##  Rao's score (a.k.a Lagrange multiplier) diagnostics for spatial
##  dependence
## 
## data:  
## model: lm(formula = TPT ~ TPAK + Pend.Miskin, data = data_sf)
## test weights: listw
## 
## RSlag = 111.07, df = 1, p-value < 2.2e-16
## 
## 
##  Rao's score (a.k.a Lagrange multiplier) diagnostics for spatial
##  dependence
## 
## data:  
## model: lm(formula = TPT ~ TPAK + Pend.Miskin, data = data_sf)
## test weights: listw
## 
## adjRSerr = 101.93, df = 1, p-value < 2.2e-16
## 
## 
##  Rao's score (a.k.a Lagrange multiplier) diagnostics for spatial
##  dependence
## 
## data:  
## model: lm(formula = TPT ~ TPAK + Pend.Miskin, data = data_sf)
## test weights: listw
## 
## adjRSlag = 0.15907, df = 1, p-value = 0.69
## 
## 
##  Rao's score (a.k.a Lagrange multiplier) diagnostics for spatial
##  dependence
## 
## data:  
## model: lm(formula = TPT ~ TPAK + Pend.Miskin, data = data_sf)
## test weights: listw
## 
## SARMA = 213, df = 2, p-value < 2.2e-16

# Menampilkan hasil dalam format tabel
lm_results <- data.frame(
  Test = names(lm_tests),
  Statistic = sapply(lm_tests, function(x) x$statistic),
  P_value = sapply(lm_tests, function(x) x$p.value)
)

print(lm_results)

##                       Test   Statistic   P_value
## RSerr.RSerr          RSerr 212.8400198 0.0000000
## RSlag.RSlag          RSlag 111.0672866 0.0000000
## adjRSerr.adjRSerr adjRSerr 101.9318081 0.0000000
## adjRSlag.adjRSlag adjRSlag   0.1590749 0.6900097
## SARMA.SARMA          SARMA 212.9990947 0.0000000

Interpretasi :

Nilai \(P\_value\) yang semuanya nol (\(0.0000000\)) pada baris RSlag dan SARMA mengindikasikan bahwa Hipotesis Nol (\(H_0\)) ditolak, yaitu model Ordinary Least Squares (OLS) gagal memenuhi asumsi residual white noise dan memiliki masalah dependensi spasial yang signifikan (baik melalui lag spasial maupun error spasial). Penolakan kuat terhadap \(H_0\) menandakan untuk beralih dari model OLS ke model ekonometrika spasial: baris RSlag yang signifikan menunjukkan perlunya dimasukkan spatial lag (mengarah ke model SAR atau SDM), sementara baris adjRSerr yang signifikan menunjukkan perlunya dimasukkan spatial error (mengarah ke model SEM). Oleh karena itu, hasil ini menyimpulkan bahwa regresi spasial harus diterapkan, dan peneliti perlu menguji ketiga model tersebut untuk menentukan apakah model SAR, SEM, atau SDM adalah yang paling tepat.

4.3.2 Spatial Autoregressive Model (SAR)

library(spatialreg)

## Warning: package 'spatialreg' was built under R version 4.3.3

## Loading required package: Matrix

## 
## Attaching package: 'Matrix'

## The following objects are masked from 'package:tidyr':
## 
##     expand, pack, unpack

## 
## Attaching package: 'spatialreg'

## The following objects are masked from 'package:spdep':
## 
##     get.ClusterOption, get.coresOption, get.mcOption,
##     get.VerboseOption, get.ZeroPolicyOption, set.ClusterOption,
##     set.coresOption, set.mcOption, set.VerboseOption,
##     set.ZeroPolicyOption

sar_model <- lagsarlm(TPT ~ TPAK + Pend.Miskin,
                      data = data_sf,
                      listw = lw,
                      zero.policy = TRUE)
summary(sar_model)

## 
## Call:lagsarlm(formula = TPT ~ TPAK + Pend.Miskin, data = data_sf, 
##     listw = lw, zero.policy = TRUE)
## 
## Residuals:
##       Min        1Q    Median        3Q       Max 
## -1.937037 -0.791214 -0.079406  0.585144  2.692514 
## 
## Type: lag 
## Coefficients: (asymptotic standard errors) 
##               Estimate Std. Error z value  Pr(>|z|)
## (Intercept) 13.2781644  1.9833160  6.6949 2.158e-11
## TPAK        -0.1651227  0.0260631 -6.3355 2.366e-10
## Pend.Miskin -0.0014735  0.0149842 -0.0983    0.9217
## 
## Rho: 0.61311, LR test value: 54.014, p-value: 1.9906e-13
## Asymptotic standard error: 0.067663
##     z-value: 9.0612, p-value: < 2.22e-16
## Wald statistic: 82.105, p-value: < 2.22e-16
## 
## Log likelihood: -245.1814 for lag model
## ML residual variance (sigma squared): 0.93736, (sigma: 0.96817)
## Number of observations: 174 
## Number of parameters estimated: 5 
## AIC: 500.36, (AIC for lm: 552.38)
## LM test for residual autocorrelation
## test value: 11.025, p-value: 0.00089883

Interpretasi:

Hasil model SAR menunjukkan bahwa rho (ρ) sebesar 0,6131 signifikan (p < 0,001), menandakan adanya pengaruh spasial langsung antarprovinsi — tingkat pengangguran suatu provinsi dipengaruhi oleh kondisi pengangguran di provinsi sekitarnya. Variabel TPAK tetap berpengaruh negatif signifikan terhadap TPT, sedangkan Penduduk Miskin tidak signifikan. Nilai AIC yang lebih rendah (500,36) dibanding OLS menunjukkan bahwa model SAR lebih sesuai dalam menjelaskan fenomena pengangguran karena mempertimbangkan efek spasial antarwilayah.

4.3.3 Spatial Error Model (SEM)

sem_model <- errorsarlm(TPT ~ TPAK + Pend.Miskin,
                        data = data_sf,
                        listw = lw,
                        zero.policy = TRUE)
summary(sem_model)

## 
## Call:errorsarlm(formula = TPT ~ TPAK + Pend.Miskin, data = data_sf, 
##     listw = lw, zero.policy = TRUE)
## 
## Residuals:
##       Min        1Q    Median        3Q       Max 
## -2.075007 -0.662019 -0.099688  0.605064  2.748674 
## 
## Type: error 
## Coefficients: (asymptotic standard errors) 
##              Estimate Std. Error z value Pr(>|z|)
## (Intercept) 21.496990   1.959952 10.9681  < 2e-16
## TPAK        -0.236146   0.028451 -8.3002  < 2e-16
## Pend.Miskin -0.043899   0.025260 -1.7379  0.08223
## 
## Lambda: 0.72038, LR test value: 70.006, p-value: < 2.22e-16
## Asymptotic standard error: 0.063604
##     z-value: 11.326, p-value: < 2.22e-16
## Wald statistic: 128.28, p-value: < 2.22e-16
## 
## Log likelihood: -237.1852 for error model
## ML residual variance (sigma squared): 0.83208, (sigma: 0.91218)
## Number of observations: 174 
## Number of parameters estimated: 5 
## AIC: 484.37, (AIC for lm: 552.38)

Interpretasi:

Hasil estimasi Spatial Error Model (SEM) menunjukkan bahwa model ini berhasil menangkap adanya efek spasial pada komponen error. Nilai lambda (λ) sebesar 0,7204 signifikan (p < 0,001), menandakan adanya autokorelasi spasial kuat pada error term, artinya faktor-faktor lain yang memengaruhi tingkat pengangguran memiliki keterkaitan antarprovinsi. Variabel TPAK (-0,2361) berpengaruh negatif dan signifikan (p < 0,001) terhadap TPT, menunjukkan bahwa semakin tinggi partisipasi angkatan kerja, tingkat pengangguran cenderung menurun. Sementara itu, Penduduk Miskin (-0,0439) berpengaruh negatif tetapi tidak signifikan (p = 0,082). Nilai AIC sebesar 484,37, yang lebih rendah dibanding model OLS (552,38), menunjukkan bahwa model SEM memberikan kecocokan yang lebih baik karena mampu menangkap pengaruh spasial yang tidak terakomodasi dalam model regresi biasa.

4.3.4 Spatial Durbin Model (SDM)

sdm_model <- lagsarlm(TPT ~ TPAK + Pend.Miskin,
                      data = data_sf,
                      listw = lw,
                      type = "mixed",
                      zero.policy = TRUE)
summary(sdm_model)

## 
## Call:lagsarlm(formula = TPT ~ TPAK + Pend.Miskin, data = data_sf, 
##     listw = lw, type = "mixed", zero.policy = TRUE)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -2.05849 -0.65827 -0.12605  0.56885  2.84138 
## 
## Type: mixed 
## Coefficients: (asymptotic standard errors) 
##                  Estimate Std. Error z value  Pr(>|z|)
## (Intercept)      6.628564   2.473199  2.6802 0.0073587
## TPAK            -0.235332   0.029707 -7.9218 2.442e-15
## Pend.Miskin     -0.059078   0.028166 -2.0975 0.0359483
## lag.TPAK         0.158325   0.045351  3.4911 0.0004811
## lag.Pend.Miskin  0.065278   0.032435  2.0126 0.0441614
## 
## Rho: 0.70922, LR test value: 69.373, p-value: < 2.22e-16
## Asymptotic standard error: 0.065894
##     z-value: 10.763, p-value: < 2.22e-16
## Wald statistic: 115.84, p-value: < 2.22e-16
## 
## Log likelihood: -236.378 for mixed model
## ML residual variance (sigma squared): 0.82724, (sigma: 0.90953)
## Number of observations: 174 
## Number of parameters estimated: 7 
## AIC: 486.76, (AIC for lm: 554.13)
## LM test for residual autocorrelation
## test value: 1.4558, p-value: 0.2276

Interpretasi:

Hasil estimasi Spatial Durbin Model (SDM) atau mixed model menunjukkan bahwa pengaruh spasial tidak hanya terjadi pada variabel dependen, tetapi juga pada variabel independen. Nilai rho (ρ) sebesar 0,7092 signifikan (p < 0,001), yang berarti terdapat dependensi spasial kuat antarprovinsi dalam tingkat pengangguran. Variabel TPAK (-0,2353) berpengaruh negatif signifikan (p < 0,001) terhadap TPT, sedangkan Penduduk Miskin (-0,0591) juga berpengaruh negatif signifikan (p = 0,036). Selain itu, variabel spasial tetangga (lag.TPAK dan lag.Pend.Miskin) signifikan positif, menunjukkan bahwa peningkatan partisipasi angkatan kerja atau kemiskinan di wilayah sekitar dapat memengaruhi tingkat pengangguran di provinsi lain. Nilai AIC (486,76) lebih rendah daripada model OLS (554,13), menandakan model SDM memiliki kecocokan yang lebih baik. Secara keseluruhan, model ini mengindikasikan bahwa faktor ekonomi di suatu provinsi dan di wilayah sekitarnya sama-sama berkontribusi dalam menentukan tingkat pengangguran terbuka di Indonesia.

4.4 Perbandingan Model

AIC(ols_model, sar_model, sem_model, sdm_model)

##           df      AIC
## ols_model  4 552.3766
## sar_model  5 500.3628
## sem_model  5 484.3705
## sdm_model  7 486.7560

Interpretasi:

Berdasarkan perbandingan nilai AIC (Akaike Information Criterion), model dengan AIC terendah menunjukkan kecocokan terbaik terhadap data. Dari hasil tersebut, dapat disimpulkan bahwa model SEM (Spatial Error Model) adalah model terbaik karena memiliki nilai AIC paling rendah (484.37). Hal ini menunjukkan bahwa model SEM paling sesuai untuk menjelaskan variasi Tingkat Pengangguran Terbuka (TPT) antarprovinsi di Indonesia, karena mampu menangkap efek spasial pada komponen error yang tidak terakomodasi oleh model OLS, SAR, maupun SDM.

4.5 Spatial Analysis Dashboard

Dashboard menyajikan analisis regresi spasial untuk membandingkan berbagai model ekonometrika dalam memahami dan memprediksi tingkat pengangguran terbuka (TPT) di seluruh provinsi Indonesia. Model yang digunakan meliputi OLS (Ordinary Least Squares) sebagai model regresi klasik, SAR (Spatial Autoregressive Model) yang menangkap efek limpahan antarwilayah, SEM (Spatial Error Model) yang memperhitungkan korelasi spasial pada galat, serta SDM (Spatial Durbin Model) yang menggabungkan komponen lag dan error.

Variabel dependen yang dianalisis adalah TPT, dengan variabel independen meliputi TPAK (Tingkat Partisipasi Angkatan Kerja) dan Pend_Miskin (Jumlah Penduduk Miskin). Dashboard ini dilengkapi fitur interaktif seperti visualisasi spasial dengan label provinsi, perbandingan model berdasarkan metrik statistik, analisis tren deret waktu, analisis korelasi global dan lokal, serta opsi untuk mengunduh hasil dan visualisasi. Untuk menjalankan dashboard ini, pengguna perlu mengunggah file CSV yang berisi kolom Provinsi, Tahun, TPT, TPAK, dan Pend_Miskin, serta file shapefile (.rds) untuk batas wilayah provinsi Indonesia.

Link Dashboard : https://hadeelina23001.shinyapps.io/SpatialAnalysisDashboard/

BAB V (Kesimpulan dan Saran)

5.1 Kesimpulan

Berdasarkan hasil analisis regresi spasial terhadap data tingkat pengangguran terbuka (TPT) provinsi di Indonesia, diperoleh beberapa kesimpulan utama. Model OLS menunjukkan bahwa variabel Tingkat Partisipasi Angkatan Kerja (TPAK) berpengaruh negatif dan signifikan terhadap TPT, sedangkan Persentase Penduduk Miskin tidak signifikan. Analisis Moran’s I, Geary’s C, dan Getis-Ord Gi* mengindikasikan adanya autokorelasi spasial positif, yang berarti distribusi pengangguran tidak acak, melainkan membentuk pola klaster antarprovinsi.

Hasil uji lanjut menunjukkan bahwa model Spatial Error Model (SEM) merupakan model terbaik dengan nilai AIC paling rendah (484,37), menandakan bahwa pengaruh spasial pada komponen error lebih dominan dibandingkan pengaruh lag spasial pada variabel dependen. Koefisien lambda (λ = 0,7204) yang signifikan menunjukkan adanya keterkaitan antarwilayah pada faktor-faktor yang memengaruhi pengangguran. Dengan demikian, tingkat pengangguran di suatu provinsi tidak hanya dipengaruhi oleh kondisi internalnya, tetapi juga oleh pengaruh tidak langsung dari wilayah sekitarnya.

5.2 Saran

Berdasarkan hasil penelitian ini, terdapat beberapa saran yang dapat diberikan:

Pemerintah daerah perlu memperhatikan keterkaitan spasial antarprovinsi dalam menyusun kebijakan ketenagakerjaan. Upaya penurunan pengangguran sebaiknya dilakukan secara terpadu antarwilayah, terutama pada provinsi yang membentuk klaster pengangguran tinggi.
Peningkatan partisipasi angkatan kerja perlu difokuskan melalui program pelatihan keterampilan, pendidikan vokasi, dan penciptaan lapangan kerja produktif agar dapat menekan tingkat pengangguran secara berkelanjutan.
Penelitian selanjutnya disarankan untuk menambahkan variabel lain seperti pertumbuhan ekonomi, pendidikan, dan investasi agar model dapat menangkap lebih banyak faktor penyebab pengangguran.
Penggunaan data dengan resolusi spasial dan temporal yang lebih tinggi juga direkomendasikan agar hasil analisis lebih akurat dan relevan untuk pengambilan kebijakan di tingkat regional.

Referensi

Arbia, G. (2014). A primer for spatial econometrics: With applications in R. Palgrave Macmillan.
Anselin, L. (1988). Spatial econometrics: Methods and models. Kluwer Academic Publishers.
Elhorst, J. P. (2014). Spatial econometrics: From cross-sectional data to spatial panels. SpringerBriefs in Regional Science.
Lee, L. F. (2021). Spatial econometrics: Spatial autoregressive models. World Scientific.
Oktafianto, E. K., et al. (2019). The determinant of regional unemployment in Indonesia: The spatial Durbin models. Signifikan: Jurnal Ilmu Ekonomi
Yanuar, F. (2023). Spatial autoregressive quantile regression with open unemployment level in all provinces in Indonesia. Jurnal Sains Teknologi Indonesia
Fauzi, F., Wenur, G. H., & Wasono, R. (2023). Spatial Durbin Model of Unemployment Rate in Central Java. Parameter: Journal of Statistics
Rosmanah, R., Damu Djara, V. A., & Jaya, I. G. N. M. (2022). The spatial econometrics of economic growth in Sumatera Utara Province. J. Math. Comput. Sci.
Hariyatih, S. (2024). Analisis Pengaruh IPM, UMP dan Tingkat Partisipasi Angkatan Kerja terhadap Pengangguran Terbuka di Indonesia. Journal of Social and Economics Research
Adianita, H., Susilowati, D., & Putri Karisma, D. A. (2024). Analisis Tingkat Partisipasi Angkatan Kerja dan Jumlah Lapangan Kerja melalui Pendidikan terhadap Tingkat Pengangguran di Indonesia. Development Review
Ade Kantari, D. P., Kamila, N., & Safitri, O. (2024). Analisis Pengaruh Indeks Pendidikan, Tingkat Partisipasi Angkatan Kerja dan Jumlah Penduduk terhadap Tingkat Pengangguran Terbuka pada Kabupaten/Kota Provinsi Jawa Timur Tahun 2021. Acmatics Journal: Actuarial, Mathematics, and Statistics Journal
Safrina, Y., & Ratna, R. (2023). Analisis Pengaruh Tingkat Partisipasi Angkatan Kerja, Indeks Pembangunan Manusia, dan Tingkat Pengangguran Terbuka terhadap Pertumbuhan Ekonomi di Indonesia. Jurnal Ekonomi Regional Unimal
Badan Pusat Statistik. Tingkat Pengangguran Terbuka menurut Provinsi. Tabel Statistik. Diakses dari [https://www.bps.go.id/id/statistics-table/2/NTQzIzI=/tingkat-pengangguran-terbuka-menurut-provinsi.html]
Badan Pusat Statistik. Persentase Penduduk Miskin (P0) menurut Provinsi dan Daerah - persen. Tabel Statistik. Diakses dari [https://www.bps.go.id/id/statistics-table/2/MTkyIzI=/persentase-penduduk-miskin--p0--menurut-provinsi-dan-daerah--persen-.html]
Badan Pusat Statistik Persentase Angkatan Kerja terhadap Penduduk Usia Kerja (TPAK) menurut Provinsi - persen. Tabel Statistik. Diakses from [https://www.bps.go.id/id/statistics-table/2/MjM5NiMy/persentase-angkatan-kerja-terhadap-penduduk-usia-kerja--tpak--menurut-provinsi--persen-.html]