Dosen Pembimbing : Dr. I Gede Nyoman Mindra Jaya,
M.Si.
Disusun Oleh : Samih Muhamad Alfarras
NPM : 140610230053
PROGRAM STUDI S-1 STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU
PENGETAHUAN ALAM
UNIVERSITAS PADJADJARAN
JATINANGOR
2025
Daftar Isi
Tuberkulosis (TBC) masih menjadi masalah kesehatan masyarakat yang serius secara global dan nasional, dengan variasi insiden yang dipengaruhi oleh faktor individu dan ekologi. Penelitian epidemiologis menyatakan bahwa komorbid seperti HIV secara signifikan meningkatkan peluang terjadinya TBC aktif (Narasimhan et al., 2013), dan bukti meta-analitik menunjukkan pula hubungan kuat antara HIV dan prevalensi TBC pada populasi yang hidup dengan HIV (Qi et al., 2023). Selain faktor klinis, faktor ekologis dan sosial ekonomi seperti kepadatan penduduk dan kemiskinan juga dikaitkan dengan variasi spasial insiden TBC sehingga memerlukan pendekatan analisis pada tingkat area untuk memahami pola sebaran (Liyew et al., 2024; Sihaloho et al., 2019).
Literatur kajian ekologi dan meta-analisis menegaskan bahwa diabetes mellitus merupakan salah satu determinan penting yang meningkatkan risiko TBC dan memperburuk hasil pengobatan (Silva et al., 2018). Selain itu, tinjauan sistematis terbaru pada hubungan diabetes dan TBC menunjukkan bahwa diabetes meningkatkan risiko berkembangnya penyakit TBC aktif dibandingkan tanpa diabetes (Franco et al., 2024). Oleh karena itu, ketika menganalisis sebaran spasial TBC pada tingkat kabupaten/kota, penting untuk mmemperhatikan bagaimana ketersediaan layanan kesehatan dan beban kasus diabetes berinteraksi dengan karakteristik demografi dan ekonomi setempat—seperti kepadatan penduduk dan tingkat kemiskinan—serta kondisi akses terhadap air minum dan fasilitas sanitasi yang layak, karena faktor-faktor ini dapat memengaruhi baik risiko penularan maupun hasil penanganan penyakit. (Silva et al., 2018; Franco et al., 2024).
Pendekatan regresi spasial seperti Spatial Autoregressive Model (SAR) dan Spatial Error Model (SEM) banyak digunakan untuk menangkap ketergantungan spasial pada data area dan untuk mengurangi bias estimasi yang timbul bila asumsi independensi spasial dilanggar. Studi-studi sebelumnya meninjau berbagai teknik spasial dan merekomendasikan penggunaan model spasial ketika terdapat autokorelasi ruang yang signifikan pada data kasus penyakit menular (Sihaloho et al., 2019). Dalam konteks analisis TBC pada level kabupaten/kota, model-model ini membantu membedakan apakah efek spasial bekerja melalui variabel respons (lag spasial) atau melalui proses kesalahan (error spasial), sehingga pemilihan model yang tepat penting untuk inferensi yang valid dan untuk rekomendasi kebijakan berbasis wilayah (Liyew et al., 2024).
Berdasarkan latar tersebut, beberapa masalah utama yang diidentifikasi adalah:
Terdapat ketidakmerataan sebaran kasus TBC antar kabupaten/kota di Provinsi Jawa Tengah pada tahun 2024 yang belum sepenuhnya dipahami pola spasialnya.
Peran faktor komorbid, khususnya beban kasus diabetes, serta determinan layanan kesehatan dan kondisi sosial ekonomi lokal, yaitu ketersediaan fasilitas kesehatan, kepadatan penduduk, persentase penduduk miskin, cakupan air minum layak dan persentase sanitasi layak, terhadap sebaran spasial kasus TBC di tingkat kabupaten/kota belum dianalisis secara komprehensif pada dataset 2024.
Belum ada konsensus apakah model dengan komponen lag spasial (SAR) atau model yang menangkap korelasi error spasial (SEM) lebih sesuai untuk menjelaskan variasi spasial kasus TB di Jawa Tengah, serta bagaimana perbandingan kinerja keduanya pada data 2024.
Pola interpolasi spasial antar wilayah pada jumlah kasus TBC belum diuji, sehingga keterkaitan nilai kasus di suatu wilayah dengan wilayah sekitarnya belum diketahui.
Penelitian ini bertujuan untuk:
Mendeskripsikan pola sebaran spasial kasus tuberkulosis di Provinsi Jawa Tengah pada tahun 2024 pada tingkat kabupaten/kota.
Mengestimasi pengaruh jumlah fasilitas kesehatan (x1), jumlah penderita diabetes mellitus (x2), kepadatan penduduk per km2 (x3), persentase penduduk miskin (x4), persentase air minum layak (x5), dan persentase sanitasi layak (x6) terhadap jumlah kasus tuberkulosis (y) menggunakan model regresi spasial.
Mengaplikasikan dan membandingkan dua pendekatan regresi spasial utama yaitu Spatial Autoregressive Model (SAR) dan Spatial Error Model (SEM) untuk menentukan model yang paling sesuai menjelaskan variasi spasial kasus TB di Jawa Tengah pada tahun 2024 berdasarkan ukuran kebaikan model seperti AIC dan uji diagnostik spasial.
Mengidentifikasi dan mengukur pola interpolasi spasial jumlah kasus TBC antar wilayah.
Agar ruang lingkup penelitian terfokus dan dapat diselesaikan secara metodologis, penelitian ini membatasi diri pada hal-hal berikut:
Unit analisis adalah kabupaten/kota di Provinsi Jawa Tengah. Analisis tidak dilakukan pada level kecamatan atau level individu.
Periode analisis adalah tahun 2024 dan hanya menggunakan data kasus TBC yang dilaporkan pada tahun tersebut sebagai variabel dependen y.
Variabel independen yang dimasukkan terbatas pada: jumlah fasilitas kesehatan (x1), jumlah penderita diabetes mellitus (x2), kepadatan penduduk per km2 (x3), persentase penduduk miskin (x4), persentase air minum layak (x5), dan persentase sanitasi layak (x6) per kabupaten/kota. Variabel lain yang mungkin relevan (misalnya kualitas udara, akses layanan kesehatan, migrasi) tidak dimasukkan dalam model utama dikarenakan keterbatasan data.
Penentuan model spasial dan inferensi mengikuti asumsi klasik model spasial. Jika ditemukan pelanggaran asumsi serius (misalnya heteroskedastisitas spasial yang kuat atau outlier spasial ekstrem) akan dilakukan transformasi atau pendekatan robust namun pembahasan teknis lanjutan akan disajikan secara terbatas pada lampiran.
Spatial Dependence atau ketergantungan spasial merujuk pada konsep bahwa observasi yang berlokasi berdekatan cenderung lebih mirip dibanding observasi yang berjauhan, karena proses sosial, ekonomi, atau biologis yang melintasi batas wilayah. Konsep ini merupakan penerapan prinsip Tobler tentang interaksi ruang, yakni bahwa segala sesuatu di ruang berkaitan, tetapi hal-hal yang lebih dekat mempunyai hubungan yang lebih kuat (Anselin, 1988). Dalam konteks epidemiologi penyakit menular seperti tuberkulosis, ketergantungan spasial muncul karena transmisi antar populasi tetangga, mobilitas manusia, serta keterkaitan determinan sosial ekonomi di area berdekatan (Liyew et al., 2024; Sihaloho et al., 2019). Pemahaman teori ketergantungan spasial menjadi dasar untuk memilih pendekatan analitik yang memperhitungkan struktur ruang, karena pelanggaran asumsi independensi antar unit akan menghasilkan estimasi dan inferensi yang bias bila digunakan model nonspasial biasa (Anselin, 1988; LeSage & Pace, 2009).
Autokorelasi spasial digunakan untuk mengukur sejauh mana nilai suatu variabel di satu lokasi berkorelasi dengan nilai di lokasi lain yang berdekatan. Terdapat dua jenis analisis autokorelasi spasial, yaitu Global Moran’s I dan Local Moran’s I (LISA). Global Moran’s I digunakan untuk menilai apakah pola spasial secara keseluruhan bersifat mengelompok (clustered), acak (random), atau menyebar (dispersed), sedangkan Local Moran’s I digunakan untuk mengidentifikasi lokasi-lokasi spesifik yang membentuk klaster signifikan, seperti wilayah dengan kasus TBC tinggi yang berdekatan dengan wilayah serupa (High-High) atau rendah dengan rendah (Low-Low). Kedua ukuran ini penting untuk memahami pola sebaran penyakit dan mendeteksi daerah prioritas penanganan
Model SAR memperkenalkan lag spasial variabel dependen untuk menangkap efek spillover antara unit ruang. Bentuk model SAR adalah:
\[ y = \rho W y + X \beta + \varepsilon \]
Di mana :
y adalah vektor variabel dependen,
W adalah matriks bobot spasial yang telah ditentukan,
ρ adalah koefisien lag spasial yang mengukur seberapa besar nilai y di satu wilayah dipengaruhi oleh nilai y di wilayah tetangga,
X adalah matriks kovariat,
β adalah vektor koefisien, dan
ε adalah komponen error iid atau dengan struktur varians tertentu
Model SAR memasukkan ketergantungan spasial melalui variabel dependen, menunjukkan bahwa nilai TBC di suatu wilayah dipengaruhi oleh nilai TBC di wilayah sekitar.
Model SEM memodelkan ketergantungan spasial pada komponen error, dengan bentuk:
\[ y = X\beta + u, \qquad u = \lambda W u + \varepsilon \]
Di mana :
\(y\) adalah vektor variabel dependen,
\(X\) adalah matriks kovariat,
\(\beta\) adalah vektor koefisien regresi,
\(W\) adalah matriks pembobot spasial,
\(\lambda\) adalah parameter error spasial, dan
\(\varepsilon\) adalah komponen error yang diasumsikan white noise.
Model SEM memperhitungkan korelasi spasial pada komponen error, yang menunjukkan adanya faktor spasial yang tidak teramati tetapi memengaruhi variabel dependen. Dengan membandingkan kedua model ini, dapat diketahui apakah pengaruh spasial lebih dominan berasal dari interaksi antarwilayah atau dari faktor-faktor tak teramati dalam struktur residual.
Interpolasi spasial adalah rangkaian metode statistik dan numerik yang digunakan untuk memperkirakan nilai variabel pada lokasi yang tidak diamati berdasarkan nilai yang tersedia pada lokasi terukur (Cressie, 1993). Dalam penelitian spasial, interpolasi penting untuk membuat peta tematik, mengisi celah data, dan mendukung analisis lanjut seperti deteksi klaster, pemodelan risiko, dan pengambilan keputusan kebijakan (Webster & Oliver, 2007).
Inti interpolasi spasial adalah asumsi autokorelasi ruang, yaitu nilai yang lebih dekat secara geografis cenderung lebih mirip daripada nilai yang berjauhan (Cressie, 1993). Dua konsep sentral yang sering muncul adalah stasionaritas dan isotropi. Stasionaritas berhubungan dengan kestabilan statistik proses di seluruh area studi, sedangkan isotropi berarti sifat korelasi tidak bergantung pada arah. Ketidakstasionaritas dan anisotropi mempengaruhi pemilihan metode dan interpretasi hasil (Isaaks & Srivastava, 1989; Webster & Oliver, 2007).
Langkah-langkah analisisnya adalah sebagai berikut :
Tahap awal meliputi pemeriksaan sebaran titik pengamatan, kelengkapan data, keberadaan pencilan, serta konsistensi sistem koordinat. Jika diperlukan, dilakukan transformasi data untuk mendekati distribusi normal dan mengurangi heteroskedastisitas (Cressie, 1993).
Variogram eksperimental adalah fungsi yang menggambarkan ketergantungan spasial berdasarkan perbedaan nilai antar pasangan titik sebagai fungsi jarak pemisah \(h\). Untuk setiap jarak pemisah \(h\), variogram eksperimental dinyatakan sebagai:
\[ \gamma(h) = \frac{1}{2N(h)} \sum_{i,j:; |s_i - s_j| \approx h} \big( Z(s_i) - Z(s_j) \big)^2, \]
di mana \(N(h)\) adalah jumlah pasangan titik yang jaraknya mendekati \(h\), \(s_i\) dan \(s_j\) adalah lokasi spasial, dan \(Z(s)\) menyatakan nilai variabel pada lokasi \(s\) (Matheron, 1963). Variogram eksperimental biasanya diplotkan sebagai titik-titik (semivariansi vs jarak) untuk diinspeksi pola dependen spasialnya.
Untuk tujuan interpolasi kriging, variogram eksperimental didekati menggunakan model variogram teoretis yang memiliki parameter karakteristik: nugget, sill, dan range:
Model teoretis yang umum dipakai antara lain:
\[ \gamma(h) = \begin{cases} \text{nugget} + (\text{sill}-\text{nugget})\Big[\dfrac{3h}{2a} - \dfrac{1}{2}\Big(\dfrac{h}{a}\Big)^3\Big], & 0 \le h \le a \ \text{sill}, & h > a \end{cases} \]
di mana \(a\) adalah range efektif.
\[ \gamma(h) = \text{nugget} + (\text{sill}-\text{nugget})(1 - e^{-h/a}) \]
\[ \gamma(h) = \text{nugget} + (\text{sill}-\text{nugget})(1 - e^{-h^2/a^2}) \]
Pemilihan model didasarkan pada kombinasi inspeksi visual (fit kurva terhadap variogram eksperimental) dan kriteria numerik. Selain kecocokan statistik, pemilihan juga harus mempertimbangkan interpretasi fisika/spasial fenomena yang sedang dipelajari (Isaaks & Srivastava, 1989).
Inverse Distance Weighting (IDW) adalah metode interpolasi deterministik yang memperkirakan nilai pada lokasi tak teramati sebagai rata-rata tertimbang nilai titik pengamatan sekitarnya, dengan bobot berbanding terbalik terhadap jarak. Secara matematis:
\[ \hat{Z}(s_0) = \frac{\sum_{i=1}^n w_i, Z(s_i)}{\sum_{i=1}^n w_i}, \qquad w_i = \frac{1}{d(s_0,s_i)^p}, \]
di mana \(d(s_0,s_i)\) adalah jarak antara lokasi prediksi \(s_0\) dan titik pengamatan \(s_i\), dan \(p\) adalah parameter pangkat (power) yang mengontrol penurunan bobot terhadap jarak (Shepard, 1968). Kelebihan IDW adalah kesederhanaan dan transparansi; keterbatasannya termasuk asumsi isotropi dan tidak ada model eksplisit untuk ketidakpastian prediksi seperti variansi prediksi.
Data yang digunakan dalam penelitian ini merupakan data sekunder yang diperoleh dari sumber resmi yaitu Portal Data Jawa Tengah dan Badan Pusat Statistik (BPS). Variabel dependen yang digunakan adalah jumlah kasus Tuberkulosis (TBC) di setiap kabupaten/kota, sedangkan variabel independennya meliputi jumlah fasilitas kesehatan (x1), jumlah penderita diabetes mellitus (x2), kepadatan penduduk per km2 (x3), persentase penduduk miskin (x4), persentase air minum layak (x5), dan persentase sanitasi layak (x6). Data yang dikumpulkan mencerminkan kondisi sosial, ekonomi, dan kesehatan masyarakat di Provinsi Jawa Tengah pada tahun 2024.
Unit spasial yang digunakan dalam penelitian ini adalah wilayah administratif tingkat kabupaten/kota di Provinsi Jawa Tengah. Setiap unit spasial direpresentasikan dalam bentuk poligon pada peta digital (shapefile), yang berfungsi untuk menganalisis hubungan spasial antarwilayah. Pemilihan unit ini didasarkan pada ketersediaan data dan peran kabupaten/kota sebagai pelaksana utama program pengendalian penyakit TBC di tingkat daerah.
Analisis yang digunakan terdiri atas analisis deskriptif spasial, autokorelasi spasial, dan model ekonometrika spasial. Analisis deskriptif dilakukan untuk memvisualisasikan persebaran kasus TBC di Jawa Tengah. Autokorelasi spasial dihitung menggunakan Global Moran’s I untuk mendeteksi pola sebaran secara keseluruhan dan Local Moran’s I (LISA) untuk mengidentifikasi klaster signifikan antarwilayah. Selanjutnya, dilakukan pemodelan menggunakan Spatial Autoregressive Model (SAR) dan Spatial Error Model (SEM) untuk menganalisis pengaruh variabel independen terhadap jumlah kasus TBC dengan mempertimbangkan efek spasial, serta membandingkan model mana yang memberikan hasil paling sesuai.
Penelitian ini diawali dengan pengumpulan dan pengolahan data sekunder dari sumbe-sumber resmi, kemudian dilakukan penyusunan peta dan pembentukan matriks pembobot spasial (spatial weights matrix). Selanjutnya dilakukan analisis autokorelasi spasial untuk mendeteksi adanya ketergantungan spasial antarwilayah. Setelah itu dilakukan pemodelan menggunakan model SAR dan SEM untuk mengetahui faktor-faktor yang memengaruhi jumlah kasus TBC. Tahap akhir penelitian adalah interpretasi hasil analisis, penarikan kesimpulan, dan penyusunan rekomendasi kebijakan berbasis spasial untuk penanggulangan TBC di Jawa Tengah.
## Reading layer `gadm41_IDN_2' from data source
## `E:\Backup Window\Documents\Tugas Kuliah\Semester 5\Spasial\gadm41_IDN_shp\gadm41_IDN_2.shp'
## using driver `ESRI Shapefile'
## Simple feature collection with 502 features and 13 fields
## Geometry type: MULTIPOLYGON
## Dimension: XY
## Bounding box: xmin: 95.00971 ymin: -11.00761 xmax: 141.0194 ymax: 6.076941
## Geodetic CRS: WGS 84
## [1] "Jumlah Kab/Kota di shapefile: 36"
## [1] "Daftar Kab/Kota di shapefile:"
## [1] "Banjarnegara" "Banyumas" "Batang" "Blora"
## [5] "Boyolali" "Brebes" "Cilacap" "Demak"
## [9] "Grobogan" "Jepara" "Karanganyar" "Kebumen"
## [13] "Kendal" "Klaten" "Kota Magelang" "Kota Pekalongan"
## [17] "Kota Semarang" "Kota Tegal" "Kudus" "Magelang"
## [21] "Pati" "Pekalongan" "Pemalang" "Purbalingga"
## [25] "Purworejo" "Rembang" "Salatiga" "Semarang"
## [29] "Sragen" "Sukoharjo" "Surakarta" "Tegal"
## [33] "Temanggung" "Waduk Kedungombo" "Wonogiri" "Wonosobo"
## [1] "Jumlah data TBC: 35"
## [1] "Daftar Kab/Kota di data TBC:"
## [1] "Banjarnegara" "Banyumas" "Batang" "Blora" "Boyolali"
## [6] "Brebes" "Cilacap" "Demak" "Grobogan" "Jepara"
## [11] "Karanganyar" "Kebumen" "Kendal" "Klaten" "Kudus"
## [16] "Magelang" "Pati" "Pekalongan" "Pemalang" "Purbalingga"
## [21] "Purworejo" "Rembang" "Salatiga" "Semarang" "Sragen"
## [26] "Sukoharjo" "Surakarta" "Tegal" "Temanggung" "Wonogiri"
## [31] "Wonosobo"
## [1] "Kab/Kota yang ada di shapefile tapi TIDAK ada di data:"
## [1] "Kota Magelang" "Kota Pekalongan" "Kota Semarang" "Kota Tegal"
## [5] "Waduk Kedungombo"
## [1] "Jumlah Kab/Kota setelah filter: 31"
## [1] "Jumlah data yang berhasil di-join: 35"
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 662 1374 1866 2478 2776 6992