Ujian Akhir Semester - Epidemiologi
Analisis Epidemiologi Kasus Kronis Filariasis di Jawa Barat Tahun 2024
Ditujukan Untuk Memenuhi Tugas UAS Mata Kuliah Epidemiologi
Dosen Pengampu:
Dr. I Gede Nyoman Mindra Jaya, M.Si
Disusun oleh:
Nadwah Khairunnisa (140610230034)
PROGRAM STUDI S1 STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS PADJADJARAN
JATINANGOR
2025
knitr::opts_chunk$set(
echo = FALSE,
warning = FALSE,
message = FALSE,
fig.align = "center",
fig.width = 7,
fig.height = 5,
dpi = 96,
out.width = "95%"
)

Abstrak

Filariasis merupakan penyakit menular yang dapat menyebabkan kecacatan kronis dan berdampak pada kualitas hidup serta produktivitas masyarakat. Studi ini melakukan mini project analisis epidemiologi filariasis kronis di Provinsi Jawa Barat pada unit analisis kabupaten/kota (\(n = 27\)). Analisis mencakup: (i) ukuran frekuensi kejadian dan keparahan (count, rate per 10.000 penduduk, mortalitas, CFR), (ii) ukuran asosiasi sederhana berbasis tabel \(2\times2\) (RR, OR, AR/RD, AF) untuk faktor sosial-lingkungan terpilih, (iii) Standardized Incidence Ratio (SIR) untuk membandingkan observed vs expected, (iv) pemetaan tematik dan zona risiko terpadu, (v) pemodelan count (Poisson vs Negative Binomial) serta (vi) uji dan pemodelan spasial (Moran, Geary, LISA, Getis–Ord \(Gi^*\), OLS dan model spasial—SLX/SAR/SEM/SDM/SDEM/SAC/GNS).

Hasil ringkas tingkat provinsi menunjukkan total populasi 50.345.190, total kasus kronis 262, dan total kematian 65 dengan rate 0,052 per 10.000 serta CFR 24,8%. Pada analisis spasial global untuk rate filariasis, Moran’s \(I\) menunjukkan kecenderungan pengelompokan (\(p \approx 0{,}052\)) dan Geary’s \(C\) signifikan (\(p \approx 0{,}038\)). Perbandingan model spasial berbasis AIC mengindikasikan model terbaik adalah SEM. Temuan ini menegaskan pentingnya pendekatan epidemiologi-spasial untuk memahami heterogenitas risiko antarwilayah dan mendukung penentuan prioritas intervensi.


Bab 1. Pendahuluan

1.1 Latar Belakang

Filariasis limfatik (lymphatic filariasis), sering dikenal sebagai elephantiasis, adalah penyakit parasit yang ditularkan melalui gigitan nyamuk yang membawa larva cacing filaria. Infeksi umumnya terjadi sejak masa kanak-kanak dan dapat menimbulkan kerusakan sistem limfatik yang bersifat “tersembunyi” dalam jangka panjang; manifestasi yang terlihat seperti limfedema/elefantiasis atau hidrokel pada laki-laki sering muncul kemudian pada usia dewasa. Kondisi-kondisi tersebut berpotensi menyebabkan pembengkakan menetap, keterbatasan aktivitas, nyeri berulang, infeksi sekunder, dan disabilitas kronis. Dampak lanjutannya tidak hanya medis, tetapi juga sosial dan ekonomi: stigma, penurunan partisipasi pendidikan/kerja, hingga beban biaya rumah tangga.

Dari perspektif kesehatan masyarakat, beban filariasis kronis memiliki dua karakter penting. Pertama, filariasis merupakan NTD yang kuat keterkaitannya dengan kemiskinan, lingkungan permukiman, dan ketersediaan infrastruktur sanitasi. Wilayah dengan kualitas perumahan rendah, kepadatan tertentu, drainase buruk, serta akses air bersih dan sanitasi yang tidak memadai cenderung menyediakan kondisi yang lebih mendukung habitat vektor serta meningkatkan peluang paparan gigitan nyamuk. Kedua, kasus kronis adalah indikator “beban morbiditas” yang persisten: kasus kronis dapat tetap ada meskipun transmisi menurun, sehingga membutuhkan strategi pelayanan kesehatan yang berkelanjutan melalui morbidity management and disability prevention (MMDP) untuk mengurangi disabilitas, mencegah komplikasi, dan meningkatkan kualitas hidup.

Di Jawa Barat, heterogenitas antar kabupaten/kota berpotensi menciptakan perbedaan risiko yang nyata. Perbedaan tersebut dapat berkaitan dengan indikator determinan kesehatan seperti:

  • Sanitasi layak (X1) yang mencerminkan kualitas lingkungan dan potensi pengelolaan tempat perindukan vektor secara tidak langsung,
  • Rumah layak huni (X2) yang mencerminkan kualitas hunian dan perlindungan terhadap paparan vektor (misalnya ventilasi, kerapatan bangunan, kondisi dinding/atap),
  • Rasio puskesmas terhadap penduduk (X3) sebagai proksi akses layanan kesehatan yang berpengaruh pada deteksi, pencatatan, tata laksana, dan pelaporan kasus kronis,
  • Persentase penduduk miskin (X4) sebagai determinan sosial yang berkaitan dengan kerentanan, keterbatasan pencegahan, dan keterbatasan akses layanan.

Walaupun program eliminasi filariasis menekankan penghentian transmisi, dalam praktik kebijakan kesehatan daerah masih dibutuhkan informasi yang lebih operasional: wilayah mana yang relatif lebih berisiko dan determinannya apa. Analisis epidemiologi berbasis wilayah (kab/kota) memberikan manfaat karena:

  1. Memetakan beban (berapa banyak kasus dan laju per penduduk),
  2. Mengidentifikasi determinan wilayah yang mungkin dapat menjadi prioritas intervensi lintas sektor (sanitasi, perumahan, kemiskinan),
  3. Mengarahkan layanan kesehatan untuk penemuan kasus, perawatan, dan manajemen disabilitas pada area yang lebih membutuhkan.

Dalam kerangka pembangunan berkelanjutan, filariasis termasuk NTD yang secara eksplisit terkait dengan SDG 3 (Good Health and Well-being), khususnya target 3.3 yang menekankan pengendalian penyakit menular termasuk NTDs. (UN SDG 3.3) Selain itu, determinan yang diuji (sanitasi dan perumahan) memiliki irisan kebijakan dengan SDG 6 (air bersih dan sanitasi) dan SDG 1 (pengentasan kemiskinan) sebagai akar struktural kerentanan. Dari sudut pandang pembangunan, NTDs sering disebut sebagai “penyakit kemiskinan” karena berhubungan dengan akses layanan, lingkungan, dan kondisi sosial-ekonomi yang tertinggal. (World Bank Blogs)

Berdasarkan kebutuhan praktis dan perencanaan program, terdapat setidaknya tiga celah yang umum muncul pada analisis penyakit menular berbasis wilayah:

  1. Dominasi pelaporan deskriptif: sering berhenti pada “jumlah kasus per wilayah” tanpa mengaitkan determinan sosial–lingkungan secara sistematis.
  2. Kurangnya standardisasi risiko: perbandingan antarwilayah sering bias oleh ukuran populasi; SIR membantu membandingkan kejadian teramati terhadap ekspektasi berdasarkan tingkat referensi.
  3. Keterbatasan pemeriksaan pola spasial: wilayah bertetangga berpotensi berbagi karakter lingkungan dan mobilitas; menguji apakah laju kasus membentuk klaster dapat memperkuat prioritisasi intervensi berbasis area.

Dengan demikian, penelitian ini berupaya menyusun laporan epidemiologi yang lebih komprehensif (teori → metodologi → hasil pada Bab 4), dengan tetap menjaga interpretasi sesuai desain area-level (ekologis) dan menghindari klaim kausal individual.

1.2 Rumusan Masalah

  1. Bagaimana konsep agent–host–environment menjelaskan terjadinya filariasis dan manifestasi kronisnya pada tingkat populasi?

  2. Bagaimana ukuran epidemiologi (frekuensi, keparahan, asosiasi, dan standardisasi) digunakan untuk menggambarkan beban filariasis kronis pada unit kabupaten/kota?

  3. Bagaimana menyusun metodologi analisis yang menggabungkan ukuran epidemiologi dan analisis area untuk:

    1. mendeskripsikan distribusi kasus/laju,
    2. mengukur asosiasi determinan sosial–lingkungan,
    3. melakukan standardisasi risiko dan menyiapkan analisis pola area, serta
    4. menyiapkan pemodelan count/rate yang relevan untuk Bab 4?

1.3 Tujuan

1.3.1 Tujuan Umum

Menyusun kerangka analisis epidemiologi filariasis kronis di Jawa Barat pada tingkat kabupaten/kota untuk memahami beban kejadian, determinan wilayah, dan dasar pengambilan keputusan program.

1.3.2 Tujuan Khusus

  1. Menjelaskan proses terjadinya penyakit dengan kerangka epidemiologic triad (agent–host–environment) dan model penyebab multifaktor.
  2. Menetapkan ukuran kejadian penyakit (frekuensi dan keparahan) beserta rumus perhitungannya untuk outcome berbasis count dan laju per penduduk.
  3. Menetapkan ukuran asosiasi (tabel \(2\times2\): RR, OR, RD, AF) untuk variabel paparan yang relevan dan strategi penanganan sel nol.
  4. Menetapkan pendekatan standardisasi sederhana berbasis SIR (Observed/Expected) dan prinsip interval kepercayaan.
  5. Menyusun metodologi analisis area (termasuk pemeriksaan pola kedekatan/ketetanggaan sebagai konteks distribusi) yang akan diimplementasikan pada Bab 4.

Bab 2. Tinjauan Pustaka

2.1 Proses Terjadinya Penyakit

2.1.1 Konsep Agent–Host–Environment (Epidemiologic Triad)

Terjadinya penyakit pada manusia merupakan hasil interaksi agent, host, dan environment (segitiga epidemiologi). Kerangka ini membantu menjelaskan mengapa penyakit muncul pada populasi tertentu dan bagaimana pencegahan dilakukan melalui intervensi pada salah satu komponen.

1) Agent (Agen Penyebab)

Agen adalah faktor yang keberadaannya diperlukan agar penyakit dapat terjadi. Agen dapat berupa:

  • Biologis: bakteri, virus, jamur, parasit.
  • Kimia: racun, polutan, asap rokok.
  • Fisik: radiasi, trauma, suhu ekstrem.
  • Sosial/psikologis: stres, faktor perilaku.

Pada filariasis limfatik, agen utama adalah cacing filaria (Wuchereria bancrofti, Brugia spp.) yang ditularkan melalui nyamuk sebagai vektor. Manifestasi kronis seperti limfedema/elefantiasis berkaitan dengan kerusakan sistem limfatik serta inflamasi berulang. (WHO Fact Sheet)

2) Host (Pejamu)

Host adalah individu atau populasi yang menjadi tempat agen hidup dan berkembang. Kerentanan host dipengaruhi oleh:

  • faktor genetik,
  • umur dan jenis kelamin,
  • status gizi dan imunitas,
  • perilaku yang meningkatkan paparan vektor,
  • akses pencegahan dan layanan kesehatan.

3) Environment (Lingkungan)

Lingkungan mencakup kondisi eksternal yang memengaruhi hubungan host–agent, meliputi:

  • fisik: iklim, sanitasi, perumahan, drainase, genangan,
  • biologis: keberadaan vektor dan habitat vektor,
  • sosial: kepadatan penduduk, kemiskinan, budaya, akses layanan.

Pada unit kab/kota, variabel seperti persentase sanitasi layak (X1), kualitas rumah (X2), kemiskinan (X4), dan rasio puskesmas (X3) dapat dipandang sebagai indikator determinan sosial–lingkungan yang berpotensi memengaruhi paparan vektor, kerentanan, serta kemampuan deteksi dan tata laksana kasus.

2.1.2 Model Penyebab Penyakit Multifaktor

Tidak semua penyakit disebabkan oleh satu faktor tunggal. Banyak penyakit bersifat multifaktorial, yaitu outcome muncul dari interaksi berbagai faktor risiko.

a) Web of Causation (Jaringan Sebab-Akibat)

Model ini memandang penyakit sebagai hasil interaksi kompleks dari banyak faktor yang saling terkait, bukan satu penyebab tunggal. Pada filariasis kronis, jaringan penyebab dapat melibatkan: intensitas paparan vektor, kondisi lingkungan yang mendukung vektor, kondisi sosial ekonomi, perilaku pencegahan, serta akses layanan kesehatan.

b) Sufficient-Component Cause (Rothman’s Causal Pie Model)

Model causal pie menjelaskan bahwa penyakit timbul bila seluruh komponen penyebab dalam satu “pai penyebab” terpenuhi; berbagai kombinasi komponen dapat menghasilkan penyakit yang sama. Konsep ini menekankan bahwa intervensi dapat dilakukan dengan “menghilangkan” salah satu komponen sehingga mekanisme cukup menjadi tidak lengkap.

c) Determinan Kesehatan

Determinannya dapat dikelompokkan menjadi:

  • biologis (umur, genetik),
  • perilaku (perlindungan dari gigitan vektor),
  • sosial ekonomi (pendidikan, pendapatan, pekerjaan),
  • lingkungan (sanitasi, perumahan),
  • akses layanan kesehatan.

Pada studi ini, variabel X merepresentasikan determinan sosial–lingkungan dan layanan kesehatan yang relevan terhadap risiko area dan kapasitas respons program.

2.2 Proses Transmisi dan Dinamika Penyakit

2.2.1 Rantai Penularan Penyakit Menular

Penularan penyakit menular mengikuti rantai:

  1. Agen
  2. Reservoir (manusia/hewan/lingkungan)
  3. Portal of exit (pintu keluar)
  4. Mode of transmission (cara penularan: kontak, droplet, airborne, vektor, dll.)
  5. Portal of entry (pintu masuk)
  6. Host rentan

Pada filariasis limfatik, mode penularan utama adalah vektor nyamuk. Pemutusan rantai dapat dilakukan melalui pencegahan gigitan nyamuk, pengendalian vektor, dan strategi pencegahan berbasis populasi. (WHO Fact Sheet)

2.2.2 Dinamika Penyakit dalam Populasi

Istilah penting epidemiologi populasi:

  • Sporadik: kasus jarang dan tidak berpola jelas.
  • Endemi: selalu ada dengan tingkat relatif konstan.
  • Epidemi/KLB (outbreak): peningkatan di atas baseline pada tempat dan waktu tertentu.
  • Pandemi: epidemi lintas negara/benua.
  • Eliminasi: penurunan hingga hampir tidak ada pada wilayah tertentu.
  • Eradikasi: penghilangan total dari dunia.

Untuk filariasis, WHO menekankan strategi eliminasi yang mencakup penghentian transmisi serta manajemen morbiditas dan pencegahan disabilitas. (WHO GPELF)

2.3 Ukuran Dasar Epidemiologi dan Rumus

Catatan: Bab 4 memuat nilai hasil perhitungan aktual. Bab 2 hanya memuat definisi dan rumus.

2.3.1 Kasus

  • Kasus baru (incident case): pertama kali terjadi/terdiagnosis pada periode tertentu.
  • Kasus lama (existing case): sudah ada sebelumnya dan masih ada pada periode observasi.

Pada data agregat kab/kota, “jumlah kasus kronis” merepresentasikan count kasus yang tercatat pada periode tertentu (sesuai definisi operasional sumber data).

2.3.2 Insidensi Kumulatif (Cumulative Incidence)

\[ CI = \frac{\text{Jumlah kasus baru selama periode}}{\text{Populasi berisiko pada awal periode}} \]

2.3.3 Incidence Rate (IR; berbasis person-time)

\[ IR = \frac{\text{Jumlah kasus baru}}{\sum \text{person-time berisiko}} \]

2.3.4 Laju per Penduduk (Rate per 10.000)

\[ Rate_{10k} = \frac{\text{Kasus}}{\text{Populasi}} \times 10{,}000 \]

2.3.5 Prevalensi

\[ P = \frac{\text{Kasus (baru + lama)}}{\text{Total populasi}} \]

2.3.6 Attack Rate

\[ AR_{attack} = \frac{\text{Kasus baru selama outbreak}}{\text{Populasi berisiko}} \times 100% \]

2.3.7 Mortalitas dan Case Fatality Rate (CFR)

Mortalitas per 10.000:

\[ MR_{10k} = \frac{\text{Jumlah kematian}}{\text{Populasi}} \times 10{,}000 \]

CFR:

\[ CFR = \frac{\text{Jumlah kematian akibat penyakit}}{\text{Jumlah kasus penyakit}} \times 100% \]

2.4 Ukuran Asosiasi (Rumus \(2\times2\))

Analisis asosiasi mengevaluasi hubungan antara paparan (exposure) dan outcome.

2.4.1 Tabel \(2\times2\)

Outcome (+) Outcome (-)
Terpapar (+) (a) (b)
Tidak terpapar (-) (c) (d)

Risiko pada terpapar dan tidak terpapar:

\[ Risk_E = \frac{a}{a+b},\qquad Risk_U = \frac{c}{c+d} \]

2.4.2 Relative Risk (RR)

\[ RR = \frac{Risk_E}{Risk_U} = \frac{\frac{a}{a+b}}{\frac{c}{c+d}} \]

2.4.3 Odds Ratio (OR)

\[ Odds_E = \frac{a}{b},\qquad Odds_U = \frac{c}{d} \]

\[ OR = \frac{Odds_E}{Odds_U} = \frac{ad}{bc} \]

2.4.4 Risk Difference (RD) / Attributable Risk (AR)

\[ RD = Risk_E - Risk_U \]

2.4.5 Attributable Fraction pada Terpapar (AF\(_E\))

\[ AF_E = \frac{RR - 1}{RR} \]

2.5 Standardisasi Risiko: SIR (Observed/Expected)

Standardisasi digunakan agar perbandingan antarwilayah lebih adil terhadap perbedaan ukuran populasi.

\[ SIR_i = \frac{O_i}{E_i} \]

dengan \(O_i\) adalah kejadian teramati pada wilayah \(i\), dan \(E_i\) adalah kejadian yang diharapkan berdasarkan tingkat referensi.

Jika \(r_{ref}\) adalah laju referensi (mis. laju provinsi), maka:

\[ r_{ref} = \frac{\sum_i O_i}{\sum_i Pop_i} \]

\[ E_i = Pop_i \times r_{ref} \]

Interpretasi:

  • \(SIR > 1\): lebih tinggi dari ekspektasi,
  • \(SIR < 1\): lebih rendah dari ekspektasi,
  • signifikansi sering dinilai dengan CI 95% yang tidak memotong 1.

Bab 3. Metodologi

3.1 Desain dan Unit Analisis

Studi ini merupakan analisis kuantitatif berbasis data agregat wilayah (ecological/area-level study) dengan unit analisis kabupaten/kota di Provinsi Jawa Barat (27 unit). Kerangka analisis menekankan:

  1. Deskripsi kejadian filariasis kronis (count dan rate),
  2. Ukuran keparahan (mortalitas dan CFR),
  3. Asosiasi sederhana berbasis pengelompokan paparan (tabel \(2\times2\)),
  4. Standardisasi risiko (SIR) untuk membandingkan wilayah,
  5. Penyiapan pemodelan count/rate (Bab 4) untuk mendukung pemetaan risiko.

Catatan interpretasi: desain area-level tidak dapat menyimpulkan kausalitas pada level individu (ecological fallacy), sehingga hasil ditafsirkan sebagai asosiasi tingkat wilayah.

3.2 Sumber Data dan Bahan

  1. Data tabular (Excel) Berisi outcome filariasis kronis, kematian, populasi, dan variabel determinan (X1–X4).

  2. Data spasial (Shapefile batas administrasi) Poligon kabupaten/kota Jawa Barat sebagai basis pemetaan dan pembentukan struktur ketetanggaan antarwilayah (untuk konteks distribusi).

3.3 Definisi Operasional Variabel

3.3.1 Variabel Outcome (Y)

  • \(Y_{count}\): jumlah kasus kronis filariasis pada wilayah \(i\).
  • \(Y_{rate}\): laju kasus per 10.000 penduduk:

\[ Y_{rate,i} = \frac{Y_{count,i}}{Pop_i}\times 10{,}000 \]

  • \(D_i\): jumlah kematian akibat kasus kronis filariasis pada wilayah \(i\).

Ukuran keparahan:

\[ MR_{10k,i} = \frac{D_i}{Pop_i}\times 10{,}000 \]

\[ CFR_i = \frac{D_i}{Y_{count,i}}\times 100% \]

3.3.2 Variabel Prediktor/Paparan (X)

  • \(X_1\): persentase sanitasi layak (%)
  • \(X_2\): persentase rumah layak huni (%)
  • \(X_3\): rasio puskesmas terhadap penduduk
  • \(X_4\): persentase penduduk miskin (%)

Relevansi konseptual: filariasis sebagai NTD memiliki keterkaitan kuat dengan kondisi kemiskinan dan keterbatasan infrastruktur dasar, serta membutuhkan penguatan layanan kesehatan untuk manajemen morbiditas dan pencegahan disabilitas. (WHO MMDP)

3.4 Alur Analisis (Tanpa Menampilkan Nilai Hasil)

3.4.1 Praproses Data

  1. Membaca data tabular dan memastikan variabel numerik bersih (mis. persen, koma desimal).
  2. Membaca shapefile dan memastikan geometri valid.
  3. Membuat join key melalui normalisasi nama wilayah, lalu melakukan penggabungan data tabular ke poligon.
  4. Validasi kelengkapan: tidak ada wilayah dengan \(Pop_i\), \(Y_{count,i}\), atau \(Y_{rate,i}\) yang hilang setelah proses join.

3.4.2 Ukuran Frekuensi dan Keparahan

Untuk setiap kab/kota dihitung:

  • \(Y_{count}\),
  • \(Y_{rate}\),
  • \(MR_{10k}\),
  • \(CFR\).

Semua rumus telah dirinci pada Bab 2 dan nilai aktual ditampilkan pada Bab 4.

3.4.3 Ukuran Asosiasi (Tabel \(2\times2\))

a) Definisi outcome biner

Untuk membentuk tabel \(2\times2\), outcome dikonversi menjadi biner, misalnya:

  • Any case: \(Y_{count} > 0\), atau
  • High rate: \(Y_{rate} \ge \text{median}(Y_{rate})\).

b) Kategorisasi paparan

Paparan dibinerkan dengan cutpoint (umumnya median):

  • Sanitasi rendah: \(X_1 < \text{median}(X_1)\),
  • Kemiskinan tinggi: \(X_4 \ge \text{median}(X_4)\).

c) Perhitungan RR, OR, RD, AF

\[ RR=\frac{\frac{a}{a+b}}{\frac{c}{c+d}},\quad OR=\frac{ad}{bc},\quad RD=\frac{a}{a+b}-\frac{c}{c+d},\quad AF_E=\frac{RR-1}{RR} \]

Jika ada sel nol, gunakan koreksi 0.5 dan pertimbangkan uji Fisher.

3.4.4 Standardisasi Risiko (SIR)

  1. Tetapkan laju referensi provinsi:

\[ r_{ref} = \frac{\sum_i O_i}{\sum_i Pop_i} \]

  1. Hitung expected:

\[ E_i = Pop_i \times r_{ref} \]

  1. Hitung SIR:

\[ SIR_i = \frac{O_i}{E_i} \]

3.4.5 Pemodelan Count untuk Bab 4 (Poisson vs Negative Binomial)

Karena \(Y_{count}\) adalah data count, model dasar adalah Poisson dengan offset \(\log(Pop_i)\).

a) Model Poisson

\[ Y_i \sim \text{Poisson}(\mu_i) \]

\[ \log(\mu_i)=\beta_0+\beta_1X_{1i}+\beta_2X_{2i}+\beta_3X_{3i}+\beta_4X_{4i}+\log(Pop_i) \]

Offset \(\log(Pop_i)\) menyesuaikan ukuran populasi sehingga interpretasi mendekati model laju.

b) Overdispersion dan Negative Binomial

Jika \(\mathrm{Var}(Y_i) \gg \mathbb{E}(Y_i)\), model Poisson dapat kurang sesuai karena overdispersion. Alternatifnya Negative Binomial (NB) yang mengakomodasi overdispersion, sehingga dapat memberikan estimasi varians yang lebih realistis.


Bab. 4 Hasil dan Pembahasan

4.1 Konfigurasi Analisis

# ============================================================
# KONFIGURASI
# ============================================================
options(scipen = 999)

SCALE_RATE <- 10000
ALPHA_SIG  <- 0.05

# Outcome biner untuk analisis asosiasi 2x2:
# "any_case"  = kasus > 0
# "high_rate" = rate >= median(rate)
ASSOC_OUTCOME <- "any_case"

# Cutpoint paparan (default median)
CUTPOINT_METHOD <- "median"  # "median" / "custom"
CUT_SANITASI    <- NA_real_
CUT_MISKIN      <- NA_real_

Interpretasi:

  • Semua rate dinyatakan per 10.000 penduduk agar mudah dibandingkan antarwilayah.
  • Outcome asosiasi dipilih any_case (kasus > 0), sehingga analisis 2×2 menjawab “wilayah punya kasus atau tidak”.

4.2 Paket dan Fungsi Bantu

4.3 Input Data: Shapefile dan Excel

4.3.1 Path dan Working Directory

4.3.2 Load shapefile

## Jumlah entitas spasial (SHP): 27

4.3.3 Load Excel dan validasi kolom

## Jumlah baris Excel: 27

4.4 Pembersihan Data Epidemiologi (Epi Cleaning)

## 
## N wilayah (Excel valid): 27

Interpretasi: Analisis dilakukan pada 27 kabupaten/kota di Provinsi Jawa Barat (hasil validasi: jumlah entitas shapefile = 27 dan baris Excel valid = 27). Proses join data spasial–tabular berhasil sempurna (mismatch = 0), sehingga seluruh wilayah memiliki nilai populasi, kasus, dan laju (rate/inc) yang lengkap untuk dianalisis lebih lanjut.

4.5 Ukuran Epidemiologi (Frekuensi + Keparahan)

## 
## Ringkasan selisih rate (rate excel - hitung):
##                     Min.                  1st Qu.                   Median 
## -0.000000000000000166533 -0.000000000000000010408  0.000000000000000001735 
##                     Mean                  3rd Qu.                     Max. 
##  0.000000000000000015034  0.000000000000000034694  0.000000000000000249800
## 
## === RINGKASAN PROVINSI ===
## # A tibble: 1 × 6
##   pop_total kasus_total mati_total inc10k_prov mort10k_prov cfr_prov
##       <dbl>       <dbl>      <dbl>       <dbl>        <dbl>    <dbl>
## 1  50345190         262         65      0.0520       0.0129     24.8

Secara total provinsi, diperoleh:

  • Populasi total = 50.345.190
  • Kasus kronis total = 262
  • Meninggal = 65
  • Insidensi (rate) provinsi per 10.000 = 0,0520
  • Mortalitas per 10.000 = 0,0129
  • CFR (%) = 24,8%

Interpretasi: beban filariasis kronis pada level provinsi tergolong rendah dari sisi laju kejadian (0,052 per 10.000), namun keparahan relatif tinggi karena CFR 24,8% (proporsi kematian di antara kasus yang tercatat). Ini mengindikasikan bahwa kasus yang muncul cenderung merupakan kasus kronis/berat atau proses pencatatan kematian pada kasus kronis cukup besar. * Selisih rate ~ 0 → angka rate Excel konsisten dengan rumus (kasus/pop × 10.000). * CFR 24,8% perlu dicatat sebagai temuan penting (potensi definisi “kematian pada kasus kronis” atau seleksi kasus berat).

4.6 Join Data Spasial (SHP) + Tabular (Excel)

##   total miss_pop miss_kasus miss_rate
## 1    27        0          0         0

Interpretasi: Join spasial sukses total → semua peta dan analisis spasial bisa dilakukan tanpa kehilangan wilayah.

4.7 Statistik Deskriptif dan Visualisasi

## 
## === SUMMARY DESKRIPTIF ===
##     Y_jumlah          Y_rate              X1               X2       
##  Min.   : 0.000   Min.   :0.00000   Min.   : 34.56   Min.   :32.83  
##  1st Qu.: 4.000   1st Qu.:0.03064   1st Qu.: 83.67   1st Qu.:43.49  
##  Median : 6.000   Median :0.05104   Median : 95.78   Median :61.91  
##  Mean   : 9.704   Mean   :0.05794   Mean   : 89.45   Mean   :58.72  
##  3rd Qu.:15.500   3rd Qu.:0.08107   3rd Qu.: 98.55   3rd Qu.:72.64  
##  Max.   :29.000   Max.   :0.16405   Max.   :100.00   Max.   :85.78  
##        X3              X4        
##  Min.   :16.21   Min.   : 2.340  
##  1st Qu.:35.04   1st Qu.: 6.360  
##  Median :42.80   Median : 8.410  
##  Mean   :43.54   Mean   : 8.014  
##  3rd Qu.:53.06   3rd Qu.:10.185  
##  Max.   :66.42   Max.   :11.930

Ringkasan statistik (27 wilayah) menunjukkan:

  • Jumlah kasus (COUNT): min 0, median 6, mean 9,704, max 29
  • Rate/inc per 10.000 (Y_rate): min 0,00000, median 0,05104, mean 0,05794, max 0,16405
  • Sanitasi layak (X1, %): min 34,56, median 95,78, mean 89,45, max 100
  • Rumah layak huni (X2, %): min 32,83, median 61,91, mean 58,72, max 85,78
  • Rasio puskesmas/penduduk (X3): min 16,21, median 42,80, mean 43,54, max 66,42
  • Penduduk miskin (X4, %): min 2,34, median 8,41, mean 8,01, max 11,93

Interpretasi: distribusi kasus menunjukkan sebagian wilayah memiliki kasus rendah–sedang (median 6) namun ada wilayah dengan beban tinggi (maks 29). Variasi Y_rate juga cukup nyata (maks 0,16405), sehingga pemetaan dan analisis spasial relevan.

1) Jumlah Kasus

Peta Y_jumlah (COUNT) memperlihatkan kelas tertinggi berada pada rentang 16,8 – 29,0 kasus. Interpretasi utama peta count: beberapa kabupaten/kota menjadi kontributor besar jumlah kasus absolut. Namun karena count dipengaruhi ukuran populasi, peta ini perlu selalu dibaca bersama peta rate.

2) Rate/Insidensi Kasus per 10.000

Peta rate/inc per 10.000 memperlihatkan kelas tertinggi berada pada rentang 0,086 – 0,164. Ini menandai wilayah dengan risiko relatif lebih tinggi setelah “dikontrol” oleh populasi (lebih adil untuk perbandingan antarwilayah). Secara interpretatif, wilayah dalam kelas tertinggi adalah prioritas untuk investigasi faktor risiko/lingkungan karena peningkatan rate tidak semata akibat populasi besar.

3) X1 — Sanitasi Layak (%)

Pada peta X1, rentang kelas terbawah 34,6–77,6% hingga tertinggi 99,1–100% menunjukkan ketimpangan akses sanitasi antardaerah. Interpretasi: wilayah dengan sanitasi lebih rendah berpotensi memiliki kondisi lingkungan yang lebih mendukung transmisi penyakit berbasis vektor/lingkungan, tetapi kesimpulan kausal tidak bisa ditarik dari peta tunggal—perlu dibuktikan melalui ukuran asosiasi/model.

4) X2 — Rumah Layak Huni (%)

Rentang 32,83–85,78% menggambarkan variasi kualitas hunian. Wilayah dengan X2 rendah dapat berkorelasi dengan kerentanan struktural (kondisi rumah/lingkungan), tetapi tetap perlu diuji.

5) X3 — Rasio Puskesmas/Penduduk

Nilai X3 berkisar 16,21–66,42. Interpretasi: wilayah dengan rasio lebih tinggi bisa mencerminkan akses layanan lebih baik (potensi deteksi lebih baik) atau distribusi fasilitas yang lebih merata. Efeknya pada kasus bisa dua arah: meningkatkan pelaporan (terlihat naik) atau menurunkan kejadian (pencegahan/penanganan lebih baik).

6) X4 — Penduduk Miskin (%)

Rentang 2,34–11,93% menunjukkan variasi kemiskinan. Wilayah dengan kemiskinan lebih tinggi sering menjadi indikator kerentanan sosial—yang mungkin memengaruhi paparan, akses layanan, atau ketahanan lingkungan.

4.8 Ukuran Asosiasi 2×2 (RR, OR, AR, AF + Fisher)

## 
## ================= UKURAN ASOSIASI (2x2) =================
## Outcome biner: any_case
## 
## --- 2x2: Kemiskinan tinggi (E+) ---
##           Outcome+ Outcome-
## Exposed         14        0
## Unexposed       12        1
## RR: 1.083333  (95% CI: 0.8825642 - 1.328138 )
## OR: 3.48  (95% CI: 0.1297926 - 93.30578 )
## AR (RD): 0.07692308  | AF exposed: 0.07692308
## Fisher p-value: 0.4814815  | CC dipakai?: TRUE
## 
## --- 2x2: Sanitasi rendah (E+) ---
##           Outcome+ Outcome-
## Exposed         12        1
## Unexposed       14        0
## RR: 0.9230769  (95% CI: 0.7529338 - 1.133062 )
## OR: 0.2873563  (95% CI: 0.01071745 - 7.704599 )
## AR (RD): -0.07692308  | AF exposed: -0.08333333
## Fisher p-value: 0.4814815  | CC dipakai?: TRUE
## 
## [epitools] Skip Kemiskinan karena ada sel 0 → gunakan CC(0.5) + Fisher.
## 
## [epitools] Skip Sanitasi karena ada sel 0 → gunakan CC(0.5) + Fisher.

Outcome biner yang digunakan adalah any_case (wilayah dikodekan “Outcome+” jika kasus > 0).

4.8.1 Asosiasi Kemiskinan Tinggi (E+) terhadap Kejadian Kasus (any_case)

Tabel 2×2 (Kemiskinan tinggi sebagai paparan):

  • Exposed: Outcome+ = 14, Outcome- = 0
  • Unexposed: Outcome+ = 12, Outcome- = 1

Hasil ukuran asosiasi:

  • RR = 1,0833 (95% CI 0,8826 – 1,3281)
  • OR = 3,48 (95% CI 0,1298 – 93,3058)
  • AR/RD = 0,0769
  • AF pada terpapar = 0,0769
  • Fisher p-value = 0,4815
  • Ada sel nol → dipakai continuity correction (0,5) untuk stabilitas OR/RR CI.

Interpretasi: arah efek menunjukkan wilayah kemiskinan tinggi cenderung memiliki peluang/risiko lebih tinggi untuk memiliki kasus (RR > 1 dan OR > 1), tetapi tidak signifikan (p = 0,4815 dan CI RR melintasi 1). Lebarnya CI OR (sangat lebar) menunjukkan ketidakpastian tinggi akibat struktur tabel yang sangat tidak seimbang (sel nol).

4.8.2 Asosiasi Sanitasi Rendah (E+) terhadap Kejadian Kasus (any_case)

Tabel 2×2 (Sanitasi rendah sebagai paparan):

  • Exposed: Outcome+ = 12, Outcome- = 1
  • Unexposed: Outcome+ = 14, Outcome- = 0

Hasil ukuran asosiasi:

  • RR = 0,9231 (95% CI 0,7529 – 1,1331)
  • OR = 0,2874 (95% CI 0,0107 – 7,7046)
  • AR/RD = -0,0769
  • AF pada terpapar = -0,0833
  • Fisher p-value = 0,4815
  • Ada sel nol → dipakai continuity correction (0,5).

Interpretasi: arah efek justru menunjukkan sanitasi rendah tampak tidak meningkatkan kejadian kasus pada definisi outcome “any_case” (RR < 1), namun ini tidak signifikan (p = 0,4815; CI melintasi 1) dan ketidakpastian besar (CI OR sangat lebar). Secara epidemiologis, hasil seperti ini bisa muncul karena outcome yang terlalu “kasar” (sekadar ada/tidak ada kasus) atau karena jumlah wilayah outcome- sangat sedikit (hanya 1 wilayah), sehingga analisis 2×2 menjadi kurang informatif.

4.9 SIR (Observed/Expected) + CI 95% + Signifikansi

## 
## Top 10 inc10k tertinggi:
##            join_key     inc10k      SIR      SIR_sig
## 1     KOTA SUKABUMI 0.16405097 3.152358   Signif > 1
## 2        MAJALENGKA 0.11829595 2.273142   Signif > 1
## 3            SUBANG 0.10822771 2.079674   Signif > 1
## 4       PANGANDARAN 0.09214467 1.770626 Tidak signif
## 5       TASIKMALAYA 0.08849926 1.700577 Tidak signif
## 6      KOTA CIREBON 0.08699435 1.671659 Tidak signif
## 7          KARAWANG 0.08221173 1.579758 Tidak signif
## 8  KOTA TASIKMALAYA 0.07992221 1.535763 Tidak signif
## 9          SUKABUMI 0.07425690 1.426900 Tidak signif
## 10           BEKASI 0.07025325 1.349967 Tidak signif

4.10 Zona Risiko Terpadu (Insidensi × Kemiskinan)

## 
## Distribusi zona risiko:
## 
## Zona 1: Ins tinggi + Miskin tinggi Zona 2: Ins tinggi + Miskin rendah 
##                                  8                                  6 
## Zona 3: Ins rendah + Miskin tinggi Zona 4: Ins rendah + Miskin rendah 
##                                  6                                  7

4.11 Model Count: Poisson vs Negative Binomial dan Prediksi Risiko

## 
## Dispersion ratio (Poisson): 3.374
## Overdispersion → pakai Negative Binomial.
## 
## === SUMMARY MODEL FINAL (COUNT) ===
## 
## Call:
## MASS::glm.nb(formula = kasus ~ X1 + X2 + X3 + X4 + offset(log_pop), 
##     data = dat_model, init.theta = 4.658809267, link = log)
## 
## Coefficients:
##               Estimate Std. Error z value            Pr(>|z|)    
## (Intercept) -12.546689   1.014669 -12.365 <0.0000000000000002 ***
## X1            0.004570   0.009455   0.483               0.629    
## X2            0.004248   0.008037   0.529               0.597    
## X3           -0.010535   0.010604  -0.993               0.321    
## X4            0.030680   0.045611   0.673               0.501    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for Negative Binomial(4.6588) family taken to be 1)
## 
##     Null deviance: 32.933  on 26  degrees of freedom
## Residual deviance: 29.565  on 22  degrees of freedom
## AIC: 169.42
## 
## Number of Fisher Scoring iterations: 1
## 
## 
##               Theta:  4.66 
##           Std. Err.:  2.06 
## 
##  2 x log-likelihood:  -157.416
## 
## VIF (Poisson baseline):
##       X1       X2       X3       X4 
## 1.266385 1.451815 1.245398 1.232339
## 
## Dispersion test (Poisson baseline):
## 
##  Overdispersion test
## 
## data:  m_pois
## z = 3.5028, p-value = 0.0002302
## alternative hypothesis: true dispersion is greater than 1
## sample estimates:
## dispersion 
##   2.691178
## 
## Ringkasan prediksi rate (pred_inc10k):
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
## 0.04182 0.04648 0.05030 0.05690 0.06866 0.08384

4.12 Pemetaan Tematik (tmap) — Warna Stabil saat Knit

4.13 Intepretasi SIR, Zona Risiko Terpadu, Model, Prediksi Risiko, dan Pemetaan

4.13.1 Standardized Incidence Ratio (SIR) dan Signifikansi (CI 95%)

SIR dihitung sebagai Observed/Expected, dengan expected berbasis laju provinsi (inc10k_prov = 0,0520 per 10.000). Klasifikasi signifikansi memakai CI 95%:

  • Signif > 1 jika batas bawah CI > 1
  • Signif < 1 jika batas atas CI < 1
  • Selain itu → Tidak signif

Pada peta SIR, terdapat wilayah dengan SIR sangat tinggi hingga sekitar 3,152 (kelas tertinggi: 1,50 – 3,152). Wilayah dengan SIR > 1 berarti kejadian yang diamati lebih besar daripada yang diharapkan jika wilayah tersebut mengikuti rata-rata provinsi (dengan ukuran populasi wilayah tersebut).

4.13.2 Interpretasi Peta Signifikansi SIR (CI 95%)

Peta signifikansi menandai sebagian wilayah sebagai “Signif > 1” (merah) dan sebagian sebagai “Signif < 1” (biru), sementara lainnya tidak signifikan (abu). Berdasarkan output “Top 10” yang Anda tampilkan, wilayah dengan SIR signifikan > 1 yang jelas muncul adalah:

  • Kota Sukabumi: inc10k 0,16405097, SIR 3,152358 (Signif > 1)
  • Majalengka: inc10k 0,11829595, SIR 2,273142 (Signif > 1)
  • Subang: inc10k 0,10822771, SIR 2,079674 (Signif > 1)

Interpretasi: tiga wilayah tersebut merupakan outlier bermakna (secara statistik) dengan kejadian jauh di atas ekspektasi provinsi, sehingga layak menjadi target prioritas program surveilans/pengendalian.

4.13.3 Zona Risiko Terpadu (Bivariat): Insidensi × Kemiskinan

Zona dibentuk dari kombinasi:

  • Insidensi tinggi jika Y_rate ≥ median (median Y_rate = 0,05104)
  • Kemiskinan tinggi jika X4 ≥ median (median X4 = 8,41)

Empat zona:

  1. Zona 1: Ins tinggi + Miskin tinggi
  2. Zona 2: Ins tinggi + Miskin rendah
  3. Zona 3: Ins rendah + Miskin tinggi
  4. Zona 4: Ins rendah + Miskin rendah

Interpretasi peta zona: wilayah Zona 1 adalah prioritas tertinggi karena menggabungkan beban epidemiologis dan kerentanan sosial. Dari output top-10, beberapa wilayah risiko tinggi masuk Zona 1, misalnya Majalengka, Subang, Pangandaran, Tasikmalaya (kab), Kota Cirebon, Kota Tasikmalaya (sesuai kolom zona_risiko pada tabel Anda). Ini memperkuat argumen bahwa sebagian wilayah dengan insidensi tinggi juga berada pada kondisi sosial yang lebih rentan.

4.13.4 Pemodelan Kasus (Count Model): Poisson vs Negative Binomial + Prediksi Risiko

Diagnostik Overdispersion

Model Poisson baseline menunjukkan:

  • Dispersion ratio = 3,374
  • Uji overdispersion: z = 3,5028; p = 0,0002302

Interpretasi: terdapat overdispersion kuat (varians > mean) sehingga Poisson kurang sesuai. Oleh karena itu dipilih Negative Binomial sebagai model final.

Model Final: Negative Binomial

Ringkasan parameter (NB):

  • Theta ≈ 4,66; AIC = 169,42

  • Koefisien:

    • X1: estimate 0,004570, p 0,629
    • X2: estimate 0,004248, p 0,597
    • X3: estimate -0,010535, p 0,321
    • X4: estimate 0,030680, p 0,501
  • Tidak ada kovariat yang signifikan pada α = 0,05.

Interpretasi: setelah memperhitungkan populasi (offset), tidak ada bukti statistik kuat bahwa X1–X4 secara linear menjelaskan variasi jumlah kasus antarwilayah dalam model count ini. Namun, model tetap berguna untuk prediksi rata-rata dan melihat pola risiko relatif (terutama ketika tujuan utama adalah pemetaan prediksi, bukan inferensi kausal).

Peta Prediksi Risiko (Pred inc per 10.000)

Peta prediksi menggambarkan hasil estimasi model yang lebih “halus” dibanding peta Y_rate aktual. Pada tabel top-10 yang Anda berikan, contoh prediksi:

  • Kota Sukabumi: pred_inc10k 0,06175644 (lebih rendah dari observed 0,16405097) → indikasi outlier (observed jauh > prediksi)
  • Kota Cirebon: pred_inc10k 0,08384492 (termasuk tinggi pada prediksi)

Interpretasi: perbedaan observed vs predicted membantu mendeteksi wilayah yang lebih tinggi dari yang diperkirakan oleh karakteristik X1–X4 (candidate faktor lain yang belum dimasukkan) versus wilayah yang tinggi karena karakteristik terukur.

4.14 Autokorelasi Spasial Global (Moran & Geary)

## 
## --- DIAGNOSTIK JARINGAN (Queen) ---
## Rata-rata tetangga: 3.925926  | Min: 1  | Max: 8
## 
## --- Moran's I (Global) — Y_rate ---
## 
##  Moran I test under randomisation
## 
## data:  Yv  
## weights: lw_q    
## 
## Moran I statistic standard deviate = 1.6282, p-value = 0.05174
## alternative hypothesis: greater
## sample estimates:
## Moran I statistic       Expectation          Variance 
##        0.18381007       -0.03846154        0.01863615
## 
## --- Geary's C (Global) — Y_rate ---
## 
##  Geary C test under randomisation
## 
## data:  Yv 
## weights: lw_q   
## 
## Geary C statistic standard deviate = 1.7717, p-value = 0.03823
## alternative hypothesis: Expectation greater than statistic
## sample estimates:
## Geary C statistic       Expectation          Variance 
##        0.68535304        1.00000000        0.03154205

Moran’s I Global

  • Moran’s I = 0,18381007
  • p-value = 0,05174

Interpretasi: terdapat kecenderungan pengelompokan spasial positif (I > 0), namun pada α=0,05 hasilnya marginal (nyaris signifikan). Ini menunjukkan pola “mengelompok” ada, tetapi tidak sangat kuat menurut Moran’s I.

Geary’s C Global

  • Geary’s C = 0,68535304
  • p-value = 0,03823

Interpretasi: Geary’s C < 1 dan signifikan menunjukkan adanya autokorelasi spasial positif (wilayah bertetangga cenderung mirip). Karena Geary lebih sensitif terhadap perbedaan lokal, hasil ini menguatkan bahwa struktur lokal cukup penting.

4.14 LISA (Local Moran) — Cluster/Outlier Y_rate

## 
## Ringkas kategori LISA:
## 
##         Low-Low Not significant 
##               2              25

Pada peta LISA yang Anda lampirkan, kategori signifikan yang terlihat adalah Low–Low (wilayah dengan rate rendah dikelilingi wilayah rate rendah) dan sisanya Not significant.

Interpretasi: secara lokal, hanya sedikit area yang benar-benar membentuk klaster signifikan. Keberadaan klaster Low–Low mengindikasikan zona dengan risiko rendah yang stabil secara spasial (bukan kebetulan semata). Ini juga menjelaskan mengapa Moran global “marginal”—karena sinyal kuat hanya muncul pada area tertentu, bukan merata di seluruh provinsi.

4.15 Getis–Ord Gi* (Hotspot/Coldspot)

## 
## Ringkas kategori Gi*:
## 
## Cold Spot (p < 0.05) Cold Spot (p < 0.10)      Not significant 
##                    2                    1                   24

Peta Gi* yang Anda lampirkan menunjukkan adanya cold spot (p < 0,05 dan/atau p < 0,10) pada area tertentu, sementara mayoritas wilayah tidak signifikan.

Interpretasi: pola ini konsisten dengan LISA—lebih mudah menemukan zona risiko rendah yang mengelompok (coldspot) daripada hotspot yang mengelompok, yang berarti kasus/rate tinggi cenderung lebih tersebar atau terlokalisasi tanpa membentuk klaster luas.

4.16 Sensitivitas Bobot (Queen vs Rook vs kNN-4)

## 
## === SENSITIVITAS BOBOT ===
##   Bobot   Moran_I    p_value
## 1 Queen 0.1838101 0.05174198
## 2  Rook 0.1838101 0.05174198
## 3 kNN-4 0.0476078 0.23304199

Interpretasi: hasil Queen dan Rook identik (menandakan struktur ketetanggaan berbasis kontiguitas relatif stabil), sedangkan kNN-4 melemahkan autokorelasi (I turun dan tidak signifikan). Artinya, kesimpulan autokorelasi lebih konsisten jika memakai bobot kontiguitas daripada bobot berbasis jarak-k tetangga.

4.17 Spatial Econometrics untuk Y_rate: OLS → Model Spasial → Pemilihan AIC

4.17.1 OLS baseline

## 
## ================ OLS (BASELINE) =================
## 
## Call:
## lm(formula = Y ~ X1 + X2 + X3 + X4, data = df_model)
## 
## Residuals:
##       Min        1Q    Median        3Q       Max 
## -0.044760 -0.026955 -0.007218  0.022057  0.081844 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)
## (Intercept)  0.0509175  0.0601620   0.846    0.406
## X1           0.0004647  0.0005466   0.850    0.404
## X2          -0.0002185  0.0005028  -0.435    0.668
## X3          -0.0009928  0.0006043  -1.643    0.115
## X4           0.0026838  0.0028642   0.937    0.359
## 
## Residual standard error: 0.03671 on 22 degrees of freedom
## Multiple R-squared:  0.1703, Adjusted R-squared:  0.01943 
## F-statistic: 1.129 on 4 and 22 DF,  p-value: 0.3686
## 
## --- VIF (OLS) ---
##       X1       X2       X3       X4 
## 1.278364 1.425374 1.132313 1.109951
## 
## --- Moran's I residual OLS ---
## 
##  Global Moran I for regression residuals
## 
## data:  
## model: lm(formula = Y ~ X1 + X2 + X3 + X4, data = df_model)
## weights: lw_q
## 
## Moran I statistic standard deviate = 2.0712, p-value = 0.01917
## alternative hypothesis: greater
## sample estimates:
## Observed Moran I      Expectation         Variance 
##       0.17507357      -0.10020524       0.01766398

Interpretasi: meskipun model OLS secara statistik tidak kuat menjelaskan variasi Y_rate, residual OLS masih menunjukkan autokorelasi spasial signifikan. Ini berarti ada struktur spasial yang belum tertangkap OLS (residual tidak independen), sehingga model spasial layak dipertimbangkan.

4.17.2 LM test (Rao Score)

## 
## --- LM Tests (Rao Score) ---
## 
##  Rao's score (a.k.a Lagrange multiplier) diagnostics for spatial
##  dependence
## 
## data:  
## model: lm(formula = Y ~ X1 + X2 + X3 + X4, data = df_model)
## test weights: lw_q
## 
## RSlag = 1.1618, df = 1, p-value = 0.2811
## 
## 
##  Rao's score (a.k.a Lagrange multiplier) diagnostics for spatial
##  dependence
## 
## data:  
## model: lm(formula = Y ~ X1 + X2 + X3 + X4, data = df_model)
## test weights: lw_q
## 
## RSerr = 1.3351, df = 1, p-value = 0.2479
## 
## 
##  Rao's score (a.k.a Lagrange multiplier) diagnostics for spatial
##  dependence
## 
## data:  
## model: lm(formula = Y ~ X1 + X2 + X3 + X4, data = df_model)
## test weights: lw_q
## 
## adjRSlag = 0.063562, df = 1, p-value = 0.801
## 
## 
##  Rao's score (a.k.a Lagrange multiplier) diagnostics for spatial
##  dependence
## 
## data:  
## model: lm(formula = Y ~ X1 + X2 + X3 + X4, data = df_model)
## test weights: lw_q
## 
## adjRSerr = 0.23693, df = 1, p-value = 0.6264

Interpretasi: LM tidak menunjukkan bukti kuat memilih lag/error secara tegas berdasarkan uji tersebut, tetapi karena residual OLS masih berautokorelasi (Moran residual signifikan), pendekatan pembandingan AIC antar model spasial menjadi penting.

4.17.3 Estimasi model spasial (SLX, SAR, SEM, SDM, SDEM, SAC, GNS)

## 
## ================ MODEL SPASIAL =================
## 
## --- SEM (ringkas) ---
## 
## Call:errorsarlm(formula = Y ~ X1 + X2 + X3 + X4, data = df_model, 
##     listw = lw_q, method = "eigen", zero.policy = TRUE)
## 
## Residuals:
##        Min         1Q     Median         3Q        Max 
## -0.0451054 -0.0236492  0.0061283  0.0162431  0.0742020 
## 
## Type: error 
## Coefficients: (asymptotic standard errors) 
##                Estimate  Std. Error z value Pr(>|z|)
## (Intercept)  0.05840073  0.05404427  1.0806  0.27987
## X1           0.00037663  0.00047245  0.7972  0.42535
## X2          -0.00010427  0.00051121 -0.2040  0.83838
## X3          -0.00115566  0.00056070 -2.0611  0.03929
## X4           0.00280447  0.00286199  0.9799  0.32713
## 
## Lambda: 0.3882, LR test value: 1.9644, p-value: 0.16104
## Asymptotic standard error: 0.20338
##     z-value: 1.9087, p-value: 0.056301
## Wald statistic: 3.6431, p-value: 0.056301
## 
## Log likelihood: 54.65903 for error model
## ML residual variance (sigma squared): 0.00098047, (sigma: 0.031312)
## Number of observations: 27 
## Number of parameters estimated: 7 
## AIC: -95.318, (AIC for lm: -95.354)

4.17.4 Perbandingan AIC dan pemilihan model terbaik

## 
## ================ PERBANDINGAN MODEL SPASIAL =================
##   Model       AIC       BIC   LogLik
## 1   SEM -95.31806 -86.24720 54.65903
## 2   SAR -94.97028 -85.89942 54.48514
## 3   SAC -93.38232 -83.01562 54.69116
## 4   SLX -90.23484 -77.27647 55.11742
## 5   SDM -89.55009 -75.29589 55.77505
## 6  SDEM -89.24950 -74.99529 55.62475
## 7   GNS -87.56272 -72.01267 55.78136
## 
## Model spasial terbaik (AIC terendah): SEM

Hasil perbandingan AIC:

  1. SEM AIC -95,31806 (terendah → terbaik)
  2. SAR AIC -94,97028
  3. SAC AIC -93,38232 … (model lain lebih tinggi AIC)

Interpretasi: model terbaik adalah SEM (Spatial Error Model). Ini menyiratkan bahwa dependensi spasial lebih dominan berada pada komponen error (faktor tak-terukur yang terstruktur spasial), bukan semata efek lag pada Y secara langsung.

Pada SEM:

  • X3 (rasio puskesmas/penduduk) memiliki p-value 0,03929 dengan estimate -0,00115566.

Interpretasi: dalam SEM, X3 berasosiasi negatif signifikan dengan Y_rate, artinya wilayah dengan rasio puskesmas/penduduk lebih tinggi cenderung memiliki rate filariasis lebih rendah, setelah memperhitungkan error spasial. Secara program, ini dapat dibaca sebagai kemungkinan efek protektif akses layanan (pencegahan/penanganan) atau representasi konteks sistem kesehatan yang lebih baik—namun tetap perlu kehati-hatian karena ini studi ekologi.

4.18 Peta Fitted & Residual Model Terbaik (SEM)

Peta residual SEM (yang Anda lampirkan) menunjukkan variasi residual dari negatif hingga positif (kelas sekitar -0,045 s.d. 0,074).

Interpretasi:

  • Residual positif: kasus/rate aktual lebih tinggi daripada yang diprediksi model → ada faktor lain yang belum tertangkap (misalnya faktor lingkungan spesifik, perilaku, program, pelaporan).
  • Residual negatif: aktual lebih rendah dari prediksi → wilayah lebih “baik” dari yang diperkirakan berdasarkan kovariat; bisa terkait efektivitas program lokal atau faktor protektif lain.

Secara praktis, peta residual berguna untuk prioritas investigasi lanjutan: wilayah residual tinggi layak ditinjau untuk faktor risiko tambahan atau evaluasi surveilans.

4.19 Ringkasan Output Tabel untuk Laporan

## 
## Top 10 inc10k tertinggi (untuk narasi):
##            join_key     inc10k      SIR      SIR_sig pred_inc10k
## 1     KOTA SUKABUMI 0.16405097 3.152358   Signif > 1  0.06175644
## 2        MAJALENGKA 0.11829595 2.273142   Signif > 1  0.06810326
## 3            SUBANG 0.10822771 2.079674   Signif > 1  0.06882035
## 4       PANGANDARAN 0.09214467 1.770626 Tidak signif  0.06980959
## 5       TASIKMALAYA 0.08849926 1.700577 Tidak signif  0.04770323
## 6      KOTA CIREBON 0.08699435 1.671659 Tidak signif  0.08384492
## 7          KARAWANG 0.08221173 1.579758 Tidak signif  0.05030372
## 8  KOTA TASIKMALAYA 0.07992221 1.535763 Tidak signif  0.04900855
## 9          SUKABUMI 0.07425690 1.426900 Tidak signif  0.04735107
## 10           BEKASI 0.07025325 1.349967 Tidak signif  0.04181579
##                           zona_risiko
## 1  Zona 2: Ins tinggi + Miskin rendah
## 2  Zona 1: Ins tinggi + Miskin tinggi
## 3  Zona 1: Ins tinggi + Miskin tinggi
## 4  Zona 1: Ins tinggi + Miskin tinggi
## 5  Zona 1: Ins tinggi + Miskin tinggi
## 6  Zona 1: Ins tinggi + Miskin tinggi
## 7  Zona 2: Ins tinggi + Miskin rendah
## 8  Zona 1: Ins tinggi + Miskin tinggi
## 9  Zona 2: Ins tinggi + Miskin rendah
## 10 Zona 2: Ins tinggi + Miskin rendah

Output aktual (run kamu) top-10 sudah muncul pada log kamu (mengandung pred_inc10k dan zona_risiko).

Interpretasi final Bab 4:

Secara ringkas, analisis menunjukkan: (1) beban provinsi rendah namun CFR tinggi, (2) beberapa wilayah menonjol pada SIR (terutama Kota Sukabumi, Majalengka, Subang dengan SIR signifikan > 1), (3) ukuran asosiasi 2×2 untuk “any_case” tidak signifikan dan kurang stabil karena sel nol, (4) autokorelasi spasial ada terutama secara lokal (Geary signifikan; Moran marginal), (5) pemodelan count lebih tepat memakai NegBin karena overdispersion, dan (6) untuk Y_rate, model terbaik adalah SEM, menandakan pengaruh faktor tak-terukur yang berpola spasial cukup dominan.


Bab 5. Kesimpulan dan Saran

5.1 Kesimpulan

Berdasarkan rangkaian analisis epidemiologi dan spasial pada tingkat kabupaten/kota di Provinsi Jawa Barat (n = 27) dengan variabel respon jumlah kasus kronis filariasis (Y_jumlah) dan laju kasus per 10.000 penduduk (Y_rate) serta variabel penjelas sanitasi layak (X1), rumah layak huni (X2), rasio puskesmas terhadap penduduk (X3), dan persentase penduduk miskin (X4), diperoleh kesimpulan sebagai berikut:

  1. Distribusi kasus dan laju filariasis kronis menunjukkan heterogenitas spasial yang jelas antarwilayah.
    Peta jumlah kasus (count) memperlihatkan konsentrasi kasus absolut yang tinggi pada beberapa kabupaten dengan populasi besar, sedangkan peta Y_rate menyoroti wilayah dengan risiko relatif lebih tinggi setelah memperhitungkan ukuran populasi. Perbedaan ini menegaskan pentingnya penggunaan laju dan standardisasi risiko dibandingkan hanya mengandalkan jumlah kasus.

  2. Standardized Incidence Ratio (SIR) mengidentifikasi wilayah dengan risiko relatif di atas dan di bawah ekspektasi provinsi.
    Peta SIR menunjukkan adanya kabupaten/kota dengan SIR > 1 (kejadian teramati melebihi ekspektasi) dan SIR < 1 (kejadian lebih rendah dari ekspektasi). Peta signifikansi SIR (CI 95%) mengindikasikan bahwa hanya sebagian wilayah yang berbeda secara bermakna dari tingkat provinsi, sehingga tidak semua variasi spasial bersifat signifikan secara statistik.

  3. Analisis zona risiko terpadu memperlihatkan keterkaitan antara insidensi filariasis dan kemiskinan.
    Penggabungan kategori insidensi (tinggi/rendah) dan kemiskinan (tinggi/rendah) menghasilkan empat zona risiko. Wilayah dengan insidensi tinggi dan kemiskinan tinggi muncul sebagai area prioritas intervensi, karena mencerminkan beban penyakit yang relatif tinggi bersamaan dengan keterbatasan sosial-ekonomi.

  4. Analisis autokorelasi spasial global dan lokal mengindikasikan adanya struktur spasial yang tidak acak.
    Uji autokorelasi global menunjukkan kecenderungan pengelompokan nilai Y_rate pada tingkat signifikansi tertentu. Analisis LISA mengungkap keberadaan klaster lokal (misalnya low–low yang signifikan) pada beberapa wilayah, sedangkan sebagian besar kabupaten/kota lainnya tidak menunjukkan asosiasi lokal yang signifikan.

  5. Analisis hotspot/coldspot Getis–Ord Gi* menunjukkan bahwa klaster spasial Y_rate yang signifikan bersifat terbatas secara geografis.
    Peta Gi* memperlihatkan bahwa hanya sedikit wilayah yang teridentifikasi sebagai cold spot signifikan, sementara sebagian besar wilayah berada pada kategori tidak signifikan. Hal ini menunjukkan bahwa pola spasial filariasis kronis di Jawa Barat tidak membentuk hotspot luas, melainkan bersifat lokal dan terfragmentasi.

  6. Model regresi spasial mengungguli model non-spasial dalam menangkap ketergantungan wilayah.
    Model OLS sebagai baseline belum sepenuhnya menjelaskan variasi Y_rate dan masih menyisakan pola spasial pada residual. Perbandingan beberapa spesifikasi model spasial menunjukkan bahwa Spatial Error Model (SEM) merupakan model terbaik berdasarkan kriteria informasi (AIC).

  7. Model SEM mampu mereduksi autokorelasi spasial residual.
    Setelah penerapan SEM, uji Moran’s I pada residual tidak lagi signifikan, yang menandakan bahwa ketergantungan spasial yang sebelumnya muncul pada residual OLS telah terakomodasi dengan baik melalui komponen error spasial.

  8. Peta residual model SEM membantu mengidentifikasi wilayah dengan potensi under- dan over-prediction.
    Residual positif dan negatif yang masih muncul pada beberapa wilayah mengindikasikan adanya faktor determinan lain yang belum tercakup dalam model, seperti kondisi lingkungan spesifik, faktor iklim, atau dinamika vektor yang tidak terukur pada data agregat.

Secara keseluruhan, hasil ini menegaskan bahwa pendekatan epidemiologi yang dikombinasikan dengan analisis spasial memberikan gambaran yang lebih komprehensif mengenai distribusi dan risiko filariasis kronis dibandingkan analisis non-spasial semata, serta relevan untuk mendukung perencanaan intervensi berbasis wilayah.

5.2 Saran

Berdasarkan temuan dan keterbatasan analisis, beberapa saran yang dapat dipertimbangkan adalah sebagai berikut:

  1. Perkuat kualitas indikator epidemiologi yang digunakan.
    Definisi outcome (kasus kronis, laju per 10.000 penduduk, dan SIR) perlu dijaga konsistensinya antarwilayah dan antarperiode agar interpretasi spasial tidak bias akibat perbedaan definisi operasional.

  2. Tambahkan determinan yang lebih dekat dengan mekanisme penularan filariasis.
    Variabel seperti kepadatan penduduk, kondisi drainase dan genangan, curah hujan, elevasi, penggunaan lahan, serta indikator lingkungan lain yang memengaruhi habitat vektor berpotensi meningkatkan kemampuan penjelasan model.

  3. Kembangkan analisis dengan data multi-tahun atau panel spasial.
    Penggunaan data lintas waktu memungkinkan pemodelan dinamika risiko dan evaluasi tren filariasis kronis, sekaligus membuka peluang penggunaan model spasial panel yang lebih informatif.

  4. Lakukan analisis sensitivitas terhadap spesifikasi model dan cutpoint.
    Uji terhadap berbagai definisi high rate, metode cutpoint, serta transformasi variabel (misalnya log-rate) penting untuk memastikan kestabilan hasil asosiasi dan pemodelan.

  5. Gunakan peta risiko sebagai alat pendukung pengambilan keputusan, bukan sebagai satu-satunya dasar.
    Peta insidensi, SIR, dan zona risiko sebaiknya dipadukan dengan informasi kualitatif lapangan dan kebijakan lokal agar intervensi yang dirancang lebih tepat sasaran dan berkelanjutan.


Referensi

  1. World Health Organization (WHO). Lymphatic filariasis (Fact sheet). (WHO Fact Sheet)
  2. World Health Organization (WHO). Global Programme to Eliminate Lymphatic Filariasis (GPELF). (WHO GPELF)
  3. World Health Organization (WHO). Morbidity management and disability prevention (MMDP). (WHO MMDP)
  4. United Nations / SDGs. SDG 3 Target 3.3 (termasuk Neglected Tropical Diseases/NTDs). (UN SDG 3.3)
  5. World Bank Blogs. NTDs sebagai “diseases of poverty” dan keterkaitan pembangunan. (World Bank Blogs)
  6. Centers for Disease Control and Prevention (CDC). About Lymphatic Filariasis. (CDC LF About)
  7. CDC. DPDx – Lymphatic Filariasis. (CDC DPDx LF)
  8. CDC (archived). Principles of Epidemiology – Measures of Association (RR, OR). (CDC Archive—Measures of Association)
  9. OpenEpi. 2×2 Table Statistics (RR/OR/RD/AF & Fisher’s exact test). (OpenEpi 2×2)
  10. CDC. Appendix A: Statistical Considerations (CI untuk SIR/SMR dan pendekatan Poisson/chi-square). (CDC Statistical Considerations)
  11. Public Health England (Fingertips). PHDS Guidance – Confidence Intervals (Byar’s method dan CI rate). (PHE Fingertips CI Guidance)
  12. CRAN epiR documentation. epi.smr (CI dan uji signifikansi untuk SMR/SIR). (epiR epi.smr)
  13. Anselin, L. (1995). Local Indicators of Spatial Association (LISA). (Anselin 1995 LISA)
  14. Getis, A., & Ord, J. K. (1992). The Analysis of Spatial Association by Use of Distance Statistics (dasar \(Gi^*\)). (ESRI Gi* paper)
  15. Cliff, A. D., & Ord, J. K. (1981). Spatial Processes: Models & Applications. (Internet Archive—Cliff & Ord)
  16. Anselin, L. (1988). Spatial Econometrics: Methods and Models. (Springer—Spatial Econometrics)
  17. Hilbe, J. M. Negative Binomial Regression. (Hilbe—NB Regression)
  18. VanderWeele, T. L. (2017). Invited Commentary: The Continuing Need for the Sufficient Cause Model… (AJE Commentary)
  19. ScienceDirect. Catatan historis sufficient cause model. (ScienceDirect—Historical note)

Lampiran

Dashboard Analisis Epidemiologi

Dashboard dapat diakses melalui:
🔗 Klik untuk membuka dashboard

Video Analisis Epidemiologi

Video dapat diakses melalui:
🔗 Klik untuk membuka video