ANALISIS SPASIAL SEBARAN KASUS MALARIA DI PROVINSI NUSA TENGGARA TIMUR
Dosen Pembimbing: Dr. I Gede Nyoman Mindra Jaya, M.Si.
Disusun Oleh: Kevin Jonathan (140610230040)
PROGRAM STUDI S-1 STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU
PENGETAHUAN ALAM
UNIVERSITAS PADJADJARAN
JATINANGOR
2025
Daftar Isi
Abstrak
Malaria merupakan salah satu penyakit menular yang masih menjadi masalah kesehatan masyarakat di Indonesia, khususnya di Provinsi Nusa Tenggara Timur (NTT) yang tergolong wilayah endemis. Perbedaan kondisi geografis, sosial ekonomi, serta akses layanan kesehatan menyebabkan distribusi kasus malaria antar kabupaten/kota di NTT tidak bersifat homogen. Penelitian ini bertujuan untuk menganalisis pola sebaran spasial prevalensi malaria di Provinsi NTT serta mengidentifikasi keberadaan autokorelasi spasial dan model regresi spasial yang paling sesuai. Data yang digunakan merupakan data sekunder tingkat kabupaten/kota yang meliputi jumlah kasus malaria, jumlah penduduk, kepadatan penduduk, dan jumlah penduduk miskin, serta data spasial batas administrasi wilayah. Analisis dilakukan menggunakan pendekatan analisis spasial dengan bantuan perangkat lunak R, meliputi visualisasi peta tematik, uji autokorelasi spasial global menggunakan Indeks Moran, analisis autokorelasi spasial lokal menggunakan LISA, serta pemodelan regresi spasial. Hasil penelitian menunjukkan bahwa prevalensi malaria di Provinsi NTT memiliki autokorelasi spasial positif yang signifikan dan membentuk klaster wilayah tertentu. Model regresi spasial memberikan kinerja yang lebih baik dibandingkan model regresi konvensional, dengan Spatial Error Model sebagai model terbaik. Temuan ini menegaskan pentingnya pendekatan spasial dalam perencanaan dan evaluasi kebijakan pengendalian malaria berbasis wilayah guna mendukung pencapaian Tujuan Pembangunan Berkelanjutan, khususnya SDG 3.
Malaria merupakan salah satu penyakit menular yang hingga saat ini masih menjadi masalah kesehatan masyarakat di berbagai negara berkembang, termasuk Indonesia. Penyakit ini disebabkan oleh parasit Plasmodium yang ditularkan melalui gigitan nyamuk Anopheles, dan dapat menimbulkan dampak serius terhadap kualitas hidup, produktivitas penduduk, serta beban sistem kesehatan apabila tidak ditangani secara efektif. Meskipun berbagai program pengendalian malaria telah dilaksanakan secara nasional, distribusi kasus malaria di Indonesia masih menunjukkan ketimpangan antar wilayah.
Provinsi Nusa Tenggara Timur (NTT) merupakan salah satu wilayah yang tergolong endemis malaria dengan tingkat prevalensi yang relatif tinggi dibandingkan banyak provinsi lainnya di Indonesia. Kondisi geografis berupa wilayah kepulauan, perbedaan akses terhadap fasilitas kesehatan, serta variasi karakteristik sosial ekonomi masyarakat menyebabkan pola penyebaran malaria antar kabupaten/kota di NTT tidak bersifat homogen. Perbedaan tersebut mengindikasikan bahwa faktor spasial berperan penting dalam membentuk variasi prevalensi malaria di wilayah ini.
Dalam konteks pembangunan berkelanjutan, permasalahan malaria memiliki keterkaitan yang erat dengan Sustainable Development Goals (SDGs), khususnya SDG 3: Good Health and Well-being, yang menargetkan penghapusan epidemi penyakit menular, termasuk malaria, pada tahun 2030. Upaya pencapaian target tersebut memerlukan pendekatan berbasis bukti (evidence-based policy), salah satunya melalui analisis spasial yang mampu mengidentifikasi wilayah prioritas intervensi kesehatan secara lebih tepat sasaran.
Oleh karena itu, analisis spasial prevalensi malaria di Provinsi NTT menjadi penting untuk memahami pola penyebaran penyakit secara geografis, mengidentifikasi adanya keterkaitan antar wilayah, serta mengevaluasi pengaruh faktor kependudukan dan sosial ekonomi. Hasil analisis ini diharapkan dapat memberikan kontribusi dalam perencanaan dan evaluasi kebijakan pengendalian malaria yang lebih efektif dan berkelanjutan.
Belum diketahui apakah prevalensi malaria antar kabupaten/kota di Provinsi NTT memiliki pola spasial tertentu atau bersifat acak.
Belum adanya kajian yang menguji secara formal keberadaan autokorelasi spasial pada data prevalensi malaria di NTT.
Belum diketahui model regresi spasial yang paling sesuai untuk menjelaskan variasi prevalensi malaria dengan mempertimbangkan faktor kepadatan penduduk dan tingkat kemiskinan.
Menggambarkan distribusi spasial prevalensi malaria antar kabupaten/kota di Provinsi NTT melalui visualisasi peta tematik.
Menguji keberadaan autokorelasi spasial global dan lokal pada prevalensi malaria menggunakan Moran’s I dan LISA.
Membangun dan membandingkan model regresi non-spasial dan spasial untuk mengidentifikasi faktor-faktor yang memengaruhi prevalensi malaria.
Memberikan implikasi kebijakan yang relevan dengan pencapaian SDG 3 berdasarkan hasil analisis spasial yang diperoleh.
Spatial dependence atau ketergantungan spasial merupakan konsep utama dalam analisis data spasial yang menyatakan bahwa nilai suatu variabel pada suatu lokasi dipengaruhi oleh nilai variabel yang sama pada lokasi lain yang berdekatan secara geografis. Konsep ini berakar pada hukum pertama geografi yang dikemukakan oleh Tobler, yang menyatakan bahwa segala sesuatu saling berhubungan, namun hubungan antar objek yang berdekatan cenderung lebih kuat dibandingkan objek yang berjauhan.
Dalam analisis statistik konvensional, salah satu asumsi utama adalah independensi antar observasi. Namun, pada data spasial, asumsi ini sering kali tidak terpenuhi karena adanya keterkaitan antar unit wilayah. Ketergantungan spasial dapat muncul akibat kesamaan karakteristik lingkungan, faktor sosial ekonomi, maupun proses difusi fenomena tertentu antar wilayah yang berdekatan.
Dalam konteks kesehatan masyarakat, khususnya penyakit menular seperti malaria, spatial dependence sangat relevan. Penyebaran penyakit tidak hanya ditentukan oleh kondisi internal suatu wilayah, tetapi juga dipengaruhi oleh kondisi wilayah sekitarnya, seperti mobilitas penduduk, kesamaan iklim, dan faktor lingkungan yang mendukung perkembangbiakan vektor penyakit.
Autokorelasi spasial menggambarkan adanya keterkaitan antara nilai suatu variabel di suatu lokasi dengan nilai variabel yang sama di lokasi lain yang berdekatan secara geografis. Dalam konteks kesehatan masyarakat, autokorelasi spasial menunjukkan bahwa kondisi kesehatan suatu wilayah tidak berdiri sendiri, melainkan dipengaruhi oleh kondisi wilayah sekitarnya.
Salah satu ukuran autokorelasi spasial global yang paling umum digunakan adalah Indeks Moran. Indeks ini mengukur derajat kemiripan nilai antar wilayah berdasarkan matriks pembobot spasial. Nilai Indeks Moran yang positif menunjukkan adanya pengelompokan (clustering), sedangkan nilai negatif menunjukkan pola dispersi.
Keberadaan autokorelasi spasial menjadi alasan utama mengapa analisis spasial diperlukan, karena metode statistik konvensional umumnya mengasumsikan bahwa observasi bersifat independen antar wilayah.
Pendekatan spatial econometrics digunakan untuk mengakomodasi adanya ketergantungan spasial antar wilayah, di mana kondisi pada suatu wilayah dapat dipengaruhi oleh kondisi wilayah di sekitarnya. Ketergantungan spasial ini menyebabkan asumsi independensi observasi pada regresi klasik tidak terpenuhi, sehingga diperlukan model yang secara eksplisit memasukkan struktur spasial melalui matriks pembobot spasial. Dalam penelitian ini, model spatial econometrics digunakan untuk menganalisis pola penyebaran kasus malaria antar kabupaten/kota, yang relevan dengan pencapaian Sustainable Development Goals (SDGs), khususnya SDG 3 mengenai kesehatan yang baik dan kesejahteraan.
Model regresi Ordinary Least Squares (OLS) digunakan sebagai model dasar (baseline model) untuk menggambarkan hubungan antara variabel dependen dan variabel independen tanpa mempertimbangkan adanya pengaruh spasial. Model ini berfungsi sebagai pembanding awal untuk mengidentifikasi apakah ketergantungan spasial perlu dimasukkan ke dalam pemodelan. Secara matematis, model OLS dinyatakan sebagai berikut.
\[ \mathbf{y} = \mathbf{X}\boldsymbol{\beta} + \boldsymbol{\varepsilon} \]
\[ \boldsymbol{\varepsilon} \sim \mathcal{N}(\mathbf{0}, \sigma^2 \mathbf{I}) \]
Dalam model ini, vektor error diasumsikan saling independen dan berdistribusi normal. Apabila asumsi tersebut dilanggar akibat adanya autokorelasi spasial, maka estimasi parameter yang dihasilkan oleh OLS menjadi tidak efisien dan dapat menimbulkan kesimpulan yang menyesatkan.
Model Spatial Lag atau Spatial Autoregressive Model (SAR) digunakan ketika nilai variabel dependen di suatu wilayah dipengaruhi secara langsung oleh nilai variabel dependen di wilayah sekitarnya. Model ini menangkap adanya interaksi spasial antar wilayah yang saling berdekatan melalui lag spasial pada variabel dependen. Secara matematis, model SAR dirumuskan sebagai berikut.
\[ \mathbf{y} = \rho \mathbf{W}\mathbf{y} + \mathbf{X}\boldsymbol{\beta} + \boldsymbol{\varepsilon} \]
\[ \boldsymbol{\varepsilon} \sim \mathcal{N}(\mathbf{0}, \sigma^2 \mathbf{I}) \]
Parameter \(\rho\) menunjukkan tingkat ketergantungan spasial antar wilayah. Nilai parameter yang signifikan mengindikasikan bahwa prevalensi malaria di suatu wilayah dipengaruhi oleh prevalensi di wilayah lain yang bertetangga, sehingga intervensi kesehatan perlu mempertimbangkan pendekatan lintas wilayah sesuai dengan prinsip pembangunan berkelanjutan dalam SDGs.
Model Spatial Error atau Spatial Error Model (SEM) digunakan ketika ketergantungan spasial tidak muncul secara langsung pada variabel dependen, melainkan pada komponen error akibat adanya faktor-faktor yang tidak terobservasi namun memiliki pola spasial. Model ini sesuai digunakan apabila pengaruh spasial berasal dari kondisi lingkungan, sosial, atau akses layanan kesehatan yang tidak sepenuhnya terukur dalam model. Model SEM dinyatakan dalam sistem persamaan berikut.
\[ \mathbf{y} = \mathbf{X}\boldsymbol{\beta} + \mathbf{u} \]
\[ \mathbf{u} = \lambda \mathbf{W}\mathbf{u} + \boldsymbol{\varepsilon} \]
\[ \boldsymbol{\varepsilon} \sim \mathcal{N}(\mathbf{0}, \sigma^2 \mathbf{I}) \]
Parameter \(\lambda\) mencerminkan tingkat autokorelasi spasial pada komponen error. Apabila parameter ini signifikan, maka pengaruh spasial bersifat tidak langsung dan berasal dari faktor laten yang memiliki keterkaitan antar wilayah.
Pemilihan model spatial econometrics dilakukan dengan mempertimbangkan hasil uji autokorelasi spasial dan uji diagnostik, seperti Lagrange Multiplier (LM), serta perbandingan kriteria informasi, seperti Akaike Information Criterion (AIC). Model yang dipilih adalah model yang mampu menangkap struktur spasial data secara optimal dan memberikan interpretasi substantif yang relevan dalam konteks pengendalian malaria dan pencapaian tujuan SDG 3 di tingkat regional.
Penelitian ini menggunakan data sekunder yang bersumber dari instansi resmi pemerintah. Unit analisis yang digunakan adalah kabupaten/kota di Provinsi Nusa Tenggara Timur (NTT). Pemilihan unit analisis ini didasarkan pada pertimbangan administratif dan ketersediaan data kesehatan serta sosial ekonomi yang seragam antar wilayah.
Data yang digunakan terdiri atas dua jenis, yaitu data atribut dan data spasial. Data atribut meliputi jumlah kasus malaria, jumlah penduduk, kepadatan penduduk, dan jumlah penduduk miskin pada masing-masing kabupaten/kota. Sementara itu, data spasial berupa shapefile batas administrasi kabupaten/kota digunakan untuk merepresentasikan hubungan geografis antar wilayah. Seluruh proses analisis dilakukan menggunakan perangkat lunak R untuk memastikan keterulangan (reproducibility) hasil analisis.
Untuk mendukung analisis spasial, beberapa paket R yang relevan dimuat terlebih dahulu, mencakup pengolahan data, pemetaan, serta pemodelan spasial.
# 0. LIBRARY
library(dplyr)
library(sf)
library(stringr)
library(tmap)
library(spdep)
## Warning: package 'spdep' was built under R version 4.3.3
## Loading required package: spData
## Warning: package 'spData' was built under R version 4.3.3
## To access larger datasets in this package, install the spDataLarge
## package with: `install.packages('spDataLarge',
## repos='https://nowosad.github.io/drat/', type='source')`
library(spatialreg)
## Warning: package 'spatialreg' was built under R version 4.3.3
## Loading required package: Matrix
##
## Attaching package: 'Matrix'
## The following objects are masked from 'package:tidyr':
##
## expand, pack, unpack
##
## Attaching package: 'spatialreg'
## The following objects are masked from 'package:spdep':
##
## get.ClusterOption, get.coresOption, get.mcOption,
## get.VerboseOption, get.ZeroPolicyOption, set.ClusterOption,
## set.coresOption, set.mcOption, set.VerboseOption,
## set.ZeroPolicyOption
library(gstat)
library(stars)
## Warning: package 'stars' was built under R version 4.3.3
## Loading required package: abind
Tahap awal pengolahan data dilakukan dengan membaca data malaria yang berisi informasi jumlah kasus dan jumlah penduduk. Data kemudian diperiksa untuk memastikan tidak terdapat nilai kosong atau entri wilayah yang tidak valid. Proses ini penting untuk menjaga kualitas data agar hasil analisis yang diperoleh tidak bias akibat kesalahan input data.
Selanjutnya, dilakukan penyesuaian penamaan variabel untuk memastikan konsistensi dan kemudahan dalam analisis lanjutan. Prevalensi malaria dihitung sebagai jumlah kasus malaria per 1.000 penduduk, sehingga memungkinkan perbandingan tingkat kejadian malaria antar wilayah dengan ukuran populasi yang berbeda.
# 1. BACA DATA MALARIA
Malaria <- read.csv("Malaria2.csv", sep = ";")
Malaria <- Malaria %>%
rename(Penduduk_asli = Penduduk, Kasus_asli = Kasus) %>%
rename(Penduduk = Kasus_asli, Kasus = Penduduk_asli) %>%
mutate(prevalensi = round((Kasus / Penduduk) * 1000, 3))
Hasil ringkasan statistik dari variabel prevalensi memberikan gambaran awal mengenai sebaran nilai prevalensi malaria di Provinsi NTT. Informasi ini menjadi dasar untuk memahami variasi data sebelum dilakukan analisis spasial lebih lanjut.
Data spasial diperoleh dalam bentuk shapefile batas administrasi kabupaten/kota di Indonesia. Dari data tersebut, dilakukan penyaringan untuk mengambil wilayah Provinsi Nusa Tenggara Timur saja. Penyesuaian penamaan wilayah dilakukan agar data atribut malaria dapat digabungkan dengan data spasial secara tepat.
Proses penggabungan data atribut dan spasial ini sangat penting karena menjadi dasar bagi seluruh analisis spasial, termasuk pemetaan, pengujian autokorelasi spasial, dan pemodelan regresi spasial.
# 2. SHAPEFILE & JOIN DENGAN MAPPING TEPAT
shp_ntt <- st_read("C:/Users/Kevin Jonathan/Downloads/gadm41_IDN_2/gadm41_IDN_2.shp", quiet = TRUE) %>%
filter(NAME_1 == "Nusa Tenggara Timur") %>%
mutate(NAME_2_clean = NAME_2 %>% toupper() %>% str_replace_all("\\.", "") %>% str_squish())
# Mapping manual sesuai nama GADM untuk NTT (perbaikan utama untuk Kota Kupang dan lainnya)
mapping <- tribble(
~Kabupaten.Kota, ~NAME_2_clean,
"Sumba Barat", "SUMBA BARAT",
"Sumba Timur", "SUMBA TIMUR",
"Kupang", "KUPANG", # Kabupaten Kupang
"Timor Tengah Selatan", "TIMOR TENGAH SELATAN",
"Timor Tengah Utara", "TIMOR TENGAH UTARA",
"Belu", "BELU",
"Alor", "ALOR",
"Lembata", "LEMBATA",
"Flores Timur", "FLORES TIMUR",
"Sikka", "SIKKA",
"Ende", "ENDE",
"Ngada", "NGADA",
"Manggarai", "MANGGARAI",
"Rote Ndao", "ROTE NDAO",
"Manggarai Barat", "MANGGARAI BARAT",
"Sumba Tengah", "SUMBA TENGAH",
"Sumba Barat Daya", "SUMBA BARAT DAYA",
"Nagekeo", "NAGEKEO",
"Manggarai Timur", "MANGGARAI TIMUR",
"Sabu Raijua", "SABU RAIJUA",
"Malaka", "MALAKA",
"Kota Kupang", "KUPANG" # <-- Perbaikan kunci: Kota Kupang di GADM adalah "KUPANG"
)
Malaria_mapped <- Malaria %>%
left_join(mapping, by = "Kabupaten.Kota")
shp_ntt_join <- shp_ntt %>%
left_join(Malaria_mapped, by = "NAME_2_clean")
# Diagnosa join (lihat berapa yang berhasil)
cat("Berhasil join:", sum(!is.na(shp_ntt_join$prevalensi)), "dari", nrow(shp_ntt_join), "\n")
## Berhasil join: 21 dari 22
Setelah proses ini, data spasial Provinsi NTT siap digabungkan dengan data malaria sehingga setiap kabupaten/kota memiliki informasi geografis dan atribut kesehatan secara lengkap.
Visualisasi peta tematik digunakan sebagai langkah awal untuk mengidentifikasi pola distribusi prevalensi malaria secara spasial. Peta ini memberikan gambaran mengenai wilayah-wilayah dengan tingkat prevalensi rendah hingga tinggi, sehingga memudahkan identifikasi daerah prioritas penanganan malaria.
Pemetaan dilakukan menggunakan pendekatan kuantil agar distribusi warna pada peta lebih seimbang dan informatif.
## ℹ tmap modes "plot" - "view"
## ℹ toggle with `tmap::ttm()`
##
##
## ── tmap v3 code detected ───────────────────────────────────────────────────────
##
## [v3->v4] `tm_polygons()`: instead of `style = "quantile"`, use fill.scale =
## `tm_scale_intervals()`.
## ℹ Migrate the argument(s) 'style', 'palette' (rename to 'values') to
## 'tm_scale_intervals(<HERE>)'
## [v3->v4] `tm_layout()`: use `tm_title()` instead of `tm_layout(main.title = )`
## [cols4all] color palettes: use palettes from the R package cols4all. Run
## `cols4all::c4a_gui()` to explore them. The old palette name "Reds" is named
## "brewer.reds"
## Multiple palettes called "reds" found: "brewer.reds", "matplotlib.reds". The first one, "brewer.reds", is returned.
Pola yang terlihat pada peta menunjukkan bahwa prevalensi malaria tidak tersebar secara acak. Beberapa wilayah cenderung memiliki nilai prevalensi yang lebih tinggi dibandingkan wilayah lain di sekitarnya. Temuan ini mengindikasikan perlunya pengujian autokorelasi spasial untuk memastikan apakah pola tersebut signifikan secara statistik.
Autokorelasi spasial diuji untuk mengetahui apakah prevalensi malaria di suatu kabupaten/kota berkaitan dengan prevalensi di wilayah sekitarnya. Dalam konteks SDG 3 (Good Health and Well-being), keberadaan klaster malaria menunjukkan bahwa intervensi kesehatan perlu dirancang berbasis wilayah, bukan hanya berbasis administrasi tunggal.
# 5. AUTOKORELASI (FILTER NA DULU!)
shp_clean <- shp_ntt_join %>% filter(!is.na(prevalensi) & st_is_valid(geometry))
coords <- st_centroid(shp_clean) %>% st_coordinates()
## Warning: st_centroid assumes attributes are constant over geometries
# Pastikan coords numerik dan tanpa NA
if (any(is.na(coords))) stop("Masih ada NA di koordinat!")
knn_nb <- knearneigh(coords, k = 4)
## Warning in knearneigh(coords, k = 4): knearneigh: identical points found
## Warning in knearneigh(coords, k = 4): knearneigh: kd_tree not available for
## identical points
nb_knn <- knn2nb(knn_nb)
listw_knn <- nb2listw(nb_knn, style = "W", zero.policy = TRUE)
moran_global <- moran.test(shp_clean$prevalensi, listw_knn, zero.policy = TRUE)
print(moran_global)
##
## Moran I test under randomisation
##
## data: shp_clean$prevalensi
## weights: listw_knn
##
## Moran I statistic standard deviate = 2.9747, p-value = 0.001467
## alternative hypothesis: greater
## sample estimates:
## Moran I statistic Expectation Variance
## 0.24889924 -0.05000000 0.01009653
local_moran <- localmoran(shp_clean$prevalensi, listw_knn, zero.policy = TRUE)
shp_ntt_join$Ii <- NA
shp_ntt_join$P_Ii <- NA
shp_ntt_join$Ii[as.numeric(rownames(shp_clean))] <- local_moran[,1]
shp_ntt_join$P_Ii[as.numeric(rownames(shp_clean))] <- local_moran[,5]
tm_shape(shp_ntt_join) + tm_polygons("Ii", palette = "RdBu", midpoint = 0) + tm_layout(main.title = "LISA Prevalensi Malaria NTT")
##
## ── tmap v3 code detected ───────────────────────────────────────────────────────
## [v3->v4] `tm_tm_polygons()`: migrate the argument(s) related to the scale of
## the visual variable `fill` namely 'midpoint', 'palette' (rename to 'values') to
## fill.scale = tm_scale(<HERE>).
## ℹ For small multiples, specify a 'tm_scale_' for each multiple, and put them in
## a list: 'fill.scale = list(<scale1>, <scale2>, ...)'
## [v3->v4] `tm_layout()`: use `tm_title()` instead of `tm_layout(main.title = )`
## [cols4all] color palettes: use palettes from the R package cols4all. Run
## `cols4all::c4a_gui()` to explore them. The old palette name "RdBu" is named
## "brewer.rd_bu"
## Multiple palettes called "rd_bu" found: "brewer.rd_bu", "matplotlib.rd_bu". The first one, "brewer.rd_bu", is returned.
Pengujian autokorelasi spasial dilakukan menggunakan Moran’s I dengan matriks pembobot berbasis kedekatan geografis.
Model regresi non-spasial (OLS) digunakan sebagai pembanding awal untuk mengevaluasi hubungan antara prevalensi malaria dengan variabel kepadatan penduduk dan tingkat kemiskinan. Namun, mengingat adanya autokorelasi spasial, penggunaan model OLS berpotensi menghasilkan estimasi yang bias dan tidak efisien.
Oleh karena itu, penelitian ini menggunakan model regresi spasial, yaitu Spatial Autoregressive Model (SAR) dan Spatial Error Model (SEM). Kedua model tersebut dirancang untuk menangkap ketergantungan spasial yang tidak dapat ditangani oleh model regresi konvensional. Perbandingan kinerja model dilakukan berdasarkan kriteria informasi dan signifikansi parameter.
# 6. MODEL SPASIAL (filter NA lagi)
shp_model <- shp_ntt_join %>% filter(!is.na(prevalensi_std) & !is.na(Kepadatan_std) & !is.na(PendudukMiskin_std))
ols_model <- lm(prevalensi_std ~ Kepadatan_std + PendudukMiskin_std, data = shp_model)
summary(ols_model)
##
## Call:
## lm(formula = prevalensi_std ~ Kepadatan_std + PendudukMiskin_std,
## data = shp_model)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.7359 -0.5923 -0.2906 0.2926 3.6548
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -5.890e-17 2.293e-01 0.000 1.000
## Kepadatan_std 6.055e-02 2.604e-01 0.232 0.819
## PendudukMiskin_std -3.443e-02 2.604e-01 -0.132 0.896
##
## Residual standard error: 1.051 on 18 degrees of freedom
## Multiple R-squared: 0.006651, Adjusted R-squared: -0.1037
## F-statistic: 0.06026 on 2 and 18 DF, p-value: 0.9417
sar_model <- lagsarlm(prevalensi_std ~ Kepadatan_std + PendudukMiskin_std,
data = shp_model, listw = listw_knn, zero.policy = TRUE)
summary(sar_model)
##
## Call:lagsarlm(formula = prevalensi_std ~ Kepadatan_std + PendudukMiskin_std,
## data = shp_model, listw = listw_knn, zero.policy = TRUE)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.703128 -0.504436 -0.240041 0.040253 3.496893
##
## Type: lag
## Coefficients: (asymptotic standard errors)
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -0.041229 0.196628 -0.2097 0.8339
## Kepadatan_std 0.153503 0.222466 0.6900 0.4902
## PendudukMiskin_std 0.107798 0.222602 0.4843 0.6282
##
## Rho: 0.42717, LR test value: 2.4498, p-value: 0.11754
## Asymptotic standard error: 0.22698
## z-value: 1.882, p-value: 0.059837
## Wald statistic: 3.5419, p-value: 0.059837
##
## Log likelihood: -27.99046 for lag model
## ML residual variance (sigma squared): 0.80428, (sigma: 0.89682)
## Number of observations: 21
## Number of parameters estimated: 5
## AIC: 65.981, (AIC for lm: 66.431)
## LM test for residual autocorrelation
## test value: 0.50487, p-value: 0.47737
sem_model <- errorsarlm(prevalensi_std ~ Kepadatan_std + PendudukMiskin_std,
data = shp_model, listw = listw_knn, zero.policy = TRUE)
summary(sem_model)
##
## Call:errorsarlm(formula = prevalensi_std ~ Kepadatan_std + PendudukMiskin_std,
## data = shp_model, listw = listw_knn, zero.policy = TRUE)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.835816 -0.489831 -0.335282 0.051582 3.250064
##
## Type: error
## Coefficients: (asymptotic standard errors)
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -0.12448 0.39609 -0.3143 0.7533
## Kepadatan_std 0.25472 0.21335 1.1939 0.2325
## PendudukMiskin_std 0.27705 0.22978 1.2057 0.2279
##
## Lambda: 0.52305, LR test value: 3.3753, p-value: 0.066179
## Asymptotic standard error: 0.1996
## z-value: 2.6205, p-value: 0.0087795
## Wald statistic: 6.8671, p-value: 0.0087795
##
## Log likelihood: -27.52767 for error model
## ML residual variance (sigma squared): 0.7485, (sigma: 0.86516)
## Number of observations: 21
## Number of parameters estimated: 5
## AIC: 65.055, (AIC for lm: 66.431)
lm_tests <- lm.LMtests(ols_model, listw_knn,
test = c("LMerr","LMlag","RLMerr","RLMlag","SARMA"),
zero.policy = TRUE)
## Please update scripts to use lm.RStests in place of lm.LMtests
print(lm_tests)
##
## Rao's score (a.k.a Lagrange multiplier) diagnostics for spatial
## dependence
##
## data:
## model: lm(formula = prevalensi_std ~ Kepadatan_std +
## PendudukMiskin_std, data = shp_model)
## test weights: listw
##
## RSerr = 2.7184, df = 1, p-value = 0.0992
##
##
## Rao's score (a.k.a Lagrange multiplier) diagnostics for spatial
## dependence
##
## data:
## model: lm(formula = prevalensi_std ~ Kepadatan_std +
## PendudukMiskin_std, data = shp_model)
## test weights: listw
##
## RSlag = 2.819, df = 1, p-value = 0.09315
##
##
## Rao's score (a.k.a Lagrange multiplier) diagnostics for spatial
## dependence
##
## data:
## model: lm(formula = prevalensi_std ~ Kepadatan_std +
## PendudukMiskin_std, data = shp_model)
## test weights: listw
##
## adjRSerr = 0.26875, df = 1, p-value = 0.6042
##
##
## Rao's score (a.k.a Lagrange multiplier) diagnostics for spatial
## dependence
##
## data:
## model: lm(formula = prevalensi_std ~ Kepadatan_std +
## PendudukMiskin_std, data = shp_model)
## test weights: listw
##
## adjRSlag = 0.36941, df = 1, p-value = 0.5433
##
##
## Rao's score (a.k.a Lagrange multiplier) diagnostics for spatial
## dependence
##
## data:
## model: lm(formula = prevalensi_std ~ Kepadatan_std +
## PendudukMiskin_std, data = shp_model)
## test weights: listw
##
## SARMA = 3.0878, df = 2, p-value = 0.2136
# 7. PEMILIHAN MODEL
cat("=== PERBANDINGAN MODEL ===\n\n")
## === PERBANDINGAN MODEL ===
cat("AIC Biasa:\n")
## AIC Biasa:
Hasil analisis menunjukkan bahwa model regresi spasial memberikan kinerja yang lebih baik dibandingkan model OLS, sehingga lebih sesuai digunakan dalam menjelaskan variasi prevalensi malaria di Provinsi NTT.
Peta residual model spasial terbaik digunakan untuk mengevaluasi sejauh mana model mampu menangkap variasi prevalensi malaria secara spasial. Residual merepresentasikan selisih antara nilai prevalensi yang diamati dengan nilai yang diprediksi oleh model, sehingga pola residual dapat menunjukkan apakah masih terdapat struktur spasial yang belum terjelaskan. Model yang baik diharapkan menghasilkan residual yang terdistribusi secara acak tanpa pola pengelompokan tertentu.
Berdasarkan peta residual, sebagian besar wilayah menunjukkan nilai residual yang relatif kecil dan tersebar secara acak. Hal ini mengindikasikan bahwa model spasial yang dipilih telah mampu menangkap ketergantungan spasial utama dalam data. Meskipun demikian, masih terdapat beberapa wilayah dengan residual positif atau negatif yang relatif besar, yang dapat mengindikasikan adanya faktor lokal spesifik yang belum tercakup dalam model, seperti kondisi lingkungan atau akses layanan kesehatan.
# 8. RESIDUAL
shp_ntt_join$resid_best <- NA
shp_ntt_join$resid_best[as.numeric(rownames(shp_model))] <- residuals(sar_model)
tm_shape(shp_ntt_join) +
tm_polygons("resid_best", palette = "RdBu", midpoint = 0, title = "Residual Model Terbaik") +
tm_layout(main.title = "Peta Residual Model Spasial Terbaik", legend.outside = TRUE)
##
## ── tmap v3 code detected ───────────────────────────────────────────────────────
## [v3->v4] `tm_tm_polygons()`: migrate the argument(s) related to the scale of
## the visual variable `fill` namely 'midpoint', 'palette' (rename to 'values') to
## fill.scale = tm_scale(<HERE>).
## ℹ For small multiples, specify a 'tm_scale_' for each multiple, and put them in
## a list: 'fill.scale = list(<scale1>, <scale2>, ...)'
## [v3->v4] `tm_polygons()`: migrate the argument(s) related to the legend of the
## visual variable `fill` namely 'title' to 'fill.legend = tm_legend(<HERE>)'
## [v3->v4] `tm_layout()`: use `tm_title()` instead of `tm_layout(main.title = )`
## [cols4all] color palettes: use palettes from the R package cols4all. Run
## `cols4all::c4a_gui()` to explore them. The old palette name "RdBu" is named
## "brewer.rd_bu"
## Multiple palettes called "rd_bu" found: "brewer.rd_bu", "matplotlib.rd_bu". The first one, "brewer.rd_bu", is returned.
Secara keseluruhan, peta residual mendukung kelayakan model spasial terbaik yang digunakan dalam penelitian ini, karena tidak ditemukan pola spasial yang kuat pada residual. Dengan demikian, model tersebut dapat digunakan sebagai dasar untuk interpretasi lebih lanjut dan perumusan rekomendasi kebijakan berbasis wilayah.
Peta distribusi penyakit malaria menggambarkan sebaran spasial tingkat prevalensi malaria di seluruh kabupaten/kota di Provinsi Nusa Tenggara Timur. Visualisasi ini memberikan gambaran awal mengenai variasi tingkat risiko malaria antarwilayah serta membantu mengidentifikasi daerah dengan beban penyakit yang relatif tinggi maupun rendah. Peta ini berperan penting sebagai dasar eksplorasi sebelum dan sesudah penerapan model spasial.
Hasil pemetaan menunjukkan adanya variasi prevalensi malaria yang cukup mencolok antarwilayah. Beberapa kabupaten/kota memiliki prevalensi yang lebih tinggi dibandingkan wilayah lainnya, yang secara spasial cenderung berdekatan. Pola ini selaras dengan hasil analisis autokorelasi spasial yang menunjukkan adanya pengelompokan wilayah berdasarkan tingkat prevalensi malaria.
Selain peta administratif, interpolasi spasial menggunakan metode Inverse Distance Weighting (IDW) memberikan gambaran kontinu mengenai distribusi prevalensi malaria. Peta interpolasi ini membantu mengidentifikasi gradien spasial risiko malaria dan dapat digunakan sebagai informasi pendukung dalam perencanaan intervensi kesehatan masyarakat yang lebih terarah.# 9. INTERPOLASI IDW
# 9. INTERPOLASI IDW
shp_ntt_proj <- st_transform(shp_ntt_join, 32751)
points_ntt <- st_centroid(shp_ntt_proj) %>% filter(!is.na(prevalensi))
## Warning: st_centroid assumes attributes are constant over geometries
grid_pts <- st_make_grid(st_union(shp_ntt_proj), cellsize = 10000, what = "centers") %>% st_sf(geometry = .)
idw_model <- gstat(formula = prevalensi ~ 1, locations = points_ntt, nmax = 7, set = list(idp = 2))
idw_pts <- predict(idw_model, newdata = grid_pts) %>% rename(prevalensi = var1.pred)
## [inverse distance weighted interpolation]
idw_raster <- st_rasterize(idw_pts["prevalensi"], dx = 10000, dy = 10000)
idw_crop <- st_crop(idw_raster, st_bbox(shp_ntt_proj))
tm_shape(idw_crop) +
tm_raster("prevalensi", palette = "Reds", title = "Estimasi Prevalensi") +
tm_shape(shp_ntt_proj) + tm_borders() +
tm_layout(main.title = "Interpolasi IDW Prevalensi Malaria NTT", legend.outside = TRUE)
##
## ── tmap v3 code detected ───────────────────────────────────────────────────────
## [v3->v4] `tm_tm_raster()`: migrate the argument(s) related to the scale of the
## visual variable `col` namely 'palette' (rename to 'values') to col.scale =
## tm_scale(<HERE>).
## [v3->v4] `tm_raster()`: migrate the argument(s) related to the legend of the
## visual variable `col` namely 'title' to 'col.legend = tm_legend(<HERE>)'
## [v3->v4] `tm_layout()`: use `tm_title()` instead of `tm_layout(main.title = )`
## [cols4all] color palettes: use palettes from the R package cols4all. Run
## `cols4all::c4a_gui()` to explore them. The old palette name "Reds" is named
## "brewer.reds"
Penelitian ini menunjukkan bahwa prevalensi malaria di Provinsi Nusa Tenggara Timur memiliki pola spasial yang signifikan dan tidak terdistribusi secara acak. Hasil analisis autokorelasi spasial global menggunakan Moran’s I mengindikasikan adanya pengelompokan wilayah dengan tingkat prevalensi yang serupa, sedangkan analisis LISA mampu mengidentifikasi klaster wilayah dengan prevalensi tinggi dan rendah secara lokal. Temuan ini menegaskan bahwa aspek spasial merupakan komponen penting dalam memahami dinamika penyebaran malaria di NTT.
Pemodelan spatial econometrics menunjukkan bahwa model spasial memberikan hasil yang lebih baik dibandingkan model OLS konvensional. Berdasarkan perbandingan kriteria pemilihan model, model Spatial Error Model (SEM) dipilih sebagai model terbaik, yang mengindikasikan bahwa ketergantungan spasial lebih dominan muncul melalui struktur galat daripada melalui mekanisme lag variabel dependen. Hal ini menunjukkan bahwa faktor-faktor yang tidak teramati namun bersifat spasial turut memengaruhi variasi prevalensi malaria antarwilayah.
Secara keseluruhan, hasil penelitian ini mendukung pentingnya pendekatan analisis spasial dalam kajian kesehatan masyarakat. Pendekatan ini mampu memberikan pemahaman yang lebih komprehensif terhadap distribusi penyakit serta menjadi dasar yang kuat dalam perumusan kebijakan pengendalian malaria yang berbasis wilayah.
Berdasarkan hasil penelitian, disarankan agar upaya pengendalian malaria di Provinsi Nusa Tenggara Timur dilakukan dengan mempertimbangkan pola spasial antarwilayah. Wilayah yang tergolong dalam klaster prevalensi tinggi perlu menjadi prioritas utama dalam pelaksanaan program intervensi, seperti peningkatan surveilans, pengendalian vektor, serta pemerataan akses layanan kesehatan. Pendekatan berbasis wilayah ini sejalan dengan pencapaian Tujuan Pembangunan Berkelanjutan (Sustainable Development Goals), khususnya SDG 3 terkait kesehatan yang baik dan kesejahteraan.
Untuk penelitian selanjutnya, disarankan agar variabel penjelas diperluas dengan memasukkan faktor lingkungan dan iklim, seperti curah hujan, suhu, dan kondisi geografis, yang secara teoritis berkaitan erat dengan penyebaran malaria. Selain itu, penggunaan unit analisis spasial yang lebih rinci, seperti tingkat kecamatan atau desa, diharapkan dapat memberikan gambaran yang lebih detail mengenai variasi spasial penyakit.
Dari sisi metodologi, penelitian lanjutan dapat mempertimbangkan penggunaan model spasial yang lebih kompleks, seperti Spatial Durbin Model (SDM) atau pendekatan spatio-temporal, untuk menangkap dinamika penyebaran malaria dari waktu ke waktu. Dengan demikian, hasil penelitian tidak hanya bersifat deskriptif dan diagnostik, tetapi juga dapat berkontribusi secara lebih langsung dalam perumusan kebijakan kesehatan masyarakat yang berkelanjutan.
Daftar Pustaka
Pebesma, E. (2018). Simple features for R: Standardized support for spatial vector data. The R Journal, 10(1), 439–446. https://doi.org/10.32614/RJ-2018-009).
World Health Organization. (2022). World malaria report 2022. Geneva: World Health Organization. https://www.who.int/teams/global-malaria-programme/reports/world-malaria-report-2022
United Nations. (2023). The sustainable development goals report 2023. New York: United Nations. https://unstats.un.org/sdgs/report/2023
Badan Pusat Statistik Provinsi Nusa Tenggara Timur. (2024). Persentase penduduk miskin menurut kabupaten/kota (persen), 2024. Diakses dari https://ntt.bps.go.id/id/statistics-table/2/NTg0IzI=/persentase-penduduk-miskinmenurut-kabupaten-kota.html
Badan Pusat Statistik Provinsi Nusa Tenggara Timur. (2024). Jumlah kasus penyakit menurut kabupaten/kota dan jenis penyakit (jiwa), 2024. Diakses dari https://ntt.bps.go.id/id/statistics-table/2/MTQ4NSMy/jumlah-kasus-penyakit-menurut-kabupaten-kota-dan-jenis-penyakit.html
Lampiran
Link Dashboard: https://kevinjonathan2023.shinyapps.io/MalariaNTT/
Link Dataset (CSV):https://drive.google.com/drive/folders/1IWRJnvd2FGG7e0GHkInAqwDNb681RljL?usp=sharing
Link file Geospasial (SHP):https://drive.google.com/drive/folders/1OnQflgMlUx4ifw8HsQiHoj4nCMj3chzC?usp=sharing
Link Presentasi:https://bit.ly/SpatialPresentation25