RPubs-UTS-Spasial.knit

ANALISIS AUTOKORELASI SPASIAL DAN PEMODELAN SPASIAL PADA KASUS SEBARAN TUBERKULOSIS DI PROVINSI JAWA BARAT TAHUN 2023

Dosen Pembimbing:

Dr. I Gede Nyoman Mindra Jaya, M.Si.

Disusun Oleh:

Rasendriya Nandana Kurniawan 140610230009

PROGRAM STUDI S-1 STATISTIKA

DEPARTEMEN STATISTIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS PADJADJARAN

TAHUN AJARAN 2025/2026

ABSTRAK

Penyakit Tuberkulosis (TBC) merupakan isu kesehatan masyarakat yang krusial di Indonesia. Hal tersebut dapat terlihat pada Provinsi Jawa Barat yang mencatatkan bahwa lebih dari 200 ribu orang terserang penyakit TBC pada tahun 2023. Tingginya angka tersebut mengindikasikan perlunya kajian mendalam mengenai pola penyebaran penyakit. Penelitian ini bertujuan untuk menganalisis dan memodelkan distribusi spasial kasus TBC di Jawa Barat. Metode yang digunakan adalah analisis autokorelasi spasial, yaitu dengan Uji Moran’s I Global dan Lokal, dilanjutkan dengan pemodelan regresi spasial melalui pendekatan Ordinary Least Square (OLS), Spatial Error Model (SEM), Spatial Autoregressive (SAR), dan Spatial Durbin Model (SDM). Hasil pengujian membuktikan adanya autokorelasi spasial positif yang signifikan pada kasus TBC di Jawa Barat, sehingga pemodelan spasial mutlak diperlukan untuk mendapatkan estimasi yang tidak bias. Kesimpulan menunjukkan bahwa model OLS dan SEM adalah model yang paling sesuai untuk menjelaskan faktor-faktor yang mempengaruhi kasus TBC, bergantung pada tingkat signifikansi yang ditetapkan, yang dapat menjadi dasar intervensi kesehatan yang lebih efektif dan terarah.

BAB I. Pendahuluan

1.1 Latar Belakang

Penyakit Tuberculosis atau biasa disebut sebagai TBC, masih menjadi sebuah masalah kesehatan yang cukup besar, bahkan menjadi salah satu penyebab kematian akibat penyakit menular tertinggi di dunia. Menurut World Health Organization, diperkirakan kematian akibat penyakit menular ini sekitar 1,25 juta orang pada tahun 2023, dan jumlah orang yang menderita TBC mencapai angka 10,9 juta orang.

Penderita penyakit TBC tersebar di seluruh dunia. Pada tahun 2020, kawasan WHO Asia Tenggara menjadi kawasan dengan penderita TBC terbanyak, yaitu 43%. Indonesia menjadi salah satu negara dengan kasus TBC terbanyak di Asia Tenggara (Rahmadhani & Amanda, 2023), terutama Provinsi Jawa Barat yang memiliki total kasus mencapai 203 ribu orang pada tahun 2023 (BPS Jabar, 2023). Penyebaran kasus yang tinggi di Provinsi Jawa Barat menunjukkan bahwa tuberkulosis bukan hanya masalah kesehatan individu, melainkan juga fenomena sosial dan lingkungan yang kompleks. Faktor-faktor seperti kepadatan penduduk, tingkat kemiskinan, jumlah kasus penderita Diabetes Melitus, dan jumlah kasus penderita HIV/AIDS menjadi 4 faktor penting dalam penyebaran penyakit TBC. Oleh karena itu, pendekatan analisis spasial menjadi sangat relevan untuk memahami pola distribusi TBC, karena memungkinkan peneliti untuk mengidentifikasi klaster serta hubungan spasial antar kabupaten/kota di Jawa Barat. Dengan menganalisis autokorelasi spasial menggunakan ukuran seperti Moran’s I dan LISA (Local Indicators of Spatial Association), dapat diketahui apakah kasus TBC cenderung mengelompok di wilayah tertentu atau tersebar secara acak (Shaweno, et al. (2018). Informasi ini sangat penting dalam menentukan prioritas intervensi kesehatan masyarakat, sehingga upaya pencegahan dan penanggulangan dapat difokuskan pada daerah-daerah yang paling membutuhkan.

1.2 Identifikasi Masalah

Salah satu tantangan yang dihadapi Indonesia adalah bagaimana cara pemerintah mendapatkan model yang cukup dan baik dalam menjelaskan bagaimana persebaran kasus TBC di Indonesia beserta faktor-faktor yang bisa mendukung persebaran kasus tersebut. Pemerintah telah mencoba melakukan pengendalian kuman penyebab TBC lewat mempertahankan cakupan pengobatan dan tingkat pengobatan yang berhasil tinggi (Rasyid, et al. 2025). Dengan begitu, pemodelan secara spasial dapat membantu pemerintah untuk menyusun strategi yang lebih efektif dalam memberantas penyakit TBC di Indonesia.

1.3 Tujuan Penelitian

Penelitian ini bertujuan untuk menganalisis pola sebaran spasial kasus TBC di kabupaten/kota Provinsi Jawa Barat serta mengidentifikasi pengaruh variabel HIV/AIDS, Diabetes Mellitus, kepadatan penduduk, dan persentase penduduk miskin terhadap jumlah kasus TBC menggunakan pendekatan model ekonometrika spasial.

1.4 Batasan Penelitian

Penelitian ini dibatasi pada wilayah administratif kabupaten/kota di Provinsi Jawa Barat dengan menggunakan data sekunder pada periode tertentu. Variabel independen yang digunakan meliputi jumlah kasus HIV/AIDS (X1), jumlah penderita Diabetes Mellitus (X2), kepadatan penduduk per km² (X3), dan persentase penduduk miskin (X4), sedangkan variabel dependen adalah jumlah kasus TBC. Analisis difokuskan pada hubungan spasial antarwilayah tanpa meninjau faktor individual atau temporal secara mendalam.

BAB II. Tinjauan Pustaka

2.1 Teori Dasar Spatial Dependence

Spatial dependence atau ketergantungan spasial menggambarkan kondisi di mana suatu fenomena pada satu lokasi dipengaruhi oleh fenomena di lokasi sekitarnya. Dalam konteks kesehatan masyarakat, seperti kasus TBC, wilayah dengan tingkat kejadian tinggi cenderung berdekatan dengan wilayah lain yang juga memiliki tingkat kejadian tinggi. Prinsip ini sejalan dengan Tobler’s First Law of Geography yang menyatakan bahwa “everything is related to everything else, but near things are more related than distant things.” Oleh karena itu, analisis spasial diperlukan untuk mengidentifikasi adanya pola keterkaitan antarwilayah, yang tidak dapat dijelaskan hanya dengan analisis statistik konvensional.

2.2 Autokorelasi Spasial

Autokorelasi spasial digunakan untuk mengukur sejauh mana nilai suatu variabel di satu lokasi berkorelasi dengan nilai di lokasi lain yang berdekatan. Terdapat dua jenis analisis autokorelasi spasial, yaitu Global Moran’s I dan Local Moran’s I (LISA). Global Moran’s I digunakan untuk menilai apakah pola spasial secara keseluruhan bersifat mengelompok (clustered), acak (random), atau menyebar (dispersed), sedangkan Local Moran’s I digunakan untuk mengidentifikasi lokasi-lokasi spesifik yang membentuk klaster signifikan, seperti wilayah dengan kasus TBC tinggi yang berdekatan dengan wilayah serupa (High-High) atau rendah dengan rendah (Low-Low). Kedua ukuran ini penting untuk memahami pola sebaran penyakit dan mendeteksi daerah prioritas penanganan.

2.3 Model Spatial Econometrics yang Digunakan

Model ekonometrika spasial digunakan untuk menganalisis hubungan antarvariabel dengan mempertimbangkan efek spasial. Dua model utama yang umum digunakan adalah Spatial Error Model (SEM) dan Spatial Autoregressive Model (SAR). Model SAR memasukkan ketergantungan spasial melalui variabel dependen, menunjukkan bahwa nilai TBC di suatu wilayah dipengaruhi oleh nilai TBC di wilayah sekitar. Sebaliknya, model SEM memperhitungkan korelasi spasial pada komponen error, yang menunjukkan adanya faktor spasial yang tidak teramati tetapi memengaruhi variabel dependen. Dengan membandingkan kedua model ini, dapat diketahui apakah pengaruh spasial lebih dominan berasal dari interaksi antarwilayah atau dari faktor-faktor tak teramati dalam struktur residual.

BAB III. Metodologi Penelitian

3.1 Data

Data yang digunakan dalam penelitian ini merupakan data sekunder yang diperoleh dari sumber resmi seperti Open Data Jawa Barat dan Badan Pusat Statistik (BPS) Jawa Barat. Variabel dependen yang digunakan adalah jumlah kasus Tuberkulosis (TBC) di setiap kabupaten/kota, sedangkan variabel independennya meliputi jumlah kasus HIV/AIDS baru (X1), jumlah penderita Diabetes Mellitus (X2), kepadatan penduduk per km² (X3), dan persentase penduduk miskin (X4). Data yang dikumpulkan mencerminkan kondisi sosial, ekonomi, dan kesehatan masyarakat pada periode penelitian yang telah ditentukan.

3.2 Unit Spasial

Unit spasial yang digunakan dalam penelitian ini adalah wilayah administratif tingkat kabupaten/kota di Provinsi Jawa Barat. Ada 27 kabupaten dan kota yang akan dilakukan analisis spasial ini, yaitu: Bandung, Bandung Barat, Bekasi, Bogor, Ciamis, Cianjur, Cirebon, Garut, Indramayu, Karawang, Kuningan, Majalengka, Pangandaran, Purwakarta, Subang, Sukabumi, Sumedang, Tasikmalaya, Kota Bandung, Kota Banjar, Kota Bekasi, Kota Bogor, Kota Cirebon, Kota Depok, Kota Sukabumi, Kota Tasikmalaya, dan Kota Cimahi. Setiap unit spasial direpresentasikan dalam bentuk poligon pada peta digital (shapefile), yang berfungsi untuk menganalisis hubungan spasial antarwilayah. Pemilihan unit ini didasarkan pada ketersediaan data dan peran kabupaten/kota sebagai pelaksana utama program pengendalian penyakit TBC di tingkat daerah.

3.3 Metode Analisis

Analisis yang digunakan terdiri atas analisis deskriptif spasial, autokorelasi spasial, dan model ekonometrika spasial. Analisis deskriptif dilakukan untuk memvisualisasikan persebaran kasus TBC di Jawa Barat. Autokorelasi spasial dihitung menggunakan Global Moran’s I untuk mendeteksi pola sebaran secara keseluruhan dan Local Moran’s I (LISA) untuk mengidentifikasi klaster signifikan antarwilayah. Selanjutnya, dilakukan pemodelan menggunakan Ordinary Least Square (OLS), Spatial Autoregressive Model (SAR), Spatial Error Model (SEM), dan Spatial Durbin Model (SDM) untuk menganalisis pengaruh variabel independen terhadap jumlah kasus TBC dengan mempertimbangkan efek spasial, serta membandingkan model mana yang memberikan hasil paling sesuai.

3.4 Alur Kerja Penelitian

Penelitian ini diawali dengan pengumpulan dan pengolahan data sekunder dari berbagai sumber resmi, kemudian dilakukan penyusunan peta dan pembentukan matriks pembobot spasial (spatial weights matrix). Selanjutnya dilakukan analisis autokorelasi spasial untuk mendeteksi adanya ketergantungan spasial antarwilayah. Setelah itu dilakukan pemodelan menggunakan model SAR dan SEM untuk mengetahui faktor-faktor yang memengaruhi jumlah kasus TBC. Tahap akhir penelitian adalah interpretasi hasil analisis, penarikan kesimpulan, dan penyusunan rekomendasi kebijakan berbasis spasial untuk penanggulangan TBC di Jawa Barat.

BAB IV. Hasil dan Pembahasan

4.1 Peta Deskriptif

Package yang Digunakan (Message dan warning disembunyikan)

# Packages
library(spdep)
library(sp)
library(sf)
library(ggplot2)
library(dplyr)
library(spData)
library(geodata)
library(tmap)
library(skimr)
library(psych)
library(gridExtra)
library(grid)
library(viridis)
library(spatialreg)
library(stringr)
library(car)

Persiapan Sebelum Analisis Autokorelasi Spasial dan Pemodelan Regresi

#### Persiapan Peta Chloropeth Provinsi Jawa Barat dan Pemanggilan file CSV 

# Set Directory dan Panggil File SHP
shp <- st_read("geoBoundaries-IDN-ADM2-all/geoBoundaries-IDN-ADM2.shp")
# Ganti Nama Kolom
shp <- shp %>%
  mutate(
    NAME_join = shapeName
  )
# List Kota/Kabupaten dalam Provinsi Jawa Barat 
kabkota_jabar <- c(
  "Bandung", "Bandung Barat", "Bekasi", "Bogor", "Ciamis",
  "Cianjur", "Cirebon", "Garut", "Indramayu", "Karawang",
  "Kota Bandung", "Kota Banjar", "Kota Bekasi", "Kota Bogor",
  "Kota Cimahi", "Kota Cirebon", "Kota Depok", "Kota Sukabumi",
  "Kota Tasikmalaya", "Kuningan", "Majalengka", "Pangandaran",
  "Purwakarta", "Subang", "Sukabumi", "Sumedang", "Tasikmalaya"
)
# Filter SHP Menjadi Hanya Kota yang Ada pada Provinsi Jawa Barat
jabar_shp_filtered <- shp %>%
  filter(NAME_join %in% kabkota_jabar)

# Memanggil File .csv
data_csv <- read.csv("Stats-Spat.csv", stringsAsFactors = FALSE)
col_join_csv_name <- "Kabupaten.Kota" 

if (!(col_join_csv_name %in% names(data_csv))) {
  stop("Kolom join 'Kabupaten.Kota' tidak ditemukan di CSV. Periksa nama kolom CSV.")
}
# Penggabungan Data dari SHP yang Difilter dan Data dari File .csv
data_csv <- data_csv %>%
  mutate(
    NAME_join = str_trim(.data[[col_join_csv_name]])
  )
jabar_data <- left_join(jabar_shp_filtered, data_csv, by = "NAME_join") %>%
  rename(KabKota = NAME_join)

# Variabel Y (Dependen) dan X (Independen) - Spasi diganti dengan titik
Y_var_dot <- "Jumlah.Kasus.Penyakit...Angka.Penemuan.TBC..Y."
X_vars_dot <- c("Jumlah.Kasus.Penyakit...HIV.AIDS.Kasus.Baru..X1.",
                "Jumlah.Penderita...Diabetes.Mellitus..X2.",
                "Kepadatan.Penduduk.per.km.2..X3.",
                "Persentase.Penduduk.Miskin..X4.")

# Cek Hasil Penggabungan Data dari 2 File yang Berbeda
head(jabar_data)

Gambar Peta Chloropeth Provinsi Jawa Barat dan Peta Distribusi Kasus TBC

#### Peta Chloropeth dari File SHP
tmap_mode("plot") 
raw_map <- tm_shape(jabar_shp_filtered) +
  tm_fill(col = "shapeGroup", palette = "Set3", title = "Kelompok Wilayah", legend.show = TRUE) +
  tm_borders(col = "black", lwd = 0.5) +
  tm_text("NAME_join", size = 0.5, remove.overlap = TRUE) +
  tm_layout(title = "Peta Batas Wilayah Jawa Barat", title.position = c("center", "top"), legend.outside = TRUE, frame = FALSE)
print(raw_map)

Peta Distribusi Kasus TBC menggunakan Peta Chloropeth

# Peta Distribusi Kasus TBC (Chloropeth)
tmap_mode("plot")
tm_shape(jabar_data) +
  tm_fill(Y_var_dot, # <<< PERBAIKAN: Menggunakan nama kolom bertitik >>>
          style = "quantile", palette = "Reds",
          title = "Jumlah Kasus TBC") +
  tm_borders(col = "gray40", lwd = 0.5) +
  tm_text("KabKota", size = 0.5, col = "black",
          remove.overlap = TRUE, shadow = TRUE) + 
  tm_layout(title = "Peta Distribusi Kasus TBC di Jawa Barat",
            title.size = 1.1,
            legend.position = c("right", "top"),
            frame = FALSE)

Pada gambar peta tersebut, terlihat bahwa jumlah kasus TBC terbanyak ada pada Kabupaten Bekasi, Kabupaten Karawang, Kabupaten Bogor, Kabupaten Bandung, Kota Bandung dan Kota Bekasi, terlihat dari warna merah yang sangat gelap pada peta distribusi. Sedangkan jumlah kasus TBC cenderung sedikit pada kabupaten dan kota yang diwarnai merah pudar seperti Kabupaten Sumedang, Kabupaten Tasikmalaya, Kabupaten Ciamis, dan Banjar.

4.2 Uji Autokorelasi Spasial

Spatial Weights List

nb_full <- poly2nb(jabar_data, queen = TRUE)
lw_full <- nb2listw(nb_full, style = "W", zero.policy = TRUE)

Global Moran’s I Test

# Moran Test
# 5. Jalankan uji Moran Global
moran.test(jabar_data[[Y_var_dot]], lw_full, zero.policy = TRUE)

## 
##  Moran I test under randomisation
## 
## data:  jabar_data[[Y_var_dot]]  
## weights: lw_full    
## 
## Moran I statistic standard deviate = 3.2446, p-value = 0.0005882
## alternative hypothesis: greater
## sample estimates:
## Moran I statistic       Expectation          Variance 
##        0.37947921       -0.03846154        0.01659271

Hasil uji autokorelasi spasial residual menggunakan Moran’s I menunjukkan bahwa nilai statistik Moran’s I sebesar 0,379 dengan ekspektasi -0,038 dan varians 0,0166. Nilai dengan p-value 0.0005882. Dengan alpha = 0.05, maka p value < alpha, sehingga menolak H0. Maka dari itu, kasus TBC tahun 2023 di Provinsi Jawa Barat terindikasi mengalami autokorelasi spasial yang signifikan pada residual model OLS. Adapun pada kasus ini, nilai Moran’s I lebih besar daripada nilai ekspektasi, maka kasus TBC tahun 2023 ini terindikasi autokorelasi spasial positif yang artinya unit wilayah cenderung bertetangga dengan unit wilayah dengan residual yang mirip (High-high dan low-low)

Klasifikasi dengan LISA Cluster (Local Moran’s I)

## 6. Local Moran
local_moran <- localmoran(jabar_data[[Y_var_dot]], lw_full, zero.policy = TRUE)
jabar_data$Ii  <- local_moran[, 1]
jabar_data$Z.Ii <- local_moran[, 4]
jabar_data$Pval <- local_moran[, 5]

# 7. LISA cluster (menggunakan mean / lag)
# --- 7. LISA Cluster (menggunakan mean / lag) ---
mean_val <- mean(jabar_data[[Y_var_dot]], na.rm = TRUE)
lag_val  <- lag.listw(lw_full, jabar_data[[Y_var_dot]], zero.policy = TRUE)

jabar_data$Quadrant <- "Not Sig."
for (i in seq_len(nrow(jabar_data))) {
  if (!is.na(jabar_data$Pval[i]) && jabar_data$Pval[i] <= 0.05) {
    y_i <- jabar_data[[Y_var_dot]][i]
    lag_i <- lag_val[i]
    if (!is.na(y_i) && !is.na(lag_i)) {
      if (y_i >= mean_val && lag_i >= mean(lag_val, na.rm = TRUE)) {
        jabar_data$Quadrant[i] <- "High-High"
      } else if (y_i <= mean_val && lag_i <= mean(lag_val, na.rm = TRUE)) {
        jabar_data$Quadrant[i] <- "Low-Low"
      } else if (y_i >= mean_val && lag_i <= mean(lag_val, na.rm = TRUE)) {
        jabar_data$Quadrant[i] <- "High-Low"
      } else if (y_i <= mean_val && lag_i >= mean(lag_val, na.rm = TRUE)) {
        jabar_data$Quadrant[i] <- "Low-High"
      }
    }
  }
}
jabar_data$Quadrant <- factor(
  jabar_data$Quadrant,
  levels = c("High-High", "Low-Low", "High-Low", "Low-High", "Not Sig.")
)

# --- PETA STATIS (bukan satelit) ---
tmap_mode("plot")  # ubah ke mode plot (gambar biasa)

tm_shape(jabar_data) +
  tm_fill(
    "Quadrant",
    palette = c("red", "blue", "orange", "cyan", "grey"),
    title = "LISA Cluster TBC"
  ) +
  tm_borders(col = "black", lwd = 1) +
  tm_text("KabKota", size = 0.6, col = "black") +
  tm_layout(
    main.title = "Peta LISA TBC Jawa Barat (2023)",
    legend.outside = TRUE,
    frame = FALSE
  )

Berdasarkan hasil analisis Local Moran’s I (LISA) pada peta kluster spasial, teridentifikasi beberapa pola keruangan kasus TBC di Jawa Barat. Mayoritas kabupaten/kota menunjukkan warna biru terang yang mengindikasikan tidak adanya autokorelasi spasial yang signifikan, artinya distribusi kasus TBC di wilayah-wilayah tersebut bersifat acak dan tidak membentuk pola klaster dengan wilayah sekitarnya.

Beberapa wilayah menunjukkan pola klaster yang signifikan, di antaranya:
- Kluster High-High (warna merah) teridentifikasi di Kabupaten Bekasi, Kabupaten Bogor, Kota Bekasi, dan Kota Bogor, yang mengindikasikan wilayah-wilayah tersebut memiliki kasus TBC tinggi dan dikelilingi oleh wilayah-wilayah dengan kasus TBC juga cenderung tinggi.
- Kluster Low-Low (warna biru gelap) terlihat di Kabupaten Ciamis, menunjukkan bahwa wilayah tersebut memiliki kasus TBC rendah dan dikelilingi oleh wilayah-wilayah dengan kasus TBC rendah.
- Kluster Low-High (warna biru muda) teridentifikasi di Kabupaten Depok, yang mengindikasikan bahwa meskipun wilayah ini memiliki kasus TBC yang relatif rendah, namun dikelilingi oleh wilayah-wilayah tetangga dengan kasus TBC yang tinggi.

4.3 Estimasi Model

Persiapan Data untuk Estimasi Model Regresi

# Persiapan data untuk regresi
data_regresi <- jabar_data %>%
  st_drop_geometry() %>%
  select(all_of(c(Y_var_dot, X_vars_dot))) %>%
  na.omit()

# Buat formula regresi
formula_ols <- as.formula(paste(Y_var_dot, "~", paste(X_vars_dot, collapse = " + ")))

# Pastikan data spasial sudah bersih dari NA
jabar_data_clean <- jabar_data %>%
  filter(complete.cases(st_drop_geometry(select(., all_of(c(Y_var_dot, X_vars_dot))))))

# Buat neighbors dan weights matrix untuk data clean
nb_clean <- poly2nb(jabar_data_clean, queen = TRUE)
lw_clean <- nb2listw(nb_clean, style = "W", zero.policy = TRUE)

Sebelum dilakukannya pemodelan regresi dengan data yang ada, diperlukan untuk mengetahui ada tidaknya multikolinieritas pada variabel yang digunakan. Pada penelitian ini, metode yang digunakan untuk mendeteksi multikolinieritas adalah dengan VIF (Variance Inflation Factor).

Uji VIF Variabel Independen:

# Uji VIF untuk multikolinieritas
ols_model <- lm(formula_ols, data = data_regresi)
vif_results <- vif(ols_model)
cat("=== UJI MULTIKOLINIERITAS (VIF) ===\n");vif_results

## === UJI MULTIKOLINIERITAS (VIF) ===

## Jumlah.Kasus.Penyakit...HIV.AIDS.Kasus.Baru..X1. 
##                                         1.827541 
##        Jumlah.Penderita...Diabetes.Mellitus..X2. 
##                                         1.747955 
##                 Kepadatan.Penduduk.per.km.2..X3. 
##                                         2.585301 
##                  Persentase.Penduduk.Miskin..X4. 
##                                         2.487639

# Interpretasi VIF
cat("\nInterpretasi VIF:\n");for(i in 1:length(vif_results)) {
  vif_value <- vif_results[i]
  status <- ifelse(vif_value > 10, "Multikolinieritas TINGGI", 
                   ifelse(vif_value > 5, "Multikolinieritas sedang", "Aman"))
  cat(names(vif_results)[i], ":", round(vif_value, 3), "-", status, "\n")
}

## 
## Interpretasi VIF:

## Jumlah.Kasus.Penyakit...HIV.AIDS.Kasus.Baru..X1. : 1.828 - Aman 
## Jumlah.Penderita...Diabetes.Mellitus..X2. : 1.748 - Aman 
## Kepadatan.Penduduk.per.km.2..X3. : 2.585 - Aman 
## Persentase.Penduduk.Miskin..X4. : 2.488 - Aman

Berdasarkan hasil output dari uji multikolinieritas tersebut, diketahui bahwa nilai VIF pada keempat variabel tersebut berada dibawah batas nilai VIF = 5. Maka dari itu, tidak ada indikasi multikolinieritas antar variabel yang digunakan sehingga bisa dilanjutkan dengan pemodelan regresi.

Pemodelan regresi dengan metode OLS, SAR, SEM, dan SDM

# Model OLS (Ordinary Least Square)
ols_model <- lm(formula_ols, data = jabar_data_clean)
# Model SEM (Spatial Error Model)
sem_model <- errorsarlm(formula_ols, data = jabar_data_clean, listw = lw_clean, zero.policy = TRUE)
# Model SAR (Spatial Autoregressive)
sar_model <- lagsarlm(formula_ols, data = jabar_data_clean, listw = lw_clean, zero.policy = TRUE)
# Model SDM (Spatial Durbin Model)
sdm_model <- lagsarlm(formula_ols, data = jabar_data_clean, listw = lw_clean, 
                      type = "mixed", zero.policy = TRUE)

# Hasil keempat model:
cat("-------------------------------------------------------------- \n Hasil Model OLS: \n");summary(ols_model)

## -------------------------------------------------------------- 
##  Hasil Model OLS:

## 
## Call:
## lm(formula = formula_ols, data = jabar_data_clean)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -6025.0 -1387.9   142.7  1761.0  6262.3 
## 
## Coefficients:
##                                                    Estimate Std. Error t value
## (Intercept)                                      6048.59257 4016.62377   1.506
## Jumlah.Kasus.Penyakit...HIV.AIDS.Kasus.Baru..X1.   43.78360   14.11529   3.102
## Jumlah.Penderita...Diabetes.Mellitus..X2.           0.16676    0.05112   3.262
## Kepadatan.Penduduk.per.km.2..X3.                   -0.29133    0.21925  -1.329
## Persentase.Penduduk.Miskin..X4.                  -601.84641  371.80275  -1.619
##                                                  Pr(>|t|)   
## (Intercept)                                       0.14632   
## Jumlah.Kasus.Penyakit...HIV.AIDS.Kasus.Baru..X1.  0.00520 **
## Jumlah.Penderita...Diabetes.Mellitus..X2.         0.00357 **
## Kepadatan.Penduduk.per.km.2..X3.                  0.19754   
## Persentase.Penduduk.Miskin..X4.                   0.11975   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3216 on 22 degrees of freedom
## Multiple R-squared:  0.7277, Adjusted R-squared:  0.6781 
## F-statistic:  14.7 on 4 and 22 DF,  p-value: 5.503e-06

cat("-------------------------------------------------------------- \n Hasil Model SEM: \n");summary(sem_model)

## -------------------------------------------------------------- 
##  Hasil Model SEM:

## 
## Call:
## errorsarlm(formula = formula_ols, data = jabar_data_clean, listw = lw_clean, 
##     zero.policy = TRUE)
## 
## Residuals:
##       Min        1Q    Median        3Q       Max 
## -5912.192  -975.679   -13.246  1878.963  5741.292 
## 
## Type: error 
## Coefficients: (asymptotic standard errors) 
##                                                     Estimate  Std. Error
## (Intercept)                                      3230.487596 3523.735235
## Jumlah.Kasus.Penyakit...HIV.AIDS.Kasus.Baru..X1.   47.411947   10.914634
## Jumlah.Penderita...Diabetes.Mellitus..X2.           0.162053    0.040734
## Kepadatan.Penduduk.per.km.2..X3.                   -0.303909    0.181709
## Persentase.Penduduk.Miskin..X4.                  -301.466694  326.411130
##                                                  z value  Pr(>|z|)
## (Intercept)                                       0.9168   0.35926
## Jumlah.Kasus.Penyakit...HIV.AIDS.Kasus.Baru..X1.  4.3439 1.400e-05
## Jumlah.Penderita...Diabetes.Mellitus..X2.         3.9783 6.941e-05
## Kepadatan.Penduduk.per.km.2..X3.                 -1.6725   0.09443
## Persentase.Penduduk.Miskin..X4.                  -0.9236   0.35571
## 
## Lambda: 0.43305, LR test value: 3.302, p-value: 0.069197
## Approximate (numerical Hessian) standard error: 0.2135
##     z-value: 2.0284, p-value: 0.042523
## Wald statistic: 4.1143, p-value: 0.042523
## 
## Log likelihood: -251.942 for error model
## ML residual variance (sigma squared): 7080000, (sigma: 2660.8)
## Number of observations: 27 
## Number of parameters estimated: 7 
## AIC: 517.88, (AIC for lm: 519.19)

cat("-------------------------------------------------------------- \n Hasil Model SAR: \n");summary(sar_model)

## -------------------------------------------------------------- 
##  Hasil Model SAR:

## 
## Call:
## lagsarlm(formula = formula_ols, data = jabar_data_clean, listw = lw_clean, 
##     zero.policy = TRUE)
## 
## Residuals:
##       Min        1Q    Median        3Q       Max 
## -6603.484  -914.518   -59.336  1739.858  6336.111 
## 
## Type: lag 
## Coefficients: (numerical Hessian approximate standard errors) 
##                                                    Estimate Std. Error z value
## (Intercept)                                      3565.60470 3911.21397  0.9116
## Jumlah.Kasus.Penyakit...HIV.AIDS.Kasus.Baru..X1.   43.88358   12.27004  3.5765
## Jumlah.Penderita...Diabetes.Mellitus..X2.           0.16350    0.04449  3.6749
## Kepadatan.Penduduk.per.km.2..X3.                   -0.32036    0.19159 -1.6721
## Persentase.Penduduk.Miskin..X4.                  -449.55604  340.47196 -1.3204
##                                                   Pr(>|z|)
## (Intercept)                                      0.3619602
## Jumlah.Kasus.Penyakit...HIV.AIDS.Kasus.Baru..X1. 0.0003482
## Jumlah.Penderita...Diabetes.Mellitus..X2.        0.0002379
## Kepadatan.Penduduk.per.km.2..X3.                 0.0945130
## Persentase.Penduduk.Miskin..X4.                  0.1867046
## 
## Rho: 0.15532, LR test value: 1.8582, p-value: 0.17283
## Approximate (numerical Hessian) standard error: 0.11137
##     z-value: 1.3947, p-value: 0.16311
## Wald statistic: 1.9451, p-value: 0.16311
## 
## Log likelihood: -252.6639 for lag model
## ML residual variance (sigma squared): 7817600, (sigma: 2796)
## Number of observations: 27 
## Number of parameters estimated: 7 
## AIC: 519.33, (AIC for lm: 519.19)

cat("-------------------------------------------------------------- \n Hasil Model SDM: \n");summary(sdm_model)

## -------------------------------------------------------------- 
##  Hasil Model SDM:

## 
## Call:
## lagsarlm(formula = formula_ols, data = jabar_data_clean, listw = lw_clean, 
##     type = "mixed", zero.policy = TRUE)
## 
## Residuals:
##       Min        1Q    Median        3Q       Max 
## -5573.397 -1245.378    10.688  1425.476  5005.328 
## 
## Type: mixed 
## Coefficients: (numerical Hessian approximate standard errors) 
##                                                         Estimate  Std. Error
## (Intercept)                                          3702.244253 6776.864234
## Jumlah.Kasus.Penyakit...HIV.AIDS.Kasus.Baru..X1.       42.858724   11.140428
## Jumlah.Penderita...Diabetes.Mellitus..X2.               0.164034    0.045774
## Kepadatan.Penduduk.per.km.2..X3.                       -0.280042    0.178658
## Persentase.Penduduk.Miskin..X4.                        22.474564  327.006943
## lag.Jumlah.Kasus.Penyakit...HIV.AIDS.Kasus.Baru..X1.  -40.888807   27.054642
## lag.Jumlah.Penderita...Diabetes.Mellitus..X2.          -0.020067    0.078572
## lag.Kepadatan.Penduduk.per.km.2..X3.                    0.355961    0.433750
## lag.Persentase.Penduduk.Miskin..X4.                  -376.273333  650.193817
##                                                      z value  Pr(>|z|)
## (Intercept)                                           0.5463 0.5848553
## Jumlah.Kasus.Penyakit...HIV.AIDS.Kasus.Baru..X1.      3.8471 0.0001195
## Jumlah.Penderita...Diabetes.Mellitus..X2.             3.5835 0.0003390
## Kepadatan.Penduduk.per.km.2..X3.                     -1.5675 0.1170034
## Persentase.Penduduk.Miskin..X4.                       0.0687 0.9452061
## lag.Jumlah.Kasus.Penyakit...HIV.AIDS.Kasus.Baru..X1. -1.5113 0.1307014
## lag.Jumlah.Penderita...Diabetes.Mellitus..X2.        -0.2554 0.7984184
## lag.Kepadatan.Penduduk.per.km.2..X3.                  0.8207 0.4118407
## lag.Persentase.Penduduk.Miskin..X4.                  -0.5787 0.5627852
## 
## Rho: 0.40122, LR test value: 2.8262, p-value: 0.092735
## Approximate (numerical Hessian) standard error: 0.21986
##     z-value: 1.8249, p-value: 0.068016
## Wald statistic: 3.3303, p-value: 0.068016
## 
## Log likelihood: -249.9442 for mixed model
## ML residual variance (sigma squared): 6154600, (sigma: 2480.8)
## Number of observations: 27 
## Number of parameters estimated: 11 
## AIC: 521.89, (AIC for lm: 522.71)

Berdasarkan hasil output dari pemodelan keempat model regresi tersebut, didapatkan model regresi sebagai berikut:
- Model OLS: Y = 6048.59257 + 43.78360 X1 + 0.16676 X2 - 0.29133 X3 - 601.84641 X4
- Model SEM: Y = 3230.48760 + 47.41195 X1 + 0.16205 X2 - 0.30391 X3 - 301.46669 X4
- Model SAR: Y = 3565.60470 + 43.88358 X1 + 0.16350 X2 - 0.32036 X3 - 449.55604 X4
- Model SDM: Y = 3702.244 + 42.859 X1 + 0.164 X2 - 0.280 X3 - 22.475 X4 -40.889 WX1 - 0.0201 WX2 + 0.356 WX3 - 376.273 WX4

4.4 Perbandingan dan Interpretasi Model

Untuk menentukan model apa yang harus digunakan, diperlukan untuk melakukan LM (Lagrange Multiplier) test pada model OLS yang sudah dibuat. Apabila tidak ada satupun nilai statistik (Rao Score Error dan Lag, SARMA, serta Adjusted Rao Score Error dan Lag) yang lebih kecil dari nilai taraf signifikansi, maka model OLS menjadi model yang lebih layak digunakan. Namun apabila ada setidaknya salah satu nilai statistik tersebut yang lebih kecil daripada taraf signifikansi yang ditetapkan, maka diperlukan untuk melihat nilai statistik apa yang lebih kecil, sehingga pada akhirnya bisa menghasilkan model regresi yang terbaik.

Hasil uji Lagrange Multiplier

lm_tests <- lm.LMtests(ols_model, listw = lw_clean, test = c("LMerr", "LMlag", "RLMerr", "RLMlag", "SARMA"))
summary(lm_tests)

##  Rao's score (a.k.a Lagrange multiplier) diagnostics for spatial
##  dependence
## data:  
## model: lm(formula = formula_ols, data = jabar_data_clean)
## test weights: listw
##  
##          statistic parameter p.value  
## RSerr      2.89099         1 0.08908 .
## RSlag      2.68678         1 0.10118  
## adjRSerr   0.84509         1 0.35794  
## adjRSlag   0.64088         1 0.42339  
## SARMA      3.53187         2 0.17103  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Melihat dari hasil output tersebut, diketahui bahwa nilai statistik ujinya lebih besar dari alpha jika nilai taraf signifikansi yang ditetapkan adalah 5% atau 0.05. Dengan begitu, maka model terbaik untuk kasus ini adalah model OLS. Namun, apabila taraf signifikansi yang digunakan adalah sebesar 10% atau 0.1, maka terdapat satu nilai statistik yang lebih kecil dari alpha, yaitu nilai Rao Score Error, sehingga model SEM lebih disarankan untuk model kasus TBC di Jawa Barat tahun 2023

Melihat Nilai AIC dan Loglikelihood

models <- list(
  Model_OLS = ols_model,
  Model_SEM = sem_model, 
  Model_SAR = sar_model,
  Model_SDM = sdm_model
)

df <- data.frame(
  AIC = sapply(models, AIC),
  Log_Likelihood = sapply(models, function(m) as.numeric(logLik(m)[1]))
);df

##                AIC Log_Likelihood
## Model_OLS 519.1860      -253.5930
## Model_SEM 517.8840      -251.9420
## Model_SAR 519.3277      -252.6639
## Model_SDM 521.8884      -249.9442

Dari tabel tersebut, terlihat bahwa nilai AIC terkecil dan Log-likelihood terbesar dipegang oleh model regresi SEM. Hal tersebut mendukung pernyataan sebelumnya bahwa Spatial Error Model bisa menjadi opsi model regresi yang digunakan untuk kasus ini, apabila taraf signifikansi yang digunakan adalah 10%. Namun jika taraf signifikansi yang ditetapkan hanya sebesar 5%, maka model OLS tetap menjadi model untuk kasus ini dikarenakan tidak ada indikasi autokorelasi spasial pada kasus Tuberculosis di Provinsi Jawa Barat pada tahun 2023.

4.5 Interpretasi Hasil

Dengan hasil uji tersebut, ada 2 opsi model yang bisa digunakan sebagai model regresi untuk kasus Tuberculosis tahun 2023 di Provinsi Jawa Barat, yaitu:
- Model OLS: Y = 6048.59257 + 43.78360 X1 + 0.16676 X2 - 0.29133 X3 - 601.84641 X4
- Model SEM: Y = 3230.48760 + 47.41195 X1 + 0.16205 X2 - 0.30391 X3 - 301.46669 X4

Model OLS menjadi model terbaik untuk kasus ini apabila taraf signifikansi yang ditetapkan adalah 5%. Sedangkan, model SEM dapat menjadi model terbaik untuk kasus ini apabila taraf signifikansi yang ditetapkan adalah 10%.

BAB V. Kesimpulan

Pada kasus Tuberculosis di Jawa Barat tahun 2023, ditemukan bahwa kasus ini terindikasi adanya clustering yang signifikan secara spasial, terlihat dari hasil Global Moran’s I Test yang mengindikasikan adanya autokorelasi spasial positif pada kasus ini. Selain itu, terlihat juga pada Peta LISA bahwa ada beberapa Kabupaten dan Kota yang terindikasi autokorelasi spasial lainnya, yaitu Low-low pada Kabupaten Ciamis, High-high pada Kabupaten Bekasi, Kabupaten Bogor, Kota Bekasi, dan KotaBogor, serta Low-High pada Kota Depok.

Namun demikian, masalah autokorelasi spasial pada kasus ini berhasil diatasi dengan menggunakan model regresi dengan tujuan untuk menghilangkan autokorelasi spasial. Dengan taraf signifikansi sebesar 5%, model yang paling tepat untuk digunakan pada kasus Tuberkolosis di Jawa Barat tahun 2023 adalah model Ordinary Least Square (OLS), dikarenakan tidak ada satupun nilai statistik (RSerr, RSlag, adjRSerr, adjRSlag, SARMA) uji yang lebih kecil daripada nilai alpha yang ditetapkan. Namun apabila taraf signifikansi dinaikkan ke 10%, maka model yang lebih cocok digunakan adalah Spasial Error Model (SEM) karena didapatkan nilai RSerr yang lebih kecil dari 0.1 yang menandakan adanya autokorelasi spasial pada model tersebut. Hal tersebut juga didukung dengan nilai AIC terkecil dan Log-likelihood terbesar pada model tersebut membuat SEM juga memungkinkan menjadi opsi model yang cocok untuk kasus ini.

Adapun saran untuk penelitian berikutnya adalah fokus pada pembaruan data berdasarkan tahun terakhir data yang ada serta menggunakan variable-variabel dependen yang lebih baik dan mendukung menjadi faktor-faktor penyebaran penyakit Tuberkulosis pada Jawa Barat pada masa yang akan datang.

Daftar Pustaka

Open Data Jabar. (2025). Kepadatan Penduduk Berdasarkan Kabupaten/Kota di Jawa Barat. https://opendata.jabarprov.go.id/id/dataset/kepadatan-penduduk-berdasarkan-kabupatenkota-di-jawa-barat

Open Data Jabar. (2024). Jumlah Penderita Diabeter Melitus Berdasarkan Kabupaten/Kota di Jawa Barat. https://opendata.jabarprov.go.id/id/dataset/jumlah-penderita-diabetes-melitus-berdasarkan-kabupatenkota-di-jawa-barat

Badan Pusat Statistik. (2024). Kasus Penyakit Menurut Kabupaten/Kota dan Jenis Penyakit di Provinsi Jawa Barat, 2023. https://jabar.bps.go.id/id/statistics-table/3/YTA1Q1ptRmhUMEpXWTBsQmQyZzBjVzgwUzB4aVp6MDkjMyMzMjAw/kasus-penyakit-menurut-kabupaten-kota-dan-jenis-penyakit-di-provinsi-jawa-barat.html?year=2023

World Health Organization. (2025). Tuberculosis. https://www.who.int/news-room/fact-sheets/detail/tuberculosis

Rahmadhani, Amanda (2023) GAMBARAN JUMLAH MONOSIT PADA PASIEN YANG BARU TERDIAGNOSIS TUBERKULOSIS DI RSUD KOTA YOGYAKARTA. Diploma thesis, Poltekkes Kemenkes Yogyakarta. https://eprints.poltekkesjogja.ac.id/13358/

Shaweno, D., Karmakar, M., Alene, K., Ragonnet, R., Clements, A., Trauer, J., Denholm, J., & McBryde, E. (2018). Methods used in the spatial analysis of tuberculosis epidemiology: a systematic review. BMC Medicine, 16. https://doi.org/10.1186/s12916-018-1178-4.

Laferani, Y., Makful, M., & Soviadi, N. (2023). Spatial analysis of pediatric pulmonary tuberculosis cases aged 0-14 years in West Java Province. BKM Public Health and Community Medicine. https://doi.org/10.22146/bkm.v39i02.6659.

Rasyid, B. S., Dewi, N. R., Inayati, A. (2025). IMPLEMENTASI EDUKASI KESEHATAN TENTANG PENYAKIT TB PARU TERHADAP PENGETAHUAN PENCEGAHAN PENULARAN PENYAKIT TB PARU. Jurnal Cendekia. https://jurnal.akperdharmawacana.ac.id/index.php/JWC/article/view/694

Lampiran

Data (File .csv) yang Digunakan : https://drive.google.com/file/d/1gOEQIA11p0rTdFN_fv5AcJq7l2eFGhSy/view?usp=drive_link

Peta Chloropeth (Folder .zip) yang Digunakan: https://drive.google.com/file/d/1TjO15P3VvG1w6h09DUY0PbMrv-3SeK4F/view?usp=sharing

Dashboard Kasus TBC di Jawa Barat Tahun 2023: https://nanaurum.shinyapps.io/Dashboard-UTS-Spasial-Stats/