Nama: Fatih Zahrani
NPM: 140610230014
Dosen Pengampu: I Gede Nyoman Mindra Jaya, M.Si., Ph.D.


A. Konsep Teori

Autokorelasi spasial mengukur sejauh mana nilai suatu variabel pada suatu lokasi berhubungan dengan nilai variabel yang sama pada lokasi di sekitarnya.

Autokorelasi Spasial Positif

Autokorelasi spasial positif terjadi ketika unit spasial yang berdekatan cenderung memiliki nilai yang mirip satu sama lain. Ini mencerminkan adanya pola pengelompokan (clustering).Nilai yang tinggi cenderung berdekatan dengan nilai yang tinggi (High-High), dan nilai yang rendah cenderung berdekatan dengan nilai yang rendah (Low-Low).Pola ini sering timbul akibat proses spasial seperti penularan, interaksi sosial, atau pengaruh lingkungan yang seragam di suatu wilayah.

Contoh kasus:

Kecamatan dengan tingkat kasus Diare tinggi cenderung dikelilingi oleh kecamatan lain dengan tingkat kasus Diare yang juga tinggi (High-High Cluster).

Alat Ukur:

Moran’s I jika I > 0, Geary’s C jika C < 1.

Autokorelasi Spasial Negatif

Autokorelasi spasial negatif terjadi ketika unit spasial yang berdekatan cenderung memiliki nilai yang berlawanan atau berbeda satu sama lain. Pola ini sering disebut sebagai pola dispersi atau pola checkerboard. Nilai yang tinggi cenderung dikelilingi oleh nilai yang rendah (High-Low), dan sebaliknya, nilai rendah dikelilingi oleh nilai tinggi (Low-High).

Pola ini jarang terjadi di fenomena alam, namun bisa muncul akibat proses kompetisi, penempatan sumber daya yang sengaja menyebar, atau pengaruh metodologi (misalnya dalam penghitungan rasio).

Contoh Kasus:

Suatu wilayah dengan nilai rata-rata rumah tangga tinggi dikelilingi oleh wilayah dengan nilai rata-rata rumah tangga rendah, dan seterusnya, membentuk pola selang-seling.

Alat Ukur:

Moran’s I jika I < 0, Geary’s C jika C > 1.

Moran’s I fokus pada kovarians dan lebih sensitif terhadap kemiripan nilai secara global. Geary’s C fokus pada variabilitas/perbedaan nilai antar tetangga dan lebih peka terhadap contrast lokal. Jika I≈0 atau C≈1, data dianggap acak (tidak ada autokorelasi spasial global yang signifikan).


Autokorelasi Spasial Positif

Pola ini menunjukkan bahwa nilai-nilai yang tinggi (atau rendah) cenderung bergerombol di wilayah yang berdekatan.

  1. Penyakit Menular (Kasus Diare) cenderung menular dan dipengaruhi oleh faktor lingkungan seperti sanitasi atau sumber air yang sama.

  2. Nilai Properti/Harga Rumah karena harga rumah dipengaruhi oleh fasilitas dan reputasi lingkungan.

  3. Kesenjangan Ekonomi. Tingkat kemiskinan sering kali terjadi di wilayah-wilayah yang berdekatan karena adanya akses sumber daya, pekerjaan, atau kebijakan pembangunan yang terpusat.

Autokorelasi Spasial Negatif

Pola ini menunjukkan bahwa nilai-nilai tinggi dikelilingi oleh nilai-nilai rendah, atau sebaliknya, membentuk pola seperti “catur”.

  1. Lokasi Fasilitas Publik seperti Pasar: Pemerintah berupaya menempatkan pasar baru di wilayah yang jauh dari pasar yang sudah ada untuk menjangkau semua penduduk dan menghindari tumpang tindih layanan.

  2. Spesies Tanaman yang Bersaing : Beberapa jenis tanaman yang sangat kompetitif akan menekan pertumbuhan spesies yang sama di sekitarnya.

  3. Distribusi Kasus yang Dipengaruhi Intervensi: Kecamatan A, kasus rendah, diapit oleh tetangga kasus tinggi


Rumus Matematis Autokorelasi Spasial

Berikut adalah rumus-rumus utama untuk mengukur autokorelasi spasial, di mana \(N\) adalah jumlah unit, \(x_i\) adalah nilai variabel, \(\overline{x}\) adalah rata-rata, dan \(w_{ij}\) adalah elemen Matriks Bobot Spasial (\(W\)).


Moran’s I (Global)

Moran’s \(I\) mengukur kovarians antar lokasi.

\[I=\frac{N}{S_{0}}\cdot\frac{\sum_{i=1}^{N}\sum_{j=1}^{N}w_{ij}(x_{i}-\overline{x})(x_{j}-\overline{x})}{\sum_{i=1}^{N}(x_{i}-\overline{x})^{2}} \text{, di mana } S_{0}=\sum_{i}\sum_{j}w_{ij}.\]


Geary’s C (Global)

Geary’s \(C\) mengukur perbedaan nilai antar tetangga (contrast lokal).

\[C=\frac{(N-1)\sum_{i=1}^{N}\sum_{j=1}^{N}w_{ij}(x_{i}-x_{j})^{2}}{2S_{0}\sum_{i=1}^{N}(x_{i}-\overline{x})^{2}}.\]


Local Moran’s \(I_i\) (LISA)

Local Moran’s \(I_i\) mengidentifikasi cluster dan outlier spasial pada setiap lokasi \(i\).

\[I_{i}=\frac{x_{i}-\overline{x}}{m_{2}}\sum_{j=1}^{N}w_{ij}(x_{j}-\overline{x}),\]

\[\text{dengan } m_{2}=\frac{1}{N}\sum_{k=1}^{N}(x_{k}-\overline{x})^{2}.\]


Getis–Ord \(G_i\) dan \(G_i^*\) (Raw Statistic)

Statistik Getis-Ord digunakan untuk deteksi hot spot dan cold spot.

\(G_i\) (Tanpa memasukkan lokasi \(i\))

\[G_{i}(d)=\frac{\sum_{j\ne i}w_{ij}(d)x_{j}}{\sum_{j\ne i}x_{j}}\]

\(G_i^*\) (Memasukkan lokasi \(i\))

\[G_{i}^{*}(d)=\frac{\sum_{j=1}^{N}w_{ij}(d)x_{j}}{\sum_{j=1}^{N}x_{j}}, \text{ dengan } w_{ii}(d)=1.\]

Catatan: Untuk inferensi (uji hipotesis), umumnya digunakan Z-skor terstandarisasi dari \(G_{i}^{*}\) (\(z(G_{i}^{*})\)).


  • Jelaskan perbedaan utama antara ukuran global dan lokal

Ukuran Global (Moran’s I, Geary’s C)

  1. Cakupannya satu nilai tunggal untuk seluruh wilayah studi.

  2. Mengukur derajat keterkaitan rata-rata atau pola keseluruhan (clustering atau dispersi) di seluruh peta.

  3. Menjawab: “Apakah data memiliki autokorelasi spasial secara signifikan?”

Ukuran Global (Local Moran’s \(I_i\), Getis–Ord \(G_i^*\) )

  1. Cakupannya Satu nilai untuk setiap unit spasial (i) dalam wilayah studi.

  2. Mengidentifikasi lokasi spesifik di mana clustering (hot spot/cold spot) atau outlier spasial terjadi.

  3. Memberikan kesimpulan secara detail, menghasilkan peta cluster atau hot spot.


B. Analisis Data (Simulasi)

  1. Gunakan data spasial kecamatan di Kota Bandung (atau gunakan grid simulasi jika data asli tidak tersedia).

  2. Buat data simulasi kasus penyakit menular (misalnya diare per 10.000 penduduk) untuk 30 kecamatan di Kota Bandung. Gunakan distribusi Poisson dengan rata-rata berbeda antar kecamatan.

  3. Buat peta choropleth dari data simulasi tersebut.

  4. Apa pola spasial yang terlihat secara visual?


Pembahasan

# Memuat library yang dibutuhkan
library(sf)
## Warning: package 'sf' was built under R version 4.3.3
## Linking to GEOS 3.11.2, GDAL 3.8.2, PROJ 9.3.1; sf_use_s2() is TRUE
library(sp)
## Warning: package 'sp' was built under R version 4.3.3
library(spdep)
## Warning: package 'spdep' was built under R version 4.3.3
## Loading required package: spData
## Warning: package 'spData' was built under R version 4.3.3
## To access larger datasets in this package, install the spDataLarge
## package with: `install.packages('spDataLarge',
## repos='https://nowosad.github.io/drat/', type='source')`
library(dplyr)
## Warning: package 'dplyr' was built under R version 4.3.3
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(ggplot2)

# Memuat dan Mempersiapkan Data Peta Asli (dari gadm36_IDN_3_sp.rds)
# Asumsi file berada di folder kerja R.
Indo_Kec <- readRDS("gadm36_IDN_3_sp.rds")
Bandung <- Indo_Kec[Indo_Kec$NAME_2 == "Kota Bandung",]

# Tambahkan ID, lalu konversi ke format sf (sebagai objek spasial dasar)
Bandung$id <- seq_len(nrow(Bandung))
Bandung_sf <- sf::st_as_sf(Bandung)

# Setup Bobot Spasial (Queen Contiguity)
nb <- spdep::poly2nb(sf::as_Spatial(Bandung_sf), queen = TRUE)
lwW <- spdep::nb2listw(nb, style="W") # Row-standardized
N <- nrow(Bandung_sf)

# Parameter Simulasi
set.seed(99) 

# Variabel pengacakan Z dan spatial lag LZ
z <- rnorm(N)
lz <- spdep::lag.listw(lwW, z)

# Model Rata-rata (lambda) menggunakan distribusi Poisson
beta0 <- 1.2
beta1 <- 0.6
beta2 <- 1.0
pop <- round(runif(N, 3000, 8000)) # Populasi simulasi
lambda <- exp(beta0 + beta1 * scale(z) + beta2 * scale(lz))

# Menghitung Kasus (dosis/exposure per 10.000 penduduk)
cases <- rpois(N, lambda = lambda * (pop/10000))

# Membuat data simulasi final
Diare_sim <- dplyr::tibble(id = Bandung_sf$id, pop = pop, cases = cases,
                           rate10k = (cases/pop)*10000)

# Menggabungkan data spasial dengan hasil simulasi
Bandung_merged <- dplyr::left_join(Bandung_sf, Diare_sim, by="id")

# Membuat Peta Choropleth berdasarkan Rate Diare per 10.000
ggplot(Bandung_merged) +
  geom_sf(aes(fill = rate10k), color="white", size=0.2) +
  scale_fill_viridis_c(option="magma") + # Menggunakan skema warna magma
  labs(title="Rate Diare (per 10.000) - Simulasi pada Peta Asli", fill="Rate") +
  theme_minimal()

Analisis Pola Visual

Peta Choropleth menunjukkan bahwa nilai-nilai yang mirip cenderung berkelompok di lokasi yang berdekatan, bukan tersebar secara acak.

Berdasarkan peta choropleth diatas, pola spasial yang terlihat secara visual adalah Autokorelasi Spasial Positif atau Clustering. Pola ini mengindikasikan adanya ketergantungan spasial (spatial dependency). Clustering yang terbentuk secara visual ini sesuai dengan tujuan simulasi, di mana kasus penyakit menular umumnya menunjukkan pengelompokan (Moran’s I > 0).

  1. High-High Clustering (Hot Spot)

Wilayah dengan Rate Diare tinggi (ditandai dengan warna paling terang, biasanya kuning hingga putih/merah dalam skema magma) terkonsentrasi dan dikelilingi oleh wilayah lain yang juga memiliki nilai tinggi. Secara visual pada peta simulasi, ini terlihat jelas di klaster bagian Timur/Tenggara peta.

  1. Low-Low Clustering (Cold Spot)

Wilayah dengan Rate Diare rendah (ditandai dengan warna paling gelap, yaitu ungu atau hitam) juga berkumpul di beberapa bagian peta (misalnya di bagian Barat dan Utara).


C. Pengukuran Autokorelasi

  • 1. Hitung Moran’s I untuk data simulasi kasus diare di Kota Bandung.

      1. Berapa nilai Moran’s I?
      1. Apakah signifikan secara statistik (uji permutasi)?
      1. Apa artinya bagi pola spasial penyakit?

Pembahasan

a. Berapa nilai Moran’s I?

# Pastikan Bandung_merged dan lwW sudah terdefinisi dari Bagian B.
# Menghitung Moran’s I (dua sisi)
moran_res <- spdep::moran.test(Bandung_merged$rate10k, lwW,
                               randomisation = TRUE, alternative = "two.sided")

# Menampilkan hasil
moran_res
## 
##  Moran I test under randomisation
## 
## data:  Bandung_merged$rate10k  
## weights: lwW    
## 
## Moran I statistic standard deviate = 2.6834, p-value = 0.007287
## alternative hypothesis: two.sided
## sample estimates:
## Moran I statistic       Expectation          Variance 
##       0.232684592      -0.034482759       0.009912455

Jawaban: Nilai Moran’s I yang didapatkan adalah 0.2326


b. Apakah signifikan secara statistik (uji permutasi)? Karena pvalue (0.007) kurang dari tingkat signifikansi umum (α=0.05), kita menolak Hipotesis Nol (H0). Kesimpulannya pola spasial tersebut tidak acak.


c. Apa artinya bagi pola spasial penyakit? Nilai Moran’s I (0.2326) adalah positif (karena lebih besar dari 0 dan jauh lebih besar dari nilai ekspektasi (−0.03448). Ini mengindikasikan adanya Autokorelasi Spasial Positif yang berarti unit-unit spasial yang berdekatan cenderung memiliki nilai yang mirip.

Interpretasi untuk kasus diare:

Kecamatan dengan rate Diare tinggi cenderung dikelilingi oleh kecamatan dengan rate Diare tinggi (Hot Spot).

Kecamatan dengan rate Diare rendah cenderung dikelilingi oleh kecamatan dengan rate Diare rendah (Cold Spot).

Kesimpulannya: kasus Diare simulasi di Kota Bandung tersebar dalam pola clustering yang signifikan, bukan secara acak.


  • 2. Hitung Geary’s C

      1. Bagaimana perbandingannya dengan Moran’s I?
      1. Jelaskan perbedaan sensitivitas kedua ukuran ini

Pembahasan


a. Hitung Geary’s C. Bagaimana perbandingannya dengan Moran’s I?

# Pastikan Bandung_merged (rate10k) dan lwW sudah terdefinisi.
# Menghitung Geary’s C (dua sisi)
geary_res <- spdep::geary.test(Bandung_merged$rate10k, lwW,
                               randomisation = TRUE, alternative = "two.sided")

# Menampilkan hasil
geary_res
## 
##  Geary C test under randomisation
## 
## data:  Bandung_merged$rate10k 
## weights: lwW   
## 
## Geary C statistic standard deviate = 2.4895, p-value = 0.01279
## alternative hypothesis: two.sided
## sample estimates:
## Geary C statistic       Expectation          Variance 
##        0.67292616        1.00000000        0.01726162

Hasil Perbandingan:

  • Moran’s I (0.1643): Nilai positif (I > 0) mengonfirmasi bahwa unit-unit spasial yang memiliki nilai serupa (tinggi-tinggi atau rendah-rendah) cenderung berdekatan (berautokorelasi positif)

  • Geary’s C (0.6729): Nilai kurang dari 1 (C < 1) juga mengonfirmasi adanya Autokorelasi Positif, yang berarti perbedaan nilai antara unit yang bertetangga adalah kecil (mereka mirip)

Artinya kedua statistik global tersebut sepakat bahwa distribusi rate Diare simulasi di Kota Bandung menunjukkan clustering (pengelompokan) yang signifikan secara statistik.


b. Jelaskan perbedaan sensitivitas kedua ukuran ini

  • Moran’s I : sensitif terhadap kovarians antar lokasi. Lebih peka terhadap kemiripan global dan mengukur seberapa besar nilai unit spasial menyerupai tetangganya (analog dengan koefisien korelasi Pearson).

  • Geary’s C : sensitif terhadap variasi/Perbedaan antar tetangga. Lebih peka terhadap contrast lokal (seberapa besar nilai unit spasial berbeda dari tetangganya).


  • 3. Hitung Local Moran’s I (LISA)

      1. Identifikasi kecamatan yang masuk kategori High-High, Low-Low, High-Low, dan Low-High.
      1. Buat peta cluster LISA.
      1. Apa interpretasi hasil ini untuk kasus penyakit menular?

Pembahasan


x <- scale(Bandung_merged$rate10k)[,1]
lagx <- spdep::lag.listw(lwW, x)

lisa <- spdep::localmoran(x, lwW,
                          alternative = "two.sided",
                          zero.policy = TRUE)

lisa_df <- as.data.frame(lisa)
names(lisa_df) <- c("Ii","Ei","Vi","Zi","Pi.two.sided")

alpha <- 0.05
quad <- dplyr::case_when(
  x >= 0 & lagx >= 0 ~ "High-High",
  x < 0 & lagx < 0 ~ "Low-Low",
  x >= 0 & lagx < 0 ~ "High-Low (Outlier)",
  x < 0 & lagx >= 0 ~ "Low-High (Outlier)"
)

Bandung_LISA <- dplyr::bind_cols(Bandung_merged, lisa_df) |>
  dplyr::mutate(quad = ifelse(Pi.two.sided <= alpha, quad, "Not significant"))

ggplot(Bandung_LISA) +
  geom_sf(aes(fill = quad), color = "white", size = 0.2) +
  scale_fill_manual(values = c(
    "High-High" = "#d73027",
    "Low-Low" = "#4575b4",
    "High-Low (Outlier)" = "#fdae61",
    "Low-High (Outlier)" = "#74add1",
    "Not significant" = "grey85"
  )) +
  labs(
    title = "Local Moran's I (LISA)",
    fill = "Kategori"
  ) +
  theme_minimal()

Interpretasi:

Cluster Hot spot (High-High) → kasus diare tinggi dan wilayah sekitarnya juga tinggi, indikasi cluster penyebaran penyakit. Perlu intervensi prioritas: perbaikan sanitasi, penyediaan air bersih, dan edukasi perilaku hidup bersih.

Outlier (Low-High) → kasus kecamatan ini sendiri rendah, tapi dikelilingi oleh kecamatan dengan kasus tinggi. Perlu monitoring intensif agar tidak berubah menjadi wilayah baru dengan kasus tinggi.

Wilayah lain (Nonsignificant, White) → kasusnya tidak menunjukkan pola spasial yang kuat (bisa acak atau rata-rata normal). Harus tetap dipantau, tapi prioritas pencegahan difokuskan ke cluster signifikan.


  • 4. Hitung Getis–Ord Getis–Ord \(G_i^*\)

      1. Tentukan kecamatan yang termasuk hot spot dan cold spot.
      1. Bandingkan hasilnya dengan peta LISA.
      1. Apakah ada perbedaan wilayah yang ditandai sebagai klaster signifikan?

Pembahasan

library(spdep)
library(dplyr)
library(ggplot2)

# --- Variabel yang dipakai
x <- Bandung_merged$rate10k

# --- Hitung statistik Getis-Ord Gi*
gi_star <- spdep::localG(x, listw = lwW, zero.policy = TRUE)

# --- Simpan hasil ke data frame
Bandung_G <- Bandung_merged %>%
  mutate(Gi_star = as.numeric(gi_star),
         hotcold = case_when(
           Gi_star >= 1.96 ~ "Hot spot (p < 0.05)",   # signifikan tinggi
           Gi_star <= -1.96 ~ "Cold spot (p < 0.05)", # signifikan rendah
           TRUE ~ "Not significant"
         ))

# --- Peta hot spot / cold spot
ggplot(Bandung_G) +
  geom_sf(aes(fill = hotcold), color = "white", size = 0.2) +
  scale_fill_manual(values = c(
    "Hot spot (p < 0.05)" = "#b2182b",
    "Cold spot (p < 0.05)" = "#2166ac",
    "Not significant" = "grey85"
  )) +
  labs(title = "Getis–Ord Gi* (Hot/Cold Spots)", fill = NULL) +
  theme_minimal()

Pembahasan

a. Kecamatan yang termasuk hot spot dan cold spot Pada peta terlihat ada beberapa kecamatan di tengah dan selatan Kota Bandung berwarna merah → Hot spot (p < 0.05). Artinya wilayah tersebut memiliki kasus diare tinggi, dan dikelilingi oleh wilayah dengan kasus tinggi juga. Tidak ada kecamatan yang terdeteksi sebagai Cold spot (biru).

b. Perbandingan dengan peta LISA LISA menunjukkan: Beberapa kecamatan High-High (hot spot) di bagian tengah & selatan. Ada 1 kecamatan kategori Low-High (outlier) → kasus rendah tapi dikelilingi kasus tinggi.

Getis–Ord Gi* menunjukkan: Wilayah hot spot di bagian tengah & selatan (mirip dengan LISA untuk kategori High-High). Tidak menandai outlier (misalnya Low-High), hanya fokus pada hot spot murni.

c. Apakah ada perbedaan wilayah signifikan? Ya, ada perbedaan kecil: LISA bisa mengidentifikasi outlier spasial (misalnya Low-High atau High-Low). Getis–Ord Gi* hanya mengidentifikasi kelompok signifikan (hot spot / cold spot), sehingga wilayah outlier dari LISA tidak muncul.

Namun, keduanya sama-sama mengonfirmasi adanya cluster hot spot di tengah & selatan Kota Bandung, yang berarti area ini memang daerah rawan penyebaran diare.


  • 5. Diskusi

      1. Bagaimana hasil analisis autokorelasi spasial bisa membantu dinas kesehatan dalam menyusun strategi pencegahan dan intervensi penyakit menular di Kota Bandung?
      1. Sebutkan keterbatasan dari analisis autokorelasi spasial, misalnya terkait dengan:MAUP(Modifiable Areal Unit Problem), Ukuran bobot spasial (rook, queen, k-nearest neighbors), Masalah multiple testing pada analisis lokal

a. Peran Analisis Autokorelasi Spasial dalam Strategi Dinas Kesehatan

Hasil analisis autokorelasi spasial (Moran’s I dan LISA) memberikan landasan analitis yang diperlukan Dinas Kesehatan Kota Bandung untuk menyusun strategi intervensi penyakit menular yang efektif dan efisien.

Penargetan Intervensi yang Presisi (LISA): Peta LISA mengidentifikasi secara visual dan statistik lokasi High-High (Hot Spot) yang merupakan klaster risiko tinggi di mana penyakit tidak hanya tinggi tetapi juga didorong oleh faktor lingkungan tetangganya. Sumber daya (misalnya, tim kesehatan, anggaran sanitasi) dapat dialokasikan langsung ke kecamatan-kecamatan Hot Spot ini untuk efisiensi maksimum.

Justifikasi Model Spasial (Global Moran’s I): Nilai Global Moran’s I yang signifikan secara statistik (\(0.2326\)) memvalidasi bahwa kasus penyakit dependen secara spasial. Ini memberikan bukti kepada Dinas Kesehatan bahwa mereka tidak boleh menggunakan model statistik standar (non-spasial) untuk menganalisis faktor risiko penyakit, melainkan harus menggunakan Model Regresi Spasial (SLM/SEM) yang memperhitungkan keterkaitan tetangga.


b. Keterbatasan Analisis Autokorelasi Spasial

Meskipun kuat, analisis autokorelasi spasial memiliki beberapa keterbatasan metodologis yang harus diakui dalam interpretasinya:

i) MAUP (Modifiable Areal Unit Problem) MAUP menyatakan bahwa hasil analisis (termasuk Moran’s I) sensitif terhadap cara unit spasial didefinisikan atau dikelompokkan (batas administratif). Jika analisis dilakukan pada level kelurahan dan bukan level kecamatan, hasilnya bisa berubah drastis, sehingga kesimpulan yang ditarik bersifat modificable dan terikat pada unit spasial yang digunakan.

ii) Ukuran Bobot Spasial (Rook, Queen, kNN) Matriks bobot spasial (\(W\)) mendefinisikan hubungan ketetanggaan dan menjadi fondasi perhitungan.

Keterbatasan: Pemilihan antara Rook (berbagi sisi), Queen (berbagi sisi atau sudut), atau k-Nearest Neighbors (kNN) bersifat subjektif dan dapat memengaruhi nilai statistik Moran’s I dan identifikasi klaster lokal.

iii) Masalah Multiple Testing pada Analisis Lokal Analisis LISA atau Getis-Ord melakukan uji hipotesis terpisah (misalnya, \(p < 0.05\)) untuk setiap unit spasial (\(N\) unit)

Keterbatasan: Melakukan banyak pengujian secara bersamaan meningkatkan risiko kesalahan Tipe I (False Positive) secara drastis, yaitu mengidentifikasi klaster sebagai signifikan padahal sebenarnya acak. Analisis yang ketat sering memerlukan koreksi untuk Multiple Testing (seperti Bonferroni atau False Discovery Rate/FDR) untuk menjaga keandalan hasil, meskipun koreksi ini dapat membuat beberapa klaster yang valid menjadi tidak signifikan.