Dalam analisis statistik klasik, salah satu asumsi mendasar yang sering digunakan adalah adanya independensi antar pengamatan (saling bebas). Artinya, nilai suatu variabel pada satu unit observasi dianggap tidak dipengaruhi oleh nilai variabel pada unit observasi lainnya. Namun, dalam data yang memiliki referensi geografis atau keruangan (data spasial), asumsi ini sering kali tidak terpenuhi. Fenomena ini terjadi karena karakteristik suatu wilayah sering kali dipengaruhi oleh karakteristik wilayah di sekitarnya, baik karena faktor kedekatan geografis, interaksi sosial, maupun penyebaran fenomena alam.
Konsep ketergantungan antar wilayah ini dikenal dengan istilah autokorelasi spasial (spatial autocorrelation). Hal ini sejalan dengan Hukum Geografi Pertama yang dikemukakan oleh Tobler (1970), yang menyatakan bahwa “Segala sesuatu saling berhubungan dengan hal lainnya, tetapi sesuatu yang dekat memiliki hubungan yang lebih kuat daripada sesuatu yang jauh”. Mengabaikan efek spasial dalam analisis data kewilayahan dapat menyebabkan kesalahan dalam penarikan kesimpulan, seperti bias pada estimasi parameter atau ketidaktepatan dalam identifikasi pola penyebaran masalah.
Autokorelasi spasial berfungsi untuk mengidentifikasi pola penyebaran suatu variabel, apakah membentuk pola mengelompok (cluster), menyebar (dispersed), atau acak (random). Deteksi pola ini sangat penting dalam berbagai bidang, seperti epidemiologi untuk memetakan penyebaran penyakit, ekonomi untuk melihat klaster kemiskinan, hingga klimatologi. Untuk mengukur tingkat autokorelasi spasial, terdapat beberapa metode statistik yang umum digunakan, di antaranya adalah Indeks Moran (Moran’s I) dan Indeks Geary (Geary’s C).
Indeks Moran umumnya digunakan untuk melihat autokorelasi spasial secara global dengan membandingkan kovarians antar lokasi, sedangkan Indeks Geary lebih sensitif terhadap perbedaan lokal dengan menggunakan pendekatan kuadrat selisih nilai antar lokasi. Kedua metode ini memberikan perspektif yang saling melengkapi dalam memahami struktur spasial data. Oleh karena itu, penelitian ini akan menerapkan analisis autokorelasi spasial menggunakan kedua metode tersebut untuk mengetahui pola hubungan dan ketergantungan antar wilayah pada data yang diamati.
Adapun rumusan masalah pada penelitian kali ini adalah sebagai berikut;
Berdasarkan rumusan masalah maka didapatkan tujuan penelitian kali ini adalah sebagai berikut:
Autokorelasi spasial merupakan suatu ukuran kemiripan antar objek dalam suatu ruang, dengan kata lain autokrelasi adalah korelasi antar variabel pada dirinya sendiri berdasarkan ruang. Jika nilai pada suatu wilayah tertentu memiliki keterkaitan dengan wilayah lainnya maka dapat dikatakan pada wilayah-wilayah tersebut terdapat autokorelasi spasial. Autokrelasi spasial terbagi atas autokorelasi spasial positif, autokorelasi spasial negatif dan tidak terdapat autokorelasi spasial (Agwil dan Hidayati, 2023).
Autokorelasi spasial merupakan konsep fundamental dalam analisis spasial yang mengukur tingkat ketergantungan antar nilai atribut pada lokasi-lokasi yang berdekatan. Konsep ini berakar pada Hukum Geografi Pertama yang dikemukakan oleh Tobler (1970), yang menyatakan bahwa segala sesuatu saling berhubungan dengan hal lainnya, tetapi sesuatu yang dekat memiliki hubungan yang lebih kuat dibandingkan dengan sesuatu yang jauh.
Menurut Anselin (1988), autokorelasi spasial dapat didefinisikan sebagai hubungan fungsional antara nilai variabel \(Y\) di lokasi \(i\) dengan nilai variabel yang sama di lokasi \(j\) (\(i \neq j\)). Hubungan ini bisa bersifat:
Dalam perhitungannya, autokorelasi spasial sangat bergantung pada Matriks Pembobot Spasial (\(W\)). Lee dan Wong (2001) menjelaskan bahwa matriks ini merepresentasikan hubungan kedekatan antar wilayah, baik berdasarkan persinggungan batas (contiguity) maupun berdasarkan jarak (distance).
Indeks Moran (\(I\)) adalah statistik yang paling luas digunakan untuk mendeteksi autokorelasi spasial global. Metode ini dikembangkan oleh Patrick Alfred Pierce Moran pada tahun 1950. Indeks Moran pada dasarnya membandingkan nilai kovarians antar lokasi dengan varians data secara keseluruhan.
Secara matematis, Indeks Moran dirumuskan sebagai berikut:
\[ I = \frac{n}{\sum_{i=1}^{n} \sum_{j=1}^{n} w_{ij}} \frac{\sum_{i=1}^{n} \sum_{j=1}^{n} w_{ij}(x_i - \bar{x})(x_j - \bar{x})}{\sum_{i=1}^{n} (x_i - \bar{x})^2} \]
Dimana:
Nilai Indeks Moran berkisar antara -1 hingga +1.
Untuk menguji signifikansi autokorelasi spasial, digunakan nilai statistik \(Z\) atau Z-score. Menurut Cliff dan Ord (1981), jika nilai \(|Z_{hitung}| > Z_{\alpha/2}\), maka tolak \(H_0\), yang berarti terdapat autokorelasi spasial yang signifikan pada taraf nyata \(\alpha\).
\[ Z(I) = \frac{I - E(I)}{\sqrt{Var(I)}} \]
Metode lain yang sering digunakan sebagai pembanding Indeks Moran adalah Indeks Geary (\(C\)), atau dikenal sebagai Geary’s Ratio. Berbeda dengan Moran yang menggunakan produk silang dari deviasi rata-rata (mirip korelasi Pearson), Indeks Geary menggunakan kuadrat selisih antar nilai observasi pada lokasi bertetangga.
Rumus Indeks Geary adalah:
\[ C = \frac{(n-1) \sum_{i=1}^{n} \sum_{j=1}^{n} w_{ij} (x_i - x_j)^2}{2 (\sum_{i=1}^{n} \sum_{j=1}^{n} w_{ij}) \sum_{i=1}^{n} (x_i - \bar{x})^2} \]
Rentang nilai Indeks Geary berbeda dengan Indeks Moran, yaitu berkisar antara 0 hingga 2:
Sokal dan Oden (1978) mencatat bahwa Indeks Geary cenderung lebih sensitif terhadap perbedaan lokal (heterogenitas spasial) dibandingkan Indeks Moran yang lebih stabil dalam melihat pola global. Oleh karena itu, penggunaan kedua indeks ini secara bersamaan sering disarankan untuk mendapatkan gambaran struktur spasial yang lebih komprehensif.
Data yang digunakan dalam penelitian ini adalah data sekunder yang diperoleh dari paket data bawaan dalam perangkat lunak R, yaitu paket `spdep` dan `sf`. Dataset tersebut adalah data *North Carolina SIDS* (*Sudden Infant Death Syndrome*) yang memuat informasi spasial dan atribut kesehatan dari 100 *counties* (kabupaten) di negara bagian North Carolina, Amerika Serikat. Penelitian ini secara spesifik menggunakan data jumlah kasus kematian mendadak pada bayi (SIDS) yang tercatat pada tahun 1974. Data spasial direpresentasikan dalam format *shapefile* poligon yang memuat batas-batas administrasi setiap kabupaten.
Variabel yang digunakan dalam analisis ini terdiri dari variabel
pengamatan utama dan variabel unit spasial. Fokus utama penelitian ini
adalah variabel Jumlah Kasus SIDS 1974 (SID74), yaitu
variabel numerik yang merepresentasikan total kejadian kematian mendadak
pada bayi (Sudden Infant Death Syndrome) di setiap kabupaten
selama periode tahun 1974. Variabel ini digunakan untuk mendeteksi
keberadaan pola autokorelasi spasial. Sebagai acuan keruangan, digunakan
variabel Nama Kabupaten (NAME) yang berfungsi sebagai unit
spasial. Variabel ini memuat identitas wilayah administrasi dari 100
kabupaten di North Carolina dan berperan krusial dalam penentuan lokasi
serta proses pembentukan matriks pembobot spasial (spatial weights
matrix) dalam analisis selanjutnya.
Prosedur analisis data dilakukan dengan bantuan perangkat lunak RStudio. Langkah-langkah analisis yang dilakukan adalah sebagai berikut:
# 1. Load Library
library(sf)
library(spdep)
library(ggplot2)
# 2. Load Data Bawaan R (North Carolina SIDS)
# Mengambil file shapefile yang tersimpan di dalam folder instalasi library 'sf'
nc_file <- system.file("shape/nc.shp", package="sf")
peta <- st_read(nc_file)## Reading layer `nc' from data source `D:\apps\R-4.5.2\library\sf\shape\nc.shp' using driver `ESRI Shapefile'
## Simple feature collection with 100 features and 14 fields
## Geometry type: MULTIPOLYGON
## Dimension: XY
## Bounding box: xmin: -84.32385 ymin: 33.88199 xmax: -75.45698 ymax: 36.58965
## Geodetic CRS: NAD27
# Kita akan menganalisis variabel 'SID74' (Jumlah kasus SIDS tahun 1974)
# Nama variabel kita simpan ke objek 'data_var' agar mudah diganti-ganti
data_var <- peta$SID74
nama_wilayah <- peta$NAME # Nama Kabupaten untuk label
# Tampilkan 6 data teratas
head(peta[, c("NAME", "SID74")])## Simple feature collection with 6 features and 2 fields
## Geometry type: MULTIPOLYGON
## Dimension: XY
## Bounding box: xmin: -81.74107 ymin: 36.07282 xmax: -75.77316 ymax: 36.58965
## Geodetic CRS: NAD27
## NAME SID74 geometry
## 1 Ashe 1 MULTIPOLYGON (((-81.47276 3...
## 2 Alleghany 0 MULTIPOLYGON (((-81.23989 3...
## 3 Surry 5 MULTIPOLYGON (((-80.45634 3...
## 4 Currituck 1 MULTIPOLYGON (((-76.00897 3...
## 5 Northampton 9 MULTIPOLYGON (((-77.21767 3...
## 6 Hertford 7 MULTIPOLYGON (((-76.74506 3...
nc <- st_read(system.file("shape/nc.shp", package="sf"), quiet = TRUE)
data_var <- nc$SID74
# 2. Statistik Deskriptif (Min, 1st Qu, Median, Mean, 3rd Qu, Max)
summary(data_var)## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00 2.00 4.00 6.67 8.25 44.00
Berdasarkan hasil diatas maka didapatkan bahwa pada data tersebut didapatkan nilai minimum adalah 0 yang berarti terdapat kabupaten yang tidak memiliki kasus SIDS, dengan quartil 1 adalah 2, yang berarti sebanyak 25% kabupaten memiliki jumlah kasus 2 atau kurang. Dari nilai mean, median, dan modus didapatkan data menceng ke kanan yang berarti data tidak berdistribusi normal. Terdapat juga outlier yang dapat dilihat dari nilai rata-rata lebih tinggi karena adanya segelintir kabupaten yang kasusnya sangat esktrem, padahal mayoritas kabupaten cuma punya 4 kasus.
# 1. Membuat Tetangga (Queen Contiguity)
nb <- poly2nb(peta, queen = TRUE)
# 2. Membuat Matriks Pembobot (Row Standardized)
listw <- nb2listw(nb, style = "W")
# --- C. INDEKS MORAN (MORAN'S I) ---
# Uji Moran
moran_result <- moran.test(data_var, listw)
print("--- HASIL UJI INDEKS MORAN ---")## [1] "--- HASIL UJI INDEKS MORAN ---"
##
## Moran I test under randomisation
##
## data: data_var
## weights: listw
##
## Moran I statistic standard deviate = 2.5192, p-value = 0.00588
## alternative hypothesis: greater
## sample estimates:
## Moran I statistic Expectation Variance
## 0.147740529 -0.010101010 0.003925567
Berdasarkan output analisis Indeks Moran di atas, berikut adalah pengujian hipotesis untuk menentukan keberadaan autokorelasi spasial:
1. Hipotesis
\[ \begin{aligned} H_0 &: I = 0 \text{ (Tidak terdapat autokorelasi spasial antar lokasi)} \\ H_1 &: I > 0 \text{ (Terdapat autokorelasi spasial positif / Pola Mengelompok)} \end{aligned} \]
Catatan: Hipotesis alternatif (\(H_1\)) dinyatakan “lebih besar dari 0”
karena output R menunjukkan
alternative hypothesis: greater.
2. Tingkat Signifikansi
Tingkat kepercayaan yang digunakan adalah 95% atau taraf nyata \(\alpha = 0.05\).
3. Statistik Uji
Berdasarkan hasil output R, diperoleh nilai-nilai sebagai berikut:
4. Kriteria Keputusan
5. Keputusan
Dikarenakan nilai \(P\text{-value} (0.00588) < \alpha (0.05)\), maka keputusannya adalah Tolak\(H_0\). Selain itu, nilai Indeks Moran (\(I = 0.1477\)) lebih besar dari nilai harapan (\(E(I) = -0.0101\)) dan nilai Z-hitung (\(2.5192\)) bernilai positif, yang mengindikasikan arah hubungan positif. Dengan tingkat kepercayaan 95%, dapat disimpulkan bahwa terdapat autokorelasi spasial positif yang signifikan pada data tersebut. Hal ini menunjukkan bahwa lokasi-lokasi yang berdekatan memiliki nilai karakteristik yang cenderung mirip (nilai tinggi dikelilingi nilai tinggi, atau nilai rendah dikelilingi nilai rendah), sehingga membentuk pola pengelompokan (cluster) secara spasial.
# Visualisasi Moran Scatterplot
moran.plot(data_var, listw,
labels = as.character(nama_wilayah),
xlab = "Kasus SIDS",
ylab = "Lag Spatial Kasus SIDS",
main = "Moran Scatterplot - North Carolina")Grafik diatas menggambarkan hubungan antara nilai suatu wilayah (Sumbu X) dengan rata-rata nilai tetangganya (Sumbu Y). Garis putus-putus membagi grafik menjadi 4 kuadran.Analisis ini menunjukkan bahwa penyebaran kasus SIDS di North Carolina memiliki pola mengelompok (cluster). Ada klaster daerah aman (Low-Low) yang dominan, klaster daerah rawan (High-High seperti Robeson), serta daerah unik yang kasusnya meledak sendirian (Mecklenburg).
## [1] "--- HASIL UJI KOEFISIEN GEARY ---"
##
## Geary C test under randomisation
##
## data: data_var
## weights: listw
##
## Geary C statistic standard deviate = 1.9591, p-value = 0.02505
## alternative hypothesis: Expectation greater than statistic
## sample estimates:
## Geary C statistic Expectation Variance
## 0.843876721 1.000000000 0.006350747
Selain Indeks Moran, analisis autokorelasi spasial juga dilakukan menggunakan Koefisien Geary (Geary’s C) untuk melihat sensitivitas hubungan antar wilayah tetangga berdasarkan perbedaan nilai kuadratnya. Berikut adalah hasil pengujiannya:
1. Hipotesis
\[ \begin{aligned} H_0 &: C = 1 \text{ (Tidak terdapat autokorelasi spasial / Pola Acak)} \\ H_1 &: C < 1 \text{ (Terdapat autokorelasi spasial positif / Pola Mengelompok)} \end{aligned} \]
Catatan: Hipotesis alternatif (\(H_1\)) dinyatakan \(C < 1\) karena output R menunjukkan “alternative hypothesis: Expectation greater than statistic”, yang berarti nilai Harapan (1) lebih besar dari statistik hitung (\(C\)).
2. Tingkat Signifikansi
Tingkat kepercayaan yang digunakan adalah 95% atau taraf nyata \(\alpha = 0.05\).
3. Statistik Uji
Berdasarkan hasil output R, diperoleh nilai-nilai sebagai berikut:
4. Kriteria Keputusan
5. Keputusan
Dikarenakan nilai \(P\text{-value} (0.02505) < \alpha (0.05)\), maka keputusannya adalah Tolak \(H_0\). Selain itu, nilai statistik Geary (\(C = 0.8439\)) lebih kecil dari 1 (nilai harapan). Dalam Koefisien Geary, nilai \(0 < C < 1\) mengindikasikan adanya autokorelasi positif. Dengan tingkat kepercayaan 95%, dapat disimpulkan bahwa terdapat autokorelasi spasial positif yang signifikan. Hasil ini konsisten dengan Indeks Moran, di mana lokasi-lokasi yang berdekatan memiliki perbedaan nilai yang kecil (mirip), sehingga membentuk pola pengelompokan (cluster).
Analisis autokorelasi spasial menggunakan Indeks Moran dilakukan dengan membandingkan nilai kovarians antar lokasi yang bertetangga terhadap varians data secara keseluruhan, yang dimediasi oleh matriks pembobot spasial (spatial weights matrix). Metode ini menghasilkan nilai statistik (\(I\)) dengan rentang -1 hingga +1 untuk mendeteksi pola global. Pengujian parameternya dilakukan melalui uji hipotesis dengan \(H_0\) yang menyatakan bahwa data menyebar secara acak (\(I=0\)). Keputusan pengujian didasarkan pada perbandingan nilai \(P\text{-value}\) dengan taraf nyata \(\alpha\) (0.05) dan nilai \(Z\)-hitung; jika \(P\text{-value} < \alpha\) dan \(Z\)-hitung positif, maka disimpulkan terdapat autokorelasi spasial positif atau pola pengelompokan (cluster).
Sementara itu, analisis menggunakan Indeks Geary (Geary’s C) menggunakan pendekatan kuadrat selisih nilai antar lokasi, yang membuatnya lebih sensitif terhadap perbedaan lokal dibandingkan pola global. Statistik ini memiliki nilai harapan sebesar 1, di mana nilai \(C < 1\) mengindikasikan autokorelasi positif (kemiripan nilai antar tetangga) dan \(C > 1\) mengindikasikan autokorelasi negatif (ketidakmiripan). Pengujian parameternya menggunakan prinsip yang sama dengan Indeks Moran, yaitu membandingkan statistik hitung dengan nilai harapan melalui uji-Z. Jika \(H_0\) (\(C=1\)) ditolak dengan nilai statistik \(C\) yang signifikan di bawah angka 1, maka terbukti adanya hubungan spasial yang bersifat mengelompok.
Berdasarkan hasil analisis pada data kasus SIDS di North Carolina, kedua metode memberikan kesimpulan yang konsisten dan signifikan secara statistik. Uji Indeks Moran menghasilkan nilai \(I = 0.1477\) (\(P\text{-value} = 0.0058\)) dan Uji Indeks Geary menghasilkan nilai \(C = 0.8439\) (\(P\text{-value} = 0.025\)), di mana kedua nilai \(P\text{-value} < 0.05\). Hal ini mengonfirmasi bahwa sebaran penyakit tersebut memiliki pola autokorelasi spasial positif (clustered). Artinya, wilayah dengan kasus SIDS tinggi cenderung dikelilingi oleh wilayah dengan kasus tinggi pula, sebagaimana dikonfirmasi oleh visualisasi Moran Scatterplot yang menunjukkan dominasi pola pada kuadran Low-Low dan High-High.
Agwil, W & Hidayati, N. (2003). Modul Pengantar Statistik Spasial. FMIPA, Universitas Bengkulu.
Anselin, L. (1988). Spatial Econometrics: Methods and Models. Dordrecht: Kluwer Academic Publishers.
Cliff, A. D., & Ord, J. K. (1981). Spatial Processes: Models & Applications. London: Pion.
Lee, J., & Wong, D. W. S. (2001). Statistical Analysis with ArcView GIS. New York: John Wiley & Sons.
Sokal, R. R., & Oden, N. L. (1978). Spatial autocorrelation in biology: 1. Methodology. Biological Journal of the Linnean Society, 10(2), 199-228.
Tobler, W. R. (1970). A Computer Movie Simulating Urban Growth in the Detroit Region. Economic Geography, 46(2), 234-240.