Latar Belakang

Lonjakan data di era digital, yang peningkatannya bersifat eksponensial, telah menghasilkan volume data dalam jumlah besar. Mayoritas dari data ini mengandung komponen geografis atau spasial, yakni informasi yang merujuk pada lokasi di permukaan bumi. Pemanfaatan data spasial sangat luas, mencakup berbagai bidang seperti studi lingkungan, epidemiologi, perencanaan tata ruang, hingga aplikasi bisnis dan logistik (Bivand et al., 2013).

Data spasial memegang peranan vital dalam beragam disiplin ilmu, mulai dari ekologi, epidemiologi, hingga geofisika, sebab hampir seluruh fenomena di dunia nyata memiliki keterkaitan geografis. Untuk memahami pola distribusi objek atau kejadian, mengandalkan observasi visual saja tidak cukup. Diperlukan sebuah pengujian statistik yang cermat untuk memastikan apakah pola tersebut acak (Complete Spatial Randomness), mengelompok (clustered), atau seragam (regular) (Diggle et al., 2023). Dalam hal ini, Analisis Pola Titik Spasial (Spatial Point Pattern Analysis) menjadi alat fundamental untuk mengekstraksi informasi tersebut, di mana pola yang teridentifikasi seringkali menjadi cerminan dari proses fisik atau sosial yang mendasarinya.

Dua metode klasik yang umum digunakan untuk analisis ini adalah Analisis Kuadrat (Quadrat Analysis) dan Indeks Tetangga Terdekat (Nearest Neighbor Index/NNI). Metode Kuadrat sangat efektif untuk mendeteksi variasi kepadatan dalam skala global dengan membandingkan frekuensi kejadian di tiap unit area. Sementara itu, NNI lebih sensitif dalam mendeteksi interaksi dalam skala lokal di antara titik-titik individu (Baddeley et al., 2021). Dalam konteks mitigasi bencana geologi, misalnya gempa bumi, penerapan metode ini menjadi sangat krusial. Identifikasi pola clustering pada data seismik dapat membantu dalam pemetaan zona patahan yang aktif serta area berisiko tinggi yang mungkin tidak tampak jelas jika hanya menggunakan pemetaan konvensional (Wibowo & Santoso, 2022).

Penggunaan perangkat lunak statistik modern, khususnya R dengan paket spatstat, telah mempermudah proses komputasi kompleks yang dibutuhkan untuk analisis ini. Oleh karena itu, praktikum ini memegang peranan penting untuk menjembatani kesenjangan antara teori statistik spasial dan aplikasi praktisnya. Hal ini memungkinkan praktikan tidak hanya sekadar menghitung indeks statistik, tetapi juga mampu menginterpretasikan implikasi fenomena nyata dari pola yang terdeteksi, seperti membedakan antara keteraturan yang bersifat artifisial dan pengelompokan alami yang diakibatkan oleh proses tektonik (Illian & Burslem, 2020).

Rumusan Masalah

Adapun rumusan masalah dari praktikum kali ini adalah sebagai berikut:

  1. Bagaimana cara menentukan pola titik spasial dengan menggunakan R?
  2. Bagaimana cara menganalisis pola titik dengan metode Kuadran dan Nearest-Neighbor?

Tujuan Penelitian

Berdasarkan rumusan masalah didapatkan tujuan dari penelitian adalah sebagai berikut:

  1. Mahasiswa mampu menentukan pola titik spasial dengan menggunakan R.
  2. Mahasiswa mampu menganalisis pola titik dengan metode Kuadran dan Nearest-Neighbor.

Batasan Masalah 1 (Metode Kuadran)

Gunakan Metode Kuadran pada data cells dari paket spatstat.data untuk mengetahui apakah pola sebaran titik bersifat acak, seragam, atau mengelompok. Hitung nilai VMR dan lakukan uji kuadran, lalu interpretasikan hasilnya.

library(spatstat)
## Warning: package 'spatstat' was built under R version 4.4.3
## Loading required package: spatstat.data
## Warning: package 'spatstat.data' was built under R version 4.4.3
## Loading required package: spatstat.univar
## Warning: package 'spatstat.univar' was built under R version 4.4.3
## spatstat.univar 3.1-4
## Loading required package: spatstat.geom
## Warning: package 'spatstat.geom' was built under R version 4.4.3
## spatstat.geom 3.6-0
## Loading required package: spatstat.random
## Warning: package 'spatstat.random' was built under R version 4.4.3
## spatstat.random 3.4-2
## Loading required package: spatstat.explore
## Warning: package 'spatstat.explore' was built under R version 4.4.3
## Loading required package: nlme
## spatstat.explore 3.5-3
## Loading required package: spatstat.model
## Warning: package 'spatstat.model' was built under R version 4.4.3
## Loading required package: rpart
## spatstat.model 3.4-2
## Loading required package: spatstat.linnet
## Warning: package 'spatstat.linnet' was built under R version 4.4.3
## spatstat.linnet 3.3-2
## 
## spatstat 3.4-1 
## For an introduction to spatstat, type 'beginner'
library(spatstat.data)

Input Data

Pada batasan masalah digunakan data cells yang tersedia dari package spatstat.data

data(cells)
X <- spatstat.data::cells 
par(mfrow = c(1, 2))
plot(X)
plot(density(X, 5))

Plot pertama menunjukkan sebaran dari lokasi kejadian yang divisualisasikan dengan titik dalam suatu area yang berbentuk persegi. Dapat dilihat bahwa titik menyebar cukup merata di seluruh area, tidak terlihat ada titik yang berkelompok atau area kosong yang besar.

Plot densitas yang dihasilkan menggunakan bandwidth 5 menunjukkan rentang skala warna yang sangat sempit, hanya berkisar dari 42 hingga 42.04. Meskipun secara visual tampak gradasi warna dari biru ke kuning/oranye, rentang yang tipis ini mengindikasikan bahwa secara statistik, kepadatan (densitas) data hampir konstan atau seragam di seluruh area tersebut.

Membagi Daerah Pengamatan Menjadi Beberapa Sel

Q <- quadratcount(X, nx=4, ny=3) 
plot(X)
plot(Q, add=TRUE, cex=2)

Daerah pengamatan tersebut dibagi menjadi 12 sel, dapat dilihat angka pada plot diatas menunjukkan jumlah pengamatan yang berada pada sel tersebut

Variance Mean Ratio (VMR)

Berikut dilakukan perhitungan mean dan varian (ragam) setiap sel. Kemudian dihitung perbandingan nilai ragam dan nilai rata-rata (Variance Mean Ratio (VMR))

rt2 <- mean(Q) 
var <- sd(Q)^2 
VMR <- var/rt2 
VMR
## [1] 0.3376623

Dilakukan pengujian Quadrat Test untuk menguji Complete Spatial Randomness (CSR)

quadrat.test(Q)
## Warning: Some expected counts are small; chi^2 approximation may be inaccurate
## 
##  Chi-squared test of CSR using quadrat counts
## 
## data:  
## X2 = 3.7143, df = 11, p-value = 0.04492
## alternative hypothesis: two.sided
## 
## Quadrats: 4 by 3 grid of tiles

Interpretasi

Nilai VMR = 0.3376623, karena nilai VMR tersebut kurang dari 1 (\(VMR < 1\)), ini menunjukkan bahwa pola sebaran datanya bersifat Regular (Seragam/Teratur). Melalui hasil pengujian Quadran diperoleh nilai p-value = 0.04492.Jika menggunakan taraf signifikansi \(\alpha = 0.05\) (5%), maka p-value < \(\alpha\) (0.04492 < 0.05) artinya, Ada cukup bukti untuk menyatakan bahwa pola sebaran titik tidak acak (Seragam/Teratur)

Batasan Masalah 2 (Metode Nearest Neighbor)

Gunakan metode Nearest Neighbor pada data quakes dari paket datasets untuk melihat apakah sebaran titik gempa bersifat acak, seragam, atau mengelompok. Hitung nilai ITT/NNI dan lakukan uji NN, lalu interpretasikan hasilnya.

Mendefinisikan Data dan Koordinat

library(sp)
## Warning: package 'sp' was built under R version 4.4.3
library(spatstat.geom)
data("quakes")
coordinates(quakes) <- ~long + lat
plot(quakes)

Data yang digunakan untuk analisis ini bersumber dari dataset Quakes bawaan R. Untuk kebutuhan analisis, format koordinat (X,Y) diperlukan, sehingga kolom long (longitude) dan lat (latitude) digabungkan menjadi satu kolom koordinat. Berdasarkan plot data tersebut, terlihat adanya kecenderungan titik-titik data berdekatan dan membentuk beberapa kelompok (klaster) visual.

Nearest Neighbor

nni <- function(x, win = c("hull","extent")){
  win <- match.arg(win)
  W <- if (win=="hull") convexhull.xy(coordinates(x)) else {
    e <- as.vector(bbox(x))
    as.owin(c(e[1], e[3], e[2], e[4]))
  }
  p <- as.ppp(coordinates(x), W = W)
  A <- area.owin(W)
  o <- mean(nndist(p))
  e <- 0.5 * sqrt(A / p$n)
  se <- 0.26136 * sqrt(A) / p$n
  z <- (o - e)/se; p2 <- 2*pnorm(-abs(z))
  list(NNI = o/e, z = z, p.value = p2,
       expected.mean.distance = e, observed.mean.distance = o)
}
nni(quakes)
## Warning: data contain duplicated points
## $NNI
## [1] 0.5470358
## 
## $z
## [1] -27.40279
## 
## $p.value
## [1] 2.540433e-165
## 
## $expected.mean.distance
## [1] 0.2998562
## 
## $observed.mean.distance
## [1] 0.1640321

Interpretasi

Hasil analisis pola titik spasial pada data gempa bumi menggunakan metode Nearest Neighbor Index (NNI) menghasilkan nilai indeks 0.5470358. Karena nilai NNI ini kurang dari 1, pola yang teridentifikasi adalah Clustered (Mengelompok), yang berarti titik-titik gempa cenderung terkonsentrasi di area-area tertentu. Hasil uji signifikansi memberikan nilai z-score -27.40 dengan p-value yang mendekati 0. Nilai p-value yang jauh di bawah 0.05 ini menunjukkan bahwa hasil tersebut sangat signifikan secara statistik, sehingga hipotesis nol (pola acak) ditolak. Temuan ini didukung oleh perbandingan jarak, dengan jarak rata-rata teramati (observed mean distance) adalah 0.164, yang nilainya hampir setengah dari jarak rata-rata harapan (expected mean distance) sebesar 0.300. Ini menegaskan bahwa lokasi titik-titik gempa memang saling berdekatan, jauh lebih rapat daripada yang diharapkan dari pola acak.

Kesimpulan

penentuan pola titik spasial di R dapat dicapai melalui metode statistik seperti Metode Kuadrat (Quadrat Analysis) dan Nearest Neighbor Index (NNI), yang keduanya tersedia dalam paket spatstat. Metode Kuadrat bekerja dengan mempartisi area studi menjadi sel-sel grid dan menghitung rasio varians-terhadap-rata-rata (VMR) untuk menentukan tipe pola, yang signifikansinya diuji dengan Chi-square. Di sisi lain, metode NNI mengevaluasi pola berdasarkan perbandingan antara jarak rata-rata ke tetangga terdekat yang diamati dengan jarak yang diharapkan dalam pola acak, yang signifikansinya diuji menggunakan uji-Z. Berdasarkan analisis pada dua dataset yang berbeda, penerapan metode Kuadrat pada data cells (dari spatstat.data) mengindikasikan pola sebaran Regular (Seragam). Ini disimpulkan dari nilai VMR 0.337 dan p-value 0.04492, yang menolak hipotesis nol (Complete Spatial Randomness) pada tingkat signifikansi 5%. Sebaliknya, analisis pada data quake menggunakan NNI mengungkap pola Clustered (Mengelompok) yang sangat signifikan. Bukti utamanya adalah nilai NNI 0.547 (< 1), z-score ekstrem -27.40, dan p-value yang mendekati nol. Pengelompokan ini terkonfirmasi lebih lanjut oleh jarak rata-rata observasi (0.164) yang jauh lebih kecil dari jarak harapan (0.300), yang membuktikan adanya konsentrasi kejadian gempa di lokasi-lokasi spesifik.

References

Baddeley, A., Rubak, E., & Turner, R. (2021). Spatial Point Patterns: Methodology and Applications with R. CRC Press. Diggle, P. J., Moraga, P., Rowlingson, B., & Taylor, B. M. (2023). Spatial and Spatio-Temporal Log-Gaussian Cox Processes: Extending the Geostatistical Paradigm. Statistical Science, 28(4), 542-563. Illian, J. B., & Burslem, D. F. R. P. (2020). Contributions of spatial point pattern analysis to the understanding of plant ecology. Journal of Ecology, 115(1), 1-15. Wibowo, A., & Santoso, D. (2022). Analisis Spasial Klaster Kegempaan di Wilayah Sumatra Menggunakan Metode Nearest Neighbor dan K-Means. Jurnal Geofisika Indonesia, 5(2), 88-97.