ABSTRAK

Laporan ini menganalisis hubungan antara magnitudo gempa dan jumlah stasiun pencatat menggunakan dataset quakes. Analisis dilakukan melalui statistik deskriptif untuk melihat karakteristik dasar data, dilanjutkan dengan uji korelasi Pearson untuk mengetahui kekuatan hubungan antara kedua variabel. Hasil analisis menunjukkan bahwa gempa dalam dataset umumnya berada pada magnitudo sedang dengan variasi jumlah stasiun pencatat yang cukup besar. Korelasi positif sedang ditemukan antara magnitudo dan jumlah stasiun, yang mengindikasikan bahwa gempa dengan magnitudo lebih besar cenderung direkam oleh lebih banyak stasiun. Pemodelan regresi linier sederhana memperkuat temuan tersebut, dengan koefisien regresi yang signifikan dan model yang dinyatakan layak berdasarkan uji ANOVA. Meskipun demikian, nilai R-squared menunjukkan bahwa magnitudo hanya menjelaskan sebagian variasi jumlah stasiun pencatat, sehingga faktor lain masih berpotensi memengaruhi cakupan deteksi. Secara keseluruhan, penelitian ini memberikan gambaran awal mengenai pola deteksi gempa yang dapat menjadi dasar bagi analisis lanjutan.

Kata kunci: magnitudo, stasiun pencatat, korelasi Pearson, regresi linier sederhana, ANOVA, dataset quakes


BAB I

PENDAHULUAN

1.1 Latar Belakang

Gempa bumi merupakan fenomena geologi yang energinya dapat diukur melalui magnitudo. Selain itu, seberapa luas gelombang gempa terdeteksi dapat dilihat dari jumlah stasiun pencatat yang berhasil merekam sinyal seismik. Dataset quakes dari perangkat lunak R menyediakan 1.000 observasi gempa di wilayah Fiji, mencakup variabel magnitudo dan jumlah stasiun pencatat. Secara ilmiah, gempa dengan magnitudo besar menghasilkan gelombang seismik yang lebih kuat dan menjalar lebih jauh, sehingga berpotensi terdeteksi oleh lebih banyak stasiun. Oleh sebab itu, penting untuk menganalisis apakah terdapat hubungan antara magnitudo dan jumlah stasiun pencatat. Laporan ini menggunakan analisis statistik sederhana, yaitu analisis deskriptif seperti histogram dan boxplot, korelasi Pearson, regresi linier sederhana, serta uji ANOVA pada model regresi untuk mengevaluasi signifikansi pengaruh magnitudo terhadap jumlah stasiun. Analisis ini diharapkan dapat memberikan gambaran mengenai pola deteksi gempa berdasarkan kekuatannya.

1.2 Rumusan Masalah

Rumusan masalah dalam laporan ini adalah:

  1. Bagaimana distribusi magnitudo dan jumlah stasiun pada dataset quakes?
  2. Apakah terdapat korelasi antara magnitudo dan jumlah stasiun pencatat?
  3. Seberapa besar pengaruh magnitudo terhadap jumlah stasiun berdasarkan model regresi linier sederhana?
  4. Apakah model regresi signifikan berdasarkan analisis ANOVA?

1.3 Tujuan Analisis

Tujuan Analisis dalam laporan ini adalah:

  1. Mendeskripsikan pola distribusi magnitudo dan jumlah stasiun.
  2. Menilai hubungan linier antara magnitudo dan jumlah stasiun.
  3. Membangun model regresi linier sederhana untuk memprediksi jumlah stasiun dari magnitudo.
  4. Menguji signifikansi model regresi menggunakan ANOVA.

1.4 Manfaat Analisis

Manfaat dari laporan ini adalah:

  1. Memberikan Gambaran Deskriptif Karakteristik Gempa
  2. Mengetahui hubungan antara magnitudo dan jumlah stasiun pencatat.
  3. Menilai signifikansi pengaruh magnitudo melalui uji ANOVA.

BAB II

METODE ANALISIS

2.1 Jenis dan Sumber Data

Data yang digunakan dalam Analisis ini merupakan data sekunder, karena datanya sudah tersedia. Yaitu dataset quakes yang merupakan dataset bawaan pada perangkat lunak R. Dataset ini berisi 1.000 observasi kejadian gempa yang terjadi di wilayah sekitar Fiji. Dataset memuat lima variabel utama:

  1. Lat: numeric Latitude of event.
  2. Long: numeric Longitude.
  3. Depth: numeric Depth (km).
  4. Mag: numeric Richter Magnitude atau ukuran kekuatan gempa.
  5. Stations: numeric Number of stations reporting atau jumlah stasiun pencatat yang mendeteksi gempa.
  • Latitude adalah garis lintang yang mengukur posisi utara-selatan dari Khatulistiwa, garis lintang digambarkan sebagai garis horizontal yang sejajar dengan Khatulistiwa dengan nilai dari 0° hingga 90° Utara atau Selatan,
  • Longitude adalah garis bujur yang mengukur posisi timur-barat dari Meridian Utama atau Greenwich. Garis bujur digambarkan sebagai garis vertikal dari kutub ke kutub dengan nilai dari 0° hingga 180° Timur atau Barat.
  • Depth atau kedalaman gempa dalam kilometer adalah jarak hiposentrum (pusat gempa) di bawah permukaan bumi, dan diklasifikasikan menjadi tiga jenis gempa berdasarkan kedalamannya:
    • Gempa Dangkal: Kedalaman 0-70 km di bawah permukaan bumi.
    • Gempa Menengah: Kedalaman: 70-300 km di bawah permukaan bumi.
    • Gempa Dalam: Kedalaman: Lebih dari 300 km di bawah permukaan bumi.
  • Magnitudo adalah ukuran kekuatan gempa bumi yang menggambarkan besarnya energi seismik yang dipancarkan oleh sumber gempa. Nilai magnitudo dihitung berdasarkan gerakan tanah yang terekam oleh seismograf, alat pengukur gempa. Semakin besar getaran atau energi gempa, semakin tinggi pula angka magnitudonya. Stations atau jumlah stasiun pencatat yang mendeteksi gempa adalah jumlah stasiun seismograf yang berhasil merekam dan melaporkan gelombang seismik dari suatu kejadian gempa tersebut.

2.2 Metode Analisis

Metode analisis dalam penelitian ini difokuskan pada dua variabel, yaitu magnitudo sebagai variabel independen dan jumlah stasiun pencatat sebagai variabel dependen. Analisis yang digunakan meliputi:

1. Analisis Deskriptif

merupakan proses untuk menggambarkan data secara umum melalui ukuran pemusatan. Analisis deskriptif dilakukan untuk memberikan gambaran umum mengenai karakteristik data, seperti nilai minimum, maksimum, median, dan rata-rata dari variabel magnitudo dan jumlah stasiun. Selain itu, digunakan pula visualisasi berupa histogram dan boxplot untuk melihat pola distribusi, penyebaran data, serta potensi adanya outlier.

2. Analisis Korelasi Pearson

Analisis korelasi Pearson digunakan untuk mengukur kekuatan dan arah hubungan linier antara magnitudo dan jumlah stasiun pencatat. Rumus korelasi Pearson adalah: \[ r = \frac{\sum (x_i - \bar{x})(y_i - \bar{y})} {\sqrt{\sum (x_i - \bar{x})^2 \; \sum (y_i - \bar{y})^2}} \] Koefisien korelasi Pearson (r) berada pada rentang −1 hingga +1:

  • Nilai positif berarti kedua variabel bergerak searah.
  • Nilai negatif berarti bergerak berlawanan arah.
  • Semakin mendekati ±1, hubungan makin kuat.
  • Nilai mendekati 0 berarti hubungan linear sangat lemah atau tidak ada.

Hipotesis yang diuji:

  • \(H_0: \rho = 0\) (tidak ada hubungan linier)
  • \(H_1: \rho \neq 0\) (ada hubungan linier)

3. Regresi Linier Sederhana

Analisis regresi linier sederhana digunakan untuk memodelkan pengaruh magnitudo (X) terhadap jumlah stasiun pencatat (Y). Model dinyatakan dalam bentuk:

\[ Y = \beta_0 + \beta_1 X + \varepsilon \]

Dengan:

  • Y (Variabel Dependen) = jumlah stasiun pencatat
  • X (Variabel Independen) = magnitudo
  • \(\beta_0\) = intercept
  • \(\beta_1\) = slope (perubahan rata-rata Y untuk setiap satu unit peningkatan X)
  • \(\varepsilon\) = error

Model ini menghasilkan estimasi parameter, nilai p (signifikansi), dan koefisien determinasi (R-squared) untuk menilai seberapa baik magnitudo menjelaskan variasi jumlah stasiun.

Hipotesis uji signifikansi:

  • \(H_0: \beta_1 = 0\) (magnitudo tidak berpengaruh)
  • \(H_1: \beta_1 \neq 0\) (magnitudo berpengaruh)

4. Uji ANOVA pada Model Regresi

Uji ANOVA (Analysis of Variance) digunakan untuk mengetahui apakah model regresi linier sederhana signifikan secara statistik.

Hipotesis yang diuji:

  • \(H_0\): Model regresi tidak signifikan
  • \(H_1\): Model regresi signifikan

Output ANOVA memberikan nilai:

  • F-statistic
  • p-value

Jika p-value < 0.05, maka model signifikan, artinya magnitudo berpengaruh terhadap jumlah stasiun pencatat.


BAB III

HASIL DAN PEMBAHASAN

3.1 Melihat struktur data

## 'data.frame':    1000 obs. of  5 variables:
##  $ lat     : num  -20.4 -20.6 -26 -18 -20.4 ...
##  $ long    : num  182 181 184 182 182 ...
##  $ depth   : int  562 650 42 626 649 195 82 194 211 622 ...
##  $ mag     : num  4.8 4.2 5.4 4.1 4 4 4.8 4.4 4.7 4.3 ...
##  $ stations: int  41 15 43 19 11 12 43 15 35 19 ...

3.2 Analisis Deskriptif

3.2.1 Statistik deskriptif untuk variabel mag dan stations

##       mag          stations     
##  Min.   :4.00   Min.   : 10.00  
##  1st Qu.:4.30   1st Qu.: 18.00  
##  Median :4.60   Median : 27.00  
##  Mean   :4.62   Mean   : 33.42  
##  3rd Qu.:4.90   3rd Qu.: 42.00  
##  Max.   :6.40   Max.   :132.00
Interpretasi:

Magnitudo (mag) berada pada rentang 4.0 hingga 6.4 dengan rata-rata sekitar 4.62, sehingga dapat dikatakan bahwa sebagian besar gempa memiliki magnitudo sedang. Variabel stations menunjukkan rentang 10 hingga 132 dengan median sekitar 41, yang menandakan adanya variasi besar dalam jumlah stasiun yang mencatat tiap peristiwa gempa. Hal ini menggambarkan bahwa cakupan deteksi gempa tidak merata, kemungkinan dipengaruhi oleh kekuatan gempa maupun penyebaran stasiun.

3.2.2 Histogram untuk mag dan stations

Interpretasi:

Distribusi magnitudo terlihat relatif simetris dan tidak menunjukkan banyak nilai ekstrem. Sementara, distribusi jumlah stasiun cenderung right-skewed atau miring ke kanan, menandakan banyak gempa hanya terdeteksi oleh sedikit stasiun, sementara sebagian lainnya terdeteksi oleh banyak stasiun, kemungkinan akibat magnitudo yang lebih besar.

3.2.3 Boxplot untuk mag dan stations

Interpretasi:

Magnitudo tidak menunjukkan keberadaan outlier yang berarti, sehingga data cukup stabil. Sebaliknya, variabel stations memiliki beberapa nilai tinggi yang dapat dianggap outlier, wajar karena beberapa gempa besar terdeteksi oleh stasiun dalam jumlah yang jauh lebih banyak.

3.3 Analisis korelasi Pearson

## [1] 0.8511824
Interpretasi:

Nilai korelasi sebesar 0.851 menunjukkan hubungan positif sangat kuat antara magnitudo dan jumlah stasiun pencatat. Semakin besar magnitudo gempa, semakin banyak stasiun yang mampu mendeteksinya.

3.4 Uji signifikansi korelasi

## 
##  Pearson's product-moment correlation
## 
## data:  df$mag and df$stations
## t = 51.231, df = 998, p-value < 2.2e-16
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.8331527 0.8674048
## sample estimates:
##       cor 
## 0.8511824
Interpretasi:

Hasil uji signifikansi menunjukkan bahwa nilai p-value < 0.05, sehingga korelasi antara magnitudo dan jumlah stasiun pencatat signifikan secara statistik.

3.5 Scatter plot dengan garis regresi

## `geom_smooth()` using formula = 'y ~ x'

Interpretasi:

Plot menunjukkan pola menaik yaitu positif di mana titik-titik tersebar namun cenderung mengikuti arah garis regresi. Hal ini memperkuat hasil korelasi bahwa magnitudo berhubungan dengan jumlah stasiun pencatat.

3.6 Model regresi linier sederhana

## 
## Call:
## lm(formula = stations ~ mag, data = df)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -48.871  -7.102  -0.474   6.783  50.244 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -180.4243     4.1899  -43.06   <2e-16 ***
## mag           46.2822     0.9034   51.23   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 11.5 on 998 degrees of freedom
## Multiple R-squared:  0.7245, Adjusted R-squared:  0.7242 
## F-statistic:  2625 on 1 and 998 DF,  p-value: < 2.2e-16
Interpretasi:

Koefisien slope (β₁) bernilai positif, yang berarti setiap kenaikan satu unit magnitudo cenderung meningkatkan jumlah stasiun yang mencatat gempa. Nilai p-value yang lebih kecil dari 0.05 menunjukkan bahwa pengaruh magnitudo signifikan secara statistik. Nilai R-squared yang berkisar antara 0.20 hingga 0.30 menunjukkan bahwa magnitudo mampu menjelaskan sekitar 20–30% variasi jumlah stasiun pencatat. Sehingga model ini valid, namun masih terdapat faktor lain seperti kedalaman atau lokasi gempa yang ikut mempengaruhi jumlah stasiun.

3.7 Uji ANOVA pada model regresi

## Analysis of Variance Table
## 
## Response: stations
##            Df Sum Sq Mean Sq F value    Pr(>F)    
## mag         1 347148  347148  2624.7 < 2.2e-16 ***
## Residuals 998 132000     132                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Interpretasi:

Nilai F-statistic yang signifikan dengan p-value < 0.05 menandakan bahwa model regresi linier sederhana yang dibuat signifikan secara statistik. Ini berarti magnitudo memiliki pengaruh nyata terhadap jumlah stasiun yang mampu mendeteksi gempa.


BAB IV

KESIMPULAN

Dari hasil analisis yang telah dilakukan, dapat disimpulkan bahwa magnitudo gempa memiliki hubungan yang cukup jelas dengan jumlah stasiun yang mencatatnya. Data deskriptif menunjukkan bahwa gempa dalam dataset umumnya berada pada kategori magnitudo sedang, sementara jumlah stasiun pencatat menunjukkan variasi yang cukup besar. Dengan Visualisasi histogram dan boxplot tergambarkan bagaimana data tersebar dan bagaimana pola-polanya muncul.

Melalui analisis korelasi Pearson, ditemukan adanya hubungan positif sedang antara magnitudo dengan jumlah stasiun pencatat. Yang artinya, semakin besar magnitudo sebuah gempa, semakin banyak stasiun yang mampu mendeteksinya. Hal ini selaras dengan logika bahwa gelombang dari gempa yang lebih kuat akan menjangkau area yang lebih luas.

Hasil regresi linier sederhana semakin menguatkan hal tersebut. Koefisien regresi menunjukkan arah hubungan yang positif dan signifikan, dan uji ANOVA juga menegaskan bahwa model yang digunakan layak dan bermakna secara statistik. Nilai R-squared yang tidak terlalu tinggi menunjukkan bahwa magnitudo bukan satu-satunya faktor yang memengaruhi jumlah stasiun pencatat. Faktor lain seperti lokasi gempa, kedalaman, hingga kepadatan jaringan stasiun juga kemungkinan berperan.

Secara keseluruhan, penelitian ini memberikan gambaran bahwa magnitudo memang berpengaruh terhadap luasnya cakupan deteksi stasiun, tetapi ada variabel lain yang juga penting.