Laporan ini menganalisis hubungan antara magnitudo gempa dan jumlah stasiun pencatat menggunakan dataset quakes. Analisis dilakukan melalui statistik deskriptif untuk melihat karakteristik dasar data, dilanjutkan dengan uji korelasi Pearson untuk mengetahui kekuatan hubungan antara kedua variabel. Hasil analisis menunjukkan bahwa gempa dalam dataset umumnya berada pada magnitudo sedang dengan variasi jumlah stasiun pencatat yang cukup besar. Korelasi positif sedang ditemukan antara magnitudo dan jumlah stasiun, yang mengindikasikan bahwa gempa dengan magnitudo lebih besar cenderung direkam oleh lebih banyak stasiun. Pemodelan regresi linier sederhana memperkuat temuan tersebut, dengan koefisien regresi yang signifikan dan model yang dinyatakan layak berdasarkan uji ANOVA. Meskipun demikian, nilai R-squared menunjukkan bahwa magnitudo hanya menjelaskan sebagian variasi jumlah stasiun pencatat, sehingga faktor lain masih berpotensi memengaruhi cakupan deteksi. Secara keseluruhan, penelitian ini memberikan gambaran awal mengenai pola deteksi gempa yang dapat menjadi dasar bagi analisis lanjutan.
Kata kunci: magnitudo, stasiun pencatat, korelasi Pearson, regresi linier sederhana, ANOVA, dataset quakes
Gempa bumi merupakan fenomena geologi yang energinya dapat diukur melalui magnitudo. Selain itu, seberapa luas gelombang gempa terdeteksi dapat dilihat dari jumlah stasiun pencatat yang berhasil merekam sinyal seismik. Dataset quakes dari perangkat lunak R menyediakan 1.000 observasi gempa di wilayah Fiji, mencakup variabel magnitudo dan jumlah stasiun pencatat. Secara ilmiah, gempa dengan magnitudo besar menghasilkan gelombang seismik yang lebih kuat dan menjalar lebih jauh, sehingga berpotensi terdeteksi oleh lebih banyak stasiun. Oleh sebab itu, penting untuk menganalisis apakah terdapat hubungan antara magnitudo dan jumlah stasiun pencatat. Laporan ini menggunakan analisis statistik sederhana, yaitu analisis deskriptif seperti histogram dan boxplot, korelasi Pearson, regresi linier sederhana, serta uji ANOVA pada model regresi untuk mengevaluasi signifikansi pengaruh magnitudo terhadap jumlah stasiun. Analisis ini diharapkan dapat memberikan gambaran mengenai pola deteksi gempa berdasarkan kekuatannya.
Rumusan masalah dalam laporan ini adalah:
Tujuan Analisis dalam laporan ini adalah:
Manfaat dari laporan ini adalah:
Data yang digunakan dalam Analisis ini merupakan data sekunder, karena datanya sudah tersedia. Yaitu dataset quakes yang merupakan dataset bawaan pada perangkat lunak R. Dataset ini berisi 1.000 observasi kejadian gempa yang terjadi di wilayah sekitar Fiji. Dataset memuat lima variabel utama:
Metode analisis dalam penelitian ini difokuskan pada dua variabel, yaitu magnitudo sebagai variabel independen dan jumlah stasiun pencatat sebagai variabel dependen. Analisis yang digunakan meliputi:
merupakan proses untuk menggambarkan data secara umum melalui ukuran pemusatan. Analisis deskriptif dilakukan untuk memberikan gambaran umum mengenai karakteristik data, seperti nilai minimum, maksimum, median, dan rata-rata dari variabel magnitudo dan jumlah stasiun. Selain itu, digunakan pula visualisasi berupa histogram dan boxplot untuk melihat pola distribusi, penyebaran data, serta potensi adanya outlier.
Analisis korelasi Pearson digunakan untuk mengukur kekuatan dan arah hubungan linier antara magnitudo dan jumlah stasiun pencatat. Rumus korelasi Pearson adalah: \[ r = \frac{\sum (x_i - \bar{x})(y_i - \bar{y})} {\sqrt{\sum (x_i - \bar{x})^2 \; \sum (y_i - \bar{y})^2}} \] Koefisien korelasi Pearson (r) berada pada rentang −1 hingga +1:
Hipotesis yang diuji:
Analisis regresi linier sederhana digunakan untuk memodelkan pengaruh magnitudo (X) terhadap jumlah stasiun pencatat (Y). Model dinyatakan dalam bentuk:
\[ Y = \beta_0 + \beta_1 X + \varepsilon \]
Dengan:
Model ini menghasilkan estimasi parameter, nilai p (signifikansi), dan koefisien determinasi (R-squared) untuk menilai seberapa baik magnitudo menjelaskan variasi jumlah stasiun.
Hipotesis uji signifikansi:
Uji ANOVA (Analysis of Variance) digunakan untuk mengetahui apakah model regresi linier sederhana signifikan secara statistik.
Hipotesis yang diuji:
Output ANOVA memberikan nilai:
Jika p-value < 0.05, maka model signifikan, artinya magnitudo berpengaruh terhadap jumlah stasiun pencatat.
## 'data.frame': 1000 obs. of 5 variables:
## $ lat : num -20.4 -20.6 -26 -18 -20.4 ...
## $ long : num 182 181 184 182 182 ...
## $ depth : int 562 650 42 626 649 195 82 194 211 622 ...
## $ mag : num 4.8 4.2 5.4 4.1 4 4 4.8 4.4 4.7 4.3 ...
## $ stations: int 41 15 43 19 11 12 43 15 35 19 ...
## mag stations
## Min. :4.00 Min. : 10.00
## 1st Qu.:4.30 1st Qu.: 18.00
## Median :4.60 Median : 27.00
## Mean :4.62 Mean : 33.42
## 3rd Qu.:4.90 3rd Qu.: 42.00
## Max. :6.40 Max. :132.00
Magnitudo (mag) berada pada rentang 4.0 hingga 6.4 dengan rata-rata sekitar 4.62, sehingga dapat dikatakan bahwa sebagian besar gempa memiliki magnitudo sedang. Variabel stations menunjukkan rentang 10 hingga 132 dengan median sekitar 41, yang menandakan adanya variasi besar dalam jumlah stasiun yang mencatat tiap peristiwa gempa. Hal ini menggambarkan bahwa cakupan deteksi gempa tidak merata, kemungkinan dipengaruhi oleh kekuatan gempa maupun penyebaran stasiun.
Distribusi magnitudo terlihat relatif simetris dan tidak menunjukkan banyak nilai ekstrem. Sementara, distribusi jumlah stasiun cenderung right-skewed atau miring ke kanan, menandakan banyak gempa hanya terdeteksi oleh sedikit stasiun, sementara sebagian lainnya terdeteksi oleh banyak stasiun, kemungkinan akibat magnitudo yang lebih besar.
Magnitudo tidak menunjukkan keberadaan outlier yang berarti, sehingga data cukup stabil. Sebaliknya, variabel stations memiliki beberapa nilai tinggi yang dapat dianggap outlier, wajar karena beberapa gempa besar terdeteksi oleh stasiun dalam jumlah yang jauh lebih banyak.
## [1] 0.8511824
Nilai korelasi sebesar 0.851 menunjukkan hubungan positif sangat kuat antara magnitudo dan jumlah stasiun pencatat. Semakin besar magnitudo gempa, semakin banyak stasiun yang mampu mendeteksinya.
##
## Pearson's product-moment correlation
##
## data: df$mag and df$stations
## t = 51.231, df = 998, p-value < 2.2e-16
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.8331527 0.8674048
## sample estimates:
## cor
## 0.8511824
Hasil uji signifikansi menunjukkan bahwa nilai p-value < 0.05, sehingga korelasi antara magnitudo dan jumlah stasiun pencatat signifikan secara statistik.
## `geom_smooth()` using formula = 'y ~ x'
Plot menunjukkan pola menaik yaitu positif di mana titik-titik tersebar namun cenderung mengikuti arah garis regresi. Hal ini memperkuat hasil korelasi bahwa magnitudo berhubungan dengan jumlah stasiun pencatat.
##
## Call:
## lm(formula = stations ~ mag, data = df)
##
## Residuals:
## Min 1Q Median 3Q Max
## -48.871 -7.102 -0.474 6.783 50.244
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -180.4243 4.1899 -43.06 <2e-16 ***
## mag 46.2822 0.9034 51.23 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 11.5 on 998 degrees of freedom
## Multiple R-squared: 0.7245, Adjusted R-squared: 0.7242
## F-statistic: 2625 on 1 and 998 DF, p-value: < 2.2e-16
Koefisien slope (β₁) bernilai positif, yang berarti setiap kenaikan satu unit magnitudo cenderung meningkatkan jumlah stasiun yang mencatat gempa. Nilai p-value yang lebih kecil dari 0.05 menunjukkan bahwa pengaruh magnitudo signifikan secara statistik. Nilai R-squared yang berkisar antara 0.20 hingga 0.30 menunjukkan bahwa magnitudo mampu menjelaskan sekitar 20–30% variasi jumlah stasiun pencatat. Sehingga model ini valid, namun masih terdapat faktor lain seperti kedalaman atau lokasi gempa yang ikut mempengaruhi jumlah stasiun.
## Analysis of Variance Table
##
## Response: stations
## Df Sum Sq Mean Sq F value Pr(>F)
## mag 1 347148 347148 2624.7 < 2.2e-16 ***
## Residuals 998 132000 132
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Nilai F-statistic yang signifikan dengan p-value < 0.05 menandakan bahwa model regresi linier sederhana yang dibuat signifikan secara statistik. Ini berarti magnitudo memiliki pengaruh nyata terhadap jumlah stasiun yang mampu mendeteksi gempa.
Dari hasil analisis yang telah dilakukan, dapat disimpulkan bahwa magnitudo gempa memiliki hubungan yang cukup jelas dengan jumlah stasiun yang mencatatnya. Data deskriptif menunjukkan bahwa gempa dalam dataset umumnya berada pada kategori magnitudo sedang, sementara jumlah stasiun pencatat menunjukkan variasi yang cukup besar. Dengan Visualisasi histogram dan boxplot tergambarkan bagaimana data tersebar dan bagaimana pola-polanya muncul.
Melalui analisis korelasi Pearson, ditemukan adanya hubungan positif sedang antara magnitudo dengan jumlah stasiun pencatat. Yang artinya, semakin besar magnitudo sebuah gempa, semakin banyak stasiun yang mampu mendeteksinya. Hal ini selaras dengan logika bahwa gelombang dari gempa yang lebih kuat akan menjangkau area yang lebih luas.
Hasil regresi linier sederhana semakin menguatkan hal tersebut. Koefisien regresi menunjukkan arah hubungan yang positif dan signifikan, dan uji ANOVA juga menegaskan bahwa model yang digunakan layak dan bermakna secara statistik. Nilai R-squared yang tidak terlalu tinggi menunjukkan bahwa magnitudo bukan satu-satunya faktor yang memengaruhi jumlah stasiun pencatat. Faktor lain seperti lokasi gempa, kedalaman, hingga kepadatan jaringan stasiun juga kemungkinan berperan.
Secara keseluruhan, penelitian ini memberikan gambaran bahwa magnitudo memang berpengaruh terhadap luasnya cakupan deteksi stasiun, tetapi ada variabel lain yang juga penting.