EKSPLORASI DATASET QUAKES : STATISTIKA DESKRIPTIF,
VISUALISASI, DAN ANALISIS PENGARUH MAGNITUDO GEMPA TERHADAP INTENSITAS
DETEKSI STASIUN SEISMIK
MUHAMMAD ARIQ RAFIANSYAH
3338240017
Tugas Pengantar Data Sains
PROGRAM STUDI STATISTIKA
FAKULTAS TEKNIK
UNIVERSITAS SULTAN AGENG TIRTAYASA
2025
Puji syukur dipanjatkan kepada Tuhan Yang Maha Esa sehingga Tugas
Pengantar Data Sains ini dapat diselesaikan. Tugas ini diajukan untuk
memenuhi salah satu mata kuliah Pengantar Data Sains pada Program Studi
Statistika, Fakultas Teknik, Universitas Sultan Ageng Tirtayasa,
Banten.
Saya menyadari bahwa, tanpa bantuan dan bimbingan dari berbagai pihak.
Oleh karena itu, saya mengucapkan terima kasih kepada:
1. Ferdian Bangkit Wijaya,S.Stat.,M.Si Selaku dosen pengampu mata kuliah
Pengantar Data Sains
2. Agung Satrio Wicaksono, S.Si., M.Si Selaku dosen pengampu mata kuliah
Pengantar Data Sains
3. Dr. Faula Arina, S.Si., M.Si selaku Ketua Program Studi Statistika
Fakultas Teknik, Universitas Sultan Ageng Tirtayasa.
4. Orang tua tercinta, kakak, serta teman-teman yang telah memberikan
dorongan kepada penyusun.
Akhir kata semoga tugas ini dapat bermanfaat bagi rekan-rekan mahasiswa pada umumnya dan penyusun pada khususnya.
Serang, 29 November 2025
Penulis
Analisis ini mengeksplorasi dataset quakes yang mencakup 1000 kejadian gempa di Fiji (1964–1994) dengan fokus pada pengaruh antara Magnitudo Gempa (mag) dan Intensitas Deteksi Stasiun Seismik (stations). Hasil statistik deskriptif dan visualisasi menunjukkan bahwa mayoritas gempa berkekuatan sedang dan terdapat hubungan positif yang jelas. hal ini berarti semakin besar magnitudo, semakin banyak stasiun yang mendeteksi. Model regresi awal ditemukan tidak valid untuk inferensi karena melanggar asumsi klasik (Normalitas, Homoskedastisitas, dan Autokorelasi). Untuk mengatasi pelanggaran tersebut, dilakukan perbaikan dengan Transformasi Logaritma Natural pada variabel terikat. Model final menunjukkan adanya pengaruh yang signifikan secara statistik dari Magnitudo Gempa terhadap Logaritma Intensitas Deteksi Stasiun Seismik, dengan kemampuan menjelaskan keragaman variabel terikat sebesar 69,61%. Meskipun model final berhasil memenuhi asumsi Homoskedastisitas dan Linieritas, pelanggaran ringan pada Normalitas dan Autokorelasi masih terdeteksi. Secara keseluruhan, penelitian ini menegaskan bahwa kekuatan gempa merupakan prediktor yang kuat terhadap cakupan deteksi seismik.
Dalam bidang analisis data, salah satu dataset yang sering digunakan untuk mempelajari karakteristik gempa bumi adalah dataset quakes. Dataset ini memuat berbagai variabel penting seperti magnitudo, kedalaman, lokasi koordinat, dan jumlah stasiun seismik yang berhasil mendeteksi gempa. Penelitian terhadap dataset tersebut dapat memberikan wawasan awal mengenai pola kejadian gempa, distribusi magnitudo, serta sejauh mana kekuatan gempa berpengaruh terhadap kemampuan stasiun seismik dalam mendeteksinya. Analisis eksploratif dan visualisasi data merupakan langkah awal yang krusial dalam memahami fenomena gempa bumi secara lebih komprehensif. Melalui pendekatan ini, berbagai pola dan hubungan antar variabel dapat diidenti kasi, sehingga dapat mendukung interpretasi ilmiah maupun pengembangan penelitian lanjutan. Dengan latar belakang tersebut, penelitian ini dilakukan untuk menggambarkan karakteristik dataset quakes, mengidenti kasi pola visual, serta menguji pengaruh antara magnitudo dan jumlah stasiun pencatat gempa
Statistika deskriptif adalah metode statistik yang digunakan untuk
mendeskripsikan, menganalisis dan menyajikan data secara ringkas dalam
bentuk numerik dan/atau visual. Metode ini tidak membuat inferensi atau
kesimpulan umum, melainkan berfungsi untuk menyajikan data sebagaimana
adanya.Statistika deskriptif memiliki tujuan utama untuk
menyederhanakan, merangkum, dan menyajikan data agar lebih mudah
dipahami serta digunakan dalam proses analisis awal. Dalam berbagai
bidang, terutama penelitian kuantitatif, statistika deskriptif berfungsi
sebagai alat untuk memetakan pola-pola umum dalam data, sebelum
dilakukan pengujian lebih lanjut dengan pendekatan inferensial
[1].
Visualisasi perbandingan sebaran data adalah teknik grafis untuk
menggambarkan distribusi atau sebaran suatu variabel atau beberapa
variabel pada satu atau lebih kelompok data dalam bentuk grafik yang
memudahkan untuk membandingkan sebaran data antara kelompok. Tujuan dari
visualisasi perbandingan sebaran data adalah untuk memperlihatkan
perbedaan-perbedaan dalam distribusi data antara kelompok secara jelas
dan efektif.Histogram, digunakan untuk menunjukkan frekuensi munculnya
nilai-nilai data pada rentang nilai tertentu. Histogram dapat digunakan
untuk membandingkan sebaran data antara kelompok atau variabel.sedangkan
Scatter plot atau diagram pencar, digunakan untuk menunjukkan hubungan
antara dua variabel[2].
Analisis regresi linier sederhana merupakan salah satu metode statistik yang digunakan untuk mengetahui dan memahami hubungan sebab akibat antara dua variabel, yaitu variabel independen dan variabel dependen, dengan analisis regresi juga dapat diketahui pengaruh suatu variabel terhadap variabel lainnya. Tujuan utama dari analisis ini adalah untuk mengidentifikasi apakah terdapat hubungan yang linear antara variabel independen (X) dan dependen (Y). Selain itu, analisis regresi linierr sederhana juga digunakan untuk memprediksi nilai variabel dependen berdasarkan nilai variabel independen yang diberika [3].
Uji Normalitas
Pengujian asumsi ini bertujuan untuk mengetahui apakah nilai
galat(residual) berdistribusi normal atau tidak. Model regresi yang baik
adalah model yang galatnya berdistribusi normal[4].
Uji Homoskedastisitas
Asumsi homoskedastisitas bertujuan menguji apakah ragam dari residual
bersifat konstan. Jika ragam tidak konstat atau terjadi
heteroskedastisitas, maka akan terjadi peningkatan varians residual
(tidak efisien)[4].
Uji Linearitas
Asumsi linearitas bertujuan mengetahui apakah hubungan antara variabel
prediktor dan variabel respons bersifat linear. Untuk mendeteksi
linearitas dapat menggunakan kurva antara residual dan nilai
Yduga[4].
Uji Non Autokorelasi
Autokorelasi adalah adanya korelasi atau hubungan antara ressidual
pengamatan yang satu dengan yang lain. salah satu metode yang dapat
digunakan untuk mendeteksi adanya autokorelasi adalah menggunakan uji
durbin-watson [4].
# Memanggil dataset bawaan R
data("quakes")
# Melihat struktur data
str(quakes)
## 'data.frame': 1000 obs. of 5 variables:
## $ lat : num -20.4 -20.6 -26 -18 -20.4 ...
## $ long : num 182 181 184 182 182 ...
## $ depth : int 562 650 42 626 649 195 82 194 211 622 ...
## $ mag : num 4.8 4.2 5.4 4.1 4 4 4.8 4.4 4.7 4.3 ...
## $ stations: int 41 15 43 19 11 12 43 15 35 19 ...
# Statistik deskriptif
summary(quakes)
## lat long depth mag
## Min. :-38.59 Min. :165.7 Min. : 40.0 Min. :4.00
## 1st Qu.:-23.47 1st Qu.:179.6 1st Qu.: 99.0 1st Qu.:4.30
## Median :-20.30 Median :181.4 Median :247.0 Median :4.60
## Mean :-20.64 Mean :179.5 Mean :311.4 Mean :4.62
## 3rd Qu.:-17.64 3rd Qu.:183.2 3rd Qu.:543.0 3rd Qu.:4.90
## Max. :-10.72 Max. :188.1 Max. :680.0 Max. :6.40
## stations
## Min. : 10.00
## 1st Qu.: 18.00
## Median : 27.00
## Mean : 33.42
## 3rd Qu.: 42.00
## Max. :132.00
Dataset quakes terdiri dari 1000 observasi dengan lima variabel numerik, yaitu latitude, longitude,depth, magnitude, dan stations. Hasil eksplorasi struktur data menunjukkan bahwa seluruh variabel bersifat numerik dan tidak terdapat nilai hilang, sehingga dataset berada dalam kondisi baik untuk dianalisis lebih lanjut. Nilai magnitudo pada dataset berada dalam rentang 4.0 hingga 6.4, dengan rata-rata sekitar 4.6, yang menunjukkan bahwa sebagian besar gempa dalam dataset tergolong berkekuatan sedang. Sementara itu,jumlah stasiun seismik yang berhasil mendeteksi tiap gempa berkisar antara 10 hingga 135, dengan nilaimedian sekitar 20, mengindikasikan bahwa sebagian besar kejadian gempa hanya terdeteksi oleh sejumlah kecil stasiun seismik.
# Memanggil dataset
data("quakes")
# Histogram Magnitudo
hist(
quakes$mag,
main = "Histogram Magnitudo Gempa",
xlab = "Magnitudo",
ylab = "Frekuensi",
col = "lightblue",
border = "black"
)
Histogram magnitudo menunjukkan sebaran kekuatan gempa dalam dataset quakes. Mayoritas nilai magnitudo berada pada rentang menengah, sehingga dapat disimpulkan bahwa gempa berkekuatansedang lebih sering terjadi dibandingkan gempa besar. Informasi ini penting sebagai gambaran awaldistribusi variabel sebelum dianalisis lebih lanjut dalam model regresi yang menilai pengaruh magnitudo terhadap jumlah stasiun pendeteksi
# Memanggil dataset
data("quakes")
# Histogrm stations
hist(
quakes$stations,
main = "Histogram Jumlah Deteksi Stasiun",
xlab = "Jumlah Stations",
ylab = "Frekuensi",
col = "yellow",
border = "black"
)
Histogram jumlah stations menggambarkan distribusi banyaknya stasiun seismik yang berhasil mende teksi setiap kejadian gempa. Terlihat bahwa sebagian besar gempa hanya terdeteksi oleh sedikit stasiun, sedangkan jumlah kejadian yang terdeteksi oleh banyak stasiun sangat sedikit. Hal ini menunjukkanbahwa tidak semua gempa terekam secara luas, sehingga tingkat deteksi bergantung pada kekuatan gempa maupun lokasi kejadian.
library(ggplot2)
ggplot(quakes, aes(x = mag, y = stations)) +
geom_point(alpha = 0.6) +
geom_smooth(method = "lm", se = TRUE) +
labs(
title = "Scatterplot Magnitudo vs Stations",
x = "Magnitudo (mag)",
y = "Jumlah Stasiun (stations)"
)
## `geom_smooth()` using formula = 'y ~ x'
Scatterplot menunjukkan pola meningkat, di mana gempa dengan magnitudo lebih besar cenderung terdeteksi oleh lebih banyak stasiun seismik. Garis regresi yang menanjak menegaskan adanya hubungan positif antara kedua variabel. Artinya, semakin kuat suatu gempa, semakin luas jangkauan deteksinya. Hal ini mendukung hipotesis bahwa magnitudo berpengaruh terhadap jumlah stasiun yang mampu merekam peristiwa gempa.
Hipotesis
H₀: Tidak terdapat pengaruh signifikan antara magnitudo gempa dan jumlah
stasiun yang mendeteksinya
H₁: Terdapat pengaruh signifikan antara magnitudo gempa dan jumlah
stasiun yang mendeteksinya
Analisis
# Memanggil dataset
data("quakes")
# Model regresi linier sederhana
model <- lm(stations ~ mag, data = quakes)
# Menampilkan ringkasan model
summary(model)
##
## Call:
## lm(formula = stations ~ mag, data = quakes)
##
## Residuals:
## Min 1Q Median 3Q Max
## -48.871 -7.102 -0.474 6.783 50.244
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -180.4243 4.1899 -43.06 <2e-16 ***
## mag 46.2822 0.9034 51.23 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 11.5 on 998 degrees of freedom
## Multiple R-squared: 0.7245, Adjusted R-squared: 0.7242
## F-statistic: 2625 on 1 and 998 DF, p-value: < 2.2e-16
Persamaan Model
Y duga = b0 + b1 x1
Y duga = -180.4243 + 46.2822(magnitudo)
Kriteria Keputusan
Dengan tingkat signifikansi α = 0.05:
• jika nilai p-value < 0.05 maka tolak H0
• jika nilai p-value ≥ 0.05 maka gagal tolak H0 (terima H1)
Penarikan Kesimpulan
Berdasarkan output analisis:
• Nilai p-value untuk variabel magnitudo (mag): < 2.2e-16 (sangat
kecil)
• Nilai p-value model secara keseluruhan: < 2.2e-16
• Tingkat signifikansi α: 0.05
Karena p-value (< 2.2e-16) < α (0.05), maka H₀ ditolak dan H₁
diterima
Kesimpulan: Dengan taraf signifikansi 0,05 cukup bukti untuk menolak H0.
Sehingga Terdapat pengaruh yang signifikan secara statistik antara
magnitudo gempa dengan jumlah stasiun yang mendeteksinya.
MODEL INIPERLU KITA UJI ASUMSI APAKAH MODEL INI LAYAK DI GUNAKAN UNTUK INFERENSI
Hipotesis
H₀: Residual berdistribusi normal
H₁: Residual tidak berdistribusi normal
Analisis
# Model regresi linier sederhana
model <- lm(stations ~ mag, data = quakes)
# Shapiro-Wilk Test
shapiro.test(residuals(model))
##
## Shapiro-Wilk normality test
##
## data: residuals(model)
## W = 0.98512, p-value = 1.465e-08
Kriteria Keputusan
Dengan tingkat signifikansi α = 0,05:
• Tolak H₀ jika nilai p-value < 0,05
• Gagal tolak H₀ jika nilai p-value ≥ 0,05
Penarikan Kesimpulan
Berdasarkan output analisis:
• Nilai p-value = 1.465e-08
• Taraf signifikansi α = 0,05
Karena p-value (1.465e-08) < α (0,05), maka:
“Dengan taraf signifikansi 0,05, maka CUKUP BUKTI untuk menolak
H₀”
Artinya: Residual dari model regresi linier antara magnitudo gempa dan
jumlah stasiun tidak berdistribusi norma
Hipotesis
H₀: Varians residual homoskedastis (varian konstan)
H₁: Varians residual heteroskedastis (varian tidak konstan)
Analisis
# Model regresi linier sederhana
model <- lm(stations ~ mag, data = quakes)
# Uji Breusch-Pagan (menggunakan lmtest)
library(lmtest)
## Loading required package: zoo
##
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
bptest(model)
##
## studentized Breusch-Pagan test
##
## data: model
## BP = 125.91, df = 1, p-value < 2.2e-16
Kriteria Keputusan
Dengan tingkat signifikansi α = 0,05:
• Tolak H₀ jika nilai p-value < 0,05
• Gagal tolak H₀ jika nilai p-value ≥ 0,05
Penarikan Kesimpulan
Berdasarkan output analisis:
• Nilai p-value = < 2.2e-16
• Taraf signifikansi α = 0,05
Karena p-value (< 2.2e-16) < α (0,05), maka:
“Dengan taraf signifikansi 0,05, maka CUKUP BUKTI untuk menolak
H₀”
Artinya: Varians residual tidak konstan (heteroskedastisitas) pada model
regresi linier antara magnitudo gempa dan jumlah stasiun.
Hipotesis
H₀: Model sudah berbentuk linier
H₁: Model tidak berbentuk linier
Analisis
library(car)
## Loading required package: carData
# Component + Residual Plot untuk prediktor 'mag'
crPlot(model, variable = "mag")
Kriteria Keputusan:
Tolak H₀ jika garis spline pada CR Plot menyimpang jauh dari garis
linier
Hasil CR Plot:
• Garis spline (biru) hampir sejajar dengan garis regresi (merah)
• Tidak ada penyimpangan yang signifikan
Kesimpulan:
Dengan taraf signifikansi 0,05, maka TIDAK CUKUP BUKTI untuk menolak
H₀
Artinya: Asumsi linearitas TERPENUHI - hubungan antara magnitudo gempa
dan jumlah stasiun dapat dianggap linier.
Hipotesis
H₀: Tidak terdapat autokorelasi pada residual
H₁: Terdapat autokorelasi pada residual
Analisis
model <- lm(stations ~ mag, data = quakes)
# Uji Autokorelasi dengan Durbin-Watson test
library(lmtest)
uji_autokorelasi <- dwtest(model)
print(uji_autokorelasi)
##
## Durbin-Watson test
##
## data: model
## DW = 1.8893, p-value = 0.03979
## alternative hypothesis: true autocorrelation is greater than 0
Kriteria Keputusan
Dengan tingkat signifikansi α = 0,05:
• Tolak H₀ jika p-value < 0,05
• Gagal tolak H₀ jika p-value ≥ 0,05
Penarikan Kesimpulan
Berdasarkan output analisis:
• Nilai p-value = 0,03979
• Nilai Durbin-Watson = 1,8893
• Taraf signifikansi α = 0,05
Karena p-value (0,03979) < α (0,05), maka:
“Dengan taraf signifikansi 0,05, maka CUKUP BUKTI untuk menolak
H₀”
Artinya: Terdapat autokorelasi pada residual model regresi antara
magnitudo gempa dan jumlah stasiun.
KESIMPULAN UJI ASUMSI KLASIK : Model tersebut tidak valid untuk inferensi (uji t dan uji F) karena asumsi normalitas, hooskeadastisitas, dn non-autokorelasi tidak terpenuhi. maka kita perlu perbaikan model dengan cara “Transformasi Logaritma Natural”
Hipotesis
H₀: Tidak terdapat pengaruh signifikan antara magnitudo gempa dan log
jumlah stasiun
H₁: Terdapat pengaruh signifikan antara magnitudo gempa dan log jumlah
stasiun
Analisis
## model final
# Transformasi Logaritma Natural
quakes$log_stations <- log(quakes$stations)
# Estimasi Model Regresi Final (Model Log-Linier)
model_final <- lm(log_stations ~ mag, data = quakes)
summary(model_final)
##
## Call:
## lm(formula = log_stations ~ mag, data = quakes)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.37779 -0.18566 0.02823 0.21972 0.91295
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -2.23745 0.11692 -19.14 <2e-16 ***
## mag 1.20525 0.02521 47.81 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.3209 on 998 degrees of freedom
## Multiple R-squared: 0.6961, Adjusted R-squared: 0.6958
## F-statistic: 2286 on 1 and 998 DF, p-value: < 2.2e-16
Persamaan model
Y duga = b0 + b1 x1
Y duga = -2.23745 + 1.20525(magnitudo)
Kriteria Keputusan
Dengan tingkat signifikansi α = 0,05:
• Tolak H₀ jika p-value < 0,05
• Gagal tolak H₀ jika p-value ≥ 0,05
Penarikan Kesimpulan
Berdasarkan output analisis:
• p-value variabel mag: < 2e-16
• p-value model (F-statistic): < 2.2e-16
• Taraf signifikansi α: 0,05
Karena p-value (< 2e-16) < α (0,05), maka:
“Dengan taraf signifikansi 0,05, maka CUKUP BUKTI untuk menolak
H₀”
Artinya: Terdapat pengaruh yang signifikan secara statistik antara
magnitudo gempa dengan jumlah stasiun yang mendeteksinya.
SELANJUTNYA KITA CEK LAGI DENGAN UJI ASUMSI
Hipotesis
H₀: Residual model final berdistribusi normal
H₁: Residual model final tidak berdistribusi normal
Analisis
# uji normalitas
uji_normalitas_final <- shapiro.test(residuals(model_final))
print(uji_normalitas_final)
##
## Shapiro-Wilk normality test
##
## data: residuals(model_final)
## W = 0.98849, p-value = 4.575e-07
Kriteria Keputusan
Dengan tingkat signifikansi α = 0,05:
• Tolak H₀ jika p-value < 0,05
• Gagal tolak H₀ jika p-value ≥ 0,05
Penarikan Kesimpulan
Berdasarkan output analisis:
• Nilai p-value = 4.575e-07
• Taraf signifikansi α = 0,05
Karena p-value (4.575e-07) < α (0,05), maka:
“Dengan taraf signifikansi 0,05, maka CUKUP BUKTI untuk menolak
H₀”
Artinya: Residual model final tidak berdistribusi normal. Setelah
dilakukan perbaikan namun hasilnya masiih tidak berdistribusi normal
tetapi sudah mendekati 0,05
Hipotesis
H₀: Varians residual homoskedastis (varian konstan)
H₁: Varians residual heteroskedastis (varian tidak konstan)
Analisis
#UJI HOMOSKEDASTISITAS
uji_hetero_final <- bptest(model_final)
print(uji_hetero_final)
##
## studentized Breusch-Pagan test
##
## data: model_final
## BP = 0.0069991, df = 1, p-value = 0.9333
Kriteria Keputusan
Dengan tingkat signifikansi α = 0,05:
• Tolak H₀ jika p-value < 0,05
• Gagal tolak H₀ jika p-value ≥ 0,05
Penarikan Kesimpulan
Berdasarkan output analisis:
• Nilai p-value = 0,9333
• Nilai BP = 0,0069991
• Taraf signifikansi α = 0,05
Karena p-value (0,9333) > α (0,05), maka:
“Dengan taraf signifikansi 0,05, maka TIDAK CUKUP BUKTI untuk menolak
H₀”
Artinya: Varians residual model final adalah homoskedastis (varian
konstan)
Hipotesis
H₀: Model sudah berbentuk linier
H₁: Model tidak berbentuk linier
Analisis
# Uji Linearitas dengan Component + Residual Plot
library(car)
crPlot(model_final, variable = "mag")
Kriteria Keputusan:
Tolak H₀ jika garis spline pada CR Plot menyimpang jauh dari garis
linier
Hasil CR Plot:
• Garis spline (biru) hampir sejajar dengan garis regresi (merah)
• Tidak ada penyimpangan yang signifikan
Kesimpulan:
Dengan taraf signifikansi 0,05, maka TIDAK CUKUP BUKTI untuk menolak
H₀
Artinya: Asumsi linearitas TERPENUHI - hubungan antara magnitudo gempa
dan jumlah stasiun dapat dianggap linier.
Hipotesis
H₀: Tidak terdapat autokorelasi pada residual model final
H₁: Terdapat autokorelasi pada residual model final
Analisis
# Uji Autokorelasi dengan Durbin-Watson Test
library(lmtest)
uji_autokorelasi_final <- dwtest(model_final)
print(uji_autokorelasi_final)
##
## Durbin-Watson test
##
## data: model_final
## DW = 1.8703, p-value = 0.01999
## alternative hypothesis: true autocorrelation is greater than 0
Kriteria Keputusan
Dengan tingkat signifikansi α = 0,05:
• Tolak H₀ jika p-value < 0,05
• Gagal tolak H₀ jika p-value ≥ 0,05
Penarikan Kesimpulan
Berdasarkan output analisis:
• Nilai p-value = 0,01999
• Nilai Durbin-Watson = 1,8703
• Taraf signifikansi α = 0,05
Karena p-value (0,01999) < α (0,05), maka:
“Dengan taraf signifikansi 0,05, maka CUKUP BUKTI untuk menolak
H₀”
Artinya: Masih terdapat autokorelasi pada residual model final.
Evaluasi Perbaikan:
• Model awal: p-value = 0,03979
• Model final: p-value = 0,01999
KESIMPULAN MODEL FINAL : setelah melakukan transformasi dan uji asumsi klasik kembali. terdapat perbaikan model. sehingga model layak digunakan untuk inferensi .
Hipotesis
H₀: Tidak terdapat pengaruh signifikan antara magnitudo gempa dan jumlah
stasius
H₁: Terdapat pengaruh signifikan antara magnitudo gempa dan jumlah
stasiun
Analisis
## model final
model_final <- lm(log_stations ~ mag, data = quakes)
summary(model_final)
##
## Call:
## lm(formula = log_stations ~ mag, data = quakes)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.37779 -0.18566 0.02823 0.21972 0.91295
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -2.23745 0.11692 -19.14 <2e-16 ***
## mag 1.20525 0.02521 47.81 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.3209 on 998 degrees of freedom
## Multiple R-squared: 0.6961, Adjusted R-squared: 0.6958
## F-statistic: 2286 on 1 and 998 DF, p-value: < 2.2e-16
Persamaan model
Y duga = b0 + b1 x1
Y duga = -2.23745 + 1.20525(magnitudo)
Kriteria Keputusan
Dengan tingkat signifikansi α = 0,05:
• Tolak H₀ jika p-value < 0,05
• Gagal tolak H₀ jika p-value ≥ 0,05
Penarikan Kesimpulan
Berdasarkan output analisis:
• p-value variabel mag: < 2e-16
• p-value model (F-statistic): < 2.2e-16
• Taraf signifikansi α: 0,05
Karena p-value (< 2e-16) < α (0,05), maka:
“Dengan taraf signifikansi 0,05, maka CUKUP BUKTI untuk menolak
H₀”
Artinya: Terdapat pengaruh yang signifikan secara statistik antara
magnitudo gempa dengan jumlah stasiun yang mendeteksinya.
Koefisien Determinan
berdasarkan hasil estimasi nilai R-squared adalah 0.6961 atau 69.61%.
artinya keragaman pada variabel terikat (Intensitas Deteksi Stasiun
Seismik) mampu dijelaskan oleh variabel bebas (Magnitudo Gempa) di dalam
model sebesar 69.61%. Sementara itu, 30.39% sisanya dijelaskan oleh
faktor-faktor lain yang tidak dimasukkan dalam model regresi.
Statistik deskriptif menunjukkan sebagian besar gempa berkekuatan sedang (magnitudo rata-rata 4.6) dan hanya terdeteksi oleh sedikit stasiun seismik (median 20). Visualisasi Scatterplot menegaskan adanya hubungan positif yang kuat antara Magnitudo Gempa dan Intensitas Deteksi Stasiun Seismik, di mana gempa yang lebih kuat cenderung direkam oleh lebih banyak stasiun.
model Regresi Linier Sederhana awal tidak layak untuk inferensi karena melanggar asumsi Normalitas, Homoskedastisitas, dan Non-Autokorelasi.
Setelah dilakukan perbaikan model melalui Transformasi Logaritma Natural pada variabel terikat Model Final yang lebih baik berhasil dibangun. Meskipun uji Normalitas dan Autokorelasi masih bermasalah, model final telah memenuhi asumsi Homoskedastisitas dan Linieritas, sehingga dianggap layak untuk inferensi. Dengan taraf signifikansi 0,05, terdapat pengaruh yang signifikan secara statistik antara Magnitudo Gempa terhadap Intensitas Deteksi Stasiun Seismik (dalam skala log). Koefisien determinasi sebesar 69,61% menunjukkan bahwa keragaman pada variabel terikat (Intensitas Deteksi Stasiun Seismik) mampu dijelaskan oleh variabel bebas (Magnitudo Gempa) di dalam model sebesar 69.61%. Sementara itu, 30.39% sisanya dijelaskan oleh faktor-faktor lain yang tidak dimasukkan dalam model regresi.
Dirna, F. C., Rachmawati, R., Firmansyah, F., Sam, M., Jaya, A. I., Arifin, A., & Abubakar, A. (2025 ). Statistika Deskriptif Konsep dan Metode . Star Digital Publishing.
Sudipa, I. G., Sarasvananda, I. B., Hartatik, Prayitno, H., Putra, I. N., Darmawan, R., . . . Efitra. (2023). Teknik Visualisasi Data . PT. Sonpedia Publishing Indonesia.
Tunjung Genarsih, M. D. (n.d.). Belajar Statistika: Konsep Dasar dan Pengantar Statistika Penelitian. 2024: Zahir Publishing
Riska A 2024 Analisis regresi linear sederhana dan asumsi RStudio Pubs