Kata Pengantar

Puji syukur dipanjatkan kepada Tuhan Yang Maha Esa sehingga Tugas Pengantar Data Sains ini dapat diselesaikan. Tugas ini diajukan untuk memenuhi salah satu mata kuliah Pengantar Data Sains pada Program Studi Statistika, Fakultas Teknik, Universitas Sultan Ageng Tirtayasa, Banten.
Saya menyadari bahwa, tanpa bantuan dan bimbingan dari berbagai pihak. Oleh karena itu, saya mengucapkan terima kasih kepada:
1. Ferdian Bangkit Wijaya,S.Stat.,M.Si Selaku dosen pengampu mata kuliah Pengantar Data Sains
2. Agung Satrio Wicaksono, S.Si., M.Si Selaku dosen pengampu mata kuliah Pengantar Data Sains
3. Dr. Faula Arina, S.Si., M.Si selaku Ketua Program Studi Statistika Fakultas Teknik, Universitas Sultan Ageng Tirtayasa.
4. Orang tua tercinta, kakak, serta teman-teman yang telah memberikan dorongan kepada penyusun.

Akhir kata semoga tugas ini dapat bermanfaat bagi rekan-rekan mahasiswa pada umumnya dan penyusun pada khususnya.

Serang, 29 November 2025

Penulis

Abstrak

Analisis ini mengeksplorasi dataset quakes yang mencakup 1000 kejadian gempa di Fiji (1964–1994) dengan fokus pada pengaruh antara Magnitudo Gempa (mag) dan Intensitas Deteksi Stasiun Seismik (stations). Hasil statistik deskriptif dan visualisasi menunjukkan bahwa mayoritas gempa berkekuatan sedang dan terdapat hubungan positif yang jelas. hal ini berarti semakin besar magnitudo, semakin banyak stasiun yang mendeteksi. Model regresi awal ditemukan tidak valid untuk inferensi karena melanggar asumsi klasik (Normalitas, Homoskedastisitas, dan Autokorelasi). Untuk mengatasi pelanggaran tersebut, dilakukan perbaikan dengan Transformasi Logaritma Natural pada variabel terikat. Model final menunjukkan adanya pengaruh yang signifikan secara statistik dari Magnitudo Gempa terhadap Logaritma Intensitas Deteksi Stasiun Seismik, dengan kemampuan menjelaskan keragaman variabel terikat sebesar 69,61%. Meskipun model final berhasil memenuhi asumsi Homoskedastisitas dan Linieritas, pelanggaran ringan pada Normalitas dan Autokorelasi masih terdeteksi. Secara keseluruhan, penelitian ini menegaskan bahwa kekuatan gempa merupakan prediktor yang kuat terhadap cakupan deteksi seismik.

1. PENDAHULUAN

1.1 Latar Belakang

Dalam bidang analisis data, salah satu dataset yang sering digunakan untuk mempelajari karakteristik gempa bumi adalah dataset quakes. Dataset ini memuat berbagai variabel penting seperti magnitudo, kedalaman, lokasi koordinat, dan jumlah stasiun seismik yang berhasil mendeteksi gempa. Penelitian terhadap dataset tersebut dapat memberikan wawasan awal mengenai pola kejadian gempa, distribusi magnitudo, serta sejauh mana kekuatan gempa berpengaruh terhadap kemampuan stasiun seismik dalam mendeteksinya. Analisis eksploratif dan visualisasi data merupakan langkah awal yang krusial dalam memahami fenomena gempa bumi secara lebih komprehensif. Melalui pendekatan ini, berbagai pola dan hubungan antar variabel dapat diidenti kasi, sehingga dapat mendukung interpretasi ilmiah maupun pengembangan penelitian lanjutan. Dengan latar belakang tersebut, penelitian ini dilakukan untuk menggambarkan karakteristik dataset quakes, mengidenti kasi pola visual, serta menguji pengaruh antara magnitudo dan jumlah stasiun pencatat gempa

1.2 Rumusan Masalah

  1. Bagaimana gambaran statistik deskriptif dan visualisasi data menjelaskan karakteristik dan pola hubungan Magnitudo dengan Intensitas Deteksi Stasiun Seismik?
  2. Apakah Model Regresi Linier Sederhana awal memenuhi keempat asumsi klasik (Normalitas, Linieritas, Homoskedastisitas, dan Non-Autokorelasi) sehingga layak digunakan untuk inferensi?
  3. Seberapa signifikan dan bagaimana interpretasi pengaruh Magnitudo Gempa terhadap Intensitas Deteksi Stasiun Seismik ?

1.3 Tujuan

  1. Melakukan statistik deskriptif dan visualisasi data untuk mendeskripsikan karakteristik data quakes
  2. Melakukan estimasi Model Regresi Linier Sederhana awal dan menguji pemenuhan keempat asumsi klasiknya.
  3. Menganalisis signifikansi dan menginterpretasikan pengaruh Magnitudo Gempa terhadap Intensitas Deteksi Stasiun Seismik

2. METODE PENELITIAN

2.1 Sumber Data dan Variabel Penelitian

  • Data: Data yang digunakan adalah dataset quakes dari lingkungan perangkat lunak R.
  • Waktu dan Lokasi Data: Dataset berisi 1000 kejadian gempa di Fiji, 1964–1994.
  • Variabel:
    • Variabel Bebas (X): Magnitudo (mag)
    • Variabel Terikat (Y): Intensitas Deteksi Stasiun Seismik (stations)

2.2 Metode Analisis Data

2.2.1 Statistika Deskriptif dan visualisasi

Statistika deskriptif adalah metode statistik yang digunakan untuk mendeskripsikan, menganalisis dan menyajikan data secara ringkas dalam bentuk numerik dan/atau visual. Metode ini tidak membuat inferensi atau kesimpulan umum, melainkan berfungsi untuk menyajikan data sebagaimana adanya.Statistika deskriptif memiliki tujuan utama untuk menyederhanakan, merangkum, dan menyajikan data agar lebih mudah dipahami serta digunakan dalam proses analisis awal. Dalam berbagai bidang, terutama penelitian kuantitatif, statistika deskriptif berfungsi sebagai alat untuk memetakan pola-pola umum dalam data, sebelum dilakukan pengujian lebih lanjut dengan pendekatan inferensial [1].
Visualisasi perbandingan sebaran data adalah teknik grafis untuk menggambarkan distribusi atau sebaran suatu variabel atau beberapa variabel pada satu atau lebih kelompok data dalam bentuk grafik yang memudahkan untuk membandingkan sebaran data antara kelompok. Tujuan dari visualisasi perbandingan sebaran data adalah untuk memperlihatkan perbedaan-perbedaan dalam distribusi data antara kelompok secara jelas dan efektif.Histogram, digunakan untuk menunjukkan frekuensi munculnya nilai-nilai data pada rentang nilai tertentu. Histogram dapat digunakan untuk membandingkan sebaran data antara kelompok atau variabel.sedangkan Scatter plot atau diagram pencar, digunakan untuk menunjukkan hubungan antara dua variabel[2].

2.2.2 Analisis dan Estimasi Model Refresi Linier Sederhana

Analisis regresi linier sederhana merupakan salah satu metode statistik yang digunakan untuk mengetahui dan memahami hubungan sebab akibat antara dua variabel, yaitu variabel independen dan variabel dependen, dengan analisis regresi juga dapat diketahui pengaruh suatu variabel terhadap variabel lainnya. Tujuan utama dari analisis ini adalah untuk mengidentifikasi apakah terdapat hubungan yang linear antara variabel independen (X) dan dependen (Y). Selain itu, analisis regresi linierr sederhana juga digunakan untuk memprediksi nilai variabel dependen berdasarkan nilai variabel independen yang diberika [3].

2.2.3 Uji Asumsi Klasik

  1. Uji Normalitas
    Pengujian asumsi ini bertujuan untuk mengetahui apakah nilai galat(residual) berdistribusi normal atau tidak. Model regresi yang baik adalah model yang galatnya berdistribusi normal[4].

  2. Uji Homoskedastisitas
    Asumsi homoskedastisitas bertujuan menguji apakah ragam dari residual bersifat konstan. Jika ragam tidak konstat atau terjadi heteroskedastisitas, maka akan terjadi peningkatan varians residual (tidak efisien)[4].

  3. Uji Linearitas
    Asumsi linearitas bertujuan mengetahui apakah hubungan antara variabel prediktor dan variabel respons bersifat linear. Untuk mendeteksi linearitas dapat menggunakan kurva antara residual dan nilai Yduga[4].

  4. Uji Non Autokorelasi
    Autokorelasi adalah adanya korelasi atau hubungan antara ressidual pengamatan yang satu dengan yang lain. salah satu metode yang dapat digunakan untuk mendeteksi adanya autokorelasi adalah menggunakan uji durbin-watson [4].

3. HASIL DAN PEMBAHASAN

3.1 Statistika Deskriptif dan Visualisasi

3.1.1 Statistika Deskriptif

# Memanggil dataset bawaan R
data("quakes")

# Melihat struktur data
str(quakes)
## 'data.frame':    1000 obs. of  5 variables:
##  $ lat     : num  -20.4 -20.6 -26 -18 -20.4 ...
##  $ long    : num  182 181 184 182 182 ...
##  $ depth   : int  562 650 42 626 649 195 82 194 211 622 ...
##  $ mag     : num  4.8 4.2 5.4 4.1 4 4 4.8 4.4 4.7 4.3 ...
##  $ stations: int  41 15 43 19 11 12 43 15 35 19 ...
# Statistik deskriptif 
summary(quakes)
##       lat              long           depth            mag      
##  Min.   :-38.59   Min.   :165.7   Min.   : 40.0   Min.   :4.00  
##  1st Qu.:-23.47   1st Qu.:179.6   1st Qu.: 99.0   1st Qu.:4.30  
##  Median :-20.30   Median :181.4   Median :247.0   Median :4.60  
##  Mean   :-20.64   Mean   :179.5   Mean   :311.4   Mean   :4.62  
##  3rd Qu.:-17.64   3rd Qu.:183.2   3rd Qu.:543.0   3rd Qu.:4.90  
##  Max.   :-10.72   Max.   :188.1   Max.   :680.0   Max.   :6.40  
##     stations     
##  Min.   : 10.00  
##  1st Qu.: 18.00  
##  Median : 27.00  
##  Mean   : 33.42  
##  3rd Qu.: 42.00  
##  Max.   :132.00

Dataset quakes terdiri dari 1000 observasi dengan lima variabel numerik, yaitu latitude, longitude,depth, magnitude, dan stations. Hasil eksplorasi struktur data menunjukkan bahwa seluruh variabel bersifat numerik dan tidak terdapat nilai hilang, sehingga dataset berada dalam kondisi baik untuk dianalisis lebih lanjut. Nilai magnitudo pada dataset berada dalam rentang 4.0 hingga 6.4, dengan rata-rata sekitar 4.6, yang menunjukkan bahwa sebagian besar gempa dalam dataset tergolong berkekuatan sedang. Sementara itu,jumlah stasiun seismik yang berhasil mendeteksi tiap gempa berkisar antara 10 hingga 135, dengan nilaimedian sekitar 20, mengindikasikan bahwa sebagian besar kejadian gempa hanya terdeteksi oleh sejumlah kecil stasiun seismik.

3.1.2 Visualisasi

  1. Histogram Magnitudo
# Memanggil dataset
data("quakes")

# Histogram Magnitudo 
hist(
  quakes$mag,
  main = "Histogram Magnitudo Gempa",
  xlab = "Magnitudo",
  ylab = "Frekuensi",
  col = "lightblue",
  border = "black"
)

Histogram magnitudo menunjukkan sebaran kekuatan gempa dalam dataset quakes. Mayoritas nilai magnitudo berada pada rentang menengah, sehingga dapat disimpulkan bahwa gempa berkekuatansedang lebih sering terjadi dibandingkan gempa besar. Informasi ini penting sebagai gambaran awaldistribusi variabel sebelum dianalisis lebih lanjut dalam model regresi yang menilai pengaruh magnitudo terhadap jumlah stasiun pendeteksi

  1. Histogram Stations
# Memanggil dataset
data("quakes")

# Histogrm stations
hist(
  quakes$stations,
  main = "Histogram Jumlah Deteksi Stasiun",
  xlab = "Jumlah Stations",
  ylab = "Frekuensi",
  col = "yellow",
  border = "black"
)

Histogram jumlah stations menggambarkan distribusi banyaknya stasiun seismik yang berhasil mende teksi setiap kejadian gempa. Terlihat bahwa sebagian besar gempa hanya terdeteksi oleh sedikit stasiun, sedangkan jumlah kejadian yang terdeteksi oleh banyak stasiun sangat sedikit. Hal ini menunjukkanbahwa tidak semua gempa terekam secara luas, sehingga tingkat deteksi bergantung pada kekuatan gempa maupun lokasi kejadian.

  1. Scatterplot Magnitudo vs Stations
library(ggplot2)

ggplot(quakes, aes(x = mag, y = stations)) +
  geom_point(alpha = 0.6) +
  geom_smooth(method = "lm", se = TRUE) +
  labs(
    title = "Scatterplot Magnitudo vs Stations",
    x = "Magnitudo (mag)",
    y = "Jumlah Stasiun (stations)"
  )
## `geom_smooth()` using formula = 'y ~ x'

Scatterplot menunjukkan pola meningkat, di mana gempa dengan magnitudo lebih besar cenderung terdeteksi oleh lebih banyak stasiun seismik. Garis regresi yang menanjak menegaskan adanya hubungan positif antara kedua variabel. Artinya, semakin kuat suatu gempa, semakin luas jangkauan deteksinya. Hal ini mendukung hipotesis bahwa magnitudo berpengaruh terhadap jumlah stasiun yang mampu merekam peristiwa gempa.

3.2 Analisis dan Estimasi Model Regresi Linier Sederhana

  1. Hipotesis
    H₀: Tidak terdapat pengaruh signifikan antara magnitudo gempa dan jumlah stasiun yang mendeteksinya
    H₁: Terdapat pengaruh signifikan antara magnitudo gempa dan jumlah stasiun yang mendeteksinya

  2. Analisis

# Memanggil dataset
data("quakes")

# Model regresi linier sederhana
model <- lm(stations ~ mag, data = quakes)

# Menampilkan ringkasan model
summary(model)
## 
## Call:
## lm(formula = stations ~ mag, data = quakes)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -48.871  -7.102  -0.474   6.783  50.244 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -180.4243     4.1899  -43.06   <2e-16 ***
## mag           46.2822     0.9034   51.23   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 11.5 on 998 degrees of freedom
## Multiple R-squared:  0.7245, Adjusted R-squared:  0.7242 
## F-statistic:  2625 on 1 and 998 DF,  p-value: < 2.2e-16
  1. Persamaan Model
    Y duga = b0 + b1 x1
    Y duga = -180.4243 + 46.2822(magnitudo)

  2. Kriteria Keputusan
    Dengan tingkat signifikansi α = 0.05:
    • jika nilai p-value < 0.05 maka tolak H0
    • jika nilai p-value ≥ 0.05 maka gagal tolak H0 (terima H1)

  3. Penarikan Kesimpulan
    Berdasarkan output analisis:
    • Nilai p-value untuk variabel magnitudo (mag): < 2.2e-16 (sangat kecil)
    • Nilai p-value model secara keseluruhan: < 2.2e-16
    • Tingkat signifikansi α: 0.05
    Karena p-value (< 2.2e-16) < α (0.05), maka H₀ ditolak dan H₁ diterima
    Kesimpulan: Dengan taraf signifikansi 0,05 cukup bukti untuk menolak H0. Sehingga Terdapat pengaruh yang signifikan secara statistik antara magnitudo gempa dengan jumlah stasiun yang mendeteksinya.

MODEL INIPERLU KITA UJI ASUMSI APAKAH MODEL INI LAYAK DI GUNAKAN UNTUK INFERENSI

3.3 Uji Asumsi Klasik

3.3.1 Uji Normalitas

  1. Hipotesis
    H₀: Residual berdistribusi normal
    H₁: Residual tidak berdistribusi normal

  2. Analisis

# Model regresi linier sederhana
model <- lm(stations ~ mag, data = quakes)
# Shapiro-Wilk Test
shapiro.test(residuals(model))
## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(model)
## W = 0.98512, p-value = 1.465e-08
  1. Kriteria Keputusan
    Dengan tingkat signifikansi α = 0,05:
    • Tolak H₀ jika nilai p-value < 0,05
    • Gagal tolak H₀ jika nilai p-value ≥ 0,05

  2. Penarikan Kesimpulan
    Berdasarkan output analisis:
    • Nilai p-value = 1.465e-08
    • Taraf signifikansi α = 0,05
    Karena p-value (1.465e-08) < α (0,05), maka:
    “Dengan taraf signifikansi 0,05, maka CUKUP BUKTI untuk menolak H₀”
    Artinya: Residual dari model regresi linier antara magnitudo gempa dan jumlah stasiun tidak berdistribusi norma

3.3.2 Uji Homoskedastisitas

  1. Hipotesis
    H₀: Varians residual homoskedastis (varian konstan)
    H₁: Varians residual heteroskedastis (varian tidak konstan)

  2. Analisis

# Model regresi linier sederhana
model <- lm(stations ~ mag, data = quakes)
# Uji Breusch-Pagan (menggunakan lmtest)
library(lmtest)
## Loading required package: zoo
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
bptest(model)
## 
##  studentized Breusch-Pagan test
## 
## data:  model
## BP = 125.91, df = 1, p-value < 2.2e-16
  1. Kriteria Keputusan
    Dengan tingkat signifikansi α = 0,05:
    • Tolak H₀ jika nilai p-value < 0,05
    • Gagal tolak H₀ jika nilai p-value ≥ 0,05

  2. Penarikan Kesimpulan
    Berdasarkan output analisis:
    • Nilai p-value = < 2.2e-16
    • Taraf signifikansi α = 0,05
    Karena p-value (< 2.2e-16) < α (0,05), maka:
    “Dengan taraf signifikansi 0,05, maka CUKUP BUKTI untuk menolak H₀”
    Artinya: Varians residual tidak konstan (heteroskedastisitas) pada model regresi linier antara magnitudo gempa dan jumlah stasiun.

3.3.3 Uji Linearitas

  1. Hipotesis
    H₀: Model sudah berbentuk linier
    H₁: Model tidak berbentuk linier

  2. Analisis

library(car)
## Loading required package: carData
# Component + Residual Plot untuk prediktor 'mag'
crPlot(model, variable = "mag")

  1. Kriteria Keputusan:
    Tolak H₀ jika garis spline pada CR Plot menyimpang jauh dari garis linier
    Hasil CR Plot:
    • Garis spline (biru) hampir sejajar dengan garis regresi (merah)
    • Tidak ada penyimpangan yang signifikan

  2. Kesimpulan:
    Dengan taraf signifikansi 0,05, maka TIDAK CUKUP BUKTI untuk menolak H₀
    Artinya: Asumsi linearitas TERPENUHI - hubungan antara magnitudo gempa dan jumlah stasiun dapat dianggap linier.

3.3.3 Uji Non Autokorelasi

  1. Hipotesis
    H₀: Tidak terdapat autokorelasi pada residual
    H₁: Terdapat autokorelasi pada residual

  2. Analisis

model <- lm(stations ~ mag, data = quakes)
# Uji Autokorelasi dengan Durbin-Watson test
library(lmtest)
uji_autokorelasi <- dwtest(model)
print(uji_autokorelasi)
## 
##  Durbin-Watson test
## 
## data:  model
## DW = 1.8893, p-value = 0.03979
## alternative hypothesis: true autocorrelation is greater than 0
  1. Kriteria Keputusan
    Dengan tingkat signifikansi α = 0,05:
    • Tolak H₀ jika p-value < 0,05
    • Gagal tolak H₀ jika p-value ≥ 0,05

  2. Penarikan Kesimpulan
    Berdasarkan output analisis:
    • Nilai p-value = 0,03979
    • Nilai Durbin-Watson = 1,8893
    • Taraf signifikansi α = 0,05
    Karena p-value (0,03979) < α (0,05), maka:
    “Dengan taraf signifikansi 0,05, maka CUKUP BUKTI untuk menolak H₀”
    Artinya: Terdapat autokorelasi pada residual model regresi antara magnitudo gempa dan jumlah stasiun.

KESIMPULAN UJI ASUMSI KLASIK : Model tersebut tidak valid untuk inferensi (uji t dan uji F) karena asumsi normalitas, hooskeadastisitas, dn non-autokorelasi tidak terpenuhi. maka kita perlu perbaikan model dengan cara “Transformasi Logaritma Natural”

3.4 Perbaikan model regeresi linier sederhana

  1. Hipotesis
    H₀: Tidak terdapat pengaruh signifikan antara magnitudo gempa dan log jumlah stasiun
    H₁: Terdapat pengaruh signifikan antara magnitudo gempa dan log jumlah stasiun

  2. Analisis

## model final 
# Transformasi Logaritma Natural
quakes$log_stations <- log(quakes$stations)  

# Estimasi Model Regresi Final (Model Log-Linier)
model_final <- lm(log_stations ~ mag, data = quakes)
summary(model_final)
## 
## Call:
## lm(formula = log_stations ~ mag, data = quakes)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -1.37779 -0.18566  0.02823  0.21972  0.91295 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -2.23745    0.11692  -19.14   <2e-16 ***
## mag          1.20525    0.02521   47.81   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.3209 on 998 degrees of freedom
## Multiple R-squared:  0.6961, Adjusted R-squared:  0.6958 
## F-statistic:  2286 on 1 and 998 DF,  p-value: < 2.2e-16
  1. Persamaan model
    Y duga = b0 + b1 x1
    Y duga = -2.23745 + 1.20525(magnitudo)

  2. Kriteria Keputusan
    Dengan tingkat signifikansi α = 0,05:
    • Tolak H₀ jika p-value < 0,05
    • Gagal tolak H₀ jika p-value ≥ 0,05

  3. Penarikan Kesimpulan
    Berdasarkan output analisis:
    • p-value variabel mag: < 2e-16
    • p-value model (F-statistic): < 2.2e-16
    • Taraf signifikansi α: 0,05
    Karena p-value (< 2e-16) < α (0,05), maka:
    “Dengan taraf signifikansi 0,05, maka CUKUP BUKTI untuk menolak H₀”
    Artinya: Terdapat pengaruh yang signifikan secara statistik antara magnitudo gempa dengan jumlah stasiun yang mendeteksinya.

SELANJUTNYA KITA CEK LAGI DENGAN UJI ASUMSI

3.4.1 Uji Normalitas Final

  1. Hipotesis
    H₀: Residual model final berdistribusi normal
    H₁: Residual model final tidak berdistribusi normal

  2. Analisis

# uji normalitas   
uji_normalitas_final <- shapiro.test(residuals(model_final))  
print(uji_normalitas_final)  
## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(model_final)
## W = 0.98849, p-value = 4.575e-07
  1. Kriteria Keputusan
    Dengan tingkat signifikansi α = 0,05:
    • Tolak H₀ jika p-value < 0,05
    • Gagal tolak H₀ jika p-value ≥ 0,05

  2. Penarikan Kesimpulan
    Berdasarkan output analisis:
    • Nilai p-value = 4.575e-07
    • Taraf signifikansi α = 0,05
    Karena p-value (4.575e-07) < α (0,05), maka:
    “Dengan taraf signifikansi 0,05, maka CUKUP BUKTI untuk menolak H₀”
    Artinya: Residual model final tidak berdistribusi normal. Setelah dilakukan perbaikan namun hasilnya masiih tidak berdistribusi normal tetapi sudah mendekati 0,05

3.4.2 Uji Homoskedastisitas Final

  1. Hipotesis
    H₀: Varians residual homoskedastis (varian konstan)
    H₁: Varians residual heteroskedastis (varian tidak konstan)

  2. Analisis

#UJI HOMOSKEDASTISITAS 
uji_hetero_final <- bptest(model_final)
print(uji_hetero_final)
## 
##  studentized Breusch-Pagan test
## 
## data:  model_final
## BP = 0.0069991, df = 1, p-value = 0.9333
  1. Kriteria Keputusan
    Dengan tingkat signifikansi α = 0,05:
    • Tolak H₀ jika p-value < 0,05
    • Gagal tolak H₀ jika p-value ≥ 0,05

  2. Penarikan Kesimpulan
    Berdasarkan output analisis:
    • Nilai p-value = 0,9333
    • Nilai BP = 0,0069991
    • Taraf signifikansi α = 0,05
    Karena p-value (0,9333) > α (0,05), maka:
    “Dengan taraf signifikansi 0,05, maka TIDAK CUKUP BUKTI untuk menolak H₀”
    Artinya: Varians residual model final adalah homoskedastis (varian konstan)

3.4.3 Uji Linearitas Final

  1. Hipotesis
    H₀: Model sudah berbentuk linier
    H₁: Model tidak berbentuk linier

  2. Analisis

# Uji Linearitas dengan Component + Residual Plot
library(car)
crPlot(model_final, variable = "mag")

  1. Kriteria Keputusan:
    Tolak H₀ jika garis spline pada CR Plot menyimpang jauh dari garis linier
    Hasil CR Plot:
    • Garis spline (biru) hampir sejajar dengan garis regresi (merah)
    • Tidak ada penyimpangan yang signifikan

  2. Kesimpulan:
    Dengan taraf signifikansi 0,05, maka TIDAK CUKUP BUKTI untuk menolak H₀
    Artinya: Asumsi linearitas TERPENUHI - hubungan antara magnitudo gempa dan jumlah stasiun dapat dianggap linier.

3.4.4 Uji Non Autokorelasi Final

  1. Hipotesis
    H₀: Tidak terdapat autokorelasi pada residual model final
    H₁: Terdapat autokorelasi pada residual model final

  2. Analisis

# Uji Autokorelasi dengan Durbin-Watson Test
library(lmtest)
uji_autokorelasi_final <- dwtest(model_final)
print(uji_autokorelasi_final)
## 
##  Durbin-Watson test
## 
## data:  model_final
## DW = 1.8703, p-value = 0.01999
## alternative hypothesis: true autocorrelation is greater than 0
  1. Kriteria Keputusan
    Dengan tingkat signifikansi α = 0,05:
    • Tolak H₀ jika p-value < 0,05
    • Gagal tolak H₀ jika p-value ≥ 0,05

  2. Penarikan Kesimpulan
    Berdasarkan output analisis:
    • Nilai p-value = 0,01999
    • Nilai Durbin-Watson = 1,8703
    • Taraf signifikansi α = 0,05
    Karena p-value (0,01999) < α (0,05), maka:
    “Dengan taraf signifikansi 0,05, maka CUKUP BUKTI untuk menolak H₀”
    Artinya: Masih terdapat autokorelasi pada residual model final.
    Evaluasi Perbaikan:
    • Model awal: p-value = 0,03979
    • Model final: p-value = 0,01999

KESIMPULAN MODEL FINAL : setelah melakukan transformasi dan uji asumsi klasik kembali. terdapat perbaikan model. sehingga model layak digunakan untuk inferensi .

##3.5 Inferensi dan Interpretasi Model Regresi Final 1. Hipotesis
H₀: Tidak terdapat pengaruh signifikan antara magnitudo gempa dan jumlah stasiun
H₁: Terdapat pengaruh signifikan antara magnitudo gempa dan jumlah stasiun

  1. Analisis
## model final 
model_final <- lm(log_stations ~ mag, data = quakes)
summary(model_final)
## 
## Call:
## lm(formula = log_stations ~ mag, data = quakes)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -1.37779 -0.18566  0.02823  0.21972  0.91295 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -2.23745    0.11692  -19.14   <2e-16 ***
## mag          1.20525    0.02521   47.81   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.3209 on 998 degrees of freedom
## Multiple R-squared:  0.6961, Adjusted R-squared:  0.6958 
## F-statistic:  2286 on 1 and 998 DF,  p-value: < 2.2e-16
  1. Persamaan model
    Y duga = b0 + b1 x1
    Y duga = -2.23745 + 1.20525(magnitudo)

  2. Kriteria Keputusan
    Dengan tingkat signifikansi α = 0,05:
    • Tolak H₀ jika p-value < 0,05
    • Gagal tolak H₀ jika p-value ≥ 0,05

  3. Penarikan Kesimpulan
    Berdasarkan output analisis:
    • p-value variabel mag: < 2e-16
    • p-value model (F-statistic): < 2.2e-16
    • Taraf signifikansi α: 0,05
    Karena p-value (< 2e-16) < α (0,05), maka:
    “Dengan taraf signifikansi 0,05, maka CUKUP BUKTI untuk menolak H₀”
    Artinya: Terdapat pengaruh yang signifikan secara statistik antara magnitudo gempa dengan jumlah stasiun yang mendeteksinya.

  4. Koefisien Determinan
    berdasarkan hasil estimasi nilai R-squared adalah 0.6961 atau 69.61%. artinya keragaman pada variabel terikat (Intensitas Deteksi Stasiun Seismik) mampu dijelaskan oleh variabel bebas (Magnitudo Gempa) di dalam model sebesar 69.61%. Sementara itu, 30.39% sisanya dijelaskan oleh faktor-faktor lain yang tidak dimasukkan dalam model regresi.

4. KESIMPULAN

Statistik deskriptif menunjukkan sebagian besar gempa berkekuatan sedang (magnitudo rata-rata 4.6) dan hanya terdeteksi oleh sedikit stasiun seismik (median 20). Visualisasi Scatterplot menegaskan adanya hubungan positif yang kuat antara Magnitudo Gempa dan Intensitas Deteksi Stasiun Seismik, di mana gempa yang lebih kuat cenderung direkam oleh lebih banyak stasiun.

model Regresi Linier Sederhana awal tidak layak untuk inferensi karena melanggar asumsi Normalitas, Homoskedastisitas, dan Non-Autokorelasi.

Setelah dilakukan perbaikan model melalui Transformasi Logaritma Natural pada variabel terikat Model Final yang lebih baik berhasil dibangun. Meskipun uji Normalitas dan Autokorelasi masih bermasalah, model final telah memenuhi asumsi Homoskedastisitas dan Linieritas, sehingga dianggap layak untuk inferensi. Dengan taraf signifikansi 0,05, terdapat pengaruh yang signifikan secara statistik antara Magnitudo Gempa terhadap Intensitas Deteksi Stasiun Seismik (dalam skala log). Koefisien determinasi sebesar 69,61% menunjukkan bahwa keragaman pada variabel terikat (Intensitas Deteksi Stasiun Seismik) mampu dijelaskan oleh variabel bebas (Magnitudo Gempa) di dalam model sebesar 69.61%. Sementara itu, 30.39% sisanya dijelaskan oleh faktor-faktor lain yang tidak dimasukkan dalam model regresi.

Daftar Pustaka

  1. Dirna, F. C., Rachmawati, R., Firmansyah, F., Sam, M., Jaya, A. I., Arifin, A., & Abubakar, A. (2025 ). Statistika Deskriptif Konsep dan Metode . Star Digital Publishing.

  2. Sudipa, I. G., Sarasvananda, I. B., Hartatik, Prayitno, H., Putra, I. N., Darmawan, R., . . . Efitra. (2023). Teknik Visualisasi Data . PT. Sonpedia Publishing Indonesia.

  3. Tunjung Genarsih, M. D. (n.d.). Belajar Statistika: Konsep Dasar dan Pengantar Statistika Penelitian. 2024: Zahir Publishing

  4. Riska A 2024 Analisis regresi linear sederhana dan asumsi RStudio Pubs