Data sunspots (bintik matahari) merupakan salah satu dataset runtun waktu klasik yang mencatat aktivitas matahari selama berabad-abad. Aktivitas ini penting karena bintik matahari memengaruhi radiasi elektromagnetik yang mencapai Bumi, yang pada gilirannya berdampak pada iklim global dan gangguan komunikasi radio. Secara statistik, data sunspots memiliki pola siklus yang kuat namun memiliki variabilitas yang kompleks.Dalam analisis runtun waktu, model Autoregressive orde 1 atau AR(1) sering digunakan sebagai langkah awal untuk melihat persistensi data. Namun, estimasi parameter secara konvensional terkadang rentan terhadap asumsi distribusi. Oleh karena itu, metode Bootstrap hadir sebagai solusi non-parametrik untuk menaksir distribusi empiris dari koefisien model melalui proses resampling residu, guna mendapatkan estimasi yang lebih kuat (robust).
Bagaimana karakteristik data sunspots setelah dilakukan proses mean-centering?Berapa nilai estimasi parameter koefisien model AR(1) melalui metode bootstrap?Apakah koefisien model AR(1) yang dihasilkan signifikan secara statistik berdasarkan nilai \(t_{hitung}\) bootstrap?
Melakukan transformasi mean-centering dan fitting model AR(1) pada data sunspots.Mengimplementasikan algoritma bootstrap sebanyak \(B=200\) pada residu model.Menghitung simpangan baku dan statistik uji untuk menarik kesimpulan mengenai parameter model.
Model Autoregressive orde 1 menyatakan bahwa nilai pada waktu \(t\) dipengaruhi secara linier oleh nilai pada waktu sebelumnya (\(t-1\)). Persamaannya adalah:\[z_t = \phi z_{t-1} + \epsilon_t\]Di mana \(\phi\) adalah koefisien autoregresif dan \(\epsilon_t\) adalah white noise.
Agar model tidak memerlukan parameter intersep (\(\beta_0\)), data asli \(x\) ditransformasi menjadi \(z\) melalui rumus:\[z = x - \bar{x}\]
Metode ini dilakukan dengan mengambil residu dari model awal, lalu melakukan sampling ulang berulang kali dengan pengembalian (with replacement). Data tiruan dikonstruksi kembali menggunakan residu bootstrap tersebut untuk mendapatkan distribusi nilai \(\phi\) yang baru.
Dataset yang digunakan adalah data internal R bernama sunspots, yang berisi rata-rata bulanan jumlah bintik matahari dari tahun 1749 hingga 1983.
x <- as.numeric(sunspots)
x_bar <- mean(x)
z <- x - x_bar
par(mfrow=c(2,1))
plot.ts(x, main="Data Sunspots Asli", col="darkblue")
plot.ts(z, main="Data Sunspots (Mean-Centered)", col="darkred")
abline(h=0, lty=2)
fit_orig <- arima(z, order = c(1, 0, 0), include.mean = FALSE)
phi_hat <- fit_orig$coef[1]
residu <- residuals(fit_orig)
cat("Koefisien AR(1) Awal:", phi_hat)
## Koefisien AR(1) Awal: 0.9214238
set.seed(123)
B <- 200
n <- length(z)
boot_coefs <- numeric(B)
for(i in 1:B) {
res_boot <- sample(residu, size = n, replace = TRUE)
z_star <- numeric(n)
z_star[1] <- z[1]
for(t in 2:n) {
z_star[t] <- phi_hat * z_star[t-1] + res_boot[t]
}
fit_boot <- arima(z_star, order = c(1, 0, 0), include.mean = FALSE)
boot_coefs[i] <- fit_boot$coef[1]
}
beta_star_mean <- mean(boot_coefs)
se_boot <- sd(boot_coefs)
t_hitung <- beta_star_mean / se_boot
df_boot <- data.frame(coef = boot_coefs)
ggplot(df_boot, aes(x = coef)) +
geom_histogram(bins = 20, fill = "steelblue", color = "white") +
geom_vline(xintercept = beta_star_mean, color = "red", size = 1) +
labs(title = "Distribusi Koefisien Beta* (Bootstrap)",
x = "Nilai Koefisien AR(1)", y = "Frekuensi") +
theme_minimal()
Interpretasi: Dengan nilai \(t_{hitung}\) sebesar r round(t_hitung, 2), yang jauh lebih besar dari nilai kritis \(t_{\alpha=0.05}\) (sekitar 1.96), maka kita dapat menyimpulkan bahwa parameter \(\phi\) sangat signifikan. Ini menunjukkan adanya ketergantungan yang kuat antara aktivitas bintik matahari bulan ini dengan bulan sebelumnya.
Proses mean-centering berhasil menghilangkan komponen rata-rata sehingga data berfluktuasi di sekitar angka nol, memudahkan pemodelan AR(1) murni.Melalui simulasi bootstrap sebanyak 200 kali, diperoleh nilai rerata koefisien \(\bar{\beta}^*\) sebesar r round(beta_star_mean, 4).Nilai \(t_{hitung}\) menunjukkan signifikansi yang sangat tinggi, membuktikan bahwa model AR(1) sangat relevan untuk menjelaskan dinamika data sunspots.