# Memuat dataset
data("randu", package = "datasets")KB 3: Analisis Data Randu - Statistik Bisnis (26 Juni 2024)
Pendahuluan
Dokumen ini adalah contoh analisis data menggunakan Quarto dengan dataset `randu`. Kami akan mencakup beberapa modul analisis data seperti distribusi normal, estimasi, uji hipotesis, analisis varians, regresi, dan peramalan.
Memuat Data
Pertama, kita akan memuat dataset `randu` dari paket `datasets` di R.
Modul 8: Analisis Varians
Melakukan ANOVA untuk memeriksa perbedaan antara kelompok yang dibuat secara acak.
# Membuat variabel faktor
randu$group <- factor(rep(1:3, length.out=nrow(randu)))
# Melakukan ANOVA
anova_result <- aov(x ~ group, data=randu)
summary(anova_result) Df Sum Sq Mean Sq F value Pr(>F)
group 2 0.35 0.17481 2.165 0.116
Residuals 397 32.06 0.08076
Analisis Varians ini memeriksa apakah ada perbedaan signifikan antara kelompok yang dibuat secara acak dalam kolom `group`. Hasilnya menunjukkan F-statistik dan nilai p untuk memeriksa perbedaan antara grup.
Modul 9: Regresi
Membuat model regresi linear antara kolom `x` dan `y`.
# Regresi linear
lm_result <- lm(y ~ x, data=randu)
summary(lm_result)
Call:
lm(formula = y ~ x, data = randu)
Residuals:
Min 1Q Median 3Q Max
-0.51216 -0.25973 -0.01152 0.24429 0.52379
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.51235 0.03088 16.593 <2e-16 ***
x -0.04995 0.05160 -0.968 0.334
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 0.2937 on 398 degrees of freedom
Multiple R-squared: 0.002349, Adjusted R-squared: -0.0001572
F-statistic: 0.9373 on 1 and 398 DF, p-value: 0.3336
Regresi linear sederhana ini memodelkan hubungan antara kolom `x` dan `y`. Hasilnya memberikan informasi tentang koefisien regresi, nilai t, dan nilai p.
Modul 10: Peramalan
Melakukan peramalan deret waktu menggunakan model ARIMA.
# Load library forecasting
library(forecast)Registered S3 method overwritten by 'quantmod':
method from
as.zoo.data.frame zoo
# Data deret waktu
ts_data <- ts(randu$x, frequency = 1)
# Model ARIMA otomatis
fit <- auto.arima(ts_data)
# Peramalan
forecast_result <- forecast(fit, h=10)
plot(forecast_result)Peramalan ini menggunakan model ARIMA otomatis untuk data deret waktu dari kolom `x`. Hasil plot menunjukkan nilai aktual dan nilai prediksi dengan interval kepercayaan untuk 10 periode mendatang.