KB 3: Analisis Data Randu - Statistik Bisnis (26 Juni 2024)

Author

Ainu Azzaria

Pendahuluan

Dokumen ini adalah contoh analisis data menggunakan Quarto dengan dataset `randu`. Kami akan mencakup beberapa modul analisis data seperti distribusi normal, estimasi, uji hipotesis, analisis varians, regresi, dan peramalan.

Memuat Data

Pertama, kita akan memuat dataset `randu` dari paket `datasets` di R.

# Memuat dataset
data("randu", package = "datasets")

Modul 8: Analisis Varians

Melakukan ANOVA untuk memeriksa perbedaan antara kelompok yang dibuat secara acak.

# Membuat variabel faktor
randu$group <- factor(rep(1:3, length.out=nrow(randu)))

# Melakukan ANOVA
anova_result <- aov(x ~ group, data=randu)
summary(anova_result)
             Df Sum Sq Mean Sq F value Pr(>F)
group         2   0.35 0.17481   2.165  0.116
Residuals   397  32.06 0.08076               

Analisis Varians ini memeriksa apakah ada perbedaan signifikan antara kelompok yang dibuat secara acak dalam kolom `group`. Hasilnya menunjukkan F-statistik dan nilai p untuk memeriksa perbedaan antara grup.

Modul 9: Regresi

Membuat model regresi linear antara kolom `x` dan `y`.

# Regresi linear
lm_result <- lm(y ~ x, data=randu)
summary(lm_result)

Call:
lm(formula = y ~ x, data = randu)

Residuals:
     Min       1Q   Median       3Q      Max 
-0.51216 -0.25973 -0.01152  0.24429  0.52379 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)  0.51235    0.03088  16.593   <2e-16 ***
x           -0.04995    0.05160  -0.968    0.334    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 0.2937 on 398 degrees of freedom
Multiple R-squared:  0.002349,  Adjusted R-squared:  -0.0001572 
F-statistic: 0.9373 on 1 and 398 DF,  p-value: 0.3336

Regresi linear sederhana ini memodelkan hubungan antara kolom `x` dan `y`. Hasilnya memberikan informasi tentang koefisien regresi, nilai t, dan nilai p.

Modul 10: Peramalan

Melakukan peramalan deret waktu menggunakan model ARIMA.

# Load library forecasting
library(forecast)
Registered S3 method overwritten by 'quantmod':
  method            from
  as.zoo.data.frame zoo 
# Data deret waktu
ts_data <- ts(randu$x, frequency = 1)

# Model ARIMA otomatis
fit <- auto.arima(ts_data)

# Peramalan
forecast_result <- forecast(fit, h=10)
plot(forecast_result)

Peramalan ini menggunakan model ARIMA otomatis untuk data deret waktu dari kolom `x`. Hasil plot menunjukkan nilai aktual dan nilai prediksi dengan interval kepercayaan untuk 10 periode mendatang.