Tugas STA1372 - Metode Simulasi dan Resampling

2023-04-30

1. Mensimulasikan perbandingan ketakbiasan dari rata-rata contoh dan median contoh

Berikut merupakan langkah-langkah dalam mensimulasikan perbandingan ketakbiasan dari rata-rata contoh dan median contoh:

Pertama, kita akan membuat contoh data dengan menggunakan fungsi rnorm() yang menghasilkan sampel data acak dari distribusi normal. Sampel data yang digunakan sebanyak 1000 observasi dengan mean 10 dan simpangan baku 2.

set.seed(123)
sample_data <- rnorm(1000, mean = 10, sd = 2)

Setelah itu, dibuat vektor mean_vec dan median vec untuk menyimpan rata-rata dan median contoh.

mean_vec <- vector(length = 1000)
median_vec <- vector(length = 1000)

Simulasi perbandingan ketakbiasan rata-rata dan median dapat dilakukan dengan cara mengulang atau membuat simulasi sebanyak 1000 kali untuk mengambil rata-rata dan median contoh.

for (i in 1:1000) {
  samp_i <- sample(sample_data, replace = TRUE)
  mean_vec[i] <- mean(samp_i)
  median_vec[i] <- median(samp_i)
}

Gambar dibawah merupakan histogram yang menampilkan distribusi rata-rata dan median bias contoh yang dihasilkan dari simulasi.

hist(mean_vec, col = "coral", main = "Distribusi Rata-rata Contoh")

hist(median_vec, col = "yellow", main = "Distribusi Median Contoh")

Pada histogram tersebut dapat dilihat bahwa kedua distribusi baik pada rata-rata contoh maupun median contoh cenderung simetris (tidak menjulur ke salah satu sisi). Dalam hal ini, rata-rata dan median dari sampel menghasilkan nilai yang mendekati nilai sebenarnya dari populasi.

Berikut merupakan nilai rata-rata dan median dari kedua distribusi yang ditampilkan dengan menggunakan perintah cat.

cat("Rata-rata distribusi rata-rata contoh: ", mean(mean_vec), "\n")
## Rata-rata distribusi rata-rata contoh:  10.0349
cat("Median distribusi rata-rata contoh: ", median(mean_vec), "\n")
## Median distribusi rata-rata contoh:  10.03665
cat("Rata-rata distribusi median contoh: ", mean(median_vec), "\n")
## Rata-rata distribusi median contoh:  10.02551
cat("Median distribusi median contoh: ", median(median_vec), "\n")
## Median distribusi median contoh:  10.03039

Berdasarkan hasil output tersebut, dapat dilihat bahwa nilai rata-rata dan median dari distribusi rata-rata contoh tidak jauh berbeda, begitu juga dengan distribusi median contoh. Hal ini menunjukkan bahwa distribusi tersebut cenderung simetris.

2 Mensimulasikan perbandingan ketakbiasan ragam dengan pembagi n dan n-1

Berikut merupakan langkah-langkah dalam mensimulasikan perbandingan ketakbiasan ragam dengan pembagi n dan n-1:

Pertama, kita akan membuat contoh data dengan menggunakan fungsi rnorm() yang menghasilkan sampel data acak dari distribusi normal. Sampel data yang digunakan sebanyak 100 observasi dengan mean 0 dan simpangan baku 1.

n <- 100
data <- rnorm(100, mean = 0, sd = 1)

Kemudian, menghitung nilai ragam dengan pembagi n dan n-1.

#menghitung nilai ragam dengan pembagi n

ragam_n <- var(data)
#menghitung nilai ragam dengan pembagi n-1

ragam_n2 <- var(data)*(n-1)/n

Setelah itu, menghitung perbedaan antara nilai ragam dengan pembagi n dan n-1.

diff_ragam <- ragam_n - ragam_n2

Mengulangi ketiga langkah di atas sebanyak 1000 kali untuk melihat perbedaan distribusi antara ragam dengan pembagi n dan n-1.

n_sim <- 1000
diff_ragam_vec <- numeric(n_sim)
for (i in 1:n_sim) {
  data <- rnorm(n, mean = 0, sd = 1)
  ragam_n <- var(data)
  ragam_n2 <- var(data) * (n - 1) / n
  diff_ragam_vec[i] <- ragam_n - ragam_n2
}

Gambar dibawah merupakan histogram yang menampilkan distribusi perbedaan antara ragam dengan pembagi n dan n-1 yang dihasilkan dari simulasi.

hist(diff_ragam_vec, breaks = 20, col = "purple", main = "Perbandingan Ketakbiasan Ragam dengan Pembagi n dan n-1")

Terdapat perbedaan yang cukup signifikan antara nilai ragam dengan pembagi n dan n-1. Pembagi n-1 cenderung memberikan hasil yang lebih akurat daripada pembagi n karena menyesuaikan dengan jumlah sampel yang digunakan, sehingga pembagi n-1 sering digunakan untuk menghasilkan estimasi yang lebih akurat dari ketakbiasan ragam. Namun, pada dataset yang besar, perbedaan antara kedua pembagi ragam tersebut cenderung tidak signifikan.