Sebanyak 1.000 observasi dibangkitkan dari distribusi normal dengan rata-rata 30 dan simpangan baku 2,5. Selanjutnya, sampel berukuran 50 diambil sebanyak 1.000 kali. Rata-rata setiap sampel disimpan dalam sebuah vektor.
# Menetapkan seed
set.seed(150)
# Menghasilkan 1.000 observasi
data_asli <- rnorm( n = 1000, mean = 30, sd = 2.5 )
# Menyiapkan vektor penyimpanan
rata_rata_sampel <- numeric(1000)
# Mengambil sampel berukuran 50 sebanyak 1.000 kali
for (i in 1:1000) {
sampel <- sample(
data_asli,
size = 50,
replace = FALSE )
rata_rata_sampel[i] <- mean(sampel) }
Menampilkan Hasil
# Enam observasi pertama
head(data_asli)
## [1] 25.91923 29.84251 28.23638 29.21455 29.33263 30.38290
# Enam rata-rata sampel pertama
head(rata_rata_sampel)
## [1] 29.88923 29.12852 29.96403 30.28330 29.42555 30.13464
Ringkasan Statistik
ringkasan <- data.frame(
Data = c("Data asli", "Rata-rata sampel"),
Rata_Rata = c(
mean(data_asli),
mean(rata_rata_sampel)
),
Simpangan_Baku = c(
sd(data_asli),
sd(rata_rata_sampel)
),
Minimum = c(
min(data_asli),
min(rata_rata_sampel)
),
Maksimum = c(
max(data_asli),
max(rata_rata_sampel)
)
)
Nilai rata-rata data asli dan rata-rata dari seluruh rata-rata sampel seharusnya berada di sekitar 30. Simpangan baku rata-rata sampel secara teoretis mendekati:
2.5 / sqrt(50)
## [1] 0.3535534
Dua histogram berikut digabungkan dalam satu tampilan \[ par(mfrow = c(1, 2)). \]
# Menggabungkan dua histogram dalam satu grafik
par(mfrow = c(1, 2))
hist(
data_asli,
breaks = 30,
col = "lightblue",
border = "white",
main = "Distribusi Data Asli",
xlab = "Nilai Observasi"
)
hist(
rata_rata_sampel,
breaks = 30,
col = "lightgreen",
border = "white",
main = "Distribusi Rata-Rata Sampel",
xlab = "Rata-Rata Sampel"
)
# Mengembalikan tampilan grafik
par(mfrow = c(1, 1))
Histogram data asli memperlihatkan distribusi nilai dari 1.000 observasi. Distribusinya berbentuk mendekati normal dan berpusat di sekitar nilai 30. Penyebaran data asli relatif lebar karena memiliki simpangan baku sebesar 2,5.
Histogram rata-rata sampel juga berbentuk mendekati normal dan berpusat di sekitar 30. Namun, penyebarannya jauh lebih sempit daripada data asli. Hal ini terjadi karena rata-rata sampel memiliki galat baku sekitar 0,354, yaitu lebih kecil daripada simpangan baku data asli.
Hasil tersebut menunjukkan bahwa rata-rata dari sampel berukuran 50 cenderung lebih stabil dan lebih dekat dengan rata-rata populasi. Meskipun nilai setiap observasi cukup bervariasi, proses pengambilan rata-rata mengurangi variasi tersebut. Hasil simulasi ini sesuai dengan konsep distribusi sampling rata-rata dan Teorema Limit Pusat.