Terdapat tiga faktor utama yang menentukan seberapa akurat estimasi kita terhadap populasi, yaitu ukuran sampel (\(n\)), variabilitas data (\(\sigma\) atau \(s\)), dan standar deviasi populasi diketahui atau tidak. Memahami interaksi antara faktor-faktor ini sangat penting untuk melakukan analisis statistik yang valid. Berikut adalah beberapa contoh untuk memahami interaksi pada setiap faktor.
Seorang Manajer Kualitas di sebuah perusahaan smartphone besar. Perusahaan baru saja memproduksi model terbaru, dan harus memberikan pernyataan resmi kepada publik mengenai rata-rata daya tahan baterai smartphone tersebut dalam penggunaan normal. Di sini Manajer akan mensimulasikan tiga tahap pengujian:
Berdasarkan data historis pabrik, diketahui standar deviasi populasi (\(\sigma\)) adalah 3 jam. Rata-rata dari sampel yang ditemukan adalah 15 jam.
# Parameter
rata_rata <- 15
sd_populasi <- 3
conf_level <- 0.95
z_score <- qnorm(0.975)
# Faktor 1: Ukuran sampel yang diuji (n = 5, 30, 100)
n_sampel <- c(5, 30, 100)
# Hitung interval kepercayaan (Step-by-step)
# Menghitung standar error
se <- sd_populasi / sqrt(n_sampel)
# Menghitung margin of error (E)
me <- z_score * se
# Menghitung batas bawah dan batas atas
bawah <- rata_rata - me
atas <- rata_rata + me
# Gabungkan dalam satu tabel
hasil_tugas <- data.frame(
n = n_sampel,
Standar_Error = round(se, 3),
Margin_of_Error = round(me, 3),
Lower_CI = round(bawah, 3),
Upper_CI = round(atas, 3),
Lebar_Interval = round(atas - bawah, 3)
)
# Hasil perhitungan
print(hasil_tugas)
## n Standar_Error Margin_of_Error Lower_CI Upper_CI Lebar_Interval
## 1 5 1.342 2.630 12.370 17.630 5.259
## 2 30 0.548 1.074 13.926 16.074 2.147
## 3 100 0.300 0.588 14.412 15.588 1.176
Berdasarkan tabel yang diperoleh, bisa dilihat pola yang jelas mengenai ketidakpastian:
Seorang auditor QC di pabrik snack. Standar berat satu bungkus keripik adalah 250 gram. Anda mengambil sampel 30 bungkus (n=30) dari tiga mesin pengemas yang berbeda:
bagaimana variabilitas mesin ini mempengaruhi keyakinan kita terhadap rata-rata berat produk.
# Parameter
rata_rata_snack <- 250
n_audit <- 30
conf_level <- 0.95
z_score <- qnorm(0.975)
# Faktor 2: Variabilitas
sd_mesin <- c(10, 50, 90)
# Perhitungan Statistik
# Hitung standar error
se_snack <- sd_mesin / sqrt(n_audit)
# Hitung margin of error
me_snack <- z_score * se_snack
# Hitung Interval Kepercayaan (CI)
bawah_snack <- rata_rata_snack - me_snack
atas_snack <- rata_rata_snack + me_snack
# Tabel Hasil
tabel_audit <- data.frame(
Kondisi_Mesin = c("Presisi (SD 10)", "Lama (SD 50)", "Rusak (SD 90)"),
Standar_Deviasi = sd_mesin,
Standar_Error = round(se_snack, 3),
Margin_of_Error = round(me_snack, 3),
Lower_CI = round(bawah_snack, 3),
Upper_CI = round(atas_snack, 3),
Lebar_Interval = round(atas_snack - bawah_snack, 3)
)
print(tabel_audit)
## Kondisi_Mesin Standar_Deviasi Standar_Error Margin_of_Error Lower_CI
## 1 Presisi (SD 10) 10 1.826 3.578 246.422
## 2 Lama (SD 50) 50 9.129 17.892 232.108
## 3 Rusak (SD 90) 90 16.432 32.205 217.795
## Upper_CI Lebar_Interval
## 1 253.578 7.157
## 2 267.892 35.784
## 3 282.205 64.411
# Grafik perbandingan ketidakpastian
barplot(tabel_audit$Lebar_Interval,
names.arg = tabel_audit$Kondisi_Mesin,
col = c("green", "orange", "red"),
main = "Ketidakpastian Berdasarkan Kondisi Mesin",
ylab = "Lebar Interval (Gram)")
Terlihat pola yang jelas mengenai ketidakpastian berdasarkan variabilitas standar deviasi:
Kita gunakan konteks yang masih menyambung dengan audit snack sebelumnya, yaitu berat isi snack (target 250 gram) dengan jumlah sampel kecil n=10 agar perbedaannya terlihat jelas.
# Parameter
rata_rata_snack <- 250
n_sampel <- 10 # Sampel kecil digunakan agar perbedaan Z dan T terlihat
sd_input <- 10
conf_level <- 0.95
# Faktor 3: Menentukan Nilai Kritis
# Distribusi Z (Normal), jika sigma diketahui
z_crit <- qnorm(0.975)
# Distribusi T, karena sigma tidak diketahui pakai derajat bebas df = n-1
df <- n_sampel - 1
t_crit <- qt(0.975, df)
# Perhitungan Statistik
se_snack <- sd_input / sqrt(n_sampel)
me_z <- z_crit * se_snack
me_t <- t_crit * se_snack
# Tabel Hasil
tabel_z_vs_t <- data.frame(
Kondisi = c("Diketahui (Z)", "Tidak Diketahui (T)"),
Nilai_Kritis = round(c(z_crit, t_crit), 3),
Margin_of_Error = round(c(me_z, me_t), 3),
Lower_CI = round(rata_rata_snack - c(me_z, me_t), 3),
Upper_CI = round(rata_rata_snack + c(me_z, me_t), 3),
Lebar_Interval = round(c(me_z * 2, me_t * 2), 3)
)
print(tabel_z_vs_t)
## Kondisi Nilai_Kritis Margin_of_Error Lower_CI Upper_CI
## 1 Diketahui (Z) 1.960 6.198 243.802 256.198
## 2 Tidak Diketahui (T) 2.262 7.154 242.846 257.154
## Lebar_Interval
## 1 12.396
## 2 14.307
# Visualisasi
barplot(tabel_z_vs_t$Lebar_Interval,
names.arg = tabel_z_vs_t$Kondisi,
col = c("cyan", "salmon"),
main = "Z vs T: Mana yang Lebih Lebar?",
ylab = "Lebar Interval (Gram)")
Terlihat pola yang jelas mengenai ketidakpastian berdasarkan diketahui atau tidaknya standar deviasi: