Sebuah perusahaan ingin mengestimasi rata-rata waktu yang dihabiskan oleh pelanggan di situs web mereka. Mereka melakukan dua survei dengan ukuran sampel yang berbeda
Survei 1: 30 pelanggan, rata-rata waktu = 5 menit, standar deviasi = 2 menit Survei 2: 100 pelanggan, rata-rata waktu = 5 menit, standar deviasi = 2 menit ### Tugas 1. Hitung interval kepercayaan 95% untuk kedua survei. 2. Bandingkan lebar interval kepercayaan dari kedua survei. 3. Jelaskan bagaimana ukuran sampel mempengaruhi selang kepercayaan.
# Survei 1
n1 <- 30
mean1 <- 5
sd1 <- 2
alpha <- 0.05
t_value1 <- qt(1 - alpha/2, df = n1-1)
error_margin1 <- t_value1 * sd1 / sqrt(n1)
interval1 <- c(mean1 - error_margin1, mean1 + error_margin1)
interval1
## [1] 4.253188 5.746812
# Survei 2
n2 <- 100
mean2 <- 5
sd2 <- 2
t_value2 <- qt(1 - alpha/2, df = n2-1)
error_margin2 <- t_value2 * sd2 / sqrt(n2)
interval2 <- c(mean2 - error_margin2, mean2 + error_margin2)
interval2
## [1] 4.603157 5.396843
Interpretasi : - Survei 1 memiliki interval kepercayaan (4.252, 5.748) menit. - Survei 2 memiliki interval kepercayaan (4.602, 5.398) menit. - Ukuran sampel yang lebih besar (100 vs 30) menghasilkan selang kepercayaan yang lebih sempit,menunjukkan estimasi yang lebih presisi. ## Studi Kasus 2: Pengaruh Variabilitas Data terhadapSelang Kepercayaan ### Situasi: Sebuah sekolah ingin mengestimasi rata-rata nilai ujian matematika siswa. Mereka memiliki dua kelas denganvariabilitas nilai yang berbeda.
# Kelas A
nA <- 40
meanA <- 75
sdA <- 10
alpha <- 0.05
t_valueA <- qt(1 - alpha/2, df = nA-1)
error_marginA <- t_valueA * sdA / sqrt(nA)
intervalA <- c(meanA - error_marginA, meanA + error_marginA)
intervalA
## [1] 71.80184 78.19816
# Kelas B
nB <- 40
meanB <- 75
sdB <- 20
t_valueB <- qt(1 - alpha/2, df = nB-1)
error_marginB <- t_valueB * sdB / sqrt(nB)
intervalB <- c(meanB - error_marginB, meanB + error_marginB)
intervalB
## [1] 68.60369 81.39631
Interpretasi: - Kelas A memiliki interval kepercayaan (71.784, 78.216). - Kelas B memiliki interval kepercayaan (68.568, 81.432). - Variabilitas data yang lebih tinggi (standar deviasi 20 vs 10) menghasilkan selang kepercayaan yanglebih lebar, menunjukkan estimasi yang kurang presisi. ## Studi Kasus 3: Pengaruh Tingkat Kepercayaanterhadap Selang Kepercayaan ### Situasi: Sebuah perusahaan ingin mengestimasi rata-rata jumlah produk yang terjual per hari. Mereka menggunakandua tingkat kepercayaan yang berbeda.
# Tingkat Kepercayaan 90%
alpha90 <- 0.10
t_value90 <- qt(1 - alpha90/2, df = 49)
error_margin90 <- t_value90 * 15 / sqrt(50)
interval90 <- c(100 - error_margin90, 100 + error_margin90)
interval90
## [1] 96.4435 103.5565
# Tingkat Kepercayaan 99%
alpha99 <- 0.01
t_value99 <- qt(1 - alpha99/2, df = 49)
error_margin99 <- t_value99 * 15 / sqrt(50)
interval99 <- c(100 - error_margin99, 100 + error_margin99)
interval99
## [1] 94.31496 105.68504
Interpretasi: - Interval kepercayaan 90% adalah (96.464, 103.536). - Interval kepercayaan 99% adalah (94.394, 105.606). - Tingkat kepercayaan yang lebih tinggi (99% vs 90%) menghasilkan selang kepercayaan yang lebihlebar, menunjukkan rentang yang lebih luas untuk mencakup parameter populasi dengan keyakinanyang lebih tinggi. ## Studi Kasus 4: Estimasi Rata-Rata Tinggi BadanMahasiswa (Standar Deviasi Diketahui) ### Situasi Sebuah universitas ingin mengestimasi rata-rata tinggi badan mahasiswa di fakultas teknik. Berdasarkan datahistoris, standar deviasi tinggi badan populasi mahasiswa teknik adalah 5 cm. Sebuah sampel acak dari 36mahasiswa diambil, dan rata-rata tinggi badan sampel adalah 170 cm.
mean_tinggi <- 170 # dalam cm
sd_tinggi <- 5 # dalam cm (diketahui)
n <- 36
alpha <- 0.05
# Menghitung nilai z untuk tingkat kepercayaan 95%
z_value <- qnorm(1 - alpha/2)
# Menghitung margin of error
error_margin <- z_value * sd_tinggi / sqrt(n)
# Menghitung interval kepercayaan
interval <- c(mean_tinggi - error_margin, mean_tinggi + error_margin)
interval
## [1] 168.3667 171.6333
Interval kepercayaan 95% untuk rata-rata tinggi badan mahasiswa teknik adalah (168.37 cm, 171.63 cm).Artinya, kita dapat yakin 95% bahwa rata-rata tinggi badan seluruh mahasiswa teknik di universitas tersebutberada dalam rentang ini. Karena standar deviasi populasi diketahui, estimasi ini lebih presisi.
Universitas yang sama ingin mengestimasi rata-rata tinggi badan mahasiswa di fakultas seni. Namun, standardeviasi populasi tidak diketahui. Sebuah sampel acak dari 25 mahasiswa diambil, dan hasilnya adalah sebagai.
berikut (dalam cm):
tinggi_badan <- c(165, 168, 170, 172, 169, 167, 171, 166, 173, 174, 170, 168, 169, 167, 172, 171, 170, 169, 168, 173, 172, 170, 169, 167, 171)
tinggi_badan
## [1] 165 168 170 172 169 167 171 166 173 174 170 168 169 167 172 171 170 169 168
## [20] 173 172 170 169 167 171
Hitung interval kepercayaan 95% untuk rata-rata tinggi badan mahasiswa. Interpretasikan hasilnya. ### Penyelesaian: Karena standar deviasi populasi tidak diketahui, kita menggunakan distribusi t.
mean_tinggi <- mean(tinggi_badan)
sd_tinggi <- sd(tinggi_badan)
n <- length(tinggi_badan)
alpha <- 0.05
# Menghitung nilai t untuk tingkat kepercayaan 95% dan df = n-1
t_value <- qt(1 - alpha/2, df = n-1)
# Menghitung margin of error
error_margin <- t_value * sd_tinggi / sqrt(n)
# Menghitung interval kepercayaan
interval <- c(mean_tinggi - error_margin, mean_tinggi + error_margin)
interval
## [1] 168.6802 170.5998
Interval kepercayaan 95% untuk rata-rata tinggi badan mahasiswa seni adalah (168.67 cm, 170.73 cm).Artinya, kita dapat yakin 95% bahwa rata-rata tinggi badan seluruh mahasiswa seni di universitas tersebutberada dalam rentang ini. Karena standar deviasi populasi tidak diketahui, kita menggunakan distribusi t, yangmenghasilkan interval yang sedikit lebih lebar dibandingkan jika standar deviasi populasi diketahui.
Estimasi dalam dan selang kepercayaan adalah konsep penting dalam statistika yang memungkinkan kitauntuk membuat inferensi tentang parameter populasi berdasarkan data sampel. Dengan memahami danmenghitung selang kepercayaan, kita dapat membuat estimasi yang lebih akurat dan dapat diandalkan untukpengambilan keputusan. ## Tugas Lakukan simulasi untuk mempelajari pengaruh ukuran sampel, variabilitas data (standar deviasi), danpengetahuan tentang standar deviasi populasi (diketahui/tidak diketahui) terhadap lebar interval kepercayaan95%, dengan informasi setiap faktor dan level sebagai berikut:
set.seed(42) # Reproducibility
# Faktor dan level
n_vals <- c(5, 30, 100)
sd_vals <- c(10, 50, 90)
pop_sd_known <- c(TRUE, FALSE)
# Z-score untuk 95% CI
z_val <- qnorm(0.975)
# Buat dataframe untuk menyimpan hasil
hasil_simulasi <- data.frame()
# Simulasi untuk semua kombinasi
for (n in n_vals) {
for (sd in sd_vals) {
for (known in pop_sd_known) {
# Simulasi data normal
data <- rnorm(n, mean = 100, sd = sd)
x_bar <- mean(data)
if (known) {
# Jika σ diketahui → gunakan Z
se <- sd / sqrt(n)
margin_error <- z_val * se
lebar_ci <- 2 * margin_error
metode <- "Z (σ diketahui)"
} else {
# Jika σ tidak diketahui → gunakan t
s <- sd(data)
t_val <- qt(0.975, df = n - 1)
se <- s / sqrt(n)
margin_error <- t_val * se
lebar_ci <- 2 * margin_error
metode <- "t (σ tidak diketahui)"
}
hasil_simulasi <- rbind(hasil_simulasi, data.frame(
n = n,
sd = sd,
metode = metode,
lebar_CI = lebar_ci
))
}
}
}
# Tampilkan hasil
print(hasil_simulasi)
## n sd metode lebar_CI
## 1 5 10 Z (σ diketahui) 17.530451
## 2 5 10 t (σ tidak diketahui) 25.594404
## 3 5 50 Z (σ diketahui) 87.652254
## 4 5 50 t (σ tidak diketahui) 222.932190
## 5 5 90 Z (σ diketahui) 157.774057
## 6 5 90 t (σ tidak diketahui) 180.097401
## 7 30 10 Z (σ diketahui) 7.156777
## 8 30 10 t (σ tidak diketahui) 5.849313
## 9 30 50 Z (σ diketahui) 35.783883
## 10 30 50 t (σ tidak diketahui) 31.576894
## 11 30 90 Z (σ diketahui) 64.410989
## 12 30 90 t (σ tidak diketahui) 66.886810
## 13 100 10 Z (σ diketahui) 3.919928
## 14 100 10 t (σ tidak diketahui) 3.618628
## 15 100 50 Z (σ diketahui) 19.599640
## 16 100 50 t (σ tidak diketahui) 21.605575
## 17 100 90 Z (σ diketahui) 35.279352
## 18 100 90 t (σ tidak diketahui) 31.821928
library(ggplot2)
ggplot(hasil_simulasi, aes(x = factor(n), y = lebar_CI, fill = metode)) +
geom_bar(stat = "identity", position = "dodge") +
facet_wrap(~ sd, labeller = label_both) +
labs(title = "Lebar Interval Kepercayaan 95%",
x = "Ukuran Sampel (n)",
y = "Lebar CI",
fill = "Metode") +
theme_minimal()
### Interpretasi asil simulasi menunjukkan bahwa lebar interval
kepercayaan 95% sangat dipengaruhi oleh ukuran sampel, besar
variabilitas data, dan pengetahuan tentang standar deviasi populasi.
Semakin besar ukuran sampel, lebar interval kepercayaan cenderung
mengecil karena ketidakpastian terhadap estimasi rata-rata menurun.
Sebaliknya, semakin besar standar deviasi (variabilitas data), interval
menjadi lebih lebar karena meningkatnya ketidakpastian. Selain itu, jika
standar deviasi populasi diketahui dan digunakan dalam perhitungan
(menggunakan distribusi Z), interval kepercayaan menjadi lebih sempit
dibandingkan saat standar deviasi tidak diketahui dan harus diperkirakan
dari sampel (menggunakan distribusi t), terutama pada ukuran sampel
kecil. Dengan demikian, interval kepercayaan yang paling sempit akan
diperoleh ketika ukuran sampel besar, variabilitas data rendah, dan
standar deviasi populasi diketahui.