Situasi: Sebuah perusahaan ingin mengestimasi rata-rata waktu yang dihabiskan oleh pelanggan di situs web mereka.Mereka melakukan dua survei dengan ukuran sampel yang berbeda.
Data: Survei 1: 30 pelanggan, rata-rata waktu = 5 menit, standar deviasi = 2 menit Survei 2: 100 pelanggan, rata-rata waktu = 5 menit, standar deviasi = 2 menit
Tugas: 1. Hitung interval kepercayaan 95% untuk kedua survei. 2. Bandingkan lebar interval kepercayaan dari kedua survei. 3. Jelaskan bagaimana ukuran sampel mempengaruhi selang kepercayaa
# Survei 1
n1 <- 30
mean1 <- 5
sd1 <- 2
alpha <- 0.05
t_value1 <- qt(1 - alpha/2, df = n1-1)
error_margin1 <- t_value1 * sd1 / sqrt(n1)
interval1 <- c(mean1 - error_margin1, mean1 + error_margin1)
interval1
## [1] 4.253188 5.746812
# Survei 2
n2 <- 100
mean2 <- 5
sd2 <- 2
t_value2 <- qt(1 - alpha/2, df = n2-1)
error_margin2 <- t_value2 * sd2 / sqrt(n2)
interval2 <- c(mean2 - error_margin2, mean2 + error_margin2)
interval2
## [1] 4.603157 5.396843
Interpretasi: Survei 1 memiliki interval kepercayaan (4.252, 5.748) menit. Survei 2 memiliki interval kepercayaan (4.602, 5.398) menit. Ukuran sampel yang lebih besar (100 vs 30) menghasilkan selang kepercayaan yang lebih sempit,menunjukkan estimasi yang lebih presisi.
#Studi Kasus 2: Pengaruh Variabilitas Data terhadapSelang Kepercayaan
Situasi: Sebuah sekolah ingin mengestimasi rata-rata nilai ujian matematika siswa. Mereka memiliki dua kelas denganvariabilitas nilai yang berbeda.
Data: Kelas A: 40 siswa, rata-rata nilai = 75, standar deviasi = 10 Kelas B: 40 siswa, rata-rata nilai = 75, standar deviasi = 20
Tugas: 1. Hitung interval kepercayaan 95% untuk kedua kelas. 2. Bandingkan lebar interval kepercayaan dari kedua kelas. 3. Jelaskan bagaimana variabilitas data mempengaruhi selang kepercayaan
# Kelas A
nA <- 40
meanA <- 75
sdA <- 10
alpha <- 0.05
t_valueA <- qt(1 - alpha/2, df = nA-1)
error_marginA <- t_valueA * sdA / sqrt(nA)
intervalA <- c(meanA - error_marginA, meanA + error_marginA)
intervalA
## [1] 71.80184 78.19816
# Kelas B
nB <- 40
meanB <- 75
sdB <- 20
t_valueB <- qt(1 - alpha/2, df = nB-1)
error_marginB <- t_valueB * sdB / sqrt(nB)
intervalB <- c(meanB - error_marginB, meanB + error_marginB)
intervalB
## [1] 68.60369 81.39631
Interpretasi: Kelas A memiliki interval kepercayaan (71.784, 78.216). Kelas B memiliki interval kepercayaan (68.568, 81.432). Variabilitas data yang lebih tinggi (standar deviasi 20 vs 10) menghasilkan selang kepercayaan yanglebih lebar, menunjukkan estimasi yang kurang presisi.
#Studi Kasus 3: Pengaruh Tingkat Kepercayaanterhadap Selang Kepercayaan
Situasi: Sebuah perusahaan ingin mengestimasi rata-rata jumlah produk yang terjual per hari. Mereka menggunakandua tingkat kepercayaan yang berbeda.
Data: Sampel: 50 hari, rata-rata penjualan = 100 produk, standar deviasi = 15 produk Tingkat kepercayaan: 90% dan 99%
Tugas: 1. Hitung interval kepercayaan untuk kedua tingkat kepercayaan. 2. Bandingkan lebar interval kepercayaan dari kedua tingkat kepercayaan. 3. Jelaskan bagaimana tingkat kepercayaan mempengaruhi selang kepercayaan
# Tingkat Kepercayaan 90%
alpha90 <- 0.10
t_value90 <- qt(1 - alpha90/2, df = 49)
error_margin90 <- t_value90 * 15 / sqrt(50)
interval90 <- c(100 - error_margin90, 100 + error_margin90)
interval90
## [1] 96.4435 103.5565
# Tingkat Kepercayaan 99%
alpha99 <- 0.01
t_value99 <- qt(1 - alpha99/2, df = 49)
error_margin99 <- t_value99 * 15 / sqrt(50)
interval99 <- c(100 - error_margin99, 100 + error_margin99)
interval99
## [1] 94.31496 105.68504
Interpretasi: Interval kepercayaan 90% adalah (96.464, 103.536). Interval kepercayaan 99% adalah (94.394, 105.606). Tingkat kepercayaan yang lebih tinggi (99% vs 90%) menghasilkan selang kepercayaan yang lebihlebar, menunjukkan rentang yang lebih luas untuk mencakup parameter populasi dengan keyakinanyang lebih tinggi.
#Studi Kasus 4: Estimasi Rata-Rata Tinggi BadanMahasiswa (Standar Deviasi Diketahui)
Situasi: Sebuah universitas ingin mengestimasi rata-rata tinggi badan mahasiswa di fakultas teknik. Berdasarkan datahistoris, standar deviasi tinggi badan populasi mahasiswa teknik adalah 5 cm. Sebuah sampel acak dari 36mahasiswa diambil, dan rata-rata tinggi badan sampel adalah 170 cm.
Tugas: 1. Hitung interval kepercayaan 95% untuk rata-rata tinggi badan mahasiswa. 2. Interpretasikan hasilnya.
Penyelesaian: Karena standar deviasi populasi diketahui, kita menggunakan distribusi z.
mean_tinggi <- 170 # dalam cm
sd_tinggi <- 5 # dalam cm (diketahui)
n <- 36
alpha <- 0.05
# Menghitung nilai z untuk tingkat kepercayaan 95%
z_value <- qnorm(1 - alpha/2)
# Menghitung margin of error
error_margin <- z_value * sd_tinggi / sqrt(n)
# Menghitung interval kepercayaan
interval <- c(mean_tinggi - error_margin, mean_tinggi + error_margin)
interval
## [1] 168.3667 171.6333
## [1] 168.3667 171.6333
## [1] 168.3667 171.6333
Interpretasi: Interval kepercayaan 95% untuk rata-rata tinggi badan mahasiswa teknik adalah (168.37 cm, 171.63 cm).Artinya, kita dapat yakin 95% bahwa rata-rata tinggi badan seluruh mahasiswa teknik di universitas tersebutberada dalam rentang ini. Karena standar deviasi populasi diketahui, estimasi ini lebih presisi.
Situasi: Universitas yang sama ingin mengestimasi rata-rata tinggi badan mahasiswa di fakultas seni. Namun, standardeviasi populasi tidak diketahui. Sebuah sampel acak dari 25 mahasiswa diambil, dan hasilnya adalah sebagai berikut (dalam cm):
tinggi_badan <- c(165, 168, 170, 172, 169, 167, 171, 166, 173, 174, 170, 168, 169, 167, 172, 171, 170, 169, 168, 173, 172, 170, 169, 167, 171)
Tugas: 1. Hitung interval kepercayaan 95% untuk rata-rata tinggi badan mahasiswa. 2. Interpretasikan hasilnya.
Penyelesaian: Karena standar deviasi populasi tidak diketahui, kita menggunakan distribusi t.
mean_tinggi <- mean(tinggi_badan)
sd_tinggi <- sd(tinggi_badan)
n <- length(tinggi_badan)
alpha <- 0.05
# Menghitung nilai t untuk tingkat kepercayaan 95% dan df = n-1
t_value <- qt(1 - alpha/2, df = n-1)
# Menghitung margin of error
error_margin <- t_value * sd_tinggi / sqrt(n)
# Menghitung interval kepercayaan
interval <- c(mean_tinggi - error_margin, mean_tinggi + error_margin)
Interpretasi: Interval kepercayaan 95% untuk rata-rata tinggi badan mahasiswa seni adalah (168.67 cm, 170.73 cm).Artinya, kita dapat yakin 95% bahwa rata-rata tinggi badan seluruh mahasiswa seni di universitas tersebutberada dalam rentang ini. Karena standar deviasi populasi tidak diketahui, kita menggunakan distribusi t, yangmenghasilkan interval yang sedikit lebih lebar dibandingkan jika standar deviasi populasi diketahui.
Presisi Estimasi: Ketika standar deviasi populasi diketahui (Kasus 4), interval kepercayaan lebih sempit (168.37 cm,171.63 cm) karena kita memiliki informasi tambahan tentang variabilitas populasi. Ketika standar deviasi populasi tidak diketahui (Kasus 5), interval kepercayaan sedikit lebih lebar (168.67 cm, 170.73 cm) karena kita harus mengestimasi variabilitas dari sampel, yang menambahketidakpastian.
Distribusi yang Digunakan: Standar deviasi diketahui: Distribusi z (normal). Standar deviasi tidak diketahui: Distribusi t (Student’s t).
Ukuran Sampel: Pada Kasus 4, ukuran sampel lebih besar (36 vs 25), yang juga berkontribusi pada interval yang lebihsempit. Pada Kasus 5, ukuran sampel lebih kecil, sehingga interval kepercayaan lebih lebar. # Faktor yang Mempengaruhi Selang KepercayaanBeberapa faktor yang dapat mempengaruhi lebar selang kepercayaan antara lain:
Ukuran Sampel: Semakin besar ukuran sampel, semakin sempit selang kepercayaan, karena semakinbanyak informasi yang tersedia untuk mengestimasi parameter populasi.
Variabilitas Data: Semakin besar variabilitas data (standar deviasi), semakin lebar selang kepercayaan. Halini karena data yang lebih variabel memerlukan rentang yang lebih luas untuk mencakup parameter populasi.3. Tingkat Kepercayaan: Tingkat kepercayaan yang lebih tinggi menghasilkan selang kepercayaan yang lebihlebar, karena kita memerlukan rentang yang lebih luas untuk meningkatkan keyakinan bahwa parameterpopulasi tercakup.
Tingkat Kepercayaan: Tingkat kepercayaan yang lebih tinggi menghasilkan selang kepercayaan yang lebihlebar, karena kita memerlukan rentang yang lebih luas untuk meningkatkan keyakinan bahwa parameterpopulasi tercakup.
Kesimpulan Estimasi dalam dan selang kepercayaan adalah konsep penting dalam statistika yang memungkinkan kitauntuk membuat inferensi tentang parameter populasi berdasarkan data sampel. Dengan memahami danmenghitung selang kepercayaan, kita dapat membuat estimasi yang lebih akurat dan dapat diandalkan untukpengambilan keputusan.
Lakukan simulasi untuk mempelajari pengaruh ukuran sampel, variabilitas data (standar deviasi), danpengetahuan tentang standar deviasi populasi (diketahui/tidak diketahui) terhadap lebar interval kepercayaan95%, dengan informasi setiap faktor dan level sebagai berikut: - Faktor 1: Ukuran Sampel (n), Level: 5, 30, 100 - Faktor 2: Variabilitas Data (Standar Deviasi, σ atau s), Level: 10, 50, 90 - Faktor 3: Pengetahuan Standar Deviasi Populasi, Level: Diketahui (σ), Tidak Diketahui (s) Interpretasikan hasilnya..
# Set seed untuk replikasi hasil
set.seed(123)
# Faktor dan level
n_values <- c(5, 30, 100) # Ukuran sampel
sd_values <- c(10, 50, 90) # Standar deviasi
pop_sd_known <- c(TRUE, FALSE) # Diketahui atau tidak
## Fungsi untuk menghitung lebar interval kepercayaan 95%
compute_CI_width <- function(n, sd, known) {
alpha <- 0.05 # Signifikansi 5%
if (known) {
z_value <- qnorm(1 - alpha/2) # Z-score untuk 95%
error_margin <- z_value * (sd / sqrt(n))
} else {
t_value <- qt(1 - alpha/2, df = n-1) # t-score untuk 95%
error_margin <- t_value * (sd / sqrt(n))
}
width <- 2 * error_margin # Lebar interval kepercayaan
return(width)
}
# Simulasi
results <- expand.grid(n = n_values, sd = sd_values, known = pop_sd_known)
results$CI_width <- mapply(compute_CI_width, results$n, results$sd, results$known)
# Tampilkan hasil
print(results)
## n sd known CI_width
## 1 5 10 TRUE 17.530451
## 2 30 10 TRUE 7.156777
## 3 100 10 TRUE 3.919928
## 4 5 50 TRUE 87.652254
## 5 30 50 TRUE 35.783883
## 6 100 50 TRUE 19.599640
## 7 5 90 TRUE 157.774057
## 8 30 90 TRUE 64.410989
## 9 100 90 TRUE 35.279352
## 10 5 10 FALSE 24.833280
## 11 30 10 FALSE 7.468123
## 12 100 10 FALSE 3.968434
## 13 5 50 FALSE 124.166400
## 14 30 50 FALSE 37.340614
## 15 100 50 FALSE 19.842170
## 16 5 90 FALSE 223.499520
## 17 30 90 FALSE 67.213105
## 18 100 90 FALSE 35.715905
# Visualisasi
library(ggplot2)
ggplot(results, aes(x = factor(n), y = CI_width, fill = factor(known))) +
geom_bar(stat = "identity", position = "dodge") +
facet_wrap(~ sd, scales = "free") +
labs(title = "Pengaruh Ukuran Sampel, Variabilitas, dan Pengetahuan SD terhadap Lebar CI",
x = "Ukuran Sampel (n)", y = "Lebar Interval Kepercayaan 95%",
fill = "SD Populasi Diketahui") +
theme_minimal()
DInterpretasi Hasil 1. Pengaruh Ukuran Sampel (n) terhadap Lebar Interval Kepercayaan • Semakin besar ukuran sampel (n), semakin sempit interval kepercayaan. • Hal ini terjadi karena standar error dihitung sebagai: sehingga saat n meningkat, SE menurun, menyebabkan interval kepercayaan lebih sempit. • Contoh hasil simulasi: • n = 5 → Interval lebih lebar • n = 30 → Interval lebih sempit • n = 100 → Interval paling sempit
Kesimpulan: Sampel yang lebih besar memberikan estimasi yang lebih presisi terhadap rata-rata populasi. [15.56, 14/3/2025] Hilmi Hafiyyan: 2. Pengaruh Variabilitas Data (Standar Deviasi, σ atau s) terhadap Lebar Interval Kepercayaan • Semakin besar standar deviasi, semakin lebar interval kepercayaan. • Standar deviasi yang lebih tinggi menunjukkan data lebih menyebar, sehingga estimasi rata-rata lebih tidak pasti. • Contoh hasil simulasi: • σ = 10 → Interval lebih sempit • σ = 50 → Interval lebih lebar • σ = 90 → Interval paling lebar
Kesimpulan: Variabilitas data yang tinggi meningkatkan ketidakpastian dalam estimasi, menyebabkan interval kepercayaan lebih lebar. 3. Pengaruh Pengetahuan Standar Deviasi Populasi terhadap Lebar Interval Kepercayaan • Jika standar deviasi populasi diketahui (σ), maka interval kepercayaan lebih sempit karena menggunakan distribusi Z (Normal). • Jika standar deviasi tidak diketahui (s), maka interval lebih lebar, terutama untuk sampel kecil, karena menggunakan distribusi t-Student, yang memiliki ekor lebih tebal. • Contoh hasil simulasi: • Untuk n = 5, interval kepercayaan dengan t-Student jauh lebih lebar dibandingkan dengan Z. • Untuk n = 100, perbedaan antara Z dan t lebih kecil karena distribusi t mendekati distribusi normal saat n besar.
Kesimpulan: Mengetahui standar deviasi populasi (σ) membantu menghasilkan estimasi yang lebih akurat dengan interval yang lebih sempit.