Sebuah tim peneliti ingin memperkirakan rata-rata waktu penggunaan media sosial mahasiswa per hari (dalam menit). Karena sulit untuk meneliti semua mahasiswa dalam satu universitas, peneliti mengambil sampel dan membuat interval kepercayaan 95% untuk memperkirakan rata-rata populasi. Peneliti kemudian melakukan simulasi untuk melihat bagaimana ukuran sampel, variabilitas data, dan pengetahuan tentang standar deviasi populasi mempengaruhi lebar interval kepercayaan.
Peneliti ingin mengetahui rata-rata waktu mahasiswa menggunakan media sosial per hari, dengan sampel yang diambil secara acak. Namun, jumlah responden yang dikumpulkan berbeda-beda.
#Survei 1 (Sampel Kecil)
n1 <- 100
mean1 <- 180
sd1 <- 5
alpha <- 0.05
t_value1 <- qt(1 - alpha/2, df = n1-1)
error_margin1 <- t_value1 * sd1 / sqrt(n1)
interval1 <- c(mean1 - error_margin1, mean1 + error_margin1)
interval1
## [1] 179.0079 180.9921
#Survei 2 (Sampel Sedang)
n2 <- 250
mean2 <- 180
sd2 <- 5
alpha <- 0.05
t_value2 <- qt(1 - alpha/2, df = n2-1)
error_margin2 <- t_value2 * sd2 / sqrt(n2)
interval2 <- c(mean2 - error_margin2, mean2 + error_margin2)
interval2
## [1] 179.3772 180.6228
#Survei 3 (Sampel Besar)
n3 <- 1000
mean3 <- 180
sd3 <- 5
alpha <- 0.05
t_value3 <- qt(1 - alpha/2, df = n3-1)
error_margin3 <- t_value3 * sd3 / sqrt(n3)
interval3 <- c(mean3 - error_margin3, mean3 + error_margin3)
interval3
## [1] 179.6897 180.3103
Berdasarkan hasil perhitungan maka dapat disimpulkan bahwa ukuran sampel yang lebih besar menghasilkan selang kepercayaan yang lebih sempit atau menunjukkan estimasi yang lebih presisi.
# Level 1 (Variabilitas Rendah)
nA <- 250
meanA <- 180
sdA <- 10
alpha <- 0.05
t_valueA <- qt(1 - alpha/2, df = nA-1)
error_marginA <- t_valueA * sdA / sqrt(nA)
intervalA <- c(meanA - error_marginA, meanA + error_marginA)
intervalA
## [1] 178.7544 181.2456
# Level 2 (Variabilitas Sedang)
nB <- 250
meanB <- 180
sdB <- 50
t_valueB <- qt(1 - alpha/2, df = nB-1)
error_marginB <- t_valueB * sdB / sqrt(nB)
intervalB <- c(meanB - error_marginB, meanB + error_marginB)
intervalB
## [1] 173.7718 186.2282
# Level 3 (Variabilitas Tinggi)
nC <- 250
meanC <- 180
sdC <- 90
t_valueC <- qt(1 - alpha/2, df = nC-1)
error_marginC <- t_valueC * sdC / sqrt(nC)
intervalC <- c(meanC - error_marginC, meanC + error_marginC)
intervalC
## [1] 168.7892 191.2108
Berdasarkan hasil perhitungan maka dapat dilihat bahwa semakin besar atau tinggi variabilitas data maka selang kepercayaan yang dihasilkan juga akan lebih lebar. Hal ini menunjukkan bahwa semakin tinggi varibialitas data maka estimasi yang dihasilkan akan kurang presisi.
# Kasus 1 (SD diketahui)
mean_waktu <- 180
sd_waktu <- 10
n <- 30
alpha <- 0.05
z_value <- qnorm(1 - alpha/2)
error_margin <- z_value * sd_waktu / sqrt(n)
interval <- c(mean_waktu - error_margin, mean_waktu + error_margin)
interval
## [1] 176.4216 183.5784
Interval kepercayaan pada kasus 1 (SD diketahui) selebar 7.1568 (176.4216, 183.5784). Dari hasil perhitungan kasus 1 pada interval 95%, artinya peneliti yakin 95% bahwa rata-rata lama waktu penggunaan media sosial di universitas tersebut berada dalam rentang ini. Selain itu, karena standar deviasi populasi diketahui, maka estimasi yang dihasilkan lebih presisi.
# Kasus 2 (SD tidak diketahui)
lama_waktu <- c(150, 210, 160, 200, 170, 190, 140, 220, 130, 230, 155, 205, 165, 195, 175, 185, 120, 240, 110, 250, 145, 215, 135, 225, 158, 202, 168, 192, 178, 182)
mean_lama_waktu <- mean(lama_waktu)
sd_lama_waktu <- sd(lama_waktu)
n <- length(lama_waktu)
alpha <- 0.05
t_value <- qt(1 - alpha/2, df = n-1)
error_margin <- t_value * sd_lama_waktu / sqrt(n)
interval <- c(mean_lama_waktu - error_margin, mean_lama_waktu + error_margin)
interval
## [1] 166.5699 193.4301
Interval kepercayaan pada kasus 2 (SD tidak diketahui) selebar 26.8602 (166.5699, 193.4301). Dari hasil perhitungan kasus 2 pada interval 95%, artinya peneliti yakin 95% bahwa rata-rata lama waktu penggunaan media sosial di universitas tersebut berada dalam rentang ini. Namun, karena standar deviasi populasi tidak diketahui, maka peneliti menggunakan distribusi t yang mana menghasilkan interval yang lebih lebar dibandingkan jika standar deviasi populasi diketahui.