Studi Kasus

Sebuah tim peneliti ingin memperkirakan rata-rata waktu penggunaan media sosial mahasiswa per hari (dalam menit). Karena sulit untuk meneliti semua mahasiswa dalam satu universitas, peneliti mengambil sampel dan membuat interval kepercayaan 95% untuk memperkirakan rata-rata populasi. Peneliti kemudian melakukan simulasi untuk melihat bagaimana ukuran sampel, variabilitas data, dan pengetahuan tentang standar deviasi populasi mempengaruhi lebar interval kepercayaan.

Faktor 1: Ukuran Sampel (n)

Peneliti ingin mengetahui rata-rata waktu mahasiswa menggunakan media sosial per hari, dengan sampel yang diambil secara acak. Namun, jumlah responden yang dikumpulkan berbeda-beda.

Data:

  • Survei 1: 100 mahasiswa, rata-rata waktu = 180 menit, standar deviasi = 5 menit
  • Survei 2: 500 mahasiswa, rata-rata waktu = 180 menit, standar deviasi = 5 menit
  • Survei 3: 1000 mahasiswa, rata-rata waktu = 180 menit, standar deviasi = 5 menit
#Survei 1 (Sampel Kecil)
n1 <- 100
mean1 <- 180
sd1 <- 5
alpha <- 0.05
t_value1 <- qt(1 - alpha/2, df = n1-1)
error_margin1 <- t_value1 * sd1 / sqrt(n1)
interval1 <- c(mean1 - error_margin1, mean1 + error_margin1)
interval1
## [1] 179.0079 180.9921
#Survei 2 (Sampel Sedang)
n2 <- 250
mean2 <- 180
sd2 <- 5
alpha <- 0.05
t_value2 <- qt(1 - alpha/2, df = n2-1)
error_margin2 <- t_value2 * sd2 / sqrt(n2)
interval2 <- c(mean2 - error_margin2, mean2 + error_margin2)
interval2
## [1] 179.3772 180.6228
#Survei 3 (Sampel Besar)
n3 <- 1000
mean3 <- 180
sd3 <- 5
alpha <- 0.05
t_value3 <- qt(1 - alpha/2, df = n3-1)
error_margin3 <- t_value3 * sd3 / sqrt(n3)
interval3 <- c(mean3 - error_margin3, mean3 + error_margin3)
interval3
## [1] 179.6897 180.3103

Interpretasi

  • Survei 1 (\(n=100\)) memiliki interval kepercayaan selebar 1.9842 menit (179.0079, 180.9921)
  • Survei 2 (\(n=250\)) memiliki interval kepercayaan selebar 1.2456 menit (179.3772, 180.6228)
  • Survei 3 (\(n=1000\)) memiliki interval kepercayaan selebar 0.6206 menit (179.6897, 180.3103)

Berdasarkan hasil perhitungan maka dapat disimpulkan bahwa ukuran sampel yang lebih besar menghasilkan selang kepercayaan yang lebih sempit atau menunjukkan estimasi yang lebih presisi.

Faktor 2: Variabilitas Data (Standar Deviasi, σ atau s)

Data:

  • Level 1: 250 mahasiswa, rata-rata waktu = 180 menit, standar deviasi = 10
  • Level 2: 250 mahasiswa, rata-rata waktu = 180 menit, standar deviasi = 50
  • Level 3: 250 mahasiswa, rata-rata waktu = 180 menit, standar deviasi = 90
# Level 1 (Variabilitas Rendah)
nA <- 250
meanA <- 180
sdA <- 10
alpha <- 0.05
t_valueA <- qt(1 - alpha/2, df = nA-1)
error_marginA <- t_valueA * sdA / sqrt(nA)
intervalA <- c(meanA - error_marginA, meanA + error_marginA)
intervalA
## [1] 178.7544 181.2456
# Level 2 (Variabilitas Sedang)
nB <- 250
meanB <- 180
sdB <- 50
t_valueB <- qt(1 - alpha/2, df = nB-1)
error_marginB <- t_valueB * sdB / sqrt(nB)
intervalB <- c(meanB - error_marginB, meanB + error_marginB)
intervalB
## [1] 173.7718 186.2282
# Level 3 (Variabilitas Tinggi)
nC <- 250
meanC <- 180
sdC <- 90
t_valueC <- qt(1 - alpha/2, df = nC-1)
error_marginC <- t_valueC * sdC / sqrt(nC)
intervalC <- c(meanC - error_marginC, meanC + error_marginC)
intervalC
## [1] 168.7892 191.2108

Interpretasi

  • Level 1 (\(s=10\)) memiliki interval kepercayaan selebar 2.4912 menit (178.7544, 181.2456)
  • Level 2 (\(s=50\)) memiliki interval kepercayaan selebar 12.4564 menit (173.7718, 186.2282)
  • Level 3 (\(s=90\)) memiliki interval kepercayaan selebar 22.4216 menit (168.7892, 191.2108)

Berdasarkan hasil perhitungan maka dapat dilihat bahwa semakin besar atau tinggi variabilitas data maka selang kepercayaan yang dihasilkan juga akan lebih lebar. Hal ini menunjukkan bahwa semakin tinggi varibialitas data maka estimasi yang dihasilkan akan kurang presisi.

Faktor 3: Pengetahuan Standar Deviasi Populasi

Data:

  • Kasus 1: 30 mahasiswa, rata-rata waktu = 180 menit, standar deviasi = 20 menit
  • Kasus 2: 30 mahasiswa, rata-rata waktu = 180 menit
# Kasus 1 (SD diketahui)
mean_waktu <- 180
sd_waktu <- 10
n <- 30
alpha <- 0.05

z_value <- qnorm(1 - alpha/2)

error_margin <- z_value * sd_waktu / sqrt(n)

interval <- c(mean_waktu - error_margin, mean_waktu + error_margin)
interval
## [1] 176.4216 183.5784

Interpretasi

Interval kepercayaan pada kasus 1 (SD diketahui) selebar 7.1568 (176.4216, 183.5784). Dari hasil perhitungan kasus 1 pada interval 95%, artinya peneliti yakin 95% bahwa rata-rata lama waktu penggunaan media sosial di universitas tersebut berada dalam rentang ini. Selain itu, karena standar deviasi populasi diketahui, maka estimasi yang dihasilkan lebih presisi.

# Kasus 2 (SD tidak diketahui)
lama_waktu <- c(150, 210, 160, 200, 170, 190, 140, 220, 130, 230, 155, 205, 165, 195, 175, 185, 120, 240, 110, 250, 145, 215, 135, 225, 158, 202, 168, 192, 178, 182)

mean_lama_waktu <- mean(lama_waktu)
sd_lama_waktu <- sd(lama_waktu)
n <- length(lama_waktu)
alpha <- 0.05

t_value <- qt(1 - alpha/2, df = n-1)

error_margin <- t_value * sd_lama_waktu / sqrt(n)

interval <- c(mean_lama_waktu - error_margin, mean_lama_waktu + error_margin)
interval
## [1] 166.5699 193.4301

Interpretasi

Interval kepercayaan pada kasus 2 (SD tidak diketahui) selebar 26.8602 (166.5699, 193.4301). Dari hasil perhitungan kasus 2 pada interval 95%, artinya peneliti yakin 95% bahwa rata-rata lama waktu penggunaan media sosial di universitas tersebut berada dalam rentang ini. Namun, karena standar deviasi populasi tidak diketahui, maka peneliti menggunakan distribusi t yang mana menghasilkan interval yang lebih lebar dibandingkan jika standar deviasi populasi diketahui.

Perbandingan Kasus 1 (SD diketahui) dan 2 (SD tidak diketahui)

  1. Presisi Estimasi Dari hasil perhitungan pada kasus 1 dan kasus 2 dapat dilihat bahwa kasus 1 memiliki interval kepercayaan yang lebih sempit (7.1568) dibandingkan dengan kasus 2 (26.8602). Hal ini menunjukkan bahwa ketika standar deviasi populasi diketahui maka estimasi yang dihasilkan akan lebih presisi, hal ini dikarenakan peneliti memiliki informasi tambahan tentang variabilitas populasi. Sedangkan ketika standar deviasi populasi tidak diketahui maka peneliti harus mengestimasi variabilitas dari sampel, yang mana menambah ketidakpastian.
  2. Distribusi yang Digunakan Pada kasus 1 (SD diketahui) digunakan distribusi z (normal), sedangkan pada kasus 2 (SD tidak diketahui) digunakna distribusi t (Student’s t).