KUIS STATISKA

Confidence Interval ~ Week 13 ~

Naychila Adelia Zahrah

Data Science Undergraduate Student

R Programming Data Science Statistics

1 Study Kasus 1

1.1 Identifikasi uji statistik dan berikan alasannya

Uji statistik yang tepat adalah Interval Kepercayaan untuk Rata-rata dengan standar deviasi populasi diketahui (Z-Interval).

Alasan :

  • Nilai standar deviasi populasi (𝜎) diketahui

  • Ukuran sampel besar ( 𝑛 = 100 ≥ 30 )

  • Tujuan analisis adalah mengestimasi rata-rata populasi, bukan membandingkan atau menguji hipotesis

Maka digunakan distribusi Z, bukan distribusi t.

1.2 Menghitung Interval Kepercayaan

Diketahui:\[\sigma = 3.2 \quad n = 100 \quad \bar{x} = 12.6\]Rumus:\[E = Z_{\alpha/2} \frac{\sigma}{\sqrt{n}}\]

a) Interval Kepercayaan 90%

\(Z_{0.05} = 1.645\)

Hitung Margin of Error

\[E = 1.645 \times \frac{3.2}{\sqrt{100}}\]\[E = 1.645 \times 0.32= 0.53\] Hitung Batas Interval

  • Lower Limit: \(\bar{x} - E = 12.6 - 0.53 = 12.07\)

  • Upper Limit: \(\bar{x} + E = 12.6 + 0.53 = 13.13\)

CI 90% = (12.07, 13.13)

b) Interval Kepercayaan 95%

\(Z_{0.025} = 1.96\)

Hitung Margin of Error

\[E = 1.96 \times \frac{3.2}{\sqrt{100}}\]\[E = 1.96 \times 0.32 = 0.63\] Hitung Batas Interval

  • Lower Limit: \(12.6 - 0.63 = 11.97\)

  • Upper Limit: \(12.6 + 0.63 = 13.23\)

CI 95% = (11.97, 13.23)

c) Interval Kepercayaan 99%

\(Z_{0.005} = 2.576\)

Hitung Margin of Error

\[E = 2.576 \times \frac{3.2}{\sqrt{100}}\]\[E = 2.576 \times 0.32 = 0.82\] Hitung Batas Interval

  • Lower Limit: \(12.6 - 0.82 = 11.78\)

  • Upper Limit: \(12.6 + 0.82 = 13.42\)

CI 99% = (11.78, 13.42)

1.3 Visualisasi perbandingan

library(readr)
library(ggplot2)
library(knitr)
library(DT)
library(statip)

confidence <- c("90%", "95%", "99%")
lower <- c(12.07, 11.97, 11.78)
upper <- c(13.13, 13.23, 13.42)
mean <- c(12.6, 12.6, 12.6)

plot(mean, 1:3,
     xlim = c(11.5, 13.5),
     yaxt = "n",
     ylab = "Confidence Level",
     xlab = "Rata-rata Transaksi Harian",
     main = "Perbandingan Interval Kepercayaan",
     cex.main = 1.6,
     cex.lab = 1.4,
     cex.axis = 1.3)

axis(2, at = 1:3, labels = confidence)

segments(lower, 1:3, upper, 1:3, lwd = 4)
points(mean, 1:3, pch = 19, cex = 1.8)

Interpretasi: Grafik ini menunjukkan bahwa semakin tinggi tingkat kepercayaan, maka rentang intervalnya akan semakin lebar. Interval 99% memiliki rentang paling luas karena memberikan kepastian paling tinggi, sedangkan interval 90% paling sempit karena lebih presisi namun dengan tingkat kepastian yang lebih rendah. Meskipun lebar intervalnya berbeda, ketiganya memiliki titik pusat yang sama di angka 12.6, yang menunjukkan bahwa rata-rata sampel yang digunakan tetap konsisten.

1.4 Interpretasi dalam konteks analisis bisnis

Secara bisnis, rata-rata transaksi harian pengguna setelah peluncuran fitur baru diperkirakan berada di angka 12,6 unit. Penggunaan berbagai tingkat kepercayaan menunjukkan bahwa perusahaan memiliki keyakinan sebesar 95% bahwa rata-rata transaksi sebenarnya berada di kisaran 11,97 hingga 13,23, yang merupakan standar umum dalam pengambilan keputusan. Jika manajemen menginginkan kepastian yang lebih ekstrem (99%) untuk meminimalkan risiko kesalahan prediksi, maka rentang nilai menjadi lebih lebar (11,78 hingga 13,42), yang berarti hasil estimasi menjadi kurang spesifik namun jauh lebih aman dari sisi risiko.

2 Study kasus 2

2.1 Identifikasi uji statistik dan berikan alasannya

Uji statistik yang tepat untuk kasus ini adalah Uji-t (t-distribution).

Alasannya:

  • Standar deviasi populasi (\(\sigma\)) tidak diketahui: Kita hanya memiliki data sampel, sehingga kita harus menggunakan standar deviasi sampel (\(s\)).

  • Ukuran sampel kecil: Jumlah sampel (\(n = 12\)) kurang dari 30.

  • Diasumsikan bahwa data waktu penyelesaian tugas terdistribusi secara normal.

2.2 Menghitung Kepercayaan Interval

Diketahui:

  • Data: \(8.4, 7.9, 9.1, 8.7, 8.2, 9.0, 7.8, 8.5, 8.9, 8.1, 8.6, 8.3\)

  • \(n = 12\)

  • \(\bar{x} = 8.458\)

  • \(s = 0.407\)

  • \(df = n - 1 = 11\)

Rumus:\[E = t_{\alpha/2} \frac{s}{\sqrt{n}}\]

a) Interval Kepercayaan 90%

\(t_{0.05, 11} = 1.796\)

Hitung Margin of Error:\[E = 1.796 \times \frac{0.407}{\sqrt{12}}\]\[E = 1.796 \times 0.117 = 0.211\]

Hitung Batas Interval:

  • Lower Limit: \(\bar{x} - E = 8.458 - 0.211 = 8.247\)

  • Upper Limit: \(\bar{x} + E = 8.458 + 0.211 = 8.669\)

CI 90% = (8.247, 8.669)

b) Interval Kepercayaan 95%

\(t_{0.025, 11} = 2.201\)

Hitung Margin of Error:

\[E = 2.201 \times \frac{0.407}{\sqrt{12}}\]\[E = 2.201 \times 0.117 = 0.259\] Hitung Batas Interval:

  • Lower Limit: \(\bar{x} - E = 8.458 - 0.259 = 8.199\)

  • Upper Limit: \(\bar{x} + E = 8.458 + 0.259 = 8.717\)

CI 95% = (8.199, 8.717)

c) Interval Kepercayaan 99%

\(t_{0.005, 11} = 3.106\)

Hitung Margin of Error: \[E = 3.106 \times \frac{0.407}{\sqrt{12}}\]\[E = 3.106 \times 0.117 = 0.365\] Hitung Batas Interval:

  • Lower Limit: \(\bar{x} - E = 8.458 - 0.365 = 8.093\)

  • Upper Limit: \(\bar{x} + E = 8.458 + 0.365 = 8.823\)

CI 99% = (8.093, 8.823)

2.3 Visualisasi perbandingan

library(readr)
library(ggplot2)
library(knitr)
library(DT)
library(statip)

# 1. Input Data Sesuai Hitungan Manual Anda
x_bar_manual <- 8.458
# Margin of Error (E) dari hitungan manual Anda
e_90 <- 0.211
e_95 <- 0.259
e_99 <- 0.365

# 2. Membuat Dataframe Hasil Sesuai Angka Anda
results <- data.frame(
Kepercayaan = c("90%", "95%", "99%"),
Mean = rep(x_bar_manual, 3),
Lower = c(8.247, 8.199, 8.093), # Angka manual Anda
Upper = c(8.669, 8.717, 8.823) # Angka manual Anda
)

# 3. Visualisasi
ggplot(results, aes(x = Kepercayaan, y = Mean)) +
geom_errorbar(aes(ymin = Lower, ymax = Upper, color = Kepercayaan), width = 0.2, linewidth = 1.8) +
 geom_point(size = 6, color = "black") +
 # Menampilkan label angka 3 desimal agar persis sama dengan teks manual
 geom_text(aes(label = paste0("(", sprintf("%.3f", Lower), ", ", sprintf("%.3f", Upper), ")")),
 vjust = -2.5, size = 6, fontface = "bold") +
 labs(title = "Visualisasi Interval Kepercayaan (Study Kasus 2)",
subtitle = "Hasil disamakan persis dengan hitungan manual (3 desimal)",
y = "Waktu Penyelesaian (Menit)",
x = "Tingkat Kepercayaan") +
 theme_minimal(base_size = 18) +
 theme(
 plot.title = element_text(size = 22, face = "bold"),
 legend.position = "none"
 )

Interpretasi : Grafik ini menunjukkan bahwa rata-rata waktu penyelesaian tugas dari 12 pengguna adalah 8,458 menit, di mana penggunaan Uji-t dipilih karena standar deviasi populasi tidak diketahui dan ukuran sampel kecil. Visualisasi tersebut memperlihatkan bahwa semakin tinggi tingkat kepercayaan, maka rentang interval akan semakin lebar, mulai dari tingkat 90% dengan rentang (8,247, 8,669) hingga tingkat 99% yang melebar menjadi (8,093, 8,823). Hal ini membuktikan adanya trade-off antara kepastian dan presisi estimasi, di mana rentang interval dapat dipersempit kembali untuk meningkatkan akurasi hanya dengan cara menambah ukuran sampel.

2.4 Pengaruh Ukuran Sampel dan Tingkat Kepercayaan

  • Pengaruh Tingkat Kepercayaan

Tingkat kepercayaan memiliki korelasi positif dengan lebar interval. Berdasarkan rumus \(E = t_{\alpha/2} \frac{s}{\sqrt{n}}\), semakin tinggi tingkat kepercayaan yang diinginkan (misalnya beralih dari 90% ke 99%), maka nilai kritis \(t_{\alpha/2}\) akan semakin besar. Karena nilai \(t\) berfungsi sebagai pengali, nilai Margin of Error (\(E\)) juga akan otomatis meningkat, yang mengakibatkan rentang interval menjadi lebih lebar. Hal ini terjadi karena untuk mendapatkan tingkat kepastian yang lebih tinggi, kita memerlukan rentang nilai yang lebih luas guna memastikan parameter populasi tercakup di dalamnya.

  • Pengaruh Ukuran Sampel

Ukuran sampel (\(n\)) memiliki hubungan terbalik dengan lebar interval. Dalam rumus statistik, \(n\) berada di posisi penyebut dalam komponen standar error (\(\frac{s}{\sqrt{n}}\)). Oleh karena itu, jika ukuran sampel diperbesar, nilai pembagi akan meningkat sehingga hasil standar error dan Margin of Error (\(E\)) akan mengecil. Dampaknya, interval kepercayaan akan menjadi lebih sempit atau lebih presisi. Dengan kata lain, semakin banyak data yang dikumpulkan, semakin akurat estimasi rata-rata yang dihasilkan, sehingga rentang ketidakpastiannya pun berkurang.

3 Study kasus 3

3.1 Menghitung Proporsi Sampel \(\hat{p}\)

Hitung Proporsi Sampel \(\hat{p}\)

Diketahui:

  • \(n = 400\) (total pengguna)

  • \(x = 156\) (pengguna yang mengklik CTA)

  1. Hitung Proporsi Sampel \(\hat{p}\) \[\hat{p} = \frac{x}{n} = \frac{156}{400} = 0.39\]

3.2 Menghitung Kepercayaan Interval

Hitung Interval Kepercayaan

Rumus yang digunakan adalah: \[E = Z_{\alpha/2} \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}\]

a) Interval Kepercayaan 90%

  • \(Z_{0.05} = 1.645\)

  • \(E = 1.645 \times \sqrt{\frac{0.39(1-0.39)}{400}} = 1.645 \times 0.0244 = 0.0402\)

  • CI 90% = \(0.39 \pm 0.0402 = \mathbf{(0.3498, 0.4302)}\)

b) Interval Kepercayaan 95%

  • \(Z_{0.025} = 1.96\)

  • \(E = 1.96 \times \sqrt{\frac{0.39(1-0.39)}{400}} = 1.96 \times 0.0244 = 0.0478\)

  • CI 95% = \(0.39 \pm 0.0478 = \mathbf{(0.3422, 0.4378)}\)

c) Interval Kepercayaan 99%

  • \(Z_{0.005} = 2.576\)

  • \(E = 2.576 \times \sqrt{\frac{0.39(1-0.39)}{400}} = 2.576 \times 0.0244 = 0.0629\)

  • CI 99% = \(0.39 \pm 0.0629 = \mathbf{(0.3271, 0.4529)}\)

3.3 Visualisasi perbandingan

library(ggplot2)

# Data input sesuai perhitungan manual
p_hat <- 0.39
results_prop <- data.frame(
  Kepercayaan = c("90%", "95%", "99%"),
  Lower = c(0.3498, 0.3422, 0.3271),
  Upper = c(0.4302, 0.4378, 0.4529),
  Proporsi = c(0.39, 0.39, 0.39)
)

# Visualisasi
ggplot(results_prop, aes(x = Kepercayaan, y = Proporsi)) +
  geom_errorbar(aes(ymin = Lower, ymax = Upper, color = Kepercayaan), 
                width = 0.2, linewidth = 1.8) + 
  geom_point(size = 6) +
  # Menggunakan sprintf untuk memastikan 4 desimal muncul di gambar
  geom_text(aes(label = paste0("[", sprintf("%.4f", Lower), ", ", sprintf("%.4f", Upper), "]")), 
            vjust = -2.5, size = 6, fontface = "bold") +
  labs(title = "Visualisasi Interval Kepercayaan Proporsi (Study Kasus 3)",
       subtitle = "Hasil disesuaikan dengan perhitungan manual (4 desimal)",
       y = "Proporsi Klik (CTR)", x = "Tingkat Kepercayaan") +
  theme_minimal(base_size = 18) +
  theme(
    plot.title = element_text(size = 22, face = "bold"),
    legend.position = "none",
    plot.margin = unit(c(1,1,1,1), "cm")
  )

Interpretasi : Grafik ini menunjukkan perbandingan rentang estimasi proporsi klik (Click-Through Rate) pada desain tombol CTA baru dengan titik pusat proporsi sampel sebesar 0.39 atau 39%. Terlihat secara visual bahwa semakin tinggi tingkat kepercayaan (dari 90% ke 99%), maka interval kepercayaan akan semakin lebar, yang menandakan adanya perdagangan (trade-off) antara tingkat kepastian dan presisi estimasi. Karena batas bawah pada tingkat kepercayaan 99% sekalipun masih berada di angka 0.3271 (32.71%), tim data science dapat menyimpulkan dengan sangat yakin bahwa performa tombol baru ini secara konsisten memberikan hasil yang positif dan signifikan bagi bisnis.

3.4 Pengaruh Tingkat Kepercayaan terhadap Pengambilan Keputusan

Tingkat kepercayaan memengaruhi pengambilan keputusan dengan cara menentukan keseimbangan antara kepastian statistik dan ketepatan estimasi hasil eksperimen produk. Semakin tinggi tingkat kepercayaan yang dipilih (seperti 99%), maka rentang interval akan semakin lebar, yang berarti tim produk memiliki kepastian yang sangat kuat bahwa hasil sebenarnya berada dalam rentang tersebut, namun dengan presisi nilai yang lebih rendah. Dalam eksperimen tombol CTA ini, penggunaan tingkat kepercayaan yang lebih tinggi membantu meminimalkan risiko kesalahan pengambilan keputusan (seperti meluncurkan fitur yang sebenarnya tidak efektif), karena jika batas bawah interval yang paling lebar sekalipun masih menunjukkan hasil positif, maka keputusan untuk mengimplementasikan desain baru tersebut dapat diambil dengan sangat aman dan percaya diri.

4 Study kasus 4

4.1 Identifikasi uji statistik oleh masing-masing tim

  • Tim A: Menggunakan Uji-Z karena standar deviasi populasi (\(\sigma\)) diketahui (\(24\)).

  • Tim B: Menggunakan Uji-t karena hanya standar deviasi sampel (\(s\)) yang diketahui (\(24\)), sedangkan \(\sigma\) tidak diketahui.

4.2 Menghitung Kepercayaan Interval

Diketahui (Kedua Tim): - \(n = 36\)

  • \(\bar{x} = 210\)

  • \(\sigma\) (Tim A) / \(s\) (Tim B) \(= 24\)

  • \(df\) (Tim B) \(= n - 1 = 35\)

a) Interval Kepercayaan 90%

Tim A (Uji-Z):

  • \(Z_{0.05} = 1.645\)

  • Hitung Margin of Error (\(E\)):\(E = 1.645 \times \frac{24}{\sqrt{36}} = 1.645 \times 4 = 6.58\)

  • Hitung Batas Interval:

  1. Lower Limit: \(\bar{x} - E = 210 - 6.58 = 203.42\)

  2. Upper Limit: \(\bar{x} + E = 210 + 6.58 = 216.58\)

  • CI 90% = (203.42, 216.58)

Tim B (Uji-t):

  • \(t_{0.05, 35} = 1.690\)

  • Hitung Margin of Error (\(E\)):\(E = 1.690 \times \frac{24}{\sqrt{36}} = 1.690 \times 4 = 6.76\)

  • Hitung Batas Interval:

  1. Lower Limit: \(210 - 6.76 = 203.24\)

  2. Upper Limit: \(210 + 6.76 = 216.76\)

  • CI 90% = (203.24, 216.76)

b) Interval Kepercayaan 95%

Tim A (Uji-Z):

  • \(Z_{0.025} = 1.96\)

  • Hitung Margin of Error (\(E\)):\(E = 1.96 \times 4 = 7.84\)

  • Hitung Batas Interval:

  1. Lower Limit: \(210 - 7.84 = 202.16\)

  2. Upper Limit: \(210 + 7.84 = 217.84\)

  • CI 95% = (202.16, 217.84)

Tim B (Uji-t):

  • \(t_{0.025, 35} = 2.030\)

  • Hitung Margin of Error (\(E\)):\(E = 2.030 \times 4 = 8.12\)

  • Hitung Batas Interval:

  1. Lower Limit: \(210 - 8.12 = 201.88\)

  2. Upper Limit: \(210 + 8.12 = 218.12\)

  • CI 95% = (201.88, 218.12)

c) Interval Kepercayaan 99%

Tim A (Uji-Z):

  • \(Z_{0.005} = 2.576\)

  • Hitung Margin of Error (\(E\)):\(E = 2.576 \times 4 = 10.30\)

  • Hitung Batas Interval:

  1. Lower Limit: \(210 - 10.30 = 199.70\)

  2. Upper Limit: \(210 + 10.30 = 220.30\)

  • CI 99% = (199.70, 220.30)

Tim B (Uji-t):

  • \(t_{0.005, 35} = 2.724\)

  • Hitung Margin of Error (\(E\)):\(E = 2.724 \times 4 = 10.90\)

  • Hitung Batas Interval:

  1. Lower Limit: \(210 - 10.90 = 199.10\)

  2. Upper Limit: \(210 + 10.90 = 220.90\)

  • CI 99% = (199.10, 220.90)

4.3 Visualisasi perbandingan

library(ggplot2)

# 1. Data sesuai perhitungan manual Study Kasus 4
results_4 <- data.frame(
  Metode = rep(c("Tim A (Uji-Z)", "Tim B (Uji-t)"), each = 3),
  Kepercayaan = rep(c("90%", "95%", "99%"), 2),
  Lower = c(203.42, 202.16, 199.70, 203.24, 201.88, 199.10),
  Upper = c(216.58, 217.84, 220.30, 216.76, 218.12, 220.90),
  Mean = 210
)

results_4$Kepercayaan <- factor(results_4$Kepercayaan, levels = c("90%", "95%", "99%"))

# 2. Visualisasi dengan label di depan (sisi kiri grafik)
ggplot(results_4, aes(x = Kepercayaan, y = Mean, color = Metode)) +
  geom_errorbar(aes(ymin = Lower, ymax = Upper), 
                width = 0.3, linewidth = 2, position = position_dodge(0.8)) + 
  geom_point(size = 6, position = position_dodge(0.8)) +
  
  # Meletakkan label di sisi kiri kategori masing-masing
  geom_text(aes(label = paste0("[", sprintf("%.2f", Lower), ", ", sprintf("%.2f", Upper), "]"),
                # Menggeser posisi vertikal sedikit agar Tim A dan Tim B tidak bertumpuk
                y = ifelse(Metode == "Tim A (Uji-Z)", Mean + 1.2, Mean - 1.2)),
            # Menggunakan position_nudge untuk mendorong teks ke KIRI (depan) garis
            position = position_dodge(0.8),
            hjust = 1.1,         # Rata kanan agar teks berakhir tepat di depan garis
            size = 4.5, 
            fontface = "bold",
            show.legend = FALSE) +
  
  labs(title = "Perbandingan Presisi Interval Kepercayaan: Tim A vs Tim B",
       subtitle = "Semua label diletakkan di depan (sisi kiri) masing-masing garis agar rapi",
       y = "Atensi API (Milidetik)", x = "Tingkat Kepercayaan") +
  theme_minimal(base_size = 18) +
  theme(
    plot.title = element_text(size = 24, face = "bold"),
    legend.position = "bottom",
    plot.margin = unit(c(1, 1, 1, 1), "cm")
  )

Interpretasi : Grafik ini menunjukkan bahwa meskipun Tim A dan Tim B memiliki rata-rata sampel yang sama sebesar 210 ms, terdapat perbedaan nyata pada tingkat presisi intervalnya. Tim A yang menggunakan Uji-Z menghasilkan interval yang lebih sempit dan presisi karena parameter populasi sudah diketahui secara pasti. Sebaliknya, Tim B yang menggunakan Uji-t menghasilkan interval yang lebih lebar karena adanya ketidakpastian tambahan dari penggunaan standar deviasi sampel. Semakin tinggi tingkat kepercayaan, rentang interval kedua tim semakin melebar untuk memberikan margin keamanan yang lebih besar dalam mengestimasi atensi API.

4.4 perbedaan lebar interval antara Tim A dan Tim B

Perbedaan lebar interval tersebut terjadi karena perbedaan tingkat ketidakpastian yang diasumsikan oleh masing-masing uji statistik. Tim A memiliki presisi yang lebih tinggi (interval lebih sempit) karena menggunakan Uji-Z, yang berasumsi bahwa standar deviasi populasi (\(\sigma\)) sudah diketahui secara pasti. Sementara itu, Tim B harus menggunakan Uji-t yang lebih konservatif karena mereka hanya mengestimasi standar deviasi berdasarkan sampel (\(s\)). Karena distribusi-t memiliki “ekor” yang lebih tebal untuk mengompensasi risiko kesalahan estimasi pada sampel, nilai kritis \(t\) akan selalu lebih besar daripada nilai kritis \(Z\) pada tingkat kepercayaan yang sama, sehingga menghasilkan rentang interval yang lebih lebar bagi Tim B.

5 Study kasus 5

5.1 Identifikasi Interval Kepercayaan dan Uji Statistik

  • Identifikasi Interval Kepercayaan: Jenis interval yang digunakan adalah Interval Kepercayaan Satu Sisi (Batas Bawah) karena manajemen hanya tertarik pada ambang minimum (at least) penggunaan fitur premium.

  • Uji Statistik yang Tepat: Digunakan Z-Test untuk Proporsi karena data berupa proporsi pengguna (\(x\) dari \(n\)) dengan ukuran sampel yang besar (\(n = 250 > 30\)).

5.2 Menghitung Batas Bawah

Diketahui:

  • \(n = 250\)

  • \(x = 185\)

  • Proporsi Sampel (\(\hat{p}\)) = \(\frac{185}{250} = 0.74\) (74%)

  • Standar Error (\(SE\)) = \(\sqrt{\frac{\hat{p}(1-\hat{p})}{n}} = \sqrt{\frac{0.74 \times 0.26}{250}} \approx 0.0277\)

  • Rumus Batas Bawah \(= \hat{p} - (Z_{\alpha} \times SE)\)

a) Tingkat Kepercayaan 90%

  • Nilai kritis satu sisi (\(Z_{0.10}\)) = 1.28

  • Batas Bawah = 0.74 - (1.28 ) = 0.74 - 0.0355 = $

b) Tingkat Kepercayaan 95%

  • Nilai kritis satu sisi (\(Z_{0.05}\)) = 1.645

  • Batas Bawah = 0.74 - (1.645 ) = 0.74 - 0.0456 = $

c) Tingkat Kepercayaan 99%

  • Nilai kritis satu sisi (\(Z_{0.01}\)) = 2.326

  • Batas Bawah = 0.74 - (2.326 ) = 0.74 - 0.0644 = $

5.3 Visualisasi perbandingan

library(ggplot2)

# Data hasil perhitungan Study Kasus 5
results_5 <- data.frame(
  Tingkat = factor(c("90%", "95%", "99%"), levels = c("90%", "95%", "99%")),
  LowerBound = c(0.7045, 0.6944, 0.6756)
)

# Visualisasi dengan posisi label berbeda khusus untuk 90%
ggplot(results_5, aes(x = Tingkat, y = LowerBound)) +
  # Garis target 70%
  geom_hline(yintercept = 0.70, linetype = "dashed", color = "red", linewidth = 1.5) +
  
  # Titik data
  geom_point(size = 8, color = "#2c3e50") +
  
  # Pengaturan Label: Khusus 90% di atas, selain itu di samping kiri
  geom_text(aes(label = sprintf("%.2f%%", LowerBound * 100),
                vjust = ifelse(Tingkat == "90%", -2, 0.5),  # -2 untuk ke atas (khusus 90%)
                hjust = ifelse(Tingkat == "90%", 0.5, 1.3)), # 0.5 untuk tengah (khusus 90%), 1.3 untuk samping
            size = 6, 
            fontface = "bold", 
            color = "black") +
  
  # Keterangan Target
  annotate("text", x = 0.5, y = 0.705, label = "Target 70%", 
           color = "red", fontface = "bold", size = 6, hjust = 0) +
           
  labs(title = "Estimasi Batas Bawah Pengguna Aktif Mingguan",
       subtitle = "Label 90% berada di atas titik, lainnya berada di depan (samping kiri) titik",
       y = "Proporsi Pengguna", x = "Tingkat Kepercayaan") +
  
  scale_y_continuous(labels = scales::percent, limits = c(0.65, 0.76)) +
  
  theme_minimal(base_size = 18) +
  theme(
    plot.title = element_text(face = "bold", size = 26),
    panel.grid.minor = element_blank()
  )

Interpretasi : Grafik ini menunjukkan bahwa proporsi sampel pengguna fitur premium saat ini mencapai 74%, namun pemenuhan target manajemen sebesar 70% sangat bergantung pada tingkat kepastian statistik yang digunakan. Pada tingkat kepercayaan 90%, target terpenuhi secara statistik karena batas bawah estimasi berada di angka 70,45%, sedikit di atas ambang batas merah. Namun, pada tingkat kepercayaan 95% dan 99%, batas bawahnya turun menjadi 69,44% dan 67,56%, sehingga target tersebut belum sepenuhnya terjamin. Hal ini mengindikasikan bahwa meski performa saat ini terlihat melampaui target, masih terdapat risiko hasil sebenarnya berada di bawah 70% jika dilihat dengan tingkat ketelitian yang lebih ketat.

5.4 Apakah Target 70% Telah Terpenuhi Secara Statistik

Target 70% terpenuhi secara statistik hanya pada tingkat kepercayaan 90%, karena nilai batas bawahnya (70,45%) masih berada di atas ambang batas 70%. Namun, target tersebut tidak terpenuhi secara statistik pada tingkat kepercayaan 95% dan 99%, karena nilai batas bawahnya masing-masing adalah 69,44% dan 67,56%, yang berarti masih ada kemungkinan secara statistik bahwa proporsi pengguna aktif sebenarnya berada di bawah target 70%.

6 Referensi

  • Walpole, R. E., Myers, R. H., Myers, S. L., & Ye, K. (2016). Probability & Statistics for Engineers & Scientists. Pearson.

  • Black, K. (2019). Business Statistics: For Contemporary Decision Making. Wiley.

  • Montgomery, D. C., & Runger, G. C. (2018). Applied Statistics and Probability for Engineers. Wiley.

  • Anderson, D. R., Sweeney, D. J., Williams, T. A., Camm, J. D., & Cochran, J. J. (2020). Statistics for Business & Economics. Cengage Learning.