Confidence Interval

Profil Mahasiswa - Anindya Kristianingputri
Foto Profil Anindya Kristianingputri

Anindya Kristianingputri

NIM: 52250025

Student Major Data Science

Institut Teknologi Sains Bandung

Dosen: Bakti Siregar, M.Sc., CDS

R Programming Statistics Confidence Interval

1 Studi Kasus 1

Rentang Kepercayaan untuk Rata-rata, \(\sigma\) Diketahui: Sebuah Platform Aplikasi Belanja Online ingin memperkirakan Rata-rata jumlah transaksi harian per pengguna Setelah Meluncurkan Fitur baru. Berdasarkan dari data historis berskala besar, populasi Simpangan Baku Sudah dketahui.

\[ \begin{eqnarray*} \sigma &=& 3.2 \quad \text{(Populasi Simpangan Baku)} \\ n &=& 100 \quad \text{(Ukuran/jumlah sampel)} \\ \bar{x} &=& 12.6 \quad \text{(rata rata sampel)} \end{eqnarray*} \]

Tugas

  1. Identifkasi Uji Satatistik yang sesuai dan jelaskan alasanmu.

  2. Hitung Rentang Kepercayaan Untuk:

    • \(90\%\)
    • \(95\%\)
    • \(99\%\)
  3. Buat Sebuah Visualisasi Perbandingan dari ketiga Interval Kepercayaan tersebut.

  4. Interpretasikan Hasilnya dalam Konteks Analisis Bisnis.

Penyelesaian Studi Kasus 1

  1. Identifkasi Uji Statistik

Uji Z digunakan pada penelitian ini karena seluruh parameter yang diperlukan telah diketahui, yaitu simpangan baku populasi sebesar 3,2, rata-rata sampel 12,6, dan ukuran sampel yang besar (n = 100). Dengan jumlah sampel yang besar, distribusi rata-rata sampel dapat diasumsikan mendekati distribusi normal sesuai Teorema Limit Tengah, sehingga penggunaan distribusi Z menjadi tepat. Oleh karena itu, karena semua informasi utama telah tersedia dan n ≥ 30, uji Z merupakan pilihan yang paling tepat untuk menguji rata-rata populasi pada kasus ini.

Rumus Distribusi Z dalam Rentang Kepercayaan

\[ \text{CI} = \bar{x} \pm z_{\alpha/2} \frac{\sigma}{\sqrt{n}} \]

\(\bar{x}\) : Rata-rata sampel
\(\sigma\) : Standar deviasi populasi
\(n\) : Ukuran sampel
\(z_{\alpha/2}\) : Nilai kritis distribusi normal standar (\(1-\alpha\))
\(\pm\) : Menunjukkan batas bawah dan batas atas interval kepercayaan

  1. Hitung Rentang Kepercayaan
Rentang Kepercayaan
Data yang digunakan:
Rata-rata sampel (\(\bar{x}\)) = 12.6
Standar deviasi populasi (\(\sigma\)) = 3.2
Ukuran sampel (\(n\)) = 100
Rentang Kepercayaan 90%

1. Menghitung \(z_{\alpha/2}\)

Tingkat keyakinan = 90% = 0.90
\[ \alpha = 1 - 0.90 = 0.10 \]
\[ \alpha/2 = 0.10/2 = 0.05 \]
\[ z_{\alpha/2} = z_{0.05} = 1.645 \]

2. Menghitung Margin of Error (ME)

Rumus: \[ ME = z_{\alpha/2} \times \frac{\sigma}{\sqrt{n}} \]
\[ ME = 1.645 \times \frac{3.2}{\sqrt{100}} \]
\[ ME = 1.645 \times 0.32 \]
\[ ME = 0.5264 \]

3. Menghitung Rentang Kepercayaan

Rumus: \[ \bar{x} \pm ME \]
Batas Atas = 12.6 + 0.5264 = 13.1264
Batas Bawah = 12.6 - 0.5264 = 12.0736
Rentang Kepercayaan 90%:
(12.0736, 13.1264)
Rentang Kepercayaan 95%

1. Menghitung \(z_{\alpha/2}\)

Tingkat keyakinan = 95% = 0.95
\[ \alpha = 1 - 0.95 = 0.05 \]
\[ \alpha/2 = 0.05/2 = 0.025 \]
\[ z_{\alpha/2} = z_{0.025} = 1.96 \]

2. Menghitung Margin of Error (ME)

Rumus: \[ ME = z_{\alpha/2} \times \frac{\sigma}{\sqrt{n}} \]
\[ ME = 1.96 \times \frac{3.2}{\sqrt{100}} \]
\[ ME = 1.96 \times 0.32 \]
\[ ME = 0.6272 \]

3. Menghitung Rentang Kepercayaan

Rumus: \[ \bar{x} \pm ME \]
Batas Atas = 12.6 + 0.6272 = 13.2272
Batas Bawah = 12.6 - 0.6272 = 11.9728
Rentang Kepercayaan 95%:
(11.9728, 13.2272)
Rentang Kepercayaan 99%

1. Menghitung \(z_{\alpha/2}\)

Tingkat keyakinan = 99% = 0.99
\[ \alpha = 1 - 0.99 = 0.01 \]
\[ \alpha/2 = 0.01/2 = 0.005 \]
\[ z_{\alpha/2} = z_{0.005} = 2.576 \]

2. Menghitung Margin of Error (ME)

Rumus: \[ ME = z_{\alpha/2} \times \frac{\sigma}{\sqrt{n}} \]
\[ ME = 2.576 \times \frac{3.2}{\sqrt{100}} \]
\[ ME = 2.576 \times 0.32 \]
\[ ME = 0.82432 \]

3. Menghitung Rentang Kepercayaan

Rumus: \[ \bar{x} \pm ME \]
Batas Atas = 12.6 + 0.82432 = 13.42432
Batas Bawah = 12.6 - 0.82432 = 11.77568
Rentang Kepercayaan 99%:
(11.77568, 13.42432)
  1. Visualisasi Perbandingan dari ketiga Interval Kepercayaan
library(ggplot2)

ci_data <- data.frame(
  CI = factor(c("90%", "95%", "99%"), levels = c("90%", "95%", "99%")),
  mean = c(12.6, 12.6, 12.6),
  lower = c(12.0736, 11.9728, 11.77568),
  upper = c(13.1264, 13.2272, 13.42432)
)
ggplot(ci_data, aes(x = CI, y = mean, color = CI)) +

  geom_point(size = 4) +

  geom_errorbar(
    aes(ymin = lower, ymax = upper),
    width = 0.18,
    linewidth = 1.3
  ) +

  # Label CI tepat di tengah titik mean
  geom_text(
    aes(
      x = CI,
      y = mean,
      label = paste0("(", round(lower,2), ", ", round(upper,2), ")")
    ),
    hjust = 0.5,
    vjust = 0.5,
    size = 3.8,
    color = "black",
    inherit.aes = FALSE
  ) +

  scale_color_manual(
    values = c(
      "90%" = "#2CB1A6",
      "95%" = "#1E8F8B",
      "99%" = "#166E6A"
    )
  ) +

  labs(
    title = "Visualisasi Rentang Kepercayaan Mean",
    subtitle = "Perbandingan Rentang Kepercayaan 90%, 95%, dan 99% terhadap Mean Sampel",
    x = "Tingkat Kepercayaan",
    y = "Nilai Mean"
  ) +

  theme_minimal(base_size = 13) +
  theme(
    plot.title = element_text(face = "bold", hjust = 0.5),
    plot.subtitle = element_text(hjust = 0.5),
    axis.title.x = element_text(face = "bold", hjust = 0.5),
    axis.title.y = element_text(face = "bold", hjust = 0.5),
    axis.text.x = element_text(hjust = 0.5),
    axis.text.y = element_text(hjust = 0.5),
    legend.position = "none"
  )

  1. Interpretasikan dalam Konteks Analisis Bisnis.

    Estimasi rata-rata sekitar 12,6 transaksi harian per pengguna menunjukkan indikasi peningkatan aktivitas pengguna setelah fitur diluncurkan. Rentang kepercayaan 90% dapat dimanfaatkan sebagai dasar keputusan awal untuk uji operasional dan optimalisasi fitur karena intervalnya lebih sempit dan cepat memberikan sinyal performa. Rentang kepercayaan 95% memberikan tingkat keyakinan yang lebih seimbang dan paling tepat digunakan sebagai dasar keputusan manajerial utama, yaitu melanjutkan atau mempertahankan fitur dalam jangka menengah. Sementara itu, rentang kepercayaan 99% memberikan keyakinan tertinggi bahwa peningkatan transaksi benar-benar terjadi, sehingga lebih aman digunakan sebagai dasar keputusan strategis bernilai besar, seperti alokasi anggaran pengembangan lanjutan dan penerapan fitur secara menyeluruh.


2 Studi Kasus 2

Rentang Kepercayaan rata rata, \(\sigma\) tidak diketahui: Sebuah Tim Penelitian AX menganalisis Waktu Penyelesaian Tugas (dalam hitungan menit) untuk aplikasi seluler. Data ini dikumpulkan dari 12 pengguna:

\[ 8.4,\; 7.9,\; 9.1,\; 8.7,\; 8.2,\; 9.0,\; 7.8,\; 8.5,\; 8.9,\; 8.1,\; 8.6,\; 8.3 \]

Tugas:

  1. Identifkasi Uji Satatistik yang sesuai dan jelaskan alasanmu.
  2. Hitung Interval Kepercayaan Untuk:
    • \(90\%\)
    • \(95\%\)
    • \(99\%\)
  3. Visualisasikan ketiga interval tersebut pada satu plot.
  4. Jelaskan bagaimana ukuran sampel dan tingkat kepercayaan memengaruhi lebar interval.

Penyelesaian Studi Kasus 2

  1. Identifkasi Uji Statistik

    Kasus ini dianalisis menggunakan rentang kepercayaan rata-rata dengan distribusi t karena simpangan baku populasi (σ) tidak diketahui dan jumlah sampel relatif kecil (n = 12). Data yang dianalisis berupa waktu penyelesaian tugas dalam satuan menit, sehingga sesuai untuk analisis rata-rata. Dalam kondisi tersebut, distribusi t lebih tepat digunakan dibandingkan distribusi normal karena mampu memperhitungkan ketidakpastian akibat estimasi simpangan baku dari sampel.

  2. Hitung Rentang Kepercayaan
Rentang Kepercayaan dengan Distribusi t
Data Waktu Penyelesaian Tugas (menit):
8.4, 7.9, 9.1, 8.7, 8.2, 9.0, 7.8, 8.5, 8.9, 8.1, 8.6, 8.3
n = 12 (ukuran sampel)
Rentang Kepercayaan 90%

1. Hitung Mean (Rata-rata)

Data: 8.4, 7.9, 9.1, 8.7, 8.2, 9.0, 7.8, 8.5, 8.9, 8.1, 8.6, 8.3
\[ \bar{x} = \frac{8.4 + 7.9 + 9.1 + 8.7 + .......+ 8.3}{12} \]
\[ \bar{x} = \frac{102.5}{12} = 8.5417 \]

2. Hitung Standar Deviasi Sampel (s)

Rumus: \[ s = \sqrt{\frac{\sum (x_i - \bar{x})^2}{n-1}} \]
\[ \begin{aligned} (8.4-8.5417)^2 &= 0.0201 \\ (7.9-8.5417)^2 &= 0.4115 \\ (9.1-8.5417)^2 &= 0.3115 \\ (8.7-8.5417)^2 &= 0.0251 \\ (8.2-8.5417)^2 &= 0.1167 \\ (9.0-8.5417)^2 &= 0.2100 \\ (7.8-8.5417)^2 &= 0.5503 \\ (8.5-8.5417)^2 &= 0.0017 \\ (8.9-8.5417)^2 &= 0.1285 \\ (8.1-8.5417)^2 &= 0.1951 \\ (8.6-8.5417)^2 &= 0.0034 \\ (8.3-8.5417)^2 &= 0.0584 \\ \end{aligned} \]
\[ \sum (x_i - \bar{x})^2 = 0.0201 + 0.4115 + 0.3115 + .......+ 0.0584 \]
\[ \sum (x_i - \bar{x})^2 = 2.0323 \]
\[ s = \sqrt{\frac{2.0323}{12-1}} = \sqrt{\frac{2.0323}{11}} = \sqrt{0.1848} = 0.4299 \]

3. Menentukan \( t_{\alpha/2} \)

Tingkat keyakinan = 90% = 0.90
\[ \alpha = 1 - 0.90 = 0.10 \]
\[ \alpha/2 = 0.10/2 = 0.05 \]
Derajat kebebasan: \( df = n - 1 = 12 - 1 = 11 \)
\[ t_{\alpha/2} = t_{0.05, 11} = 1.796 \]

4. Menghitung Margin of Error (ME)

Rumus: \[ ME = t_{\alpha/2} \times \frac{s}{\sqrt{n}} \]
\[ ME = 1.796 \times \frac{0.4299}{\sqrt{12}} \]
\[ ME = 1.796 \times \frac{0.4299}{3.4641} \]
\[ ME = 1.796 \times 0.1241 = 0.2229 \]

5. Menghitung Rentang Kepercayaan

Rumus: \[ \bar{x} \pm ME \]
Batas Atas = 8.5417 + 0.2229 = 8.7646
Batas Bawah = 8.5417 - 0.2229 = 8.3188
Rentang Kepercayaan 90%:
(8.3188, 8.7646)
Rentang Kepercayaan 95%

1. Mean dan Standar Deviasi

\[ \bar{x} = 8.5417 \]
\[ s = 0.4299 \]

2. Menentukan \( t_{\alpha/2} \)

Tingkat keyakinan = 95% = 0.95
\[ \alpha = 1 - 0.95 = 0.05 \]
\[ \alpha/2 = 0.05/2 = 0.025 \]
Derajat kebebasan: \( df = n - 1 = 12 - 1 = 11 \)
\[ t_{\alpha/2} = t_{0.025, 11} = 2.201 \]

3. Menghitung Margin of Error (ME)

Rumus: \[ ME = t_{\alpha/2} \times \frac{s}{\sqrt{n}} \]
\[ ME = 2.201 \times \frac{0.4299}{\sqrt{12}} \]
\[ ME = 2.201 \times 0.1241 = 0.2731 \]

4. Menghitung Rentang Kepercayaan

Rumus: \[ \bar{x} \pm ME \]
Batas Atas = 8.5417 + 0.2731 = 8.8148
Batas Bawah = 8.5417 - 0.2731 = 8.2686
Rentang Kepercayaan 95%:
(8.2686, 8.8148)
Rentang Kepercayaan 99%

1. Mean dan Standar Deviasi

\[ \bar{x} = 8.5417 \]
\[ s = 0.4299 \]

2. Menentukan \( t_{\alpha/2} \)

Tingkat keyakinan = 99% = 0.99
\[ \alpha = 1 - 0.99 = 0.01 \]
\[ \alpha/2 = 0.01/2 = 0.005 \]
Derajat kebebasan: \( df = n - 1 = 12 - 1 = 11 \)
\[ t_{\alpha/2} = t_{0.005, 11} = 3.106 \]

3. Menghitung Margin of Error (ME)

Rumus: \[ ME = t_{\alpha/2} \times \frac{s}{\sqrt{n}} \]
\[ ME = 3.106 \times \frac{0.4299}{\sqrt{12}} \]
\[ ME = 3.106 \times 0.1241 = 0.3854 \]

4. Menghitung Rentang Kepercayaan

Rumus: \[ \bar{x} \pm ME \]
Batas Atas = 8.5417 + 0.3854 = 8.9271
Batas Bawah = 8.5417 - 0.3854 = 8.1563
Rentang Kepercayaan 99%:
(8.1563, 8.9271)
  1. Visualisasi Perbandingan dari ketiga Interval Kepercayaan
library(ggplot2)

ci_data <- data.frame(
  CI = factor(c("90%", "95%", "99%"), levels = c("90%", "95%", "99%")),
  lower = c(8.3188, 8.2686, 8.1563),
  upper = c(8.7646, 8.8148, 8.9271),
  mean  = 8.5417
)

ggplot(ci_data, aes(y = CI)) +
  geom_errorbar(
    aes(xmin = lower, xmax = upper, color = CI),
    width = 0.25,
    linewidth = 1.4,
    orientation = "y"
  ) +
  geom_text(
    aes(x = lower, label = round(lower, 3)),
    hjust = 1.1,
    size = 4,
    fontface = "bold"
  ) +
  geom_text(
    aes(x = upper, label = round(upper, 3)),
    hjust = -0.1,
    size = 4,
    fontface = "bold"
  ) +
  scale_color_manual(
    values = c("90%" = "#008080",
               "95%" = "#20b2aa",
               "99%" = "#48d1cc")
  ) +
  labs(
    title = "Perbandingan Rentang Kepercayaan",
    x = "Waktu (menit)",
    y = NULL
  ) +
  theme_minimal(base_size = 13) +
  theme(
    plot.title = element_text(hjust = 0.5, face = "bold"),
    plot.subtitle = element_text(hjust = 0.5),
    axis.text.y = element_text(hjust = 0.5),
    legend.position = "none"
  )

4.Penjelasan bagaimana ukuran sampel dan tingkat kepercayaan memengaruhi lebar interval.

Lebar rentang kepercayaan dipengaruhi langsung oleh ukuran sampel dan tingkat kepercayaan. Semakin besar ukuran sampel, estimasi rata-rata menjadi lebih stabil sehingga standar error (\(\frac{\sigma}{\sqrt{n}}\)) mengecil dan interval kepercayaan menjadi lebih sempit, sedangkan sampel kecil menyebabkan ketidakpastian lebih besar sehingga interval melebar. Sebaliknya, tingkat kepercayaan yang lebih tinggi (misalnya dari 90% ke 99%) memerlukan nilai kritis Z atau t yang lebih besar, memperbesar margin of error dan membuat interval semakin lebar untuk menjamin keyakinan yang lebih kuat. Dengan demikian, interval sempit mencerminkan estimasi presisi dari sampel besar dan kepercayaan moderat seperti 95%, sementara interval lebar menunjukkan kehati-hatian lebih besar dalam pengambilan keputusan.

3 Studi Kasus 3

Rentang Kepercayaan untuk Sebuah Proporsi, Pengujian A/B: Tim Data Sience menjalankan pengujian A/B pada desain tombol Call-To-Action (CTA) baru. Eksperimen tersebut menghasilkan:

\[ \begin{eqnarray*} n &=& 400 \quad \text{(Keseluruhan Jumlah Pengguna)} \\ x &=& 156 \quad \text{(Pengguna yang memencet CTA)} \end{eqnarray*} \]

Tugas:

  1. Hitung sample proporsi \(\hat{p}\).
  2. Hitung Rentang Kepercayaan Untuk Proporsi pada :
    • \(90\%\)
    • \(95\%\)
    • \(99\%\)
  3. Visualisasikan dan Bandingkan ketiga interval tersebut.
  4. Jelaskan bagaimana tingkat kepercayaan memengaruhi pengambilan keputusan dalam eksperimen produk..

Penyelesaian Studi Kasus 3

  1. Hitung sample proporsi \(\hat{p}\) dan Hitung Rentang Kepercayaan Untuk Proporsi
Rentang Kepercayaan Proporsi
Data Pengujian A/B:
n = 400 (jumlah pengguna)
x = 156 (pengguna yang memencet CTA)
Hitung Sample Proporsi \(\hat{p}\)

Perhitungan Sample Proporsi

Rumus: \[ \hat{p} = \frac{x}{n} \]
\[ \hat{p} = \frac{156}{400} \]
\[ \hat{p} = 0.39 \]
Hasil Perhitungan:
\(\hat{p} = 0.39\)
Rentang Kepercayaan 90%

1. Menentukan \( z_{\alpha/2} \)

Tingkat keyakinan = 90% = 0.90
\[ \alpha = 1 - 0.90 = 0.10 \]
\[ \alpha/2 = 0.10/2 = 0.05 \]
\[ z_{\alpha/2} = z_{0.05} = 1.645 \]

2. Menghitung Margin of Error (ME)

Rumus: \[ ME = z_{\alpha/2} \times \sqrt{\frac{\hat{p}(1-\hat{p})}{n}} \]
\[ ME = 1.645 \times \sqrt{\frac{0.39 \times (1-0.39)}{400}} \]
\[ ME = 1.645 \times \sqrt{\frac{0.39 \times 0.61}{400}} \]
\[ ME = 1.645 \times \sqrt{\frac{0.2379}{400}} \]
\[ ME = 1.645 \times \sqrt{0.00059475} \]
\[ ME = 1.645 \times 0.02439 \]
\[ ME = 0.04012 \]

3. Menghitung Rentang Kepercayaan

Rumus: \[ \hat{p} \pm ME \]
Batas Atas = 0.39 + 0.04012 = 0.43012
Batas Bawah = 0.39 - 0.04012 = 0.34988
Rentang Kepercayaan 90% untuk proporsi:
(0.3499, 0.4301)
atau (34.99%, 43.01%)
Rentang Kepercayaan 95%

1. Menentukan \( z_{\alpha/2} \)

Tingkat keyakinan = 95% = 0.95
\[ \alpha = 1 - 0.95 = 0.05 \]
\[ \alpha/2 = 0.05/2 = 0.025 \]
\[ z_{\alpha/2} = z_{0.025} = 1.96 \]

2. Menghitung Margin of Error (ME)

Rumus: \[ ME = z_{\alpha/2} \times \sqrt{\frac{\hat{p}(1-\hat{p})}{n}} \]
\[ ME = 1.96 \times \sqrt{\frac{0.39 \times (1-0.39)}{400}} \]
\[ ME = 1.96 \times \sqrt{\frac{0.39 \times 0.61}{400}} \]
\[ ME = 1.96 \times 0.02439 \]
\[ ME = 0.04780 \]

3. Menghitung Rentang Kepercayaan

Rumus: \[ \hat{p} \pm ME \]
Batas Atas = 0.39 + 0.04780 = 0.43780
Batas Bawah = 0.39 - 0.04780 = 0.34220
Rentang Kepercayaan 95% untuk proporsi:
(0.3422, 0.4378)
atau (34.22%, 43.78%)
Rentang Kepercayaan 99%

1. Menentukan \( z_{\alpha/2} \)

Tingkat keyakinan = 99% = 0.99
\[ \alpha = 1 - 0.99 = 0.01 \]
\[ \alpha/2 = 0.01/2 = 0.005 \]
\[ z_{\alpha/2} = z_{0.005} = 2.576 \]

2. Menghitung Margin of Error (ME)

Rumus: \[ ME = z_{\alpha/2} \times \sqrt{\frac{\hat{p}(1-\hat{p})}{n}} \]
\[ ME = 2.576 \times \sqrt{\frac{0.39 \times (1-0.39)}{400}} \]
\[ ME = 2.576 \times \sqrt{\frac{0.39 \times 0.61}{400}} \]
\[ ME = 2.576 \times 0.02439 \]
\[ ME = 0.06283 \]

3. Menghitung Rentang Kepercayaan

Rumus: \[ \hat{p} \pm ME \]
Batas Atas = 0.39 + 0.06283 = 0.45283
Batas Bawah = 0.39 - 0.06283 = 0.32717
Rentang Kepercayaan 99% untuk proporsi:
(0.3272, 0.4528)
atau (32.72%, 45.28%)
  1. Visualisasi dan Perbandingan ketiga interval tersebut.
library(ggplot2)

# Data CI proporsi
ci_proporsi <- data.frame(
  CI = factor(c("90%", "95%", "99%"), levels = c("90%", "95%", "99%")),
  lower = c(0.3499, 0.3422, 0.3272),
  upper = c(0.4301, 0.4378, 0.4528)
)

ggplot(ci_proporsi, aes(y = CI)) +
  geom_errorbar(
    aes(xmin = lower, xmax = upper, color = CI),
    width = 0.25,
    linewidth = 1.4,
    orientation = "y"
  ) +
  geom_text(
    aes(x = lower, label = scales::percent(lower, accuracy = 0.01)),
    hjust = 1.1,
    size = 4,
    fontface = "bold"
  ) +
  geom_text(
    aes(x = upper, label = scales::percent(upper, accuracy = 0.01)),
    hjust = -0.1,
    size = 4,
    fontface = "bold"
  ) +
  scale_color_manual(
    values = c("90%" = "#008080",
               "95%" = "#20b2aa",
               "99%" = "#48d1cc")
  ) +
  scale_x_continuous(
    labels = scales::percent_format(accuracy = 1)
  ) +
  labs(
    title = "Perbandingan Rentang Kepercayaan",
    subtitle = "n = 400,  x = 156,  p̂ = 0.39",
    x = "Proporsi Pengguna",
    y = NULL
  ) +
  theme_minimal(base_size = 13) +
  theme(
    plot.title = element_text(hjust = 0.5, face = "bold"),
    plot.subtitle = element_text(hjust = 0.5),
    axis.text.y = element_text(hjust = 0.5),
    legend.position = "none"
  )

  1. Penjelasan bagaimana tingkat kepercayaan memengaruhi pengambilan keputusan dalam eksperimen produk.

Tingkat kepercayaan memengaruhi pengambilan keputusan dalam eksperimen produk karena menentukan seberapa yakin tim terhadap hasil yang diperoleh. Tingkat kepercayaan yang lebih tinggi (misalnya 99%) memberikan keyakinan yang lebih kuat bahwa hasil eksperimen mencerminkan kondisi sebenarnya, namun konsekuensinya adalah rentang kepercayaan menjadi lebih lebar, sehingga keputusan yang diambil cenderung lebih konservatif. Sebaliknya, tingkat kepercayaan yang lebih rendah (misalnya 90%) menghasilkan rentang yang lebih sempit dan keputusan bisa diambil lebih cepat, tetapi dengan risiko kesalahan yang lebih besar. Oleh karena itu, pemilihan tingkat kepercayaan harus disesuaikan dengan konteks bisnis: eksperimen berisiko tinggi biasanya memerlukan tingkat kepercayaan yang lebih tinggi

4 Studi Kasus 4

Perbandingan Presisi (Uji-Z vs Uji-t): Dua tim data mengukur latensi API (dalam milidetik) di bawah kondisi yang berbeda.

\[\begin{eqnarray*} \text{Tim A:} \\ n &=& 36 \quad \text{(Ukuran/jumlah sampel)} \\ \bar{x} &=& 210 \quad \text{(Rata Rata Sampel)} \\ \sigma &=& 24 \quad \text{(Diketahui Simpangan Baku)} \\[6pt] \text{Tim B:} \\ n &=& 36 \quad \text{(Ukuran/jumlah sampel)} \\ \bar{x} &=& 210 \quad \text{(Rata Rata Sampel)} \\ s &=& 24 \quad \text{(Simpangan Baku Sampel)} \end{eqnarray*}\]

Tugas

  1. Identifikasi uji statistik yang digunakan oleh setiap tim.
  2. Hitung Rentang Kepercayaan Untuk 90%, 95%, and 99%.
  3. Buat visualisasi yang membandingkan seluruh interval.
  4. Jelaskan mengapa lebar interval berbeda, meskipun datanya mirip mendekati sama/ serupa.

Penyelesaian Studi Kasus 4

  1. uji statistik yang digunakan oleh setiap tim
  • Tim A menggunakan uji Z (Z-test), karena simpangan baku populasi (σ) diketahui. Dalam kondisi ini, ketidakpastian hanya berasal dari variasi sampel, sehingga distribusi normal sudah memadai untuk melakukan inferensi terhadap rata-rata populasi. Dengan ukuran sampel yang relatif cukup (n = 36), pendekatan ini memberikan estimasi yang stabil dan efisien.

  • Tim B menggunakan uji t, karena simpangan baku populasi tidak diketahui dan digantikan oleh simpangan baku sampel (s). Penggunaan distribusi t diperlukan untuk memperhitungkan tambahan ketidakpastian akibat estimasi simpangan baku dari data sampel, sehingga hasil inferensi menjadi lebih valid dan sesuai dengan kondisi data yang tersedia.

  1. Hitung Rentang Kepercayaan
Rentang Kepercayaan - Distribusi z dan t
Data Tim:
Tim A:
n = 36 (ukuran sampel)
\(\bar{x}\) = 210 (rata-rata sampel)
\(\sigma\) = 24 (diketahui simpangan baku populasi)
Tim B:
n = 36 (ukuran sampel)
\(\bar{x}\) = 210 (rata-rata sampel)
s = 24 (simpangan baku sampel)
Tim A: Distribusi z (σ diketahui)
Rentang Kepercayaan 90%

1. Menentukan \( z_{\alpha/2} \)

Tingkat keyakinan = 90% = 0.90
\[ \alpha = 1 - 0.90 = 0.10 \]
\[ \alpha/2 = 0.10/2 = 0.05 \]
\[ z_{\alpha/2} = z_{0.05} = 1.645 \]

2. Menghitung Margin of Error (ME)

Rumus: \[ ME = z_{\alpha/2} \times \frac{\sigma}{\sqrt{n}} \]
\[ ME = 1.645 \times \frac{24}{\sqrt{36}} \]
\[ ME = 1.645 \times \frac{24}{6} \]
\[ ME = 1.645 \times 4 \]
\[ ME = 6.58 \]

3. Menghitung Rentang Kepercayaan

Rumus: \[ \bar{x} \pm ME \]
Batas Atas = 210 + 6.58 = 216.58
Batas Bawah = 210 - 6.58 = 203.42
Rentang Kepercayaan 90%:
(203.42, 216.58)
Rentang Kepercayaan 95%

1. Menentukan \( z_{\alpha/2} \)

Tingkat keyakinan = 95% = 0.95
\[ \alpha = 1 - 0.95 = 0.05 \]
\[ \alpha/2 = 0.05/2 = 0.025 \]
\[ z_{\alpha/2} = z_{0.025} = 1.96 \]

2. Menghitung Margin of Error (ME)

Rumus: \[ ME = z_{\alpha/2} \times \frac{\sigma}{\sqrt{n}} \]
\[ ME = 1.96 \times \frac{24}{\sqrt{36}} \]
\[ ME = 1.96 \times 4 \]
\[ ME = 7.84 \]

3. Menghitung Rentang Kepercayaan

Rumus: \[ \bar{x} \pm ME \]
Batas Atas = 210 + 7.84 = 217.84
Batas Bawah = 210 - 7.84 = 202.16
Rentang Kepercayaan 95%:
(202.16, 217.84)
Rentang Kepercayaan 99%

1. Menentukan \( z_{\alpha/2} \)

Tingkat keyakinan = 99% = 0.99
\[ \alpha = 1 - 0.99 = 0.01 \]
\[ \alpha/2 = 0.01/2 = 0.005 \]
\[ z_{\alpha/2} = z_{0.005} = 2.576 \]

2. Menghitung Margin of Error (ME)

Rumus: \[ ME = z_{\alpha/2} \times \frac{\sigma}{\sqrt{n}} \]
\[ ME = 2.576 \times \frac{24}{\sqrt{36}} \]
\[ ME = 2.576 \times 4 \]
\[ ME = 10.304 \]

3. Menghitung Rentang Kepercayaan

Rumus: \[ \bar{x} \pm ME \]
Batas Atas = 210 + 10.304 = 220.304
Batas Bawah = 210 - 10.304 = 199.696
Rentang Kepercayaan 99%:
(199.70, 220.30)
Tim B: Distribusi t (σ tidak diketahui)
Rentang Kepercayaan 90%

1. Menentukan \( t_{\alpha/2} \)

Tingkat keyakinan = 90% = 0.90
\[ \alpha = 1 - 0.90 = 0.10 \]
\[ \alpha/2 = 0.10/2 = 0.05 \]
Derajat kebebasan: \( df = n - 1 = 36 - 1 = 35 \)
\[ t_{\alpha/2} = t_{0.05, 35} = 1.690 \]

2. Menghitung Margin of Error (ME)

Rumus: \[ ME = t_{\alpha/2} \times \frac{s}{\sqrt{n}} \]
\[ ME = 1.690 \times \frac{24}{\sqrt{36}} \]
\[ ME = 1.690 \times \frac{24}{6} \]
\[ ME = 1.690 \times 4 \]
\[ ME = 6.76 \]

3. Menghitung Rentang Kepercayaan

Rumus: \[ \bar{x} \pm ME \]
Batas Atas = 210 + 6.76 = 216.76
Batas Bawah = 210 - 6.76 = 203.24
Rentang Kepercayaan 90%:
(203.24, 216.76)
Rentang Kepercayaan 95%

1. Menentukan \( t_{\alpha/2} \)

Tingkat keyakinan = 95% = 0.95
\[ \alpha = 1 - 0.95 = 0.05 \]
\[ \alpha/2 = 0.05/2 = 0.025 \]
Derajat kebebasan: \( df = n - 1 = 36 - 1 = 35 \)
\[ t_{\alpha/2} = t_{0.025, 35} = 2.030 \]

2. Menghitung Margin of Error (ME)

Rumus: \[ ME = t_{\alpha/2} \times \frac{s}{\sqrt{n}} \]
\[ ME = 2.030 \times \frac{24}{\sqrt{36}} \]
\[ ME = 2.030 \times 4 \]
\[ ME = 8.12 \]

3. Menghitung Rentang Kepercayaan

Rumus: \[ \bar{x} \pm ME \]
Batas Atas = 210 + 8.12 = 218.12
Batas Bawah = 210 - 8.12 = 201.88
Rentang Kepercayaan 95%:
(201.88, 218.12)
Rentang Kepercayaan 99%

1. Menentukan \( t_{\alpha/2} \)

Tingkat keyakinan = 99% = 0.99
\[ \alpha = 1 - 0.99 = 0.01 \]
\[ \alpha/2 = 0.01/2 = 0.005 \]
Derajat kebebasan: \( df = n - 1 = 36 - 1 = 35 \)
\[ t_{\alpha/2} = t_{0.005, 35} = 2.724 \]

2. Menghitung Margin of Error (ME)

Rumus: \[ ME = t_{\alpha/2} \times \frac{s}{\sqrt{n}} \]
\[ ME = 2.724 \times \frac{24}{\sqrt{36}} \]
\[ ME = 2.724 \times 4 \]
\[ ME = 10.896 \]

3. Menghitung Rentang Kepercayaan

Rumus: \[ \bar{x} \pm ME \]
Batas Atas = 210 + 10.896 = 220.896
Batas Bawah = 210 - 10.896 = 199.104
Rentang Kepercayaan 99%:
(199.10, 220.90)
  1. Visualisasi yang membandingkan seluruh interval
library(ggplot2)

ci_data <- data.frame(
  CI = factor(rep(c("90%", "95%", "99%"), each = 2),
              levels = c("90%", "95%", "99%")),
  Tim = factor(rep(c("Tim A (z)", "Tim B (t)"), times = 3),
               levels = c("Tim A (z)", "Tim B (t)")),
  lower = c(
    203.42, 203.24,
    202.16, 201.88,
    199.70, 199.10
  ),
  upper = c(
    216.58, 216.76,
    217.84, 218.12,
    220.30, 220.90
  )
)

ci_data$mid <- (ci_data$lower + ci_data$upper)/2

ggplot(ci_data, aes(y = Tim, color = Tim)) +
  
  geom_errorbar(
    aes(xmin = lower, xmax = upper),
    orientation = "y",
    width = 0.25,
    linewidth = 1.4
  ) +
  
  geom_point(aes(x = mid), size = 3.5) +
  
  geom_label(
    aes(x = mid, label = paste0(round(lower,2), " – ", round(upper,2))),
    size = 5.2,
    fontface = "bold",
    fill = "white",
    alpha = 0.85,
    linewidth = 0,
    show.legend = FALSE
  ) +
  
  scale_color_manual(values = c("Tim A (z)" = "#e75480", "Tim B (t)" = "#4d4d4d")) +
  
  facet_wrap(~ CI, ncol = 1) +
  
  labs(
    title = "Perbandingan Rentang Kepercayaan Tim A dan Tim B",
    subtitle = "Interval kepercayaan 90%, 95%, dan 99%",
    x = "Nilai Estimasi",
    y = NULL
  ) +
  
  theme_minimal(base_size = 14) +
  theme(
    legend.position = "none",
    plot.title = element_text(hjust = 0.5, face = "bold", size = 16),
    plot.subtitle = element_text(hjust = 0.5, size = 13),
    strip.text = element_text(face = "bold", size = 14)
  )

  1. Penjelasan mengapa lebar interval berbeda, meskipun datanya mirip mendekati sama/ serupa

Meskipun data dari dua tim terlihat mirip dan rata-ratanya hampir sama, lebar interval kepercayaan bisa berbeda. Hal ini karena beberapa faktor. Pertama, tingkat kepercayaan yang dipilih, misalnya 90%, 95%, atau 99% menentukan seberapa yakin kita bahwa interval tersebut mencakup parameter populasi. Semakin tinggi tingkat kepercayaan, semakin lebar intervalnya. Kedua, metode perhitungan juga berpengaruh; Tim A menggunakan distribusi z, sedangkan Tim B menggunakan distribusi t. Distribusi t memiliki ekor lebih tebal sehingga CI cenderung lebih panjang, terutama untuk sampel kecil. Ketiga, variabilitas data dan ukuran sampel memengaruhi standar error data yang lebih tersebar atau sampel lebih kecil menghasilkan interval yang lebih lebar. Jadi, walaupun datanya hampir sama, kombinasi tingkat kepercayaan, jenis distribusi, dan karakteristik sampel menyebabkan lebar interval terlihat berbeda.

5 Studi Kasus 5

Interval Kepercayaan Satu Sisi: Perusahaan Software as a Service (SaaS) ingin memastikan bahwa setidaknya 70% pengguna aktif mingguan menggunakan fitur premium.

Untuk sebuah percobbaan:

\[ \begin{eqnarray*} n &=& 250 \quad \text{(Keseluruhan pengguna)} \\ x &=& 185 \quad \text{(Pengguna "Premium" yang Aktif)} \end{eqnarray*} \]

Manajemen hanya tertarik pada batas bawah dari perkiraan tersebut.

Tugas:

  1. Identifikasi jenis Rentang Kepercayaan Diri dan uji yang sesuai.
  2. Hitung Interval Kepercayaan satu sisi bawah pada :
    • \(90\%\)
    • \(95\%\)
    • \(99\%\)
  3. Visualisasikan batas bawah untuk semua tingkat kepercayaan.
  4. Tentukan apakah target 70% secara statistik terpenuhi.

Penyelesaian Studi Kasus 5

  1. uji statistik yang digunakan oleh Kasus ini

Kasus ini memerlukan Interval Kepercayaan Satu Sisi (One-Sided Confidence Interval), khususnya batas bawah (Lower Bound), karena tujuannya adalah memastikan nilai minimum “setidaknya 70%” dari populasi, bukan mencari rentang dua sisi. Dengan data berupa proporsi kategorikal (pengguna premium vs. non-premium) dan ukuran sampel yang besar (n=250), uji statistik yang tepat untuk digunakan adalah Uji-Z untuk Satu Proporsi (One-Sample Z-Test for a Proportion), di mana proporsi sampel dihitung sebesar 185/250 = 0.74 atau 74%.

2.Hitung Interval Kepercayaan satu sisi bawah

Interval Kepercayaan Satu Sisi Bawah
Data SaaS - Pengguna Fitur Premium:
n = 250 (total pengguna)
x = 185 (pengguna premium aktif)

Hitung Sample Proporsi \(\hat{p}\)

Rumus: \[ \hat{p} = \frac{x}{n} \]
\[ \hat{p} = \frac{185}{250} \]
\[ \hat{p} = 0.74 \]
Proporsi pengguna premium aktif: 74%
Interval Kepercayaan Satu Sisi Bawah 90%

1. Menentukan \( z_{\alpha} \)

Tingkat keyakinan = 90% = 0.90
\[ \alpha = 1 - 0.90 = 0.10 \]
(Untuk satu sisi bawah, gunakan seluruh α di satu sisi)
\[ z_{\alpha} = z_{0.10} = 1.282 \]

2. Menghitung Margin of Error (ME)

Rumus: \[ ME = z_{\alpha} \times \sqrt{\frac{\hat{p}(1-\hat{p})}{n}} \]
\[ ME = 1.282 \times \sqrt{\frac{0.74 \times (1-0.74)}{250}} \]
\[ ME = 1.282 \times \sqrt{\frac{0.74 \times 0.26}{250}} \]
\[ ME = 1.282 \times \sqrt{\frac{0.1924}{250}} \]
\[ ME = 1.282 \times \sqrt{0.0007696} \]
\[ ME = 1.282 \times 0.02774 \]
\[ ME = 0.03557 \]

3. Menghitung Batas Bawah Satu Sisi

Rumus: \[ \text{Batas Bawah} = \hat{p} - ME \]
Batas Bawah = 0.74 - 0.03557 = 0.70443
Interval Kepercayaan Satu Sisi Bawah 90%:
Proporsi ≥ 0.7044
atau ≥ 70.44%
Interpretasi: Dengan keyakinan 90%, kita dapat mengatakan bahwa minimal 70.44% pengguna aktif menggunakan fitur premium.
Interval Kepercayaan Satu Sisi Bawah 95%

1. Menentukan \( z_{\alpha} \)

Tingkat keyakinan = 95% = 0.95
\[ \alpha = 1 - 0.95 = 0.05 \]
\[ z_{\alpha} = z_{0.05} = 1.645 \]

2. Menghitung Margin of Error (ME)

Rumus: \[ ME = z_{\alpha} \times \sqrt{\frac{\hat{p}(1-\hat{p})}{n}} \]
\[ ME = 1.645 \times \sqrt{\frac{0.74 \times 0.26}{250}} \]
\[ ME = 1.645 \times 0.02774 \]
\[ ME = 0.04564 \]

3. Menghitung Batas Bawah Satu Sisi

Rumus: \[ \text{Batas Bawah} = \hat{p} - ME \]
Batas Bawah = 0.74 - 0.04564 = 0.69436
Interval Kepercayaan Satu Sisi Bawah 95%:
Proporsi ≥ 0.6944
atau ≥ 69.44%
Interpretasi: Dengan keyakinan 95%, kita dapat mengatakan bahwa minimal 69.44% pengguna aktif menggunakan fitur premium.
Interval Kepercayaan Satu Sisi Bawah 99%

1. Menentukan \( z_{\alpha} \)

Tingkat keyakinan = 99% = 0.99
\[ \alpha = 1 - 0.99 = 0.01 \]
\[ z_{\alpha} = z_{0.01} = 2.326 \]

2. Menghitung Margin of Error (ME)

Rumus: \[ ME = z_{\alpha} \times \sqrt{\frac{\hat{p}(1-\hat{p})}{n}} \]
\[ ME = 2.326 \times \sqrt{\frac{0.74 \times 0.26}{250}} \]
\[ ME = 2.326 \times 0.02774 \]
\[ ME = 0.06452 \]

3. Menghitung Batas Bawah Satu Sisi

Rumus: \[ \text{Batas Bawah} = \hat{p} - ME \]
Batas Bawah = 0.74 - 0.06452 = 0.67548
Interval Kepercayaan Satu Sisi Bawah 99%:
Proporsi ≥ 0.6755
atau ≥ 67.55%
Interpretasi: Dengan keyakinan 99%, kita dapat mengatakan bahwa minimal 67.55% pengguna aktif menggunakan fitur premium.
  1. Visualisasikan batas bawah untuk semua tingkat kepercayaan
library(ggplot2)

# Data
confidence <- c(0.90, 0.95, 0.99)
z_alpha <- c(1.282, 1.645, 2.326)
p_hat <- 185 / 250
n <- 250

# Hitung Margin of Error dan Batas Bawah
ME <- z_alpha * sqrt(p_hat * (1 - p_hat) / n)
lower_bound <- p_hat - ME

df <- data.frame(
  Confidence = confidence * 100,
  LowerBound = lower_bound
)

# Buat ggplot dengan posisi label disesuaikan
ggplot(df, aes(x = Confidence, y = LowerBound)) +
  geom_point(size = 4, color = "#008080") +
  geom_line(group = 1, color = "#20b2aa", linetype = "dashed") +
  geom_hline(yintercept = 0.7, color = "red", linetype = "dotted", size = 1) +
  geom_text(aes(label = sprintf("%.3f", LowerBound)),
            vjust = -0.8,  
            color = "#006666",
            size = 5) +
  scale_x_continuous(breaks = df$Confidence) +
  scale_y_continuous(labels = scales::percent_format(accuracy = 1), limits = c(0.65, 0.75)) +
  labs(
    title = "Batas Bawah Interval",
    x = "Tingkat Kepercayaan (%)",
    y = "Batas Bawah Proporsi",
    caption = "Garis merah = target minimal 70%"
  ) +
  theme_minimal(base_size = 14)
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

  1. Tentukan apakah target 70% secara statistik terpenuhi.

Berdasarkan data dari 250 pengguna dengan 185 pengguna aktif fitur premium, diperoleh proporsi sampel sebesar 74%. Hasil ini menunjukkan angka yang melebihi target perusahaan sebesar 70%. Namun, setelah dilakukan perhitungan interval kepercayaan satu sisi bawah, ditemukan bahwa pencapaian target bergantung pada tingkat keyakinan statistik yang diterapkan. Pada tingkat keyakinan 90%, batas bawah interval sebesar 70,44% mengindikasikan target terpenuhi, sedangkan pada tingkat keyakinan 95% dan 99% dengan batas bawah masing-masing 69,44% dan 67,55%, target dinyatakan tidak tercapai.Target 70% pengguna fitur premium hanya terpenuhi pada tingkat keyakinan 90%, namun tidak pada tingkat keyakinan yang lebih tinggi (95% dan 99%). Perlu dipertimbangkan bahwa meskipun data sampel menunjukkan angka positif, ketidakpastian statistik pada tingkat keyakinan tinggi menyebabkan target belum dapat dikatakan tercapai secara meyakinkan.

6 Reference

[1] T. Tony Cai, “One-sided confidence intervals in discrete distributions,”Journal of Statistical Planning and Inference, vol. 131, no. 1, pp. 63–88, 2005.

[2] A.-M. Simundic, “Confidence interval,” Biochemia Medica, vol. 18, no. 2, pp. 154–161, 2008.

[3] O. Barndorff-Nielsen, J. Kent, and M. Sørensen, “Normal variance-mean mixtures and z distributions,” International Statistical Review / Revue Internationale de Statistique, pp. 145–159, 1982.

