Study Cases

Confidence Interval ~ Week 13 ~

Jihan Ramadhani Deandri
Data Science undergraduate student

R Programming Data Science Statistics

1 Case Study 1

Interval Kepercayaan untuk Rata-rata (σ diketahui) Sebuah platform e-commerce ingin memperkirakan rata-rata jumlah transaksi per pengguna setelah meluncurkan fitur baru. Berdasarkan data historis berskala besar, standar deviasi populasi diketahui.

Diketahui :

  • \(\sigma = 3.2 \;\rightarrow\;\) (standar deviasi populasi)

  • \(n = 100 \;\rightarrow\;\) (ukuran sampel)

  • \(\bar{x} = 12.6 \;\rightarrow\;\) (rata-rata sampel)

JAWABAN :

1.1 Uji Statistik yang Digunakan

Uji statistik yang tepat adalah Confidence Interval untuk rata-rata menggunakan distribusi Z (Z-Interval). Alasan pemilihan uji:

  • Tujuan analisis adalah memperkirakan rata-rata populasi

  • Standar deviasi populasi (\(\sigma\)) diketahui

  • Ukuran sampel besar (\(n = 100\))

Karena \(\sigma\) diketahui dan \(n \ge 30\), maka distribusi yang digunakan adalah distribusi Z, bukan distribusi t.

1.2 Confidence Interval

Diketahui:

  • \(\sigma = 3.2\)
  • \(n = 100\)
  • \(\bar{x} = 12.6\)

Rumus : \[ \bar{x} \pm Z_{\alpha/2}\,\frac{\sigma}{\sqrt{n}} \] a. confidence interval 90%

  • Nilai Z untuk tingkat kepercayaan 90%:

\[ Z_{0.90} = 1.645 \]

  • Margin of Error:

\[ ME = Z \times SE = 1.645 \times 0.32 = 0.53 \]

  • Confidence Interval:

\[ \bar{x} \pm ME = 12.6 \pm 0.53 \]

\[ CI_{90\%} = (12.07,\; 13.13) \] b. confidence interval 95%

  • Nilai Z untuk tingkat kepercayaan 95%:

    \[ Z_{0.95} = 1.96 \]

  • Margin of Error:

    \[ ME = Z \times SE = 1.96 \times 0.32 = 0.63 \]

  • Confidence Interval:

    \[ \bar{x} \pm ME = 12.6 \pm 0.63 \]

    \[ CI_{95\%} = (11.97,\; 13.23) \]

c. confidence interval 99%

  • Nilai Z untuk tingkat kepercayaan 99%:

    \[ Z_{0.99} = 2.576 \]

  • Margin of Error:

    \[ ME = Z \times SE = 2.576 \times 0.32 = 0.82 \]

  • Confidence Interval:

    \[ \bar{x} \pm ME = 12.6 \pm 0.82 \]

    \[ CI_{99\%} = (11.78,\; 13.42) \]

1.3 Perbandingan Confidence Interval (Visualisasi Grafik)

# =========================
# DATA
# =========================
ci <- data.frame(
  Level = c("90%", "95%", "99%"),
  Lower = c(12.07, 11.97, 11.78),
  Upper = c(13.13, 13.23, 13.42),
  y = c(3, 2, 1)
)

mean_val <- 12.6

# =========================
# PLOT KOSONG
# =========================
par(mar = c(5, 6, 3, 2))

plot(
  x = c(11.5, 13.5),
  y = c(0.5, 3.5),
  type = "n",
  yaxt = "n",
  xlab = "Nilai Rata-rata Transaksi",
  ylab = "",
  main = "Perbandingan Confidence Interval"
)

axis(2, at = ci$y, labels = ci$Level, las = 1)
abline(h = ci$y, col = "gray90")

# =========================
# AREA CI (HIJAU TRANSPARAN)
# =========================
rect(
  ci$Lower, ci$y - 0.22,
  ci$Upper, ci$y + 0.22,
  col = rgb(0.2, 0.6, 0.4, 0.25),
  border = NA
)

# =========================
# GARIS CI
# =========================
segments(
  ci$Lower, ci$y,
  ci$Upper, ci$y,
  lwd = 4,
  col = rgb(0.1, 0.4, 0.3)
)

# =========================
# KOTAK UJUNG CI
# =========================
points(ci$Lower, ci$y, pch = 15, cex = 1.1, col = "black")
points(ci$Upper, ci$y, pch = 15, cex = 1.1, col = "black")

# =========================
# TITIK MEAN
# =========================
points(rep(mean_val, nrow(ci)), ci$y,
       pch = 19, cex = 1.1, col = "black")

abline(v = mean_val, lty = 2, lwd = 2, col = "gray40")

# =========================
# ANGKA DI UJUNG GARIS (INI JAWABANMU)
# =========================
for (i in 1:nrow(ci)) {

  text(
    ci$Lower[i],
    ci$y[i] + 0.25,
    labels = round(ci$Lower[i], 2),
    cex = 0.8,
    pos = 4
  )

  text(
    ci$Upper[i],
    ci$y[i] + 0.25,
    labels = round(ci$Upper[i], 2),
    cex = 0.8,
    pos = 2
  )
}

1.4 Interpretasikan hasil analisis dalam konteks analitik bisnis

Berdasarkan visualisasi confidence interval, terlihat bahwa interval dengan tingkat kepercayaan 99% memiliki garis paling panjang, sedangkan interval 90% memiliki garis paling pendek. Interval 95% berada di antara keduanya. Hal ini menunjukkan bahwa semakin tinggi tingkat kepercayaan yang digunakan, maka semakin lebar rentang confidence interval. Meskipun confidence interval 99% memberikan tingkat keyakinan yang paling tinggi, interval ini juga memiliki ketidakpastian yang lebih besar. Sebaliknya, confidence interval 90% lebih presisi, namun dengan tingkat keyakinan yang lebih rendah. Confidence interval 95% memberikan keseimbangan antara ketepatan dan tingkat keyakinan, sehingga paling sesuai digunakan untuk pengambilan keputusan dalam analisis bisnis.

2 Case Study 2

Interval Kepercayaan untuk Rata-rata, σ Tidak Diketahui Sebuah tim riset UX menganalisis waktu penyelesaian tugas (dalam satuan menit) untuk sebuah aplikasi mobile baru.Data dikumpulkan dari 12 pengguna, dengan hasil sebagai berikut:

8.4, 7.9, 9.1, 8.7, 8.2, 9.0, 7.8, 8.5, 8.9, 8.1, 8.6, 8.3

jumlah data : \[ n=12\]

JAWABAN :

2.1 uji Statistik yang digunakan

Uji statistik yang tepat adalah Confidence Interval menggunakan distribusi t (t-interval).

Alasannya:

  • Data berupa rata-rata waktu (numerik/kontinu)

  • Ukuran sampel kecil (n = 12, kurang dari 30)

  • Standar deviasi populasi (σ) tidak diketahui, hanya standar deviasi sampel

Karena \(\sigma\) tidak diketahui dan ukuran sampel kecil, maka distribusi yang digunakan adalah distribusi t-Student, bukan distribusi Z.

2.2 confidence Interval

Diketahui:

  • (\(n\)) = 12

  • (\(\bar{x}\)) = \(8{,}46\) menit

  • (\(s\)) = \(0{,}41\) menit

  • \(df = n - 1 = 11\)

rumus (σ tidak diketahui):

\[ \bar{x} \pm t_{\alpha/2,\,n-1}\left(\frac{s}{\sqrt{n}}\right) \]

a. Confidence Interval 90%

  • Nilai t untuk tingkat kepercayaan 90%

\[ t_{0.05,11} = 1.796 \]

  • Margin of Error

\[ ME = t_{\alpha/2} \times \frac{s}{\sqrt{n}} \]

\[ ME = 1.796 \times \frac{0.41}{\sqrt{12}} \]

\[ ME \approx 0.22 \]

  • Confidence Interval

\[ \bar{x} \pm ME = 8.46 \pm 0.22 \]

\[ CI_{90\%} \approx (8.24,\; 8.68) \] b. confidence Interval 95%

  • tingkat kepercayaan 95%

\[ \alpha = 1 - 0.95 = 0.05 \Rightarrow \alpha/2 = 0.025 \]

\[t_{0.025,11} = 2.201\]

  • Margin of Error

\[ ME = 2.201 \times \frac{0.41}{\sqrt{12}} \]

\[ ME \approx 0.26 \]

  • Confidence Interval

\[ \bar{x} \pm ME \]

\[ 8.46 \pm 0.26 \]

\[ (8.20,\; 8.72) \]

c. Confidence Interval 99%

  • \[ t_{0.005,\,11} = 3.106 \]

  • Margin of eror \[ ME = t_{\alpha/2,\,n-1}\left(\frac{s}{\sqrt{n}}\right) \] \[ ME = 3.106 \times \frac{0.41}{\sqrt{12}} \approx 0.37 \]

  • Confidence Interval \[ \bar{x} \pm ME \]

\[ 8.46 \pm 0.37 = (8.09,\; 8.83) \]

2.3 Perbandingan Confidence Interval (Visualisasi Grafik)

# =========================
# DATA
# =========================
ci <- data.frame(
  Level = c("90%", "95%", "99%"),
  Lower = c(8.24, 8.20, 8.09),
  Upper = c(8.68, 8.72, 8.83),
  y = c(3, 2, 1)
)

mean_val <- 8.46

# =========================
# PLOT KOSONG
# =========================
par(mar = c(5, 6, 3, 2), bg = "white")

plot(
  NA,
  xlim = c(8.0, 8.9),
  ylim = c(0.5, 3.5),
  xlab = "Waktu (menit)",
  ylab = "",
  yaxt = "n",
  main = "Confidence Interval (Dot–Interval dengan End Caps)"
)

axis(2, at = ci$y, labels = ci$Level, las = 1)

# =========================
# GRID HALUS
# =========================
abline(h = ci$y, col = "gray92")

# =========================
# AREA CI (HIJAU TRANSPARAN)
# =========================
for (i in 1:nrow(ci)) {
  rect(
    ci$Lower[i], ci$y[i] - 0.18,
    ci$Upper[i], ci$y[i] + 0.18,
    col = rgb(46, 139, 87, 80, maxColorValue = 255),
    border = NA
  )
}

# =========================
# GARIS CI
# =========================
segments(
  ci$Lower, ci$y,
  ci$Upper, ci$y,
  lwd = 4,
  col = "#2E8B57",
  lend = "round"
)

# =========================
# KOTAK UJUNG (END CAPS)
# =========================
points(
  ci$Lower, ci$y,
  pch = 15,      # kotak
  cex = 1.2,
  col = "#1B5E20"
)

points(
  ci$Upper, ci$y,
  pch = 15,
  cex = 1.2,
  col = "#1B5E20"
)

# =========================
# TITIK TENGAH CI
# =========================
points(
  (ci$Lower + ci$Upper) / 2,
  ci$y,
  pch = 19,
  cex = 1.4,
  col = "#1B5E20"
)

# =========================
# GARIS MEAN GLOBAL
# =========================
abline(
  v = mean_val,
  lwd = 2,
  lty = 2,
  col = "gray40"
)

# =========================
# LABEL ANGKA
# =========================
text(ci$Lower, ci$y + 0.25, round(ci$Lower, 2),
     pos = 2, cex = 0.8, col = "gray25")

text(ci$Upper, ci$y + 0.25, round(ci$Upper, 2),
     pos = 4, cex = 0.8, col = "gray25")

Interpretasi:

  • Garis horizontal menunjukkan rentang confidence interval.

  • Titik hitam menunjukkan rata-rata sampel sebesar 8.46 menit.

  • Semakin panjang garis, semakin lebar confidence interval, yang berarti tingkat ketidakpastian lebih besar.

2.4 Jelaskan bagaimana ukuran sampel dan tingkat kepercayaan memengaruhi lebar confidence interval

  1. Pengaruh ukuran sampel (sample size)

Semakin besar ukuran sampel, maka confidence interval akan semakin sempit.Hal ini terjadi karena dengan data yang lebih banyak, estimasi rata-rata menjadi lebih stabil dan kesalahan pengukuran (standard error) menjadi lebih kecil.Sebaliknya, jika ukuran sampel kecil, maka confidence interval akan lebih lebar karena ketidakpastian estimasi masih cukup besar.

  1. Pengaruh tingkat kepercayaan (confidence level)

Semakin tinggi tingkat kepercayaan yang digunakan (misalnya 99%), maka confidence interval akan semakin lebar.Hal ini karena untuk menjadi lebih yakin bahwa interval memuat nilai rata-rata populasi, rentang interval harus diperluas.Sebaliknya, tingkat kepercayaan yang lebih rendah (misalnya 90%) menghasilkan interval yang lebih sempit, namun dengan tingkat keyakinan yang lebih kecil.

3 Case Study 3

Interval kepercayaan untuk proporsi digunakan dalam A/B testing untuk menilai kinerja suatu desain. Pada studi kasus ini, tim data science menguji desain baru tombol Call-To-Action (CTA). Dari 400 pengguna yang terlibat, sebanyak 156 pengguna mengklik CTA. Data ini digunakan untuk mengestimasi proporsi klik dan membentuk confidence interval pada beberapa tingkat kepercayaan sebagai dasar pengambilan keputusan produk.

Diketahui :

Jumlah pengguna: \[ n = 400 \]

Jumlah pengguna yang mengklik CTA: \[ x = 156 \]

3.1 Menghitung proporsi sampel (p)

  • Proporsi sampel dihitung dengan rumus:

\[ \hat{p} = \frac{x}{n} \]

  • Substitusi nilai:

\[ \hat{p} = \frac{156}{400} = 0.39 \]

3.2 Menghitung Confidence Interval untuk proporsi

Rumus Confidence Interval Proporsi \[ \hat{p} \pm z_{\alpha/2} \sqrt{\frac{\hat{p}(1-\hat{p})}{n}} \] a. Confidence Interval 90%

  • Nilai Z:

\[ z_{0.05} = 1{,}645 \]

  • Margin of Error:

\[ ME = 1{,}645 \times \sqrt{\frac{0{,}39(1-0{,}39)}{400}} \approx 0{,}04 \] - Confidence Interval:

\[ 0{,}39 \pm 0{,}04 = (0{,}35,\; 0{,}43) \] b. Confidence Inteval 95%

  • Nilai Z:

\[ z_{0.025} = 1{,}96 \]

  • Margin of Error:

\[ ME = 1{,}96 \times \sqrt{\frac{0{,}39(1-0{,}39)}{400}} \approx 0{,}05 \] - Confidence Interval:

\[ 0{,}39 \pm 0{,}05 = (0{,}34,\; 0{,}44) \] c. Confidence Interval 99%

  • Nilai Z:

\[ z_{0.005} = 2{,}576 \]

  • Margin of Error:

\[ ME = 2{,}576 \times \sqrt{\frac{0{,}39(1-0{,}39)}{400}} \approx 0{,}06 \] - Confidence Interval:

\[ 0{,}39 \pm 0{,}06 = (0{,}33,\; 0{,}45) \]

3.3 Visualisasi dan perbandingan confidence interval

# =========================
# DATA
# =========================
level <- c("90%", "95%", "99%")
lower <- c(0.35, 0.34, 0.33)
upper <- c(0.43, 0.44, 0.45)
y <- c(1, 2, 3)   # urutan normal biar aman

mean_val <- 0.39

# =========================
# PLOT KOSONG
# =========================
par(mar = c(5, 6, 3, 2))

plot(
  NA,
  xlim = c(0.30, 0.48),
  ylim = c(0.5, 3.5),
  xlab = "Proporsi Klik CTA",
  ylab = "Tingkat Kepercayaan",
  yaxt = "n",
  main = "Confidence Interval Proporsi Klik CTA"
)

axis(2, at = y, labels = level)

# =========================
# GARIS CI (INI YANG TADI HILANG)
# =========================
segments(
  x0 = lower,
  y0 = y,
  x1 = upper,
  y1 = y,
  col = "#2E8B57",   # hijau estetik
  lwd = 5,
  lend = "round"
)

# =========================
# TITIK MEAN
# =========================
points(
  x = rep(mean_val, length(y)),
  y = y,
  pch = 19,
  cex = 1.3,
  col = "black"
)

# =========================
# GARIS MEAN
# =========================
abline(
  v = mean_val,
  lty = 2,
  lwd = 2,
  col = "gray40"
)

# =========================
# LABEL ANGKA
# =========================
text(lower, y + 0.18, round(lower, 2), pos = 4, cex = 0.8)
text(upper, y + 0.18, round(upper, 2), pos = 2, cex = 0.8)

Interpretasi :

Garis horizontal menunjukkan interval kepercayaan proporsi klik CTA pada tingkat 90%, 95%, dan 99%, dengan ujung garis sebagai batas bawah dan batas atas estimasi proporsi klik di populasi. Titik hitam (0,39) menunjukkan proporsi klik dari data sampel, yaitu

\[ \hat{p} = \frac{156}{400} = 0{,}39 \]

Nilai ini sama untuk semua tingkat kepercayaan karena berasal dari sampel yang sama.Lebar interval meningkat seiring naiknya tingkat kepercayaan: interval 99% paling lebar, sedangkan interval 90% paling sempit, yang menunjukkan bahwa tingkat kepercayaan lebih tinggi memerlukan rentang estimasi yang lebih besar.

3.4 Pengaruh confidence level terhadap pengambilan keputusan produk

  • Confidence level tinggi (99%), Memberikan keyakinan lebih besar, tetapi interval lebih lebar sehingga keputusan cenderung lebih hati-hati.

  • Confidence level lebih rendah (90%), Interval lebih sempit dan keputusan bisa diambil lebih cepat, namun risikonya lebih tinggi.

  • Confidence level (95%), Paling sering digunakan karena memberikan keseimbangan antara ketepatan dan tingkat keyakinan dalam A/B testing.

4 Case Study 4

Pada studi kasus ini, dua tim data mengukur latensi API (dalam milidetik) dengan kondisi berbeda.Kedua tim memiliki ukuran sampel dan rata-rata yang sama, tetapi informasi tentang standar deviasi berbeda, sehingga metode statistik yang digunakan juga berbeda.

Diketahui :

  1. Team A
  • \(n = 36\) → ukuran sampel

  • \(\bar{x} = 210\) → rata-rata sampel

  • \(\sigma = 24\) → standar deviasi populasi (diketahui)

  1. Team B
  • \(n = 36\) → ukuran sampel

  • \(\bar{x} = 210\) → rata-rata sampel

  • \(s = 24\) → standar deviasi sampel

JAWABAN :

4.1 Uji Statistik yang digunakan

  • Team A menggunakan Z-Test Karena standar deviasi populasi (𝜎) diketahui.

  • Team B menggunakan t-Test Karena standar deviasi populasi tidak diketahui dan hanya tersedia standar deviasi sampel (𝑠).

4.2 Confidence Interval (90%, 95%, 99%)

Rumus :

  • Z-Test (Team A)

\[\bar{x} \pm z_{\alpha/2}\left(\frac{\sigma}{\sqrt{n}}\right)\]

  • t-Test (Team B)

\[\bar{x} \pm t_{\alpha/2,\,n-1}\left(\frac{s}{\sqrt{n}}\right)\]

Perhitungan CI :

# Data Confidence Interval Team A (Z-Test)
teamA <- data.frame(
  Level = c("90%", "95%", "99%"),
  Lower = c(203.42, 202.16, 199.70),
  Upper = c(216.58, 217.84, 220.30)
)

knitr::kable(
  teamA,
  caption = "Confidence Interval Team A (Z-Test)"
)
Confidence Interval Team A (Z-Test)
Level Lower Upper
90% 203.42 216.58
95% 202.16 217.84
99% 199.70 220.30
# Data Confidence Interval Team B (t-Test)
teamB <- data.frame(
  Level = c("90%", "95%", "99%"),
  Lower = c(203.24, 201.88, 199.10),
  Upper = c(216.76, 218.12, 220.90)
)

knitr::kable(
  teamB,
  caption = "Confidence Interval Team B (t-Test)"
)
Confidence Interval Team B (t-Test)
Level Lower Upper
90% 203.24 216.76
95% 201.88 218.12
99% 199.10 220.90

4.3 Visualisasi Perbandingan Interval

library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.5.2
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(tidyr)

# 1. Menyiapkan Data Team A
teamA <- data.frame(
  Team = "Team A (Z-Test)",
  Level = c("90%", "95%", "99%"),
  Lower = c(203.42, 202.16, 199.70),
  Upper = c(216.58, 217.84, 220.30)
)

# 2. Menyiapkan Data Team B
teamB <- data.frame(
  Team = "Team B (t-Test)",
  Level = c("90%", "95%", "99%"),
  Lower = c(203.24, 201.88, 199.10),
  Upper = c(216.76, 218.12, 220.90)
)

# 3. Menggabungkan data
all_teams <- rbind(teamA, teamB)
all_teams$Level <- factor(all_teams$Level, levels = c("90%", "95%", "99%"))
mean_val <- 210

# 4. Membuat Plot Perbandingan
ggplot(all_teams, aes(x = Level, y = mean_val, color = Team)) +
  # Membuat garis interval
  geom_errorbar(aes(ymin = Lower, ymax = Upper), 
                width = 0.4, 
                size = 1.2, 
                position = position_dodge(width = 0.5)) +
  # Menambahkan titik rata-rata
  geom_point(position = position_dodge(width = 0.5), size = 3) +
  # Menambahkan label angka untuk Lower Bound
  geom_text(aes(y = Lower, label = Lower), 
            position = position_dodge(width = 1.2), 
            vjust = 1.5, size = 3, show.legend = FALSE) +
  # Menambahkan label angka untuk Upper Bound
  geom_text(aes(y = Upper, label = Upper), 
            position = position_dodge(width = 1.2), 
            vjust = -0.5, size = 3, show.legend = FALSE) +
  # Estetika Grafik
  coord_flip() +
  geom_hline(yintercept = mean_val, linetype = "dashed", color = "darkgrey") +
  scale_color_manual(values = c("Team A (Z-Test)" = "seagreen", 
                                "Team B (t-Test)" = "steelblue")) +
  labs(title = "Perbandingan Confidence Interval: Team A vs Team B",
       subtitle = "Z-Test vs t-Test pada API Latency",
       x = "Confidence Level",
       y = "API Latency (ms)") +
  theme_minimal() +
  theme(legend.position = "bottom")
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
## Warning: `position_dodge()` requires non-overlapping x intervals.
## `position_dodge()` requires non-overlapping x intervals.

Interpretasi:

  • Titik hitam yang berada tepat di tengah setiap garis horizontal menunjukkan nilai rata-rata sampel sebesar 210 ms. Posisi titik ini tidak berubah pada tingkat kepercayaan 90%, 95%, dan 99%, karena nilai rata-rata sampel yang digunakan dalam perhitungan sama untuk semua interval.

  • Garis horizontal Setiap garis horizontal merepresentasikan interval kepercayaan untuk rata-rata API latency pada tingkat kepercayaan tertentu.

a. Ujung kiri garis adalah batas bawah interval kepercayaan

b. Ujung kanan garis adalah batas atas interval kepercayaan

Semakin tinggi tingkat kepercayaan, garis horizontal terlihat semakin panjang, yang menunjukkan bahwa rentang nilai rata-rata populasi yang mungkin menjadi lebih lebar.

4.4 Penjelasan Mengapa Lebar Interval Berbeda

Walaupun rata-rata, ukuran sampel, dan nilai simpangan baku sama, lebar interval antara Team A dan Team B tetap berbeda karena:

  • Z-Test (Team A) menggunakan standar deviasi populasi yang pasti, sehingga intervalnya lebih sempit dan lebih presisi.

  • t-Test (Team B) memperhitungkan ketidakpastian karena standar deviasi populasi tidak diketahui, sehingga nilai kritis lebih besar dan interval menjadi lebih lebar.

  • Perbedaan ini paling terlihat pada tingkat kepercayaan tinggi (99%).

5 Case Study 5

Dalam perusahaan Software as a Service (SaaS), proporsi pengguna aktif yang memanfaatkan fitur premium merupakan indikator penting dalam mengevaluasi kinerja produk. Untuk memastikan apakah target penggunaan fitur premium telah tercapai, diperlukan analisis statistika yang tidak hanya bergantung pada data sampel, tetapi juga mempertimbangkan ketidakpastian estimasi.Pada studi kasus ini, perusahaan menargetkan minimal 70% pengguna aktif mingguan menggunakan fitur premium. Oleh karena itu, digunakan interval kepercayaan satu sisi (batas bawah) untuk proporsi guna menilai apakah target tersebut dapat dipenuhi secara statistik berdasarkan data yang tersedia.

Diketahui :

  • Jumlah total pengguna: \[ n = 250 \]

  • Jumlah pengguna premium aktif: \[ x = 185 \]

  • Proporsi sampel: \[ \hat{p} = \frac{x}{n} = \frac{185}{250} = 0{,}74 \]

5.1 Uji Sttisti yang di gunakan

  • Jenis interval: One-sided (lower) confidence interval untuk proporsi

  • Distribusi / uji statistik: Z-test (Normal approximation) untuk proporsi Digunakan karena:

b. 𝑛𝑝^ =1 85 ≥ 10

a. 𝑛(1−𝑝^) = 65 ≥ 10

5.2 Perhitungan Interval Kepercayaan (Batas Bawah)

rumus umum:

\[ \hat{p} - z_{\alpha}\sqrt{\frac{\hat{p}(1-\hat{p})}{n}} \]

hasil perhitungan :

Tingkat Kepercayaan Nilai (z_) Batas Bawah
90% 1,282 0,693
95% 1,645 0,680
99% 2,326 0,656

5.3 Visualisasi

# ===============================
# HITUNG + PLOT (DENGAN LABEL ANGKA)
# ===============================

# Data
n <- 250
x <- 185

# Proporsi sampel
p_hat <- x / n

# Standard error
SE <- sqrt(p_hat * (1 - p_hat) / n)

# Nilai Z one-sided
z_values <- c(
  "90%" = 1.282,
  "95%" = 1.645,
  "99%" = 2.326
)

# Batas bawah
lower_bounds <- p_hat - z_values * SE

# Plot Utama
plot(
  lower_bounds,
  type = "b",
  pch = 19,
  col = "deeppink",
  lwd = 2,
  xaxt = "n",
  ylim = c(0.6, 0.75),
  xlab = "Tingkat Kepercayaan",
  ylab = "Batas Bawah Interval Kepercayaan",
  main = "Batas Bawah Interval Kepercayaan Satu Sisi"
)

# Menambahkan Label Angka di setiap titik
# round(lower_bounds, 3) membulatkan angka menjadi 3 desimal agar rapi
# pos = 3 meletakkan teks di ATAS titik
text(
  x = 1:3, 
  y = lower_bounds, 
  labels = round(lower_bounds, 3), 
  pos = 3, 
  cex = 0.8, 
  col = "black"
)

# Menambahkan elemen tambahan
axis(1, at = 1:3, labels = names(z_values))
abline(h = 0.70, col = "purple", lty = 2, lwd = 2)

Interpretasi:

grafik menunjukkan hubungan antara tingkat kepercayaan dan nilai batas bawah pada interval kepercayaan satu sisi. Secara keseluruhan, terdapat tren penurunan nilai batas bawah seiring dengan meningkatnya tingkat kepercayaan dari \(90\%\) hingga \(99\%\). Hal ini terjadi karena dalam statistika, untuk mendapatkan tingkat keyakinan yang lebih tinggi bahwa parameter populasi berada dalam cakupan interval, maka rentang interval tersebut harus diperlebar.Dalam konteks interval satu sisi (batas bawah), pelebaran rentang dilakukan dengan menggeser batas bawah ke nilai yang lebih kecil atau lebih konservatif. Sebagai contoh, pada tingkat kepercayaan \(90\%\), titik berada di atas garis referensi ungu (\(0.70\)), namun pada tingkat \(99\%\), titik tersebut menurun signifikan mendekati angka \(0.68\). Dengan demikian, semakin tinggi kepastian yang diinginkan (\(99\%\)), maka nilai batas bawah yang dihasilkan akan semakin rendah untuk mengakomodasi margin kesalahan yang lebih kecil.

5.4 Apakah Target 70% Tercapai?

Confidence Level Lower Bound ≥ 70%?
90% 0,704 Ya
95% 0,694 Tidak
99% 0,676 Tidak

6 Referensi

  1. D’Agostino McGowan, L., & Wickham, H. (n.d.). Introductory Statistics. Bookdown.

  2. McGowan, Lucy D’Agostino, dan Hadley Wickham. n.d. Introductory Statistics. Bookdown.

  3. Bakti Siregar, M.Sc., CDS. (2024). Introduction to Statistics, Chapter 8 – Confidence Interval.