Study Cases

Statistical Inferences ~ Week 14 ~

Jihan Ramadhani Deandri
Data Science undergraduate student

R Programming Data Science Statistics

1 Case Study 1

1.1 One-Sample Z-Test (Statistical Hypotheses)

Sebuah digital learning platform mengklaim bahwa rata-rata waktu belajar harian penggunanya adalah 120 menit. Berdasarkan data historis, standar deviasi populasi diketahui sebesar 15 menit, sehingga variasi waktu belajar pengguna telah diketahui dengan baik.

Untuk memverifikasi klaim tersebut, diambil sampel acak sebanyak 64 pengguna, dan diperoleh rata-rata waktu belajar sampel sebesar 116 menit. Dengan menggunakan taraf signifikansi sebesar 5% (𝛼= 0.05 α = 0.05), akan dilakukan pengujian hipotesis statistik untuk menentukan apakah terdapat perbedaan yang signifikan antara rata-rata waktu belajar pengguna dalam sampel dan rata-rata yang diklaim oleh platform.

Diketahui :

\[ \begin{aligned} \mu_0 &= 120 \quad &\rightarrow\quad &\text{rata-rata populasi} \\ \sigma &= 15 \quad &\rightarrow\quad &\text{standar deviasi populasi} \\ n &= 64 \quad &\rightarrow\quad &\text{ukuran sampel} \\ \bar{x} &= 116 \quad &\rightarrow\quad &\text{rata-rata sampel} \\ \alpha &= 0.05 \quad &\rightarrow\quad &\text{taraf signifikansi} \end{aligned} \]

1.2 Taks

JAWABAN :

1.2.1 Formulasi Hipotesis yang diuji

Hipotesisi yang di uji adalah rata-rata waktu belajar pengguna berbeda dari 120 menit.

\[ \begin{aligned} H_0 &: \mu = 120 \\ H_1 &: \mu \neq 120 \end{aligned} \]

1.2.2 Uji Statistik yang digunakan

uji statistik yang tepat adalah One-Sample Z-Test, karena:

  • Standar deviasi populasi (𝜎) diketahui

  • Ukuran sampel cukup besar (𝑛= 64 ≥ 30)

  • Tujuan pengujian adalah membandingkan rata-rata sampel dengan rata-rata populasi

1.2.3 Perhitungan Statistik Uji dan p-value

  • Rumus Statistik Uji Z \[Z = \frac{\bar{x} - \mu_0}{\sigma / \sqrt{n}}\]

  • Perhitungan Statistik Uji \[ \begin{aligned} Z &= \frac{116 - 120}{15 / \sqrt{64}} = \frac{-4}{1.875} = -2.13 \end{aligned} \]

  • p-value (Uji Dua Sisi) \[ \text{p-value} = 2 \times P(Z < -2.13) \approx 0.033 \]

1.2.4 Keputusan Statistik

Karena:

\[ \text{p-value} = 0.033 \;<\; \alpha = 0.05 \;\;\Rightarrow\;\; \text{Tolak } H_0 \]

Artinya, terdapat perbedaan yang signifikan secara statistik antara rata-rata waktu belajar pengguna dan klaim 120 menit.

1.2.5 Interpretasi dalam Konteks Business Analytics

Berdasarkan hasil uji statistik, rata-rata waktu belajar harian pengguna secara signifikan lebih rendah dari 120 menit, sehingga klaim platform mengenai rata-rata waktu belajar tersebut tidak didukung oleh data sampel pada taraf signifikansi 5%. Temuan ini mengindikasikan adanya kesenjangan antara target atau ekspektasi perusahaan dan perilaku aktual pengguna. Dalam konteks bisnis, perusahaan perlu melakukan evaluasi menyeluruh terhadap efektivitas konten pembelajaran, tingkat keterlibatan (engagement) pengguna, serta desain pengalaman belajar yang dapat memengaruhi durasi belajar harian. Informasi ini penting sebagai dasar pengambilan keputusan strategis, khususnya dalam merancang inisiatif peningkatan engagement dan retensi pengguna yang lebih selaras dengan pola penggunaan nyata di lapangan.

2 Case Study 2

2.1 One-Sample T-Test (σ Unknown, Small Sample)

UX Research Team ingin mengetahui apakah rata-rata waktu yang dibutuhkan pengguna untuk menyelesaikan tugas pada aplikasi baru berbeda dari 10 menit. Untuk itu, data waktu penyelesaian tugas dikumpulkan dari 10 pengguna, lalu dianalisis secara statistik karena jumlah sampel terbatas dan simpangan baku populasi tidak diketahui.Waktu penyelesaian tugas (menit) dari 10 pengguna:

data -> (9.2, 10.5, 9.8, 10.1, 9.6, 10.3, 9.9, 9.7, 10.0, 9.5)

2.2 Taks

JAWABAN :

2.2.1 Definisi Hipotesis (Two-Tailed)

Karena ingin mengetahui apakah rata-rata berbeda dari 10 menit, maka digunakan uji dua arah.

\[\begin{aligned} H_0 &: \mu = 10 \quad \text{(rata-rata waktu = 10 menit)} \\ H_1 &: \mu \neq 10 \quad \text{(rata-rata waktu ≠ 10 menit)} \end{aligned}\]

2.2.2 Menentukan Uji Hipotesis yang Tepat

  • Ukuran sampel kecil (𝑛 = 10)

  • Simpangan baku populasi tidak diketahui

  • Menguji rata-rata satu sampel terhadap nilai tertentu

Uji yang tepat, One-Sample t-Test

2.2.3 Menghitung t-statistic dan p-value (α = 0.05)

# Data
waktu <- c(9.2, 10.5, 9.8, 10.1, 9.6, 10.3, 9.9, 9.7, 10.0, 9.5)

# Parameter
mu0 <- 10
n <- length(waktu)

# Statistik
x_bar <- mean(waktu)
s <- sd(waktu)
t_stat <- (x_bar - mu0) / (s / sqrt(n))
p_value <- 2 * pt(abs(t_stat), df = n - 1, lower.tail = FALSE)

# Tabel hasil perhitungan
hasil <- data.frame(
  Komponen = c("Jumlah Sampel (n)",
               "Rata-rata Sampel (x̄)",
               "Standar Deviasi Sampel (s)",
               "Nilai Hipotesis (μ₀)",
               "t-statistic",
               "p-value (two-tailed)"),
  Nilai = c(n,
            round(x_bar, 4),
            round(s, 4),
            mu0,
            round(t_stat, 4),
            round(p_value, 4))
)

# Tampilkan tabel rapi
knitr::kable(
  hasil,
  align = c("l", "c")
)
Komponen Nilai
Jumlah Sampel (n) 10.0000
Rata-rata Sampel (x̄) 9.8600
Standar Deviasi Sampel (s) 0.3864
Nilai Hipotesis (μ₀) 10.0000
t-statistic -1.1456
p-value (two-tailed) 0.2815

2.2.4 Keputusan Statistik

# Tabel kriteria keputusan
kriteria <- data.frame(
  Kondisi = c("p-value < 0.05", "p-value ≥ 0.05"),
  Keputusan = c("Tolak H₀", "Gagal menolak H₀")
)

knitr::kable(
  kriteria,
  caption = "Kriteria Keputusan Uji Hipotesis",
  align = c("c", "c")
)
Kriteria Keputusan Uji Hipotesis
Kondisi Keputusan
p-value < 0.05 Tolak H₀
p-value ≥ 0.05 Gagal menolak H₀

2.2.5 Pengaruh Ukuran Sampel terhadap Reliabilitas Inferensi

  • Sampel kecil → standar error lebih besar

  • Variabilitas estimasi lebih tinggi

  • Daya uji (power) lebih rendah, sehingga sulit mendeteksi perbedaan kecil

  • Interval kepercayaan menjadi lebih lebar

3 Case Study 3

3.1 Two-Sample T-Test (A/B Testing)

Dalam analisis produk digital, A/B testing sering digunakan untuk membandingkan dua versi halaman (misalnya landing page) guna melihat mana yang memberikan performa lebih baik. Pada soal ini, tim product analytics ingin mengetahui apakah rata-rata durasi sesi pengguna pada Versi A dan Versi B berbeda secara signifikan. Karena yang dibandingkan adalah rata-rata dua kelompok independen, maka metode statistik yang tepat adalah Two-Sample T-Test.

Diketahui :

Versi Sampel (n) Rata-rata (menit) Standar Deviasi
A 25 4.8 1.2
B 25 5.4 1.4

3.2 Taks

JAWABAN :

3.2.1 Merumuskan Hipotesis

Karena ingin membandingkan apakah rata-rata berbeda, maka digunakan uji dua arah.

  • Hipotesis nol (H₀) :

\[\alpha = 0.05\]

  • Hipotesis alternatif (H₁):

\[H_1 : \mu_A \neq \mu_B\]

3.2.2 Jenis Uji t yang Digunakan

  • Dua kelompok independen

  • Data berbentuk rata-rata

  • Ukuran sampel kecil (n < 30)

3. Menghitung Statistik Uji dan p-value

  • Rumus t-Statistic

\[ t = \frac{\bar{x}_A - \bar{x}_B} {\sqrt{\frac{s_A^2}{n_A} + \frac{s_B^2}{n_B}}} \]

  • Subtitusi nilai

\[ t = \frac{4.8 - 5.4} {\sqrt{\frac{1.2^2}{25} + \frac{1.4^2}{25}}} \]

  • Perhitungan bertahap

\[t = \frac{-0.6}{\sqrt{0.0576 + 0.0784}}\]

\[t = \frac{-0.6}{\sqrt{0.136}}\]

\[t = \frac{-0.6}{0.369} \approx -1.63\]

  • P-value

\[t \approx -1.63\]

4. Keputusan Statistik (α = 0.05)

  • p-value = 0.11

  • α = 0.05

Karena: \[\text{p-value} > \alpha\]

Gagal menolak H₀

3.2.3 Interpretasi untuk Pengambilan Keputusan Produk

Hasil uji statistik menunjukkan bahwa p-value (0.11) lebih besar dari tingkat signifikansi α=0.05, sehingga tidak terdapat bukti yang cukup untuk menyatakan adanya perbedaan rata-rata durasi sesi pengguna antara Versi A dan Versi B. Perbedaan rata-rata yang terlihat pada data tidak signifikan secara statistik dan kemungkinan disebabkan oleh variasi acak.

Dalam konteks produk, hal ini berarti Versi b belum dapat dibuktikan lebih baik daripada Versi a dalam meningkatkan durasi sesi pengguna. Oleh karena itu, tim produk sebaiknya tidak mengambil keputusan perubahan berdasarkan hasil ini saja dan perlu mempertimbangkan pengumpulan data tambahan atau metrik lain sebelum menentukan strategi selanjutnya.

4 Case Study 4

4.1 Chi-Square Test of Independence

Dalam bisnis e-commerce, memahami perilaku pengguna sangat penting untuk menentukan strategi pembayaran yang tepat. Salah satu hal yang ingin diketahui perusahaan adalah apakah jenis perangkat yang digunakan pelanggan (mobile atau desktop) memiliki hubungan dengan metode pembayaran yang dipilih.Untuk menjawab pertanyaan tersebut, digunakan Chi-Square Test of Independence, yaitu uji statistik yang bertujuan untuk mengetahui apakah dua variabel kategori saling berhubungan atau tidak.

Diketahui :

Device / Payment E-Wallet Credit Card Cash on Delivery
Mobile 120 80 50
Desktop 60 90 40
  • Total keseluruhan observasi:

\[120 + 80 + 50 + 60 + 90 + 40 = 440\]

4.2 Taks

JAWABAN :

4.2.1 Hipotesis Nol dan Hipotesis Alternatif

  • Hipotesis nol (H₀): Tidak terdapat hubungan antara jenis perangkat (mobile atau desktop) dan metode pembayaran yang dipilih oleh pelanggan.

  • Hipotesis alternatif (H₁): Terdapat hubungan antara jenis perangkat (mobile atau desktop) dan metode pembayaran yang dipilih oleh pelanggan.

4.2.2 Jenis Uji Statistik yang Digunakan

Uji statistik yang tepat adalah Chi-Square Test of Independence, karena:

  • Data berbentuk kategori

  • Ingin menguji hubungan antara dua variabel

  • Disajikan dalam tabel kontingensi

4.2.3 Menghitung Statistik Chi-Square (χ²)

1. Langkah pertama: Hitung total baris dan kolom

  • Total Mobile = 120 + 80 + 50 = 250

  • Total Desktop = 60 + 90 + 40 = 190

  • Total E-Wallet = 180

  • Total Credit Card = 170

  • Total COD = 90

Total keseluruhan = 440

2. Langkah : Hitung Nilai Harapan (Expected Value)

Rumus Nilai Harapan :

\[ E = \frac{(\text{Total Baris}) \times (\text{Total Kolom})} {\text{Total Keseluruhan}} \]

Contoh:

  • Mobile – E-Wallet

\[ E = \frac{250 \times 180}{440} = 102.27 \]

  • Nilai Chi-Square dihitung menggunakan rumus :

\[ \chi^2 = \sum \frac{(O - E)^2}{E} \] di mana 𝑂 adalah frekuensi observasi dan 𝐸 adalah nilai harapan.

\[ \chi^2 \approx 12.43 \]

4.2.4 Menentukan p-value (α = 0.05)

  • Derajat kebebasan : \[(df) = (2 - 1)(3 - 1) = 2\]

  • Statistik Uji \[\chi^2 \approx 12.43\]

\[df = 2\]

  • p-value dan Keputusan \[\text{p-value} < 0.05\]

\[\text{keputusan: tolak } H_0\]

4.2.5 Interpretasi dalam Konteks Strategi Pembayaran Digital

Hasil uji Chi-Square menunjukkan bahwa terdapat hubungan yang signifikan antara jenis perangkat yang digunakan pelanggan dan metode pembayaran yang mereka pilih. Artinya, preferensi metode pembayaran tidak bersifat acak, tetapi dipengaruhi oleh apakah pengguna berbelanja melalui mobile atau desktop.

Dalam konteks strategi pembayaran digital, perusahaan e-commerce sebaiknya menyesuaikan penawaran dan tampilan metode pembayaran berdasarkan perangkat pengguna. Misalnya, optimalisasi e-wallet pada platform mobile dan peningkatan kemudahan pembayaran kartu kredit pada desktop dapat meningkatkan pengalaman pengguna dan potensi transaksi yang berhasil.

5 Case Study 5

5.1 Type I and Type II Errors (Conceptual)

Dalam analisis statistik, pengujian hipotesis digunakan untuk membantu pengambilan keputusan berbasis data. Pada studi kasus ini, sebuah startup fintech ingin menguji apakah algoritma baru pendeteksi fraud benar-benar mampu mengurangi transaksi penipuan.Untuk itu, digunakan pengujian hipotesis dengan dua kemungkinan kesalahan, yaitu Type I Error dan Type II Error. Memahami kedua jenis kesalahan ini sangat penting karena masing-masing memiliki dampak bisnis yang berbeda. Hipotesis yang digunakan adalah:

  • H₀ (Hipotesis Nol): Algoritma baru tidak mengurangi fraud
  • H₁ (Hipotesis Alternatif): Algoritma baru mengurangi fraud

5.2 Taks

JAWABAN :

5.2.1 Type I Error (α)

Type I Error terjadi ketika kita menolak H₀ padahal H₀ sebenarnya benar. Dalam konteks studi kasus ini, Type I Error berarti perusahaan menyimpulkan bahwa algoritma baru berhasil mengurangi fraud, padahal sebenarnya algoritma tersebut tidak memberikan pengaruh yang nyata. Akibatnya, perusahaan bisa mengadopsi algoritma baru yang sebenarnya tidak efektif dan mengeluarkan biaya serta sumber daya tanpa manfaat yang sepadan.

5.2.2 Type II Error (β)

Type II Error terjadi ketika kita gagal menolak H₀ padahal H₁ sebenarnya benar. Dalam studi kasus ini, Type II Error berarti perusahaan menyimpulkan bahwa algoritma baru tidak mampu mengurangi fraud, padahal sebenarnya algoritma tersebut efektif. Kesalahan ini menyebabkan perusahaan melewatkan peluang untuk menurunkan tingkat penipuan dan meningkatkan keamanan transaksi.

5.2.3 Error yang Lebih Mahal dari Perspektif Bisnis

Dari sudut pandang bisnis, Type II Error umumnya lebih mahal. Hal ini karena kegagalan mendeteksi algoritma yang efektif membuat fraud terus terjadi, sehingga menimbulkan kerugian finansial dan dapat menurunkan kepercayaan pengguna. Meskipun Type I Error juga berisiko, dampak jangka panjang Type II Error biasanya lebih merugikan.

5.2.4 Pengaruh Ukuran Sampel terhadap Type II Error

Ukuran sampel sangat memengaruhi kemungkinan terjadinya Type II Error. Jika ukuran sampel terlalu kecil, maka kemampuan untuk mendeteksi efektivitas algoritma menjadi rendah, sehingga peluang Type II Error meningkat. Sebaliknya, dengan ukuran sampel yang lebih besar, efek algoritma lebih mudah terdeteksi dan kemungkinan Type II Error menjadi lebih kecil.

5.2.5 Hubungan antara α, β, dan Statistical Power

Nilai α menunjukkan peluang terjadinya Type I Error, sedangkan β menunjukkan peluang terjadinya Type II Error. Statistical power adalah kemampuan pengujian untuk mendeteksi efek yang benar-benar ada, dan nilainya sama dengan 1 − β. Semakin kecil nilai β, maka semakin besar statistical power. Untuk menjaga α tetap rendah dan power tetap tinggi, diperlukan ukuran sampel yang memadai.

6 Case Study 6

6.1 P-Value and Statistical Decision Making

Dalam analisis statistik, p-value digunakan untuk membantu menentukan apakah suatu hasil pengujian cukup kuat untuk mendukung pengambilan keputusan. Pada studi kasus ini, sebuah model prediksi churn dievaluasi untuk melihat apakah hasil yang diperoleh benar-benar signifikan atau hanya terjadi secara kebetulan. Dengan membandingkan nilai p-value dan tingkat signifikansi (α), perusahaan dapat menentukan apakah model tersebut layak digunakan sebagai dasar pengambilan keputusan bisnis.

Diketahui hasil evaluasi model sebagai berikut :

  • Test statistic = 2,31

  • p-value = 0,021

  • Tingkat signifikansi (α) = 0,05

6.2 Taks

JAWABAN :

6.2.1 Makna p-value

P-value menunjukkan peluang memperoleh hasil seperti yang diamati jika hipotesis nol benar. Dalam kasus ini, p-value sebesar 0,021 berarti terdapat kemungkinan 2,1% bahwa hasil evaluasi model churn terjadi secara kebetulan. Nilai p-value yang kecil menunjukkan adanya bukti yang cukup kuat terhadap hipotesis nol.

6.2.2 Keputusan statistik

Keputusan statistik dibuat dengan membandingkan p-value dengan tingkat signifikansi α. Karena p-value (0,021) lebih kecil dari α (0,05), maka hipotesis nol ditolak. Hal ini berarti hasil evaluasi model churn signifikan secara statistik.

6.2.3 Penjelasan non-teknis untuk manajemen

Dalam bahasa yang lebih sederhana, hasil ini menunjukkan bahwa model prediksi churn yang diuji kemungkinan besar memang memberikan hasil yang nyata, bukan sekadar kebetulan. Oleh karena itu, model ini dapat dipertimbangkan untuk digunakan dalam mendukung keputusan bisnis.

6.2.4 Risiko jika sampel tidak representatif

Jika data yang digunakan dalam pengujian tidak mewakili kondisi pelanggan secara keseluruhan, maka hasil evaluasi bisa menjadi tidak akurat. Model yang terlihat efektif pada sampel tertentu belum tentu bekerja dengan baik saat diterapkan pada seluruh pelanggan, sehingga berisiko menghasilkan keputusan bisnis yang keliru.

6.2.5 Alasan p-value tidak mengukur effect size

P-value hanya menunjukkan apakah suatu hasil signifikan secara statistik, tetapi tidak menunjukkan seberapa besar pengaruh atau dampak model. Nilai p-value yang kecil bisa muncul meskipun pengaruhnya kecil, terutama jika ukuran sampel besar. Oleh karena itu, p-value perlu dilengkapi dengan ukuran lain seperti Cohen’s d atau Odds Ratio untuk menilai seberapa besar dampak nyata model churn tersebut terhadap pengurangan kehilangan pelanggan.

7 Referensi

  • Ismay, C., & Kim, A. Y. (2019). Sampling distributions and confidence intervals. In Statistical Inference via Data Science: A ModernDive into R and the Tidyverse.

  • Navarro, D. J. (2015). Estimating unknown quantities from a sample. In Learning Statistics with R: A tutorial for psychology students and other beginners

  • Diez, D. M., Cetinkaya-Rundel, M., & Barr, C. D. (2019). Foundations for inference. In OpenIntro Statistics (4th ed.). OpenIntro, Ltd.