Statistical Inferences

Exercises ~ Week 14

Haura Azizah Achmad

NIM: 52250027

24 December 2025


1 Case Study 1

1.1 One-Sample Z-Test (Uji Z Satu Sampel)

Sebuah platform pembelajaran digital mengklaim bahwa rata-rata waktu belajar harian pengguna adalah 120 menit. Berdasarkan data historis, simpangan baku populasi diketahui sebesar 15 menit.

Dari sampel acak 64 pengguna, diperoleh rata-rata waktu belajar sebesar 116 menit.

Diketahui: \[ \mu_0 = 120, \quad \sigma = 15, \quad n = 64, \quad \bar{x} = 116 \]


1.2 Perumusan Hipotesis

Hipotesis nol dan alternatif dirumuskan sebagai berikut:

\[ \begin{aligned} H_0 &: \mu = 120 \\ H_1 &: \mu \neq 120 \end{aligned} \]


1.3 Uji Statistik yang Digunakan

Uji statistik yang digunakan adalah Uji Z Satu Sampel, dengan alasan: - Simpangan baku populasi (\(\sigma\)) diketahui
- Ukuran sampel besar (\(n \geq 30\))
- Data diasumsikan berdistribusi normal


1.4 Perhitungan Statistik Uji dan p-value

Rumus statistik uji Z:

\[ Z = \frac{\bar{x} - \mu_0}{\sigma / \sqrt{n}} \]

Substitusi nilai:

\[ Z = \frac{116 - 120}{15 / \sqrt{64}} = \frac{-4}{15/8} = \frac{-4}{1.875} = -2.13 \]

Nilai p-value untuk uji dua arah:

\[ p\text{-value} = 2P(Z < -2.13) \approx 0.033 \]

Dengan taraf signifikansi: \[ \alpha = 0.05 \]


1.5 Keputusan Statistik

Karena: \[ p\text{-value} = 0.033 < 0.05 \]

maka tolak hipotesis nol (\(H_0\)).


1.6 Interpretasi dalam Konteks Business Analytics

Hasil analisis menunjukkan bahwa rata-rata waktu belajar harian pengguna secara signifikan berbeda dari 120 menit. Dengan rata-rata sampel sebesar 116 menit, dapat disimpulkan bahwa pengguna belajar lebih singkat dari klaim perusahaan.

Bagi manajemen platform pembelajaran digital, hasil ini mengindikasikan perlunya: - Evaluasi efektivitas konten pembelajaran
- Peningkatan strategi user engagement
- Penyesuaian klaim berbasis data aktual pengguna


2 Case Study 2

2.1 One-Sample T-Test (Simpangan Baku Tidak Diketahui, Sampel Kecil)

Sebuah tim UX Research menyelidiki apakah rata-rata waktu penyelesaian tugas pada sebuah aplikasi baru berbeda dari 10 menit.

Data yang dikumpulkan dari 10 pengguna adalah sebagai berikut:

\[ 9.2,\; 10.5,\; 9.8,\; 10.1,\; 9.6,\; 10.3,\; 9.9,\; 9.7,\; 10.0,\; 9.5 \]


2.2 Perumusan Hipotesis (Uji Dua Arah)

Hipotesis statistik dirumuskan sebagai berikut:

\[ \begin{aligned} H_0 &: \mu = 10 \\ H_1 &: \mu \neq 10 \end{aligned} \]


2.3 Uji Statistik yang Digunakan

Uji statistik yang digunakan adalah Uji t Satu Sampel, dengan alasan: - Simpangan baku populasi tidak diketahui
- Ukuran sampel kecil (\(n < 30\))
- Data diasumsikan berdistribusi normal


2.4 Perhitungan Statistik Uji dan p-value

Rata-rata Sampel

\[ \bar{x} = \frac{9.2 + 10.5 + \cdots + 9.5}{10} = 9.86 \]

Simpangan Baku Sampel

\[ s = 0.39 \]

2.5 Statistik Uji t

Rumus statistik uji:

\[ t = \frac{\bar{x} - \mu_0}{s / \sqrt{n}} \]

Substitusi nilai:

\[ t = \frac{9.86 - 10}{0.39 / \sqrt{10}} = \frac{-0.14}{0.123} = -1.14 \]

Derajat kebebasan: \[ df = n - 1 = 9 \]

Nilai p-value (uji dua arah):

\[ p\text{-value} \approx 0.28 \]

Dengan taraf signifikansi: \[ \alpha = 0.05 \]


2.6 Keputusan Statistik

Karena: \[ p\text{-value} = 0.28 > 0.05 \]

maka gagal menolak hipotesis nol (\(H_0\)).


2.7 Pengaruh Ukuran Sampel terhadap Keandalan Inferensi

Ukuran sampel yang kecil menyebabkan: - Variabilitas estimasi lebih tinggi - Kekuatan uji statistik lebih rendah - Lebih sulit mendeteksi perbedaan yang kecil namun nyata

Dengan sampel yang lebih besar, estimasi rata-rata akan lebih stabil dan hasil inferensi statistik menjadi lebih andal.


3 Case Study 3

3.1 Two-Sample T-Test (A/B Testing)

Sebuah tim product analytics melakukan uji A/B untuk membandingkan rata-rata durasi sesi (menit) antara dua versi landing page.

Ringkasan data yang diperoleh adalah sebagai berikut:

Versi Ukuran Sampel (n) Rata-rata Simpangan Baku
A 25 4.8 1.2
B 25 5.4 1.4

3.2 Perumusan Hipotesis

Hipotesis statistik yang digunakan adalah uji dua arah:

\[ \begin{aligned} H_0 &: \mu_A = \mu_B \\ H_1 &: \mu_A \neq \mu_B \end{aligned} \]


3.3 Jenis Uji Statistik

*Uji statistik yang digunakan adalah Uji t Dua Sampel Independen (Independent Two-Sample t-Test), karena: - Dua sampel berasal dari kelompok yang berbeda (Versi A dan B) - Data berbentuk numerik (durasi sesi) - Simpangan baku populasi tidak diketahui - Ukuran sampel relatif kecil dan seimbang


3.4 Perhitungan Statistik Uji dan p-value

Statistik Uji t

Rumus statistik uji:

\[ t = \frac{\bar{x}_A - \bar{x}_B} {\sqrt{\frac{s_A^2}{n_A} + \frac{s_B^2}{n_B}}} \]

Substitusi nilai:

\[ t = \frac{4.8 - 5.4} {\sqrt{\frac{1.2^2}{25} + \frac{1.4^2}{25}}} \]

\[ t = \frac{-0.6} {\sqrt{0.0576 + 0.0784}} = \frac{-0.6}{0.369} = -1.63 \]

Derajat kebebasan (pendekatan):

\[ df \approx 48 \]

Nilai p-value (uji dua arah):

\[ p\text{-value} \approx 0.11 \]

Dengan taraf signifikansi: \[ \alpha = 0.05 \]


3.5 Keputusan Statistik

Karena: \[ p\text{-value} = 0.11 > 0.05 \]

maka gagal menolak hipotesis nol (\(H_0\)).


3.6 Interpretasi untuk Pengambilan Keputusan Produk

Hasil analisis menunjukkan bahwa tidak terdapat perbedaan yang signifikan secara statistik antara rata-rata durasi sesi pengguna pada Versi A dan Versi B.

Meskipun Versi B memiliki rata-rata durasi sesi yang lebih tinggi, perbedaan tersebut belum cukup kuat secara statistik untuk dijadikan dasar keputusan produk. Oleh karena itu, tim produk disarankan untuk:

  • Mengumpulkan data tambahan
  • Menguji metrik lain (misalnya konversi atau bounce rate)
  • Melakukan iterasi desain lanjutan sebelum implementasi penuh


4 Case Study 4

4.1 Chi-Square Test of Independence (Uji Chi-Kuadrat Independensi)

Sebuah perusahaan e-commerce ingin mengetahui apakah jenis perangkat yang digunakan pelanggan berhubungan dengan preferensi metode pembayaran.

Data yang diperoleh ditunjukkan pada tabel berikut:

Perangkat / Pembayaran E-Wallet Kartu Kredit Cash on Delivery
Mobile 120 80 50
Desktop 60 90 40

4.2 Perumusan Hipotesis

Hipotesis statistik dirumuskan sebagai berikut:

\[ \begin{aligned} H_0 &: \text{Jenis perangkat dan metode pembayaran saling independen} \\ H_1 &: \text{Jenis perangkat dan metode pembayaran tidak independen} \end{aligned} \]


4.3 Uji Statistik yang Digunakan

Uji statistik yang digunakan adalah Uji Chi-Kuadrat Independensi, karena:

  • Kedua variabel bersifat kategorik
  • Data disajikan dalam tabel kontingensi
  • Tujuan analisis adalah menguji hubungan/asosiasi antar variabel

4.4 Perhitungan Statistik Chi-Kuadrat

Total Baris, Kolom, dan Keseluruhan

Total keseluruhan pengamatan: \[ N = 120 + 80 + 50 + 60 + 90 + 40 = 440 \]

Total baris: \[ \text{Mobile} = 250, \quad \text{Desktop} = 190 \]

Total kolom: \[ \text{E-Wallet} = 180, \quad \text{Kartu Kredit} = 170, \quad \text{COD} = 90 \]


Frekuensi Harapan

Rumus frekuensi harapan:

\[ E_{ij} = \frac{(\text{Total Baris}_i)(\text{Total Kolom}_j)}{N} \]

Contoh perhitungan:

\[ E_{\text{Mobile, E-Wallet}} = \frac{250 \times 180}{440} = 102.27 \]

Dengan cara yang sama diperoleh seluruh nilai harapan.


Statistik Uji Chi-Kuadrat

Rumus statistik uji:

\[ \chi^2 = \sum \frac{(O - E)^2}{E} \]

Hasil perhitungan:

\[ \chi^2 \approx 12.47 \]

Derajat kebebasan: \[ df = (r - 1)(c - 1) = (2 - 1)(3 - 1) = 2 \]


4.5 Keputusan Statistik

Nilai p-value untuk \(\chi^2 = 12.47\) dengan \(df = 2\):

\[ p\text{-value} \approx 0.002 \]

Dengan taraf signifikansi: \[ \alpha = 0.05 \]

Karena: \[ p\text{-value} < 0.05 \]

maka tolak hipotesis nol (\(H_0\)).


4.6 Interpretasi dalam Strategi Pembayaran Digital

Hasil analisis menunjukkan bahwa jenis perangkat yang digunakan pelanggan berhubungan secara signifikan dengan preferensi metode pembayaran.

Implikasi bagi strategi e-commerce:

  • Pengguna mobile cenderung lebih memilih E-Wallet
  • Pengguna desktop relatif lebih banyak menggunakan kartu kredit
  • Perusahaan dapat mengoptimalkan tampilan dan promosi metode pembayaran berdasarkan perangkat pengguna
Pendekatan ini dapat meningkatkan kenyamanan pengguna dan tingkat konversi transaksi.


5 Case Study 5

5.1 Kesalahan Tipe I dan Tipe II (Konseptual)

Sebuah startup fintech menguji apakah algoritma deteksi penipuan (fraud detection) yang baru dapat mengurangi transaksi penipuan.

Hipotesis yang diuji adalah: \[ H_0 : \text{Algoritma baru tidak mengurangi penipuan} \] \[ H_1 : \text{Algoritma baru mengurangi penipuan} \]


5.2 Kesalahan Tipe I (\(\alpha\))

Kesalahan Tipe I terjadi ketika peneliti menolak hipotesis nol (\(H_0\)) padahal \(H_0\) benar.

Dalam konteks ini, Kesalahan Tipe I berarti perusahaan menyimpulkan bahwa algoritma baru berhasil mengurangi penipuan, padahal sebenarnya algoritma tersebut tidak memberikan pengaruh nyata.


5.3 Kesalahan Tipe II (\(\beta\))

Kesalahan Tipe II terjadi ketika peneliti gagal menolak hipotesis nol (\(H_0\)) padahal hipotesis alternatif (\(H_1\)) benar.

Dalam konteks ini, Kesalahan Tipe II berarti perusahaan menyimpulkan bahwa algoritma baru tidak efektif, padahal sebenarnya algoritma tersebut mampu mengurangi penipuan.


5.4 Kesalahan yang Lebih Mahal dari Perspektif Bisnis

Dari sudut pandang bisnis, Kesalahan Tipe II (\(\beta\)) biasanya lebih mahal.

Hal ini karena perusahaan kehilangan kesempatan untuk menggunakan algoritma yang sebenarnya efektif, sehingga potensi penghematan kerugian akibat penipuan menjadi tidak maksimal.


5.5 Pengaruh Ukuran Sampel terhadap Kesalahan Tipe II

Ukuran sampel memiliki hubungan terbalik dengan Kesalahan Tipe II.

Semakin besar ukuran sampel, maka: \[ \beta \downarrow \] artinya kemungkinan gagal mendeteksi efektivitas algoritma menjadi lebih kecil.

Sebaliknya, ukuran sampel yang kecil meningkatkan risiko Kesalahan Tipe II.


5.6 Hubungan antara \(\alpha\), \(\beta\), dan Statistical Power

Statistical power didefinisikan sebagai: \[ \text{Power} = 1 - \beta \]

Hubungan antar ketiganya adalah:

  • \(\alpha\) adalah probabilitas Kesalahan Tipe I
  • \(\beta\) adalah probabilitas Kesalahan Tipe II
  • Power menunjukkan kemampuan uji statistik untuk mendeteksi efek yang benar
Semakin kecil \(\beta\), maka power semakin besar, sehingga uji statistik semakin kuat dalam mendeteksi efektivitas algoritma.


6 Case Study 6

6.1 P-Value and Statistical Decision Making

Hasil evaluasi model churn prediction* adalah sebagai berikut:*

\[ \begin{aligned} \text{Test Statistic} &= -2.31 \\ \text{p-value} &= 0.021 \\ \alpha &= 0.05 \end{aligned} \]


6.2 Tasks

Makna p-value*

p-value adalah probabilitas untuk memperoleh nilai statistik uji yang sama ekstrem atau lebih ekstrem dari yang diamati, dengan asumsi bahwa hipotesis nol (\(H_0\)) benar.

Dalam kasus ini, nilai \(p = 0.021\) berarti terdapat peluang sebesar 2,1% untuk mendapatkan hasil seperti ini jika model sebenarnya tidak memiliki pengaruh terhadap prediksi churn.


6.3 Keputusan Statistik

Keputusan statistik ditentukan dengan membandingkan p-value* dengan tingkat signifikansi:*

\[ p = 0.021 < \alpha = 0.05 \]

Karena \(p < \alpha\), maka hipotesis nol ditolak. Artinya, hasil pengujian signifikan secara statistik.


6.4 Interpretasi Non-Teknis untuk Manajemen

Secara sederhana, hasil ini menunjukkan bahwa model prediksi churn bekerja dengan baik dan kemungkinan besar hasil yang diperoleh bukan terjadi secara kebetulan. Dengan tingkat keyakinan yang tinggi, model ini dapat dipertimbangkan untuk digunakan dalam pengambilan keputusan bisnis.


6.5 Risiko Jika Sampel Tidak Representatif

Jika sampel data tidak mewakili populasi sebenarnya, maka hasil analisis bisa menyesatkan. Model mungkin terlihat efektif secara statistik, tetapi performanya tidak akan konsisten ketika diterapkan pada data nyata di lapangan. Hal ini dapat menyebabkan keputusan bisnis yang keliru.


6.6 Mengapa p-value Tidak Mengukur Effect Size

p-value hanya menunjukkan ada atau tidaknya bukti statistik terhadap hipotesis nol, bukan seberapa besar pengaruhnya. Nilai p-value sangat dipengaruhi oleh ukuran sampel, sehingga efek yang kecil pun bisa terlihat signifikan jika jumlah data sangat besar. Oleh karena itu, pengukuran effect size tetap diperlukan untuk menilai kekuatan dampak sebenarnya.


7 Reference