NIM: 52250027
24 December 2025
Sebuah platform pembelajaran digital mengklaim bahwa rata-rata waktu belajar harian pengguna adalah 120 menit. Berdasarkan data historis, simpangan baku populasi diketahui sebesar 15 menit.
Dari sampel acak 64 pengguna, diperoleh rata-rata waktu belajar sebesar 116 menit.
Diketahui: \[ \mu_0 = 120, \quad \sigma = 15, \quad n = 64, \quad \bar{x} = 116 \]
Hipotesis nol dan alternatif dirumuskan sebagai berikut:
\[ \begin{aligned} H_0 &: \mu = 120 \\ H_1 &: \mu \neq 120 \end{aligned} \]
Uji statistik yang digunakan adalah Uji Z Satu
Sampel, dengan alasan: - Simpangan baku populasi
(\(\sigma\)) diketahui
- Ukuran sampel besar (\(n \geq
30\))
- Data diasumsikan berdistribusi normal
Rumus statistik uji Z:
\[ Z = \frac{\bar{x} - \mu_0}{\sigma / \sqrt{n}} \]
Substitusi nilai:
\[ Z = \frac{116 - 120}{15 / \sqrt{64}} = \frac{-4}{15/8} = \frac{-4}{1.875} = -2.13 \]
Nilai p-value untuk uji dua arah:
\[ p\text{-value} = 2P(Z < -2.13) \approx 0.033 \]
Dengan taraf signifikansi: \[ \alpha = 0.05 \]
Karena: \[ p\text{-value} = 0.033 < 0.05 \]
maka tolak hipotesis nol (\(H_0\)).
Hasil analisis menunjukkan bahwa rata-rata waktu belajar harian pengguna secara signifikan berbeda dari 120 menit. Dengan rata-rata sampel sebesar 116 menit, dapat disimpulkan bahwa pengguna belajar lebih singkat dari klaim perusahaan.
Bagi manajemen platform pembelajaran digital, hasil ini
mengindikasikan perlunya: - Evaluasi efektivitas konten
pembelajaran
- Peningkatan strategi user engagement
- Penyesuaian klaim berbasis data aktual pengguna
Sebuah tim UX Research menyelidiki apakah rata-rata waktu penyelesaian tugas pada sebuah aplikasi baru berbeda dari 10 menit.
Data yang dikumpulkan dari 10 pengguna adalah sebagai berikut:
\[ 9.2,\; 10.5,\; 9.8,\; 10.1,\; 9.6,\; 10.3,\; 9.9,\; 9.7,\; 10.0,\; 9.5 \]
Hipotesis statistik dirumuskan sebagai berikut:
\[ \begin{aligned} H_0 &: \mu = 10 \\ H_1 &: \mu \neq 10 \end{aligned} \]
Uji statistik yang digunakan adalah Uji t Satu
Sampel, dengan alasan: - Simpangan baku populasi tidak
diketahui
- Ukuran sampel kecil (\(n
< 30\))
- Data diasumsikan berdistribusi normal
Rata-rata Sampel
\[ \bar{x} = \frac{9.2 + 10.5 + \cdots + 9.5}{10} = 9.86 \]
Simpangan Baku Sampel
\[ s = 0.39 \]
Rumus statistik uji:
\[ t = \frac{\bar{x} - \mu_0}{s / \sqrt{n}} \]
Substitusi nilai:
\[ t = \frac{9.86 - 10}{0.39 / \sqrt{10}} = \frac{-0.14}{0.123} = -1.14 \]
Derajat kebebasan: \[ df = n - 1 = 9 \]
Nilai p-value (uji dua arah):
\[ p\text{-value} \approx 0.28 \]
Dengan taraf signifikansi: \[ \alpha = 0.05 \]
Karena: \[ p\text{-value} = 0.28 > 0.05 \]
maka gagal menolak hipotesis nol (\(H_0\)).
Ukuran sampel yang kecil menyebabkan: - Variabilitas estimasi lebih tinggi - Kekuatan uji statistik lebih rendah - Lebih sulit mendeteksi perbedaan yang kecil namun nyata
Dengan sampel yang lebih besar, estimasi rata-rata akan lebih stabil dan hasil inferensi statistik menjadi lebih andal.
Sebuah tim product analytics melakukan uji A/B untuk membandingkan rata-rata durasi sesi (menit) antara dua versi landing page.
Ringkasan data yang diperoleh adalah sebagai berikut:
| Versi | Ukuran Sampel (n) | Rata-rata | Simpangan Baku |
|---|---|---|---|
| A | 25 | 4.8 | 1.2 |
| B | 25 | 5.4 | 1.4 |
Hipotesis statistik yang digunakan adalah uji dua arah:
\[ \begin{aligned} H_0 &: \mu_A = \mu_B \\ H_1 &: \mu_A \neq \mu_B \end{aligned} \]
*Uji statistik yang digunakan adalah Uji t Dua Sampel Independen (Independent Two-Sample t-Test), karena: - Dua sampel berasal dari kelompok yang berbeda (Versi A dan B) - Data berbentuk numerik (durasi sesi) - Simpangan baku populasi tidak diketahui - Ukuran sampel relatif kecil dan seimbang
Statistik Uji t
Rumus statistik uji:
\[ t = \frac{\bar{x}_A - \bar{x}_B} {\sqrt{\frac{s_A^2}{n_A} + \frac{s_B^2}{n_B}}} \]
Substitusi nilai:
\[ t = \frac{4.8 - 5.4} {\sqrt{\frac{1.2^2}{25} + \frac{1.4^2}{25}}} \]
\[ t = \frac{-0.6} {\sqrt{0.0576 + 0.0784}} = \frac{-0.6}{0.369} = -1.63 \]
Derajat kebebasan (pendekatan):
\[ df \approx 48 \]
Nilai p-value (uji dua arah):
\[ p\text{-value} \approx 0.11 \]
Dengan taraf signifikansi: \[ \alpha = 0.05 \]
Karena: \[ p\text{-value} = 0.11 > 0.05 \]
maka gagal menolak hipotesis nol (\(H_0\)).
Hasil analisis menunjukkan bahwa tidak terdapat perbedaan yang signifikan secara statistik antara rata-rata durasi sesi pengguna pada Versi A dan Versi B.
Meskipun Versi B memiliki rata-rata durasi sesi yang lebih tinggi, perbedaan tersebut belum cukup kuat secara statistik untuk dijadikan dasar keputusan produk. Oleh karena itu, tim produk disarankan untuk:
Sebuah perusahaan e-commerce ingin mengetahui apakah jenis perangkat yang digunakan pelanggan berhubungan dengan preferensi metode pembayaran.
Data yang diperoleh ditunjukkan pada tabel berikut:
| Perangkat / Pembayaran | E-Wallet | Kartu Kredit | Cash on Delivery |
|---|---|---|---|
| Mobile | 120 | 80 | 50 |
| Desktop | 60 | 90 | 40 |
Hipotesis statistik dirumuskan sebagai berikut:
\[ \begin{aligned} H_0 &: \text{Jenis perangkat dan metode pembayaran saling independen} \\ H_1 &: \text{Jenis perangkat dan metode pembayaran tidak independen} \end{aligned} \]
Uji statistik yang digunakan adalah Uji Chi-Kuadrat Independensi, karena:
Total Baris, Kolom, dan Keseluruhan
Total keseluruhan pengamatan: \[ N = 120 + 80 + 50 + 60 + 90 + 40 = 440 \]
Total baris: \[ \text{Mobile} = 250, \quad \text{Desktop} = 190 \]
Total kolom: \[ \text{E-Wallet} = 180, \quad \text{Kartu Kredit} = 170, \quad \text{COD} = 90 \]
Frekuensi Harapan
Rumus frekuensi harapan:
\[ E_{ij} = \frac{(\text{Total Baris}_i)(\text{Total Kolom}_j)}{N} \]
Contoh perhitungan:
\[ E_{\text{Mobile, E-Wallet}} = \frac{250 \times 180}{440} = 102.27 \]
Dengan cara yang sama diperoleh seluruh nilai harapan.
Statistik Uji Chi-Kuadrat
Rumus statistik uji:
\[ \chi^2 = \sum \frac{(O - E)^2}{E} \]
Hasil perhitungan:
\[ \chi^2 \approx 12.47 \]
Derajat kebebasan: \[ df = (r - 1)(c - 1) = (2 - 1)(3 - 1) = 2 \]
Nilai p-value untuk \(\chi^2 = 12.47\) dengan \(df = 2\):
\[ p\text{-value} \approx 0.002 \]
Dengan taraf signifikansi: \[ \alpha = 0.05 \]
Karena: \[ p\text{-value} < 0.05 \]
maka tolak hipotesis nol (\(H_0\)).
Hasil analisis menunjukkan bahwa jenis perangkat yang digunakan pelanggan berhubungan secara signifikan dengan preferensi metode pembayaran.
Implikasi bagi strategi e-commerce:
Sebuah startup fintech menguji apakah algoritma deteksi penipuan (fraud detection) yang baru dapat mengurangi transaksi penipuan.
Hipotesis yang diuji adalah: \[ H_0 : \text{Algoritma baru tidak mengurangi penipuan} \] \[ H_1 : \text{Algoritma baru mengurangi penipuan} \]
Kesalahan Tipe I terjadi ketika peneliti menolak hipotesis nol (\(H_0\)) padahal \(H_0\) benar.
Dalam konteks ini, Kesalahan Tipe I berarti perusahaan menyimpulkan bahwa algoritma baru berhasil mengurangi penipuan, padahal sebenarnya algoritma tersebut tidak memberikan pengaruh nyata.
Kesalahan Tipe II terjadi ketika peneliti gagal menolak hipotesis nol (\(H_0\)) padahal hipotesis alternatif (\(H_1\)) benar.
Dalam konteks ini, Kesalahan Tipe II berarti perusahaan menyimpulkan bahwa algoritma baru tidak efektif, padahal sebenarnya algoritma tersebut mampu mengurangi penipuan.
Dari sudut pandang bisnis, Kesalahan Tipe II (\(\beta\)) biasanya lebih mahal.
Hal ini karena perusahaan kehilangan kesempatan untuk menggunakan algoritma yang sebenarnya efektif, sehingga potensi penghematan kerugian akibat penipuan menjadi tidak maksimal.
Ukuran sampel memiliki hubungan terbalik dengan Kesalahan Tipe II.
Semakin besar ukuran sampel, maka: \[ \beta \downarrow \] artinya kemungkinan gagal mendeteksi efektivitas algoritma menjadi lebih kecil.
Sebaliknya, ukuran sampel yang kecil meningkatkan risiko Kesalahan Tipe II.
Statistical power didefinisikan sebagai: \[ \text{Power} = 1 - \beta \]
Hubungan antar ketiganya adalah:
Hasil evaluasi model churn prediction* adalah sebagai berikut:*
\[ \begin{aligned} \text{Test Statistic} &= -2.31 \\ \text{p-value} &= 0.021 \\ \alpha &= 0.05 \end{aligned} \]
Makna p-value*
p-value adalah probabilitas untuk memperoleh nilai statistik uji yang sama ekstrem atau lebih ekstrem dari yang diamati, dengan asumsi bahwa hipotesis nol (\(H_0\)) benar.
Dalam kasus ini, nilai \(p = 0.021\) berarti terdapat peluang sebesar 2,1% untuk mendapatkan hasil seperti ini jika model sebenarnya tidak memiliki pengaruh terhadap prediksi churn.
Keputusan statistik ditentukan dengan membandingkan p-value* dengan tingkat signifikansi:*
\[ p = 0.021 < \alpha = 0.05 \]
Karena \(p < \alpha\), maka hipotesis nol ditolak. Artinya, hasil pengujian signifikan secara statistik.
Secara sederhana, hasil ini menunjukkan bahwa model prediksi churn bekerja dengan baik dan kemungkinan besar hasil yang diperoleh bukan terjadi secara kebetulan. Dengan tingkat keyakinan yang tinggi, model ini dapat dipertimbangkan untuk digunakan dalam pengambilan keputusan bisnis.
Jika sampel data tidak mewakili populasi sebenarnya, maka hasil analisis bisa menyesatkan. Model mungkin terlihat efektif secara statistik, tetapi performanya tidak akan konsisten ketika diterapkan pada data nyata di lapangan. Hal ini dapat menyebabkan keputusan bisnis yang keliru.