Study Cases
Statistical Inferences ~ Week 14 ~
Naychila Adelia Zahrah
Data Science Undergraduate Student
R Programming Data Science Statistics
1 Study Kasus 1
1.1 One-Sample Z-Test Diketahui:
Rata-rata klaim populasi (\(\mu_0\)): 120 menit
Simpangan baku populasi (\(\sigma\)): 15 menit
Ukuran sampel (\(n\)): 64 pengguna
Rata-rata sampel (\(\bar{x}\)): 116 menit
Taraf signifikansi (\(\alpha\)): 0.05
1.2 Penyelesaian
1. Formulasi Hipotesis
Dalam statistika, kita membandingkan klaim awal dengan kemungkinan adanya perubahan.Hipotesis Nol (\(H_0\)): Rata-rata waktu belajar harian pengguna adalah 120 menit.\[H_0: \mu = 120\]
Hipotesis Alternatif (\(H_1\)): Rata-rata waktu belajar harian pengguna tidak sama dengan 120 menit (Uji dua arah).\[H_1: \mu \neq 120\]
2. Identifikasi Uji Statistik & Justifikasi
Uji yang digunakan adalah One-Sample Z-Test (Uji Z satu sampel).Alasannya:
Standar deviasi populasi (\(\sigma\)) diketahui, yaitu 15 menit.
Ukuran sampel (\(n = 64\)) besar (berdasarkan Teorema Limit Pusat, \(n \geq 30\) dianggap cukup untuk mengasumsikan distribusi normal).
3. Perhitungan Statistik Uji dan P-Value
Kita menggunakan tingkat signifikansi \(\alpha = 0,05\).
Diketahui:
Rata-rata populasi (\(\mu_0\)): 120
Standar deviasi populasi (\(\sigma\)): 15
Rata-rata sampel (\(\bar{x}\)): 116
Ukuran sampel (\(n\)): 64
Rumus Nilai Z (\(Z_{calc}\)): \[Z = \frac{\bar{x} - \mu_0}{\sigma / \sqrt{n}}\]
A. Menghitung Nilai Z (\(Z_{calc}\))
\[Z = \frac{\bar{x} - \mu_0}{\sigma / \sqrt{n}}\]\[Z = \frac{116 - 120}{15 / \sqrt{64}} = \frac{-4}{15 / 8} = \frac{-4}{1,875} = -2,133\]
B. Menghitung P-Value:
Karena ini adalah uji dua arah (\(H_1: \mu \neq 120\)), kita mencari luas area di bawah kurva normal untuk \(Z = -2,133\) dan mengalikannya dengan dua.
\(P(Z < -2,13) \approx 0,0166\)
\(P\text{-value} = 0,0166 \times 2 = \mathbf{0,0332}\)
4. Keputusan Statistik
Bandingkan \(P\text{-value}\) dengan \(\alpha\):
\(P\text{-value}\) (0.0332) < \(\alpha\) (0.05).
Keputusan: Tolak Hipotesis Nol (\(H_0\)).
5. Interpretasi dalam Konteks Bisnis Analitik
Berdasarkan data sampel dari 64 pengguna, terdapat bukti statistik yang cukup pada tingkat kepercayaan 95% untuk menyatakan bahwa rata-rata waktu belajar harian pengguna bukan 120 menit. Secara spesifik, karena rata-rata sampel (116 menit) lebih rendah dari klaim dan hasilnya signifikan, platform pembelajaran digital ini mungkin perlu menyelidiki mengapa waktu belajar pengguna menurun. Ini bisa menjadi sinyal bagi tim produk atau pemasaran untuk meningkatkan strategi keterlibatan (engagement) pengguna agar kembali mencapai target 120 menit.
2 Study Kasus 2
2.1 One-Sample T-Test (\(\sigma\) Tidak Diketahui, Sampel Kecil) Diketahui:
Target waktu (\(\mu_0\)): 10 menit
Data Sampel (\(n=10\)): 9.2, 10.5, 9.8, 10.1, 9.6, 10.3, 9.9, 9.7, 10.0, 9.5
Taraf signifikansi (\(\alpha\)): 0.05
2.2 Penyelesaian
1. Definisi Hipotesis (\(H_0\) dan \(H_1\))
\(H_0: \mu = 10\) (Rata-rata waktu penyelesaian tugas sama dengan 10 menit).
\(H_1: \mu \neq 10\) (Rata-rata waktu penyelesaian tugas berbeda dari 10 menit).
2. Identifikasi Uji Statistik yang Tepat
Uji yang digunakan adalah One-Sample T-Test.
- Justifikasi: Standar deviasi populasi (\(\sigma\)) tidak diketahui dan ukuran sampel kecil (\(n = 10\)). Kita akan menggunakan standar deviasi sampel (\(s\)) sebagai estimasi.
3. Perhitungan Statistik T dan P-Value
Pertama, kita cari dulu nilai rata-rata sampel (\(\bar{x}\)) dan standar deviasi sampel (\(s\)):
\(\bar{x}\) (Rata-rata): \((9.2 + 10.5 + ... + 9.5) / 10 = \mathbf{9.86}\)
\(s\) (Standar Deviasi Sampel): \(\approx \mathbf{0.395}\)
\(df\) (Derajat Kebebasan): \(n - 1 = 10 - 1 = \mathbf{9}\)
Rumus Nilai t : \[t = \frac{\bar{x} - \mu_0}{s / \sqrt{n}}\]
A. Menghitung Nilai t (\(t_{calc}\)):
\[t = \frac{9.86 - 10}{0.395 / \sqrt{10}}\]\[t = \frac{-0.14}{0.1249}\]\[t = -1.12\]
B. Menghitung P-Value:
Karena ini adalah uji dua arah (\(H_1: \mu \neq 10\)), kita mencari luas area pada distribusi T dengan derajat kebebasan (\(df\)) = 9:
\[P\text{-value} = P(T > |-1.12|) \times 2\]\[P\text{-value} \approx 0.291\]
4. Keputusan Statistik
Bandingkan \(P\text{-value}\) dengan \(\alpha\):
\(P\text{-value}\) (0.291) > \(\alpha\) (0.05).
Keputusan: Gagal Tolak \(H_0\).
5. Ukuran Sampel dan Keandalan Inferensial
Ukuran sampel sangat mempengaruhi keandalan data (reliabilitas):
Sampel Kecil (\(n=10\)): Memiliki risiko kesalahan tipe II yang lebih tinggi (gagal mendeteksi perbedaan yang sebenarnya ada). Hasilnya cenderung kurang stabil karena satu data ekstrem (outlier) dapat mengubah hasil secara drastis.
Sampel Besar: Mengurangi standard error, sehingga estimasi rata-rata menjadi lebih presisi dan kekuatan uji (statistical power) meningkat untuk mendeteksi perbedaan sekecil apa pun.
3 Study Kasus 3
3.1 Two-Sample T-Test (A/B Testing)
Tim product analytics melakukan uji A/B untuk membandingkan rata-rata durasi sesi (menit) antara dua versi halaman landas (landing page).
# Membuat dataframe untuk Case Study 3: Two-Sample T-Test
ab_test_data <- data.frame(
Versi = c("A", "B"),
n = c(25, 25),
Mean = c(4.8, 5.4),
Standard_Deviation = c(1.2, 1.4)
)
# Menampilkan tabel dalam format yang rapi di Rmd
knitr::kable(ab_test_data,
caption = "Tabel 3.1: Data Durasi Sesi A/B Testing",
align = "cccc")| Versi | n | Mean | Standard_Deviation |
|---|---|---|---|
| A | 25 | 4.8 | 1.2 |
| B | 25 | 5.4 | 1.4 |
3.2 Penyelesaian
1. Formulasi Hipotesis
\(H_0: \mu_A = \mu_B\) (Tidak ada perbedaan rata-rata durasi sesi antara Versi A dan Versi B).
\(H_1: \mu_A \neq \mu_B\) (Ada perbedaan signifikan rata-rata durasi sesi antara Versi A dan Versi B).
2. Identifikasi Jenis Uji-T
Uji yang digunakan adalah Independent Two-Sample T-Test (Uji-T dua sampel independen).
- Justifikasi: Kita membandingkan dua kelompok subjek yang berbeda (Versi A dan Versi B) dengan ukuran sampel kecil (\(n < 30\)).
3. Statistik Uji dan P-Value
A. Menghitung Nilai T (\(t_{calc}\)):
Rumus (asumsi varians sama): \[t = \frac{\bar{x}_1 - \bar{x}_2}{\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}}\]
Penyelesaian: \[t = \frac{4.8 - 5.4}{\sqrt{\frac{1.2^2}{25} + \frac{1.4^2}{25}}}\]\[t = \frac{-0.6}{\sqrt{0.0576 + 0.0784}}\]\[t = \frac{-0.6}{0.3688}\]\[t = -1.627\]
B. Menghitung P-Value:
Dengan derajat kebebasan (\(df\)) sekitar 48, nilai \(t = -1.627\) memberikan:\[P\text{-value} \approx 0.110\]
4. Keputusan Statistik
Bandingkan \(P\text{-value}\) dengan \(\alpha = 0.05\):
\(P\text{-value}\) (0.110) > \(\alpha\) (0.05).
Keputusan: Gagal Tolak \(H_0\).
5. Interpretasi untuk Pengambilan Keputusan Produk
Secara statistik, tidak ada perbedaan yang signifikan antara durasi sesi di Versi A dan Versi B. Meskipun Versi B memiliki angka rata-rata yang sedikit lebih tinggi (5.4 vs 4.8), perbedaan ini belum cukup kuat untuk membuktikan bahwa satu versi lebih baik dari yang lain. Tim produk disarankan untuk mengumpulkan lebih banyak data atau mencoba eksperimen desain lain yang lebih kontras.
4 Study Kasus 4
4.1 Uji Independensi Chi-Square
Sebuah perusahaan e-commerce meneliti apakah tipe perangkat berhubungan dengan preferensi metode pembayaran.
Tabel Kontingensi (Data Observasi):
# Membuat tabel data untuk Studi Kasus 4
data_pembayaran <- matrix(c(120, 80, 50, 60, 90, 40),
nrow = 2, byrow = TRUE)
# Menamai baris dan kolom
rownames(data_pembayaran) <- c("Mobile", "Desktop")
colnames(data_pembayaran) <- c("E-Wallet", "Kartu Kredit", "Cash on Delivery")
# Mengubah menjadi dataframe
df_pembayaran <- as.data.frame(data_pembayaran)
# Menampilkan tabel rapi
knitr::kable(df_pembayaran,
caption = "Tabel 4.1: Hubungan Perangkat dan Metode Pembayaran",
align = "cccc")| E-Wallet | Kartu Kredit | Cash on Delivery | |
|---|---|---|---|
| Mobile | 120 | 80 | 50 |
| Desktop | 60 | 90 | 40 |
4.2 Penyelesaian
1. Formulasi Hipotesis
\(H_0\): Tidak ada hubungan antara tipe perangkat dan preferensi metode pembayaran (keduanya saling bebas/independen).
\(H_1\): Ada hubungan yang signifikan antara tipe perangkat dan preferensi metode pembayaran (keduanya tidak saling bebas).
2. Identifikasi Uji Statistik
Uji yang tepat adalah Uji Independensi Chi-Square.
- Justifikasi: Data berbentuk kategori (nominal) dan disajikan dalam tabel kontingensi (baris x kolom).
3. Statistik Uji dan P-Value
A. Menghitung Statistik Chi-Square (\(\chi^2\)):
Rumus: \[\chi^2 = \sum \frac{(O - E)^2}{E}\]
Di mana:
\(O\) = Nilai Observasi (data nyata)
\(E\) = Nilai Harapan (Expected Value)
Langkah Perhitungan:
Hitung total baris dan kolom. Total keseluruhan (\(N\)) adalah 440.
Hitung Nilai Harapan (\(E\)) untuk setiap sel: \[E = \frac{\text{Total Baris} \times \text{Total Kolom}}{N}\]
Hitung selisih kuadrat antara \(O\) dan \(E\), lalu bagi dengan \(E\).
(Berdasarkan data tersebut, nilai \(\chi^2\) yang diperoleh adalah sekitar 14.87)
B. Menentukan P-Value:
Dengan derajat kebebasan \(df = (2-1) \times (3-1) = 2\), dan nilai \(\chi^2 = 14.87\):\[P\text{-value} \approx 0.0006\]
4. Keputusan Statistik
Bandingkan \(P\text{-value}\) dengan \(\alpha = 0,05\):
\(P\text{-value}\) (0.0006) < 0,05.
Keputusan: Tolak \(H_0\).
5. Interpretasi Strategi Pembayaran Digital
Terdapat hubungan yang signifikan secara statistik antara tipe perangkat dan metode pembayaran. Pengguna mobile lebih cenderung menggunakan E-Wallet, sementara pengguna desktop lebih banyak menggunakan kartu kredit. Strategi bisnis yang dapat diambil adalah dengan mempermudah alur pembayaran E-Wallet di aplikasi mobile untuk meningkatkan konversi.
5 Study Kasus 5
5.1 Kesalahan Tipe I dan Tipe II (Konseptual)
Sebuah startup fintech menguji apakah algoritma deteksi penipuan baru dapat mengurangi transaksi penipuan.
\(H_0\): Algoritma baru tidak mengurangi penipuan.
\(H_1\): Algoritma baru mengurangi penipuan.
5.2 Penyelesaian
1. Kesalahan Tipe I (α) dalam Konteks Ini
Kesalahan Tipe I terjadi jika kita menolak \(H_0\) padahal \(H_0\) benar.
Artinya: Kita menyimpulkan bahwa algoritma baru berhasil mengurangi penipuan, padahal kenyataannya algoritma tersebut tidak memberikan dampak apa pun.
Analogi: “Alarm Palsu” (False Positive).
2. Kesalahan Tipe II (β) dalam Konteks Ini
Kesalahan Tipe II terjadi jika kita gagal menolak \(H_0\) padahal \(H_0\) salah.
Artinya: Kita menyimpulkan bahwa algoritma baru tidak berhasil, padahal kenyataannya algoritma tersebut sangat efektif dalam mengurangi penipuan.
Analogi: “Gagal Mendeteksi” (False Negative).
3. Kesalahan Mana yang Lebih Merugikan Secara Bisnis?
Dalam konteks deteksi penipuan (fraud detection), Kesalahan Tipe II biasanya jauh lebih merugikan.
Alasannya: Jika perusahaan melakukan Kesalahan Tipe II, mereka akan membuang algoritma yang sebenarnya efektif. Akibatnya, transaksi penipuan akan terus terjadi, menyebabkan kerugian finansial yang besar bagi perusahaan dan hilangnya kepercayaan nasabah.
Sebaliknya, Kesalahan Tipe I “hanya” mengakibatkan pemborosan biaya implementasi algoritma yang ternyata tidak berguna.
4. Pengaruh Ukuran Sampel terhadap Kesalahan Tipe II
Ukuran sampel memiliki pengaruh terbalik terhadap Kesalahan Tipe II:
Semakin besar ukuran sampel, maka risiko Kesalahan Tipe II (\(\beta\)) akan semakin menurun.
Sampel yang lebih besar memberikan lebih banyak data bagi uji statistik untuk mendeteksi perbedaan atau dampak sekecil apa pun, sehingga probabilitas untuk melewatkan algoritma yang efektif menjadi lebih kecil.
5. Hubungan antara α, β, dan Kekuatan Statistik (Power)
Ketiga konsep ini saling berhubungan erat:
Hubungan α dan β: Terdapat trade-off (timbal balik). Jika kita memperketat \(\alpha\) (agar sulit terjadi Kesalahan Tipe I), maka risiko \(\beta\) (Kesalahan Tipe II) biasanya akan meningkat.
Kekuatan Statistik (Power): Didefinisikan sebagai \(1 - \beta\).
Intinya: Kekuatan statistik adalah kemampuan sebuah uji untuk mendeteksi adanya efek atau perubahan yang benar-benar ada. Semakin kecil risiko Kesalahan Tipe II (\(\beta\)), semakin tinggi kekuatan statistik penelitian tersebut.
6 Study Kasus 6
6.1 P-Value dan Pengambilan Keputusan Statistik
Hasil evaluasi model prediksi churn (perpindahan pelanggan) menunjukkan data berikut:
Statistik Uji: 2.31
P-value: 0.021
Tingkat Signifikansi (\(\alpha\)): 0.05
6.2 Penyelesaian
1. Arti dari P-Value
P-value adalah probabilitas mendapatkan hasil uji yang sama atau lebih ekstrem daripada hasil yang diobservasi, dengan asumsi bahwa hipotesis nol (\(H_0\)) benar.
- Dalam konteks ini: Nilai 0.021 menunjukkan ada peluang sebesar 2.1% bahwa hasil prediksi churn ini terjadi hanya karena faktor kebetulan. Semakin kecil p-value, semakin kuat bukti untuk menolak \(H_0\).
2. Keputusan Statistik
Untuk mengambil keputusan, kita membandingkan p-value dengan \(\alpha\):
Kriteria: Jika p-value < \(\alpha\), maka Tolak \(H_0\).
Perbandingan: 0.021 < 0.05.
Keputusan: Tolak Hipotesis Nol (\(H_0\)). Artinya, hasil model prediksi churn ini signifikan secara statistik.
3. Bahasa Non-Teknis untuk Manajemen
“Berdasarkan analisis data, kami memiliki tingkat kepercayaan 95% bahwa model prediksi churn ini bekerja dengan efektif. Probabilitas bahwa keberhasilan model ini hanya karena faktor kebetulan sangatlah kecil (hanya 2.1%). Oleh karena itu, kita dapat mengandalkan model ini untuk mengidentifikasi pelanggan yang berisiko berhenti berlangganan.”
4. Risiko jika Sampel Tidak Representatif
Jika sampel yang digunakan tidak mewakili populasi (misalnya hanya mengambil data pelanggan lama saja):
Generalisasi Salah: Keputusan statistik yang kita ambil mungkin tampak benar secara matematis, namun akan gagal total saat diterapkan di dunia nyata.
Bias: Model mungkin sangat akurat untuk kelompok tertentu tetapi tidak akurat untuk pelanggan baru atau segmen pasar lain, sehingga strategi pencegahan churn menjadi salah sasaran.
5. Mengapa P-Value Tidak Mengukur Ukuran Efek (Effect Size)?
P-value hanya memberitahu kita apakah ada hubungan atau perbedaan yang signifikan, bukan seberapa besar dampak atau perbedaan tersebut.
- Contoh: Sebuah penelitian bisa memiliki p-value yang sangat kecil (sangat signifikan) karena ukuran sampel yang sangat besar, padahal perbedaan nyata di lapangan sangatlah kecil dan tidak memiliki dampak finansial yang berarti bagi perusahaan.
7 Referensi
Black, K. (2019). Business Statistics: For Contemporary Decision Making. Wiley.
Anderson, D. R., Sweeney, D. J., Williams, T. A., Camm, J. D., & Cochran, J. J. (2020). Statistics for Business & Economics. Cengage Learning.
Lind, D. A., Marchal, W. G., & Wathen, S. A. (2018). Statistical Techniques in Business and Economics. McGraw-Hill Education.
Field, A., Miles, J., & Field, Z. (2012). Discovering Statistics Using R. SAGE Publications.