Study Cases

Statistical Inferences ~ Week 14 ~

Naychila Adelia Zahrah

Data Science Undergraduate Student

R Programming Data Science Statistics

1 Study Kasus 1

1.1 One-Sample Z-Test Diketahui:

  • Rata-rata klaim populasi (\(\mu_0\)): 120 menit

  • Simpangan baku populasi (\(\sigma\)): 15 menit

  • Ukuran sampel (\(n\)): 64 pengguna

  • Rata-rata sampel (\(\bar{x}\)): 116 menit

  • Taraf signifikansi (\(\alpha\)): 0.05

1.2 Penyelesaian

1. Formulasi Hipotesis

  • Dalam statistika, kita membandingkan klaim awal dengan kemungkinan adanya perubahan.Hipotesis Nol (\(H_0\)): Rata-rata waktu belajar harian pengguna adalah 120 menit.\[H_0: \mu = 120\]

  • Hipotesis Alternatif (\(H_1\)): Rata-rata waktu belajar harian pengguna tidak sama dengan 120 menit (Uji dua arah).\[H_1: \mu \neq 120\]

2. Identifikasi Uji Statistik & Justifikasi

Uji yang digunakan adalah One-Sample Z-Test (Uji Z satu sampel).Alasannya:

  • Standar deviasi populasi (\(\sigma\)) diketahui, yaitu 15 menit.

  • Ukuran sampel (\(n = 64\)) besar (berdasarkan Teorema Limit Pusat, \(n \geq 30\) dianggap cukup untuk mengasumsikan distribusi normal).

3. Perhitungan Statistik Uji dan P-Value

Kita menggunakan tingkat signifikansi \(\alpha = 0,05\).

Diketahui:

  • Rata-rata populasi (\(\mu_0\)): 120

  • Standar deviasi populasi (\(\sigma\)): 15

  • Rata-rata sampel (\(\bar{x}\)): 116

  • Ukuran sampel (\(n\)): 64

  • Rumus Nilai Z (\(Z_{calc}\)): \[Z = \frac{\bar{x} - \mu_0}{\sigma / \sqrt{n}}\]

A. Menghitung Nilai Z (\(Z_{calc}\))

\[Z = \frac{\bar{x} - \mu_0}{\sigma / \sqrt{n}}\]\[Z = \frac{116 - 120}{15 / \sqrt{64}} = \frac{-4}{15 / 8} = \frac{-4}{1,875} = -2,133\]

B. Menghitung P-Value:

Karena ini adalah uji dua arah (\(H_1: \mu \neq 120\)), kita mencari luas area di bawah kurva normal untuk \(Z = -2,133\) dan mengalikannya dengan dua.

  • \(P(Z < -2,13) \approx 0,0166\)

  • \(P\text{-value} = 0,0166 \times 2 = \mathbf{0,0332}\)

4. Keputusan Statistik

Bandingkan \(P\text{-value}\) dengan \(\alpha\):

  • \(P\text{-value}\) (0.0332) < \(\alpha\) (0.05).

  • Keputusan: Tolak Hipotesis Nol (\(H_0\)).

5. Interpretasi dalam Konteks Bisnis Analitik

Berdasarkan data sampel dari 64 pengguna, terdapat bukti statistik yang cukup pada tingkat kepercayaan 95% untuk menyatakan bahwa rata-rata waktu belajar harian pengguna bukan 120 menit. Secara spesifik, karena rata-rata sampel (116 menit) lebih rendah dari klaim dan hasilnya signifikan, platform pembelajaran digital ini mungkin perlu menyelidiki mengapa waktu belajar pengguna menurun. Ini bisa menjadi sinyal bagi tim produk atau pemasaran untuk meningkatkan strategi keterlibatan (engagement) pengguna agar kembali mencapai target 120 menit.

2 Study Kasus 2

2.1 One-Sample T-Test (\(\sigma\) Tidak Diketahui, Sampel Kecil) Diketahui:

  • Target waktu (\(\mu_0\)): 10 menit

  • Data Sampel (\(n=10\)): 9.2, 10.5, 9.8, 10.1, 9.6, 10.3, 9.9, 9.7, 10.0, 9.5

  • Taraf signifikansi (\(\alpha\)): 0.05

2.2 Penyelesaian

1. Definisi Hipotesis (\(H_0\) dan \(H_1\))

  • \(H_0: \mu = 10\) (Rata-rata waktu penyelesaian tugas sama dengan 10 menit).

  • \(H_1: \mu \neq 10\) (Rata-rata waktu penyelesaian tugas berbeda dari 10 menit).

2. Identifikasi Uji Statistik yang Tepat

Uji yang digunakan adalah One-Sample T-Test.

  • Justifikasi: Standar deviasi populasi (\(\sigma\)) tidak diketahui dan ukuran sampel kecil (\(n = 10\)). Kita akan menggunakan standar deviasi sampel (\(s\)) sebagai estimasi.

3. Perhitungan Statistik T dan P-Value

Pertama, kita cari dulu nilai rata-rata sampel (\(\bar{x}\)) dan standar deviasi sampel (\(s\)):

  • \(\bar{x}\) (Rata-rata): \((9.2 + 10.5 + ... + 9.5) / 10 = \mathbf{9.86}\)

  • \(s\) (Standar Deviasi Sampel): \(\approx \mathbf{0.395}\)

  • \(df\) (Derajat Kebebasan): \(n - 1 = 10 - 1 = \mathbf{9}\)

  • Rumus Nilai t : \[t = \frac{\bar{x} - \mu_0}{s / \sqrt{n}}\]

A. Menghitung Nilai t (\(t_{calc}\)):

\[t = \frac{9.86 - 10}{0.395 / \sqrt{10}}\]\[t = \frac{-0.14}{0.1249}\]\[t = -1.12\]

B. Menghitung P-Value:

Karena ini adalah uji dua arah (\(H_1: \mu \neq 10\)), kita mencari luas area pada distribusi T dengan derajat kebebasan (\(df\)) = 9:

\[P\text{-value} = P(T > |-1.12|) \times 2\]\[P\text{-value} \approx 0.291\]

4. Keputusan Statistik

Bandingkan \(P\text{-value}\) dengan \(\alpha\):

  • \(P\text{-value}\) (0.291) > \(\alpha\) (0.05).

  • Keputusan: Gagal Tolak \(H_0\).

5. Ukuran Sampel dan Keandalan Inferensial

Ukuran sampel sangat mempengaruhi keandalan data (reliabilitas):

  • Sampel Kecil (\(n=10\)): Memiliki risiko kesalahan tipe II yang lebih tinggi (gagal mendeteksi perbedaan yang sebenarnya ada). Hasilnya cenderung kurang stabil karena satu data ekstrem (outlier) dapat mengubah hasil secara drastis.

  • Sampel Besar: Mengurangi standard error, sehingga estimasi rata-rata menjadi lebih presisi dan kekuatan uji (statistical power) meningkat untuk mendeteksi perbedaan sekecil apa pun.

3 Study Kasus 3

3.1 Two-Sample T-Test (A/B Testing)

Tim product analytics melakukan uji A/B untuk membandingkan rata-rata durasi sesi (menit) antara dua versi halaman landas (landing page).

# Membuat dataframe untuk Case Study 3: Two-Sample T-Test
ab_test_data <- data.frame(
  Versi = c("A", "B"),
  n = c(25, 25),
  Mean = c(4.8, 5.4),
  Standard_Deviation = c(1.2, 1.4)
)

# Menampilkan tabel dalam format yang rapi di Rmd
knitr::kable(ab_test_data, 
             caption = "Tabel 3.1: Data Durasi Sesi A/B Testing",
             align = "cccc")
Tabel 3.1: Data Durasi Sesi A/B Testing
Versi n Mean Standard_Deviation
A 25 4.8 1.2
B 25 5.4 1.4

3.2 Penyelesaian

1. Formulasi Hipotesis

  • \(H_0: \mu_A = \mu_B\) (Tidak ada perbedaan rata-rata durasi sesi antara Versi A dan Versi B).

  • \(H_1: \mu_A \neq \mu_B\) (Ada perbedaan signifikan rata-rata durasi sesi antara Versi A dan Versi B).

2. Identifikasi Jenis Uji-T

Uji yang digunakan adalah Independent Two-Sample T-Test (Uji-T dua sampel independen).

  • Justifikasi: Kita membandingkan dua kelompok subjek yang berbeda (Versi A dan Versi B) dengan ukuran sampel kecil (\(n < 30\)).

3. Statistik Uji dan P-Value

A. Menghitung Nilai T (\(t_{calc}\)):

Rumus (asumsi varians sama): \[t = \frac{\bar{x}_1 - \bar{x}_2}{\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}}\]

Penyelesaian: \[t = \frac{4.8 - 5.4}{\sqrt{\frac{1.2^2}{25} + \frac{1.4^2}{25}}}\]\[t = \frac{-0.6}{\sqrt{0.0576 + 0.0784}}\]\[t = \frac{-0.6}{0.3688}\]\[t = -1.627\]

B. Menghitung P-Value:

Dengan derajat kebebasan (\(df\)) sekitar 48, nilai \(t = -1.627\) memberikan:\[P\text{-value} \approx 0.110\]

4. Keputusan Statistik

Bandingkan \(P\text{-value}\) dengan \(\alpha = 0.05\):

  • \(P\text{-value}\) (0.110) > \(\alpha\) (0.05).

  • Keputusan: Gagal Tolak \(H_0\).

5. Interpretasi untuk Pengambilan Keputusan Produk

Secara statistik, tidak ada perbedaan yang signifikan antara durasi sesi di Versi A dan Versi B. Meskipun Versi B memiliki angka rata-rata yang sedikit lebih tinggi (5.4 vs 4.8), perbedaan ini belum cukup kuat untuk membuktikan bahwa satu versi lebih baik dari yang lain. Tim produk disarankan untuk mengumpulkan lebih banyak data atau mencoba eksperimen desain lain yang lebih kontras.

4 Study Kasus 4

4.1 Uji Independensi Chi-Square

Sebuah perusahaan e-commerce meneliti apakah tipe perangkat berhubungan dengan preferensi metode pembayaran.

Tabel Kontingensi (Data Observasi):

# Membuat tabel data untuk Studi Kasus 4
data_pembayaran <- matrix(c(120, 80, 50, 60, 90, 40), 
                          nrow = 2, byrow = TRUE)

# Menamai baris dan kolom
rownames(data_pembayaran) <- c("Mobile", "Desktop")
colnames(data_pembayaran) <- c("E-Wallet", "Kartu Kredit", "Cash on Delivery")

# Mengubah menjadi dataframe
df_pembayaran <- as.data.frame(data_pembayaran)

# Menampilkan tabel rapi
knitr::kable(df_pembayaran, 
             caption = "Tabel 4.1: Hubungan Perangkat dan Metode Pembayaran",
             align = "cccc")
Tabel 4.1: Hubungan Perangkat dan Metode Pembayaran
E-Wallet Kartu Kredit Cash on Delivery
Mobile 120 80 50
Desktop 60 90 40

4.2 Penyelesaian

1. Formulasi Hipotesis

  • \(H_0\): Tidak ada hubungan antara tipe perangkat dan preferensi metode pembayaran (keduanya saling bebas/independen).

  • \(H_1\): Ada hubungan yang signifikan antara tipe perangkat dan preferensi metode pembayaran (keduanya tidak saling bebas).

2. Identifikasi Uji Statistik

Uji yang tepat adalah Uji Independensi Chi-Square.

  • Justifikasi: Data berbentuk kategori (nominal) dan disajikan dalam tabel kontingensi (baris x kolom).

3. Statistik Uji dan P-Value

A. Menghitung Statistik Chi-Square (\(\chi^2\)):

Rumus: \[\chi^2 = \sum \frac{(O - E)^2}{E}\]

Di mana:

  • \(O\) = Nilai Observasi (data nyata)

  • \(E\) = Nilai Harapan (Expected Value)

Langkah Perhitungan:

  • Hitung total baris dan kolom. Total keseluruhan (\(N\)) adalah 440.

  • Hitung Nilai Harapan (\(E\)) untuk setiap sel: \[E = \frac{\text{Total Baris} \times \text{Total Kolom}}{N}\]

  • Hitung selisih kuadrat antara \(O\) dan \(E\), lalu bagi dengan \(E\).

(Berdasarkan data tersebut, nilai \(\chi^2\) yang diperoleh adalah sekitar 14.87)

B. Menentukan P-Value:

Dengan derajat kebebasan \(df = (2-1) \times (3-1) = 2\), dan nilai \(\chi^2 = 14.87\):\[P\text{-value} \approx 0.0006\]

4. Keputusan Statistik

Bandingkan \(P\text{-value}\) dengan \(\alpha = 0,05\):

  • \(P\text{-value}\) (0.0006) < 0,05.

  • Keputusan: Tolak \(H_0\).

5. Interpretasi Strategi Pembayaran Digital

Terdapat hubungan yang signifikan secara statistik antara tipe perangkat dan metode pembayaran. Pengguna mobile lebih cenderung menggunakan E-Wallet, sementara pengguna desktop lebih banyak menggunakan kartu kredit. Strategi bisnis yang dapat diambil adalah dengan mempermudah alur pembayaran E-Wallet di aplikasi mobile untuk meningkatkan konversi.

5 Study Kasus 5

5.1 Kesalahan Tipe I dan Tipe II (Konseptual)

Sebuah startup fintech menguji apakah algoritma deteksi penipuan baru dapat mengurangi transaksi penipuan.

  • \(H_0\): Algoritma baru tidak mengurangi penipuan.

  • \(H_1\): Algoritma baru mengurangi penipuan.

5.2 Penyelesaian

1. Kesalahan Tipe I (α) dalam Konteks Ini

Kesalahan Tipe I terjadi jika kita menolak \(H_0\) padahal \(H_0\) benar.

  • Artinya: Kita menyimpulkan bahwa algoritma baru berhasil mengurangi penipuan, padahal kenyataannya algoritma tersebut tidak memberikan dampak apa pun.

  • Analogi: “Alarm Palsu” (False Positive).

2. Kesalahan Tipe II (β) dalam Konteks Ini

Kesalahan Tipe II terjadi jika kita gagal menolak \(H_0\) padahal \(H_0\) salah.

  • Artinya: Kita menyimpulkan bahwa algoritma baru tidak berhasil, padahal kenyataannya algoritma tersebut sangat efektif dalam mengurangi penipuan.

  • Analogi: “Gagal Mendeteksi” (False Negative).

3. Kesalahan Mana yang Lebih Merugikan Secara Bisnis?

Dalam konteks deteksi penipuan (fraud detection), Kesalahan Tipe II biasanya jauh lebih merugikan.

  • Alasannya: Jika perusahaan melakukan Kesalahan Tipe II, mereka akan membuang algoritma yang sebenarnya efektif. Akibatnya, transaksi penipuan akan terus terjadi, menyebabkan kerugian finansial yang besar bagi perusahaan dan hilangnya kepercayaan nasabah.

  • Sebaliknya, Kesalahan Tipe I “hanya” mengakibatkan pemborosan biaya implementasi algoritma yang ternyata tidak berguna.

4. Pengaruh Ukuran Sampel terhadap Kesalahan Tipe II

Ukuran sampel memiliki pengaruh terbalik terhadap Kesalahan Tipe II:

  • Semakin besar ukuran sampel, maka risiko Kesalahan Tipe II (\(\beta\)) akan semakin menurun.

  • Sampel yang lebih besar memberikan lebih banyak data bagi uji statistik untuk mendeteksi perbedaan atau dampak sekecil apa pun, sehingga probabilitas untuk melewatkan algoritma yang efektif menjadi lebih kecil.

5. Hubungan antara α, β, dan Kekuatan Statistik (Power)

Ketiga konsep ini saling berhubungan erat:

  • Hubungan α dan β: Terdapat trade-off (timbal balik). Jika kita memperketat \(\alpha\) (agar sulit terjadi Kesalahan Tipe I), maka risiko \(\beta\) (Kesalahan Tipe II) biasanya akan meningkat.

  • Kekuatan Statistik (Power): Didefinisikan sebagai \(1 - \beta\).

  • Intinya: Kekuatan statistik adalah kemampuan sebuah uji untuk mendeteksi adanya efek atau perubahan yang benar-benar ada. Semakin kecil risiko Kesalahan Tipe II (\(\beta\)), semakin tinggi kekuatan statistik penelitian tersebut.

6 Study Kasus 6

6.1 P-Value dan Pengambilan Keputusan Statistik

Hasil evaluasi model prediksi churn (perpindahan pelanggan) menunjukkan data berikut:

  • Statistik Uji: 2.31

  • P-value: 0.021

  • Tingkat Signifikansi (\(\alpha\)): 0.05

6.2 Penyelesaian

1. Arti dari P-Value

P-value adalah probabilitas mendapatkan hasil uji yang sama atau lebih ekstrem daripada hasil yang diobservasi, dengan asumsi bahwa hipotesis nol (\(H_0\)) benar.

  • Dalam konteks ini: Nilai 0.021 menunjukkan ada peluang sebesar 2.1% bahwa hasil prediksi churn ini terjadi hanya karena faktor kebetulan. Semakin kecil p-value, semakin kuat bukti untuk menolak \(H_0\).

2. Keputusan Statistik

Untuk mengambil keputusan, kita membandingkan p-value dengan \(\alpha\):

  • Kriteria: Jika p-value < \(\alpha\), maka Tolak \(H_0\).

  • Perbandingan: 0.021 < 0.05.

  • Keputusan: Tolak Hipotesis Nol (\(H_0\)). Artinya, hasil model prediksi churn ini signifikan secara statistik.

3. Bahasa Non-Teknis untuk Manajemen

“Berdasarkan analisis data, kami memiliki tingkat kepercayaan 95% bahwa model prediksi churn ini bekerja dengan efektif. Probabilitas bahwa keberhasilan model ini hanya karena faktor kebetulan sangatlah kecil (hanya 2.1%). Oleh karena itu, kita dapat mengandalkan model ini untuk mengidentifikasi pelanggan yang berisiko berhenti berlangganan.”

4. Risiko jika Sampel Tidak Representatif

Jika sampel yang digunakan tidak mewakili populasi (misalnya hanya mengambil data pelanggan lama saja):

  • Generalisasi Salah: Keputusan statistik yang kita ambil mungkin tampak benar secara matematis, namun akan gagal total saat diterapkan di dunia nyata.

  • Bias: Model mungkin sangat akurat untuk kelompok tertentu tetapi tidak akurat untuk pelanggan baru atau segmen pasar lain, sehingga strategi pencegahan churn menjadi salah sasaran.

5. Mengapa P-Value Tidak Mengukur Ukuran Efek (Effect Size)?

P-value hanya memberitahu kita apakah ada hubungan atau perbedaan yang signifikan, bukan seberapa besar dampak atau perbedaan tersebut.

  • Contoh: Sebuah penelitian bisa memiliki p-value yang sangat kecil (sangat signifikan) karena ukuran sampel yang sangat besar, padahal perbedaan nyata di lapangan sangatlah kecil dan tidak memiliki dampak finansial yang berarti bagi perusahaan.

7 Referensi

  • Black, K. (2019). Business Statistics: For Contemporary Decision Making. Wiley.

  • Anderson, D. R., Sweeney, D. J., Williams, T. A., Camm, J. D., & Cochran, J. J. (2020). Statistics for Business & Economics. Cengage Learning.

  • Lind, D. A., Marchal, W. G., & Wathen, S. A. (2018). Statistical Techniques in Business and Economics. McGraw-Hill Education.

  • Field, A., Miles, J., & Field, Z. (2012). Discovering Statistics Using R. SAGE Publications.