Statistical Inferences

Profil Mahasiswa - Anindya Kristianingputri
Foto Profil Anindya Kristianingputri

Anindya Kristianingputri

NIM: 52250025

Student Major Data Science

Institut Teknologi Sains Bandung

Dosen: Bakti Siregar, M.Sc., CDS

R Programming Statistics Statistical Inference

1 Uji Z Satu Sampel (Hipotesis Statistik)

Sebuah Platform Pembelajaran Digital menyatakan bahwa waktu belajar harian rata-rata penggunanya adalah 120 menit. Berdasarkan catatan historis, simpangan baku populasi diketahui sebesar 15 menit.

Sebuah sampel acak dari 64 pengguna menunjukkan waktu belajar rata-rata sebesar 116 menit.

\[ \begin{eqnarray*} \mu_0 &=& 120 \\ \sigma &=& 15 \\ n &=& 64 \\ \bar{x} &=& 116 \end{eqnarray*} \]

Tugas

  1. Tentukan Hipotesis Nol (H₀) dan Hipotesis Alternatif (H₁).
  2. Identifikasi uji statistik yang sesuai dan jelaskan alasan Anda memilihnya.
  3. Hitung statistik uji dan nilai p menggunakan \(\alpha = 0.05\).
  4. Nyatakan keputusan statistik.
  5. Interpretasikan hasil dalam konteks analisis bisnis.

Penyelesaian Studi Kasus 1

  1. Berdasarkan soal, tertulis bahwa rata-rata waktu belajar harian pengguna adalah 120 menit, maka hipotesis nol (H₀) ditetapkan sebagai μ = 120. Hipotesis ini menyatakan bahwa rata-rata waktu belajar populasi sama dengan nilai yang diklaim oleh platform. Selanjutnya, dari hasil pengambilan sampel diperoleh rata-rata waktu belajar sebesar 116 menit dengan jumlah responden sebanyak 64 orang. Karena tidak ditentukan arah pengujian sebelumnya, maka hipotesis alternatif (H₁) dirumuskan sebagai μ ≠ 120, yang bertujuan untuk mengetahui apakah terdapat perbedaan antara rata-rata waktu belajar populasi dan klaim yang diajukan, baik lebih rendah maupun lebih tinggi dari 120 menit.

  2. Uji statistik yang tepat adalah Uji-Z satu sampel (two-tailed) untuk menguji hipotesis mengenai rata-rata populasi (μ), dengan pemenuhan tiga syarat yaitu simpangan baku populasi (σ = 15) yang diketahui, ukuran sampel besar (n=64) Sehingga distribusi rata-rata sampel mendekati normal sesuai Teorema Limit Pusat (Central Limit Theorem), serta sifat data yang kuantitatif kontinu. Mengingat σ diketahui, Uji-Z memberikan hasil yang lebih akurat

Perhitungan Uji Statistik Z

Perhitungan Uji Statistik Z

Rata-rata klaim (μ₀) 120 menit
Simpangan baku (σ) 15 menit
Ukuran sampel (n) 64
Rata-rata sampel (x̄) 116 menit
Z = (x̄ - μ₀) / (σ / √n)
1. Hitung Standar Error
σ / √n = 15 / √64 = 15 / 8 = 1.875
2. Hitung Selisih Rata-rata
x̄ - μ₀ = 116 - 120 = -4
3. Hitung Nilai Z
Z = -4 / 1.875 = -2.1333
Statistik Uji Z
Z ≈ -2.133

p = 2 × P(Z ≤ |Z hitung|)
1. Cari P(Z ≤ -2.133)
P(Z ≤ -2.133) ≈ 0.0165
2. Hitung Nilai p
p = 2 × 0.0165 = 0.0330
Nilai p (p-value)
p ≈ 0.033
  1. Berdasarkan hasil pengujian statistik pada tingkat signifikansi α = 0,05, hipotesis nol (H₀) ditolak karena nilai p-value yang diperoleh, yaitu sekitar 0,033, lebih kecil dari nilai α. Oleh karena itu, dapat disimpulkan bahwa terdapat bukti statistik yang cukup untuk menyatakan bahwa rata-rata waktu belajar harian pengguna berbeda secara signifikan dari klaim 120 menit yang disampaikan oleh platform.

  2. Hasil analisis menunjukkan bahwa rata-rata waktu belajar harian pengguna terbukti berbeda dari klaim 120 menit yang disampaikan di pernyataan diatas. Hal ini mengindikasikan bahwa tingkat keterlibatan pengguna belum sepenuhnya sesuai dengan target yang diharapkan. Kondisi tersebut dapat memengaruhi pencapaian tujuan bisnis, seperti retensi pengguna dan efektivitas program pembelajaran. Oleh karena itu, platform perlu melakukan evaluasi terhadap strategi konten, fitur pembelajaran, dan pengalaman pengguna agar waktu belajar harian dapat meningkat dan sejalan dengan klaim yang telah ditetapkan.


2 Uji t Satu Sampel (σ Tidak Diketahui, Sampel Kecil)

Tim Riset Pengalaman Pengguna (UX) menyelidiki waktu rata-rata penyelesaian tugas dari aplikasi baru dalam waktu 10 menit.

Data berikut dikumpulkan dari 10 pengguna:

\[ 9.2,\; 10.5,\; 9.8,\; 10.1,\; 9.6,\; 10.3,\; 9.9,\; 9.7,\; 10.0,\; 9.5 \]

Tugas

  1. Tentukan H₀ dan H₁ (dua ekor).
  2. Tentukan uji hipotesis yang sesuai.
  3. Hitung statistik t dan nilai p pada \(\alpha = 0.05\).
  4. Buat keputusan statistik.
  5. Jelaskan bagaimana ukuran sampel memengaruhi keandalan inferensial.

Penyelesaian Studi Kasus 2

  1. Hipotesis nol sama dengan 10 menit \[H_0 : \mu = 10\], sesuai klaim Tim Riset Pengalaman Pengguna. Sedangkan Hipotesis alternatif \[H_1 : \mu \neq 10 \] mengindikasikan adanya perbedaan signifikan dari nilai tersebut, baik lebih cepat maupun lebih lambat.

  2. Uji hipotesis yang tepat adalah uji-t satu sampel (one-sample t-test).
    Pemilihan ini didasarkan pada tiga syarat utama yang terpenuhi yaitu simpangan baku populasi tidak diketahui, sehingga menggunakan simpangan baku sampel sebagai estimasi lalu ukuran sampel kecil (n=10) sehingga tidak memenuhi syarat untuk uji-z yang memerlukan σ diketahui atau n besar; dan yang terakhir yaitu tujuan pengujiannya membandingkan rata-rata sampel dengan nilai klaim spesifik (10 menit).

Perhitungan Uji-t Satu Sampel

Perhitungan Uji-t Satu Sampel

Ukuran sampel (n) 10
Nilai hipotesis (μ₀) 10 menit
Data sampel 9.2, 10.5, 9.8, 10.1, 9.6, 10.3, 9.9, 9.7, 10.0, 9.5
Tingkat signifikansi (α) 0.05
t = (x̄ - μ₀) / (s / √n)
1. Hitung rata-rata sampel (x̄)
x̄ = (9.2+10.5+9.8+10.1+9.6+10.3+9.9+9.7+10.0+9.5)/10
= 98.6/10 = 9.86
2. Hitung simpangan baku sampel (s)
Jumlah kuadrat = Σ(xᵢ - x̄)² = 1.3440
s² = 1.3440 / 9 = 0.14933
s = √0.14933 ≈ 0.3864
3. Hitung statistik uji t
t = (9.86 - 10) / (0.3864 / √10)
= -0.14 / (0.3864 / 3.1623)
= -0.14 / 0.1222 ≈ -1.146
Statistik Uji t
t ≈ -1.146

Nilai p (dua ekor) = 2 × P(T ≤ |t|)
4. Hitung nilai p
Derajat kebebasan (df) = n - 1 = 9
P(T ≤ -1.146) ≈ 0.141 (satu ekor)
Nilai p dua ekor = 2 × 0.141 ≈ 0.282
Nilai p (p-value)
p ≈ 0.282
  1. Berdasarkan perhitungan dengan tingkat signifikansi α=0.05 dan nilai p-value ≈0.282, hipotesis nol tidak ditolak. Bahwa, tidak ada bukti statistik yang memadai untuk menyatakan bahwa rata-rata waktu penyelesaian tugas berbeda secara signifikan dari 10 menit. Data sampel yang diperoleh selaras dengan klaim bahwa rata-rata waktu penyelesaian tugas adalah 10 menit.

  2. Ukuran sampel berperan penting dalam keandalan inferensi statistik karena memengaruhi presisi estimasi dan kekuatan uji. Sampel yang lebih besar menghasilkan kesalahan standar yang lebih kecil \[SE = \frac{\sigma}{\sqrt{n}}\] sehingga estimasi parameter populasi menjadi lebih akurat dan interval kepercayaan semakin sempit. Selain itu, ukuran sampel yang besar meningkatkan power uji statistik dan mengurangi risiko kesalahan tipe II. Melalui Teorema Limit Pusat, sampel besar juga membuat asumsi normalitas lebih dapat diandalkan. Namun, ukuran sampel harus tetap diimbangi dengan kualitas dan representativitas data agar inferensi yang dihasilkan tetap valid.


3 Uji t Dua Sampel (Pengujian A/B)

Tim analitik produk melakukan uji A/B untuk membandingkan durasi sesi rata-rata (menit) antara dua versi dari laman arahan.

Data Uji A/B
Data Uji A/B - Durasi Sesi Rata-rata
Version Sample Size (n) Mean Std Dev
A 25 4.8 1.2
B 25 5.4 1.4
Catatan: Data untuk uji statistik perbandingan Versi A dan B.

Tugas

  1. Formulasikan hipotesis nol dan alternatif.
  2. Tentukan jenis uji t yang diperlukan.
  3. Hitung statistik uji dan nilai p.
  4. Tarik kesimpulan statistik pada \(\alpha = 0.05\).
  5. Interpretasikan hasil untuk pengambilan keputusan produk.

Penyelesaian Studi Kasus 3

  1. Hipotesis nol (H₀) menyatakan bahwa tidak terdapat perbedaan yang signifikan antara rata-rata durasi sesi pengguna pada laman arahan Versi A dan Versi B, atau dengan kata lain μ_A = μ_B. Sementara itu, hipotesis alternatif (H₁) menyatakan bahwa terdapat perbedaan yang signifikan antara kedua versi tersebut, yaitu μ_A ≠ μ_B, yang berarti durasi sesi rata-rata pada salah satu versi secara statistik lebih tinggi atau lebih rendah dibandingkan versi lainnya. Pengujian ini bersifat dua arah (two-tailed) karena tujuan utamanya adalah mengidentifikasi keberadaan perbedaan, tanpa mengasumsikan arah tertentu mana yang lebih unggul terlebih dahulu.

  2. Uji statistik yang digunakan dalam kasus ini adalah uji-t dua sampel independen dengan asumsi varians sama (pooled two-sample t-test). Uji ini dipilih karena bertujuan membandingkan rata-rata durasi sesi antara dua kelompok pengguna yang berbeda, yaitu Versi A dan Versi B, dengan jumlah sampel yang sama pada masing-masing kelompok (25 responden) serta data yang bersifat kuantitatif kontinu. Selain itu, nilai simpangan baku kedua kelompok relatif tidak jauh berbeda (1,2 dan 1,4), sehingga asumsi kesamaan varians dapat diterima dan penggunaan varian gabungan dianggap sesuai untuk memperoleh estimasi kesalahan standar yang lebih akurat.

Perhitungan Uji-t Dua Sampel

Perhitungan Uji-t Dua Sampel

Versi n s
A 25 4.8 1.2
B 25 5.4 1.4
df = n₁ + n₂ - 2 = 25 + 25 - 2 = 48
t = (x̄₁ - x̄₂) / [s_p √(1/n₁ + 1/n₂)]
1. Hitung selisih rata-rata
x̄₁ - x̄₂ = 4.8 - 5.4 = -0.6
2. Hitung simpangan baku gabungan (s_p)
s_p = √[((24)(1.2²) + (24)(1.4²)) / 48]
= √[(34.56 + 47.04) / 48] = √[81.6 / 48]
= √1.7 ≈ 1.3038
3. Hitung penyebut (standard error)
s_p √(1/25 + 1/25) = 1.3038 √(0.04 + 0.04)
= 1.3038 √0.08 = 1.3038 × 0.2828 ≈ 0.3686
4. Hitung statistik uji t
t = -0.6 / 0.3686 ≈ -1.628
Statistik Uji t
t ≈ -1.628

Nilai p (dua ekor) = 2 × P(T ≤ |t|)
5. Hitung nilai p
df = 48, t = -1.628 → nilai p ≈ 0.110
Nilai p (p-value)
p ≈ 0.110
  1. Berdasarkan hasil pengujian statistik menggunakan uji-t dua sampel pada tingkat signifikansi α = 0,05, diperoleh nilai p-value sebesar 0,110 yang lebih besar dari nilai α. Oleh karena itu, hipotesis nol (H₀) tidak dapat ditolak, sehingga tidak terdapat bukti statistik yang cukup untuk menyatakan adanya perbedaan yang signifikan antara rata-rata durasi sesi pada Versi A (4,8 menit) dan Versi B (5,4 menit). Dengan demikian, selisih rata-rata sebesar 0,6 menit yang terlihat pada data sampel dapat dianggap sebagai variasi yang terjadi secara acak dan belum menunjukkan keunggulan yang nyata dari salah satu versi terhadap durasi sesi pengguna.

  2. Berdasarkan Perhitungan diatas menunjukkan bahwa tidak terdapat perbedaan yang signifikan secara statistik antara durasi sesi pengguna pada Versi A dan Versi B. Dalam konteks pengambilan keputusan produk, hal ini berarti bahwa perubahan yang diterapkan pada Versi B belum terbukti memberikan peningkatan keterlibatan pengguna yang nyata dibandingkan Versi A. Oleh karena itu, tim produk sebaiknya tidak langsung mengganti Versi A dengan Versi B hanya berdasarkan durasi sesi. Diperlukan evaluasi lanjutan, seperti pengujian dengan ukuran sampel yang lebih besar sebelum mengambil keputusan implementasi produk secara penuh.


4 Uji Chi-Kuadrat untuk Independensi

Sebuah perusahaan e-commerce meneliti apakah jenis perangkat yang digunakan sesuai dengan preferensi metode pembayaran.

Data Pembayaran per Perangkat
Data Frekuensi Pembayaran per Perangkat
Perangkat / Pembayaran Dompet Digital Kartu Kredit Bayar di Tempat
Mobile 120 80 50
Desktop 60 90 40
Catatan: Data menunjukkan jumlah transaksi berdasarkan metode pembayaran dan jenis perangkat.

Tugas

  1. Nyatakan Hipotesis Nol (H₀) dan Hipotesis Alternatif (H₁).
  2. Identifikasi uji statistik yang sesuai.
  3. Hitung statistik Chi-Square (χ²).
  4. Tentukan nilai p pada \(\alpha = 0.05\).
  5. Interpretasikan hasil dalam konteks strategi pembayaran digital.

Penyelesaian Studi Kasus 4

  1. Hipotesis nol (H₀) menyatakan bahwa tidak terdapat hubungan antara jenis perangkat yang digunakan, yaitu mobile atau desktop, dengan preferensi metode pembayaran seperti dompet digital, kartu kredit, maupun pembayaran di tempat. Artinya, pola pemilihan metode pembayaran dianggap sama pada kedua kelompok pengguna. Sebaliknya, hipotesis alternatif (H₁) menyatakan bahwa terdapat hubungan yang signifikan antara jenis perangkat dan preferensi metode pembayaran, yang menunjukkan adanya perbedaan kecenderungan pilihan pembayaran antara pengguna perangkat mobile dan desktop.

  2. Uji statistik yang sesuai untuk analisis ini adalah Uji Chi-Square untuk Homogenitas Proporsi. Data yang digunakan berupa frekuensi kategorik. Data tersebut berasal dari dua kelompok independen, yaitu pengguna mobile dan desktop. Uji ini digunakan untuk menguji kesamaan distribusi proporsi antar kelompok. Hipotesis nol menyatakan bahwa proporsi pilihan metode pembayaran pada kedua kelompok adalah sama. Perhitungan dilakukan dengan membandingkan frekuensi observasi dan frekuensi harapan. Dengan demikian, uji ini dapat menentukan ada atau tidaknya perbedaan yang signifikan secara statistik.

Perhitungan Chi-Square

Perhitungan Chi-Square (χ²)

Data Observasi (Oᵢⱼ)
Perangkat / Pembayaran Dompet Digital Kartu Kredit Bayar di Tempat Total
Mobile 120 80 50 250
Desktop 60 90 40 190
Total 180 170 90 440
Data frekuensi observasi pembayaran berdasarkan perangkat

Eᵢⱼ = (Total Barisᵢ × Total Kolomⱼ) / Total Keseluruhan
Langkah 1: Hitung Frekuensi Harapan (Eᵢⱼ)
Mobile - Dompet Digital: (250 × 180) / 440 = 45000 / 440 ≈ 102.27
Mobile - Kartu Kredit: (250 × 170) / 440 = 42500 / 440 ≈ 96.59
Mobile - Bayar di Tempat: (250 × 90) / 440 = 22500 / 440 ≈ 51.14
Desktop - Dompet Digital: (190 × 180) / 440 = 34200 / 440 ≈ 77.73
Desktop - Kartu Kredit: (190 × 170) / 440 = 32300 / 440 ≈ 73.41
Desktop - Bayar di Tempat: (190 × 90) / 440 = 17100 / 440 ≈ 38.86
χ² = Σ [(Oᵢⱼ - Eᵢⱼ)² / Eᵢⱼ]
Langkah 2: Hitung (O - E)²/E untuk Setiap Sel
Mobile - Dompet Digital: (120 - 102.27)²/102.27 = 17.73²/102.27 ≈ 3.073
Mobile - Kartu Kredit: (80 - 96.59)²/96.59 = (-16.59)²/96.59 ≈ 2.849
Mobile - Bayar di Tempat: (50 - 51.14)²/51.14 = (-1.14)²/51.14 ≈ 0.025
Desktop - Dompet Digital: (60 - 77.73)²/77.73 = (-17.73)²/77.73 ≈ 4.044
Desktop - Kartu Kredit: (90 - 73.41)²/73.41 = 16.59²/73.41 ≈ 3.749
Desktop - Bayar di Tempat: (40 - 38.86)²/38.86 = 1.14²/38.86 ≈ 0.033
Langkah 3: Jumlahkan Semua Nilai
χ² = 3.073 + 2.849 + 0.025 + 4.044 + 3.749 + 0.033
χ² ≈ 13.773
Langkah 4: Hitung Derajat Kebebasan
df = (r - 1)(c - 1) = (2 - 1)(3 - 1) = 1 × 2 = 2

Hsil Perhitungan Chi-Square
χ² ≈ 13.773
Derajat Kebebasan (df) = 2
Nilai kritis χ² (α=0.05, df=2) = 5.991
  1. Berdasarkan hasil uji Chi-Square diperoleh nilai χ² = 13,773 dengan derajat kebebasan 2 dan p-value sekitar 0,001, yang lebih kecil dari tingkat signifikansi α = 0,05. Oleh karena itu, hipotesis nol ditolak dan hipotesis alternatif diterima. Hasil ini menunjukkan adanya hubungan yang signifikan secara statistik antara jenis perangkat yang digunakan (mobile atau desktop) dan preferensi metode pembayaran. Dengan demikian, dapat disimpulkan bahwa pilihan metode pembayaran pengguna memang berbeda berdasarkan perangkat yang mereka gunakan, dengan tingkat kepercayaan sebesar 95%.

  2. Hasil analisis statistik menunjukkan bahwa jenis perangkat yang digunakan pengguna berpengaruh signifikan terhadap preferensi metode pembayaran. Pengguna mobile cenderung memilih dompet digital karena kemudahan dan kecepatan transaksi, sedangkan pengguna desktop lebih sering menggunakan kartu kredit yang dianggap lebih nyaman dan aman. Temuan ini memberikan implikasi strategis bagi platform digital untuk menyesuaikan dan mengoptimalkan opsi pembayaran berdasarkan perangkat yang digunakan, sehingga proses transaksi menjadi lebih efisien. Dengan strategi pembayaran yang selaras dengan preferensi pengguna, perusahaan berpotensi meningkatkan tingkat konversi serta kepuasan pengguna secara berkelanjutan.


5 Kesalahan Tipe I dan Tipe II (Konseptual)

Sebuah startup fintech menguji apakah algoritma deteksi penipuan baru dapat mengurangi transaksi penipuan.

  • H₀: Algoritma baru tidak mengurangi penipuan.
  • H₁: Algoritma baru mengurangi penipuan.

Tugas

  1. Jelaskan Kesalahan Tipe I (α) dalam konteks ini.
  2. Jelaskan Kesalahan Tipe II (β) dalam konteks ini.
  3. Identifikasi kesalahan mana yang lebih merugikan dari perspektif bisnis.
  4. Diskusikan bagaimana ukuran sampel memengaruhi Kesalahan Tipe II.
  5. Jelaskan hubungan antara α, β, dan daya statistik.

Penyelesaian Studi Kasus 5

  1. Kesalahan Tipe I (α) dalam konteks ini terjadi apabila startup fintech menolak hipotesis nol (H₀) yang menyatakan bahwa algoritma deteksi penipuan baru tidak mengurangi transaksi penipuan, padahal pada kenyataannya algoritma tersebut memang tidak efektif. Artinya, perusahaan secara keliru menyimpulkan bahwa algoritma baru mampu menurunkan tingkat penipuan, sehingga berisiko mengadopsi sistem yang tidak memberikan manfaat nyata dan dapat menimbulkan konsekuensi operasional maupun finansial.

  2. Kesalahan Tipe II (β) dalam konteks pengujian algoritma deteksi penipuan ini terjadi ketika startup gagal mendeteksi bahwa algoritma baru sebenarnya lebih efektif mengurangi transaksi penipuan, sehingga kesimpulan yang diambil adalah algoritma tersebut tidak berpengaruh padahal dalam kenyataannya algoritma itu memang berhasil menurunkan tingkat penipuan. Akibatnya, startup memutuskan untuk tidak mengimplementasikan algoritma yang efektif tersebut, sehingga terus mengalami kerugian finansial akibat penipuan yang sebenarnya dapat dicegah, kehilangan peluang meningkatkan keamanan platform, dan berpotensi mengurangi kepercayaan pengguna karena sistem deteksi yang kurang optimal tetap digunakan.

  3. Dari perspektif bisnis, Kesalahan Tipe II (β) lebih merugikan karena menyebabkan startup terus mengalami kerugian finansial akibat transaksi penipuan yang seharusnya bisa dicegah oleh algoritma baru yang efektif, sementara Kesalahan Tipe I hanya mengakibatkan pemborosan biaya pengembangan dan integrasi algoritma yang ternyata tidak efektif, yang kerugiannya lebih terbatas dan dapat diperbaiki dengan evaluasi ulang.

A. Sampel Besar Mengurangi Risiko Kesalahan Tipe II

Ukuran sampel yang besar meningkatkan power statistik (1-β), yaitu kemampuan untuk mendeteksi efek atau perbedaan yang sebenarnya ada. Dalam konteks pengujian algoritma deteksi penipuan, sampel yang besar (misalnya ribuan transaksi) memungkinkan pendeteksian penurunan tingkat penipuan yang kecil sekalipun, sehingga mengurangi kemungkinan startup gagal mengenali efektivitas algoritma baru yang sebenarnya bermanfaat.

B. Sampel Kecil Meningkatkan Risiko Kesalahan Tipe II

Sampel yang kecil menghasilkan estimasi yang kurang presisi dan variabilitas yang tinggi, sehingga perbedaan nyata dalam efektivitas algoritma (misalnya penurunan penipuan dari 5% menjadi 3%) mungkin tidak mencapai signifikansi statistik. Akibatnya, startup berisiko salah menyimpulkan bahwa algoritma baru tidak efektif, padahal sebenarnya efektif, yang menyebabkan kerugian berkelanjutan karena penipuan yang terus terjadi.

  1. Tingkat signifikansi α menunjukkan risiko melakukan Kesalahan Tipe I, yaitu menolak hipotesis nol ketika hipotesis tersebut benar, sedangkan β menunjukkan risiko Kesalahan Tipe II, yaitu gagal menolak hipotesis nol saat hipotesis alternatif benar, dengan daya statistik didefinisikan sebagai 1 − β. Ketika nilai α diperbesar, kriteria penolakan menjadi lebih longgar sehingga daya statistik meningkat dan β menurun, sementara penurunan α untuk menghindari Kesalahan Tipe I justru menurunkan daya statistik dan meningkatkan β. Oleh karena itu, untuk mencapai daya statistik yang tinggi tanpa meningkatkan α secara signifikan, diperlukan penambahan ukuran sampel yang memadai.


6 Nilai-p dan Proses Pengambilan Keputusan Statistik

Evaluasi model prediksi churn menghasilkan hasil sebagai berikut:

  • Statistik uji = 2.31
  • Nilai p = 0.021
  • Tingkat signifikansi: \(\alpha = 0.05\)

Tugas

  1. Jelaskan arti dari nilai p.
  2. Buatlah keputusan statistik.
  3. Terjemahkan keputusan tersebut ke dalam bahasa non-teknis untuk manajemen.
  4. Bahas risiko jika sampel tidak representatif.
  5. Jelaskan mengapa nilai p tidak mengukur ukuran efek.

Penyelesaian Studi Kasus 6

  1. Nilai p (p-value) secara umum adalah probabilitas untuk mendapatkan hasil sampel yang setidaknya sama ekstremnya dengan yang diamati, dengan asumsi bahwa hipotesis nol (H₀) benar, di mana nilai p yang semakin kecil menunjukkan semakin tidak mungkinnya hasil tersebut terjadi hanya karena kebetulan semata jika H₀ memang benar, sehingga nilai p yang lebih rendah dari tingkat signifikansi yang ditetapkan (biasanya α = 0,05) memberikan bukti statistik yang cukup untuk menolak H₀ dan mendukung adanya efek atau perbedaan yang signifikan secara statistik, meskipun penting untuk diingat bahwa nilai p tidak mengukur besarnya efek atau kepentingan praktis dari temuan tersebut.

  2. Berdasarkan hasil evaluasi model prediksi churn dengan nilai p = 0,021 dan tingkat signifikansi α = 0,05, karena p < α (0,021 < 0,05), maka hipotesis nol (H₀) ditolak.Artinya, terdapat bukti statistik yang cukup untuk menyimpulkan bahwa model prediksi churn tersebut signifikan secara statistik dan hasil yang diperoleh (statistik uji = 2,31) tidak dapat dianggap terjadi hanya karena kebetulan semata.

  3. Berdasarkan hasil pengujian,model prediksi churn terbukti efektif dan bukan kebetulan semata, sehingga mampu secara konsisten mengidentifikasi pelanggan yang berpotensi berhenti menggunakan layanan. Dengan kata lain, manajemen dapat mempercayai prediksi model ini sebagai dasar untuk mengambil langkah-langkah strategis, seperti memberikan penawaran khusus atau layanan tambahan kepada pelanggan yang berisiko churn, guna meningkatkan retensi dan kepuasan pelanggan.

  4. Jika sampel tidak representatif, ada risiko bahwa model prediksi churn yang dibangun tidak mencerminkan perilaku seluruh populasi pelanggan. Akibatnya, pola churn yang terdeteksi pada sampel mungkin berbeda ketika diterapkan pada pelanggan nyata, sehingga keputusan bisnis yang diambil berdasarkan model tersebut bisa tidak akurat atau menyesatkan. Hal ini dapat menyebabkan sumber daya dialokasikan secara kurang efektif, intervensi retensi gagal mencapai target, dan potensi kerugian finansial atau kehilangan pelanggan meningkat. Oleh karena itu, memastikan sampel yang representatif dan seimbang sangat penting untuk validitas prediksi dan efektivitas strategi yang diambil.

  5. Nilai p tidak mengukur besarnya efek praktis karena hanya mencerminkan signifikansi statistik, yakni probabilitas mendapatkan hasil setidaknya seekstrem pengamatan saat hipotesis nol benar adanya. Nilai p tidak mengindikasikan seberapa pengaruh atau perbedaan tersebut dalam aplikasi nyata. Contohnya, efek kecil dapat signifikan dengan sampel besar, sedangkan efek besar mungkin tidak signifikan jika sampel terbatas. Karenanya, evaluasi dampak bisnis atau populasi memerlukan metrik efek pelengkap, seperti koefisien model, odds ratio, atau selisih rata-rata.

7 Referensi

[1] H. Ismail and H. Fajri, Statistika untuk penelitian pendidikan dan ilmu-ilmu sosial. Jakarta, Indonesia: Kencana, 2018.

[2] A. Fauzy, “Distribusi chi-kuadrat,” Jurnal MIPA IKIP Malang, vol. 25, no. 1, pp. 103–111, ISSN 0854-8269.

[3] C. Savitri et al., Statistik multivariat dalam riset, 2021.

