Study Cases

Statistical Inferences~ Week 14

Safina Zahra (52250033)

Student Majoring in Data Science

R Programming

Data Science

Statistics


Pendahuluan

Statistik inferensial adalah cabang statistik yang digunakan untuk menarik kesimpulan dan membuat perkiraan tentang suatu populasi berdasarkan data sampel. Dengan statistik inferensial, data tidak hanya disajikan, tetapi juga dianalisis untuk mengetahui apakah suatu pola, perbedaan, atau hubungan benar-benar bermakna atau hanya terjadi secara kebetulan. Oleh karena itu, statistik inferensial banyak digunakan dalam penelitian untuk mendukung pengambilan keputusan dan penarikan kesimpulan secara ilmiah.

Pada kesempatan ini, saya ingin menyampaikan terima kasih yang tulus kepada Bapak Bakti Siregar, M.Sc., CDS., selaku dosen pengampu mata kuliah Statistika. Atas bimbingan, ilmu, serta dedikasi yang telah Bapak berikan, saya dapat memahami konsep-konsep mendalam ini dengan lebih jelas dan terstruktur. Semoga materi ini dapat saya manfaatkan dengan baik dalam pengembangan kompetensi statistik saya lebih lanjut.

Case Study 1

Uji Z Satu Sampel (Hipotesis Statistik)

Sebuah platform pembelajaran digital mengklaim bahwa rata-rata waktu belajar harian penggunanya adalah 120 menit. Berdasarkan catatan historis, simpangan baku populasi diketahui sebesar 15 menit.

Sebuah sampel acak yang terdiri dari 64 pengguna menunjukkan rata-rata waktu belajar sebesar 116 menit.

Diketahui:

\[\mu_0 = 120\]

\[\sigma = 15\]

\[n = 64\]

\[\bar{x} = 116\]

Tugas

  1. Rumuskan Hipotesis Nol (H₀) dan Hipotesis Alternatif (H₁).
  2. Tentukan uji statistik yang sesuai dan jelaskan alasan pemilihannya.
  3. Hitung statistik uji dan nilai p (p-value) dengan menggunakan \[(\alpha = 0{,}05)\].
  4. Nyatakan keputusan statistik.
  5. Interpretasikan hasil dalam konteks masalah

Soal 1

Diketahui

  • Klaim rata-rata waktu belajar:

    \[\mu_0 = 120 \text{ menit}\]

  • Simpangan baku populasi:

    \[\sigma = 15\]

  • Jumlah sampel:

    \[n = 64\]

  • Rata-rata sampel:

    \[\bar{x} = 116\]

  • Taraf signifikansi:

    \[\alpha = 0{,}05\]

Menentukan Hipotesis

  • Hipotesis Nol (H₀)

    Rata-rata waktu belajar sama dengan 120 menit.

    \[H_0 : \mu = 120\]

  • Hipotesis Alternatif (H₁)

    Rata-rata waktu belajar tidak sama dengan 120 menit.

    \[H_1 : \mu \neq 120\]

Karena memakai tanda “tidak sama dengan”, maka ini uji dua arah.

Soal 2

Menentukan Uji Statistik

Uji yang digunakan adalah Uji Z Satu Sampel.

Alasannya:

  1. Simpangan baku populasi diketahui \[(\sigma = 15)\]
  2. Ukuran sampel besar (n = 64)
  3. Membandingkan rata-rata sampel dengan rata-rata populasi

Soal 3

Menentukan Rumus

Rumus statistik uji Z:

\[Z = \frac{\bar{x} - \mu_0}{\sigma / \sqrt{n}}\]

Menghitung Statistik Uji (Z)

Hitung penyebut (standard error):

\[\sigma / \sqrt{n} = 15 / \sqrt{64} = 15 / 8 = 1{,}875\]

Masukkan ke rumus Z:

\[Z = \frac{116 - 120}{1{,}875}\]

\[Z = \frac{-4}{1{,}875}\]

\[Z = -2{,}13\]

Nilai Z negatif artinya rata-rata sampel lebih kecil dari klaim.

Menentukan p-value

  • Nilai \((Z = -2{,}13)\)
  • Dari tabel Z, luas satu sisi ≈ 0,0166
  • Karena uji dua arah:

\[\text{p-value} = 2 \times 0{,}0166 = 0{,}0332\]

Soal 4

Membuat Keputusan

Bandingkan p-value dengan α:

  • p-value = 0,0332
  • α = 0,05

Karena:

\[0{,}0332 < 0{,}05\]

Maka Hipotesis Nol (H₀) ditolak

Soal 5

Interpretasi

Berdasarkan hasil uji Z satu sampel pada taraf signifikansi 5%, terdapat bukti yang cukup untuk menyatakan bahwa rata-rata waktu belajar harian pengguna tidak sama dengan 120 menit. Dengan kata lain, klaim platform pembelajaran digital tersebut tidak sesuai dengan data sampel.

Case Study 2

Uji t Satu Sampel (σ Tidak Diketahui, Sampel Kecil)

Sebuah tim riset UX menyelidiki apakah rata-rata waktu penyelesaian tugas pada sebuah aplikasi baru berbeda dari 10 menit. Data berikut dikumpulkan dari 10 pengguna:

9.2, 10.5, 9.8, 10.1, 9.6, 10.3, 9.9, 9.7, 10.0, 9.5

Tugas

  1. Tentukan Hipotesis Nol (H₀) dan Hipotesis Alternatif (H₁) (uji dua arah).
  2. Tentukan uji hipotesis yang sesuai.
  3. Hitung statistik uji t dan nilai p (p-value) dengan \[(\alpha = 0{,}05)\].
  4. Buat keputusan statistik.
  5. Jelaskan bagaimana ukuran sampel memengaruhi keandalan inferensi statistik.

Soal 1

Diketahui

Tim UX ingin mengetahui apakah rata-rata waktu penyelesaian tugas berbeda dari 10 menit.

Data waktu (menit) dari 10 pengguna:

9.2, 10.5, 9.8, 10.1, 9.6, 10.3, 9.9, 9.7, 10.0, 9.5

Taraf signifikansi:

\[\alpha = 0{,}05\]

Menentukan Hipotesis

Karena kata “differs from” (berbeda dari), maka digunakan uji dua arah.

  • Hipotesis Nol (H₀): Rata-rata waktu penyelesaian tugas sama dengan 10 menit

    \[H_0 : \mu = 10\]

  • Hipotesis Alternatif (H₁): Rata-rata waktu penyelesaian tugas tidak sama dengan 10 menit

    \[H_1 : \mu \neq 10\]

Soal 2

Menentukan Uji Statistik

Uji yang tepat adalah Uji t satu sampel.

Alasan:

  1. Simpangan baku populasi tidak diketahui
  2. Ukuran sampel kecil (n = 10)
  3. Menguji rata-rata satu sampel terhadap nilai tertentu

Soal 3

Menghitung Statistik Sampel

Rata-rata sampel \[(\bar{x})\]

Jumlah seluruh data:

\[98{,}6\]

Rata-rata:

\[\bar{x} = \frac{98{,}6}{10} = 9{,}86\]

Simpangan baku sampel (s)

Dari perhitungan (selisih terhadap rata-rata dan dikuadratkan):

  • Jumlah kuadrat selisih = 1,344

  • Varians sampel:

    \[s^2 = \frac{1{,}344}{9} = 0{,}149\]

Simpangan baku:

\[s = \sqrt{0{,}149} \approx 0{,}387\]

Menghitung Statistik Uji (t)

Rumus uji t:

\[t = \frac{\bar{x} - \mu_0}{s / \sqrt{n}}\]

Substitusi nilai:

\[t = \frac{9{,}86 - 10}{0{,}387 / \sqrt{10}}\]

\[t = \frac{-0{,}14}{0{,}122} \approx -1{,}14\]

Derajat kebebasan:

df = n - 1 = 9

Menentukan p-value

  • Nilai \((t = -1{,}14)\)
  • (df = 9)
  • Uji dua arah

Dari tabel t:

\[\text{p-value} \approx 0{,}28\]

Soal 4

Keputusan Statistik

Bandingkan p-value dengan α:

  • p-value = 0,28
  • α = 0,05

Karena:

\[0{,}28 > 0{,}05\]

Maka gagal menolak Hipotesis Nol (H₀)

Soal 5

Interpretasi

Pada taraf signifikansi 5%, tidak terdapat bukti yang cukup secara statistik untuk menyatakan bahwa rata-rata waktu penyelesaian tugas berbeda dari 10 menit. Dengan demikian, data sampel mendukung klaim bahwa waktu rata-rata sekitar 10 menit.

Pengaruh Ukuran Sampel terhadap Keandalan Inferensi

Ukuran sampel sangat memengaruhi keandalan hasil inferensi statistik:

  • Sampel kecil: Lebih sensitif terhadap data ekstrem, Ketidakpastian lebih besar, Sulit mendeteksi perbedaan kecil

  • Sampel besar Estimasi lebih stabil Kesimpulan lebih meyakinkan P-value lebih akurat

Case Study 3

Uji t Dua Sampel (A/B Testing)

Sebuah tim analitik produk melakukan uji A/B untuk membandingkan rata-rata durasi sesi (dalam menit) antara dua versi halaman landing.

Versi Ukuran Sampel (n) Rata-rata Simpangan Baku
A 25 4,8 1,2
B 25 5,4 1,4

ugas

  1. Rumuskan hipotesis nol (H₀) dan hipotesis alternatif (H₁).
  2. Tentukan jenis uji t yang diperlukan.
  3. Hitung statistik uji dan nilai p (p-value).
  4. Buat kesimpulan statistik pada taraf signifikansi α = 0,05.
  5. Interpretasikan hasilnya untuk pengambilan keputusan produk.

Soal 1

Rumuskan Hipotesis

  • H₀ (Hipotesis nol): μA = μB Artinya tidak ada perbedaan rata-rata durasi antara versi A dan B.

  • H₁ (Hipotesis alternatif): μA ≠ μB Artinya ada perbedaan rata-rata durasi antara A dan B.

Soal 2

Tentukan Jenis Uji

Menggunakan independent two-sample t-test (uji t dua sampel independen)

Karena:

  • Dua kelompok independen
  • Standar deviasi populasi tidak diketahui
  • Ukuran sampel kecil (<30 per kelompok)

Soal 3

Hitung Statistik Uji

Hitung Variansi Sampel

Simpangan baku:

  • sA = 1,2 → variansiSA = 1,2² = 1,44
  • sB = 1,4 → variansiSB = 1,4² = 1,96

Hitung Pooled Standard Deviation

Karena nA = nB (25 sama 25), kita asumsikan variansi populasi sama.

\[s_p = \sqrt{\frac{(n_A - 1)s_A^2 + (n_B - 1)s_B^2}{n_A + n_B - 2}}\]

\[s_p = \sqrt{\frac{(25-1)(1{,}44) + (25-1)(1{,}96)}{25+25-2}} = \sqrt{\frac{24(1{,}44 + 1{,}96)}{48}}\]

\[= \sqrt{\frac{24 \times 3{,}40}{48}} = \sqrt{\frac{81{,}6}{48}} = \sqrt{1{,}70} ≈ 1{,}30\]

Hitung Standard Error (SE)

\[SE = s_p \sqrt{\frac{1}{n_A} + \frac{1}{n_B}} = 1{,}30 \sqrt{\frac{1}{25} + \frac{1}{25}} = 1{,}30 \sqrt{0{,}08} ≈ 1{,}30(0{,}2828) ≈ 0{,}37\]

**Hitung *t-statistic**

\[t = \frac{\bar{x}_A - \bar{x}_B}{SE} = \frac{4{,}8 - 5{,}4}{0{,}37} = \frac{-0{,}6}{0{,}37} ≈ -1{,}62\]

Degree of Freedom (df)

Karena equal variances:

\[df = n_A + n_B - 2 = 25 + 25 - 2 = 48\]

Cari p-Value

Kita lakukan uji dua arah (two-tailed) karena H₁ ≠ (bukan arah tertentu).

Dengan t ≈ -1,62 dan df = 48:

  • Nilai p-value kira-kira sekitar 0,11 – 0,12 (nilai di > α = 0,05 → tidak signifikan)

Secara intuisi:

t p-value ~
≈ ±1,62 ~0,11

Karena p-value > α (0,05), maka gagal menolak H₀.

Soal 4

Kesimpulan Statistik pada Taraf Signifikansi 0,05

Berdasarkan hasil uji t dua sampel, nilai p-value lebih besar dari 0,05. Oleh karena itu, hipotesis nol tidak dapat ditolak.

Artinya tidak terdapat perbedaan yang signifikan secara statistik antara rata-rata durasi sesi pengguna pada versi A dan versi B.

Soal 5

Interpretasi untuk Pengambilan Keputusan Produk

Meskipun versi B memiliki rata-rata durasi sesi yang lebih tinggi dibandingkan versi A, perbedaan tersebut belum cukup kuat secara statistik untuk menyimpulkan bahwa versi B lebih baik.

Untuk pengambilan keputusan produk:

  • Belum ada dasar statistik yang kuat untuk mengganti versi A dengan versi B
  • Perbedaan yang terlihat kemungkinan disebabkan oleh variasi data secara acak
  • Disarankan untuk menambah jumlah sampel atau menjalankan A/B testing lebih lama
  • Perlu mempertimbangkan metrik lain seperti tingkat konversi atau keterlibatan pengguna

Case Study 4

Uji Chi-Kuadrat untuk Independensi

Sebuah perusahaan e-commerce meneliti apakah jenis perangkat berhubungan dengan preferensi metode pembayaran.

Perangkat / Pembayaran Dompet Digital (E-Wallet) Kartu Kredit Bayar di Tempat
Mobile 120 80 50
Desktop 60 90 40

Tugas

  1. Nyatakan hipotesis nol (H₀) dan hipotesis alternatif (H₁).
  2. Tentukan uji statistik yang sesuai.
  3. Hitung nilai statistik Chi-Kuadrat.
  4. Tentukan nilai p pada taraf signifikansi 0,05.
  5. Interpretasikan hasilnya dalam konteks strategi pembayaran digital.

Soal 1

Menyatakan Hipotesis

  • Hipotesis nol (H0) Jenis perangkat yang digunakan (mobile atau desktop) tidak berhubungan dengan preferensi metode pembayaran.

  • Hipotesis alternatif (H1) Jenis perangkat yang digunakan berhubungan dengan preferensi metode pembayaran.

Soal 2

Menentukan Uji Statistik

Uji yang tepat adalah Uji Chi-Kuadrat untuk Independensi.

Karena:

  • Data berbentuk frekuensi (jumlah pengguna)
  • Terdapat dua variabel kategorik (jenis perangkat dan metode pembayaran)
  • Tujuan untuk melihat hubungan/keterkaitan

Soal 3

Menyusun Tabel Observasi

Data yang diamati

Perangkat E-Wallet Kartu Kredit COD Total
Mobile 120 80 50 250
Desktop 60 90 40 190
Total 180 170 90 440

Menghitung Nilai Harapan

Rumus nilai harapan tiap sel:

Nilai harapan = (total baris × total kolom) / total keseluruhan

perhitungan:

  • Mobile – E-Wallet (250 × 180) / 440 = 102,27

  • Mobile – Kartu Kredit (250 × 170) / 440 = 96,59

  • Mobile – COD (250 × 90) / 440 = 51,14

  • Desktop – E-Wallet (190 × 180) / 440 = 77,73

  • Desktop – Kartu Kredit (190 × 170) / 440 = 73,41

  • Desktop – COD (190 × 90) / 440 = 38,86

Tabel Nilai Harapan

Perangkat E-Wallet Kartu Kredit COD
Mobile 102,27 96,59 51,14
Desktop 77,73 73,41 38,86

Menghitung Statistik Chi-Kuadrat

Rumus dasar:

Chi-kuadrat = jumlah dari (observasi − harapan)² dibagi harapan

Perhitungan tiap sel

Mobile – E-Wallet (120 − 102,27)² / 102,27 = 3,07

Mobile – Kartu Kredit (80 − 96,59)² / 96,59 = 2,85

Mobile – COD (50 − 51,14)² / 51,14 = 0,03

Desktop – E-Wallet (60 − 77,73)² / 77,73 = 4,04

Desktop – Kartu Kredit (90 − 73,41)² / 73,41 = 3,75

Desktop – COD (40 − 38,86)² / 38,86 = 0,03

Nilai Chi-Kuadrat Total

\[Chi-kuadrat = 3,07 + 2,85 + 0,03 + 4,04 + 3,75 + 0,03 = 13,77\]

Menentukan Derajat Bebas

Rumus derajat bebas:

(jumlah baris − 1) × (jumlah kolom − 1)

= (2 − 1) × (3 − 1) = 2

Soal 4

Menentukan p-Value

Dengan:

  • Nilai chi-kuadrat = 13,77
  • Derajat bebas = 2

Nilai p-value jauh lebih kecil dari 0,05 (sekitar < 0,01)

Kesimpulan Statistik (α = 0,05)

Karena p-value lebih kecil dari 0,05, maka: Hipotesis nol ditolak

Artinya, terdapat hubungan yang signifikan secara statistik antara jenis perangkat dan preferensi metode pembayaran.

Soal 5

Interpretasi untuk Strategi Pembayaran Digital

Hasil ini menunjukkan bahwa pengguna mobile dan desktop memiliki pola pembayaran yang berbeda.

Implikasi untuk perusahaan e-commerce:

  • Pengguna mobile lebih cenderung menggunakan dompet digital
  • Pengguna desktop lebih banyak menggunakan kartu kredit
  • Strategi pembayaran sebaiknya disesuaikan dengan jenis perangkat
  • Mobile: prioritaskan e-wallet dan promo dompet digital
  • Desktop: optimalkan pengalaman pembayaran kartu kredit

Case Study 5

Kesalahan Tipe I dan Tipe II (Konseptual)

Sebuah startup fintech menguji apakah algoritma deteksi penipuan yang baru dapat mengurangi transaksi penipuan.

  • H₀ (Hipotesis nol): Algoritma baru tidak mengurangi penipuan.
  • H₁ (Hipotesis alternatif): Algoritma baru mengurangi penipuan.

Tugas

  1. Jelaskan Kesalahan Tipe I (α) dalam konteks ini.
  2. Jelaskan Kesalahan Tipe II (β) dalam konteks ini.
  3. Tentukan kesalahan mana yang lebih merugikan dari sudut pandang bisnis.
  4. Diskusikan bagaimana ukuran sampel memengaruhi Kesalahan Tipe II.
  5. Jelaskan hubungan antara α, β, dan daya uji (statistical power).

Soal 1

Definisi Kesalahan Tipe I:

Kesalahan Tipe I terjadi ketika kita menolak H₀ padahal H₀ sejatinya benar. Artinya kita menyimpulkan bahwa algoritma baru ini efektif (mengurangi penipuan), padahal sebenarnya tidak efektif. Contoh nyatanya seperti Startup percaya algoritmanya menurunkan penipuan, padahal secara nyata tidak ada pengurangan penipuan. Keputusan bisnis dibuat berdasarkan asumsi efisiensi yang salah.

Makna α: α adalah probabilitas terjadi kesalahan Tipe I (umumnya 0,05 = 5%). Itu berarti kita mengizinkan kemungkinan kecil bahwa kita salah ketika bilang “algoritma efektif”.

Soal 2

Definisi Kesalahan Tipe II:

Kesalahan Tipe II terjadi ketika kita gagal menolak H₀ padahal H₀ sebenarnya salah. Artinya kita mengatakan algoritma tidak efektif padahal sebenarnya algoritma itu benar-benar efektif. Contoh nyatanya seperti Startup memutuskan algoritma baru tidak membantu, padahal sebenarnya algoritma itu memang mampu menurunkan penipuan hanya saja data atau uji statistik tidak cukup kuat untuk menunjukkan efek ini.

Makna β: β adalah probabilitas terjadi kesalahan Tipe II (false negative). Semakin besar β, semakin besar kemungkinan kita kehilangan efek nyata karena data kita kurang kuat.


Soal 3

dentifikasi mana yang lebih merugikan dari perspektif bisnis

Pertimbangkan biaya nyata keduanya:

# Membuat tabel jenis kesalahan
jenis_kesalahan <- data.frame(
  Jenis_Kesalahan = c("Tipe I (α)", "Tipe II (β)"),
  Akibat = c(
    "Startup menyimpulkan algoritma efektif dan menerapkannya, sehingga mengeluarkan biaya pengembangan dan operasional, padahal algoritma tersebut sebenarnya tidak mengurangi penipuan.",
    "Startup menolak algoritma yang sebenarnya efektif, sehingga kehilangan peluang untuk mengurangi penipuan dan memperoleh keuntungan yang seharusnya bisa didapatkan."
  )
)

# Menampilkan tabel
print(jenis_kesalahan)
##   Jenis_Kesalahan
## 1      Tipe I (α)
## 2     Tipe II (β)
##                                                                                                                                                                                 Akibat
## 1 Startup menyimpulkan algoritma efektif dan menerapkannya, sehingga mengeluarkan biaya pengembangan dan operasional, padahal algoritma tersebut sebenarnya tidak mengurangi penipuan.
## 2                  Startup menolak algoritma yang sebenarnya efektif, sehingga kehilangan peluang untuk mengurangi penipuan dan memperoleh keuntungan yang seharusnya bisa didapatkan.

Dari perspektif startup jika investasi besar telah dilakukan, Tipe I bisa lebih merugikan karena menghasilkan keputusan yang salah dan bisa menghabiskan sumber daya untuk sesuatu yang tidak benar-benar bekerja. Namun jika biaya salah menolak teknologi yang paling efektif sangat besar, misalnya kehilangan potensi revenue/keunggulan kompetitif, maka Tipe II juga serius. Jadi jawabannya secara umum: Bisnis biasanya lebih takut kepada Tipe I (false positive) jika biaya implementasi tinggi, tapi konteks biaya riil tetap perlu dipertimbangkan.

Soal 4

Bagaimana ukuran sampel memengaruhi Kesalahan Tipe II

Arah hubungan:

Ukuran sampel (jumlah data/percobaan) berpengaruh terutama terhadap β.

Konsepnya:

  • Jika ukuran sampel kecil → data kurang representatif → kurang power → sulit mendeteksi efek nyata → β lebih besar.
  • Jika ukuran sampel besar → variasi data lebih kecil → lebih mudah mendeteksi efek nyata → β lebih kecil.

Intinya: * Menambah ukuran sampel bisa mengurangi peluang terjadi kesalahan Tipe II. * Sebab estimasi jadi lebih akurat & dapat mendeteksi efek yang lebih kecil sekalipun.

Soal 5

hubungan antara α, β, dan statistical power

Hubungan matematika sederhana:

  • α → peluang salah menolak H₀ yang benar (false positive).
  • β → peluang gagal menolak H₀ yang salah (false negative).
  • Daya uji → kemampuan tes mendeteksi efek jika memang ada, yaitu: daya uji = 1 − β.

Interaksi di antara mereka:

  1. Menurunkan α (lebih ketat) → berarti lebih sedikit false positive. → tapi dapat menyebabkan β naik (lebih sulit mendeteksi efek nyata) karena area penolakan lebih sempit.

  2. Meningkatkan ukuran sampel → bisa menurunkan β tanpa menaikkan α, sehingga power meningkat.

  3. Efek ukuran dan daya uji: Semakin besar efek nyata dari algoritma (misalnya penurunan penipuan besar), semakin mudah mendeteksi → β turun, daya uji naik.

Graphik pemahaman (secara konsep):

Dalam distribusi statistik, ada area yang diatur oleh α dan area yang diatur oleh β; memindahkan cut-off atau tambah sampel akan mengubah ukuran area ini.

Case Study 6

P-Value dan Pengambilan Keputusan Statistik

Evaluasi model prediksi churn (pelanggan berhenti) menghasilkan temuan berikut:

  • Statistik uji = 2,31
  • Nilai p = 0,021
  • Tingkat signifikansi: α = 0,05

Tugas

  1. Jelaskan makna nilai p (p-value).
  2. Buat keputusan statistik.
  3. Terjemahkan keputusan tersebut ke dalam bahasa non-teknis untuk manajemen.
  4. Diskusikan risiko jika sampel tidak representatif.
  5. Jelaskan mengapa nilai p tidak mengukur besar efek (effect size).

Soal 1

makna nilai p (p-value)

Nilai p (p-value) adalah probabilitas memperoleh hasil pengujian statistik yang sama atau lebih ekstrem daripada data yang diamati, dengan asumsi bahwa hipotesis nol (H₀) benar.

Dalam inferensi statistik, p-value digunakan untuk menilai kekuatan bukti data terhadap hipotesis nol. Nilai p yang kecil menunjukkan bahwa hasil pengamatan jarang terjadi jika H₀ benar, sehingga data tersebut tidak konsisten dengan H₀. Sebaliknya, nilai p yang besar menunjukkan bahwa data masih konsisten dengan H₀.

Pada konteks soal ini, p-value sebesar 0,021 berarti bahwa jika hipotesis nol benar, peluang mendapatkan statistik uji sebesar 2,31 atau lebih ekstrem hanyalah 2,1%. Oleh karena itu, data memberikan bukti yang cukup kuat terhadap hipotesis nol.

Soal 2

keputusan statistik

Keputusan statistik dilakukan dengan membandingkan nilai p-value dengan tingkat signifikansi (α) yang telah ditetapkan.

Diketahui:

  • p-value = 0,021
  • α = 0,05

Aturan pengambilan keputusan:

  • Jika p-value ≤ α, maka hipotesis nol ditolak.
  • Jika p-value > α, maka hipotesis nol gagal ditolak.

Karena 0,021 lebih kecil dari 0.05, maka hipotesis nol (H₀) ditolak.

Dengan demikian, terdapat bukti statistik yang signifikan untuk mendukung hipotesis alternatif.

Soal 3

Terjemahkan keputusan ke dalam bahasa non-teknis untuk manajemen

Dalam bahasa non-teknis yang mudah dipahami oleh manajemen:

“Hasil analisis menunjukkan bahwa temuan ini sangat kecil kemungkinannya terjadi secara kebetulan. Data memberikan bukti yang cukup kuat bahwa model prediksi churn benar-benar memberikan hasil yang berarti, sehingga layak dipertimbangkan dalam pengambilan keputusan bisnis.”

Artinya, keputusan yang diambil didasarkan pada bukti data yang kuat, bukan sekadar fluktuasi acak.

Soal 4

Risiko jika sampel tidak representatif

Jika sampel yang digunakan tidak representatif terhadap populasi, maka hasil uji statistik dapat menjadi bias dan menyesatkan.

Risiko yang dapat terjadi antara lain:

  1. Kesimpulan yang tidak akurat, karena sampel tidak mencerminkan karakteristik populasi sebenarnya.
  2. Generalitas hasil menjadi rendah, sehingga hasil penelitian tidak dapat diterapkan ke seluruh populasi pelanggan.
  3. Keputusan bisnis yang salah, karena strategi dibuat berdasarkan informasi yang tidak lengkap atau tidak seimbang.

Oleh karena itu, validitas hasil inferensi statistik sangat bergantung pada kualitas dan keterwakilan sampel yang digunakan.

Soal 5

mengapa nilai p tidak mengukur besar efek (effect size)

Nilai p tidak mengukur besar atau kekuatan efek, melainkan hanya mengukur tingkat signifikansi statistik, yaitu seberapa tidak konsisten data dengan hipotesis nol.

Nilai p sangat dipengaruhi oleh ukuran sampel. Pada sampel yang besar, perbedaan yang sangat kecil sekalipun dapat menghasilkan nilai p yang kecil dan terlihat signifikan secara statistik. Sebaliknya, pada sampel yang kecil, efek yang besar bisa saja tidak terdeteksi dan menghasilkan nilai p yang besar.

Karena itu, p-value tidak memberikan informasi mengenai seberapa besar dampak atau pengaruh yang sebenarnya. Untuk menilai besar efek, diperlukan ukuran lain seperti effect size, perbedaan rata-rata, atau ukuran kekuatan hubungan.

Referensi

[1] G. Diez, C. Barr, and M. Çetinkaya-Rundel, Introductory Statistics with Randomization and Simulation, OpenIntro, 2019.

[2] D. S. C. I. Labs, Statistical Inference, dalam Intro to Statistics, Bookdown, 2023. [https://bookdown.org/dsciencelabs/intro_statistics/09-Statistical_Inference.html]

[3] G. Casella and R. L. Berger, Statistical Inference, 2nd ed. Pacific Grove, CA: Duxbury Press, 2002.