Profil Mahasiswa - Anindya Kristianingputri
R Programming
Statistics
Statistical Inference
Uji Z Satu Sampel
(Hipotesis Statistik)
Sebuah Platform Pembelajaran Digital menyatakan bahwa
waktu belajar harian rata-rata penggunanya adalah
120 menit. Berdasarkan catatan historis,
simpangan baku populasi diketahui sebesar 15 menit.
Sebuah sampel acak dari 64 pengguna menunjukkan
waktu belajar rata-rata sebesar 116 menit.
\[
\begin{eqnarray*}
\mu_0 &=& 120 \\
\sigma &=& 15 \\
n &=& 64 \\
\bar{x} &=& 116
\end{eqnarray*}
\]
Tugas
- Tentukan Hipotesis Nol (H₀) dan Hipotesis
Alternatif (H₁).
- Identifikasi uji statistik yang sesuai dan jelaskan
alasan Anda memilihnya.
- Hitung statistik uji dan nilai p
menggunakan \(\alpha = 0.05\).
- Nyatakan keputusan statistik.
- Interpretasikan hasil dalam konteks analisis
bisnis.
Penyelesaian Studi Kasus 1
Berdasarkan soal, tertulis bahwa rata-rata waktu belajar harian
pengguna adalah 120 menit, maka hipotesis nol (H₀)
ditetapkan sebagai μ = 120. Hipotesis ini menyatakan bahwa
rata-rata waktu belajar populasi sama dengan nilai yang diklaim oleh
platform. Selanjutnya, dari hasil pengambilan sampel diperoleh rata-rata
waktu belajar sebesar 116 menit dengan jumlah responden sebanyak 64
orang. Karena tidak ditentukan arah pengujian sebelumnya, maka
hipotesis alternatif (H₁) dirumuskan sebagai μ ≠ 120,
yang bertujuan untuk mengetahui apakah terdapat perbedaan antara
rata-rata waktu belajar populasi dan klaim yang diajukan, baik lebih
rendah maupun lebih tinggi dari 120 menit.
Uji statistik yang tepat adalah Uji-Z satu sampel
(two-tailed) untuk menguji hipotesis mengenai rata-rata
populasi (μ), dengan pemenuhan tiga syarat yaitu simpangan baku
populasi (σ = 15) yang diketahui, ukuran sampel besar (n=64) Sehingga
distribusi rata-rata sampel mendekati normal sesuai Teorema Limit Pusat
(Central Limit Theorem), serta sifat data yang kuantitatif
kontinu. Mengingat σ diketahui, Uji-Z memberikan hasil yang
lebih akurat
Perhitungan Uji Statistik Z
Perhitungan Uji Statistik Z
Rata-rata klaim (μ₀)
120 menit
Simpangan baku (σ)
15 menit
Ukuran sampel (n)
64
Rata-rata sampel (x̄)
116 menit
1. Hitung Standar Error
σ / √n = 15 / √64 = 15 / 8 = 1.875
2. Hitung Selisih Rata-rata
x̄ - μ₀ = 116 - 120 = -4
3. Hitung Nilai Z
Z = -4 / 1.875 = -2.1333
Statistik Uji Z
Z ≈ -2.133
1. Cari P(Z ≤ -2.133)
P(Z ≤ -2.133) ≈ 0.0165
2. Hitung Nilai p
p = 2 × 0.0165 = 0.0330
Nilai p (p-value)
p ≈ 0.033
Berdasarkan hasil pengujian statistik pada tingkat signifikansi α =
0,05, hipotesis nol (H₀) ditolak karena nilai p-value yang diperoleh,
yaitu sekitar 0,033, lebih kecil dari nilai α. Oleh karena itu, dapat
disimpulkan bahwa terdapat bukti statistik yang cukup untuk
menyatakan bahwa rata-rata waktu belajar harian pengguna berbeda secara
signifikan dari klaim 120 menit yang disampaikan oleh platform.
Hasil analisis menunjukkan bahwa rata-rata waktu belajar harian
pengguna terbukti berbeda dari klaim 120 menit yang disampaikan di
pernyataan diatas. Hal ini mengindikasikan bahwa
tingkat keterlibatan pengguna belum sepenuhnya sesuai dengan
target yang diharapkan. Kondisi tersebut dapat memengaruhi
pencapaian tujuan bisnis, seperti retensi pengguna dan efektivitas
program pembelajaran. Oleh karena itu, platform perlu melakukan evaluasi
terhadap strategi konten, fitur pembelajaran, dan pengalaman pengguna
agar waktu belajar harian dapat meningkat dan sejalan dengan klaim yang
telah ditetapkan.
Uji t Satu Sampel (σ
Tidak Diketahui, Sampel Kecil)
Tim Riset Pengalaman Pengguna (UX) menyelidiki waktu
rata-rata penyelesaian tugas dari aplikasi baru dalam waktu 10
menit.
Data berikut dikumpulkan dari 10 pengguna:
\[
9.2,\; 10.5,\; 9.8,\; 10.1,\; 9.6,\; 10.3,\; 9.9,\; 9.7,\; 10.0,\; 9.5
\]
Tugas
- Tentukan H₀ dan H₁ (dua
ekor).
- Tentukan uji hipotesis yang sesuai.
- Hitung statistik t dan nilai p
pada \(\alpha = 0.05\).
- Buat keputusan statistik.
- Jelaskan bagaimana ukuran sampel memengaruhi
keandalan inferensial.
Penyelesaian Studi Kasus 2
Hipotesis nol sama dengan 10 menit \[H_0 :
\mu = 10\], sesuai klaim Tim Riset Pengalaman Pengguna. Sedangkan
Hipotesis alternatif \[H_1 : \mu \neq 10
\] mengindikasikan adanya perbedaan signifikan dari nilai
tersebut, baik lebih cepat maupun lebih lambat.
Uji hipotesis yang tepat adalah uji-t satu sampel (one-sample
t-test).
Pemilihan ini didasarkan pada tiga syarat utama yang terpenuhi yaitu
simpangan baku populasi tidak diketahui, sehingga menggunakan simpangan
baku sampel sebagai estimasi lalu ukuran sampel kecil (n=10) sehingga
tidak memenuhi syarat untuk uji-z yang memerlukan σ diketahui atau n
besar; dan yang terakhir yaitu tujuan pengujiannya membandingkan
rata-rata sampel dengan nilai klaim spesifik (10 menit).
Perhitungan Uji-t Satu Sampel
Perhitungan Uji-t Satu Sampel
Ukuran sampel (n)
10
Nilai hipotesis (μ₀)
10 menit
Data sampel
9.2, 10.5, 9.8, 10.1, 9.6, 10.3, 9.9, 9.7, 10.0, 9.5
Tingkat signifikansi (α)
0.05
1. Hitung rata-rata sampel (x̄)
x̄ = (9.2+10.5+9.8+10.1+9.6+10.3+9.9+9.7+10.0+9.5)/10
= 98.6/10 = 9.86
2. Hitung simpangan baku sampel (s)
Jumlah kuadrat = Σ(xᵢ - x̄)² = 1.3440
s² = 1.3440 / 9 = 0.14933
s = √0.14933 ≈ 0.3864
3. Hitung statistik uji t
t = (9.86 - 10) / (0.3864 / √10)
= -0.14 / (0.3864 / 3.1623)
= -0.14 / 0.1222 ≈ -1.146
Statistik Uji t
t ≈ -1.146
4. Hitung nilai p
Derajat kebebasan (df) = n - 1 = 9
P(T ≤ -1.146) ≈ 0.141 (satu ekor)
Nilai p dua ekor = 2 × 0.141 ≈ 0.282
Nilai p (p-value)
p ≈ 0.282
Berdasarkan perhitungan dengan tingkat signifikansi α=0.05 dan nilai
p-value ≈0.282, hipotesis nol tidak ditolak. Bahwa, tidak ada bukti
statistik yang memadai untuk menyatakan bahwa rata-rata waktu
penyelesaian tugas berbeda secara signifikan dari 10 menit. Data sampel
yang diperoleh selaras dengan klaim bahwa rata-rata waktu penyelesaian
tugas adalah 10 menit.
Ukuran sampel berperan penting dalam keandalan inferensi statistik
karena memengaruhi presisi estimasi dan kekuatan uji. Sampel yang lebih
besar menghasilkan kesalahan standar yang lebih kecil \[SE = \frac{\sigma}{\sqrt{n}}\] sehingga
estimasi parameter populasi menjadi lebih akurat dan interval
kepercayaan semakin sempit. Selain itu, ukuran sampel yang besar
meningkatkan power uji statistik dan mengurangi risiko kesalahan tipe
II. Melalui Teorema Limit Pusat, sampel besar juga membuat asumsi
normalitas lebih dapat diandalkan. Namun, ukuran sampel harus tetap
diimbangi dengan kualitas dan representativitas data agar inferensi yang
dihasilkan tetap valid.
Uji t Dua Sampel
(Pengujian A/B)
Tim analitik produk melakukan uji A/B
untuk membandingkan durasi sesi rata-rata (menit)
antara dua versi dari laman arahan.
Data Uji A/B
Data Uji A/B - Durasi Sesi Rata-rata
| Version |
Sample Size (n) |
Mean |
Std Dev |
| A |
25 |
4.8 |
1.2 |
| B |
25 |
5.4 |
1.4 |
Catatan: Data untuk uji statistik perbandingan Versi A dan B.
Tugas
- Formulasikan hipotesis nol dan alternatif.
- Tentukan jenis uji t yang diperlukan.
- Hitung statistik uji dan nilai
p.
- Tarik kesimpulan statistik pada \(\alpha =
0.05\).
- Interpretasikan hasil untuk pengambilan keputusan
produk.
Penyelesaian Studi Kasus 3
Hipotesis nol (H₀) menyatakan bahwa tidak
terdapat perbedaan yang signifikan antara rata-rata durasi sesi pengguna
pada laman arahan Versi A dan Versi B, atau dengan kata lain
μ_A = μ_B. Sementara itu, hipotesis alternatif (H₁)
menyatakan bahwa terdapat perbedaan yang signifikan antara kedua versi
tersebut, yaitu μ_A ≠ μ_B, yang berarti durasi sesi rata-rata
pada salah satu versi secara statistik lebih tinggi atau lebih rendah
dibandingkan versi lainnya. Pengujian ini bersifat dua arah
(two-tailed) karena tujuan utamanya adalah mengidentifikasi keberadaan
perbedaan, tanpa mengasumsikan arah tertentu mana yang lebih unggul
terlebih dahulu.
Uji statistik yang digunakan dalam kasus ini adalah uji-t dua
sampel independen dengan asumsi varians sama (pooled two-sample
t-test). Uji ini dipilih karena bertujuan membandingkan rata-rata durasi
sesi antara dua kelompok pengguna yang berbeda, yaitu Versi A dan Versi
B, dengan jumlah sampel yang sama pada masing-masing kelompok (25
responden) serta data yang bersifat kuantitatif kontinu. Selain itu,
nilai simpangan baku kedua kelompok relatif tidak jauh berbeda (1,2 dan
1,4), sehingga asumsi kesamaan varians dapat diterima dan penggunaan
varian gabungan dianggap sesuai untuk memperoleh estimasi kesalahan
standar yang lebih akurat.
Perhitungan Uji-t Dua Sampel
Perhitungan Uji-t Dua Sampel
| Versi |
n |
x̄ |
s |
| A |
25 |
4.8 |
1.2 |
| B |
25 |
5.4 |
1.4 |
1. Hitung selisih rata-rata
x̄₁ - x̄₂ = 4.8 - 5.4 = -0.6
2. Hitung simpangan baku gabungan (s_p)
s_p = √[((24)(1.2²) + (24)(1.4²)) / 48]
= √[(34.56 + 47.04) / 48] = √[81.6 / 48]
= √1.7 ≈ 1.3038
3. Hitung penyebut (standard error)
s_p √(1/25 + 1/25) = 1.3038 √(0.04 + 0.04)
= 1.3038 √0.08 = 1.3038 × 0.2828 ≈ 0.3686
4. Hitung statistik uji t
t = -0.6 / 0.3686 ≈ -1.628
Statistik Uji t
t ≈ -1.628
5. Hitung nilai p
df = 48, t = -1.628 → nilai p ≈ 0.110
Nilai p (p-value)
p ≈ 0.110
Berdasarkan hasil pengujian statistik menggunakan uji-t dua sampel pada
tingkat signifikansi α = 0,05, diperoleh nilai p-value sebesar
0,110 yang lebih besar dari nilai α. Oleh karena itu,
hipotesis nol (H₀) tidak dapat ditolak, sehingga tidak
terdapat bukti statistik yang cukup untuk menyatakan adanya perbedaan
yang signifikan antara rata-rata durasi sesi pada Versi A (4,8 menit)
dan Versi B (5,4 menit). Dengan demikian, selisih rata-rata
sebesar 0,6 menit yang terlihat pada data sampel dapat dianggap sebagai
variasi yang terjadi secara acak dan belum menunjukkan
keunggulan yang nyata dari salah satu versi terhadap durasi
sesi pengguna.
Berdasarkan Perhitungan diatas menunjukkan bahwa tidak terdapat
perbedaan yang signifikan secara statistik antara durasi sesi pengguna
pada Versi A dan Versi B. Dalam konteks pengambilan keputusan
produk, hal ini berarti bahwa perubahan yang diterapkan pada Versi B
belum terbukti memberikan peningkatan keterlibatan pengguna yang nyata
dibandingkan Versi A. Oleh karena itu, tim produk sebaiknya tidak
langsung mengganti Versi A dengan Versi B hanya berdasarkan durasi sesi.
Diperlukan evaluasi lanjutan, seperti pengujian dengan ukuran sampel
yang lebih besar sebelum mengambil keputusan implementasi produk secara
penuh.
Uji Chi-Kuadrat untuk
Independensi
Sebuah perusahaan e-commerce meneliti apakah
jenis perangkat yang digunakan sesuai dengan
preferensi metode pembayaran.
Data Pembayaran per Perangkat
Data Frekuensi Pembayaran per Perangkat
| Perangkat / Pembayaran |
Dompet Digital |
Kartu Kredit |
Bayar di Tempat |
| 120 |
80 |
50 |
| 60 |
90 |
40 |
Catatan: Data menunjukkan jumlah transaksi berdasarkan metode pembayaran dan jenis perangkat.
Tugas
- Nyatakan Hipotesis Nol (H₀) dan Hipotesis
Alternatif (H₁).
- Identifikasi uji statistik yang sesuai.
- Hitung statistik Chi-Square (χ²).
- Tentukan nilai p pada \(\alpha = 0.05\).
- Interpretasikan hasil dalam konteks strategi pembayaran
digital.
Penyelesaian Studi Kasus 4
Hipotesis nol (H₀) menyatakan bahwa tidak
terdapat hubungan antara jenis perangkat yang digunakan, yaitu
mobile atau desktop, dengan preferensi metode pembayaran seperti dompet
digital, kartu kredit, maupun pembayaran di tempat. Artinya, pola
pemilihan metode pembayaran dianggap sama pada kedua kelompok pengguna.
Sebaliknya, hipotesis alternatif (H₁) menyatakan bahwa
terdapat hubungan yang signifikan antara jenis perangkat dan
preferensi metode pembayaran, yang menunjukkan adanya perbedaan
kecenderungan pilihan pembayaran antara pengguna perangkat mobile dan
desktop.
Uji statistik yang sesuai untuk analisis ini adalah Uji
Chi-Square untuk Homogenitas Proporsi. Data yang digunakan
berupa frekuensi kategorik. Data tersebut berasal dari dua
kelompok independen, yaitu pengguna mobile dan desktop. Uji ini
digunakan untuk menguji kesamaan distribusi proporsi antar kelompok.
Hipotesis nol menyatakan bahwa proporsi pilihan metode pembayaran pada
kedua kelompok adalah sama. Perhitungan dilakukan dengan membandingkan
frekuensi observasi dan frekuensi harapan. Dengan demikian, uji ini
dapat menentukan ada atau tidaknya perbedaan yang signifikan secara
statistik.
Perhitungan Chi-Square
Perhitungan Chi-Square (χ²)
Data Observasi (Oᵢⱼ)
| Perangkat / Pembayaran |
Dompet Digital |
Kartu Kredit |
Bayar di Tempat |
Total |
| Mobile |
120 |
80 |
50 |
250 |
| Desktop |
60 |
90 |
40 |
190 |
| Total |
180 |
170 |
90 |
440 |
Data frekuensi observasi pembayaran berdasarkan perangkat
Langkah 1: Hitung Frekuensi Harapan (Eᵢⱼ)
Mobile - Dompet Digital: (250 × 180) / 440 = 45000 / 440 ≈ 102.27
Mobile - Kartu Kredit: (250 × 170) / 440 = 42500 / 440 ≈ 96.59
Mobile - Bayar di Tempat: (250 × 90) / 440 = 22500 / 440 ≈ 51.14
Desktop - Dompet Digital: (190 × 180) / 440 = 34200 / 440 ≈ 77.73
Desktop - Kartu Kredit: (190 × 170) / 440 = 32300 / 440 ≈ 73.41
Desktop - Bayar di Tempat: (190 × 90) / 440 = 17100 / 440 ≈ 38.86
Langkah 2: Hitung (O - E)²/E untuk Setiap Sel
Mobile - Dompet Digital: (120 - 102.27)²/102.27 = 17.73²/102.27 ≈ 3.073
Mobile - Kartu Kredit: (80 - 96.59)²/96.59 = (-16.59)²/96.59 ≈ 2.849
Mobile - Bayar di Tempat: (50 - 51.14)²/51.14 = (-1.14)²/51.14 ≈ 0.025
Desktop - Dompet Digital: (60 - 77.73)²/77.73 = (-17.73)²/77.73 ≈ 4.044
Desktop - Kartu Kredit: (90 - 73.41)²/73.41 = 16.59²/73.41 ≈ 3.749
Desktop - Bayar di Tempat: (40 - 38.86)²/38.86 = 1.14²/38.86 ≈ 0.033
Langkah 3: Jumlahkan Semua Nilai
χ² = 3.073 + 2.849 + 0.025 + 4.044 + 3.749 + 0.033
χ² ≈ 13.773
Langkah 4: Hitung Derajat Kebebasan
df = (r - 1)(c - 1) = (2 - 1)(3 - 1) = 1 × 2 = 2
Hsil Perhitungan Chi-Square
χ² ≈ 13.773
Derajat Kebebasan (df) = 2
Nilai kritis χ² (α=0.05, df=2) = 5.991
Berdasarkan hasil uji Chi-Square diperoleh nilai χ² = 13,773 dengan
derajat kebebasan 2 dan p-value sekitar 0,001, yang lebih kecil dari
tingkat signifikansi α = 0,05. Oleh karena itu, hipotesis nol
ditolak dan hipotesis alternatif diterima. Hasil ini
menunjukkan adanya hubungan yang signifikan secara
statistik antara jenis perangkat yang digunakan (mobile atau
desktop) dan preferensi metode pembayaran. Dengan demikian, dapat
disimpulkan bahwa pilihan metode pembayaran pengguna memang
berbeda berdasarkan perangkat yang mereka gunakan, dengan tingkat
kepercayaan sebesar 95%.
Hasil analisis statistik menunjukkan bahwa jenis perangkat yang
digunakan pengguna berpengaruh signifikan terhadap preferensi metode
pembayaran. Pengguna mobile cenderung memilih dompet digital
karena kemudahan dan kecepatan transaksi, sedangkan pengguna desktop
lebih sering menggunakan kartu kredit yang dianggap lebih nyaman dan
aman. Temuan ini memberikan implikasi strategis bagi platform digital
untuk menyesuaikan dan mengoptimalkan opsi pembayaran
berdasarkan perangkat yang digunakan, sehingga proses transaksi
menjadi lebih efisien. Dengan strategi pembayaran yang selaras dengan
preferensi pengguna, perusahaan berpotensi meningkatkan tingkat konversi
serta kepuasan pengguna secara berkelanjutan.
Kesalahan Tipe I dan
Tipe II (Konseptual)
Sebuah startup fintech menguji apakah algoritma
deteksi penipuan baru dapat mengurangi transaksi penipuan.
- H₀: Algoritma baru tidak mengurangi
penipuan.
- H₁: Algoritma baru mengurangi
penipuan.
Tugas
- Jelaskan Kesalahan Tipe I (α) dalam konteks
ini.
- Jelaskan Kesalahan Tipe II (β) dalam konteks
ini.
- Identifikasi kesalahan mana yang lebih merugikan dari
perspektif bisnis.
- Diskusikan bagaimana ukuran sampel memengaruhi
Kesalahan Tipe II.
- Jelaskan hubungan antara α, β, dan daya
statistik.
Penyelesaian Studi Kasus 5
Kesalahan Tipe I (α) dalam konteks ini terjadi apabila
startup fintech menolak hipotesis nol (H₀) yang
menyatakan bahwa algoritma deteksi penipuan baru tidak mengurangi
transaksi penipuan, padahal pada kenyataannya algoritma tersebut memang
tidak efektif. Artinya, perusahaan secara keliru
menyimpulkan bahwa algoritma baru mampu menurunkan tingkat
penipuan, sehingga berisiko mengadopsi sistem yang tidak memberikan
manfaat nyata dan dapat menimbulkan konsekuensi operasional maupun
finansial.
Kesalahan Tipe II (β) dalam konteks pengujian algoritma
deteksi penipuan ini terjadi ketika startup gagal mendeteksi
bahwa algoritma baru sebenarnya lebih efektif mengurangi
transaksi penipuan, sehingga kesimpulan yang diambil adalah algoritma
tersebut tidak berpengaruh padahal dalam kenyataannya algoritma itu
memang berhasil menurunkan tingkat penipuan. Akibatnya, startup
memutuskan untuk tidak mengimplementasikan algoritma yang efektif
tersebut, sehingga terus mengalami kerugian finansial akibat
penipuan yang sebenarnya dapat dicegah, kehilangan peluang meningkatkan
keamanan platform, dan berpotensi mengurangi kepercayaan pengguna karena
sistem deteksi yang kurang optimal tetap digunakan.
Dari perspektif bisnis, Kesalahan Tipe II (β) lebih
merugikan karena menyebabkan startup terus mengalami
kerugian finansial akibat transaksi penipuan yang seharusnya bisa
dicegah oleh algoritma baru yang efektif, sementara Kesalahan
Tipe I hanya mengakibatkan pemborosan biaya pengembangan dan integrasi
algoritma yang ternyata tidak efektif, yang kerugiannya lebih terbatas
dan dapat diperbaiki dengan evaluasi ulang.
A. Sampel Besar Mengurangi Risiko Kesalahan Tipe II
Ukuran sampel yang besar meningkatkan power statistik
(1-β), yaitu kemampuan untuk mendeteksi efek atau
perbedaan yang sebenarnya ada. Dalam konteks pengujian
algoritma deteksi penipuan, sampel yang besar (misalnya ribuan
transaksi) memungkinkan pendeteksian penurunan tingkat penipuan yang
kecil sekalipun, sehingga mengurangi kemungkinan
startup gagal mengenali efektivitas algoritma baru yang
sebenarnya bermanfaat.
B. Sampel Kecil Meningkatkan Risiko Kesalahan Tipe
II
Sampel yang kecil menghasilkan estimasi yang kurang presisi dan
variabilitas yang tinggi, sehingga perbedaan nyata dalam
efektivitas algoritma (misalnya penurunan penipuan dari 5% menjadi 3%)
mungkin tidak mencapai signifikansi statistik. Akibatnya,
startup berisiko salah menyimpulkan bahwa algoritma baru tidak
efektif, padahal sebenarnya efektif, yang menyebabkan kerugian
berkelanjutan karena penipuan yang terus terjadi.
Tingkat signifikansi α menunjukkan risiko melakukan Kesalahan
Tipe I, yaitu menolak hipotesis nol ketika hipotesis
tersebut benar, sedangkan β menunjukkan risiko
Kesalahan Tipe II, yaitu gagal menolak hipotesis nol saat hipotesis
alternatif benar, dengan daya statistik didefinisikan sebagai
1 − β. Ketika nilai α diperbesar,
kriteria penolakan menjadi lebih longgar sehingga daya statistik
meningkat dan β menurun, sementara penurunan
α untuk menghindari Kesalahan Tipe I justru menurunkan
daya statistik dan meningkatkan β. Oleh karena itu,
untuk mencapai daya statistik yang tinggi tanpa meningkatkan
α secara signifikan, diperlukan penambahan ukuran
sampel yang memadai.
Nilai-p dan Proses
Pengambilan Keputusan Statistik
Evaluasi model prediksi churn menghasilkan hasil sebagai berikut:
- Statistik uji = 2.31
- Nilai p = 0.021
- Tingkat signifikansi: \(\alpha =
0.05\)
Tugas
- Jelaskan arti dari nilai p.
- Buatlah keputusan statistik.
- Terjemahkan keputusan tersebut ke dalam bahasa
non-teknis untuk manajemen.
- Bahas risiko jika sampel tidak representatif.
- Jelaskan mengapa nilai p tidak mengukur ukuran
efek.
Penyelesaian Studi Kasus 6
Nilai p (p-value) secara umum adalah
probabilitas untuk mendapatkan hasil sampel yang setidaknya sama
ekstremnya dengan yang diamati, dengan asumsi bahwa hipotesis nol (H₀)
benar, di mana nilai p yang semakin kecil menunjukkan
semakin tidak mungkinnya hasil tersebut terjadi hanya karena kebetulan
semata jika H₀ memang benar, sehingga nilai p yang lebih rendah
dari tingkat signifikansi yang ditetapkan (biasanya α = 0,05) memberikan
bukti statistik yang cukup untuk menolak H₀ dan mendukung adanya efek
atau perbedaan yang signifikan secara statistik, meskipun penting untuk
diingat bahwa nilai p tidak mengukur besarnya efek atau kepentingan
praktis dari temuan tersebut.
Berdasarkan hasil evaluasi model prediksi churn dengan nilai p = 0,021
dan tingkat signifikansi α = 0,05, karena p < α (0,021 < 0,05),
maka hipotesis nol (H₀) ditolak.Artinya, terdapat
bukti statistik yang cukup untuk menyimpulkan bahwa model prediksi churn
tersebut signifikan secara statistik dan hasil yang diperoleh
(statistik uji = 2,31) tidak dapat dianggap terjadi hanya karena
kebetulan semata.
Berdasarkan hasil pengujian,model prediksi churn terbukti
efektif dan bukan kebetulan semata, sehingga mampu secara
konsisten mengidentifikasi pelanggan yang berpotensi berhenti
menggunakan layanan. Dengan kata lain, manajemen dapat mempercayai
prediksi model ini sebagai dasar untuk mengambil langkah-langkah
strategis, seperti memberikan penawaran khusus atau layanan tambahan
kepada pelanggan yang berisiko churn, guna meningkatkan retensi dan
kepuasan pelanggan.
Jika sampel tidak representatif, ada risiko bahwa model
prediksi churn yang dibangun tidak mencerminkan perilaku seluruh
populasi pelanggan. Akibatnya, pola churn yang terdeteksi pada
sampel mungkin berbeda ketika diterapkan pada pelanggan nyata, sehingga
keputusan bisnis yang diambil berdasarkan model tersebut bisa
tidak akurat atau menyesatkan. Hal ini dapat
menyebabkan sumber daya dialokasikan secara kurang efektif, intervensi
retensi gagal mencapai target, dan potensi kerugian finansial atau
kehilangan pelanggan meningkat. Oleh karena itu, memastikan sampel yang
representatif dan seimbang sangat penting untuk validitas
prediksi dan efektivitas strategi yang diambil.
Nilai p tidak mengukur besarnya efek praktis karena hanya
mencerminkan signifikansi statistik, yakni probabilitas
mendapatkan hasil setidaknya seekstrem pengamatan saat hipotesis nol
benar adanya. Nilai p tidak mengindikasikan seberapa pengaruh atau
perbedaan tersebut dalam aplikasi nyata. Contohnya, efek kecil dapat
signifikan dengan sampel besar, sedangkan efek besar mungkin tidak
signifikan jika sampel terbatas. Karenanya, evaluasi dampak bisnis atau
populasi memerlukan metrik efek pelengkap, seperti koefisien model, odds
ratio, atau selisih rata-rata.
Referensi
[1] H. Ismail and H. Fajri, Statistika untuk penelitian pendidikan
dan ilmu-ilmu sosial. Jakarta, Indonesia: Kencana, 2018.
[2] A. Fauzy, “Distribusi chi-kuadrat,” Jurnal MIPA IKIP Malang,
vol. 25, no. 1, pp. 103–111, ISSN 0854-8269.
[3] C. Savitri et al., Statistik multivariat dalam riset, 2021.
