Study Cases Statistical Inferences

1 Studi Kasus 1

Uji Z Satu Sampel (Hipotesis Statistik)

Sebuah platform pembelajaran digital mengklaim bahwa rata-rata waktu belajar harian penggunanya adalah 120 menit. Berdasarkan catatan historis, simpangan baku populasi diketahui yaitu 15 menit.

Sebuah sampel acak dari 64 pengguna menunjukkan rata-rata waktu belajar 116 menit.

\[ \begin{eqnarray*} \mu_0 &=& 120 \\ \sigma &=& 15 \\ n &=& 64 \\ \bar{x} &=& 116 \end{eqnarray*} \]

Tugas

Menentukan Hipotesis Nol (H₀) dan Hipotesis Alternatif (H₁).
Identifikasi uji statistik yang sesuai dan justifikasi pilihan Anda.
Hitung statistik pengujian dan p-value menggunakan \(\alpha\ = 0.05\).
Menentukan keputusan statistik.
Menafsirkan hasilnya dalam konteks analitik bisnis.

Jawaban Studi Kasus 1

1.1 Menentukan Hipotesis Nol (H₀) dan Hipotesis Alternatif (H₁)

Platform pembelajaran digital mengklaim bahwa rata-rata waktu belajar harian penggunanya adalah 120 menit. Nilai ini digunakan sebagai nilai acuan (baseline) dalam pengujian hipotesis statistik, dan dirumuskan sebagai berikut:

Hipotesis Nol (H₀):
Rata-rata waktu belajar harian pengguna sama dengan 120 menit.
\[ H_0: \mu = 120 \] Hipotesis nol digunakan sebagai asumsi awal dan menyatakan bahwa tidak terdapat perbedaan antara rata-rata populasi dan nilai klaim.
Hipotesis Alternatif (H₁):
Rata-rata waktu belajar harian pengguna tidak sama dengan 120 menit.
\[ H_1: \mu \neq 120 \] Hipotesis alternatif menyatakan adanya perbedaan antara rata-rata populasi dan nilai klaim, serta digunakan karena arah perbedaan tidak ditentukan dalam soal.

1.2 Identifikasi uji statistik yang sesuai dan alasannya

Uji statistik yang digunakan dalam studi kasus ini adalah uji Z satu sampel (One-Sample Z-Test).

Uji ini dipilih karena tujuan analisis adalah untuk menguji rata-rata populasi berdasarkan satu sampel data (64 pengguna).
Selain itu, simpangan baku populasi diketahui (σ = 15 menit) dan ukuran sampel > 30 (n = 64), sehingga distribusi sampling dari rata-rata dapat diasumsikan mengikuti distribusi normal.

Pengujian dilakukan secara dua arah karena penelitian ini hanya ingin mengetahui apakah rata-rata populasi berbeda dari nilai klaim, tanpa melihat apakah perbedaannya lebih besar atau lebih kecil.

1.3 Hitung statistik uji-Z dan p-value α = 0.05

Statistik Uji Z:
\[ \begin{aligned} Z &= \frac{\bar{x} - \mu_0}{\frac{\sigma}{\sqrt{n}}} \\ Z &= \frac{116 - 120}{\frac{15}{\sqrt{64}}} = \frac{-4}{\frac{15}{8}} = \frac{-4}{1.875} = -2.13 \end{aligned} \]
Hitung p-value:
Nilai p-value dihitung untuk mengetahui probabilitas memperoleh nilai statistik uji yang sama ekstremnya atau lebih ekstrem, dengan asumsi bahwa hipotesis nol benar. Karena pengujian dilakukan dua arah, maka p-value dihitung sebagai dua kali probabilitas di satu sisi distribusi normal standar, dengan rumus: \[\begin{aligned}p\text{ - value} &= 2 \times P(Z \le -|z|)\end{aligned}\]

Dengan nilai statistik uji Z = −2.13, maka: \[ \begin{aligned} p\text{ - value} &= 2 \times P(Z \le -|z|) \\ &= 2 \times P(Z \le -|-2.13|) \\ &= 2 \times P(Z \le -2.13) \end{aligned} \]

Berdasarkan tabel distribusi Z atau normal standar, diperoleh: \[ \begin{aligned} P(Z \le -2.13) &= 0.0166 \end{aligned} \]

Sehingga: \[ \begin{aligned} p\text{ - value} &= 2 \times 0.0166 \\ &= 0.0332 \end{aligned} \]

Hitung Uji Statistik Z dan p-value Menggunakan Kode R

Statistik	Nilai
Nilai Z	-2.1333
p-value	0.0332

1.4 Menentukan keputusan statistik

Berdasarkan hasil perhitungan pada Tugas 3, diperoleh nilai p-value sebesar 0.0332. Nilai ini dibandingkan dengan tingkat signifikansi yang digunakan, yaitu \(\alpha\ = 0.05\).

Karena p-value lebih kecil dari \(\alpha\ (0.0332 < 0.05)\), maka hasil pengujian menunjukkan bahwa rata-rata sampel yang diperoleh memiliki perbedaan yang signifikan secara statistik terhadap nilai rata-rata yang diklaim.

Dengan demikian, pada tingkat signifikansi 5%, hipotesis nol (H₀) ditolak.

1.5 Menafsirkan hasilnya dalam konteks analitik bisnis

Berdasarkan hasil pengujian statistik, diperoleh keputusan untuk menolak hipotesis nol. Hal ini menunjukkan bahwa terdapat bukti yang cukup untuk menyatakan bahwa rata-rata populasi berbeda dari nilai rata-rata yang diklaim.

Dalam konteks analitik bisnis, hasil ini mengindikasikan bahwa klaim rata-rata waktu belajar 120 menit tidak sepenuhnya mencerminkan kondisi aktual pengguna. Oleh karena itu, perusahaan perlu meninjau kembali asumsi tersebut, misalnya untuk menyesuaikan strategi konten, durasi modul pembelajaran, atau evaluasi keterlibatan pengguna berdasarkan data yang lebih akurat.

2 Studi Kasus 2

Uji T Satu Sampel (σ Tidak Diketahui, Sampel Kecil)

Sebuah Tim Riset UX menyelidiki apakah rata-rata waktu penyelesaian tugas dari aplikasi baru berbeda dari 10 menit.

Data berikut dikumpulkan dari 10 pengguna:

\[ 9.2,\; 10.5,\; 9.8,\; 10.1,\; 9.6,\; 10.3,\; 9.9,\; 9.7,\; 10.0,\; 9.5 \]

Tugas

Menentukan Hipotesis Nol (H₀) dan Hipotesis Alternatif (H₁) (dua arah).
Tentukan uji hipotesis yang sesuai.
Hitung uji t-statistik dan p-value pada \(\alpha\ = 0.05\).
Menentukan keputusan statistik.
Menjelaskan bagaimana ukuran sampel memengaruhi keandalan inferensi statistik.

Jawaban Studi Kasus 2

2.1 Menentukan Hipotesis Nol (H₀) dan Hipotesis Alternatif (H₁) (dua arah).

Tim Riset UX ingin mengevaluasi apakah rata-rata waktu penyelesaian tugas pada aplikasi baru berbeda dari 10 menit sebagai nilai acuan (baseline) berdasarkan standar sebelumnya, sehingga hipotesis statistik dirumuskan sebagai berikut:

Hipotesis nol (H₀)
Rata-rata waktu penyelesaian tugas pengguna pada aplikasi baru sama dengan 10 menit. \[ H_0 : \mu = 10 \] Hipotesis nol digunakan sebagai asumsi awal dan menyatakan bahwa tidak terdapat perbedaan antara rata-rata populasi dan nilai acuan.
Hipotesis alternatif (H₁)
Rata-rata waktu penyelesaian tugas pengguna pada aplikasi baru tidak sama dengan 10 menit. \[ H_1 : \mu \neq 10 \] Hipotesis alternatif menyatakan bahwa terdapat perbedaan antara rata-rata populasi dan nilai acuan, tanpa menentukan arah perbedaan, sehingga pengujian dilakukan secara dua arah.

2.2 Tentukan uji hipotesis yang sesuai

Uji statistik yang digunakan dalam studi kasus ini adalah uji t satu sampel (one-sample t-test).

Uji ini digunakan untuk menguji rata-rata populasi berdasarkan satu sampel data, dengan tujuan membandingkan rata-rata waktu penyelesaian tugas dengan nilai acuan sebesar 10 menit.
Uji t dipilih karena simpangan baku populasi tidak diketahui dan ukuran sampel relatif kecil (n = 10), sehingga asumsi distribusi normal pada uji Z tidak terpenuhi secara langsung.

Pengujian dilakukan secara dua arah, karena analisis hanya ingin mengetahui apakah rata-rata waktu penyelesaian tugas berbeda dari 10 menit, tanpa menentukan arah perbedaannya.

2.3 Hitung uji t-statistik dan p-value pada α = 0.05

Sampel: \(9.2,\; 10.5,\; 9.8,\; 10.1,\; 9.6,\; 10.3,\; 9.9,\; 9.7,\; 10.0,\; 9.5,\)
Rata-rata sampel (\(\bar{x}\)):
\[ \begin{aligned} \bar{x} &= \frac{1}{n}\sum_{i=1}^{n} x_i \\ &= \frac{9.2 + 10.5 + 9.8 + 10.1 + 9.6 + 10.3 + 9.9 + 9.7 + 10.0 + 9.5}{10} \\ &= \frac{98.6}{10} \\ &= 9.86 \end{aligned} \]
Simpangan Baku Sampel: \[ \begin{aligned} s &= \sqrt{\frac{\sum_{i=1}^{n} (x_i - \bar{x})^2}{n - 1}} \\ s &= \sqrt{\frac{(9.2 - 9.86)^2 + (10.5 - 9.86)^2 + \cdots + (9.5 - 9.86)^2}{9}} \\ &\approx 0.386 \end{aligned} \]
Standar Kesalahan: \[ \begin{aligned} SE &= \frac{s}{\sqrt{n}} = \frac{0.386}{\sqrt{10}} \approx 0.122 \end{aligned} \]
Statistik Uji t:
\[\bar{x} = 9.86, \quad \mu_0 = 10, \quad SE = 0.122 \] \[ \begin{aligned} t &= \frac{\bar{x} - \mu_0}{SE} \\ &= \frac{9.86 - 10}{0.122} \\ &= \frac{-0.14}{0.122} \\ &\approx -1.147 \end{aligned} \]
Hitung p-value:
Rumus p-value untuk uji t dua arah adalah: \[\begin{aligned}p\text{ - value} &= 2 \times P(t \le -|t|)\end{aligned}\]

Dengan nilai statistik uji t = −1.147, maka: \[ \begin{aligned} p\text{ - value} &= 2 \times P(t \le - |t|) \\ &= 2 \times P(t \le - |-1.147|) \\ &= 2 \times P(t \le - 1.147) \end{aligned} \]

Berdasarkan tabel distribusi t dengan \(df = 9\), diperoleh: \[ \begin{aligned} P(t \le - 1.147) &= 0.1403 \end{aligned} \]

Sehingga: \[ \begin{aligned} p\text{ - value} &= 2 \times 0.1403 \\ &= 0.2806 \end{aligned} \]

Hitung Uji Statistik t dan p-value Menggunakan Kode R

Statistik	Nilai
Rata-rata Sampel	9.860
Nilai t	-1.146
Derajat Bebas (df)	9.000
p-value	0.281

2.4 Menentukan keputusan statistik

Berdasarkan hasil perhitungan pada Tugas 3, diperoleh nilai p-value sebesar \(p\text{-value} = 0.2806\).
Nilai tersebut dibandingkan dengan tingkat signifikansi yang digunakan, yaitu \(\alpha = 0.05\).

Karena nilai p-value lebih besar dari \(\alpha\), yaitu \(0.2806 > 0.05\), maka hasil pengujian menunjukkan bahwa tidak terdapat perbedaan yang signifikan secara statistik antara rata-rata sampel dan nilai yang diklaim.

Dengan demikian, pada tingkat signifikansi sebesar 5%, hipotesis nol \((H_0)\) gagal ditolak.

2.5 Jelaskan bagaimana ukuran sampel memengaruhi keandalan inferensial

Ukuran sampel merupakan faktor penting dalam inferensi statistik karena memengaruhi ketepatan estimasi dan kekuatan uji statistik. Pada studi kasus ini, ukuran sampel yang digunakan relatif kecil (n = 10). Ukuran sampel yang kecil menyebabkan standar kesalahan menjadi lebih besar dan daya uji statistik menjadi lebih rendah, sehingga kemungkinan terjadinya kesalahan Tipe II meningkat. Akibatnya, perbedaan yang sebenarnya ada di populasi mungkin tidak terdeteksi secara signifikan secara statistik.

Oleh karena itu, hasil inferensi pada studi kasus ini perlu ditafsirkan secara hati-hati. Penggunaan ukuran sampel yang lebih besar akan meningkatkan keandalan estimasi dan kekuatan kesimpulan statistik.

3 Studi Kasus 3

Uji T Dua Sampel (Pengujian A/B)

Tim analitik produk melakukan uji A/B untuk membandingkan durasi sesi rata-rata (menit) antara dua versi halaman landing.

Versi	Ukuran Sampel (n)	Rata-rata	Simpangan Baku
A	25	4.8	1.2
B	25	5.4	1.4

Tugas

Menentukan hipotesis nol dan alternatif.
Identifikasi jenis uji-t yang diperlukan.
Hitung statistik uji t dan p-value.
Menentukan kesimpulan statistik pada \(\alpha\ = 0.05\).
Menafsirkan hasil untuk pengambilan keputusan produk.

Jawaban Studi Kasus 3

3.1 Menentukan Hipotesis Nol (H₀) dan Hipotesis Alternatif (H₁)

Tujuan dari studi kasus ini adalah membandingkan rata-rata durasi sesi pengguna antara dua versi landing page, yaitu Versi A dan Versi B. Oleh karena itu, hipotesis statistik dirumuskan sebagai berikut.

Hipotesis Nol (\(H_0\))
Tidak terdapat perbedaan rata-rata durasi sesi pengguna antara landing page Versi A dan Versi B. \[ H_0 : \mu_A = \mu_B \]
Hipotesis Alternatif (\(H_1\))
Terdapat perbedaan rata-rata durasi sesi pengguna antara landing page Versi A dan Versi B. \[ H_1 : \mu_A \neq \mu_B \]

3.2 Identifikasi jenis uji-t yang diperlukan

Uji statistik yang digunakan adalah uji t dua sampel independen (independent two-sample t-test)

Karena data berasal dari dua kelompok pengguna yang saling independen, yaitu pengguna landing page Versi A dan Versi B.
Selain itu, simpangan baku populasi tidak diketahui dan ukuran sampel relatif kecil, sehingga uji t lebih sesuai dibandingkan uji Z.

Pengujian dilakukan secara dua arah, karena hipotesis alternatif menyatakan adanya perbedaan rata-rata tanpa menentukan arah perbedaan secara spesifik.

3.3 Hitung statistik uji t dan p-value

Rumus statistik uji t (dua sampel independen):
\[ t = \frac{\bar{x}_A - \bar{x}_B} {\sqrt{\dfrac{s_A^2}{n_A} + \dfrac{s_B^2}{n_B}}} \]
Statistik uji t: \[ \begin{aligned} t &= \frac{4.8 - 5.4} {\sqrt{\dfrac{1.2^2}{25} + \dfrac{1.4^2}{25}}} \\[6pt] &= \frac{-0.6} {\sqrt{\dfrac{1.44}{25} + \dfrac{1.96}{25}}} \\[6pt] &= \frac{-0.6} {\sqrt{\dfrac{3.40}{25}}} \\[6pt] &= \frac{-0.6} {\sqrt{0.136}} \\[6pt] &= \frac{-0.6}{0.369} \\[6pt] &\approx -1.63 \end{aligned} \]
Hitung p-value:
Derajat Kebebasan:
\[ df = \frac{\left( \frac{s_A^2}{n_A} + \frac{s_B^2}{n_B} \right)^2} {\frac{\left( \frac{s_A^2}{n_A} \right)^2}{n_A - 1} + \frac{\left( \frac{s_B^2}{n_B} \right)^2}{n_B - 1}} \\[6pt] df = \frac{\left( \frac{1.2^2}{25} + \frac{1.4^2}{25} \right)^2} {\frac{\left( \frac{1.2^2}{25} \right)^2}{24} + \frac{\left( \frac{1.4^2}{25} \right)^2}{24}} = \frac{(0.0576 + 0.0784)^2} {\frac{0.0576^2}{24} + \frac{0.0784^2}{24}} = \frac{0.136^2}{0.000138 + 0.000256} \approx 47 \] Derajat kebebasan dihitung menggunakan pendekatan Welch–Satterthwaite karena simpangan baku kedua sampel tidak diasumsikan sama.

Rumus p-value untuk uji t dua arah adalah:
\[ p\text{-value} = 2 \times P(t \le -|t|) \] Dengan nilai statistik uji \(t = -1.63\), maka:
\[ \begin{aligned} p\text{-value} &= 2 \times P(t \le -|t|) \\ &= 2 \times P(t \le -|-1.63|) \\ &= 2 \times P(t \le -1.63) \end{aligned} \] Berdasarkan tabel distribusi t dengan derajat bebas \(df = 47\), diperoleh:
\[ P(t \le -1.63) \approx 0.055 \] Sehingga:
\[ \begin{aligned} p\text{-value} &= 2 \times 0.055 \\ &\approx 0.11 \end{aligned} \]

Hitung Uji Statistik t dan p-value Menggunakan Kode R

Komponen	Nilai
t-statistik	-1.627
Derajat Bebas (df)	47.000
p-value	0.110
Tingkat Signifikansi (α)	0.050

3.4 Menentukan kesimpulan statistik pada α = 0.05

Berdasarkan hasil perhitungan pada Task 3, diperoleh nilai statistik uji \(t \approx -1.63\) dengan nilai \(p\text{-value} \approx 0.11\).
Nilai p-value tersebut dibandingkan dengan tingkat signifikansi yang digunakan, yaitu \(\alpha = 0.05\). Karena \(p\text{-value} > \alpha \quad (0.11 > 0.05)\), maka tidak terdapat bukti statistik yang cukup kuat untuk menolak hipotesis nol (\(H_0\)).

Dengan demikian, pada tingkat signifikansi 5%, hipotesis nol (\(H_0\)) gagal ditolak.

3.5 Menafsirkan hasil untuk pengambilan keputusan produk

Hasil pengujian menunjukkan bahwa tidak terdapat bukti statistik yang cukup untuk menyatakan adanya perbedaan rata-rata durasi sesi pengguna antara landing page Versi A dan Versi B. Perbedaan rata-rata yang teramati kemungkinan disebabkan oleh variasi data sampel.

Implikasi terhadap keputusan produk:
Berdasarkan hasil ini, belum terdapat dasar statistik yang kuat untuk menyimpulkan bahwa salah satu versi landing page lebih efektif dalam meningkatkan durasi sesi pengguna. Oleh karena itu, tim produk belum perlu mengganti landing page yang digunakan hanya berdasarkan hasil pengujian ini.

4 Studi Kasus 4

Uji Chi-Square untuk Independensi

Sebuah perusahaan e-commerce meneliti apakah jenis perangkat berhubungan dengan preferensi metode pembayaran.

Perangkat / Pembayaran	Dompet Digital	Kartu Kredit	Bayar di Tempat
Mobile	120	80	50
Desktop	60	90	40

Tugas

Nyatakan Hipotesis Nol (H₀) dan Hipotesis Alternatif (H₁).
Identifikasi tes statistik yang sesuai.
Hitung statistik Chi-Square (χ²).
Tentukan p-value pada \(\alpha\ = 0.05\).
Tafsirkan hasilnya dalam hal strategi pembayaran digital.

Jawaban Studi Kasus 4

4.1 Menentukan Hipotesis Nol (H₀) dan Hipotesis Alternatif (H₁)

Perusahaan e-commerce ingin mengevaluasi apakah jenis perangkat yang digunakan pengguna berhubungan dengan preferensi metode pembayaran, yang digunakan sebagai dasar analisis perilaku transaksi pengguna. Oleh karena itu, hipotesis statistik dirumuskan sebagai berikut:

Hipotesis Nol (\(H_0\))
Tidak terdapat hubungan antara jenis perangkat yang digunakan pengguna dan metode pembayaran yang dipilih. \[ H_0:\ \text{Jenis perangkat dan metode pembayaran saling independen} \]
Hipotesis Alternatif (\(H_1\))
Terdapat hubungan antara jenis perangkat yang digunakan pengguna dan metode pembayaran yang dipilih. \[ H_1:\ \text{Jenis perangkat dan metode pembayaran tidak independen} \]

4.2 Identifikasi tes statistik yang sesuai

Uji statistik yang digunakan dalam studi kasus ini adalah Uji Chi-Square (χ²) untuk independensi, karena:

Variabel yang dianalisis bersifat kategorik, yaitu:
- Jenis perangkat: Mobile dan Desktop
- Metode pembayaran: E-Wallet, Credit Card, dan Cash on Delivery
Data disajikan dalam bentuk tabel kontingensi yang memuat frekuensi pengamatan.
Tujuan analisis adalah untuk menguji ada atau tidaknya hubungan antara dua variabel kategorik, bukan untuk membandingkan rata-rata atau nilai numerik.

4.3 Hitung statistik Chi-Square (χ²)

Menyusun tabel frekuensi observasi

Perangkat	Dompet Digital	Kartu Kredit	Bayar di Tempat	Total Baris
Mobile	120	80	50	250
Desktop	60	90	40	190
Total Kolom	180	170	90	440

\[ Total Pengamatan: N = 440 \]

Menghitung Frekuensi Harapan
Rumus frekuensi harapan: \[ E_{ij} = \frac{(\text{Total baris}_i)(\text{Total kolom}_j)}{N} \]
Perangkat Mobile:
\[ \begin{aligned} E_{\text{Mobile, Dompet}} &= \frac{250 \times 180}{440} = 102.27 \\[6pt] E_{\text{Mobile, Kredit}} &= \frac{250 \times 170}{440} = 96.59 \\[6pt] E_{\text{Mobile, COD}} &= \frac{250 \times 90}{440} = 51.14 \end{aligned} \]
Perangkat Desktop:
\[ \begin{aligned} E_{\text{Desktop, Dompet}} &= \frac{190 \times 180}{440} = 77.73 \\[6pt] E_{\text{Desktop, Kredit}} &= \frac{190 \times 170}{440} = 73.41 \\[6pt] E_{\text{Desktop, COD}} &= \frac{190 \times 90}{440} = 38.86 \end{aligned} \]
Menghitung Nilai Chi-Square (\(\chi^2\))
Rumus statistik Chi-Square:
\[ \chi^2 = \sum \frac{(O - E)^2}{E} \] Perhitungan tiap sel:
\[ \begin{aligned} \chi^2_{\text{ Mobile, Dompet}} &= \frac{(120 - 102.27)^2}{102.27} = 3.074 \\[6pt] \chi^2_{\text{ Mobile, Kredit}} &= \frac{(80 - 96.59)^2}{96.59} = 2.849 \\[6pt] \chi^2_{\text{ Mobile, COD}} &= \frac{(50 - 51.14)^2}{51.14} = 0.025 \\[6pt] \chi^2_{\text{ Desktop, Dompet}} &= \frac{(60 - 77.73)^2}{77.73} = 4.044 \\[6pt] \chi^2_{\text{ Desktop, Kredit}} &= \frac{(90 - 73.41)^2}{73.41} = 3.749 \\[6pt] \chi^2_{\text{ Desktop, COD}} &= \frac{(40 - 38.86)^2}{38.86} = 0.033 \end{aligned} \]
Menjumlahkan Seluruh Komponen \(\chi^2\)
\[ \begin{aligned} \chi^2 &= 3.07 + 2.85 + 0.03 + 4.05 + 3.75 + 0.03 \\[6pt] &= 13.77 \end{aligned} \]

4.4 Tentukan p-value pada α = 0.05

Nilai statistik uji Chi-Square yang diperoleh pada tugas 3 adalah: \[ \chi^2_{\text{hitung}} = 13.77 \]

Menghitung Derajat Kebebasan (df)
Untuk uji Chi-Square independensi, derajat kebebasan (\(df\)) dihitung dengan rumus: \[ \begin{aligned} df &= (r - 1)(c - 1) \end{aligned} \] dengan:
- \(r\) = jumlah baris (jenis perangkat)
- \(c\) = jumlah kolom (metode pembayaran)
  Pada studi kasus ini:
- Jumlah baris = 2 (Mobile, Desktop)
- Jumlah kolom = 3 (Dompet Digital, Kartu Kredit, Bayar di Tempat)
\[ \begin{aligned} df &= (2 - 1)(3 - 1) \\[6pt] &= 1 \times 2 \\[6pt] &= 2 \end{aligned} \]
Menentukan p-value:
Nilai p-value ditentukan berdasarkan distribusi Chi-Square sebagai berikut: \[ p\text{-value} = P\left(\chi^2 \ge \chi^2_{\text{hitung}}\right) \] \[ p\text{-value} = P\left(\chi^2 \ge 13.77 \mid df = 2\right) \] Berdasarkan tabel distribusi Chi-Square atau perhitungan menggunakan perangkat lunak statistik, diperoleh: \[ p\text{-value} \approx 0.00102 \]

Karena nilai p-value lebih kecil dari tingkat signifikansi yang digunakan \((0.001 < 0.05)\), maka hipotesis nol (H₀) ditolak.

Artinya, terdapat hubungan yang signifikan secara statistik antara jenis perangkat dan metode pembayaran yang dipilih pengguna.

Hitung Uji Statistik chi-square dan p-value Menggunakan Kode R

Komponen	Nilai
Chi-Square Hitung	13.77000
Derajat Kebebasan (df)	2.00000
p-value	0.00102
Alpha (α)	0.05000

4.5 Menafsirkan hasil strategi pembayaran digital

Hasil pengujian menunjukkan bahwa preferensi metode pembayaran pengguna berkaitan dengan jenis perangkat yang digunakan. Pengguna mobile cenderung lebih sering menggunakan dompet digital, sedangkan pengguna desktop lebih banyak memilih kartu kredit. Metode Bayar di Tempat (COD) menunjukkan frekuensi yang relatif lebih kecil dan tidak dominan pada kedua perangkat.

Dalam konteks strategi bisnis, perusahaan dapat:

Memprioritaskan tampilan dan promosi dompet digital pada platform mobile
Mengoptimalkan integrasi kartu kredit pada versi desktop
Menyesuaikan antarmuka pembayaran agar lebih sesuai dengan kebiasaan pengguna

Pendekatan ini berpotensi meningkatkan kenyamanan pengguna dan efisiensi proses transaksi.

5 Studi Kasus 5

Kesalahan Tipe I dan Tipe II (Konseptual)

Sebuah startup fintech menguji apakah algoritma deteksi penipuan baru dapat mengurangi transaksi penipuan.

H₀: Algoritma baru tidak mengurangi penipuan.
H₁: Algoritma baru mengurangi penipuan.

Tugas:

Jelaskan Kesalahan Tipe I (α) dalam konteks ini.
Jelaskan Kesalahan Tipe II (β) dalam konteks ini.
Identifikasi kesalahan mana yang lebih mahal dari perspektif bisnis.
Diskusikan bagaimana ukuran sampel mempengaruhi Kesalahan Tipe II.
Jelaskan hubungan antara α, β, dan daya statistik.

Jawaban Studi Kasus 5

5.1 Jelaskan Kesalahan Tipe I (α) dalam konteks ini

Dalam pengujian hipotesis, Kesalahan Tipe I (α) terjadi ketika Hipotesis Nol (H₀) ditolak, padahal H₀ sebenarnya benar. Dalam konteks studi kasus ini:

H₀: Algoritma deteksi penipuan yang baru tidak mengurangi transaksi penipuan.
Kesalahan Tipe I terjadi apabila perusahaan menyimpulkan bahwa algoritma baru efektif mengurangi penipuan, padahal pada kenyataannya algoritma tersebut tidak memberikan dampak nyata.

Dalam konteks bisnis, kesalahan ini dapat menyebabkan perusahaan mengadopsi dan mengimplementasikan algoritma yang sebenarnya tidak efektif, sehingga sumber daya dialokasikan pada sistem yang tidak memberikan manfaat yang diharapkan.

5.2 Jelaskan Kesalahan Tipe II (β) dalam konteks ini

Kesalahan Tipe II (β) adalah kesalahan yang terjadi ketika Hipotesis Nol (H₀) gagal ditolak, padahal H₀ sebenarnya tidak benar.
Dalam konteks studi kasus ini:

H₀: Algoritma deteksi penipuan yang baru tidak mengurangi transaksi penipuan.
Kesalahan Tipe II (β) terjadi apabila perusahaan menyimpulkan bahwa algoritma baru tidak mengurangi transaksi penipuan, padahal sebenarnya algoritma tersebut memiliki kemampuan untuk menurunkan tingkat penipuan.

Kesalahan ini menyebabkan perusahaan kehilangan kesempatan untuk memanfaatkan sistem deteksi penipuan yang efektif, sehingga risiko dan kerugian akibat transaksi penipuan tetap berlanjut.

5.3 Identifikasi kesalahan mana yang lebih mahal dari perspektif bisnis

Dari perspektif bisnis, Kesalahan Tipe II (β) cenderung lebih mahal dibandingkan Kesalahan Tipe I.

Hal ini karena Kesalahan Tipe II membuat perusahaan gagal mengadopsi algoritma yang sebenarnya efektif, sehingga transaksi penipuan terus terjadi tanpa adanya perbaikan sistem. Dampak bisnis yang dapat timbul meliputi kerugian finansial langsung, meningkatnya biaya penanganan fraud, potensi meningkatnya chargeback, serta penurunan kepercayaan pelanggan terhadap platform.

Sebaliknya, meskipun Kesalahan Tipe I juga menimbulkan biaya karena perusahaan mengadopsi sistem yang tidak efektif, dampaknya relatif lebih mudah dikendalikan dibandingkan kerugian jangka panjang akibat membiarkan fraud terus berlangsung.

5.4 Diskusikan bagaimana ukuran sampel mempengaruhi Kesalahan Tipe II

Ukuran sampel memiliki peran penting dalam menentukan kemungkinan terjadinya Kesalahan Tipe II (β).

Pada ukuran sampel yang kecil, kemampuan uji statistik untuk mendeteksi efek yang sebenarnya menjadi rendah, sehingga peluang gagal mendeteksi efektivitas algoritma meningkat.
Sebaliknya, peningkatan ukuran sampel akan memperkecil kesalahan standar, meningkatkan ketepatan estimasi, serta meningkatkan daya uji statistik, yang pada akhirnya menurunkan probabilitas Kesalahan Tipe II.

Dalam konteks evaluasi algoritma deteksi penipuan, penggunaan ukuran sampel yang memadai memungkinkan perusahaan untuk menilai efektivitas algoritma secara lebih akurat dan mengurangi risiko menolak sistem yang sebenarnya bermanfaat.

5.5 Jelaskan hubungan antara α, β, dan daya statistik

Dalam pengujian hipotesis statistik, tingkat signifikansi (α), Kesalahan Tipe II (β), dan daya statistik (statistical power) memiliki hubungan yang saling berkaitan.

α (tingkat signifikansi) adalah probabilitas melakukan Kesalahan Tipe I, yaitu menolak H₀ ketika H₀ benar.
β adalah probabilitas melakukan Kesalahan Tipe II, yaitu gagal menolak H₀ ketika H₀ salah.
Daya statistik (power) didefinisikan sebagai \(1 − β\), yaitu probabilitas bahwa uji statistik berhasil mendeteksi efek yang benar-benar ada.

Jika nilai α ditetapkan semakin kecil, maka kriteria pengujian menjadi lebih ketat sehingga risiko Kesalahan Tipe I menurun, namun konsekuensinya risiko Kesalahan Tipe II (β) cenderung meningkat. Sebaliknya, menurunkan nilai β akan meningkatkan daya statistik, sehingga pengujian menjadi lebih sensitif dalam mendeteksi efektivitas suatu perlakuan atau algoritma.

Dalam konteks algoritma deteksi penipuan, daya statistik yang tinggi sangat penting agar perusahaan tidak gagal mendeteksi algoritma yang sebenarnya efektif. Oleh karena itu, pengaturan nilai α yang wajar serta penggunaan ukuran sampel yang memadai diperlukan untuk menekan β dan meningkatkan daya statistik, sehingga keputusan bisnis dapat diambil secara lebih akurat.

6 Studi Kasus 6

Nilai-P dan Pengambilan Keputusan Statistik

Evaluasi model prediksi churn menghasilkan hasil berikut:

Statistik uji = 2,31
p-value = 0,021
Tingkat signifikansi: \(\alpha\ = 0.05\)

Tugas:

Jelaskan arti dari nilai p (p-value).
Buat keputusan statistik.
Terjemahkan keputusan tersebut ke dalam bahasa non-teknis untuk manajemen.
Diskusikan risiko jika sampel tidak representatif.
Jelaskan mengapa p-value tidak mengukur besarnya efek.

Jawaban Studi Kasus 6

6.1 Jelaskan arti dari nilai p (p-value)

p-value merupakan probabilitas untuk memperoleh nilai statistik uji yang sama ekstremnya atau lebih ekstrem dibandingkan dengan yang diamati, dengan asumsi bahwa hipotesis nol (H₀) benar.

Pada studi kasus ini, nilai p-value sebesar 0.021 menunjukkan bahwa apabila model prediksi churn sebenarnya tidak memiliki pengaruh atau perbedaan yang signifikan, maka peluang untuk memperoleh hasil statistik seperti ini sangat kecil, yaitu sekitar 2.1%.

6.2 Buat keputusan statistik

Berdasarkan hasil pengujian, diperoleh nilai p-value sebesar 0.021 dan tingkat signifikansi yang digunakan adalah \(\alpha =0.05\)

Karena nilai p-value lebih kecil dari tingkat signifikansi \((0.021 < 0.05)\), maka hipotesis nol (H₀) ditolak.
Dengan demikian, terdapat bukti statistik yang cukup untuk menyimpulkan bahwa hasil evaluasi model prediksi churn menunjukkan pengaruh atau perbedaan yang signifikan secara statistik.

6.3 Terjemahkan keputusan tersebut ke dalam bahasa non-teknis untuk manajemen

Hasil analisis menunjukkan bahwa performa model prediksi churn bukan terjadi secara kebetulan, melainkan benar-benar menunjukkan perbedaan yang bermakna berdasarkan data yang dianalisis.

Dalam konteks pengambilan keputusan bisnis, hal ini berarti bahwa model prediksi churn cukup andal untuk digunakan sebagai dasar dalam mengidentifikasi pelanggan yang berpotensi berhenti menggunakan layanan. Dengan menggunakan model ini, manajemen dapat menyusun strategi retensi pelanggan, seperti penawaran promosi atau program loyalitas, secara lebih terarah dan berbasis data.

6.4 Diskusikan risiko jika sampel tidak representatif

Jika sampel yang digunakan dalam analisis model prediksi churn tidak representatif, maka hasil pengujian statistik dan kesimpulan yang diambil bisa menjadi tidak akurat.

Dalam konteks studi kasus ini, risiko yang dapat terjadi antara lain:

Model prediksi churn terlihat signifikan secara statistik, padahal sebenarnya hanya berlaku untuk kelompok pelanggan tertentu saja.
Model gagal mengenali pola churn pada segmen pelanggan lain yang tidak terwakili dalam sampel.
Keputusan bisnis yang diambil berdasarkan model tersebut (misalnya strategi retensi) menjadi kurang efektif atau salah sasaran.

Akibatnya, perusahaan dapat mengambil keputusan yang keliru karena hasil analisis tidak mencerminkan kondisi seluruh pelanggan.

6.5 Alasan p-value tidak mengukur besarnya efek

Nilai p (p-value) tidak mengukur besarnya efek karena nilai tersebut hanya menunjukkan tingkat signifikansi statistik, bukan kekuatan atau dampak praktis dari suatu hasil. Nilai p dipengaruhi oleh ukuran sampel, sehingga pada sampel yang besar, perbedaan yang sangat kecil pun dapat menghasilkan nilai p yang signifikan.

Dalam konteks studi kasus prediksi churn, nilai p-value yang kecil menunjukkan bahwa model memiliki pengaruh yang signifikan secara statistik, tetapi tidak menunjukkan seberapa besar kemampuan model tersebut dalam membedakan pelanggan yang akan churn dan yang tidak. Untuk menilai besarnya dampak secara praktis, diperlukan ukuran lain seperti effect size, akurasi model, atau metrik performa prediksi lainnya.

Referensi

[1] Bakti, S., & DScience Labs Authors. (n.d.). Statistical inference. In Introductory Statistics.
Available: https://bookdown.org/dsciencelabs/intro_statistics/09-Statistical_Inference.html

[2] Navarro, D. J. (n.d.). The one-sample z test. In Learning Statistics with R: A tutorial for psychology students and other beginners.
Available: https://stats.libretexts.org/Bookshelves/Applied_Statistics/Learning_Statistics_with_R_-A_tutorial_for_Psychology_Students_and_other_Beginners(Navarro)/13%3A_Comparing_Two_Means/13.01%3A_The_one-sample_z-test

[3] Navarro, D. J. (2015). One-sample t-test. In Learning Statistics with R. University of Adelaide.
Available: https://learningstatisticswithr.com/book/ttest.html

[4] IntroStats Textbook. (n.d.). Statistical inference for two population means with unknown population standard deviations. eCampusOntario Pressbooks.
Available: https://ecampusontario.pressbooks.pub/introstats/chapter/9-3-statistical-inference-for-two-population-means-with-unknown-population-standard-deviations/

[5] OpenStax. (n.d.). Test of independence (Chi-square test). In Introductory Statistics.
Available: https://openstax.org/books/introductory-statistics/pages/11-3-test-of-independence

[6] Statistics Solutions. (n.d.). Components of power analysis: Alpha, beta, and effect size.
Available: https://www.statisticssolutions.com/components-of-power-analysis/

[7] Wasserstein, R. L., & Lazar, N. A. (2016). The ASA’s statement on p-values: Context, process, and purpose. American Statistical Association.
Available: https://www.stat.berkeley.edu/~aldous/Real_World/ASA_statement.pdf

Study Cases Statistical Inferences