PADK - Inferensi Untuk Parameter Proporsi

Video Pembelajaran - P5

Video Pembelajaran dapat diakses melalui link berikut : https://ipb.link/materipadk

Sebaran Binomial

Distribusi binomial digunakan untuk menghitung probabilitas terjadinya sejumlah kejadian sukses dalam suatu rangkaian percobaan yang identik dan independen, di mana setiap percobaan hanya memiliki dua kemungkinan hasil: sukses atau gagal. Misalkan:

  • \(n\): Jumlah percobaan
  • \(p\): Peluang sukses pada setiap percobaan
  • \(Y\): Variabel acak yang menyatakan jumlah sukses dalam \(n\) percobaan

Probabilitas mendapatkan tepat \(y\) kejadian sukses diberikan oleh fungsi massa probabilitas binomial:

\[ P(Y = y) = \binom{n}{y} p^y (1-p)^{n-y} \]

Contoh 1

Misalkan sebuah dadu dilemparkan 5 kali, dan kita ingin mengetahui probabilitas munculnya angka 2 tepat sebanyak 3 kali. Maka:

  • \(n = 5\)
  • \(p = \frac{1}{6}\) (karena hanya satu dari enam sisi dadu yang bernilai 2)
  • \(y = 3\)

Perhitungan peluangnya dalam R:

n <- 5
p <- 1/6
y <- 3

prob <- dbinom(y, size=n, prob=p)
print(prob)
## [1] 0.03215021

Contoh 2

Misalkan 75% kasus pencurian di sebuah kota disebabkan oleh kebutuhan akan narkoba. Jika kita ingin mengetahui probabilitas bahwa 2 dari 4 kasus pencurian disebabkan oleh narkoba:

  • \(n = 4\)
  • \(p = 0.75\)
  • \(y = 2\)

Perhitungan dalam R:

n <- 4
p <- 0.75
y <- 2

prob <- dbinom(y, size=n, prob=p)
print(prob)
## [1] 0.2109375

Sebaran Multinomial

Distribusi multinomial adalah perluasan dari distribusi binomial untuk kasus di mana setiap percobaan memiliki lebih dari dua kemungkinan hasil. Misalkan:

  • \(n\): Jumlah percobaan
  • \(\pi_1, \pi_2, \ldots, \pi_k\): Peluang untuk masing-masing kategori, dengan \(\sum_{j=1}^{k} \pi_j = 1\)
  • \(n_1, n_2, \ldots, n_k\): Jumlah kejadian dalam masing-masing kategori

Probabilitas multinomial diberikan oleh:

\[ P(Y_1 = n_1, Y_2 = n_2, \ldots, Y_k = n_k) = \frac{n!}{n_1! n_2! \cdots n_k!} \pi_1^{n_1} \pi_2^{n_2} \cdots \pi_k^{n_k} \]

Contoh 1

Misalkan sebuah sampel acak berukuran 20 diambil dari populasi mikroprosesor, di mana 70% diantaranya baik, 25% cacat, dan 5% rusak. Probabilitas menemukan 15 mikroprosesor baik, 3 cacat, dan 2 rusak:

  • \(n = 20\)
  • \(\pi_1 = 0.7\), \(\pi_2 = 0.25\), \(\pi_3 = 0.05\)
  • \(n_1 = 15\), \(n_2 = 3\), \(n_3 = 2\)

Perhitungan dalam R:

n <- 20
prob <- c(0.7, 0.25, 0.05)
k <- c(15, 3, 2)

prob_result <- dmultinom(k, size=n, prob=prob)
print(prob_result)
## [1] 0.02875242

Untuk menjelaskan dan mengimplementasikan uji Wald dan uji proporsi yang dijelaskan dalam PPT yang kamu unggah, berikut adalah penjelasan lengkap beserta implementasi dalam R:

Uji Proporsi

Pengertian: Uji proporsi digunakan untuk menguji hipotesis mengenai proporsi populasi berdasarkan sampel yang telah diambil. Misalnya, jika sebuah survei menunjukkan bahwa 56% responden mendukung kandidat tertentu, uji proporsi dapat digunakan untuk menentukan apakah proporsi ini signifikan secara statistik.

Hipotesis: \[ H_0: p = p_0 \quad (\text{proporsi populasi sama dengan nilai hipotesis}) \] \[ H_1: p \neq p_0 \quad (\text{proporsi populasi tidak sama dengan nilai hipotesis}) \]

Statistik Uji: Statistik uji untuk uji proporsi dihitung dengan rumus: \[ Z = \frac{\hat{p} - p_0}{\sqrt{\frac{p_0(1-p_0)}{n}}} \] Dimana:

  • \(\hat{p}\) adalah proporsi sampel,

  • \(p_0\) adalah proporsi populasi yang dihipotesiskan,

  • \(n\) adalah ukuran sampel.

Kaidah Penolakan: Nilai \(Z\) dibandingkan dengan nilai kritis \(Z_{\alpha/2}\) dari distribusi normal standar. Jika \(|Z| > Z_{\alpha/2}\), maka kita tolak hipotesis nol \(H_0\).

Implementasi R: Suatu lembaga survey mengambil contoh acak sebanyak 2000 responden dan diperoleh hasil 1120 orang diantaranya masih puas terhadap kinerja pemerintah. Apakah mayoritas responden puas dengan kinerja pemerintah?

# Data
n <- 2000
x <- 1120
p0 <- 0.5  # proporsi yang dihipotesiskan

# Proporsi sampel
phat <- x / n

# Uji proporsi satu sampel
z <- (phat - p0) / sqrt(p0 * (1 - p0) / n)

# Nilai p untuk uji dua sisi
p_value <- 2 * pnorm(-abs(z))

z
## [1] 5.366563
p_value
## [1] 8.025111e-08

karena nilai p-value < 0.05, maka kita menolak \(H_0\) dan menyimpulkan bahwa mayoritas responden puas dengan kinerja pemerintah.

Uji Wald

Pengertian: Uji Wald digunakan untuk menguji parameter dalam model regresi. Secara khusus, ini digunakan untuk menguji apakah koefisien dari variabel independen secara signifikan berbeda dari nol.

Hipotesis: \[ H_0: \beta = \beta_0 \] \[ H_1: \beta \neq \beta_0 \]

Statistik Uji: Statistik uji Wald dihitung dengan rumus: \[ W = \frac{(\hat{\beta} - \beta_0)^2}{\text{Var}(\hat{\beta})} \] Dimana:

  • \(\hat{\beta}\) adalah estimasi dari koefisien,

  • \(\beta_0\) adalah nilai hipotesis,

  • \(\text{Var}(\hat{\beta})\) adalah varian dari estimasi koefisien.

Kaidah Penolakan: Bandingkan nilai statistik Wald \(W\) dengan distribusi chi-square dengan derajat kebebasan 1. Jika \(W > \chi^2_{\alpha,1}\), maka tolak \(H_0\).

Implementasi R: Di dunia telekomunikasi dikenal istilah churn analysis yang bertujuan untuk melihat kemungkinan pelanggan untuk pindah ke operator lain. Misalnya pada bulan tertentu diketahui ada sebanyak 2347 pelanggan yang keluar (churn) dari total contoh acak 60000 pelanggan. Apakah dapat kita katakan bahwa churn rate, perbandingan antara pelanggan yang churn dengan total pelanggan, adalah sebesar 4%?

# Data
n <- 60000
x <- 2347
p0 <- 0.04  # churn rate yang dihipotesiskan

# Proporsi sampel
phat <- x / n

# Uji Wald
var_hat <- (phat * (1 - phat)) / n
wald <- (phat - p0)^2 / var_hat

# Nilai p untuk uji Wald
p_value <- 1 - pchisq(wald, df = 1)

wald
## [1] 1.24557
p_value
## [1] 0.2644004

karena p-value > 0.05, maka gagal tolak \(H_0\) dan menyimpulkan bahwa churn rate sama dengan 4%.

Latihan Soal

Soal 1: Retensi Pelanggan di Aplikasi Streaming

Sebuah perusahaan aplikasi streaming video ingin mengukur retensi pengguna, yaitu persentase pengguna yang terus menggunakan aplikasi setelah satu bulan berlangganan. Dari 10.000 pengguna baru yang mendaftar, diketahui bahwa 8.700 pengguna tetap menggunakan aplikasi setelah satu bulan. Apakah dapat dikatakan bahwa retensi pengguna setelah satu bulan adalah sebesar 87%?


Soal 2: Tingkat Keberhasilan Pengobatan

Dalam sebuah uji klinis untuk mengukur efektivitas pengobatan baru terhadap suatu penyakit, diketahui bahwa dari 150 pasien yang mengikuti uji klinis, 120 pasien berhasil sembuh setelah menjalani pengobatan. Apakah bisa dikatakan bahwa tingkat keberhasilan pengobatan ini adalah 80%?


Soal 3: Konversi Pengguna di Situs E-commerce

Sebuah situs e-commerce melacak konversi pengguna, yaitu persentase pengguna yang melakukan pembelian setelah mengunjungi situs tersebut. Dalam satu bulan, dari 50.000 pengunjung, 2.500 pengunjung melakukan pembelian. Apakah dapat dikatakan bahwa tingkat konversi pengguna situs tersebut adalah 5%?


Soal 4: Tingkat Pengangguran di Kota X

Pemerintah kota X melakukan survei terhadap tenaga kerja untuk mengukur tingkat pengangguran. Dari 30.000 penduduk yang berusia produktif, ditemukan bahwa 1.800 orang tidak memiliki pekerjaan. Apakah dapat dikatakan bahwa tingkat pengangguran di kota X adalah sebesar 6%?


Soal 5: Tingkat Partisipasi dalam Pemilu

Dalam pemilihan umum di sebuah negara, dari 1.200.000 pemilih yang terdaftar, 840.000 orang hadir untuk memberikan suaranya. Apakah bisa dikatakan bahwa tingkat partisipasi dalam pemilu tersebut adalah sebesar 70%?