Study Kasus Probabilitas Bersyarat
Statistika Dasar
1 Studi Kasus 1
Penerapan Probabilitas dalam Prediksi Kualitas Produk:
Sebuah perusahaan manufaktur memproduksi barang elektronik dan ingin memprediksi apakah suatu produk akan cacat atau tidak. Data historis menunjukkan bahwa 5% dari produk yang diproduksi adalah cacat. Perusahaan menggunakan data tentang jenis komponen dan proses produksi untuk memprediksi cacat produk menggunakan teknik probabilitas.
1.1 Fitur Data
- Komponen (C): Apakah komponen elektronik yang digunakan adalah berkualitas tinggi atau rendah.
- Proses Produksi (P): Apakah proses produksi dilakukan di bawah standar atau sesuai standar.
- Cacat (D): Status cacat produk (ya/tidak).
1.2 Data Historis (Contoh)
- Probabilitas produk cacat (๐ (๐ท = Yes)) = 5%
- Probabilitas produk tidak cacat (๐(๐ท = No)) = 95%
- Probabilitas menggunakan komponen berkualitas rendah (๐(๐ถ = Low)) = 30%
- Probabilitas menggunakan komponen berkualitas tinggi (๐(๐ถ = High))= 70%
- Probabilitas proses produksi di bawah standar (๐ (๐ = Below)) = 40%
- Probabilitas proses produksi sesuai standar (๐(๐ = Standard)) = 60%
Bagaimana probabilitas bahwa suatu produk akan cacat (๐ท = Yes), jika diketahui komponen yang digunakan berkualitas rendah dan proses produksi di bawah standar?
1.3 Jawaban
1.3.1 Langkah 1: Teorema Bayes
Teorema Bayes digunakan untuk menghitung probabilitas bersyarat:
\[ P(D = Yes \mid C = Low, P = Below) = \frac{P(C = Low, P = Below \mid D = Yes) \cdot P(D = Yes)}{P(C = Low, P = Below)} \]
- Numerator: Probabilitas bahwa produk menggunakan komponen berkualitas rendah dan proses produksi di bawah standar jika produk cacat, dikalikan dengan probabilitas produk cacat.
- Denominator: Probabilitas gabungan bahwa produk menggunakan komponen berkualitas rendah dan proses produksi di bawah standar, tanpa memperhatikan status cacat.
1.3.2 Langkah 2: Hitung \(P(C = Low, P = Below \mid D = Yes)\)
Kita asumsikan bahwa \(C\) (komponen) dan \(P\) (proses produksi) independen secara kondisional terhadap \(D\). Maka, probabilitas gabungan dapat dihitung sebagai: \[ P(C = Low, P = Below \mid D = Yes) = P(C = Low \mid D = Yes) \cdot P(P = Below \mid D = Yes) \]
- Diberikan dalam soal:
- \(( P(C = Low \mid D = Yes) = 0.70 )\) โ Produk cacat kemungkinan besar menggunakan komponen berkualitas rendah.
- \(( P(P = Below \mid D = Yes) = 0.80 )\) โ Produk cacat kemungkinan besar diproduksi di bawah standar.
Substitusi nilai: \[ P(C = Low, P = Below \mid D = Yes) = 0.70 \cdot 0.80 = 0.56 \]
1.3.3 Langkah 3: Hitung \(P(C = Low, P = Below \mid D = No)\)
Demikian pula, untuk produk tidak cacat (\(D = No\)), kita hitung: \[ P(C = Low, P = Below \mid D = No) = P(C = Low \mid D = No) \cdot P(P = Below \mid D = No) \]
- Diberikan dalam soal:
- \(P(C = Low \mid D = No) = 0.25\) โ Produk tidak cacat cenderung lebih jarang menggunakan komponen berkualitas rendah.
- \(P(P = Below \mid D = No) = 0.35\) โ Produk tidak cacat lebih jarang diproduksi di bawah standar.
Substitusi nilai: \[ P(C = Low, P = Below \mid D = No) = 0.25 \cdot 0.35 = 0.0875 \]
1.3.4 Langkah 4: Hitung \(P(C = Low, P = Below)\)
Probabilitas gabungan \(P(C = Low, P = Below)\) mencakup semua produk, baik yang cacat maupun tidak cacat. Maka: \[ P(C = Low, P = Below) \\= P(C = Low, P = Below \mid D = Yes) \cdot P(D = Yes) + P(C = Low, P = Below \mid D = No) \cdot P(D = No) \]
- Diberikan dalam soal:
- \(P(D = Yes) = 0.05\)
- \(P(D = No) = 0.95\)
Substitusi nilai: \[ P(C = Low, P = Below) = (0.56 \cdot 0.05) + (0.0875 \cdot 0.95) \] \[ P(C = Low, P = Below) = 0.028 + 0.083125 = 0.111125 \]
1.3.5 Langkah 5: Hitung Probabilitas Akhir \(P(D = Yes \mid C = Low, P = Below)\)
Substitusi semua nilai yang sudah dihitung ke dalam rumus Teorema Bayes: \[ P(D = Yes \mid C = Low, P = Below) = \frac{P(C = Low, P = Below \mid D = Yes) \cdot P(D = Yes)}{P(C = Low, P = Below)} \]
Substitusi nilai: \[ P(D = Yes \mid C = Low, P = Below) = \frac{0.56 \cdot 0.05}{0.111125} \] \[ P(D = Yes \mid C = Low, P = Below) = \frac{0.028}{0.111125} \approx 0.252 \]
1.3.6 Langkah 6: Kesimpulan
Probabilitas bahwa suatu produk akan cacat, jika diketahui menggunakan komponen berkualitas rendah dan proses produksi di bawah standar, adalah: \[ P(D = Yes \mid C = Low, P = Below) \approx 25.2\% \]
1.3.7 Penjelasan
- Produk yang cacat lebih cenderung menggunakan komponen berkualitas rendah dan diproduksi di bawah standar. Oleh karena itu, probabilitas \(P(C = Low, P = Below \mid D = Yes)\) cukup tinggi (56%).
- Sebagian besar produk tidak cacat (\(P(D = No) = 95\%\)), sehingga kontribusi probabilitas \(P(C = Low, P = Below\) untuk produk tidak cacat lebih dominan dalam total \(P(C = Low, P = Below)\).
- Namun, karena kondisi tertentu (\(C = Low, P = Below\)), produk lebih mungkin cacat, sehingga \(P(D = Yes \mid C = Low, P = Below)\) menjadi lebih besar daripada probabilitas awal ( P(D = Yes) = 5%.
1.4 Kode
# Input data
P_D_yes <- 0.05 # Probabilitas produk cacat
P_D_no <- 0.95 # Probabilitas produk tidak cacat
P_C_low_given_D_yes <- 0.70 # Probabilitas komponen berkualitas rendah jika cacat
P_C_low_given_D_no <- 0.25 # Probabilitas komponen berkualitas rendah jika tidak cacat
P_P_below_given_D_yes <- 0.80 # Probabilitas proses di bawah standar jika cacat
P_P_below_given_D_no <- 0.35 # Probabilitas proses di bawah standar jika tidak cacat
# Hitung P(C = Low, P = Below | D = Yes) dan P(C = Low, P = Below | D = No)
P_C_low_and_P_below_given_D_yes <- P_C_low_given_D_yes * P_P_below_given_D_yes
P_C_low_and_P_below_given_D_no <- P_C_low_given_D_no * P_P_below_given_D_no
# Hitung P(C = Low, P = Below)
P_C_low_and_P_below <- (P_C_low_and_P_below_given_D_yes * P_D_yes) +
(P_C_low_and_P_below_given_D_no * P_D_no)
# Hitung P(D = Yes | C = Low, P = Below) menggunakan Teorema Bayes
P_D_yes_given_C_low_and_P_below <- (P_C_low_and_P_below_given_D_yes * P_D_yes) / P_C_low_and_P_below
# Output hasil
cat("P(D = Yes | C = Low, P = Below):", P_D_yes_given_C_low_and_P_below, "\n")## P(D = Yes | C = Low, P = Below): 0.2519685
1.5 Kesimpulan
Kesimpulan: Berdasarkan perhitungan menggunakan Teorema Bayes, probabilitas bahwa suatu produk akan cacat, jika diketahui komponen yang digunakan berkualitas rendah dan proses produksi di bawah standar, adalah 25.2%. Meskipun data historis menunjukkan bahwa hanya 5% dari produk yang diproduksi adalah cacat secara umum, kondisi tertentuโseperti penggunaan komponen berkualitas rendah dan proses produksi yang tidak sesuai dengan standarโsecara signifikan meningkatkan kemungkinan terjadinya cacat. Dalam hal ini, kombinasi dua faktor ini meningkatkan probabilitas cacat produk jauh lebih tinggi dibandingkan dengan probabilitas dasar yang hanya 5%. Oleh karena itu, perusahaan perlu lebih berhati-hati dan meningkatkan pengawasan terhadap komponen yang digunakan serta kualitas proses produksi untuk meminimalkan jumlah produk cacat.
2 Study Kasus 2
Penerapan Probabilitas dalam Deteksi Penipuan Transaksi:
Sebuah perusahaan e-commerce ingin mendeteksi transaksi yang berpotensi penipuan. Berdasarkan data historis, 1% dari transaksi yang dilakukan adalah penipuan. Perusahaan ingin menggunakan fitur-fitur tertentu seperti lokasi transaksi, jumlah pembelian, dan metode pembayaran untuk memprediksi apakah suatu transaksi adalah penipuan atau tidak.
2.1 Fitur Data
- Lokasi (L): Negara atau kota tempat transaksi dilakukan.
- Jumlah Pembelian (A): Jumlah uang yang dibelanjakan.
- Metode Pembayaran (M): Metode pembayaran yang digunakan (kartu kredit, dompet digital, dll).
- Penipuan (F): Status transaksi apakah penipuan atau tidak.
2.2 Data Historis (Contoh)
- Probabilitas transaksi adalah penipuan (๐ (๐น = Fraud)) = 1%
- Probabilitas transaksi bukan penipuan (๐(๐น = Not Fraud)) = 99%
- Probabilitas lokasi tertentu adalah di luar negeri (๐(๐ฟ = Foreign)) = 20%
- Probabilitas jumlah pembelian lebih dari 500(P(A = High)$) = 10%
- Probabilitas menggunakan kartu kredit sebagai metode pembayaran (๐(๐ = Credit Card)) = 50%
Bagaimana probabilitas bahwa suatu transaksi adalah penipuan (๐น = Fraud), jika diketahui transaksi dilakukan dari lokasi luar negeri, jumlah pembelian lebih dari $500, dan metode pembayaran menggunakan kartu kredit?
2.3 Jawaban
2.3.1 Langkah 1: Teorema Bayes
Teorema Bayes menyatakan: \[ P(F = Fraud \mid L = Foreign, A = High, M = Credit\ Card) \\= \frac{P(L = Foreign, A = High, M = Credit\ Card \mid F = Fraud) \cdot P(F = Fraud)}{P(L = Foreign, A = High, M = Credit\ Card)} \]
- Numerator: Kombinasi probabilitas dari lokasi luar negeri, jumlah pembelian tinggi, dan metode pembayaran kartu kredit jika transaksi adalah penipuan, dikalikan dengan probabilitas awal penipuan.
- Denominator: Probabilitas gabungan dari lokasi luar negeri, jumlah pembelian tinggi, dan metode pembayaran kartu kredit, terlepas dari apakah itu penipuan atau bukan.
2.3.2 Langkah 2: Hitung \(P(L = Foreign, A = High, M = Credit\ Card \mid F = Fraud)\)
Kita asumsikan bahwa \(L\), \(A\), dan \(M\) independen secara kondisional terhadap \(F\). Dengan asumsi ini, kita dapat menuliskan probabilitas gabungan sebagai: \[ P(L = Foreign, A = High, M = Credit\ Card \mid F = Fraud) \\= P(L = Foreign \mid F = Fraud) \cdot P(A = High \mid F = Fraud) \cdot P(M = Credit\ Card \mid F = Fraud) \]
Misalkan:
- \(P(L = Foreign \mid F = Fraud) = 0.80\) โ 80% transaksi penipuan berasal dari luar negeri.
- \(P(A = High \mid F = Fraud) = 0.70\) โ 70% transaksi penipuan memiliki jumlah pembelian lebih dari $500.
- \(P(M = Credit\ Card \mid F = Fraud) = 0.90\) โ 90% transaksi penipuan menggunakan kartu kredit.
Substitusi nilai: \[ P(L = Foreign, A = High, M = Credit\ Card \mid F = Fraud) = 0.80 \cdot 0.70 \cdot 0.90 = 0.504 \]
2.3.3 Langkah 3: Hitung \(P(L = Foreign, A = High, M = Credit\ Card \mid F = Not\ Fraud)\)
Demikian pula, untuk transaksi yang bukan penipuan (\(F = Not\ Fraud\)): \[ P(L = Foreign, A = High, M = Credit\ Card \mid F = Not\ Fraud) \\= P(L = Foreign \mid F = Not\ Fraud) \cdot P(A = High \mid F = Not\ Fraud) \cdot P(M = Credit\ Card \mid F = Not\ Fraud) \]
Misalkan:
- \(P(L = Foreign \mid F = Not\ Fraud) = 0.15\) โ 15% transaksi non-penipuan berasal dari luar negeri.
- \(P(A = High \mid F = Not\ Fraud) = 0.05\) โ 5% transaksi non-penipuan memiliki jumlah pembelian lebih dari $500.
- \(P(M = Credit\ Card \mid F = Not\ Fraud) = 0.50\) โ 50% transaksi non-penipuan menggunakan kartu kredit.
Substitusi nilai: \[ P(L = Foreign, A = High, M = Credit\ Card \mid F = Not\ Fraud) = 0.15 \cdot 0.05 \cdot 0.50 = 0.00375 \]
2.3.4 Langkah 4: Hitung \(P(L = Foreign, A = High, M = Credit\ Card)\)
Probabilitas gabungan \(P(L = Foreign, A = High, M = Credit\ Card)\) mencakup transaksi yang penipuan (\(F = Fraud\)) dan yang bukan penipuan (\(F = Not\ Fraud\)): \[ P(L = Foreign, A = High, M = Credit\ Card) \\= P(L = Foreign, A = High, M = Credit\ Card \mid F = Fraud) \cdot P(F = Fraud) \\+ P(L = Foreign, A = High, M = Credit\ Card \mid F = Not\ Fraud) \cdot P(F = Not\ Fraud) \]
Substitusi nilai:
- \(P(F = Fraud) = 0.01\)
- \(P(F = Not\ Fraud) = 0.99\)
\[ P(L = Foreign, A = High, M = Credit\ Card) = (0.504 \cdot 0.01) + (0.00375 \cdot 0.99) \] \[ P(L = Foreign, A = High, M = Credit\ Card) = 0.00504 + 0.0037125 = 0.0087525 \]
2.3.5 Langkah 5: Hitung Probabilitas Akhir
Substitusi semua nilai ke dalam rumus Teorema Bayes: \[ P(F = Fraud \mid L = Foreign, A = High, M = Credit\ Card) \\= \frac{P(L = Foreign, A = High, M = Credit\ Card \mid F = Fraud) \cdot P(F = Fraud)}{P(L = Foreign, A = High, M = Credit\ Card)} \]
Substitusi nilai: \[ P(F = Fraud \mid L = Foreign, A = High, M = Credit\ Card) = \frac{0.504 \cdot 0.01}{0.0087525} \] \[ P(F = Fraud \mid L = Foreign, A = High, M = Credit\ Card) = \frac{0.00504}{0.0087525} \approx 0.576 \]
2.3.6 Langkah 6: Kesimpulan
Probabilitas bahwa suatu transaksi adalah penipuan, jika diketahui dilakukan dari lokasi luar negeri, jumlah pembelian lebih dari $500, dan metode pembayaran menggunakan kartu kredit, adalah:
\[ P(F = Fraud \mid L = Foreign, A = High, M = Credit\ Card) \approx 57.6\% \]
2.4 Kode
# Input data
P_Fraud <- 0.01 # Probabilitas transaksi adalah penipuan
P_Not_Fraud <- 0.99 # Probabilitas transaksi bukan penipuan
# Kondisional untuk transaksi penipuan
P_L_Foreign_given_Fraud <- 0.80 # Probabilitas lokasi luar negeri jika penipuan
P_A_High_given_Fraud <- 0.70 # Probabilitas jumlah pembelian tinggi jika penipuan
P_M_Credit_given_Fraud <- 0.90 # Probabilitas metode pembayaran kartu kredit jika penipuan
# Kondisional untuk transaksi bukan penipuan
P_L_Foreign_given_Not_Fraud <- 0.15 # Probabilitas lokasi luar negeri jika bukan penipuan
P_A_High_given_Not_Fraud <- 0.05 # Probabilitas jumlah pembelian tinggi jika bukan penipuan
P_M_Credit_given_Not_Fraud <- 0.50 # Probabilitas metode pembayaran kartu kredit jika bukan penipuan
# Hitung P(L = Foreign, A = High, M = Credit | F = Fraud)
P_L_A_M_given_Fraud <- P_L_Foreign_given_Fraud * P_A_High_given_Fraud * P_M_Credit_given_Fraud
# Hitung P(L = Foreign, A = High, M = Credit | F = Not Fraud)
P_L_A_M_given_Not_Fraud <- P_L_Foreign_given_Not_Fraud * P_A_High_given_Not_Fraud * P_M_Credit_given_Not_Fraud
# Hitung P(L = Foreign, A = High, M = Credit)
P_L_A_M <- (P_L_A_M_given_Fraud * P_Fraud) + (P_L_A_M_given_Not_Fraud * P_Not_Fraud)
# Hitung P(Fraud | L = Foreign, A = High, M = Credit) menggunakan Teorema Bayes
P_Fraud_given_L_A_M <- (P_L_A_M_given_Fraud * P_Fraud) / P_L_A_M
# Output hasil
cat("P(Fraud | L = Foreign, A = High, M = Credit):", P_Fraud_given_L_A_M, "\n")## P(Fraud | L = Foreign, A = High, M = Credit): 0.5758355
2.5 Kesimpulan
Berdasarkan analisis menggunakan Teorema Bayes, probabilitas bahwa transaksi dengan lokasi luar negeri, pembelian lebih dari $500, dan menggunakan kartu kredit adalah penipuan adalah 57.6%. Meskipun hanya 1% dari semua transaksi yang umumnya dianggap penipuan, adanya pola tertentuโseperti transaksi yang dilakukan dari luar negeri, pembelian besar, dan penggunaan kartu kreditโmeningkatkan kemungkinan transaksi ini adalah penipuan. Pola ini lebih sering terlihat pada transaksi penipuan dibandingkan transaksi yang sah. Dengan kata lain, meskipun penipuan adalah kejadian langka, bukti-bukti ini cukup kuat untuk meningkatkan keyakinan bahwa transaksi ini kemungkinan besar adalah penipuan.