Konsep Dasar Probabilitas
Teorema Bayes
Konsep Dasar Probabilitas
Probabilitas adalah ukuran untuk menyatakan seberapa besar kemungkinan suatu kejadian atau peristiwa terjadi. Dalam statistik dan matematika, probabilitas dinyatakan dengan angka antara 0 dan 1, di mana:
- 0 berarti kejadian tersebut tidak mungkin terjadi.
- 1 berarti kejadian tersebut pasti terjadi.
Probabilitas Bersyarat
Probabilitas bersyarat adalah probabilitas bahwa suatu kejadian \(A\) terjadi, dengan syarat bahwa kejadian \(B\) sudah terjadi. Ditulis sebagai \(P(A \mid B)\), yang dibaca sebagai “probabilitas \(A\) terjadi jika \(B\) telah terjadi”.
Teorema Bayes
Teorema Bayes membantu kita menghitung Probabilitas Bersyarat berdasarkan informasi yang kita miliki, yaitu mengupdate probabilitas awal kita (\(P(A)\)) dengan bukti baru (\(B\)).
Teorema Bayes menggunakan Probabilitas Awal, Probabilitas Bukti, dan Probabilitas Total untuk menghitung Probabilitas Akhir.
Berikut adalah penjelasan langkah demi langkah untuk memahami rumus Teorema Bayes:
Rumus Teorema Bayes
\[ P(A \mid B) = \frac{P(B \mid A) \cdot P(A)}{P(B)} \] Di sini:
- \(P(A \mid B)\) adalah probabilitas bersyarat bahwa kejadian \(A\) terjadi setelah mengetahui kejadian \(B\).
- \(P(B \mid A)\) adalah probabilitas bukti \(B\) terjadi jika kita sudah tahu bahwa \(A\) benar.
- \(P(A)\) adalah probabilitas awal kejadian \(A\), sebelum kita mendapatkan informasi tentang \(B\).
- \(P(B)\) adalah probabilitas total bahwa \(B\) terjadi, yang dihitung dengan mempertimbangkan semua kemungkinan penyebab \(B\).
Teorema Bayes adalah alat yang sangat kuat untuk memperbarui pengetahuan kita tentang suatu kejadian berdasarkan bukti baru yang kita dapatkan. Dengan konsep tersebut, kita bisa menghitung probabilitas bersyarat dan membuat keputusan yang lebih baik di berbagai situasi. Oleh karena itu kita akan menggunakan Teorema Bayes untuk menganalisis dua Studi Kasus berikut.
Studi Kasus 1
Studi Kasus: Prediksi Kualitas Produk Elektronik Menggunakan Teknik Probabilitas
Pada studi kasus ini, saya melakukan analisis untuk memprediksi kualitas produk elektronik yang diproduksi oleh sebuah perusahaan manufaktur. Data historis menunjukkan bahwa 5% dari produk yang diproduksi oleh perusahaan tersebut merupakan produk cacat. Untuk memprediksi kemungkinan cacat pada produk, digunakan data tentang jenis komponen yang digunakan dan proses produksi yang diterapkan menggunakan teknik probabilitas.
Fitur Data
- Komponen (C): Apakah komponen elektronik yang digunakan adalah berkualitas tinggi atau rendah.
- Proses Produksi (P): Apakah proses produksi dilakukan di bawah standar atau sesuai standar.
- Cacat (D): Status cacat produk (ya/tidak)
Data Historis
- Probabilitas produk cacat (𝑃(𝐷 = Yes)) = 5%
- Probabilitas produk tidak cacat (𝑃(𝐷 = No)) = 95%
- Probabilitas menggunakan komponen berkualitas rendah (𝑃(𝐶 = Low)) = 30%
- Probabilitas menggunakan komponen berkualitas tinggi (𝑃(𝐶 = High)) = 70%
- Probabilitas proses produksi di bawah standar (𝑃(𝑃 = Below)) = 40%
- Probabilitas proses produksi sesuai standar (𝑃(𝑃 = Standard)) = 60%
Dalam studi kasus ini kita akan melihat bagaimana probabilitas bahwa suatu produk akan cacat (\(D = \text{Yes}\)), jika diketahui komponen yang digunakan berkualitas rendah (\(C = \text{Low}\)) dan proses produksi dibawah standar (\(P = \text{Below}\)). Untuk menjawab ini, kita menggunakan Teorema Bayes, yang memungkinkan kita menghitung probabilitas bersyarat berdasarkan data historis.
Teorema Bayes
Teorema Bayes dinyatakan sebagai:
\[ P ( D = \text{Yes} | C = \text{Low}, P = \text{Below} ) = \frac {P(C = \text{Low}, P = \text{Below} | D = \text{Yes}) \cdot P(D = \text{Yes})}{P(C = \text{Low} , P = \text{Below})} \]
Dimana:
- \(P(D \mid C, P)\): Probabilitas
bahwa suatu produk cacat (\(D =
\text{Yes}\)) diberikan informasi bahwa komponen yang digunakan
berkualitas rendah (\(C = \text{Low}\))
dan proses produksi di bawah standar (\(P =
\text{Below}\)).
- \(P(C, P \mid D)\): Probabilitas
kombinasi komponen rendah dan proses di bawah standar terjadi jika
produk cacat.
- \(P(D)\): Probabilitas produk cacat
secara umum (dari data historis).
- \(P(C, P)\): Probabilitas kombinasi komponen rendah dan proses di bawah standar secara keseluruhan (dari semua data historis).
Berikut langkah-langkah penyelesaian Studi Kasus 1 menggunakan Teorema Bayes
Langkah 1: Identifikasi Probabilitas Awal yang Diketahui
Dari data historis, kita memiliki:
1. Probabilitas produk cacat dan tidak cacat:
Probabilitas produk cacat atau tidak cacat diambil dari data historis
produksi perusahaan.
Dari data historis, diketahui bahwa 5% dari total produk yang diproduksi adalah cacat. Ini berarti bahwa dari 100 produk yang dihasilkan, rata-rata 5 produk akan cacat. Probabilitas ini dinyatakan dalam bentuk desimal, yaitu:
- \(P(D = \text{Yes}) = 5\% = 0.05\)
Jika 5% dari produk adalah cacat, maka sisanya, yaitu 95%. Artinya, dari 100 produk, rata-rata 95 produk tidak memiliki cacat. Probabilitas ini juga dinyatakan dalam bentuk desimal, yaitu:
- \(P(D = \text{No}) = 95\% = 0.95\)
2. Probabilitas jenis komponen:
Komponen yang digunakan dalam produk dapat berkualitas rendah atau
berkualitas tinggi. Komponen berkualitas rendah lebih rentan menyebabkan
kerusakan atau cacat pada produk, terutama dalam lingkungan proses
produksi yang tidak optimal.
Berdasarkan data, diketahui bahwa 30% dari total produk menggunakan komponen berkualitas rendah. Probabilitas ini dinyatakan sebagai:
- \(P(C = \text{Low}) = 30\% = 0.30\)
Sisanya, yaitu 70% dari produk. Ini berarti bahwa dari 100 produk, sekitar 70 di antaranya menggunakan komponen berkualitas tinggi. Probabilitas ini dinyatakan sebagai:
- \(P(C = \text{High}) = 70\% = 0.70\)
3. Probabilitas proses produksi:
Proses produksi juga dapat dilakukan di bawah standar atau sesuai
standar. Proses produksi yang tidak sesuai standar meningkatkan
kemungkinan cacat karena kontrol kualitas yang buruk, kesalahan dalam
prosedur, atau penggunaan alat yang kurang optimal.
Data menunjukkan bahwa 40% dari total produksi dilakukan dengan proses di bawah standar. Ini berarti bahwa dari 100 produk, rata-rata 40 produk diproduksi dengan proses di bawah standar. Probabilitas ini dinyatakan sebagai:
- \(P(P = \text{Below}) = 40\% = 0.40\)
Sisanya, yaitu 60% dari total produksi. Dengan kata lain, dari 100 produk, rata-rata 60 produk diproduksi dengan proses yang sesuai standar. Probabilitas ini adalah:
- \(P(P = \text{Standard}) = 60\% = 0.60\)
Langkah 2: Menghitung Probabilitas Bukti (Kombinasi) (\(P(C, P \mid D)\))
Sebelum menghitung probabilitas bukti, kita perlu mempertimbangkan hubungan antara cacatnya produk (\(D = \text{Yes}\)) dengan kualitas komponen (\(C\)) dan standar proses produksi (\(P\)). Data historis yang diberikan hanya menyediakan probabilitas awal (\(P(C)\), \(P(P)\), dan \(P(D)\)), tetapi tidak menyebutkan hubungan langsung seperti \(P(C \mid D = \text{Yes})\) atau \(P(P \mid D = \text{Yes})\). Dalam situasi ini, asumsi logis dan realistis diperlukan berdasarkan bagaimana faktor-faktor tersebut biasanya memengaruhi tingkat cacat.
Asumsi Logis Berdasarkan Data
1. Probabilitas Komponen Berkualitas Rendah (\(C = \text{Low}\)) Terkait Produk Cacat (\(D = \text{Yes}\))
- Jika suatu produk cacat (\(D =
\text{Yes}\)), kemungkinan besar komponen berkualitas rendah
digunakan karena hubungan kausal yang logis (komponen berkualitas rendah
cenderung lebih sering menyebabkan cacat).
- Dengan demikian, kita dapat mengasumsikan \(P(C = \text{Low} \mid D = \text{Yes})\)
lebih tinggi daripada \(P(C = \text{Low}) =
30\%\).
- Nilai asumsi yang masuk akal: \(P(C = \text{Low} \mid D = \text{Yes}) = 70\%\).
2. Probabilitas Komponen Berkualitas Tinggi (\(C = \text{High}\)) Terkait Produk Tidak Cacat (\(D = \text{No}\))
- Produk tidak cacat (\(D =
\text{No}\)) lebih mungkin menggunakan komponen berkualitas
tinggi karena kualitas tinggi lebih sedikit menyebabkan cacat.
- Dengan demikian, kita dapat mengasumsikan \(P(C = \text{High} \mid D = \text{No})\)
lebih tinggi daripada \(P(C = \text{High}) =
70\%\).
- Nilai asumsi yang masuk akal: \(P(C = \text{High} \mid D = \text{No}) = 80\%\).
3. Probabilitas Proses Produksi di Bawah Standar (\(P = \text{Below}\)) Terkait Produk Cacat (\(D = \text{Yes}\))
- Jika suatu produk cacat (\(D =
\text{Yes}\)), kemungkinan besar proses produksi dilakukan di
bawah standar karena proses yang buruk cenderung menghasilkan cacat
lebih sering.
- Dengan demikian, kita dapat mengasumsikan \(P(P = \text{Below} \mid D = \text{Yes})\)
lebih tinggi daripada \(P(P = \text{Below}) =
40\%\).
- Nilai asumsi yang masuk akal: \(P(P = \text{Below} \mid D = \text{Yes}) = 60\%\).
4. Probabilitas Proses Produksi Sesuai Standar (\(P = \text{Standard}\)) Terkait Produk Tidak Cacat (\(D = \text{No}\))
- Produk tidak cacat (\(D =
\text{No}\)) lebih mungkin diproduksi dengan proses yang sesuai
standar karena kontrol kualitas lebih baik.
- Dengan demikian, kita dapat mengasumsikan \(P(P = \text{Standard} \mid D = \text{No})\)
lebih tinggi daripada \(P(P = \text{Standard})
= 60\%\).
- Nilai asumsi yang masuk akal: \(P(P = \text{Standard} \mid D = \text{No}) = 70\%\).
Asumsi ini memberikan porsi probabilitas yang konsisten dengan data awal dan relevansi logis dalam hubungan antara komponen, proses produksi, dan cacatnya produk.
1. Jika produk cacat (\(D = \text{Yes}\)):
- Probabilitas komponen berkualitas rendah (\(P(C = \text{Low} \mid D = \text{Yes})\))
adalah 70% (0.7).
- Probabilitas proses di bawah standar (\(P(P = \text{Below} \mid D = \text{Yes})\)) adalah 60% (0.6).
Maka, probabilitas gabungan ketika produk cacat (\(D = \text{Yes}\)) adalah: \[ P(C = \text{Low}, P = \text{Below} \mid D = \text{Yes}) = P(C = \text{Low} \mid D = \text{Yes}) \cdot P(P = \text{Below} \mid D = \text{Yes}) \] \[ P(C = \text{Low}, P = \text{Below} \mid D = \text{Yes}) = 0.7 \cdot 0.6 = 0.42 \]
2. Jika produk tidak cacat (\(D = \text{No}\)):
- Probabilitas komponen berkualitas rendah (\(P(C = \text{Low} \mid D = \text{No})\))
adalah 20% (0.2).
- Probabilitas proses di bawah standar (\(P(P = \text{Below} \mid D = \text{No})\)) adalah 30% (0.3).
Maka, probabilitas gabungan ketika produk tidak cacat (\(D = \text{No}\)) adalah: \[ P(C = \text{Low}, P = \text{Below} \mid D = \text{No}) = P(C = \text{Low} \mid D = \text{No}) \cdot P(P = \text{Below} \mid D = \text{No}) \] \[ P(C = \text{Low}, P = \text{Below} \mid D = \text{No}) = 0.2 \cdot 0.3 = 0.06 \]
Langkah 3: Menghitung Probabilitas Total \(P(C = \text{Low}, P = \text{Below})\)
Untuk menghitung \(P(C, P)\),
gunakan aturan total probabilitas:
\[
P(C, P) = P(C, P \mid D = \text{Yes}) \cdot P(D = \text{Yes}) + P(C, P
\mid D = \text{No}) \cdot P(D = \text{No})
\]
Melakukan substitusikan nilai:
\[
P(C = \text{Low}, P = \text{Below}) = (0.42 \cdot 0.05) + (0.06 \cdot
0.95)
\] \[
P(C = \text{Low}, P = \text{Below}) = 0.021 + 0.057 = 0.078
\]
Langkah 4: Menghitung Probabilitas Akhir \(P(D = \text{Yes} \mid C = \text{Low}, P = \text{Below})\)
Menggunakan Teorema Bayes:
\[
P(D = \text{Yes} \mid C = \text{Low}, P = \text{Below}) = \frac{P(C, P
\mid D = \text{Yes}) \cdot P(D = \text{Yes})}{P(C, P)}
\]
Melakukan substitusi nilai:
\[
P(D = \text{Yes} \mid C = \text{Low}, P = \text{Below}) = \frac{(0.42
\cdot 0.05)}{0.078}
\] \[
P(D = \text{Yes} \mid C = \text{Low}, P = \text{Below}) =
\frac{0.021}{0.078} \approx 0.269
\]
Perhitungan probabilitas akhir melalui sistem
# Menghitung probabilitas akhir P(D = Yes | C = Low, P = Below) di R
# Probabilitas awal
P_D_Yes <- 0.05 # P(D = Yes)
P_D_No <- 0.95 # P(D = No)
P_C_Low_given_D_Yes <- 0.7 # P(C = Low | D = Yes)
P_C_Low_given_D_No <- 0.2 # P(C = Low | D = No)
P_P_Below_given_D_Yes <- 0.6 # P(P = Below | D = Yes)
P_P_Below_given_D_No <- 0.3 # P(P = Below | D = No)
# Probabilitas gabungan
P_C_Low_and_P_Below_given_D_Yes <- P_C_Low_given_D_Yes * P_P_Below_given_D_Yes
P_C_Low_and_P_Below_given_D_No <- P_C_Low_given_D_No * P_P_Below_given_D_No
# Probabilitas total P(C = Low, P = Below)
P_C_Low_and_P_Below <- (P_C_Low_and_P_Below_given_D_Yes * P_D_Yes) +
(P_C_Low_and_P_Below_given_D_No * P_D_No)
# Menghitung P(D = Yes | C = Low, P = Below) menggunakan Teorema Bayes
P_D_Yes_given_C_Low_and_P_Below <- (P_C_Low_and_P_Below_given_D_Yes * P_D_Yes) / P_C_Low_and_P_Below
# Menampilkan hasil
cat("Probabilitas akhir P(D = Yes | C = Low, P = Below):",
round(P_D_Yes_given_C_Low_and_P_Below * 100, 1), "%\n")## Probabilitas akhir P(D = Yes | C = Low, P = Below): 26.9 %
Kesimpulan Studi Kasus 1
Dari hasil analisis menggunakan Teorema Bayes, ditemukan bahwa probabilitas suatu produk cacat (\(D = \text{Yes}\)) jika diketahui bahwa komponen yang digunakan berkualitas rendah (\(C = \text{Low}\)) dan diproduksi dengan proses di bawah standar(\(P = \text{Below}\)) adalah 26.9%.
Dalam konteks ini:
- Probabilitas cacat dasar adalah 5%, artinya secara
umum, hanya 5 dari 100 produk yang cacat.
- Namun, jika kedua faktor risiko (\(C =
\text{Low}\) dan \(P =
\text{Below}\)) hadir, peluang cacat meningkat lebih dari
5 kali lipat menjadi 26.9%.
- Probabilitas \(P(D = \text{Yes})\)
menunjukkan prevalensi produk cacat secara umum.
- Probabilitas \(P(C = \text{Low})\) dan \(P(P = \text{Below})\) menunjukkan seberapa sering faktor risiko seperti komponen rendah atau proses buruk terjadi.
Hasil analisis ini menunjukkan pentingnya meningkatkan kualitas komponen dan proses produksi untuk mengurangi tingkat cacat pada suatu produk. Karena, kedua hal tersebut memainkan peran penting dalam menentukan kualitas produk.
Studi Kasus 2
Studi Kasus: Penerapan Probabilitas untuk Deteksi Penipuan Transaksi E-Commerce
Dalam studi ini, saya menganalisis penerapan probabilitas untuk mendeteksi transaksi penipuan pada platform e-commerce. Berdasarkan data historis, 1% dari transaksi merupakan penipuan. Fitur seperti lokasi transaksi, jumlah pembelian, dan metode pembayaran digunakan untuk memprediksi potensi penipuan. Tujuan analisis ini adalah meningkatkan akurasi deteksi transaksi mencurigakan, mengurangi risiko kerugian, dan memperkuat kepercayaan pelanggan terhadap sistem perusahaan.
Fitur Data
- Lokasi (L): Negara atau kota tempat transaksi dilakukan.
- Jumlah Pembelian (A): Jumlah uang yang dibelanjakan.
- MetodePembayaran (M):Metodepembayaranyangdigunakan (kartu kredit, dompet digital, dll).
- Penipuan (F): Status transaksi apakah penipuan atau tidak.
Data Historis
- Probabilitas transaksi adalah penipuan (𝑃(𝐹 = Fraud)) = 1%
- Probabilitas transaksi bukan penipuan (𝑃(𝐹 = Not Fraud)) = 99%
- Probabilitas lokasi tertentu adalah di luar negeri (𝑃(𝐿 = Foreign)) = 20%
- Probabilitas jumlah pembelian lebih dari 500(P(A = High)$) = 10%
- Probabilitas menggunakan kartu kredit sebagai metode pembayaran (𝑃(𝑀 =Credit Card)) = 50%
Dalam studi kasus ini kita akan melihat bagaimana probabilitas bahwa suatu transaksi adalah penipuan (𝐹 = Fraud), jika diketahui transaksi dilakukan dari lokasi luar negeri, jumlah pembelian lebih dari $500, dan metode pembayaran menggunakan kartu kredit (\(M = \text{Credit Card}\)). Untuk menjawab ini, kita menggunakan Teorema Bayes, yang memungkinkan kita menghitung probabilitas bersyarat berdasarkan data historis dan fitur-fitur yang relevan untuk mendeteksi transaksi penipuan.
Teorema Bayes
Teorema Bayes dinyatakan sebagai:
\[ P(F = \text{Fraud} \mid L = \text{Foreign}, A = \text{High}, M = \text{Credit Card}) = \frac{P(L = \text{Foreign}, A = \text{High}, M = \text{Credit Card} \mid F = \text{Fraud}) \cdot P(F = \text{Fraud})}{P(L = \text{Foreign}, A = \text{High}, M = \text{Credit Card})} \]
Dimana:
- \(P(F = \text{Fraud} \mid L = \text{Foreign}, A = \text{High}, M = \text{Credit Card})\): Probabilitas bahwa transaksi adalah penipuan (\(F = \text{Fraud}\)), jika diketahui lokasi transaksi adalah luar negeri (\(L = \text{Foreign}\)), jumlah pembelian lebih dari $500 (\(A = \text{High}\)), dan metode pembayaran menggunakan kartu kredit (\(M = \text{Credit Card}\)).
- \(P(L = \text{Foreign}, A = \text{High}, M = \text{Credit Card} \mid F = \text{Fraud})\): Probabilitas bahwa transaksi dilakukan dengan lokasi luar negeri, jumlah pembelian tinggi, dan kartu kredit, jika transaksi merupakan penipuan.
- \(P(F = \text{Fraud})\): Probabilitas awal bahwa suatu transaksi adalah penipuan.
- \(P(L = \text{Foreign}, A = \text{High}, M = \text{Credit Card})\): Probabilitas gabungan dari fitur-fitur lokasi luar negeri, jumlah pembelian lebih dari $500, dan penggunaan kartu kredit di seluruh transaksi.
Berikut langkah-langkah penyelesaian Studi Kasus 2 menggunakan Teorema Bayes
Langkah 1: Identifikasi Probabilitas Awal yang Diketahui
Dari data historis, kita memiliki:
1. Probabilitas transaksi adalah penipuan atau
bukan:
Berdasarkan data historis, diketahui bahwa 1% dari seluruh transaksi
adalah penipuan, dan sisanya 99% adalah transaksi yang sah.
- \(P(F = \text{Fraud}) = 1\% =
0.01\)
- \(P(F = \text{Not Fraud}) = 99\% = 0.99\)
2. Probabilitas lokasi transaksi luar negeri: 20% dari transaksi dilakukan dari lokasi luar negeri (misalnya transaksi internasional).
- \(P(L = \text{Foreign}) = 20\% = 0.20\)
3. Probabilitas jumlah pembelian lebih dari
$500:
10% dari transaksi memiliki jumlah pembelian lebih dari $500.
- \(P(A = \text{High}) = 10\% = 0.10\)
4. Probabilitas menggunakan kartu kredit sebagai metode pembayaran: 50% dari transaksi menggunakan kartu kredit sebagai metode pembayaran.
- \(P(M = \text{Credit Card}) = 50\% = 0.50\)
Langkah 2: Menghitung Probabilitas Bukti (Kombinasi)
Asumsi Logis Berdasarkan Data
1. Probabilitas Lokasi Luar Negeri (\(L = \text{Foreign}\)) Terkait dengan Transaksi Penipuan (\(F = \text{Fraud}\))
Probabilitas lokasi luar negeri lebih tinggi untuk transaksi penipuan (\(P(L = \text{Foreign} \mid F = \text{Fraud}) = 40\%\)) dibandingkan probabilitas lokasi luar negeri secara keseluruhan (\(P(L = \text{Foreign}) = 20\%\)).
Logika: Pelaku penipuan sering memanfaatkan lokasi luar negeri untuk menyembunyikan identitas mereka dan menghindari otoritas lokal.
Asumsi yang logis: Transaksi penipuan lebih sering berasal dari lokasi luar negeri.
2. Probabilitas Jumlah Pembelian Tinggi (\(A = \text{High}\)) Terkait dengan Transaksi Penipuan (\(F = \text{Fraud}\))
Probabilitas jumlah pembelian tinggi (\(A = \text{High}\)) lebih tinggi untuk transaksi penipuan (\(P(A = \text{High} \mid F = \text{Fraud}) = 50\%\)) dibandingkan probabilitas keseluruhan (\(P(A = \text{High}) = 10\%\)).
Logika: Pelaku penipuan biasanya memanfaatkan peluang untuk melakukan pembelian dalam jumlah besar agar mendapatkan keuntungan maksimal dalam satu transaksi.
Asumsi yang logis: Transaksi penipuan lebih cenderung memiliki jumlah pembelian tinggi.
3. Probabilitas Penggunaan Kartu Kredit (\(M = \text{Credit Card}\)) Terkait dengan Transaksi Penipuan (\(F = \text{Fraud}\))
Probabilitas penggunaan kartu kredit lebih tinggi untuk transaksi penipuan (\(P(M = \text{Credit Card} \mid F = \text{Fraud}) = 60\%\)) dibandingkan probabilitas keseluruhan (\(P(M = \text{Credit Card}) = 50\%\)).
Logika: Penipu sering mencuri atau memalsukan data kartu kredit karena lebih mudah diakses dibandingkan metode pembayaran lain, seperti transfer bank.
Asumsi yang logis: Transaksi penipuan lebih sering menggunakan kartu kredit.
Karena data historis tidak memberikan nilai langsung untuk probabilitas kombinasi, kita harus membuat asumsi berdasarkan pengetahuan atau data yang tersedia.
1. Jika transaksi adalah penipuan (\(F = \text{Fraud}\)):
Probabilitas lokasi transaksi adalah luar negeri, dengan asumsi transaksi adalah penipuan: Ini berarti bahwa 40% dari transaksi penipuan dilakukan dari luar negeri. yang berbeda dari probabilitas lokasi luar negeri secara keseluruhan (20%).
- \(P(L = \text{Foreign} \mid F = \text{Fraud}) = 40\% = 0.40\)
Probabilitas jumlah pembelian lebih dari $500, dengan asumsi transaksi adalah penipuan: Ini berarti bahwa 50% dari transaksi penipuan memiliki jumlah pembelian lebih dari $500.
- \(P(A = \text{High} \mid F = \text{Fraud}) = 50\% = 0.50\)
Probabilitas menggunakan kartu kredit untuk transaksi penipuan: Ini berarti bahwa 60% dari transaksi penipuan dilakukan menggunakan kartu kredit.
- \(P(M = \text{Credit Card} \mid F = \text{Fraud}) = 60\% = 0.60\)
Dalam hal ini, kita menghitung Probabilitas Kombinasi Transaksi Penipuan dengan tiga kondisi tersebut, yang semuanya perlu terjadi secara bersamaan (transaksi dilakukan dari luar negeri, jumlah pembelian lebih dari $500, dan menggunakan kartu kredit). Oleh karena itu, kita mengalikan ketiga probabilitas kondisional tersebut:
\[ P(L = \text{Foreign}, A = \text{High}, M = \text{Credit Card} \mid F = \text{Fraud}) = P(L = \text{Foreign} \mid F = \text{Fraud}) \cdot P(A = \text{High} \mid F = \text{Fraud}) \cdot P(M = \text{Credit Card} \mid F = \text{Fraud}) \]
Substitusikan nilai-nilai yang diberikan:
\[ P(L = \text{Foreign}, A = \text{High}, M = \text{Credit Card} \mid F = \text{Fraud}) = 0.40 \cdot 0.50 \cdot 0.60 = 0.12 \]
Jadi,0.12 atau 12% adalah probabilitas gabungan bahwa suatu transaksi penipuan dilakukan dengan kondisi lokasi luar negeri, jumlah pembelian lebih dari $500, dan metode pembayaran menggunakan kartu kredit.
2. Jika transaksi adalah bukan penipuan (\(F = \text{Not Fraud}\)):
Probabilitas lokasi transaksi adalah luar negeri, dengan asumsi transaksi adalah bukan penipuan: Artinya, 10% dari transaksi yang bukan penipuan dilakukan dari luar negeri.
- \(P(L = \text{Foreign} \mid F = \text{Not Fraud}) = 10\% = 0.10\)
Probabilitas jumlah pembelian lebih dari $500, dengan asumsi transaksi adalah bukan penipuan: Artinya, 5% dari transaksi yang bukan penipuan memiliki jumlah pembelian lebih dari $500.
- \(P(A = \text{High} \mid F = \text{Not Fraud}) = 5\% = 0.05\)
Probabilitas menggunakan kartu kredit untuk transaksi bukan penipuan: Artinya, 30% dari transaksi yang bukan penipuan dilakukan dengan menggunakan kartu kredit.
- \(P(M = \text{Credit Card} \mid F = \text{Not Fraud}) = 30\% = 0.30\)
Dalam hal ini, kita menghitung Probabilitas Kombinasi Transaksi Bukan Penipuan (\(F = \text{Not Fraud}\)) dan memenuhi kondisi lokasi di luar negeri, jumlah pembelian lebih dari $500, serta menggunakan kartu kredit. Probabilitas ini dihitung berdasarkan informasi yang diberikan dalam studi kasus.Untuk menghitung probabilitas gabungan, kita mengalikan ketiga nilai probabilitas ini:
\[ P(L = \text{Foreign}, A = \text{High}, M = \text{Credit Card} \mid F = \text{Not Fraud}) = 0.10 \times 0.05 \times 0.30 = 0.0015 \]
Transaksi Penipuan (\(F = \text{Fraud}\)) memiliki probabilitas gabungan yang jauh lebih tinggi untuk memenuhi kondisi lokasi luar negeri, jumlah pembelian tinggi, dan penggunaan kartu kredit (12%) dibandingkan transaksi bukan penipuan (0.15%).
Langkah 3: Menghitung Probabilitas Total
Selanjutnya, kita menghitung probabilitas total bahwa transaksi dilakukan dari luar negeri, jumlah pembelian lebih dari $500, dan menggunakan kartu kredit. Ini dihitung dengan menggunakan total probabilitas:
\[ P(L = \text{Foreign}, A = \text{High}, M = \text{Credit Card}) = P(L = \text{Foreign}, A = \text{High}, M = \text{Credit Card} \mid F = \text{Fraud}) \cdot P(F = \text{Fraud}) + P(L = \text{Foreign}, A = \text{High}, M = \text{Credit Card} \mid F = \text{Not Fraud}) \cdot P(F = \text{Not Fraud}) \]
Melakukan substitusi nilai:
\[ P(L = \text{Foreign}, A = \text{High}, M = \text{Credit Card}) = (0.12 \cdot 0.01) + (0.0015 \cdot 0.99) = 0.0012 + 0.001485 = 0.002685 \]
Langkah 4: Menghitung Probabilitas Akhir dengan Teorema Bayes
\[ P(F = \text{Fraud} \mid L = \text{Foreign}, A = \text{High}, M = \text{Credit Card}) = \frac{0.12 \cdot 0.01}{0.002685} = \frac{0.0012}{0.002685} \approx 0.447 \]
Perhitungan probabilitas akhir melalui sistem
# Langkah 1: Probabilitas awal
P_Fraud <- 0.01 # Probabilitas transaksi adalah penipuan
P_NotFraud <- 0.99 # Probabilitas transaksi adalah bukan penipuan
P_L_Foreign <- 0.20 # Probabilitas lokasi luar negeri
P_A_High <- 0.10 # Probabilitas jumlah pembelian > $500
P_M_CreditCard <- 0.50 # Probabilitas menggunakan kartu kredit
# Probabilitas bersyarat untuk transaksi penipuan
P_L_Foreign_given_Fraud <- 0.40
P_A_High_given_Fraud <- 0.50
P_M_CreditCard_given_Fraud <- 0.60
# Probabilitas bersyarat untuk transaksi bukan penipuan
P_L_Foreign_given_NotFraud <- 0.10
P_A_High_given_NotFraud <- 0.05
P_M_CreditCard_given_NotFraud <- 0.30
# Langkah 2: Probabilitas gabungan
# Untuk transaksi penipuan
P_combination_given_Fraud <- P_L_Foreign_given_Fraud * P_A_High_given_Fraud * P_M_CreditCard_given_Fraud
# Untuk transaksi bukan penipuan
P_combination_given_NotFraud <- P_L_Foreign_given_NotFraud * P_A_High_given_NotFraud * P_M_CreditCard_given_NotFraud
# Langkah 3: Probabilitas total
P_combination <- (P_combination_given_Fraud * P_Fraud) +
(P_combination_given_NotFraud * P_NotFraud)
# Langkah 4: Probabilitas akhir menggunakan Teorema Bayes
P_Fraud_given_combination <- (P_combination_given_Fraud * P_Fraud) / P_combination
# Cetak hasil
cat("Probabilitas transaksi adalah penipuan diberikan lokasi luar negeri, jumlah pembelian > $500, dan menggunakan kartu kredit:",
round(P_Fraud_given_combination * 100, 2), "%\n")## Probabilitas transaksi adalah penipuan diberikan lokasi luar negeri, jumlah pembelian > $500, dan menggunakan kartu kredit: 44.69 %
Kesimpulan Studi Kasus 2
Dari hasil analisis menggunakan Teorema Bayes, ditemukan bahwa probabilitas suatu transaksi adalah penipuan (\(F = \text{Fraud}\)), jika diketahui bahwa transaksi dilakukan dari luar negeri (\(L = \text{Foreign}\)), jumlah pembelian lebih dari $500 (\(A = \text{High}\)), dan menggunakan kartu kredit (\(M = \text{Credit Card}\)), adalah sekitar 44.7%.
Dalam konteks ini:
- Probabilitas transaksi adalah penipuan dasar adalah 1%, artinya secara umum, hanya 1 dari 100 transaksi yang merupakan penipuan.
- Namun, jika ketiga faktor risiko (\(L = \text{Foreign}\), \(A = \text{High}\), dan \(M = \text{Credit Card}\)) hadir, peluang transaksi menjadi penipuan meningkat menjadi 44.7%.
- Probabilitas \(P(F = \text{Fraud})\) menunjukkan prevalensi transaksi penipuan secara umum.
- Probabilitas \(P(L = \text{Foreign})\), \(P(A = \text{High})\), dan \(P(M = \text{Credit Card})\) menunjukkan seberapa sering faktor-faktor risiko tersebut terjadi.
Hasil analisis ini menunjukkan bahwa meskipun kombinasi faktor-faktor tersebut meningkatkan kemungkinan transaksi penipuan, probabilitasnya masih di bawah 50%. Oleh karena itu, perusahaan perlu terus memantau transaksi dengan kombinasi faktor ini, tetapi juga harus mempertimbangkan lebih banyak data dan indikator lain untuk meningkatkan akurasi sistem deteksi penipuan.
Referensi
Investopedia. (2023). Bayes’ Theorem. Investopedia. Diakses 14 Desember 2024, dari https://www.investopedia.com/terms/b/bayes-theorem.asp
Cuemath. (n.d.). Bayes’ Theorem. Cuemath. Diakses 14 Desember 2024, dari https://www.cuemath.com/data/bayes-theorem/
Louis, M. (n.d.). 6.2 Conditional Probability and Bayes’ Theory. In Finite Mathematics. Diakses 14 Desember 2024, dari https://louis.pressbooks.pub/finitemathematics/chapter/6-2-conditional-probability-and-bayes-theory/
Investopedia. (2023). Bayes’ Theorem. Investopedia. Diakses 14 Desember 2024, dari https://www.investopedia.com/terms/b/bayes-theorem.asp
Scribd. (n.d.). Konsep Dasar Probabilitas. Scribd. Diakses 14 Desember 2024, dari https://id.scribd.com/document/501295146/Konsep-dasar-Probabilitas