TUGAS STATISTIKA DASAR 11
Konsep Dasar Probabilitas
Studi Kasus 1
Penerapan Probabilitas dalam Prediksi Kualitas Produk:
Sebuah perusahaan manufaktur memproduksi barang elektronik dan ingin memprediksi apakah suatu produk akan cacat atau tidak. Data historis menunjukkan bahwa 5% dari produk yang diproduksi adalah cacat. Perusahaan menggunakan data tentang jenis komponen dan proses produksi untuk memprediksi cacat produk menggunakan teknik probabilitas.
Fitur Data
- Komponen \((C)\): Apakah komponen elektronik yang digunakan adalah berkualitas tinggi atau rendah.
- Proses Produksi \((P)\): Apakah proses produksi dilakukan di bawah standar atau sesuai standar.
- Cacat \((D)\): Status cacat produk (ya/tidak).
Data Historis (Contoh)
- Probabilitas produk cacat \((P (D = Yes)) = 5\% = 0,05\)
- Probabilitas produk tidak cacat \((P (D = No )) = 95\% = 0,95\)
- Probabilitas menggunakan komponen berkualitas rendah \((P(C = Low)) = 30\% = 0,30\)
- Probabilitas menggunakan komponen berkualitas tinggi \((P(C = High)) = 70\% = 0,70\)
- Probabilitas proses produksi di bawah standar \((P (P = Below)) = 40\% = 0,40\)
- Probabilitas proses produksi sesuai standar \((P(P = Standard)) = 60\% = 0,60\)
Bagaimana probabilitas bahwa suatu produk akan cacat \((D = Yes)\), jika diketahui komponen yang digunakan berkualitas rendah dan proses produksi di bawah standar?
Gunakan Teorema Bayes untuk menghitung probabilitas bersyarat ini
\[ P ( D = \text{Yes} | C = \text{Low}, P = \text{Below} ) = \frac {P(C = \text{Low}, P = \text{Below} | D = \text{Yes}) \cdot P(D = \text{Yes})}{P(C = \text{Low} , P = \text{Below})} \]
Dimana :
- \(C\) = Komponen
- \(P\) = Proses Produksi
- \(D\) = Cacat
Langkah- Langkah Menghitung Probabilitas Bersyarat
Langkah 1 : Mencari \(P(C = \text{Low}, P = \text{Below} | D = \text{Yes})\)
Asumsikan
- Komponen berkualitas rendah sering terjadi pada produk cacat \(P(C = Low | D = Yes) = 70\% = 0,70\)
- proses di bawah standar lebih sering terjadi pada produk cacat \(P(P = Below | D = Yes) = 60\% = 0,60\)
Untuk mencari \(P(C = \text{Low}, P = \text{Below} | D = \text{Yes})\) gunakan rumus:
\[ P(C = \text{Low}, P = \text{Below} | D = \text{Yes}) = P(C = Low | D = Yes) \cdot P(P = Below | D = Yes) \]
Subtitusikan nilai yang diasumsikan
\[ \begin{split} P(C = \text{Low}, P = \text{Below} | D = \text{Yes}) &= P(C = Low | D = Yes) \cdot P(P = Below | D = Yes) \\ &= 0,70 \cdot 0,60 \\ &= 0,42 \end{split} \]
Langkah 2 : Mencari \(P(C = \text{Low} , P = \text{Below})\)
Gunakan aturan Probabilitas Gabungan
\[ P(C = \text{Low} , P = \text{Below}) = P(C = Low) \cdot P(P = Below) \]
Subtitusikan nilai dari data historis
\[ \begin{split} P(C = \text{Low} , P = \text{Below}) &= P(C = Low) \cdot P(P = Below) \\ &= 0,30 \cot 0,40 \\ &= 0,12 \end{split} \]
Langkah 3 : Gunakan rumus Teorema Bayes
\[ P ( D = \text{Yes} | C = \text{Low}, P = \text{Below} ) = \frac {P(C = \text{Low}, P = \text{Below} | D = \text{Yes}) \cdot P(D = \text{Yes})}{P(C = \text{Low} , P = \text{Below})} \]
Subtitusikan nilai yang dicari sebelumnya
\[ \begin{split} P ( D = \text{Yes} | C = \text{Low}, P = \text{Below} ) &= \frac {P(C = \text{Low}, P = \text{Below} | D = \text{Yes}) \cdot P(D = \text{Yes})}{P(C = \text{Low} , P = \text{Below})} \\ &= \frac{0,42 \cdot 0,05}{0,12} \\ &= \frac{0,021}{0,12} \\ &= 0,175 \\ \text{atau} \\ &= 17,5\% \end{split} \]
Jadi, probabilitas 17,05% artinya kalau komponen yang dipakai kualitasnya rendah dan proses produksinya nggak sesuai standar, ada kemungkinan sekitar 17% produk yang dihasilkan bakal cacat. Itu berarti, dari 100 produk yang diproduksi dengan kondisi seperti itu, sekitar 17 produk bakal mengalami kecacatan. Jadi, ini nunjukin seberapa besar risiko produk cacat kalau dua faktor tersebut terjadi.
Perhitungan dalam sistem
# Real data dari soal
prob_cacat <- 0.05 # P(D = Yes) -> Probabilitas produk bakal cacat
prob_low_kalo_cacat <- 0.70 # P(C = Low | D = Yes) -> Kualitas komponen low kalau produknya cacat
prob_below_kalo_cacat <- 0.60 # P(P = Below | D = Yes) -> Proses di bawah standar kalo produknya cacat
prob_low <- 0.30 # P(C = Low) -> Probabilitas komponen kualitas low secara umum
prob_below <- 0.40 # P(P = Below) -> Probabilitas proses di bawah standar secara umum
# Langkah 1: Cari probabilitas gabungan kalo komponen low + proses bawah standar AND produknya cacat
prob_low_below_cacat <- prob_low_kalo_cacat * prob_below_kalo_cacat
# Langkah 2: Cari probabilitas komponen low + proses bawah standar secara umum
prob_low_below <- prob_low * prob_below
# Langkah 3: Ini dia rumus sakti Teorema Bayes buat ngitung probabilitas terbalik
prob_cacat_kalo_low_below <- (prob_low_below_cacat * prob_cacat) / prob_low_below
# Cetak hasilnya
cat("Probabilitas produk bakal cacat kalo komponen low dan proses produksi di bawah standar itu:",
round(prob_cacat_kalo_low_below, 4) * 100, "%\n")## Probabilitas produk bakal cacat kalo komponen low dan proses produksi di bawah standar itu: 17.5 %
Studi Kasus 2
Penerapan Probabilitas dalam Deteksi Penipuan Transaksi:
Sebuah perusahaan e-commerce ingin mendeteksi transaksi yang berpotensi penipuan. Berdasarkan data historis, 1% dari transaksi yang dilakukan adalah penipuan. Perusahaan ingin menggunakan fitur-fitur tertentu seperti lokasi transaksi, jumlah pembelian, dan metode pembayaran untuk memprediksi apakah suatu transaksi adalah penipuan atau tidak.
Fitur Data
- Lokasi \((L)\) : Negara atau kota tempat transaksi dilakukan.
- Jumlah Pembelian \((A)\) : Jumlah uang yang dibelanjakan.
- Metode Pembayaran \((M)\) : Metode pembayaran yang digunakan (kartu kredit, dompet digital, dll).
- Penipuan \((F)\): Status transaksi apakah penipuan atau tidak.
Data Historis (Contoh)
- Probabilitas transaksi adalah penipuan \((P (F = Fraud)) = 1\% = 0,01\)
- Probabilitas transaksi bukan penipuan \((P(F = Not Fraud)) = 99\% = 0,99\)
- Probabilitas lokasi tertentu adalah di luar negeri \((P(L = Foreign)) = 20\% = 0,20\)
- Probabilitas jumlah pembelian lebih dari 500 \(P(A = High)) = 10\% = 0,10\)
- Probabilitas menggunakan kartu kredit sebagai metode pembayaran \((P(M = Credit Card)) = 50\% = 0,50\)
Bagaimana probabilitas bahwa suatu transaksi adalah penipuan (𝐹 = Fraud), jika diketahui transaksi dilakukan dari lokasi luar negeri, jumlah pembelian lebih dari $500, dan metode pembayaran menggunakan kartu kredit?
Gunakan Teorema Bayes untuk menghitung probabilitas bersyarat ini
\[ \begin{split} P(F = \text{Fraud} \mid L, A, M ) = \frac{P(L, A, M \mid F = \text{Fraud}) \cdot P(F = \text{Fraud})}{P(L, A, M)} \end{split} \]
Dimana :
- \(L\) = Lokasi
- \(A\) = Jumlah Pembelian
- \(M\) = Metode Pembayaran
- \(F\) = Penipuan
Langkah - Langkah Menghitung Probabilitas Bersyarat
Langkah 1 : Menghitung \(P(L, A, M \mid F= \text{Fraud})\)
Asumsikan
- Transaksi penipuan berasal dari luar negeri \(P(L = \text{Foreign} | F = \text{Froud}) = 80\% = 0,80\)
- Transaksi penipuan melibatkan jumlah lebih dari 500 \(P(A > 500 | F = \text{Fraud}) = 70\% = 0,70\)
- Transaksi penipuan menggunakan kartu kredit \(P(M = \text{CreditCard} \mid F = \text{Fraud}) = 90\% 0.90\)
Rumus :
\[ P(L, A, M \mid F= \text{Fraud}) = P(L | F = \text{Froud}) \cdot P(A | F = \text{Fraud}) \cdot P(M \mid F = \text{Fraud}) \]
Subtitusikan nilai asumsi
\[ \begin{split} P(L, A, M \mid F= \text{Fraud}) &= P(L | F = \text{Froud}) \cdot P(A | F = \text{Fraud}) \cdot P(M \mid F = \text{Fraud}) \\ &= 0,80 \cdot 0,70 \cdot 0,90 \\ &= 0,504 \end{split} \]
Langkah 2 : Menghitung \(P(L, A, M \mid F= \text{Not Fraud})\)
Asumsikan
- Transaksi biasa berasal dari luar negeri \(P(L = \text{Foreign} \mid F = \text{Not Fraud}) = 20 \% = 0,20\).
- Transaksi biasa melibatkan jumlah lebih dari 500 \(P(A > 500 \mid F = \text{Not Fraud}) = 10\% = 0,10\).
- Transaksi biasa menggunakan kartu kredit \(P( M = \text{Credit Card} \mid F= \text{Not Fraud}) = 40\% = 0,40\).
Rumus :
\[ P(L, A, M \mid \text{Not Fraud}) = P(L |\text{Not Froud}) \cdot P(A |\text{Not Fraud}) \cdot P(M \mid \text{Not Fraud}) \]
Subtitusikan nilai asumsi
\[ \begin{split} P(L, A, M \mid \text{Not Fraud}) &= P(L |\text{Not Froud}) \cdot P(A |\text{Not Fraud}) \cdot P(M \mid \text{Not Fraud}) \\ &= 0,20 \cdot 0,10 \cdot 0,40 \\ &= 0,008 \end{split} \]
Langkah 3 : Menghitung \(P(L, A, M)\)
Menggunakan hukum probabilitas total:
\[ P(L, A, M) = P(L, A, M \mid \text{Fraud}) \cdot P(\text{Fraud}) + P(L, A, M \mid \text{Not Fraud}) \cdot P(\text{Not Fraud}) \]
Subtitusi hasil dari perhitungan sebelumnya
\[ \begin{split} P(L, A, M) &= P(L, A, M \mid \text{Fraud}) \cdot P(\text{Fraud}) + P(L, A, M \mid \text{Not Fraud}) \cdot P(\text{Not Fraud}) \\ &= 0,504 \cdot 0,01 + 0,008 \cdot 0,99 \\ &= 0,00504 + 0,00792 \\ &= 0,01296 \end{split} \]
Langkah 4 : Mehitung \(P(F = \text{Fraud} \mid L, A, M )\)
Gunakan Teorema Bayes untuk menghitung probabilitas bersyarat ini \[ P(F = \text{Fraud} \mid L, A, M ) = \frac{P(L, A, M \mid F = \text{Fraud}) \cdot P(F = \text{Fraud})}{P(L, A, M)} \]
Subtitusikan Nilai - Nilai yang ada
\[ \begin{split} P(F = \text{Fraud} \mid L, A, M ) &= \frac{P(L, A, M \mid F = \text{Fraud}) \cdot P(F = \text{Fraud})}{P(L, A, M)} \\ &= \frac{0,504 \cdot 0,01}{0,01296} \\ &= \frac{0,00504}{0,01296} \\ &= 0,3889 \\ \text{Atau} \\ &= 38,89\% \end{split} \]
Dari data, rata-rata cuma 1% transaksi yang penipuan. Tapi karena transaksi ini punya ciri-ciri mencurigakan (luar negeri, belanja besar, pakai kartu kredit), risikonya jadi jauh lebih besar, naik ke hampir 39%. Karena transaksi ini dianggap berisiko tinggi dan memerlukan perhatian khusus. Sistem deteksi penipuan dapat secara otomatis memberikan peringatan untuk transaksi dengan pola seperti ini.
Perhitungan dalam sistem
# Data historis dan probabilitas awal
# Definisi probabilitas kayak peluang transaksi bakal fraud atau nggak
define_probabilities <- function() {
prob_fraud <- 0.01 # Peluang transaksi itu penipuan (fraud)
prob_nope_fraud <- 0.99 # Peluang transaksi aman-aman aja (not fraud)
# Probabilitas kalau lagi fraud
prob_L_when_fraud <- 0.8 # Peluang lokasi luar negeri pas fraud
prob_A_when_fraud <- 0.7 # Peluang belanja lebih dari $500 pas fraud
prob_M_when_fraud <- 0.9 # Peluang bayar pake kartu kredit pas fraud
# Probabilitas kalau bukan fraud
prob_L_when_nope <- 0.2 # Peluang lokasi luar negeri pas bukan fraud
prob_A_when_nope <- 0.1 # Peluang belanja >$500 pas bukan fraud
prob_M_when_nope <- 0.4 # Peluang bayar pake kartu kredit pas bukan fraud
list(
prob_fraud = prob_fraud,
prob_nope_fraud = prob_nope_fraud,
prob_L_when_fraud = prob_L_when_fraud,
prob_A_when_fraud = prob_A_when_fraud,
prob_M_when_fraud = prob_M_when_fraud,
prob_L_when_nope = prob_L_when_nope,
prob_A_when_nope = prob_A_when_nope,
prob_M_when_nope = prob_M_when_nope
)
}
# Ngitung probabilitas bersyarat pake rumus Bayes
calculate_bayesian_probability <- function(probs) {
# P(L, A, M | Fraud)
prob_LAM_when_fraud <- probs$prob_L_when_fraud * probs$prob_A_when_fraud * probs$prob_M_when_fraud
# P(L, A, M | Not Fraud)
prob_LAM_when_nope <- probs$prob_L_when_nope * probs$prob_A_when_nope * probs$prob_M_when_nope
# Total probabilitas gabungan P(L, A, M)
prob_LAM <- (prob_LAM_when_fraud * probs$prob_fraud) +
(prob_LAM_when_nope * probs$prob_nope_fraud)
# P(Fraud | L, A, M)
prob_fraud_when_LAM <- (prob_LAM_when_fraud * probs$prob_fraud) / prob_LAM
prob_fraud_when_LAM
}
# Program utama buat ngejalanin kalkulasinya
probs <- define_probabilities()
result <- calculate_bayesian_probability(probs)
cat("Probabilitas transaksi ini adalah penipuan:", round(result * 100, 2), "%\n")## Probabilitas transaksi ini adalah penipuan: 38.89 %
Referensi
DSCiencelabs. (n.d.). Konsep Dasar Probabilitas. Retrieved December 15, 2024, dari Klik Disini.
Daud, H. A., & Azis, N. (2021). Penerapan Metode Naïve Bayes Classifier dalam Klasifikasi Data. Tajdid: Jurnal Pemikiran Islam, 24(2), 81–96. dari Klik Disini.