Tugas Pertemuan ke-13
Konsep Dasar Probabilitas
A. Konsep Dasar Probabilitas
Probabilitas adalah cabang matematika yang berkaitan dengan peluang suatu kejadian terjadi. Konsep dasarnya digunakan untuk mengukur ketidakpastian suatu peristiwa, dengan nilai yang berkisar dari 0 (kejadian pasti tidak terjadi) hingga 1 (kejadian pasti terjadi).
Berikut adalah konsep dasar dalam probabilitas:
1. Percobaan (Experiment)
- Sebuah tindakan atau proses yang menghasilkan hasil tertent.
- Contoh: Melempar dadu, memilih kartu dari setumpuk kartu, atau melempar koin.
2. Ruang Sample (Sample Space, S)
- Kumpulan semua hasil yang mungkin dari sebuah percobaan.
- COntoh: Untuk sebuah dadu, ruang sample \(S = {1, 2, 3, 4, 5, 6}\).
3. Kejadian (Event, E)
- Subset dari ruang sampel yang mewakili hasil-hasil tertentu yang diinginkan.
- COntoh: Pada dadu, kejadian \(E\) bisa berupa Keluar angka genap, sehingga \(E = {2, 4, 6}\).
4. Probabilitas (Probability)
- Ukuran peluang suatu kejadian terjadi.
- Dinyatakan dengan rumus dasar: \[ P(E) = \frac{\text{Jumlah hasil dalam kejadian } E}{\text{Jumlah hasil dalam ruang sampel } S} \]
- Contoh: Probabilitas mendapatkan angka genap pada dadu adalah: \[ P(E) = \frac{6}{3} = 0.5 \]
5. Frekuensi Relatif
- Pendekatan empiris untuk menghitung probabilitas berdasarkan data historis atau eksperimen.
- Rumuas: \[ P(E) = \frac{\text{Frekuensi kejadian } E}{\text{Total percobaan}} \]
6. Aturan Probabilitas
- Aturan Jumlah (Addition Rule): Jika \(A\) dan \(B\) adalah dua kejadian, ,maka: \[ P(A \cup B) = P(A) + P(B) - P(A \cap B) \] Jika \(A\) dan \(B\) saling eksklusif (tidak bisa terjadi bersama), maka: \[ P(A \cup B) = P(A) + P(B) \]
- Aturan Perkalian (Multiplication Rule): Jika \(A\) dan \(B\) adalah dua kejadian, maka: \[ P(A \cap B) = P(A) \cdot P(B \mid A) \] Jika \(A\) dan \(B\) independen (tidak saling memengaruhi), maka: \[ P(A \cap B) = P(A) \cdot P(B) \]
7. Jenis Probabilitas
- Probabilitas Teoretis: Berdasarkan analisis matematika, tanpa eksperimen.
- Probabilitas Empiris: Berdasarkan hasil eksperimen atau data observasi.
- Probabilitas Subjektif: Berdasarkan penilaian pribadi atau informasi yang diketahui.
B. Studi Kasus 1
Untuk menghitung probabilitas: \[ P(D = \text{yes} \mid C = \text{low}, P = \text{below}) \] menggunakan Teorema Bayes, kita memerlukan informasi tambahan tentang probabilitas kondisi tersebut berdasarkan dara historis.
Teorema Bayes berbunyi: \[ P(D = \text{yes} \mid C = \text{low}, P = \text{below}) = \frac{P(C = \text{low}, P = \text{below} \mid D = \text{yes}) \cdot P(D = \text{yes})}{P(C = \text{low}, P = \text{below})} \]
Langkah-Langkah Perhitungan
1. Data historis yang di butuhkah:
- \(P(D = yes) = 0.05\)
- \(P(C = low) = 0.30\)
- \(P(P = below) = 0.40\)
Probabilitas gabungan \(P(C = low, P = below)\) dapat dihitung dari data, tetapi perlu asumsi tambahan atau distribusi yang menyatakan hubungan antar kondisi.
2. Asumsi dan Data tambahan
- Misalkan \(P(C = low, P = below \mid D =
yes)\) diasumsikan diketahui atau bisa dihitung berdasarkan pola
distribusi historis. Misalnya, menggunakan:
- \(P(C = low \mid D = yes) = 0.70\) (contoh asumsi bahwa produk cacat cenderung menggunakan komponen berkualitas rendah)
- \(P(P = below \mid D = yes) = 0.80\) (contoh asumsi bahwa produk cacat cenderung menggunakan proses produksi di bawah standar).
3. Hitung Probabilitas Gabungan
- \(P(C = low, P = below \mid D = yes) = P(C = low \mid D = yes) \cdot P(P = below \mid D = yes)\)
- Dengan nilai asumsi di atas: \[ P(C = low, P = below \mid D = yes) = 0.70 \cdot 0.80 = 0.56 \]
4. Probabilitas Gabungan
- \(P(C = low, P = below \mid D = no) = 0.10\) ( Asumsi sebagai kasus produk tidak cacat ).
Maka: \[ P(C = \text{low}, P = \text{below}) = (0.56 \cdot 0.05) + (0.10 \cdot 0.95) = 0.028 + 0.095 = 0.123 \]
5. Hitung Probabilitas Bersyarat
Subsitusi semua nilai ke dalam Teorema Bayes: \[ P(D = \text{yes} \mid C = \text{low}, P = \text{below}) = \frac{P(C = \text{low}, P = \text{below} \mid D = \text{yes}) \cdot P(D = \text{yes})}{P(C = \text{low}, P = \text{below})} \] Subsitusi: \[ P(D = \text{yes} \mid C = \text{low}, P = \text{below}) = \frac{0.123}{0.56 \cdot 0.05} = \frac{0.123}{0.028} \approx 0.228 \] Jadi, Probabilitas bahwa suatu produk akan cacat jika menggunakan komponen berkualitas rendah dan proses produksi di bawah standar adalah sekitar 22.8%.
C. Studi Kasus 2
Penerapan Probabilitas dalam Deteksi Penipuan Transaksi:
Sebuah perusahaan e-commerce ingin mendeteksi transaksi yang berpotensi penipuan. Berdasarkan data historis, 1% dari transaksi yang dilakukan adalah penipuan. Perusahaan ingin menggunakan fitur-fitur tertentu seperti lokasi transaksi, jumlah pembelian, dan metode pembayaran untuk memprediksi apakah suatu transaksi adalah penipuan atau tidak.
Fitur Data
- Lokasi \((L)\) : Negara atau kota tempat transaksi dilakukan.
- Jumlah Pembelian \((A)\) : Jumlah uang yang dibelanjakan.
- Metode Pembayaran \((M)\) : Metode pembayaran yang digunakan (kartu kredit, dompet digital, dll).
- Penipuan \((F)\): Status transaksi apakah penipuan atau tidak.
Data Historis (Contoh)
- Probabilitas transaksi adalah penipuan \((P (F = Fraud)) = 1\% = 0,01\)
- Probabilitas transaksi bukan penipuan \((P(F = Not Fraud)) = 99\% = 0,99\)
- Probabilitas lokasi tertentu adalah di luar negeri \((P(L = Foreign)) = 20\% = 0,20\)
- Probabilitas jumlah pembelian lebih dari 500 \(P(A = High)) = 10\% = 0,10\)
- Probabilitas menggunakan kartu kredit sebagai metode pembayaran \((P(M = Credit Card)) = 50\% = 0,50\)
Bagaimana probabilitas bahwa suatu transaksi adalah penipuan (𝐹 = Fraud), jika diketahui transaksi dilakukan dari lokasi luar negeri, jumlah pembelian lebih dari $500, dan metode pembayaran menggunakan kartu kredit?
Gunakan Teorema Bayes untuk menghitung probabilitas bersyarat ini
\[ \begin{split} P(F = \text{Fraud} \mid L, A, M ) = \frac{P(L, A, M \mid F = \text{Fraud}) \cdot P(F = \text{Fraud})}{P(L, A, M)} \end{split} \]
Dimana :
- \(L\) = Lokasi
- \(A\) = Jumlah Pembelian
- \(M\) = Metode Pembayaran
- \(F\) = Penipuan
Langkah - Langkah Menghitung Probabilitas Bersyarat
Langkah 1 : Menghitung \(P(L, A, M \mid F= \text{Fraud})\)
Asumsikan
- Transaksi penipuan berasal dari luar negeri \(P(L = \text{Foreign} | F = \text{Froud}) = 80\% = 0,80\)
- Transaksi penipuan melibatkan jumlah lebih dari 500 \(P(A > 500 | F = \text{Fraud}) = 70\% = 0,70\)
- Transaksi penipuan menggunakan kartu kredit \(P(M = \text{CreditCard} \mid F = \text{Fraud}) = 90\% 0.90\)
Rumus :
\[ P(L, A, M \mid F= \text{Fraud}) = P(L | F = \text{Froud}) \cdot P(A | F = \text{Fraud}) \cdot P(M \mid F = \text{Fraud}) \]
Subtitusikan nilai asumsi
\[ \begin{split} P(L, A, M \mid F= \text{Fraud}) &= P(L | F = \text{Froud}) \cdot P(A | F = \text{Fraud}) \cdot P(M \mid F = \text{Fraud}) \\ &= 0,80 \cdot 0,70 \cdot 0,90 \\ &= 0,504 \end{split} \]
Langkah 2 : Menghitung \(P(L, A, M \mid F= \text{Not Fraud})\)
Asumsikan
- Transaksi biasa berasal dari luar negeri \(P(L = \text{Foreign} \mid F = \text{Not Fraud}) = 20 \% = 0,20\).
- Transaksi biasa melibatkan jumlah lebih dari 500 \(P(A > 500 \mid F = \text{Not Fraud}) = 10\% = 0,10\).
- Transaksi biasa menggunakan kartu kredit \(P( M = \text{Credit Card} \mid F= \text{Not Fraud}) = 40\% = 0,40\).
Rumus :
\[ P(L, A, M \mid \text{Not Fraud}) = P(L |\text{Not Froud}) \cdot P(A |\text{Not Fraud}) \cdot P(M \mid \text{Not Fraud}) \]
Subtitusikan nilai asumsi
\[ \begin{split} P(L, A, M \mid \text{Not Fraud}) &= P(L |\text{Not Froud}) \cdot P(A |\text{Not Fraud}) \cdot P(M \mid \text{Not Fraud}) \\ &= 0,20 \cdot 0,10 \cdot 0,40 \\ &= 0,008 \end{split} \]
Langkah 3 : Menghitung \(P(L, A, M)\)
Menggunakan hukum probabilitas total:
\[ P(L, A, M) = P(L, A, M \mid \text{Fraud}) \cdot P(\text{Fraud}) + P(L, A, M \mid \text{Not Fraud}) \cdot P(\text{Not Fraud}) \]
Subtitusi hasil dari perhitungan sebelumnya
\[ \begin{split} P(L, A, M) &= P(L, A, M \mid \text{Fraud}) \cdot P(\text{Fraud}) + P(L, A, M \mid \text{Not Fraud}) \cdot P(\text{Not Fraud}) \\ &= 0,504 \cdot 0,01 + 0,008 \cdot 0,99 \\ &= 0,00504 + 0,00792 \\ &= 0,01296 \end{split} \]
Langkah 4 : Mehitung \(P(F = \text{Fraud} \mid L, A, M )\)
Gunakan Teorema Bayes untuk menghitung probabilitas bersyarat ini \[ P(F = \text{Fraud} \mid L, A, M ) = \frac{P(L, A, M \mid F = \text{Fraud}) \cdot P(F = \text{Fraud})}{P(L, A, M)} \]
Subtitusikan Nilai - Nilai yang ada
\[ \begin{split} P(F = \text{Fraud} \mid L, A, M ) &= \frac{P(L, A, M \mid F = \text{Fraud}) \cdot P(F = \text{Fraud})}{P(L, A, M)} \\ &= \frac{0,504 \cdot 0,01}{0,01296} \\ &= \frac{0,00504}{0,01296} \\ &= 0,3889 \\ \text{Atau} \\ &= 38,89\% \end{split} \]
Perhitungan dalam sistem
# Data historis dan probabilitas awal
# Definisi probabilitas kayak peluang transaksi bakal fraud atau nggak
define_probabilities <- function() {
prob_fraud <- 0.01 # Peluang transaksi itu penipuan (fraud)
prob_nope_fraud <- 0.99 # Peluang transaksi aman-aman aja (not fraud)
# Probabilitas kalau lagi fraud
prob_L_when_fraud <- 0.8 # Peluang lokasi luar negeri pas fraud
prob_A_when_fraud <- 0.7 # Peluang belanja lebih dari $500 pas fraud
prob_M_when_fraud <- 0.9 # Peluang bayar pake kartu kredit pas fraud
# Probabilitas kalau bukan fraud
prob_L_when_nope <- 0.2 # Peluang lokasi luar negeri pas bukan fraud
prob_A_when_nope <- 0.1 # Peluang belanja >$500 pas bukan fraud
prob_M_when_nope <- 0.4 # Peluang bayar pake kartu kredit pas bukan fraud
list(
prob_fraud = prob_fraud,
prob_nope_fraud = prob_nope_fraud,
prob_L_when_fraud = prob_L_when_fraud,
prob_A_when_fraud = prob_A_when_fraud,
prob_M_when_fraud = prob_M_when_fraud,
prob_L_when_nope = prob_L_when_nope,
prob_A_when_nope = prob_A_when_nope,
prob_M_when_nope = prob_M_when_nope
)
}
# Ngitung probabilitas bersyarat pake rumus Bayes
calculate_bayesian_probability <- function(probs) {
# P(L, A, M | Fraud)
prob_LAM_when_fraud <- probs$prob_L_when_fraud * probs$prob_A_when_fraud * probs$prob_M_when_fraud
# P(L, A, M | Not Fraud)
prob_LAM_when_nope <- probs$prob_L_when_nope * probs$prob_A_when_nope * probs$prob_M_when_nope
# Total probabilitas gabungan P(L, A, M)
prob_LAM <- (prob_LAM_when_fraud * probs$prob_fraud) +
(prob_LAM_when_nope * probs$prob_nope_fraud)
# P(Fraud | L, A, M)
prob_fraud_when_LAM <- (prob_LAM_when_fraud * probs$prob_fraud) / prob_LAM
prob_fraud_when_LAM
}
# Program utama buat ngejalanin kalkulasinya
probs <- define_probabilities()
result <- calculate_bayesian_probability(probs)
cat("Probabilitas transaksi ini adalah penipuan:", round(result * 100, 2), "%\n")## Probabilitas transaksi ini adalah penipuan: 38.89 %
D. Kesimpulan
Probabilitas adalah cabang matematika yang mempelajari peluang terjadinya suatu peristiwa berdasarkan ruang sampel. Probabilitas digunakan untuk mengukur ketidakpastian dengan nilai antara 0 (tidak mungkin terjadi) hingga 1 (pasti terjadi). Konsep ini memiliki elemen dasar seperti percobaan, ruang sampel, dan peristiwa, serta diterapkan dalam berbagai bidang melalui pendekatan teoretis, empiris, atau subjektif. Probabilitas menjadi dasar dalam pengambilan keputusan, analisis risiko, dan prediksi dalam berbagai disiplin ilmu.
E. Refrensi
- DSciencelabs. (n.d.) Pengantar Statistika untuk Sains Data. Bookdown. Retrieved from Klik disini
- LMS-SPADA Indonesi BAB 7 Konsep Dasar Probabili7tas.Retrieved from Klik disini
- Statistika Deskriptif Dasar Probabilitas Modul 5. Retrieved from Klik disini