Konsep Dasar Probabilitas
1 Definisi
Probabilitas adalah cabang ilmu Matematika yang digunakan untuk mengukur ketidakpastian. Dalam sains data, probabilitas adalah dasar dari metode inferensi statistik, pengambilan keputusan, dan pembelajaran mesin. Berikut pembahasan penyelesaian 2 studi kasus.
2 Studi Kasus 1
Penerapan Probabilitas dalam Prediksi Kualitas Produk:
Sebuah perusahaan manufaktur memproduksi barang elektronik dan ingin memprediksi apakah suatu produk akan cacat atau tidak. Data historis menunjukkan bahwa 5% dari produk yang diproduksi adalah cacat. Perusahaan menggunakan data tentang jenis komponen dan proses produksi untuk memprediksi cacat produk menggunakan teknik probabilitas.
Berikut penjelasan mengenai studi kasus 1:
2.1 Soal yang Diberikan:
Sebuah perusahaan manufaktur memproduksi barang elektronik dan ingin memprediksi apakah suatu produk akan cacat atau tidak. Data historis menunjukkan bahwa 5% dari produk yang diproduksi adalah cacat. Kami memiliki informasi tentang jenis komponen dan proses produksi untuk memprediksi cacat produk.
2.2 Data yang Diberikan:
1. Probabilitas Cacat Produk:
- P (D Yes) = 0.05 (5% Probabilitas produk cacat)
- P (D No) = 0.95 (95% Probabilitas produk tidak cacat)
2. Probabilitas Kualitas Komponen:
- P (C Low) = 0.30 (Probabilitas menggunakan komponen berkualitas rendah)
- P (C High) = 0.70 (Probabilitas menggunakan komponen berkualitas tinggi)
3. Probabilitas Proses Produksi:
- P (P Below) = 0.40 (Probabilitas proses produksi di bawah standar)
- P (P Standard) = 0.60 (Probabilitas proses produksi sesuai standar)
2.3 Pertanyaan
Bagaimana probabilitas bahwa suatu produk akan cacat (D Yes), jika diketahui komponen yang digunakan berkualitas rendah (C Low) dan proses produksi di bawah standar (P Below)? Gunakan Teorema Bayes untuk menghitung probabilitas bersyarat ini:
2.4 Langkah-langkah Penyelesaian
2.4.1 Langkah 1: Identifikasi Kejadian
Kita ingin mencari:
\[P (D Yes| C Low, P Below)\]
2.4.2 Langkah 2: Gunakan Teorema Bayes
Teorema Bayes menyatakan: \[ P(A ∣ B) = \ \frac{P(B|A) . P(A)}{P(B)} \ \] Sehingga kita dapat menuliskannya sebagai: \[ P(D Yes ∣ C Low, P Below) = \ \frac{ P( C Low, P Below | D Yes ) . P( D Yes )}{ P( C Low, P Below )} \ \]
2.4.3 Langkah 3: Hitung Probabilitas Total
Kita perlu menghitung:
1. Probabilitas gabungan dari komponen rendah dan proses di bawah standar:
- Dengan asumsi independensi antara kualitas komponen dan proses produksi, kita dapat menghitung:
\[P ( C Rendah, P Di Bawah) = P ( C Rendah) . P ( P Di Bawah) = (0.30) . (0.40) = 0.12\]
2. Estimasi Probabilitas Bersyarat:
Kita perlu menentukan nilai untuk P ( C Rendah ,P Di Bawah ∣ D Ya ). Jika tidak ada data spesifik, kami dapat membuat asumsi berdasarkan pengalaman atau data historis.
Misalkan kita berasumsi bahwa probabilitas menggunakan komponen berkualitas rendah dan proses di bawah standar ketika produk cacat cukup tinggi, misalnya:
\[P ( C Rendah ,P Di Bawah ∣ D Ya) = 0.8\]
2.4.4 Langkah 4: Substitusi ke dalam Rumus Teorema Bayes
Sekarang kita substitusi semua nilai yang telah kita hitung ke dalam rumus Teorema Bayes: \[ P(D Ya ∣C Rendah, P Di Bawah) = \ \frac{P ( C Rendah ,P Di Bawah ∣ D Ya). P (D Ya)}{ P( C Rendah, P Di Bawah )} = \frac {(0.8) . (0.05)}{0.12} \ \]
2.4.5 Langkah 5: Hitung Nilai Akhir
Hitung nilai tersebut: \[ = \ \frac {0.04}{0.12} = 0.3333 \ \]
2.5 Kesimpulan
Probabilitas diketahui bahwa suatu produk akan cacat jika komponen yang digunakan berkualitas rendah dan proses produksi di bawah standar adalah sekitar 33.33%.
3 Studi Kasus 2
Penerapan Probabilitas dalam Deteksi Penipuan Transaksi: Sebuah perusahaan e-commerce ingin mendeteksi transaksi yang berpotensi penipuan. Berdasarkan data historis, 1% dari transaksi yang dilakukan adalah penipuan. Perusahaan ingin menggunakan fitur-fitur tertentu seperti lokasi transaksi, jumlah pembelian, dan metode pembayaran untuk memprediksi apakah suatu transaksi adalah penipuan atau tidak.
Berikut penjelasan mengenai studi kasus 2:
3.1 Soal yang Diberikan:
Sebuah perusahaan e-commerce ingin mendeteksi transaksi yang berpotensi penipuan. Berdasarkan data historis, 1% dari transaksi yang dilakukan adalah penipuan. Perusahaan ingin menggunakan fitur-fitur tertentu seperti lokasi transaksi, jumlah pembelian, dan metode pembayaran untuk memprediksi apakah suatu transaksi adalah penipuan atau tidak.
3.2 Data yang Diberikan:
1. Probabilitas Penipuan:
- P (F Penipuan) = 0.01 (1 % dari transaksi adalah penipuan)
- P (F Bukan Penipuan) = 0.95 (99 % dari transaksi bukan penipuan)
2. Fitur Probabilitas:
- P (L Asing) = 0.20 (Probabilitas lokasi transaksi di luar negeri)
- P (Tinggi) = 0.10 (Probabilitas jumlah pembelian lebih dari $500)
- P (Kartu Kredit M) = 0.50 (Probabilitas menggunakan kartu kredit sebagai metode pembayaran)
3.3 Pertanyaan
Bagaimana probabilitas bahwa suatu transaksi adalah penipuan (F = Fraud), jika diketahui transaksi dilakukan dari lokasi luar negeri (L Asing), jumlah pembelian lebih dari $500 (Tinggi), dan metode pembayaran menggunakan kartu kredit (Kartu Kredit M)? Gunakan Teorema Bayes untuk menghitung probabilitas bersyarat ini:
3.4 Langkah-langkah Penyelesaian
3.4.1 Langkah 1: Identifikasi Kejadian
Kita ingin mencari:
\[P (F Penipuan| L Asing, Tinggi , Kartu Kredit M)\]
3.4.2 Langkah 2: Gunakan Teorema Bayes
Teorema Bayes menyatakan:
\[ P(A ∣ B) = \ \frac{P=(B|A) . P(A)}{P(B)} \ \] Sehingga kita dapat menuliskannya sebagai: \[ P( F Penipuan, L Asing,Tinggi , Kartu Kredit M) = \ \frac{ P( L Asing,Tinggi , M Kartu Kredit | F Penipuan) . P( F Penipuan )}{ P( L Asing,Asing,Tinggi , Kartu Kredit M)} \ \]
3.4.3 Langkah 3: Hitung Probabilitas Gabungan
Kita perlu menghitung:
1. Probabilitas gabungan dari fitur untuk penipuan:
- Asumsikan bahwa fitur-fitur tersebut independen satu sama lain ketika transaksi adalah penipuan, maka kita dapat menghitung:
\[ P( L Asing,Tinggi , M Kartu Kredit | F Penipuan) = P( L Asing | FPenipuan).P(A Tinggi | F Penipuan).(M Kartu Kredit | F Penipuan) \] Misalkan kita berasumsikan nilai-nilai berikut berdasarkan data historis atau asumsi yang relevan:
- P (L Asing | F Penipuan) = 0.30 (30% dari transaksi penipuan yang terjadi di luar negeri)
- P (A Tinggi | F Penipuan) = 0.20 (20 % dari transaksi penipuan memiliki jumlah pembelian lebih dari $500)
- P (M Kartu Kredit | F Penipuan) = 0.60 (60% dari transaksi penipuan menggunakan kartu kredit)
Maka,
\[ P (L Asing, A Tinggi, M Kartu Kredit | F Penipuan) = (0.30).(0.20).(0.60) = 0.036 hari\]
2. Probabilitas Gabungan Untuk Semua Transaksi:
Dengan asumsi independensi juga untuk transaksi yang bukan penipuan, kita memerlukan nilai untuk fitur-fitur tersebut dalam konteks bukan penipuan.
Misalkan kita mengansumsikan nilai berikut untuk transaksi yang bukan penipuan:
P (L | FN atau Penipuan) = 0.10
P (A | FN atau Penipuan) = 0.05
P (M | FN atau Penipuan) = 0.40
Maka,
- Probabilitas gabungan untuk bukan penipuan :
\[P(L,A,M | FN atau Penipuan) = (0.10).(0.05).(0.40) = 0.002\]
3. Menghitung Probabilitas Total:
\[P(L,A,M) = P(L,A,M | F Fraud). P (F Fraud) + P(L,A,M | FN atau Penipuan). P(FN atau Penipuan) \]
Subsitusi nilai-nilai yang diketahui:
\[P(L,A,M) = (0.036 hari).0.01) + (0.002).0.99) = 0.00036 + 0.00198 = 0.00234\]
3.4.4 Langkah 4: Substitusi ke dalam Rumus Teorema Bayes
Sekarang kita substitusi semua nilai yang telah kita hitung ke dalam rumus Teorema Bayes: \[ P(F Fraud ∣ L Asing,Tinggi,Kartu Kredit MC) = \ \frac{(0.036).(0.01)}{(0.00234)} = (0.00036). (0.00234) = 0.1538 \ \]
3.5 Kesimpulan
Probabilitas diketahui bahwa suatu transaksi adalah penipuan jika dilakukan dari lokasi luar negeri, jumlah pembelian lebih dari $500, dan metode pembayaran menggunakan kartu kredit adalah sekitar 15.38%.