Tugas Statdas Pertemuan 12
Statistika Dasar
Studi Kasus 1: Prediksi Kualitas Produk
Sebuah perusahaan manufaktur memproduksi barang elektronik dan ingin memprediksi apakah suatu produk akan cacat atau tidak. Data historis menunjukkan bahwa 5% dari produk yang diproduksi adalah cacat. Perusahaan menggunakan data tentang jenis komponen dan proses produksi untuk memprediksi cacat produk menggunakan teknik probabilitas.
1.1 Fitur Data
- Komponen (\(C\)): Apakah komponen elektronik yang digunakan adalah berkualitas tinggi atau rendah.
- Proses Produksi (\(P\)): Apakah proses produksi dilakukan di bawah standar atau sesuai standar.
- Cacat (\(D\)): Status cacat produk (ya/tidak).
1.2 Data Historis (Contoh)
- Probabilitas produk cacat (\(P(D = \text{Yes})\)): 5%
- Probabilitas produk tidak cacat (\(P(D = \text{No})\)): 95%
- Probabilitas menggunakan komponen berkualitas rendah (\(P(C = \text{Low})\)): 30%
- Probabilitas menggunakan komponen berkualitas tinggi (\(P(C = \text{High})\)): 70%
- Probabilitas proses produksi di bawah standar (\(P(P = \text{Below})\)): 40%
- Probabilitas proses produksi sesuai standar (\(P(P = \text{Standard})\)): 60%
1.3 Pertanyaan
Bagaimana probabilitas bahwa suatu produk akan cacat (\(D = \text{Yes}\)), jika diketahui komponen yang digunakan berkualitas rendah dan proses produksi di bawah standar (\(C = \text{Low}\) dan \(P = \text{Below}\))?
1.3.1 Solusi
Gunakan Teorema Bayes:
\[ P(D = \text{Yes} \mid C = \text{Low}, P = \text{Below}) = \frac{P(C = \text{Low}, P = \text{Below} \mid D = \text{Yes}) \cdot P(D = \text{Yes})}{P(C = \text{Low}, P = \text{Below})} \]
1.4 Jawaban
1.4.1 Informasi yang Diberikan
Setiap informasi yang diberikan relevan untuk perhitungan probabilitas bersyarat berdasarkan Teorema Bayes. Berikut alasannya:
- Probabilitas produk cacat: \(P(D = \text{Yes}) = 0.05\) dan \(P(D = \text{No}) = 0.95\)
- Digunakan sebagai prior probability (probabilitas awal) dari status produk (cacat atau tidak).
- Penting untuk menghitung hubungan antara cacat atau tidak cacat dengan faktor lainnya.
- Probabilitas komponen berkualitas rendah: \(P(C = \text{Low}) = 0.3\)
- Memberi informasi proporsi produk yang menggunakan komponen berkualitas rendah.
- Dibutuhkan untuk menghitung gabungan probabilitas dengan proses produksi.
- Probabilitas proses produksi di bawah standar:
\(P(P = \text{Below}) = 0.4\)
- Memberikan informasi proporsi produk yang diproduksi di bawah standar.
- Dibutuhkan untuk menghitung gabungan probabilitas dengan kualitas komponen.
- Probabilitas gabungan jika produk cacat: \(P(C = \text{Low}, P = \text{Below} \mid D =
\text{Yes}) = 0.8\)
- Ini adalah likelihood (kemungkinan) bahwa produk cacat memiliki kedua faktor tersebut (komponen berkualitas rendah dan produksi di bawah standar).
- Penting untuk menerapkan Teorema Bayes.
1.4.2 Rumus Teorema Bayes
\[ P(D = \text{Yes} \mid C = \text{Low}, P = \text{Below}) = \frac{P(C = \text{Low}, P = \text{Below} \mid D = \text{Yes}) \cdot P(D = \text{Yes})}{P(C = \text{Low}, P = \text{Below})} \]
- Pembilang: Probabilitas bahwa produk cacat dan memiliki kedua faktor risiko.
- Penyebut: Probabilitas gabungan produk memiliki kedua faktor risiko, terlepas dari apakah produk cacat atau tidak.
1.4.3 Langkah Perhitungan
1.4.3.1 Langkah 1: Hitung \(P(C = \text{Low}, P = \text{Below})\)
Probabilitas gabungan \(P(C = \text{Low}, P = \text{Below})\) adalah peluang suatu produk menggunakan komponen berkualitas rendah dan diproduksi di bawah standar. Diasumsikan kedua faktor ini saling independen.
\[ P(C = \text{Low}, P = \text{Below}) = P(C = \text{Low}) \cdot P(P = \text{Below}) \]
Substitusi nilai:
\[ P(C = \text{Low}, P = \text{Below}) = 0.3 \cdot 0.4 = 0.12 \]
1.4.3.2 Langkah 2: Hitung \(P(D = \text{Yes} \mid C = \text{Low}, P = \text{Below})\)
Gunakan Teorema Bayes:
\[ P(D = \text{Yes} \mid C = \text{Low}, P = \text{Below}) = \frac{P(C = \text{Low}, P = \text{Below} \mid D = \text{Yes}) \cdot P(D = \text{Yes})}{P(C = \text{Low}, P = \text{Below})} \]
Substitusi nilai:
\[ P(D = \text{Yes} \mid C = \text{Low}, P = \text{Below}) = \frac{0.8 \cdot 0.05}{0.12} \]
1.4.3.3 Langkah 3: Selesaikan Perhitungan
Hitung pembilang:
\[ P(C = \text{Low}, P = \text{Below} \mid D = \text{Yes}) \cdot P(D = \text{Yes}) = 0.8 \cdot 0.05 = 0.04 \]
Hitung penyebut:
\[ P(C = \text{Low}, P = \text{Below}) = 0.12 \]
Hitung probabilitas bersyarat:
\[ P(D = \text{Yes} \mid C = \text{Low}, P = \text{Below}) = \frac{0.04}{0.12} = 0.3333 \]
1.4.4 Hasil Akhir
Probabilitas bahwa produk akan cacat (\(D = \text{Yes}\)) jika diketahui memiliki kedua faktor risiko (\(C = \text{Low}\) dan \(P = \text{Below}\)) adalah:
\[ 33.33\% \]
1.5 Interpretasi Hasil
1.5.1 Pemahaman Probabilitas
Hasil menunjukkan bahwa jika produk memiliki komponen berkualitas
rendah dan proses produksi dilakukan di bawah standar, ada peluang
sekitar 33.33% bahwa produk tersebut akan cacat.
Ini adalah peningkatan signifikan dibandingkan probabilitas awal (\(P(D = \text{Yes}) = 5\%\)).
1.5.2 Relevansi bagi Perusahaan
Perusahaan dapat fokus untuk meningkatkan kualitas komponen atau
memperbaiki standar produksi.
Misalnya:
- Jika komponen berkualitas rendah tidak lagi digunakan, atau
- Jika proses produksi diperbaiki,
risiko cacat produk dapat berkurang secara signifikan.
1.6 Kesimpulan
Analisis ini menunjukkan pentingnya mengelola faktor risiko dalam manufaktur. Dengan probabilitas bersyarat yang dihitung, perusahaan dapat:
- Menentukan prioritas untuk perbaikan
operasional.
- Mengurangi produk cacat dan meningkatkan efisiensi.
Pendekatan berbasis probabilitas ini memberikan dasar yang kuat untuk pengambilan keputusan strategis. Jika perusahaan mengurangi salah satu faktor risiko, probabilitas cacat produk dapat menurun drastis.
1.7 Langkah Pengurangan Risiko
Untuk mengurangi risiko produk cacat, perusahaan dapat mengambil langkah-langkah berikut:
1.7.1 Meningkatkan Kualitas Komponen
Jika probabilitas \(P(C =
\text{Low})\) (komponen berkualitas rendah) dikurangi, maka
peluang produk cacat juga akan menurun.
Contoh: Mengurangi penggunaan komponen berkualitas rendah dari 30%
menjadi 10% akan langsung berdampak pada risiko cacat.
1.7.2 Memperbaiki Standar Produksi
Meningkatkan \(P(P =
\text{Standard})\) (proses produksi sesuai standar) akan
mengurangi risiko cacat.
Contoh: Jika produksi di bawah standar dikurangi dari 40% menjadi 20%,
maka probabilitas \(P(D = \text{Yes})\)
akan berkurang.
1.7.3 Fokus pada Gabungan Faktor
Karena \(P(C = \text{Low}, P = \text{Below} \mid D = \text{Yes}) = 0.8\), perusahaan dapat memprioritaskan kombinasi ini untuk perbaikan operasional.
1.7.4 Monitor dan Validasi
Gunakan data historis untuk terus memvalidasi asumsi dan memperbarui model probabilitas, memastikan perhitungan tetap akurat seiring waktu.
Studi Kasus 2: Deteksi Penipuan Transaksi
Sebuah perusahaan e-commerce ingin mendeteksi transaksi yang berpotensi penipuan. Berdasarkan data historis, 1% dari transaksi yang dilakukan adalah penipuan. Perusahaan ingin menggunakan fitur-fitur tertentu seperti lokasi transaksi, jumlah pembelian, dan metode pembayaran untuk memprediksi apakah suatu transaksi adalah penipuan atau tidak.
2.1 Fitur Data
- Lokasi (\(L\)): Negara atau kota tempat transaksi dilakukan.
- Jumlah Pembelian (\(A\)): Jumlah uang yang dibelanjakan.
- Metode Pembayaran (\(M\)): Metode pembayaran yang digunakan (kartu kredit, dompet digital, dll).
- Penipuan (\(F\)): Status transaksi apakah penipuan atau tidak.
2.2 Data Historis (Contoh)
- Probabilitas transaksi adalah penipuan (\(P(F = \text{Yes})\)): 1%
- Probabilitas transaksi bukan penipuan (\(P(F = \text{No})\)): 99%
- Probabilitas lokasi tertentu adalah di luar negeri (\(P(L = \text{Foreign})\)): 20%
- Probabilitas jumlah pembelian lebih dari $500 (\(P(A > 500)\)): 10%
- Probabilitas menggunakan kartu kredit sebagai metode pembayaran (\(P(M = \text{Credit Card})\)): 50%
2.3 Pertanyaan
Bagaimana probabilitas bahwa suatu transaksi adalah penipuan (\(F = \text{Yes}\)), jika diketahui transaksi dilakukan dari lokasi luar negeri (\(L = \text{Foreign}\)), jumlah pembelian lebih dari $500 (\(A > 500\)), dan metode pembayaran menggunakan kartu kredit (\(M = \text{Credit Card}\))?
2.3.1 Solusi
Gunakan Teorema Bayes:
\[ P(F = \text{Yes} \mid L = \text{Foreign}, A > 500, M = \text{Credit Card}) = \frac{P(L = \text{Foreign}, A > 500, M = \text{Credit Card} \mid F = \text{Yes}) \cdot P(F = \text{Yes})}{P(L = \text{Foreign}, A > 500, M = \text{Credit Card})} \]
Langkah-langkah perhitungan dapat dilanjutkan dengan data yang relevan untuk menyelesaikan probabilitas bersyarat.
2.4 Jawaban
2.4.1 Informasi yang Diberikan
Setiap informasi yang diberikan relevan untuk menghitung probabilitas bersyarat menggunakan Teorema Bayes:
2.4.1.1 Probabilitas Dasar
- Probabilitas transaksi adalah penipuan: \(P(F = \text{Fraud}) = 0.01 \quad \text{(1% transaksi adalah penipuan)}.\)
- Probabilitas transaksi bukan penipuan: \(P(F = \text{Not Fraud}) = 0.99 \quad \text{(99% transaksi bukan penipuan)}.\)
2.4.1.2 Probabilitas Faktor Risiko
- Lokasi transaksi di luar negeri: \(P(L = \text{Overseas}) = 0.2.\)
- Jumlah pembelian lebih dari $500: \(P(A = \text{High}) = 0.1.\)
- Metode pembayaran menggunakan kartu kredit: \(P(M = \text{Credit Card}) = 0.5.\)
2.4.1.3 Gabungan Faktor Risiko
- Probabilitas gabungan untuk transaksi penipuan:
\(P(L, A, M \mid F = \text{Fraud}) = 0.4 \quad \text{(40% transaksi penipuan memiliki faktor risiko ketiga)}.\) - Probabilitas gabungan untuk transaksi bukan penipuan:
\(P(L, A, M \mid F = \text{Not Fraud}) = 0.05 \quad \text{(5% transaksi bukan penipuan memiliki faktor risiko ketiga)}.\)
2.4.2 Rumus Teorema Bayes
Untuk menghitung probabilitas bersyarat \(P(F = \text{Fraud} \mid L, A, M)\), gunakan rumus:
\[ P(F = \text{Fraud} \mid L, A, M) = \frac{P(L, A, M \mid F = \text{Fraud}) \cdot P(F = \text{Fraud})}{P(L, A, M)}. \]
2.4.2.1 Komponen Rumus
Pembilang:
\(P(L, A, M \mid F = \text{Fraud}) \cdot P(F = \text{Fraud})\)
Probabilitas bahwa transaksi penipuan memiliki faktor risiko ketiga.Penyebut:
\(P(L, A, M) = [P(L, A, M \mid F = \text{Fraud}) \cdot P(F = \text{Fraud})] + [P(L, A, M \mid F = \text{Not Fraud}) \cdot P(F = \text{Not Fraud})]\)
Probabilitas bahwa transaksi memiliki faktor risiko ketiga, baik penipuan maupun tidak.
2.4.3 Langkah Perhitungan
2.4.3.1 Langkah 1: Hitung \(P(L, A, M)\)
Gunakan hukum probabilitas total:
\[ P(L, A, M) = [P(L, A, M \mid F = \text{Fraud}) \cdot P(F = \text{Fraud})] + [P(L, A, M \mid F = \text{Not Fraud}) \cdot P(F = \text{Not Fraud})]. \]
Substitusi nilai:
\[ P(L, A, M) = (0.4 \cdot 0.01) + (0.05 \cdot 0.99). \]
Perhitungan:
\[ P(L, A, M) = 0.004 + 0.0495 = 0.0535. \]
2.4.3.2 Langkah 2: Hitung \(P(F = \text{Fraud} \mid L, A, M)\)
Gunakan rumus Teorema Bayes:
\[ P(F = \text{Fraud} \mid L, A, M) = \frac{P(L, A, M \mid F = \text{Fraud}) \cdot P(F = \text{Fraud})}{P(L, A, M)}. \]
Substitusi nilai:
\[ P(F = \text{Fraud} \mid L, A, M) = \frac{0.4 \cdot 0.01}{0.0535}. \]
Perhitungan:
\[ P(F = \text{Fraud} \mid L, A, M) = \frac{0.004}{0.0535} \approx 0.0748. \]
2.4.4 Hasil Akhir
Probabilitas bahwa transaksi tersebut adalah penipuan (\(F = \text{Fraud}\)) jika diketahui memiliki faktor risiko ketiga (\(L = \text{Overseas}, A = \text{High}, M = \text{Credit Card}\)) adalah:
\[ \text{7.48\%.} \]
2.5 Interpretasi Hasil
2.5.1 Pemahaman Probabilitas:
- Jika suatu transaksi berasal dari lokasi luar negeri, memiliki jumlah pembelian besar, dan menggunakan kartu kredit, maka ada peluang sekitar 7.48% bahwa transaksi tersebut adalah penipuan.
- Meskipun kecil, ini adalah peningkatan yang signifikan dari probabilitas awal (\(P(F = \text{Fraud}) = 1\%\)).
2.5.2 Relevansi untuk Perusahaan:
- Perusahaan dapat menggunakan hasil ini untuk memprioritaskan transaksi dengan kombinasi faktor risiko tersebut untuk diperiksa lebih lanjut.
- Menggunakan probabilitas ini dalam model deteksi penipuan dapat membantu meningkatkan efisiensi dan mengurangi kerugian.
2.6 Kesimpulan
Hasil analisis menunjukkan bahwa probabilitas suatu transaksi merupakan penipuan meningkat secara signifikan jika memenuhi tiga faktor risiko. Perusahaan dapat mengimplementasikan langkah-langkah berikut:
Meningkatkan pemantauan transaksi dengan faktor risiko tinggi.
Mengoptimalkan model deteksi dengan data historis yang lebih banyak.
Mengurangi kerugian dengan cepat menangani transaksi mencurigakan.
2.7 Langkah Pengurangan Risiko
2.7.1 Pemantauan Transaksi dengan Faktor Risiko Tinggi
- Transaksi dengan kombinasi lokasi luar negeri, jumlah pembelian besar, dan metode pembayaran kartu kredit memiliki peluang lebih tinggi untuk menjadi penipuan.
- Fokuskan sumber daya pada pengawasan transaksi dengan tiga faktor risiko ini untuk mencegah kerugian.
2.7.2 Optimasi Algoritma Deteksi Penipuan
- Gunakan probabilitas bersyarat \(P(F = \text{Fraud} \mid L, A, M)\) sebagai bagian dari model deteksi penipuan berbasis pembelajaran mesin.
- Perbarui data historis secara rutin untuk meningkatkan akurasi prediksi.
2.7.3 Peningkatan Verifikasi Transaksi
- Terapkan lapisan verifikasi tambahan untuk transaksi dengan
probabilitas tinggi menjadi penipuan, seperti:
- Verifikasi lokasi melalui IP address atau metode geolokasi.
- Meminta otorisasi manual untuk jumlah pembelian besar.
2.7.4 Peningkatan Kebijakan Pembayaran
- Batasi jumlah transaksi besar dari lokasi luar negeri tanpa pemeriksaan tambahan.
- Tingkatkan keamanan metode pembayaran kartu kredit, seperti menggunakan autentikasi dua faktor (2FA).
2.7.5 Analisis Lanjutan Faktor Risiko
- Identifikasi pola-pola tambahan yang dapat meningkatkan deteksi penipuan: Riwayat akun pelanggan.
- Waktu transaksi (misalnya, transaksi larut malam mungkin lebih mencurigakan). Kategori produk yang dibeli.
2.7.6 Pelatihan dan Edukasi Tim
- Latih tim deteksi penipuan untuk mengenali transaksi dengan faktor risiko tinggi berdasarkan hasil analisis probabilitas.
- Dorong koordinasi antara tim risiko dan teknologi untuk mengimplementasikan langkah-langkah mitigasi secara efektif.