Bab 1 Tugas Statistika Dasar Bab VII

1.1 Apa Itu Probabilitas ?

Probabilitas adalah cabang ilmu Matematika yang digunakan untuk mengukur ketidakpastian. Dalam sains data, probabilitas adalah dasar dari metode inferensi statistik, pengambilan keputusan, dan pembelajaran mesin.

Probabilitas itu intinya cara kita mengukur seberapa besar kemungkinan suatu peristiwa bisa terjadi. Misalnya, kalau kita lempar koin, kita ingin tahu seberapa besar kemungkinan koin itu jatuh di sisi gambar atau angka. Nilainya bisa antara 0 dan 1:

  • 0 → kejadian itu nggak mungkin banget terjadi.
  • 1 → artinya kejadian itu pasti terjadi.

1.1.1 Ruang Sampel dan Kejadian

  • Ruang Sampel (Sample Space) → semua kemungkinan hasil dari sebuah percobaan. Kalau misalnya kita lempar dadu, ruang sampelnya adalah \(S = \{1, 2, 3, 4, 5, 6\}\), karena itu semua angka yang bisa muncul.

  • Kejadian (Event) → subset atau bagian dari ruang sampel. Jadi, kalau kita ngomongin kejadian “mendapatkan angka genap” saat lempar dadu, itu artinya kejadian \(A = \{2, 4, 6\}\).

1.1.2 Probabilitas Kejadian Tunggal

Probabilitas kejadian itu dihitung dengan cara ngebandingin jumlah kejadian yang kita mau dengan jumlah semua kemungkinan yang ada di ruang sampel. Contohnya, kalau kita pengen tahu peluang dapetin angka genap saat lempar dadu:

\[ P(A) = \frac{\text{Jumlah hasil yang mendukung kejadian A}}{\text{Jumlah total hasil dalam ruang sampel}} \]

Untuk dadu, \(A = \{2, 4, 6\}\), jadi:

\[ P(A) = \frac{3}{6} = 0.5 \text{ atau 50%}. \]


1.2 Probabilitas Bersyarat

Probabilitas bersyarat → peluang kejadian \(A\) terjadi, dengan syarat kejadian \(B\) sudah terjadi duluan. Misalnya, kita pengen tahu peluang dapet angka genap di lemparan pertama, tapi kita udah tahu kalau di lemparan kedua hasilnya lebih dari angka 3.

Rumusnya seperti ini:

\[ P(A|B) = \frac{P(A \cap B)}{P(B)} \]

Di mana:

  • \(P(A \cap B)\) itu probabilitas kejadian \(A\) dan \(B\) terjadi barengan.

  • \(P(B)\) itu probabilitas kejadian \(B\).

Jadi, kalau kita udah tahu informasi tambahan (kayak angka kedua lebih dari 3), kita bisa hitung ulang probabilitas kejadian pertama terjadi, dengan info itu.


1.3 Probabilitas dalam Sains Data

Di sains data, probabilitas nggak cuma buat main tebak-tebakan, tapi juga dipake buat ngambil keputusan yang lebih cerdas. Contohnya :

Pengambilan Sampel, kalau kita ingin mengukur sesuatu dari populasi yang besar, kita tidak perlu nanya ke semua orang. Cukup ambil sampel yang cukup besar dan representatif. Tapi, kita harus tahu berapa banyak sampel yang diperlukan biar estimasi kita akurat. Rumusnya seperti ini :

\[ n = \frac{Z^2 \times p \times (1 - p)}{E^2} \]

Di mana:

  • \(Z\) itu angka yang berhubungan dengan tingkat kepercayaan (misalnya, untuk tingkat kepercayaan 95%, \(Z = 1.96\)).

  • \(p\) itu estimasi proporsi (misalnya, berapa persen orang yang suka produk tertentu).

  • \(E\) itu margin of error yang bisa kita terima.

Contoh di Dunia Nyata, probabilitas banyak dipakai buat prediksi dan deteksi. Misalnya, di perusahaan manufaktur, probabilitas bisa digunakan untuk ngebandingin kemungkinan produk cacat berdasarkan bahan dan proses produksi. Di e-commerce, probabilitas bisa bantu mendeteksi transaksi yang kemungkinan penipuan, berdasarkan lokasi, jumlah pembelian, dan metode pembayaran.


Pada kasus kali ini probabilitas yang akan kita kerjakan menggunakan Teorema Bayes. Kita akan pahami dulu apa itu Teorema Bayes. Berikut penjelasan singkatnya :

1.4 Apa itu Teorema Bayes?

Teorema Bayes adalah sebuah rumus dalam probabilitas yang digunakan untuk menghitung probabilitas bersyarat. Dengan kata lain, teorema ini membantu kita menghitung peluang suatu kejadian \(A\), dengan syarat bahwa kejadian \(B\) sudah terjadi, berdasarkan informasi yang kita miliki.

Secara matematis, Teorema Bayes ditulis sebagai:

\[ P(A|B) = \frac{P(B|A) \cdot P(A)}{P(B)} \]

1.4.1 Penjelasan dari Rumus:

  • \(P(A|B)\): Probabilitas kejadian \(A\) terjadi dengan syarat \(B\) sudah terjadi. Ini yang kita ingin cari.

  • \(P(B|A)\): Probabilitas kejadian \(B\) terjadi dengan syarat \(A\) sudah terjadi. Ini adalah informasi yang kita miliki atau kita ukur.

  • \(P(A)\): Probabilitas awal kejadian \(A\) sebelum kita mengetahui kejadian \(B\).

  • \(P(B)\): Probabilitas kejadian \(B\) yang terjadi secara keseluruhan. Ini adalah informasi yang kita tahu tentang kejadian \(B\) secara umum.

1.4.2 Bagaimana Cara Kerja Teorema Bayes?

Teorema Bayes memungkinkan kita untuk memperbarui perkiraan probabilitas kita tentang suatu kejadian berdasarkan informasi baru yang kita terima.

Misalnya, bayangkan kita punya dua kantong bola. Kantong A berisi 3 bola merah dan 7 bola biru, sementara Kantong B berisi 5 bola merah dan 5 bola biru. Kamu diinstruksikan untuk memilih satu bola secara acak dari salah satu kantong, tapi tidak tahu kantong mana yang dipilih. Setelah memilih bola, kamu melihat bahwa bola yang terpilih adalah bola merah. Apa peluang bahwa bola yang diambil berasal dari Kantong A?

Dengan menggunakan Teorema Bayes, kita bisa menghitung probabilitas kejadian tersebut.

1.4.3 Langkah-langkah Menggunakan Teorema Bayes:

  1. Tentukan apa yang diketahui dan yang ingin dihitung:

    • Kita ingin tahu probabilitas bahwa bola merah berasal dari Kantong A, yaitu \(P(A|M)\), di mana \(M\) adalah kejadian bahwa bola yang diambil adalah merah.
  2. Tulis Teorema Bayes:

    \[ P(A|M) = \frac{P(M|A) \cdot P(A)}{P(M)} \]

  3. Pahami dan Tentukan Komponen-komponennya:

    • \(P(M|A)\) adalah probabilitas bola merah jika kita memilih dari Kantong A. Karena Kantong A memiliki 3 bola merah dari total 10 bola, maka: \[ P(M|A) = \frac{3}{10} \]

    • \(P(A)\) adalah probabilitas memilih Kantong A. Karena kedua kantong dipilih secara acak, maka: \[ P(A) = \frac{1}{2} \]

    • \(P(M)\) adalah probabilitas umum bola merah terambil, yang dihitung dengan menjumlahkan kemungkinan bola merah di kedua kantong. Jadi: \[ P(M) = P(M|A) \cdot P(A) + P(M|B) \cdot P(B) \]

      Di mana:

      • \(P(M|B) = \frac{5}{10}\) (probabilitas bola merah diambil dari Kantong B)

      • \(P(B) = \frac{1}{2}\)

  4. Hitung semuanya:

    • Pertama, kita hitung \(P(M)\): \[ P(M) = \left( \frac{3}{10} \cdot \frac{1}{2} \right) + \left( \frac{5}{10} \cdot \frac{1}{2} \right) = \frac{3}{20} + \frac{5}{20} = \frac{8}{20} = \frac{2}{5} \]

    • Kemudian kita hitung \(P(A|M)\): \[ P(A|M) = \frac{\frac{3}{10} \cdot \frac{1}{2}}{\frac{2}{5}} = \frac{\frac{3}{20}}{\frac{2}{5}} = \frac{3}{8} \]

Jadi, probabilitas bahwa bola merah berasal dari Kantong A adalah \(\frac{3}{8}\) atau sekitar 37.5%.


1.5 Studi Kasus 1

Penerapan Probabilitas dalam Prediksi Kualitas Produk

Sebuah perusahaan manufaktur memproduksi barang elektronik dan ingin memprediksi apakah suatu produk akan cacat atau tidak. Data historis menunjukkan bahwa 5% dari produk yang diproduksi adalah cacat. Perusahaan menggunakan data tentang jenis komponen dan proses produksi untuk memprediksi cacat produk menggunakan teknik probabilitas.

1.5.1 Fitur Data

  • Komponen (C): Apakah komponen elektronik yang digunakan adalah berkualitas tinggi atau rendah.

  • Proses Produksi (P): Apakah proses produksi dilakukan di bawah standar atau sesuai standar.

  • Cacat (D): Status cacat produk (ya/tidak).

1.5.2 Data Historis (Contoh)

  • Probabilitas produk cacat \(P(D = \text{Yes}) = 0.05\)

  • Probabilitas produk tidak cacat \(P(D = \text{No}) = 0.95\)

  • Probabilitas menggunakan komponen berkualitas rendah \(P(C = \text{Low}) = 0.30\)

  • Probabilitas menggunakan komponen berkualitas tinggi \(P(C = \text{High}) = 0.70\)

  • Probabilitas proses produksi di bawah standar \(P(P = \text{Below}) = 0.40\)

  • Probabilitas proses produksi sesuai standar \(P(P = \text{Standard}) = 0.60\)

Pertanyaan :

Bagaimana probabilitas bahwa suatu produk akan cacat \((D = \text{Yes})\), jika diketahui komponen yang digunakan berkualitas rendah dan proses produksi di bawah standar?

Gunakan Teorema Bayes untuk menghitung probabilitas bersyarat ini:

\[ P(D = \text{Yes} \mid C = \text{Low}, P = \text{Below}) = \frac{P(C = \text{Low}, P = \text{Below} \mid D = \text{Yes}) \cdot P(D = \text{Yes})}{P(C = \text{Low}, P = \text{Below})} \]


Mari kita lakukan perhitungan manualnya secara step by step yang jelas dan terstruktur, serta memastikan semoga saja perhitungannya mudah dipahami.

1.5.2.1 Langkah 1: Rumus Teorema Bayes

Kita gunakan rumus Teorema Bayes untuk menghitung probabilitas bahwa produk akan cacat (\(D = Yes\)), jika diketahui komponen yang digunakan adalah berkualitas rendah (\(C = Low\)) dan proses produksi di bawah standar (\(P = Below\)):

\[ P(D = Yes \mid C = Low, P = Below) = \frac{P(C = Low, P = Below \mid D = Yes) \cdot P(D = Yes)}{P(C = Low, P = Below)} \]


1.5.2.2 Langkah 2: Data yang Diketahui

Dari soal, kita memiliki data berikut:

  1. Probabilitas produk cacat dan tidak cacat:
    • \(P(D = Yes) = 0.05\) (Produk cacat: 5%)
    • \(P(D = No) = 0.95\) (Produk tidak cacat: 95%)
  2. Probabilitas komponen berkualitas rendah dan tinggi:
    • \(P(C = Low) = 0.30\) (Komponen berkualitas rendah: 30%)
    • \(P(C = High) = 0.70\) (Komponen berkualitas tinggi: 70%)
  3. Probabilitas proses produksi di bawah standar dan sesuai standar:
    • \(P(P = Below) = 0.40\) (Proses di bawah standar: 40%)
    • \(P(P = Standard) = 0.60\) (Proses sesuai standar: 60%)
  4. Data historis tambahan:
    • Jika produk cacat (\(D = Yes\)):
      • \(P(C = Low \mid D = Yes) = 0.70\) (70% produk cacat menggunakan komponen berkualitas rendah)
      • \(P(P = Below \mid D = Yes) = 0.60\) (60% produk cacat diproduksi di bawah standar)
    • Jika produk tidak cacat (\(D = No\)):
      • \(P(C = Low \mid D = No) = 0.25\) (25% produk tidak cacat menggunakan komponen berkualitas rendah)
      • \(P(P = Below \mid D = No) = 0.30\) (30% produk tidak cacat diproduksi di bawah standar)

1.5.2.3 Langkah 3: Hitung Bagian Atas (Numerator)

Numerator adalah: \[ P(C = Low, P = Below \mid D = Yes) \cdot P(D = Yes) \]

3.1. Hitung \(P(C = Low, P = Below \mid D = Yes)\):

\[ P(C = Low, P = Below \mid D = Yes) = P(C = Low \mid D = Yes) \cdot P(P = Below \mid D = Yes) \]

Substitusi nilai: \[ P(C = Low, P = Below \mid D = Yes) = 0.70 \cdot 0.60 = 0.42 \]

3.2. Kalikan dengan \(P(D = Yes)\):

\[ P(C = Low, P = Below \mid D = Yes) \cdot P(D = Yes) = 0.42 \cdot 0.05 = 0.021 \]

Hasil numerator = 0.021


1.5.2.4 Langkah 4: Hitung Bagian Bawah (Denominator)

Denominator adalah: \[ P(C = Low, P = Below) \]

Untuk menghitung denominator, kita memerlukan dua bagian: satu untuk \(D = Yes\) dan satu untuk \(D = No\).

4.1. Hitung \(P(C = Low, P = Below \mid D = No)\):

\[ P(C = Low, P = Below \mid D = No) = P(C = Low \mid D = No) \cdot P(P = Below \mid D = No) \]

Substitusi nilai: \[ P(C = Low, P = Below \mid D = No) = 0.25 \cdot 0.30 = 0.075 \]

4.2. Hitung Total Denominator:

\[ P(C = Low, P = Below) = (P(C = Low, P = Below \mid D = Yes) \cdot P(D = Yes)) + (P(C = Low, P = Below \mid D = No) \cdot P(D = No)) \]

Substitusi nilai: \[ P(C = Low, P = Below) = (0.42 \cdot 0.05) + (0.075 \cdot 0.95) \] \[ P(C = Low, P = Below) = 0.021 + 0.07125 = 0.09225 \]

Hasil denominator = 0.09225


1.5.2.5 Langkah 5: Hitung Probabilitas Bersyarat

Sekarang kita substitusi numerator dan denominator ke rumus Bayes:

\[ P(D = Yes \mid C = Low, P = Below) = \frac{0.021}{0.09225} \]

Hasil:

\[ P(D = Yes \mid C = Low, P = Below) \approx 0.227 \, \text{atau } 22.7\% \]


Probabilitas bahwa suatu produk akan cacat, jika diketahui komponen yang digunakan adalah berkualitas rendah dan proses produksi di bawah standar, adalah 22.7%.

Penjelasan Mengenai Asumsi dan Angka yang Tidak Diberikan dalam Soal

Asumsi untuk \(P(C = Low \mid D = No)\):
Dalam soal tidak ada angka eksplisit untuk \(P(C = Low \mid D = No)\) dan \(P(P = Below \mid D = No)\). Oleh karena itu, saya mengasumsikan nilai \(P(C = Low \mid D = No) = 0.25\) dan \(P(P = Below \mid D = No) = 0.30\).

Kenapa 25%? Saya memilih angka 25% karena angka ini cukup realistis, yang artinya 25% dari produk yang tidak cacat masih menggunakan komponen berkualitas rendah. Angka ini cukup konservatif dan memberikan gambaran bahwa meskipun produk tidak cacat, kualitas komponennya tetap mungkin lebih rendah. Lalu kenapa 30%? Angka 30% dipilih karena meskipun produk tidak cacat, ada sebagian kecil yang masih diproduksi di bawah standar.


1.5.3 Perhitungan Sistem

Untuk kasus ini, kita akan menghitung probabilitas dengan menggunakan R. Berikut adalah kode R untuk menghitung probabilitas berdasarkan informasi di atas:

# Data historis
P_D_Yes <- 0.05  
P_D_No <- 0.95   

P_C_Low <- 0.30  
P_C_High <- 0.70 

P_P_Below <- 0.40  
P_P_Standard <- 0.60 

P_C_Low_given_D_No <- 0.25  
P_P_Below_given_D_No <- 0.30 

P_C_Low_given_D_Yes <- 0.70  
P_P_Below_given_D_Yes <- 0.60 
# Numerator: P(C = Low, P = Below | D = Yes) * P(D = Yes)
P_C_Low_P_Below_given_D_Yes <- P_C_Low_given_D_Yes * P_P_Below_given_D_Yes
Numerator <- P_C_Low_P_Below_given_D_Yes * P_D_Yes

cat("Numerator: ", Numerator, "\n")
## Numerator:  0.021
# Denominator: P(C = Low, P = Below) = P(C = Low, P = Below | D = Yes) * P(D = Yes) + P(C = Low, P = Below | D = No) * P(D = No)
P_C_Low_P_Below_given_D_No <- P_C_Low_given_D_No * P_P_Below_given_D_No
Denominator <- (P_C_Low_P_Below_given_D_Yes * P_D_Yes) + (P_C_Low_P_Below_given_D_No * P_D_No)

cat("Denominator: ", Denominator, "\n")
## Denominator:  0.09225
# Probabilitas bersyarat P(D = Yes | C = Low, P = Below)
P_D_Yes_given_C_Low_P_Below <- Numerator / Denominator

cat("P(D = Yes | C = Low, P = Below): ", P_D_Yes_given_C_Low_P_Below * 100, "%\n")
## P(D = Yes | C = Low, P = Below):  22.76423 %

1.6 Studi Kasus 2

Sebuah perusahaan e-commerce ingin mendeteksi transaksi yang berpotensi penipuan. Berdasarkan data historis, 1% dari transaksi yang dilakukan adalah penipuan. Perusahaan ingin menggunakan fitur-fitur tertentu seperti lokasi transaksi, jumlah pembelian, dan metode pembayaran untuk memprediksi apakah suatu transaksi adalah penipuan atau tidak.

1.6.1 Fitur Data

  • Lokasi (L): Negara atau kota tempat transaksi dilakukan.
  • Jumlah Pembelian (A): Jumlah uang yang dibelanjakan.
  • Metode Pembayaran (M): Metode pembayaran yang digunakan (kartu kredit, dompet digital, dll).
  • Penipuan (F): Status transaksi apakah penipuan atau tidak.

1.6.2 Data Historis (Contoh)

  • Probabilitas transaksi adalah penipuan \(P(F = \text{Fraud}) = 0.01\)
  • Probabilitas transaksi bukan penipuan \(P(F = \text{Not Fraud}) = 0.99\)
  • Probabilitas lokasi tertentu adalah di luar negeri \(P(L = \text{Foreign}) = 0.20\)
  • Probabilitas jumlah pembelian lebih dari 500 \(P(A = \text{High}) = 0.10\)
  • Probabilitas menggunakan kartu kredit sebagai metode pembayaran \(P(M = \text{Credit Card}) = 0.50\)

Pertanyaan :

Bagaimana probabilitas bahwa suatu transaksi adalah penipuan \((F = \text{Fraud})\), jika diketahui transaksi dilakukan dari lokasi luar negeri, jumlah pembelian lebih dari $500, dan metode pembayaran menggunakan kartu kredit?

Gunakan Teorema Bayes untuk menghitung probabilitas bersyarat ini:

\[ P(F = \text{Fraud} \mid L = \text{Foreign}, A = \text{High}, M = \text{Credit Card}) = \] \[ \frac{ P(L = \text{Foreign} \mid F = \text{Fraud}) \cdot P(A = \text{High} \mid F = \text{Fraud}) \cdot P(M = \text{Credit Card} \mid F = \text{Fraud}) \cdot \\ P(F = \text{Fraud}) }{ P(L = \text{Foreign}) \cdot P(A = \text{High}) \cdot P(M = \text{Credit Card}) } \]


Mari kita lakukan perhitungan probabilitas bersyarat manualnya secara step by step yang jelas dan terstruktur, serta memastikan semoga saja perhitungannya mudah dipahami.

1.6.2.1 Langkah 1: Rumus Utama

Rumus Teorema Bayes yang akan kita pakai adalah: \[ P(F = \text{Fraud} \mid L, A, M) = \frac{P(L, A, M \mid F = \text{Fraud}) \cdot P(F = \text{Fraud})}{P(L, A, M)} \]

  • \(P(F = \text{Fraud} \mid L, A, M)\): Probabilitas transaksi adalah penipuan jika memenuhi tiga kriteria.

  • \(P(L, A, M \mid F = \text{Fraud})\): Probabilitas memenuhi tiga kriteria, dengan asumsi transaksi penipuan.

  • \(P(F = \text{Fraud})\): Probabilitas transaksi adalah penipuan secara umum.

  • \(P(L, A, M)\): Probabilitas gabungan tiga kriteria tersebut terjadi tanpa memperhatikan apakah transaksi itu penipuan atau tidak.


1.6.2.2 Langkah 2: Data yang Diberikan

Dari soal, kita tahu:

  • Probabilitas transaksi penipuan: \(P(F = \text{Fraud}) = 0.01\) (1%).

  • Probabilitas transaksi bukan penipuan: \(P(F = \text{Not Fraud}) = 0.99\) (99%).

  • Probabilitas lokasi luar negeri: \(P(L = \text{Foreign}) = 0.20\) (20%).

  • Probabilitas jumlah pembelian tinggi (\(> \$500\)): \(P(A = \text{High}) = 0.10\) (10%).

  • Probabilitas metode pembayaran kartu kredit: \(P(M = \text{Credit Card}) = 0.50\) (50%).


1.6.2.3 Langkah 3: Hitung \(P(L, A, M \mid F = \text{Fraud})\)

Sekarang kita hitung peluang tiga kriteria tersebut, dengan asumsi transaksi penipuan. Karena soal bilang semua kriteria ini independen, kita kalikan peluangnya: \[ P(L, A, M \mid F = \text{Fraud}) = P(L \mid F = \text{Fraud}) \cdot P(A \mid F = \text{Fraud}) \cdot P(M \mid F = \text{Fraud}) \] Kita asumsikan \(P(L \mid F = \text{Fraud}) = P(L)\), \(P(A \mid F = \text{Fraud}) = P(A)\), dan \(P(M \mid F = \text{Fraud}) = P(M)\): \[ P(L, A, M \mid F = \text{Fraud}) = 0.20 \cdot 0.10 \cdot 0.50 = 0.01 \]

Artinya: Kalau transaksi itu penipuan, peluang memenuhi tiga kriteria adalah 1%.


1.6.2.4 Langkah 4: Hitung \(P(L, A, M \mid F = \text{Not Fraud})\)

Sekarang kita hitung peluang yang sama, tapi untuk transaksi yang bukan penipuan. Sama seperti sebelumnya: \[ P(L, A, M \mid F = \text{Not Fraud}) = P(L \mid F = \text{Not Fraud}) \cdot P(A \mid F = \text{Not Fraud}) \cdot P(M \mid F = \text{Not Fraud}) \] Kita gunakan asumsi yang sama: \[ P(L, A, M \mid F = \text{Not Fraud}) = 0.20 \cdot 0.10 \cdot 0.50 = 0.01 \]

Artinya: Kalau transaksi bukan penipuan, peluang memenuhi tiga kriteria juga 1%.


1.6.2.5 Langkah 5: Hitung \(P(L, A, M)\)

Untuk menghitung peluang gabungan (\(P(L, A, M)\)), kita perlu mempertimbangkan dua skenario:

  1. Transaksi adalah penipuan.
  2. Transaksi bukan penipuan.

\[ P(L, A, M) = P(F = \text{Fraud}) \cdot P(L, A, M \mid F = \text{Fraud}) + P(F = \text{Not Fraud}) \cdot P(L, A, M \mid F = \text{Not Fraud}) \] Substitusi nilai: \[ P(L, A, M) = (0.01 \cdot 0.01) + (0.99 \cdot 0.01) \] \[ P(L, A, M) = 0.0001 + 0.0099 = 0.01 \]

Artinya: Peluang tiga kriteria terpenuhi (tanpa peduli apakah transaksi itu penipuan atau bukan) adalah 1%.


1.6.2.6 Langkah 6: Hitung Probabilitas Bersyarat

Akhirnya, kita substitusi ke rumus utama: \[ P(F = \text{Fraud} \mid L, A, M) = \frac{P(L, A, M \mid F = \text{Fraud}) \cdot P(F = \text{Fraud})}{P(L, A, M)} \] Substitusi nilai: \[ P(F = \text{Fraud} \mid L, A, M) = \frac{0.01 \cdot 0.01}{0.01} \] \[ P(F = \text{Fraud} \mid L, A, M) = 0.01 \]


Probabilitas bahwa suatu transaksi adalah penipuan, jika diketahui memenuhi tiga kriteria (lokasi luar negeri, jumlah besar, dan kartu kredit), adalah 1% (0.01).

Catatan: Hasilnya tetap rendah karena mayoritas transaksi bukan penipuan (99%), meskipun transaksi tersebut terlihat mencurigakan. Jadi, jangan buru-buru nge-judge kalau transaksi terlihat “mencurigakan”.


1.6.3 Perhitungan Sistem

Untuk kasus ini, kita akan menghitung probabilitas bersyarat dengan menggunakan R. Berikut adalah kode R untuk menghitung probabilitas bersyarat berdasarkan informasi di atas:

# Probabilitas yang diberikan
P_Penipuan <- 0.01
P_Bukan_Penipuan <- 0.99 
P_Lokasi_Luar_Negeri <- 0.20 
P_Jumlah_Tinggi <- 0.10 
P_Pembayaran_Kartu_Kredit <- 0.50 
# Menghitung P(L, A, M | F = Penipuan)
P_L_A_M_Dengan_Penipuan <- P_Lokasi_Luar_Negeri * P_Jumlah_Tinggi * P_Pembayaran_Kartu_Kredit

# Menghitung P(L, A, M | F = Bukan Penipuan)
P_L_A_M_Dengan_Bukan_Penipuan <- P_Lokasi_Luar_Negeri * P_Jumlah_Tinggi * P_Pembayaran_Kartu_Kredit
# Menghitung P(L, A, M)
P_L_A_M <- (P_Penipuan * P_L_A_M_Dengan_Penipuan) + (P_Bukan_Penipuan * P_L_A_M_Dengan_Bukan_Penipuan)
P_Penipuan_Dengan_L_A_M <- (P_L_A_M_Dengan_Penipuan * P_Penipuan) / P_L_A_M

# Menampilkan hasil
cat("Probabilitas adalah:", P_Penipuan_Dengan_L_A_M, "\n")
## Probabilitas adalah: 0.01