ESSENTIALS of PROBABILITY
Tugas Week 10 - Essentials of Probability
☀️︎ 🌜
<div class="logo-inner">
<img src="C:/Users/Nurul Iffah/Downloads/WhatsApp Image 2025-11-29 at 03.02.33_ec75994f.jpg" alt="Nurul Iffah">
</div>
NURUL IFFAH
1 ESSENTIALS of PROBABILITY
Peluang adalah cara untuk mengukur seberapa besar kemungkinan suatu kejadian terjadi. Dipakai untuk memahami ketidakpastian, membaca pola dalam data, dan membantu pengambilan keputusan.
Bagian ini membahas beberapa konsep utama:
Fundamental Concept of Probability : ruang sampel, kejadian, dan peluang komplemen.
Independent and Dependent Events: apakah terjadinya satu kejadian memengaruhi kejadian lain atau tidak.
The Union of Events: peluang bahwa setidaknya satu dari beberapa kejadian akan terjadi.
Exclusive and Exhaustive Events: bagaimana kejadian-kejadian menyusun seluruh kemungkinan di ruang sampel.
Binominal Experiments and Binominal Distributions: menganalisis percobaan berulang dengan dua hasil (misalnya “sukses–gagal”).
NOTE : maaf Mr. B, ini cukup panjang karena selain untuk tugas rangkuman, ini juga sebagai sarana saya untuk belajar materi ini lagi
1.1 Fundamental Concept of Probability
1.1.1 Apa itu probabilitas?
Secara sederhana, probabilitas adalah ukuran seberapa besar kemungkinan suatu kejadian terjadi.
Kalau suatu kejadian pasti terjadi → peluangnya = 1 (atau 100%).
Kalau suatu kejadian mustahil terjadi → peluangnya = 0.
Kalau “sedang-sedang saja” → peluang di antara 0 dan 1 (misalnya 0,3 atau 30%).
Untuk kasus di mana semua hasil sama-sama mungkin (fair), kita bisa pakai rumus
\[ P(E) = \frac{\text{banyaknya hasil yang menguntungkan}}{\text{banyaknya seluruh hasil yang mungkin}} \]
Contoh 1 – Lempar dadu 1 kali
Ruang sampel: {1, 2, 3, 4, 5, 6} → 6 kemungkinan
Peluang keluar angka 4: \[ P(4) = \frac{1}{6} \]
1.1.2 Sample Space
Ruang sampel = daftar semua hasil yang mungkin dari sebuah percobaan acak.
Dadu 1 kali: \(S = \{1,2,3,4,5,6\}\)
Koin 1 kali: \(S = \{\text{Heads}, \text{Tails}\}\)
Dadu 2 kali: 36 pasangan hasil, misalnya \((1,1), (1,2), \ldots, (6,6)\).
Kalau ruang sampel jelas, lebih mudah menghitung peluang karena kita tahu:
“Berapa banyak kasus yang kita mau” dibanding “berapa banyak kasus total”.
1.1.3 Aturan Dasar Probabilitas
Ada dua hal penting:
- Rentang nilai probabilitas \[ 0 \leq P(E) \leq 1 \]
0 → tidak mungkin
1 → pasti
0,5 → 50:50
- Total probabilitas di ruang sampel = 1 Kalau kita jumlahkan peluang semua hasil yang mungkin, hasilnya harus 1.
Contoh dadu 1 kali: \[ P(1) + P(2) + P(3) + P(4) + P(5) + P(6) = 1 \]
1.1.4 Complement Rule
Kalau \(A\) adalah suatu kejadian, maka komplemennya \(A'\) berarti “kejadian bukan \(A\)”.
Rumusnya: \[ P(A') = 1 - P(A) \]
Ini sangat berguna untuk soal-soal seperti:
“Berapa peluang minimal satu …?”
Biasanya:
- “Minimal satu dua di dua dadu” → lebih mudah hitung tidak ada dua sama sekali, lalu 1 dikurangi hasil itu.
1.1.5 INSIGHT
Sebagai manusia, konsep peluang membantu kita sadar bahwa banyak hal di hidup itu soal kemungkinan, bukan kepastian — jadi kita nggak gampang baper hanya karena sekali dua kali kejadian jelek muncul. Bagi data scientist, probabilitas adalah bahasa utama untuk bicara tentang ketidakpastian: semua model, prediksi, dan keputusan berbasis data pada dasarnya mengubah “feeling” menjadi angka \(P(\text{kejadian})\) yang lebih objektif.
1.2 Independent and Dependent
1.2.1 Independent
Dua kejadian A dan B disebut independen kalau terjadinya A tidak mengubah peluang B.
Rumus: \[ P(A \cap B) = P(A) \cdot P(B) \]
Contoh:
Lempar dadu dan lempar koin:
Hasil dadu (misalnya keluar 6) tidak ada hubungannya dengan hasil koin (Heads/Tails).
Jadi peluang “dadu = 6 dan koin = Heads”: \[ P(6 \text{ dan Heads}) = P(6) \cdot P(\text{Heads}) = \frac{1}{6} \cdot \frac{1}{2} = \frac{1}{12} \]
1.2.2 Dependent
Dua kejadian A dan B disebut dependen kalau terjadinya A mengubah peluang B.
Rumus: \[ P(A \cap B) = P(A) \cdot P(B \mid A) \]
\(P(B \mid A)\) = peluang B dengan syarat A sudah terjadi.
Contoh: Ambil kartu tanpa pengembalian
Dari 52 kartu, ambil 1 kartu, lalu ambil lagi 1 kartu tanpa mengembalikan.
Peluang kartu kedua bergantung pada kartu pertama (jumlah dan susunan berubah).
Jadi kejadian “kartu pertama As sekop dan kartu kedua As hati” → dependen.
Intinya:
Independen: percobaan yang benar-benar terpisah, seperti “lempar koin, lempar dadu”.
Dependen: biasanya situasi tanpa pengembalian atau ada hubungan sebab-akibat antar kejadian.
1.2.3 INSIGHT
Dalam hidup sehari-hari, membedakan kejadian yang benar-benar terkait dan yang cuma kebetulan itu penting supaya kita nggak gampang percaya “mitos” atau korelasi palsu. Di sisi data science, ini sama dengan membedakan mana variabel yang memang saling memengaruhi (dependent) dan mana yang tidak (independent), karena hal ini akan memengaruhi cara kita membangun model, menafsirkan korelasi, dan menghitung peluang gabungan seperti \(P(A \cap B)\).
1.3 Union of Events (A atau B)
1.3.1 Apa itu Union?
Union 𝐴 ∪ 𝐵 A∪B berarti:
“A atau B” → A terjadi, atau B terjadi, atau keduanya terjadi.
Rumus umum: \[ P(A \cup B) = P(A) + P(B) - P(A \cap B) \]
Kenapa dikurang \(P(A \cap B)\)?
Karena ketika menambahkan \(P(A) + P(B)\), bagian yang overlap (irisan) terhitung dua kali, jadi harus dikurangi sekali.
1.3.2 Kasus Khusus: Mutualy Exclucive
Kalau \(A\) dan \(B\) mutually exclusive (saling lepas), artinya:
- Tidak bisa terjadi bersamaan \(\rightarrow P(A \cap B) = 0\).
Rumus menyederhana: \[ P(A \cup B) = P(A) + P(B) \]
Contoh:
A = “keluar angka 1”
B = “keluar angka 2”
pada satu dadu. Tidak mungkin satu lemparan menghasilkan 1 dan 2 sekaligus.
1.3.3 Gambaran Venn Diagram (secara konsep)
Bayangkan:
Satu kotak besar = ruang sampel.
Lingkaran A dan lingkaran B di dalam kotak.
Area yang tumpang-tindih = \(A \cap B\).
Seluruh area yang tercakup A atau B = \(A \cup B\).
Rumus union adalah cara formal untuk menghitung luas “wilayah A atau B” tanpa menghitung ganda bagian tumpang-tindih.
1.3.4 INSIGHT
Bagi kita, kata “atau” dalam kehidupan sehari-hari sering rancu: kadang maksudnya salah satu, kadang boleh dua-duanya, dan ini bisa bikin salah paham dalam aturan, kontrak, atau janji. Bagi data scientist, konsep union \(P(A \cup B)\) mengingatkan bahwa satu orang atau satu kasus bisa masuk beberapa kategori sekaligus, sehingga kita harus hati-hati agar tidak ketika menghitung jumlah user, risiko, atau probabilitas gabungan.
1.4 Mutually Exclusive & Exhaustive Events
1.4.1 Mutually Excluive (Saling Lepas)
Kejadian A dan B disebut mutually exclusive kalau mereka tidak punya outcome yang sama dan tidak bisa terjadi bersamaan.
Secara himpunan: \[ A \cap B = \varnothing \]
Secara peluang: \[ P(A \cap B) = 0 \]
Contoh:
Satu lemparan dadu:
A = “keluar 1”
B = “keluar 2”
A dan B saling lepas.
1.4.2 Exhaustive (Menyeluruh / Collectively Exhaustive)
Sekumpulan kejadian disebut exhaustive kalau bersama-sama mereka mencakup semua kemungkinan hasil.
Artinya: \[ E_1 \cup E_2 \cup \cdots \cup E_n = S \]
dan \[ P(E_1 \cup \cdots \cup E_n) = 1 \]
Contoh sederhana:
Cuaca hari ini:
E1 = “Hujan”
E2 = “Tidak hujan”
Kalau kita definisikan cuma dua kategori ini, maka E1 dan E2 bersifat exhaustive (menyeluruh): semua kemungkinan masuk salah satunya.
1.4.3 Partisi Ruang Sample
Kalau sekumpulan kejadian:
Saling lepas (mutually exclusive), dan
Menyeluruh (exhaustive),
maka mereka membentuk partisi ruang sampel.
Ini penting untuk:
Law of Total Probability
Teorema Bayes
Contoh klasik (dua dadu):
A = “jumlah genap”
B = “jumlah ganjil”
Maka:
Tidak mungkin satu hasil punya jumlah yang sekaligus genap dan ganjil → mutually exclusive.
Semua kemungkinan jumlah pasti termasuk “genap” atau “ganjil” → exhaustive.
Jadi \(\{A, B\}\) adalah partisi ruang sampel.
1.4.4 INSIGHT
Sebagai manusia, memahami ide “saling lepas” dan “menyeluruh” menolong kita memetakan pilihan: mana yang benar-benar tidak bisa terjadi bersamaan, dan apakah semua kemungkinan sudah tercakup atau belum. Bagi data scientist, ini identik dengan menyusun kategori dan kelas: kelas yang mutually exclusive menghindari data ganda, sedangkan kelas yang exhaustive memastikan tidak ada data yang “jatuh di luar sistem” ketika kita membuat model klasifikasi atau laporan.
1.5 Peluang Binomial
1.5.1 Kapan Suatu masalah Binomial?
Suatu percobaan termasuk binomial kalau memenuhi 4 syarat:
n tetap Jumlah percobaan/trial sudah ditentukan (misal 5 kali, 10 kali).
Dua hasil mungkin Di tiap percobaan hanya dua kategori:
sukses (success)
gagal (failure)
- Peluang sukses tetap, p Nilai 𝑝 p (peluang sukses) sama di setiap trial.
4. Percobaan saling bebas Hasil satu percobaan tidak memengaruhi percobaan lain (sering dipenuhi dengan cara “dengan pengembalian”).
Contoh yang binomial:
Lempar koin 10 kali, hitung berapa kali muncul Heads.
Ambil kelereng dari kotak dengan pengembalian, fokus pada “hijau/tidak hijau”.
Survey 20 orang: sukses = “setuju”, gagal = “tidak setuju”.
1.5.2 Rumus Peluang Binomial
Kalau 𝑋 X = banyaknya sukses dari 𝑛 n percobaan binomial, maka: \[ P(X = k) = \binom{n}{k}\, p^{k} (1 - p)^{n-k} \]
Dengan:
- \(n\): jumlah trial
- \(k\): banyak sukses yang
diinginkan
- \(p\): peluang sukses
- \(1 - p\): peluang gagal
\[ \binom{n}{k} = \frac{n!}{k!(n-k)!} \]
banyaknya cara memilih \(k\) sukses dari \(n\) trial.
1.5.3 Intuisi Kombinasi (kn)
Misal: 3 lemparan koin, berapa cara muncul tepat 1 Heads?
Susunan yang mungkin: H-T-T, T-H-T, T-T-H → 3 cara.
Ini sama dengan: \[ \binom{3}{1} = 3 \]
Secara umum, banyaknya cara memilih 𝑘 k sukses dari 𝑛 n percobaan: \[ \binom{n}{k} = \frac{n!}{k!(n-k)!} \]
1.5.4 Contoh Binomial
Kotak: 10 kelereng (2 hijau, 8 bukan hijau).
Ambil 5 kali dengan pengembalian.
Sukses = “hijau”.
Maka: \[ n = 5, \quad p = 0.2 \]
Peluang tepat 2 hijau: \[ P(X = 2) = \binom{5}{2} (0.2)^2 (0.8)^3 = 10 \times 0.04 \times 0.512 = 0.2048 \]
Artinya: peluang sekitar 20,48%
1.5.5 Parameter Distribusi Binomial
Rata-rata (mean) \[ \mu = n p \]
Varians \[ \sigma^2 = n p (1 - p) \]
Simpangan baku (standard deviation) \[ \sigma = \sqrt{n p (1 - p)} \]
1.5.6 INSIGHT
Dalam keseharian, banyak situasi bisa dilihat sebagai serangkaian “sukses/gagal”: lamaran kerja, klik iklan, respon chat, dan sebagainya; sudut pandang binomial membantu kita menilai apakah hasil yang kita alami itu wajar atau benar-benar luar biasa. Bagi data scientist, model binomial adalah alat kerja utama untuk memodelkan rate (seperti CTR, conversion rate, error rate), menghitung peluang jumlah sukses tertentu, dan menjadi dasar banyak uji statistik serta evaluasi eksperimen (misalnya A/B testing).
1.6 Visualisasi Distribusi Binomial & Aproksimasi Normal
1.6.1 Bentuk Distribusi Binomial
Kalau kita gambar \(P(X = k)\) untuk \(k = 0,1,\ldots,n\) dalam bentuk diagram batang,.
Itulah grafik distribusi binomial
Pengaruh p (peluang sukses): Pengaruh \(p\) (peluang sukses):
Jika \(p = 0.5\): bentuk simetris (tengahnya di \(k \approx \frac{n}{2}\)).
Jika \(p < 0.5\): banyak massa di dekat 0 \(\rightarrow\) miring ke kanan (right skewed).
Jika \(p > 0.5\): banyak massa di dekat \(n\) \(\rightarrow\) miring ke kiri (left skewed).
1.6.2 Pengaruh n Terhadap Jumlah Percobaan
Kalau \(n\) kecil (misal 2, 3, 4), distribusi hanya beberapa batang dan kelihatan “kasar”.
Kalau \(n\) makin besar:
- Untuk \(p\) yang tidak terlalu ekstrem (misalnya antara \(0.3\) dan \(0.7\)), bentuk distribusi mulai mirip kurva normal (lonceng).
- Rata-rata di \(np\), sebaran diatur oleh \(np(1-p)\).
Sering di buku ditunjukkan dengan: - Histogram binomial, lalu
- Di atasnya digambar garis kurva normal yang hampir menutupi puncak-puncak batang.
1.6.3 Kapan Bole Memakai Normal Approximation?
Distribusi binomial bisa didekati dengan distribusi normal jika: \[ np \ge 10 \text{ dan } n(1 - p) \ge 10 \]
(Beberapa sumber pakai batas 5, tapi 10 lebih “aman”.)
Alasan singkat: 1. Kalau \(np\) terlalu kecil \(\rightarrow\) “massa” terlalu dekat ke 0 \(\rightarrow\) bentuknya tidak mirip normal.
- Kalau \(n(1-p)\) terlalu kecil \(\rightarrow\) “massa” terlalu dekat ke \(n\).
Jadi, keduanya harus cukup besar supaya bentuk distribusi lebih “penuh di tengah” dan bisa didekati dengan normal.
Catatan: - Untuk \(p = 0.5\) (simetris), kita tidak butuh \(n\) sebesar kalau \(p\) ekstrem.
- Untuk \(p = 0.1\) atau \(p = 0.9\), perlu \(n\) yang jauh lebih besar agar bentuknya mendekati normal.
1.6.4 INSIGHT
Sebagai manusia, grafik distribusi binomial membuat konsep peluang yang abstrak jadi lebih “terlihat”: kita bisa langsung menangkap bahwa sebagian besar kejadian menumpuk di tengah dan nilai ekstrem memang jarang. Bagi data scientist, visualisasi bentuk distribusi penting untuk memeriksa apakah asumsi model (misalnya mendekati normal untuk \(np\) besar) layak dipakai, sehingga kita tidak hanya mengandalkan rumus, tetapi juga intuisi visual terhadap sebaran data dan peluang.
2 CLOSING
Ringkasan ini menggabungkan:
Konsep dasar probabilitas (ruang sampel, peluang, komplemen),
Kejadian independen vs dependen,
Union of events,
Kejadian saling lepas & menyeluruh,
Distribusi binomial dan parameternya,
Serta bagaimana distribusi binomial divisualisasikan dan diaproksimasi dengan distribusi normal.
3 REFERENCE
Siregar, B. (t.t.). Introduction to Statistics: A Data Science Perspective with R, Bab 6 “Essentials of Probability”.
Diakses dari: https://bookdown.org/dsciencelabs/intro_statistics/06-Essentials_of_Probability.htmlOpenStax. (2023). Introductory Statistics (2nd ed.). OpenStax.
Diez, D., Barr, C., & Çetinkaya-Rundel, M. (2019). OpenIntro Statistics (4th ed.). OpenIntro.
Hogg, R. V., Tanis, E. A., & Zimmerman, D. L. (2019). Probability and Statistical Inference (10th ed.). Pearson.
Shafer, D., & Zhang, J. (t.t.). Introductory Statistics. LibreTexts.
Khan Academy. (t.t.). Statistics and Probability. Diakses dari: https://www.khanacademy.org/math/statistics-probability
3.1 Referensi Video (YouTube)
Simple Learning Pro. (t.t.). Seri video Essentials of Probability (6.1–6.6) [Video]. YouTube.
Probability, Sample Spaces, and the Complement Rule (6.1): https://www.youtube.com/watch?v=ynjHKBCiGXY
Probability of Independent and Dependent Events (6.2): https://www.youtube.com/watch?v=LS-_ihDKr2M
The Probability of the Union of Events (6.3): https://www.youtube.com/watch?v=vqKAbhCqSTc
Mutually Exclusive and Exhaustive Events (6.4): https://www.youtube.com/watch?v=f7agTv9nA5k
The Binomial Experiment and the Binomial Formula (6.5): https://www.youtube.com/watch?v=nRuQAtajJYk
Visualizing the Binomial Distribution (6.6): https://www.youtube.com/watch?v=Y2-vSWFmgyI