Essential of Probability

Tugas Week 10

1 Pendahuluan

Bab Esensi Probabilitas ini bertujuan memberikan landasan matematis untuk menganalisis ketidakpastian, dimulai dengan mendefinisikan Konsep Fundamental probabilitas Tujuannya adalah agar pembaca mampu membedakan dan menghitung probabilitas untuk peristiwa Independen dan Dependen, menerapkan Aturan Penjumlahan untuk Union of Events, serta mengklasifikasikan peristiwa sebagai Exclusive and Exhaustive. Selain itu, bab ini secara spesifik bertujuan untuk melatih pembaca mengidentifikasi karakteristik Eksperimen Binomial dan menggunakan Distribusi Binomial untuk menghitung probabilitas dalam skenario percobaan berulang, sehingga membekali mereka dengan alat penting untuk pemodelan statistik.


2 Konsep Dasar Probabilitas

Probabilitas didefinisikan sebagai peluang terjadinya suatu kejadian, dihitung dengan membagi jumlah hasil yang diinginkan dengan jumlah total kemungkinan hasil. Misalnya, peluang mendapatkan kepala saat melempar koin adalah 1/2 atau 0.5. Untuk kejadian berulang atau majemuk, seperti mendapatkan dua kepala dalam dua lemparan, probabilitasnya dikalikan (0.5×0.5=0.25), karena ini adalah kejadian independen.

Konsep kunci lainnya adalah Ruang Sampel, yaitu seluruh himpunan hasil yang mungkin. Untuk dua lemparan koin, ruang sampelnya adalah empat hasil: HH, HT, TH, dan TT, yang masing-masing memiliki probabilitas 0.25. Dengan menjumlahkan probabilitas hasil yang relevan, kita dapat menghitung probabilitas kejadian yang lebih kompleks, seperti mendapatkan setidaknya satu ekor, yang dihitung sebagai P(HT)+P(TH)+P(TT)=0.75. Video ini juga menekankan dua kondisi wajib probabilitas: nilai probabilitas suatu peristiwa harus selalu antara 0 dan 1, dan jumlah total probabilitas semua hasil dalam ruang sampel harus selalu berjumlah 1.

Berdasarkan kondisi-kondisi tersebut, diturunkan Aturan Komplemen. Aturan ini menyatakan bahwa probabilitas suatu peristiwa tidak terjadi (P(Ac)) sama dengan 1 dikurangi probabilitas peristiwa tersebut terjadi (P(A)). Aturan ini menyediakan cara alternatif untuk menyelesaikan masalah. Misalnya, probabilitas tidak mendapatkan dua kepala dapat dihitung dengan Aturan Komplemen: 1−P(HH)=1−0.25=0.75, yang memberikan hasil yang sama dengan menjumlahkan probabilitas hasil lainnya.

2.1 Referensi Tambahan

Konsep probabilitas dasar sering diinterpretasikan dalam dua aliran utama yaitu:

A. Aliran Frekuentis (Frequentist).Penulis Ronald Fisher (buku teks statistik klasik) Probabilitas didefinisikan sebagai limit frekuensi relatif suatu kejadian dalam jangka panjang (long run). Ini adalah interpretasi yang digunakan dalam sebagian besar statistika inferensial (uji hipotesis).

B. Bayesian (Subjektif) Penulis Thomas Bayes (via Pierre-Simon Laplace); Applied Bayesian Modeling. Probabilitas adalah tingkat kepercayaan pribadi (derajat kepercayaan) terhadap suatu proposisi. Probabilitas awal (prior) diperbarui (posterior) ketika ada data baru.


3 Independen dan Dependen

Inti dari video ini adalah tentang peluang atau Probabilitas—seberapa besar kemungkinan sesuatu akan terjadi. Peluang dihitung dengan membagi jumlah hasil yang kita inginkan dengan total semua hasil yang mungkin. Contoh sederhananya, peluang mendapat kepala saat melempar koin adalah 1 dari 2 (0.5). Jika ada beberapa kejadian yang tidak saling mempengaruhi (independen), seperti melempar koin dua kali, kita bisa mengalikan peluangnya: 0.5×0.5=0.25 untuk mendapat dua kepala.

Ruang Sampei yaitu daftar lengkap semua hasil yang mungkin. Ketika melempar dua koin, ada empat hasil yang mungkin: Kepala-Kepala (HH), Kepala-Ekor (HT), Ekor-Kepala (TH), dan Ekor-Ekor (TT), di mana masing-masing punya peluang 0.25. Jika kita ingin tahu peluang hasil yang lebih luas (misalnya, mendapat setidaknya satu ekor), kita cukup menjumlahkan peluang dari hasil-hasil yang relevan (0.25+0.25+0.25=0.75). Dua aturan dasar yang harus selalu dipenuhi adalah: peluang suatu kejadian harus selalu berada di antara 0 (pasti tidak terjadi) dan 1 (pasti terjadi), dan jika kita menjumlahkan peluang semua hasil yang mungkin, totalnya harus 1.

Aturan Komplemen. Aturan ini menyatakan bahwa peluang suatu kejadian tidak terjadi adalah sama dengan 1 dikurangi peluang kejadian itu terjadi. Jadi, daripada menghitung semua kemungkinan hasil yang bukan dua kepala, kita bisa menggunakan 1−P(dua kepala). Karena peluang mendapat dua kepala adalah 0.25, maka peluang tidak mendapat dua kepala adalah 1−0.25=0.75.

3.1 Referensi tambahan

  1. Independent Events (Kejadian Independen Bebas) Independensi adalah asumsi yang sangat kuat dan sering digunakan untuk menyederhanakan fungsi likelihood atau probabilitas bersama (joint probability) dari data yang kompleks.

Definisi Kunci (Conditional Probability): Dua kejadian A dan B independen jika probabilitas terjadinya A tidak dipengaruhi oleh terjadinya B, dan sebaliknya. P(A∣B)=P(A)

Aturan Perkalian untuk Independen: Jika A dan B independen, probabilitas irisan (intersection) mereka adalah hasil kali probabilitas marginal: P(A∩B)=P(A)P(B)

  1. Relevansi Utama dalam ESL: Data & Error: Dalam banyak model, seperti Regresi Linier, sering diasumsikan bahwa observasi data atau error residual adalah independen dan terdistribusi identik (i.i.d.). Asumsi ini penting untuk menyederhanakan dan membenarkan penggunaan fungsi likelihood yang merupakan perkalian probabilitas.

    Model Naive Bayes: Model klasifikasi ini didasarkan pada asumsi kuat (dan terkadang tidak realistis) bahwa semua fitur (variabel prediktor) independen bersyarat (Xj​ independen dari Xk​ bersyarat pada kelas Y).

  2. Dependent Events (Kejadian Dependen/Bergantung)

Kejadian A dan B adalah dependen (atau tidak independen) ketika informasi tentang satu kejadian mengubah probabilitas kejadian yang lain.

Definisi Kunci: Pengetahuan tentang terjadinya B mengubah probabilitas terjadinya A. P(A∣B)=P(A)

Aturan Perkalian Umum (Menggunakan Probabilitas Bersyarat): Untuk kejadian dependen, probabilitas irisan harus menggunakan probabilitas bersyarat: P(A∩B)=P(A∣B)P(B)

  1. Relevansi Utama dalam ESL:Korelasi & Multikolinearitas: Dependensi muncul secara alami sebagai korelasi antar variabel prediktor. Pemodelan yang mengabaikan dependensi ini dapat menyebabkan masalah, seperti multikolinearitas dalam regresi.

Model Interaksi: Dalam model regresi, ketika efek satu fitur bergantung pada fitur lain, kita secara eksplisit memodelkan dependensi (interaction term).

Model Lanjutan: Model yang menangani data berurutan (misalnya, time series) seperti Hidden Markov Models atau Recurrent Neural Networks secara eksplisit dirancang untuk memodelkan dan memanfaatkan dependensi antara observasi yang berdekatan.

  1. Hubungan Kunci : Konsep dependensi adalah fondasi dari Probabilitas Bersyarat (P(A∣B)), yang kemudian menjadi inti dari Teorema Bayes. Teorema Bayes, pada gilirannya, adalah dasar matematis untuk banyak algoritma kunci dalam Statistical Learning, termasuk Maximum A Posteriori (MAP) estimation dan Bayesian Networks.

4 Probabilitas Gabungan Kejadian

Video ini menjelaskan tentang Probabilitas Gabungan Kejadian (dikenal dengan kata kunci “atau”), yaitu peluang terjadinya salah satu dari dua peristiwa atau keduanya. Sebagai dasar, video ini meninjau kembali Ruang Sampel (seluruh hasil yang mungkin, misalnya 36 hasil dari melempar dua dadu) dan Probabilitas Sederhana. Konsep penting yang menjadi jembatan adalah Irisan Kejadian (dikenal dengan kata kunci “dan”), yang merupakan hasil-hasil yang dimiliki bersama atau tumpang tindih antara dua peristiwa.

Untuk menghitung probabilitas gabungan, rumusnya adalah: peluang kejadian A ditambah peluang kejadian B, lalu dikurangi peluang irisan (kejadian A dan B). Bagian pengurangan ini sangat krusial karena ia berfungsi untuk menghilangkan perhitungan ganda (duplikasi) dari hasil-hasil yang tumpang tindih. Tanpa pengurangan ini, kita akan menghitung hasil yang sama sebanyak dua kali. Misalnya, untuk mencari peluang mendapat dua angka genap atau setidaknya satu angka dua, kita menjumlahkan peluang masing-masing, kemudian mengurangi peluang tumpang tindihnya (9/36+11/36−5/36=15/36). Konsep ini dapat divisualisasikan dengan mudah menggunakan Diagram Venn.

4.1 Referensi tambahan

  1. Definisi Penting: Gabungan (union) dari semua kejadian sama dengan Ruang Sampel Ω. A1​∪A2​∪⋯∪An​=Ω Contoh: Dalam pelemparan dadu, kejadian mendapatkan angka ≤3 (A={1,2,3}) dan kejadian mendapatkan angka >3 (B={4,5,6}) adalah komprehensif, karena A∪B={1,2,3,4,5,6}=Ω. Aturan Probabilitas: Probabilitas gabungan dari semua kejadian komprehensif selalu 1: P(A1​∪A2​∪⋯∪An​)=P(Ω)=1

  2. Union of Events (Gabungan Kejadian)

Konsep gabungan kejadian (A∪B) adalah notasi fundamental dalam mendefinisikan ruang probabilitas, meskipun penggunaannya dalam derivasi model ESL biasanya implisit. Definisi: Gabungan dua kejadian A dan B adalah kejadian di mana setidaknya satu dari A atau B terjadi.

Aturan Penjumlahan Umum (General Addition Rule): Probabilitas untuk gabungan dua kejadian dihitung sebagai: P(A∪B)=P(A)+P(B)−P(A∩B)

Aplikasi ESL Implisit: Aturan ini secara mendasar terkait dengan probabilitas kesalahan total atau error rate secara keseluruhan, di mana kesalahan bisa disebabkan oleh kejadian di kategori A atau kategori B.


5 Kejadian saling Lepas dan Kejadian Komprehensif

Video ini membahas dua jenis hubungan antar kejadian dalam probabilitas. Pertama, Kejadian Saling Lepas (Mutually Exclusive) adalah peristiwa yang tidak mungkin terjadi bersamaan (tidak ada irisan, P(A dan B)=0). Untuk kejadian seperti ini, peluang gabungan (A atau B) hanyalah penjumlahan sederhana: P(A atau B)=P(A)+P(B). Kedua, Kejadian Komprehensif (Exhaustive) adalah sekumpulan peristiwa yang bersama-sama mencakup semua hasil yang mungkin dalam ruang sampel, sehingga jika peluang semua kejadian ini dijumlahkan, hasilnya pasti sama dengan 1. P(E1​)+P(E2​)+⋯+P(En​)=1

5.1 Referensi tambahan

Mutually Exclusive Events (Kejadian Saling Lepas) Kejadian A dan B disebut saling lepas jika kedua kejadian tersebut tidak dapat terjadi secara bersamaan dalam satu kali percobaan.

Definisi Penting: Irisan (intersection) dari kedua kejadian tersebut adalah himpunan kosong. A∩B=∅ Contoh: Dalam pelemparan dadu, mendapatkan angka genap (A={2,4,6}) dan mendapatkan angka ganjil (B={1,3,5}) adalah saling lepas karena mustahil mendapatkan keduanya sekaligus.

Aturan Penjumlahan (Addition Rule): Karena A dan B saling lepas, probabilitas gabungan mereka (union) adalah penjumlahan probabilitas masing-masing: P(A∪B)=P(A)+P(B)(Ini adalah kasus khusus dari Aturan Penjumlahan Umum P(A∪B)=P(A)+P(B)−P(A∩B), di mana P(A∩B)=0). Generalisasi: Sebuah koleksi kejadian A1​,A2​,A3​,…,An​ disebut saling lepas berpasangan (pairwise mutually exclusive) jika setiap pasang kejadian di dalamnya adalah saling lepas.

Exhaustive Events (Kejadian Komprehensif/Mencakup)

Sebuah koleksi kejadian A1​,A2​,A3​,…,An​ disebut kejadian komprehensif atau mencakup jika gabungan dari semua kejadian tersebut mencakup seluruh Ruang Sampel (Ω). Dengan kata lain, setidaknya satu dari kejadian tersebut harus terjadi.

Saling Lepas dan Komprehensif Partisi Ruang Sampel: Ketika sebuah koleksi kejadian (misalnya A dan Ac) memenuhi kedua kondisi ini, mereka dikatakan mempartisi Ruang Sampel. 1. A dan Ac (komplemen dari A) selalu saling lepas (A∩Ac=∅).

  1. A dan Ac selalu komprehensif (A∪Ac=Ω).

Hukum Probabilitas Total (Law of Total Probability): Digunakan untuk menghitung probabilitas suatu kejadian dengan membaginya ke dalam kasus-kasus saling lepas dan komprehensif. Teorema Bayes: Rumus fundamental dalam inferensi probabilitas, yang pengaplikasiannya sangat bergantung pada pembagian ruang sampel menjadi kejadian-kejadian yang saling lepas dan komprehensif


6 Eksperimen Binomial dan Rumus Binomial

Video ini menjelaskan tentang Eksperimen Binomial dan Rumus Binomial, yang merupakan cara untuk menghitung probabilitas mendapatkan jumlah keberhasilan (k sukses) tertentu dalam serangkaian percobaan (n) yang diulang. Suatu eksperimen dianggap binomial jika memenuhi empat syarat ketat: jumlah percobaan (n) harus tetap, hanya ada dua hasil yang mungkin (sukses atau gagal), probabilitas sukses (p) harus konstan di setiap percobaan, dan setiap percobaan harus independen satu sama lain. Untuk menghitung peluang mendapatkan tepat k sukses, kita bisa menggunakan Rumus Binomial sebagai jalan pintas untuk menggantikan penghitungan manual semua urutan hasil yang mungkin.

Rumus Binomial untuk probabilitas mendapatkan tepat k sukses adalah: P(X=k)=(kn​)⋅pk⋅(1−p)n−k

Di mana (kn​) adalah kombinasi (n pilih k), yang menghitung jumlah total cara k sukses dapat terjadi dalam n percobaan.

6.1 Referensi tambahan

Ringkasan mengenai Eksperimen Binomial dan Distribusi Binomial berdasarkan buku Introduction to Probability oleh Charles M. Grinstead & J. Laurie Snell.

Eksperimen Binomial (Binomial Experiment) Dalam konteks buku ini, Eksperimen Binomial adalah suatu rangkaian percobaan yang harus memenuhi empat kondisi spesifik:

  1. Jumlah Percobaan Tetap (n): Eksperimen terdiri dari sejumlah percobaan independen yang dilakukan sebanyak n kali yang sudah ditetapkan sebelumnya.

  2. Dua Hasil yang Mungkin (Dichotomy): Setiap percobaan hanya memiliki dua hasil yang mungkin: Sukses (Success, S) atau Gagal (Failure, F).

  3. Probabilitas Sukses Konstan (p): Probabilitas untuk mendapatkan hasil Sukses (p) harus sama untuk setiap percobaan. Dengan demikian, probabilitas Gagal adalah q=1−p.

  4. Independensi: Hasil dari satu percobaan tidak memengaruhi hasil dari percobaan lainnya. Semua percobaan bersifat independen.

Variabel acak yang diminati dalam Eksperimen Binomial adalah jumlah total sukses (X) yang terjadi dalam n percobaan tersebut.


7 Distribusi Binomial

Video ini menginterpretasikan Distribusi Binomial sebagai model probabilitas yang sangat fleksibel, yang bentuknya secara langsung dikendalikan oleh parameter n dan p. Interpretasi n (Evolusi ke Normal): Interpretasi kunci dari peningkatan n adalah bahwa dengan semakin banyaknya percobaan, variasi dalam hasil menjadi lebih halus dan terdistribusi merata, yang secara matematis mengarah pada Distribusi Normal. Ini sangat penting karena dalam statistik, begitu sebuah distribusi dapat diasumsikan normal, kita dapat menggunakan berbagai teknik statistik yang lebih sederhana dan kuat (seperti Z-score) untuk perhitungan probabilitas.

Interpretasi p (Penceng): Nilai p tidak hanya menentukan peluang sukses, tetapi juga arah “kemiringan” hasil. Ketika p=0.5, keberhasilan dan kegagalan sama-sama mungkin, sehingga distribusi menjadi seimbang (simetris) di sekitar nilai rata-rata (μ). Ketika p jauh dari 0.5, distribusi menjadi menceng karena hasil yang paling mungkin adalah yang sangat ekstrem (sangat sedikit sukses jika p kecil, atau sangat banyak sukses jika p besar). Data selalu mengelompok di sekitar Rata-rata (μ=np) yang merupakan hasil yang paling diharapkan dalam percobaan. Interpretasi Rumus Parameter: Rumus μ=n×p memberikan nilai yang diharapkan (expected value) dari jumlah keberhasilan. Misalnya, jika Anda melempar koin 10 kali (n=10) dan probabilitas mendapatkan sisi gambar adalah 0.5 (p=0.5), rata-rata (ekspektasi) sukses adalah 10×0.5=5 kali. Rumus Varians dan Standar Deviasi mengukur seberapa jauh hasil yang diamati kemungkinan akan menyimpang dari nilai rata-rata yang diharapkan tersebut.

7.1 Referensi tambahan

Fungsi Massa Probabilitas (Probability Mass Function, PMF)

Probabilitas untuk mendapatkan tepat k kali sukses dalam n percobaan diberikan oleh fungsi massa probabilitas (PMF) Binomial: b(n,p,k)=P(X=k)=(kn​)pk(1−p)n−k Di mana:

1, P(X=k): Probabilitas mendapatkan tepat k sukses.

  1. (kn​)=k!(n−k)!n!​: Koefisien Binomial, yang menghitung jumlah cara berbeda untuk mendapatkan k sukses dalam n percobaan.

  2. pk: Probabilitas mendapatkan k sukses.

4’ (1−p)n−k: Probabilitas mendapatkan n−k gagal.

  1. Parameter Distribusi

Sebuah Distribusi Binomial sepenuhnya ditentukan oleh dua parameter, n (jumlah percobaan) dan p (probabilitas sukses). Distribusi ini sering dinotasikan sebagai B(n,p).

Nilai Harapan (Expected Value) atau Rata-rata (μ): E(X)=μ=np Interpretasi: Jika eksperimen diulang berkali-kali, rata-rata jumlah sukses yang diamati akan mendekati n×p.

  1. Varians (σ2): σ2=np(1−p)

Interpretasi: Varians mengukur seberapa tersebar (bervariasi) jumlah sukses yang mungkin terjadi di sekitar rata-rata.


8 Referensi

https://bookdown.org/dsciencelabs/intro_statistics/06-Essentials_of_Probability.html#Exclusive

Grinstead, C. M., & Snell, J. L. (2009). Introduction to Probability. American Mathematical Society (AMS).

Hastie, T., Tibshirani, R., & Friedman, J. (2009). The elements of statistical learning: Data mining, inference, and prediction (2nd ed.). Springer.

