Exercise Week 11

Probability Distribution

Foto

Wulan Gustika Antasya Tumanggor

Perguruan Tinggi: Insitut Teknologi Sains Bandung

NIM: 52250010

Prodi: Sains Data

Dosen: Bakti Siregar, M.Sc., CDS

1 Pendahuluan

Probabilitas tidak hanya membantu kita memahami seberapa besar kemungkinan suatu peristiwa terjadi, tetapi juga membentuk dasar dari banyak metode statistik yang digunakan untuk pengambilan keputusan. Ketika suatu proses atau eksperimen menghasilkan berbagai hasil, kita menggunakan variabel acak untuk merepresentasikan hasil tersebut dan distribusi probabilitas untuk menjelaskan bagaimana probabilitas ditetapkan untuk setiap nilai yang mungkin. Memahami bentuk dan sifat distribusi sangat penting karena menentukan bagaimana data berperilaku, bagaimana kita menghitung probabilitas, dan bagaimana kita membuat prediksi. Dari distribusi untuk variabel kontinu hingga perilaku statistik seperti rata-rata sampel, distribusi probabilitas berfungsi sebagai inti dari statistik inferensial.

beberapa konsep utama:

  • Variabel Acak Kontinu untuk variabel kontinyu, yang menggambarkan kemungkinan nilai pada rentang kontinyu
  • Distribusi sampel, yang mewakili distribusi statistik sampel seperti rata-rata sampel atau proporsi sampel
  • Teorema Batas Pusat (CLT), salah satu hasil terpenting dalam statistik, menjelaskan mengapa distribusi rata-rata sampel cenderung normal terlepas dari bentuk dasar populasi.
  • Distribusi proporsi sampel, banyak digunakan dalam analisis survei dan penelitian kuantitatif.

2 Acak Berkelanjutan (Continuous Random)

Dalam statistika, kita telah mempelajari variabel acak diskrit—variabel yang hanya dapat mengambil nilai tertentu dan terpisah. Pada bab ini, kita beralih ke variabel acak kontinu, yaitu variabel yang dapat mengambil rentang nilai yang tidak terbatas banyaknya dalam suatu interval.

Konsep probabilitas untuk variabel kontinu sangat berbeda dari diskrit karena nilai yang mungkin muncul tidak dapat dihitung satu per satu, melainkan membentuk sebuah kontinum.

2.1 Variabel Acak Kontinu (Continuous Random Variable)

Variabel acak kontinu (continuous random variable) adalah variabel acak yang dapat mengambil setiap nilai dalam sebuah interval pada garis bilangan.

Contoh:

  • Tinggi badan
  • Waktu
  • Berat
  • Suhu
  • Kecepatan

Nilai-nilai ini dapat berubah secara halus dan tidak dapat dihitung secara individual.

2.2 Probabilitas Variabel Kontinu Berbeda dari Diskrit

Untuk variabel diskrit, probabilitas dapat diberikan pada nilai tertentu, misalnya: \[P(X=1),P(X=2),P(X=3)\]

Pada variabel kontinu:

\[P(X=c)=0\]

Hal ini karena ada tak hingga banyaknya nilai yang mungkin, sehingga tidak ada probabilitas untuk satu titik. Karena itu, probabilitas pada variabel kontinu harus dihitung melalui rentang nilai (interval).

2.3 Fungsi Kepadatan Probabilitas (Probability Density Function – PDF)

Kurva “density curve” sebagai cara menggambarkan distribusi probabilitas untuk variabel kontinu. Kurva inilah yang secara formal disebut Probability Density Function (PDF). PDF adalah kurva halus yang menggambarkan bagaimana probabilitas tersebar pada seluruh nilai dalam interval. Probabilitas tidak ditentukan oleh tinggi grafik di satu titik, tetapi oleh luas di bawah kurva.

PDF memenuhi syarat-syarat utama:

  • Tidak negatif \[f(x) \geq 0 \quad \forall x\]

  • Total luas di bawah kurva = 1 \[\int_{-\infty}^{\infty} f(x) \, dx = 1\]

  • Probabilitas pada interval Probabilitas X berada pada interval \([a,b]\) diberikan oleh: \[P(a \leq X \leq b) = \int_{a}^{b} f(x) \, dx\]

2.4 Probabilitas pada Variabel Kontinu

Pada variabel kontinu, probabilitas dihitung sebagai luas daerah di bawah kurva PDF pada interval tertentu. Daerah yang lebih luas = probabilitas lebih besar. Karena luas sebuah titik tunggal = 0, maka: \[P(X=c) = 0\]

2.5 Sifat-sifat PDF

1. Kurva PDF tidak pernah berada di bawah sumbu x

\[f(x) \geq 0\]

2. Total area di bawah kurva adalah 1

\[\int_{-\infty}^{\infty} f(x) \, dx = 1\]

Dua sifat ini memastikan bahwa PDF adalah representasi yang valid dari sebuah probabilitas.

2.6 Contoh dan Pembahasan

Misalkan \(X\) adalah variabel acak kontinu yang memiliki fungsi kepadatan probabilitas (PDF):

\[f(x) = \begin{cases} kx, & 0 \leq x \leq 2 \\ 0, & \text{lainnya} \end{cases}\]

  1. Tentukan nilai \(k\).
  2. Hitung probabilitas \(P(1 \leq X \leq 2)\)

Penyelesaian:

1. Menentukan Nilai K

Karena \(f(x)\) adalah PDF, maka total luas kurva = 1:

\[\int_{0}^{2} kx \, dx = 1\]

Hitung:

\[k \int_{0}^{2} x \, dx = 1\] \[k \left[ \frac{x^2}{2} \right]_{0}^{2} = 1\] \[k \left( \frac{4}{2} \right) = 1\] \[k (2) = 1\] \[k = \frac{1}{2}\]

2. Menghitung P(1≤X≤2)

\[P(1 \leq X \leq 2) = \int_{1}^{2} kx \, dx\]

Substitusikan \(k = \frac{1}{2}\):

\[= \int_{1}^{2} \frac{1}{2}x \, dx\] \[= \frac{1}{2} \left[ \frac{x^2}{2} \right]_{1}^{2}\] \[= \frac{1}{2} \left( \frac{4}{2} - \frac{1}{2} \right)\] \[= \frac{1}{2} (2 - 0.5)\] \[= \frac{1}{2} \times 1.5\] \[= 0.75\]

3. Visualisasi

4. Interpretasi

Grafik menunjukkan Distribusi Probabilitas Segitiga dengan fungsi \(\mathbf{f(x) = 0.5x}\) pada interval \(\mathbf{[0, 2]}\).

  • Konstanta

Nilai \(\mathbf{k=0.5}\) menormalisasi fungsi sehingga luas total di bawah kurva adalah 1.

  • Probabilitas

Luas area di bawah kurva antara \(\mathbf{x=1}\) dan \(\mathbf{x=2}\) adalah \(\mathbf{0.75}\).

  • Kesimpulan

Variabel acak \(X\) memiliki 75% peluang untuk jatuh dalam interval \([1, 2]\), menunjukkan kecenderungan yang kuat ke arah nilai batas atas distribusi.

3 Distribusi Sampling (Distribution Sampling)

Dalam statistika inferensial, tujuan utama adalah membuat kesimpulan tentang populasi berdasarkan sampel. Namun, setiap sampel yang diambil dari populasi akan menghasilkan nilai statistik yang berbeda—misalnya, rata-rata sampel satu dengan rata-rata sampel lain tidak selalu sama.

Karena itu, kita perlu memahami bagaimana statistik (terutama rata-rata sampel) berperilaku ketika kita mengambil banyak sampel dari populasi. Inilah yang disebut distribusi sampling (sampling distribution).

Konsep ini merupakan fondasi dari:

  • Confidence interval
  • Hypothesis testing
  • Perhitungan probabilitas rata-rata sampel

Variabilitas antar sampel adalah kunci inferensi statistik.

3.1 Konsep Dasar Distribusi

1. Population Distribution

  • Distribusi seluruh data dalam populasi.
  • Bentuknya bisa normal, miring, tidak beraturan, atau bahkan multimodal.
  • Contoh: tinggi seluruh siswa, nilai seluruh peserta ujian.

2. Sample Distribution

  • Distribusi nilai dalam satu sampel yang diambil dari populasi.
  • Setiap sampel bisa memiliki bentuk distribusi berbeda, terutama jika ukuran sampel kecil.

3. Sampling Distribution

  • Distribusi dari suatu statistik, misalnya rata-rata sampel (x̄), yang dihitung dari banyak sampel acak ukuran sama.

  • Contoh:

    • Ambil 50 sampel, masing-masing \(n = 30\)
    • Hitung rata-rata setiap sampel
    • Kumpulkan semua 50 rata-rata itu → itulah sampling distribution of the sample mean

Sampling distribution bukan distribusi data mentah, tetapi distribusi statistik hasil perhitungan.

3.2 Distribusi Sampling

Distribusi sampling adalah distribusi probabilitas dari suatu statistik (misalnya x̄) yang diperoleh dari jumlah sampel acak yang tak terbatas dari populasi.

Fungsinya dalam statistika:

  • Menjelaskan seberapa jauh nilai statistik dapat berubah antar-sampel
  • Menentukan keakuratan estimasi
  • Menjadi dasar perhitungan probabilitas untuk rata-rata sampel
  • Digunakan dalam inferensi statistik (CI & hypothesis testing)

3.3 Sifat-sifat Sampling Distribution Of The Mean

1. Rata-rata Distribusi Sampling

\[\mu_{\bar{X}} = \mu\]

Artinya:

  • Rata-rata semua rata-rata sampel sama dengan rata-rata populasi
  • Statistik ini tidak bias

2. Standard Error (SE)

Standard Error mengukur seberapa jauh rata-rata sampel cenderung menyimpang dari rata-rata populasi.

Rumus SE :

\[SE = \frac{\sigma}{\sqrt{n}}\]

Interpretasi:

  • Jika ukuran sampel n meningkat → SE mengecil → distribusi menjadi lebih sempit
  • Jika n kecil → SE besar → distribusi lebih menyebar
  • Grafik menunjukkan kurva sampling yang tumpul (n kecil) berubah menjadi tajam & sempit (n besar)

3. Bentuk Distribusi Sampling

  • Jika populasi berdistribusi normal → sampling distribution of the mean pasti normal
  • Jika populasi tidak normal, sampling distribution tetap mendekati normal apabila n cukup besar

3.4 Rumus Rata-rata Sampel

\[Z = \frac{\bar{X} - \mu}{SE}$\]

Atau ditulis lengkap:

\[Z = \frac{\bar{X} - \mu}{\sigma / \sqrt{n}}\]

Makna rumus:

  • Menyatakan seberapa jauh rata-rata sampel (x̄) dari rata-rata populasi (μ)
  • Dalam satuan standard error, bukan satuan data asli
  • Digunakan untuk:
    • Menghitung probabilitas x̄
    • Mengukur seberapa ekstrem nilai rata-rata sampel
    • Menerapkan inferensi berbasis distribusi normal
  • Jika n besar:
    • SE kecil
    • Z semakin sensitif terhadap perbedaan kecil antara x̄ dan μ
    • Sampling distribution menjadi sempit dan “stabil”

3.5 Peran Distribusi Sampling Dalam Inferensi

1. Kita tidak dapat mengukur ketidakpastian

2. Tidak ada confidence interval

3. Tidak dapat menghitung probabilitas suatu statistik

4. Tidak bisa melakukan pengujian hipotesis

Sampling distribution adalah fondasi seluruh prosedur statistik modern.

3.6 Contoh dan Pembahasan

Sebuah populasi mempunyai rata-rata μ = 100 dan standar deviasi populasi σ = 15. Diambil satu sampel acak berukuran n = 25, dan diperoleh rata-rata sampel \(( \bar{X} = 106 )\).

  1. Hitung standard error (SE) untuk rata-rata sampel.
  2. Hitung Z-score untuk \((\bar{X} = 106)\).
  3. Berapa probabilitas mendapatkan rata-rata sampel sebesar 106 atau lebih?

Penyelesaian:

1. Standard Error (SE)

Rumus SE: \[SE = \frac{\sigma}{\sqrt{n}}\]

Hitung:

  • \(σ = 15\)
  • \(n = 25 → √25 = 5\)
  • \(SE = 15 / 5 = 3\)

Jadi, \(SE = 3\).

2. Z-score

Rumus Z: \[Z = \frac{\bar{X} - \mu}{SE}\]

Hitung:

  • \(\bar{X} − μ = 106 − 100 = 6\)
  • \(SE = 3\)
  • \(Z = 6 / 3 = 2\)

Jadi, Z = 2.

3. Probabilitas \((\bar{X} ≥ 106)\)

\[P(\bar{X} \ge 106) = P(Z \ge 2)\]

Nilai tabel Z:

  • \(Φ(2) ≈ 0.97725\)
  • \(P(Z ≥ 2) = 1 − 0.97725 = 0.02275\)
  • Probabilitas = ± 0.0228 (2.28%).

4. Visualisasi

Interpretasi

Peluang mendapatkan rata-rata sampel 106 atau lebih hanyalah sekitar 2.3%, sehingga nilai tersebut cukup ekstrem jika μ = 100 dan n = 25.

4 Teorema Limit Pusat (Central Limit Theorem)

Teorema Batas Pusat (Central Limit Theorem) adalah konsep fundamental dalam statistik yang memprediksi bentuk dari suatu distribusi sampling berdasarkan ukuran sampel (\(n\)).

CLT menyatakan bahwa, jika ukuran sampel (\(n\)) cukup besar, maka Distribusi Sampling dari Rata-Rata Sampel (\(\bar{x}\)) akan berbentuk mendekati Normal, terlepas dari bentuk asli Distribusi Populasi.

4.1 Visualisasi CLT

  • Populasi Awal: Bayangkan sebuah populasi yang memiliki distribusi miring (skewed).
  • Pengambilan Sampel Berulang: Kita mengambil banyak sampel acak sederhana dari populasi ini dan menghitung rata-rata (\(\bar{x}\)) dari setiap sampel.
  • Pembentukan Distribusi Sampling: Ketika semua rata-rata sampel (\(\bar{x}\)) ini dikumpulkan dan diplot, mereka akan cenderung mengumpul di sekitar Rata-Rata Populasi Sebenarnya (\(\mu\)).
  • Hasil: Tumpukan rata-rata sampel ini akan membentuk kurva lonceng (distribusi normal), meskipun distribusi populasi awalnya miring.

4.2 Aturan Penerapan CLT

Agar hasil Distribusi Sampling dapat diasumsikan Normal, ukuran sampel (\(n\)) harus memenuhi persyaratan tertentu:

1. Aturan Umum (Rule of Thumb)

Aturan praktis umum menyatakan bahwa aman untuk menerapkan Teorema Batas Pusat ketika ukuran sampel (\(n\)) lebih besar dari atau sama dengan 30.

\[\mathbf{n \geq 30}\] Jika \(n \geq 30\), Distribusi Sampling Rata-Rata Sampel akan secara otomatis mendekati normal, apa pun bentuk populasi aslinya.

2. Pengecualian dan Kasus Khusus

Ada satu pengecualian penting dari aturan \(n \geq 30\):

  • Populasi Awal Sudah Normal: Jika distribusi populasi yang dijadikan sampel sudah normal sejak awal, maka Distribusi Sampling juga akan menjadi normal, bahkan dengan ukuran sampel yang kecil (\(n < 30\)).

Namun, perlu dicatat bahwa meskipun secara teoritis Distribusi Sampling menjadi normal dengan \(n < 30\) dalam kasus ini, sampel kecil tetap menghasilkan estimasi yang kurang akurat atau tidak presisi mengenai parameter populasi.

4.3 Kegunaan CLT

Teorema Batas Pusat sangat penting karena:

1. Memungkinkan Analisis Data Besar

Dengan mengetahui bahwa Distribusi Sampling akan normal (ketika \(n\) besar), kita dapat menggunakan rumus-rumus dan alat statistik yang berhubungan dengan distribusi normal (seperti Z-score) untuk menafsirkan dan menganalisis set data yang besar.

2. Kemudahan Prediksi Bentuk

Teorema ini memungkinkan kita memprediksi bentuk distribusi statistik sampel tanpa harus mengetahui secara pasti bentuk distribusi populasi yang kompleks.

4.4 Rumus Z CLT

1. Rumus Z untuk Mean

\[z = \frac{\bar{X} - \mu}{\sigma_{\bar{X}}} = \frac{\bar{X} - \mu}{\sigma / \sqrt{n}}\]

Rumus ini digunakan ketika ingin menghitung peluang rata-rata sampel dengan pendekatan normal.

2. Rumus Z untuk Proportion

\[z = \frac{\hat{p} - p}{\sqrt{\frac{pq}{n}}}\]

Rumus ini dipakai untuk menghitung probabilitas proporsi sampel.

4.5 Contoh dan Pembahasan

Pilih opsi yang akan menghasilkan sampling distribution (distribusi sampling mean) yang kira-kira mendekati normal menurut prinsip Central Limit Theorem. Jawaban: pilih semua opsi di baris yang menurutmu benar.

  1. Populasi berbentuk rectangular (uniform), ukuran sampel = 15.
  2. Populasi berbentuk bimodal, ukuran sampel = 29.
  3. Populasi skewed (miring), ukuran sampel = 40.
  4. Populasi triangular, ukuran sampel = 35.
  5. Populasi normal, ukuran sampel = 20.
  6. Populasi normal, ukuran sampel = 8.
  7. Populasi sangat skewed, ukuran sampel = 30.
  8. Populasi slightly skewed (sedikit miring), ukuran sampel = 18.
  9. Populasi uniform, ukuran sampel = 8.
  10. Populasi bimodal kuat, ukuran sampel = 50.

Penyelesaian:

  • Jika populasi sudah normal, sampling distribution mean normal untuk semua n.

  • Untuk mean, aturan praktis: \(n ≥ 30\) → aman; untuk distribusi ekstrem (sangat skewed, bimodal kuat) mungkin perlu n jauh lebih besar.

  • Untuk bentuk yang lebih ramah (uniform, triangular, sedikit skew) diperlukan ukuran sampel lebih kecil dibanding distribusi yang sangat miring atau bimodal.

Jawaban yang direkomendasikan: 3, 4, 5, 6, 10

5 Proporsi Sampel (Sample Proportion)

Pada data kategorik, salah satu parameter populasi yang penting adalah proporsi \((p)\), yaitu persentase anggota populasi yang memiliki suatu karakteristik tertentu (misalnya: setuju/tidak, sukses/gagal, memilih/ tidak memilih).

Dalam praktik statistik, kita jarang mengetahui nilai p secara langsung. Karena itu kita mengambil sampel dan menghitung proporsi sampel yang disebut \(\hat{p}\).

Namun setiap kali kita mengambil sampel baru, nilai \(\hat{p}\) dapat berubah. Perilaku semua kemungkinan nilai \(\hat{p}\) inilah yang disebut Distribusi Sampling dari Proporsi Sampel.

5.1 Proporsi Sampel \(\hat{p}\)

Bayangkan kita mengambil banyak sampel acak berukuran sama \(n\). Setiap sampel menghasilkan nilai \(\hat{p}\). Kumpulan seluruh \(\hat{p}\) itu membentuk distribusi.

Distribusi inilah yang digunakan untuk:

  • menghitung margin kesalahan,
  • membuat interval kepercayaan,
  • menghitung probabilitas suatu hasil sampel.

Secara teori, \(X\) berasal dari distribusi Binomial dengan parameter \(n\) dan \(p\). Karena \(\hat{p} = \frac{X}{n}\) , maka distribusi \(\hat{p}\) berasal langsung dari Binomial.

5.2 Parameter Distribusi Sampling

1. Rata-rata (Mean)

\[\mu_{\hat{p}} = p\]

Artinya: rata-rata dari banyak proporsi sampel akan tepat berada pada nilai proporsi sebenarnya populasi.

2. Standard Error (SE)

\[\sigma_{\hat{p}} = \sqrt{\frac{p(1-p)}{n}}\]

Interpretasi:

  • Mengukur variabilitas \(\hat{p}\) dari sampel ke sampel.
  • Semakin besar \(n\), semakin kecil SE → estimasi semakin stabil.
  • Variabilitas maksimum terjadi ketika \(p=0.5\).

5.3 Bentuk Distribusi

Walaupun asalnya binomial, untuk ukuran sampel yang besar distribusi \(\hat{p}\) mendekati Normal. Syarat normalitas (rule-of-thumb):

\[np \ge 10 \text{ dan } n(1-p) \ge 10\]

Jika terpenuhi:

\[\hat{p} \sim N\left(p, \sqrt{\frac{p(1-p)}{n}}\right)\]

Jika kedua syarat tersebut terpenuhi, kita bisa menggunakan kurva Normal untuk menghitung probabilitas terkait \(\hat{p}\).

5.4 Z-Score untuk Proporsi Sampel

Jika distribusi \(\hat{p}\) telah memenuhi syarat normalitas, maka kita bisa menghitung Z-score untuk mengukur seberapa jauh \(\hat{p}\) dari p dalam satuan standar deviasi. \[z = \frac{\hat{p} - p}{\sqrt{\frac{p(1-p)}{n}}}\]

Interpretasi:

Z-score menyatakan seberapa banyak standard error jarak antara \(\hat{p}\) dan \(p\). Digunakan untuk menghitung probabilitas dan area kurva normal.

5.5 Contoh dan Pembahasan

Dalam sebuah populasi, proporsi sebenarnya orang yang memakai kacamata adalah

\[p=0.32\]

Sebuah sampel acak berukuran

\[n=80\]

diambil dari populasi tersebut.

Pertanyaan: Hitung probabilitas bahwa sample proportion \(\hat{p}\) akan lebih dari 0.40.

Penyelesaian:

1. Cek Kondisi Normal Approximation

\[np=80(0.32)=25.6≥10\]

\[n(1−p)=80(0.68)=54.4≥10\]

Kondisi terpenuhi → distribusi sampling \(\hat{p}\) boleh dianggap Normal.

2. Hitung Standard Deviation

\[\sigma_{\hat{p}} = \sqrt{\frac{p(1-p)}{n}}\]

\[= \sqrt{\frac{0.32(0.68)}{80}} = \sqrt{0.00272} = 0.0521\]

3. Hitung Z-Score

\[z = \frac{\hat{p} - p}{\sigma_{\hat{p}}}\]

\[z = \frac{0.40 - 0.32}{0.0521} = 1.536\]

4. Cari Peluang Menggunakan Z-Table

\[P(\hat{p} > 0.40) = P(Z > 1.536)\]

Dari Z-table:

\[P(Z > 1.54) \approx 0.0620\]

JAWABAN AKHIR: \[P(Z > 0.40) \approx 0.0620\]

5. Visualisasi

6. Interpretasi

1. Grafik Batang (Distribusi Binomial, \(n=3\))

  • Grafik ini menunjukkan probabilitas mendapatkan kelereng hijau dalam 3 kali percobaan (\(\mathbf{n=3}\)), dengan probabilitas sukses (\(\mathbf{p}\)) sebesar 0.4.

  • Probabilitas mendapatkan \(\mathbf{X=1}\) hijau adalah yang tertinggi yaitu 43.2%.

  • Probabilitas mendapatkan minimal 2 kelereng hijau (\(X \geq 2\)) totalnya adalah 35.2% (penjumlahan 0.288 dan 0.064).

2. Grafik Kurva (Distribusi Sampling Proporsi, \(n=80\))

  • Grafik ini memodelkan distribusi normal proporsi sampel (\(\hat{p}\)) dari populasi dengan proporsi (\(\mathbf{p}\)) 0.32 dan ukuran sampel (\(\mathbf{n}\)) 80.

  • Rata-rata yang diharapkan berada pada \(\mathbf{32\%}\).

  • Peluang untuk mendapatkan proporsi sampel sebesar atau lebih dari 40% (\(\hat{p} \geq 0.40\)) adalah sangat kecil, yaitu hanya 6.25% (\(Z\)-score-nya adalah 1.534).

6 Tinjuan Distribusi Sampel (Review Sampling Distribution)

6.1 Konsep Dasar Probabilitas dan Ruang Sampel

Konsep ini digunakan untuk menghitung probabilitas ketika jumlah percobaan (\(N\)) kecil.

Definisi Probabilitas Dasar

Probabilitas suatu kejadian (sukses) didefinisikan sebagai jumlah hasil yang berhasil dibagi dengan jumlah total hasil yang mungkin.

Contoh Kasus 1:

Sebuah toples berisi 200 kelereng hijau dan 300 kelereng biru (Total = 500). Kelereng diambil 3 kali dengan pengembalian (\(N=3\)). Berapakah probabilitas mendapatkan minimal dua kelereng hijau?

Penyelesaian:

1. Probabilitas Sukses dan Gagal (p dan 1-p)

  • Probabilitas Sukses (\(\mathbf{p}\)), yaitu mendapatkan kelereng hijau: \[p = \frac{\text{Jumlah Hijau}}{\text{Total Kelereng}} = \frac{200}{500} = \mathbf{0,4}\]
  • Probabilitas Gagal (\(\mathbf{1-p}\)), yaitu mendapatkan kelereng biru: \[1-p = \frac{\text{Jumlah Biru}}{\text{Total Kelereng}} = \frac{300}{500} = \mathbf{0,6}\]

2. Identifikasi Ruang Sampel dan Perhitungan Probabilitas

Mendapatkan minimal dua kelereng hijau berarti mendapatkan tepat 2 atau tepat 3 kelereng hijau.

  • Probabilitas Tepat 2 Hijau (\(\mathbf{P(X=2)}\)): Ada tiga kombinasi yang menghasilkan 2 hijau: Hijau-Hijau-Biru (GGB), Hijau-Biru-Hijau (GBG), dan Biru-Hijau-Hijau (BGG).

    • \(P(\text{GGB}) = 0,4 \times 0,4 \times 0,6 = 0,096\)
    • \(P(\text{GBG}) = 0,6 \times 0,4 \times 0,4 = 0,096\)
    • \(P(\text{BGG}) = 0,4 \times 0,6 \times 0,4 = 0,096\)
    • \(P(\text{Tepat 2 Hijau}) = 0,096 + 0,096 + 0,096 = \mathbf{0,288}\)
  • Probabilitas Tepat 3 Hijau (\(\mathbf{P(X=3)}\):

\[P(\text{GGG}) = 0,4 \times 0,4 \times 0,4 = \mathbf{0,064}\]

3. Kesimpulan:

\[P(\text{Minimal 2 Hijau}) = P(\text{X=2}) + P(\text{X=3}) = 0,288 + 0,064 = \mathbf{0,352}\]

4. Visualisasi

5. Intterpretasi

  • Model: Distribusi Binomial dengan \(\mathbf{n=3}\) (percobaan) dan \(\mathbf{p=0.4}\) (peluang hijau).

  • Peluang Tertinggi: Terjadi pada \(\mathbf{X=1}\) hijau, yaitu \(\mathbf{43.2\%}\).

  • Kategori Utama: Probabilitas mendapatkan minimal 2 kelereng hijau (\(X \geq 2\)) adalah \(\mathbf{35.2\%}\) (dijumlahkan dari 0.288 dan 0.064).

6.2 Distribusi Binomial

Ketika jumlah percobaan (\(N\)) meningkat, menggunakan ruang sampel menjadi tidak praktis. Distribusi Binomial digunakan untuk menghitung probabilitas jumlah sukses yang tepat dalam serangkaian percobaan independen.

Rumus Distribusi Binomial

Rumus ini menghitung probabilitas mendapatkan \(k\) sukses dalam \(n\) percobaan:

\[P(X=k) = C(n, k) \cdot p^k \cdot (1-p)^{n-k}\]

Di mana:

  • \(\mathbf{k}\): Jumlah sukses yang tepat.
  • \(\mathbf{n}\): Jumlah total percobaan.
  • \(\mathbf{p}\): Probabilitas sukses.

Contoh Kasus 2:

Kelereng diambil 5 kali dengan pengembalian (\(N=5\)). Berapakah probabilitas mendapatkan minimal dua kelereng hijau?

\[P(\text{Minimal 2 Hijau}) = P(X=2) + P(X=3) + P(X=4) + P(X=5)\]

Probabilitas untuk setiap \(k\) dihitung menggunakan rumus Binomial (di mana \(n=5\) dan \(p=0,4\)):

  • \(P(X=2)\):

\[P(X=2) = C(5, 2) \cdot (0,4)^2 \cdot (0,6)^3 = 10 \cdot 0,16 \cdot 0,216 = 0,3456\]

  • \(P(X=3)\)

\[P(X=3) = 10 \cdot (0,064) \cdot (0,36)\] \[P(X=3) = \mathbf{0,2304}\]

  • \(P(X=4)\)

\[P(X=4) = 5 \cdot (0,0256) \cdot (0,6)\] \[P(X=4) = \mathbf{0,0768}\]

  • \(P(X=5)\)

\[P(X=5) = 1 \cdot (0,01024) \cdot (1)\] \[P(X=5) = \mathbf{0,01024}\]

\[P(\text{Minimal 2 Hijau}) = 0,3456 + 0,2304 + 0,0768 + 0,01024 = \mathbf{0,66304}\] Visualisasi

Interpretasi

  • Model: Distribusi Binomial dengan \(\mathbf{n=5}\) (percobaan) dan \(\mathbf{p=0.4}\) (peluang sukses/hijau).

  • Grafik Batang (Probabilitas): Peluang tertinggi adalah mendapatkan 2 kelereng hijau (\(P(X=2) = 0.3456\)).

  • Grafik CDF (Kumulatif): Probabilitas mendapatkan minimal 2 kelereng hijau (\(P(X \geq 2)\)) adalah 0.66304.

6.3 Distribusi Sampling Proporsi Sampel (Pendekatan Normal)

Ketika jumlah percobaan (\(N\)) menjadi sangat besar (misalnya, \(N=100\)), bahkan perhitungan Binomial yang berulang-ulang pun menjadi tidak praktis. Dalam kasus ini, kita menggunakan Pendekatan Normal berdasarkan Teorema Batas Pusat (CLT).

Kondisi Penerapan Teorema Batas Pusat (CLT)

Agar Pendekatan Normal dapat diterapkan, dua kondisi harus dipenuhi:

  1. \(n \cdot p \geq 10\)
  2. \(n \cdot (1-p) \geq 10\)

Contoh Kasus 3:

Kelereng diambil 100 kali dengan pengembalian (\(N=100\)). Berapakah perkiraan probabilitas mendapatkan minimal 35 kelereng hijau?

1. Verifikasi Kondisi CLT

  • \(N=100\), \(p=0,4\).
  • \(n \cdot p = 100 \cdot 0,4 = 40 \geq 10\) (Memenuhi)
  • \(n \cdot (1-p) = 100 \cdot 0,6 = 60 \geq 10\) (Memenuhi)

Karena kedua syarat terpenuhi, kita dapat menggunakan Pendekatan Normal.

2. Hitung Z-score (Standardisasi Proporsi)

Kita mencari \(P(\text{Proporsi Sampel } \hat{p} \geq 0,35)\). Proporsi sampel (\(\hat{p}\)) adalah \(35/100 = 0,35\).Rumus Standarisasi (Z-score) untuk Proporsi adalah:

\[Z = \frac{\hat{p} - p}{\sqrt{\frac{p(1-p)}{n}}}\]

  • \(\hat{p} = 0,35\)
  • \(p = 0,4\)
  • \(n = 100\)

Masukkan nilai:

\[Z = \frac{0,35 - 0,4}{\sqrt{\frac{0,4(0,6)}{100}}} = \frac{-0,05}{\sqrt{0,0024}} \approx \mathbf{-1,02}\]

3. Hitung Probabilitas Perkiraan:

Z-score -1,02 sesuai dengan area ke kiri sebesar \(\mathbf{0,1539}\) pada kurva normal. Karena pertanyaan meminta probabilitas “minimal” (area ke kanan), kita hitung:

\[P(\hat{p} \geq 0,35) = 1 - P(Z < -1,02)\] \[P(\hat{p} \geq 0,35) = 1 - 0,1539 = \mathbf{0,8461}\]

4. Visualisasi

Interpretasi: Perkiraan probabilitas untuk mendapatkan minimal 35 kelereng hijau adalah 0,8463 atau 84,63%.

7 Referensi

[1] Siregar, B. Introduction to Statistics. Dsciencelabs. https://bookdown.org/dsciencelabs/intro_statistics/07-Probability_Distributions.html

[2] Mansyur, S. (2025). Statistik Dasar. Universitas Press 45. https://press.up45.ac.id/wp-content/uploads/sites/42/2025/03/STATISTIK-DASAR-BOOK-CHAPTER_ok_KIRIM.pdf

[3] Dr. Sudaryono. (2021). Statistika Dasar: Konsep dan Aplikasi dengan R. PT. Global Digital Creations. https://books.google.co.id/books?id=-H4-EAAAQBAJ&printsec=frontcover&source=gbs_ge_summary_r&cad=0#v=onepage&q&f=false