Dalam teori dan statistik probabilitas , distribusi probabilitas
menggambarkan perilaku acak suatu fenomena yang bergantung pada peluang
. Studi tentang fenomena acak dimulai dengan studi tentang permainan
peluang – permainan dadu , undian bola guci, dan gambar atau ekor
merupakan motivasi untuk memahami dan memprediksi eksperimen acak.
Pendekatan awal ini merupakan fenomena diskrit, yang berarti jumlah
kemungkinan hasil terbatas atau terhitung. Namun, beberapa isu
menunjukkan distribusi probabilitas dengan dukungan tak terhingga yang
tak terhitung . Misalnya, ketika lemparan koin cenderung tak terhingga,
jumlah gambar mendekati distribusi normal .
Fluktuasi dan variabilitas hadir di hampir setiap nilai terukur
selama pengamatan suatu fenomena, terlepas dari sifatnya; lebih lanjut,
hampir semua pengukuran memiliki komponen kesalahan intrinsik.
Distribusi probabilitas dapat memodelkan ketidakpastian dan
menggambarkan fenomena fisika, biologi, ekonomi, dan lainnya. Bidang
statistika memungkinkan penemuan distribusi probabilitas yang
disesuaikan dengan fenomena acak. Terdapat banyak distribusi
probabilitas yang berbeda. Di antara distribusi probabilitas tersebut,
distribusi normal memiliki peran yang sangat penting. Menurut teorema
limit pusat, , distribusi normal membahas perilaku asimtotik dari
berbagai distribusi probabilitas.
Terdapat dua jenis distribusi probabilitas:
Distribusi Kontinu: Ketika variabel yang diukur dinyatakan dalam
skala kontinu, seperti pada karakteristik dimensional.
Distribusi Diskrit: Ketika variabel yang diukur hanya dapat
memiliki nilai tertentu, seperti bilangan bulat: 0, 1, 2, dst.
2 . Probability of
Continuous Variables
Video ini memulai dengan meninjau variabel diskrit, yang
didefinisikan sebagai variabel yang hanya dapat mengambil sejumlah nilai
yang dapat dihitung (\(countable\))
atau terbatas. Sebaliknya, variabel kontinu adalah variabel yang dapat
mengambil nilai numerik apa pun dalam rentang tertentu, membuatnya tidak
terbatas (infinite) dan tidak dapat dihitung (\(uncountable\)). Perbedaan fundamental dalam
perolehan data: diskrit melalui menghitung, sedangkan kontinu melalui
mengukur. Perbedaan ini juga terlihat dalam representasi visual dan
perhitungan probabilitasnya. Variabel diskrit diwakili oleh diagram
batang dengan celah, sedangkan variabel kontinu diwakili oleh histogram
tanpa celah atau Kurva Kepadatan (Density Curve). Yang terpenting,
probabilitas untuk variabel kontinu dihitung sebagai luas di bawah kurva
kepadatan yang mencakup rentang hasil yang diinginkan. Distribusi Normal
adalah contoh utama dari kurva kepadatan yang digunakan dalam konteks
ini.
2.1 . Variabel Diskrit
(Discrete Variables)
Variabel diskrit adalah variabel yang hanya dapat mengambil nilai
yang dapat dihitung (countable).
Contoh: Jumlah anak dalam keluarga (Anda tidak mungkin memiliki
setengah anak), jumlah sisi kepala saat melempar koin, atau skor
tes.
Meskipun dapat dihitung, variabel diskrit tidak hanya terbatas pada
bilangan bulat. Contohnya adalah jumlah uang di rekening bank Anda (yang
melibatkan sen/cents).
Distribusi probabilitas variabel diskrit biasanya disajikan
menggunakan diagram batang (bar chart), yang memiliki celah di antara
setiap batang untuk menunjukkan bahwa hasilnya adalah entitas individual
dan tidak kontinu. Probabilitas untuk variabel acak diskrit (\(X\)) diwakili oleh Fungsi Massa
Probabilitas (PMF), yang dinotasikan sebagai \(P(X=x)\) atau \(f(x)\). Fungsi ini memberikan probabilitas
bahwa variabel acak \(X\) akan
mengambil nilai tertentu \(x\).1.
Non-Negatif,Probabilitas untuk setiap nilai x harus berada di antara
0 dan 1.,\(0≤f(x)≤1\)
Normalisasi,Jumlah total semua probabilitas untuk semua nilai x yang
mungkin harus sama dengan 1.,\(x∑f(x)=1\)
Nama Rumus
Rumus Matematis
Penjelasan
Contoh
Fungsi Massa Probabilitas (PMF)
P(X = x), dengan ∑ P(X = x) = 1
Probabilitas bahwa X tepat sama dengan nilai tertentu
x. Jumlah semua probabilitas harus 1, karena salah satu nilai pasti
terjadi. PMF menunjukkan ‘massa’ probabilitas di titik-titik
diskrit.
Untuk lemparan koin (X = jumlah kepala dalam 2
lemparan): P(X=0)=0.25, P(X=1)=0.5, P(X=2)=0.25.
Harapan (Expectation/Mean)
E[X] = ∑ x · P(X = x)
Nilai rata-rata yang diharapkan dari variabel diskrit,
diperoleh dengan menimbang setiap nilai x dengan probabilitasnya.
Mewakili ‘pusat’ distribusi.
Untuk distribusi di atas: E[X] = 0·0.25 + 1·0.5 +
2·0.25 = 1.
Varians (Variance)
Var(X) = E[X²] - (E[X])², di mana E[X²] = ∑ x² · P(X =
x)
Mengukur seberapa tersebar nilai-nilai X di sekitar
harapan. Nilai tinggi menunjukkan variasi besar (data lebih
menyebar).
Untuk X di atas: E[X²] = 0²·0.25 + 1²·0.5 + 2²·0.25 =
1.5, Var(X) = 1.5 - 1² = 0.5.
Deviasi Standar (Standard Deviation)
σ = √Var(X)
Akar kuadrat dari varians, memberikan ukuran penyebaran
dalam unit yang sama dengan X. Lebih mudah diinterpretasikan daripada
varians.
Dari Var(X)=0.5, σ = √0.5 ≈ 0.707.
2.2 . Variabel Kontinu
(Continuous Variables)
Variabel kontinu adalah variabel yang dapat mengambil nilai numerik
apa pun dalam rentang tertentu.
Sifat: Jumlah nilai yang mungkin adalah tak terbatas (infinite)
dan tidak dapat dihitung (uncountable).
Nilai-nilai ini mengalir tanpa celah di antara dua titik mana
pun.
Cara Memperoleh Data: Dengan mengukur.
Contoh:
Usia: Bisa berusia 23 tahun, 6 bulan, 2 hari, 3 detik, dan terus
menerus hingga ke skala yang lebih kecil.
Berat badan, suhu, jarak, tinggi badan.
Konsekuensi: Karena ada tak terhingga kemungkinan nilai,
probabilitas untuk mendapatkan nilai tunggal yang tepat (misalnya \(P(X=23)\)) pada variabel kontinu adalah
nol. Probabilitas hanya dapat dihitung untuk rentang nilai (misalnya,
\(P(20 \leq X \leq 30)\)).
2.3 . Representasi
Distribusi Probabilitas
Cara visualisasi dan perhitungan probabilitas berbeda secara
signifikan antara kedua jenis variabel tersebut:
Fitur
Variabel Diskrit
Variabel Kontinu
Visualisasi
Diagram Batang (Bar Chart)
Histogram / Kurva Kepadatan (Density Curve)
Pemisahan Visual
Ada celah antar batang untuk menunjukkan hasil yang
terpisah/countable.
Tidak ada celah antar batang (pada histogram) untuk
mencerminkan kontinuitas data.
Perhitungan Probabilitas
Menggunakan rumus probabilitas dasar (seperti
penjumlahan probabilitas untuk setiap hasil yang dapat dihitung).
Diwakili oleh luas di bawah kurva (Kurva
Kepadatan).
Model Utama
Distribusi Binomial, Poisson.
Distribusi Normal (karena merupakan jenis Kurva
Kepadatan).
1. Bar chart untuk variabel diskrit (contoh: jumlah siswa per
kategori nilai A, B, C, D)
2. Histogram untuk variabel kontinu (contoh: tinggi badan
siswa)
3. Kurva kepadatan (density curve) untuk distribusi normal,
dengan area shaded untuk probabilitas rentang
Distribusi Normal adalah contoh kurva kepadatan klasik kemungkinan
(PDF) untuk variabel kontinu, berbentuk lonceng simetris. Kita bisa
memvisualisasikan PDF-nya, dan opsional menambahkan elemen seperti CDF
(fungsi distribusi akumulasi) atau simulasi data. Contoh: Distribusi
normal dengan \(\mu = 5\) dan \(\sigma = 2\) , lalu hitung probabilitas
\(P(3 < X < 7) \approx 0.6827\)
(satu standar deviasi).
## Probabilitas P(3 < X < 7) = 0.6827
3 . Sampling
Distributions
Distribusi dari sampel-sampel yang diperoleh dari suatu populasi.
Prinsip distribusi sampel sangat penting dalam inferensi statistik
karena memungkinkan kita untuk membuat estimasi dan memperkirakan
parameter populasi berdasarkan data sampel.
3.1 . Definisi
Adalah distribusi yang dihasilkan dari mempertimbangkan semua
kemungkinan sampel dari suatu populasi. Dengan kata lain, distribusi
sampling adalah distribusi yang diperoleh dengan menghitung parameter
sampling dari seluruh kemungkinan sampel dari suatu populasi.
Misalnya, jika kita mengekstrak semua sampel yang mungkin dari suatu
populasi statistik dan menghitung rata-rata setiap sampel, himpunan
rata-rata sampel membentuk distribusi pengambilan sampel. Lebih
tepatnya, karena parameter yang dihitung adalah mean aritmatika, maka
ini adalah distribusi sampling dari mean. Dalam statistik, distribusi
sampling digunakan untuk menghitung probabilitas mendekati nilai
parameter populasi ketika mempelajari suatu sampel. Demikian pula,
distribusi pengambilan sampel memungkinkan kita memperkirakan kesalahan
pengambilan sampel untuk ukuran sampel tertentu.
Populasi adalah keseluruhan individu yang diminati (contoh:
10.000 orang dengan purata tinggi (\(\mu\)) 5’4”).
Sampel adalah sebahagian kecil yang diambil dari
populasi.
Min sampel (\(\bar{x}\)) tidak
sentiasa sama dengan min populasi (\(\mu\)) kerana sampel lebih kecil, memiliki
lebih banyak variabilitas, dan kurang tepat mewakili populasi.
3.2 . Perbedaan
Distribusi
Distribusi Sampel: Melibatkan pengambilan satu
sampel tunggal dari populasi dan menafsirkan data dari sampel itu
saja.
Distribusi Persampelan: Merupakan taburan yang
dibuat dari statistik (seperti min, \(\bar{x}\)) dari berbilang (multiple) sampel
rawak mudah yang diambil dari populasi yang sama.
3.3 . Sifat dan
Perbandingan Distribusi
Jika proses ini dilakukan berulang kali, Distribusi Persampelan akan
menjadi Distribusi Normal. Teorem Had Tengah (Central Limit Theorem)
adalah sebab mengapa distribusi persampelan menjadi normal (akan dibahas
di video berikutnya).
5.Tujuan Distribusi Persampelan Kemudahan dan Kecekapan: Ia
membolehkan kita menganggar nilai min populasi (\(\mu\)) tanpa perlu mengukur setiap individu
(contoh: tidak perlu mengukur 8 bilion orang di Bumi).
Pengiraan Kebarangkalian: Ia membolehkan kita mengira kebarangkalian
untuk mendapatkan hasil tertentu berdasarkan saiz sampel (\(n\)).
Tabel Konsep dan Definisi
Konsep/Istilah
Definisi
Distribusi Sampel
Distribusi yang dibuat untuk mengukur setiap individu
dalam satu sampel.
Distribusi Persampelan
Distribusi yang dibuat dengan berulang kali mengambil
sampel, menghitung statistik (min xˉ), dan menggabungkan hasilnya.
Ralat Piawai (Standard Error)
Nama lain untuk sisihan piawai dari distribusi
persampelan (σxˉ).
Teorem Had Tengah
Prinsip yang menyebabkan distribusi persampelan menjadi
berdistribusi normal jika sampel yang diambil cukup banyak.
3.4 . Rumus
Konsep Statistik
Rumus
Keterangan Rumus
Rata-rata Distribusi Sampling
\[\mu_{\bar{x}} =
\mu\]
\(\mu_{\bar{x}}\): Rata-rata dari
semua rata-rata sampel.\(\mu\) :(Rata-rata Populasi).
Kesesatan Baku (Standard Error)
\[\sigma_{\bar{x}} =
\frac{\sigma}{\sqrt{n}}\]
\(\sigma_{\bar{x}}\): Simpangan baku
Distribusi Sampling. \(\sigma\): Simpangan baku populasi.
\(n\): Ukuran
sampel.
Z-Score Distribusi Sampling
\[Z = \frac{\bar{x} -
\mu}{\sigma/\sqrt{n}}\]
\(Z\): Nilai Z-score untuk rata-rata
sampel. \(\bar{x}\):
Rata-rata sampel yang spesifik (observasi). \(\mu\): Rata-rata populasi.
\(\sigma/\sqrt{n}\):
Kesesatan Baku (\(\sigma_{\bar{x}}\)).
Z-Score Distribusi Populasi
\[Z = \frac{x -
\mu}{\sigma}\]
\(x\): Nilai observasi individual.
\(\mu\): Rata-rata
populasi. \(\sigma\):
Simpangan baku populasi.
3.5 . contoh
1. Populasi 10.000 orang, \(\mu =
5'4"\). Min sampel (\(\bar{x}\)) mungkin 5’3” atau 5’7”,
menunjukkan variabilitas sampel.
2. Ketinggian semua orang Kanada berdistribusi normal dengan
\(\mu = 160\) cm dan \(\sigma = 7\) cm.
Distribusi Persampelan (Sampling Distribution) adalah alat yang
sangat efisien dan berharga dalam statistik. Meskipun Distribusi
Persampelan min sampel memiliki min yang sama dengan min populasi, ia
memiliki variabilitas yang jauh lebih rendah—ditunjukkan oleh Sisihan
Piawai yang lebih kecil (\(\sigma /
\sqrt{n}\)), yang disebut Ralat Piawai. Hal ini memungkinkan para
ahli statistik untuk membuat inferens yang tepat tentang populasi dengan
hanya mengambil sampel dan menghitung kebarangkalian hasil sampel
tertentu
4 . The Central Limit
Theorem
Video ini menjelaskan Teorema Limit Pusat (CLT), yang memprediksi
bentuk distribusi sampling dari rata-rata sampel (\(\bar{x}\)). CLT menyatakan bahwa jika
ukuran sampel (n) cukup besar, distribusi sampling \(\bar{x}\) akan menjadi mendekati normal,
terlepas dari bentuk distribusi populasi aslinya. Secara umum, ukuran
sampel dianggap cukup besar jika \(n \geq
30\). Konsep ini didasari oleh proses berulang mengambil sampel
acak, menghitung rata-rata (\(\bar{x}\)), dan memplotnya untuk membentuk
distribusi. CLT sangat berguna karena memungkinkan kita menggunakan
rumus terkait distribusi normal untuk menganalisis dan
menginterpretasikan set data besar. Pengecualiannya adalah jika populasi
awal sudah berdistribusi normal, distribusi sampling akan normal bahkan
dengan \(n < 30\). Analisis dimulai
dengan meninjau konsep Distribusi Sampling. Distribusi sampling dibuat
dengan berulang kali mengambil sampel acak sederhana dari suatu
populasi, menghitung statistik (seperti rata-rata sampel, \(\bar{x}\)) untuk setiap sampel, dan
kemudian membuat distribusi dari statistik-statistik tersebut.
4.1 . Definisi
Teorema Limit Pusat (CLT) adalah teorema yang memprediksi bentuk
distribusi sampling ini berdasarkan ukuran sampel. Dalam teori
probabilitas , teorema limit pusat ( CLT ) menyatakan bahwa, dalam
kondisi yang tepat, distribusi versi rata-rata sampel yang dinormalisasi
akan konvergen ke distribusi normal standar . Hal ini berlaku bahkan
jika variabel aslinya sendiri tidak terdistribusi normal . Terdapat
beberapa versi CLT, yang masing-masing dapat diterapkan dalam konteks
kondisi yang berbeda. Jika ukuran sampel (\(n\)) cukup besar, maka distribusi sampling
dari rata-rata sampel (\(\bar{x}\))
akan berdistribusi mendekati normal (approximately normal).
Aturan praktis:
Jika populasi berdistribusi normal → Distribusi sampling mean
normal untuk semua \(n\).
Jika populasi tidak normal → Distribusi sampling mean akan
mendekati normal jika: \(n≥30\)(aturan
umum)
Untuk distribusi populasi yang sangat simetris, \(n\) bisa lebih kecil (10-15). Untuk
distribusi sangat skewed, mungkin perlu \(n
>50\).
Populasi (Skewed Right):Ambil banyak sampel (n=30), Hitung mean
tiap sampel, Plot mean-mean tersebut Hasil: Kurva Bell Shape
(Normal)
4.2 . Istilah
Penting
Tabel Istilah Statistik
Istilah
Definisi
Teorema Limit Pusat (Central Limit Theorem/CLT)
Teorema yang menyatakan bahwa distribusi rata-rata sampel akan normal
jika ukuran sampel cukup besar, terlepas dari distribusi populasi.
Distribusi Sampling
Distribusi yang dibentuk oleh hasil statistik (misalnya rata-rata) yang
dihitung dari sampel berulang yang diambil dari populasi.
Rata-rata Sampel (x̄)
|Rata-rata dari satu set sampel data.
Rata-rata Populasi (μ)
Rata-rata yang sebenarnya dari seluruh populasi.
Ukuran Sampel (n)
Jumlah observasi dalam satu sampel.
Distribusi Normal
Distribusi data yang berbentuk lonceng, simetris, dan menjadi hasil
akhir yang diprediksi oleh CLT.
Distribusi Miring (Skewed)
Distribusi populasi yang tidak simetris (tidak normal).
4.3 . Rumus-Rumus Dasar
Teorema Limit Pusat (CLT)
Teorema Limit Pusat memberikan rumus untuk karakteristik Distribusi
Sampling dari Rata-rata Sampel (\(\bar{x}\)).
Rata-rata dari semua rata-rata sampel (\(\mu_{\bar{x}}\)) akan selalu sama dengan
rata-rata populasi (\(\mu\))
aslinya.
\[\mu_{\bar{x}} = \mu\]keteranggan:\(\mu_{\bar{x}}\): Rata-rata dari Distribusi
Sampling Rata-rata Sampel (atau Nilai Harapan dari \(\bar{x}\)). \(\mu\): Rata-rata Populasi (Mean).
2.Simpangan Baku Distribusi Sampling (\(\sigma_{\bar{x}}\))
Simpangan baku dari distribusi sampling rata-rata sampel, yang juga
dikenal sebagai Kesalahan Standar Rata-Rata (Standard Error of the
Mean), dihitung dengan membagi simpangan baku populasi (\(\sigma\)) dengan akar kuadrat dari ukuran
sampel (\(n\)).
\(\sigma_{\bar{x}}\): Simpangan Baku
dari Distribusi Sampling Rata-rata Sampel (Standard Error of the Mean).
\(\sigma\): Simpangan Baku Populasi
(Standard Deviation). \(n\): Ukuran
Sampel.
Rumus Distribusi Normal (Skor Z)
Ketika CLT diterapkan (yaitu, \(n \geq
30\) atau populasi sudah normal), Distribusi Sampling menjadi
normal. Oleh karena itu, kita dapat menggunakan rumus Skor Z untuk
menghitung probabilitas nilai rata-rata sampel (\(\bar{x}\)) tertentu:
\(Z\): Skor Z (jumlah simpangan baku
suatu nilai \(\bar{x}\) berada di atas
atau di bawah rata-rata). \(\bar{x}\):
Rata-rata Sampel yang diamati. \(\mu\):
Rata-rata Populasi. \(\sigma\):
Simpangan Baku Populasi. \(n\): Ukuran
Sampel.
4.4 . Contoh
Misalkan kita memiliki populasi dengan distribusi eksponensial (yang
miring ke kanan, bukan normal) dengan parameter λ = 1 (mean = 1/λ = 1,
varians = 1/λ² = 1). Kita akan mengambil banyak sampel secara acak dari
distribusi ini, menghitung rata-rata setiap sampel, dan melihat
bagaimana distribusi rata-rata sampel berubah seiring peningkatan ukuran
sampel.
Untuk n = 5: Distribusi rata-rata sampel masih miring.
Untuk n = 30 : Sudah mulai mendekati normal.
Untuk n = 100 : Hampir sempurna normal.
Ini menunjukkan CLT dalam aksi: meskipun populasi asli tidak normal,
rata-rata sampel menjadi normal dengan n besar. kita lihat di visualisai
berikut:
5 . Sampling Distribution
of the Sample Proportion
Teorema Limit Pusat memberi tahu kita bahwa distribusi rata-rata
sampel mengikuti distribusi normal dalam kondisi yang tepat. Hal ini
memungkinkan kita untuk menjawab pertanyaan probabilitas tentang
rata-rata sampel. Sekarang kita ingin menyelidiki distribusi sampel
untuk parameter penting lainnya—distribusi sampel proporsi sampel.
Setelah kita mengetahui distribusi yang diikuti oleh proporsi sampel,
kita dapat menjawab pertanyaan probabilitas tentang proporsi sampel.
Proporsi adalah persentase, fraksi, atau rasio sampel atau populasi yang
memiliki karakteristik yang menarik. Proporsi populasi dilambangkan
dengan dan proporsi sampel dilambangkan dengan.
5.1 . Definisi Distribusi
Sampling dan Proporsi Sampel:
Distribusi Sampling melibatkan pengambilan sampel berulang dari suatu
populasi, menghitung statistik (seperti \(\hat{p}\)), dan membuat distribusi dari
statistik tersebut. Proporsi menjelaskan pecahan hasil yang
menguntungkan (favorable outcomes) dibandingkan dengan keseluruhan.
Perhitungan Proporsi:
\[\hat{p} = \frac{\text{Jumlah hasil
menguntungkan}}{\text{Ukuran Sampel } (n)}\]
Dalam populasi, proporsi dilambangkan dengan \(p\), dan dalam sampel dilambangkan dengan
\(\hat{p}\) (P hat).
Sampling Distribution of the Sample Proportion (\(\hat{p}\)): Ini adalah distribusi dari
statistik \(\hat{p}\) yang dibuat dari
pengambilan sampel acak berulang. Jika distribusi ini normal dan
mengikuti Central Limit Theorem (Teorema Batas Pusat), tiga hal yang
akan ditemukan adalah:
Mean (\(\mu_{\hat{p}}\)) sama dengan
proporsi populasi (\(p\)).
Standard Deviation (\(\sigma_{\hat{p}}\)) sama dengan \(\sqrt{\frac{p \times q}{n}}\), di mana
\(q = 1-p\) dan \(n\) adalah ukuran sampel.
Anda dapat menggunakan formula z-score dan tabel untuk menghitung
area terkait:
\[Z = \frac{\hat{p} -
p}{\sigma_{\hat{p}}}\].
Kondisi Teorema Batas Pusat (Central Limit Theorem/CLT):Agar CLT
dapat diterapkan pada distribusi proporsi sampel, dua kondisi harus
dipenuhi:\(n \times p \geq 10\)\(n \times (1 - p) \geq 10\)
5.2 . contoh
Misalkan kita ingin mengetahui proporsi pemilih di suatu kota yang
mendukung Calon A. Diketahui dari survei populasi sebelumnya, proporsi
populasi (\(p\)) pemilih yang mendukung
Calon A adalah 0.40 (40%).
Sebuah lembaga survei mengambil sampel acak berulang sebanyak \(\mathbf{n = 100}\) pemilih.
Pertanyaan: Bagaimana distribusi proporsi sampel (\(\hat{p}\)) yang mungkin akan terlihat, dan
berapakah probabilitas bahwa proporsi sampel dari 100 pemilih tersebut
akan kurang dari 0.35?
Langkah 1: Memeriksa Kondisi CLTKita harus memeriksa apakah
distribusi dapat dianggap normal:
Hitung Probabilitas:Menggunakan tabel \(Z\) atau fungsi distribusi normal standar,
kita mencari \(P(Z < -1.02)\).\[P(\hat{p} < 0.35) \approx P(Z < -1.02)
\approx 0.1539\]
Kesimpulan: Ada sekitar 15.39% probabilitas bahwa proporsi sampel
dari 100 pemilih yang mendukung Calon A akan kurang dari 0.35.
6 . Review: Sampling
Distribution of the Sample Proportion, Binomial Distribution,
Probability
Video ini merangkum dan mengulas konsep-konsep probabilitas,
distribusi binomial, dan distribusi sampling dari proporsi sampel
(sampling distribution of the sample proportion) melalui tiga contoh
soal praktik. Review Probabilitas dan Distribusi BinomialVideo ini
menggunakan studi kasus di mana sebuah stoples berisi 200 kelereng hijau
(sukses, \(P=0.4\)) dan 300 kelereng
biru (gagal, \(1-P=0.6\)).
6.1 . Contoh:
6.1.1 cotonh: Menggambar
Tiga Kelereng (Menggunakan Ruang Sampel)Pertanyaan:
Jika satu kelereng diambil tiga kali dengan pengembalian, berapa
probabilitas mendapatkan setidaknya dua kelereng hijau?
Metode:Penghitungan probabilitas dilakukan dengan menjumlahkan
probabilitas dari semua hasil yang memenuhi kondisi (minimal dua hijau)
Hasil yang mungkin adalah: 2 hijau dan 1 biru (GGB, GBG, BGG) dan 3
hijau (GGG).Probabilitas mendapatkan 2 kelereng hijau adalah 0.288 dan
probabilitas mendapatkan 3 kelereng hijau adalah 0.064.
Jawaban: \(0.288 + 0.064 =
\mathbf{0.352}\).
6.1.2 . Contoh :
Menggambar Lima Kelereng (Menggunakan Formula Binomial)
Pertanyaan: Jika satu kelereng diambil lima kali dengan pengembalian,
berapa probabilitas mendapatkan setidaknya dua kelereng hijau?
Metode:Karena jumlah percobaan (n) lebih banyak, digunakan Formula
Binomial untuk menghitung probabilitas tepat sejumlah sukses (\(k\)). Probabilitas “setidaknya dua hijau”
dihitung sebagai \(P(k\ge 2) = P(k=2) + P(k=3)
+ P(k=4) + P(k=5)\). Setelah menghitung masing-masing
probabilitas:\(P(k=2) = 0.3456\)
Jawaban Akhir: Hasil penjumlahan dari \(P(k=2)\) hingga \(P(k=5)\) adalah 0.6634.
6.2 . Distribusi Sampling
dari Proporsi Sampel (Sampling Distribution of the Sample
Proportion)
Pertanyaan: Jika satu kelereng diambil 100 kali dengan pengembalian,
berapa perkiraan probabilitas mendapatkan setidaknya 35 kelereng
hijau?
Metode:Karena jumlah percobaan (\(n=100\)) sangat besar, formula binomial
menjadi tidak praktis. Sebagai gantinya, digunakan konsep distribusi
sampling dari proporsi sampel yang memanfaatkan Teorema Batas Pusat
(Central Limit Theorem). Pengecekan Kondisi CLT: Kedua kondisi, \(n \times P \ge 10\) (\(100 \times 0.4 = 40\)) dan \(n \times (1-P) \ge 10\) (\(100 \times 0.6 = 60\)), terpenuhi.
Perhitungan Z-Score: Digunakan formula standardisasi untuk proporsi:
\(Z = \frac{\hat{P} -
P}{\sqrt{\frac{P(1-P)}{n}}}\). Dengan proporsi sampel (\(\hat{P}\)) minimal 35/100 = 0.35, Z-score
yang didapatkan adalah -1.02. Penemuan Probabilitas: Z-score -1.02
memiliki area ke kiri sebesar 0.1539. Karena pertanyaan meminta
“setidaknya 35” (area ke kanan), maka dihitung \(1 - 0.1539\).
Jawaban: \(1 - 0.1539 =
\mathbf{0.8461}\) atau 84.61%.
Poin Penting:Perhitungan menggunakan Teorema Batas Pusat (CLT) selalu
menghasilkan probabilitas perkiraan (approximate probability), bukan
probabilitas eksak.Probabilitas eksak hanya bisa didapat melalui formula
ruang sampel (untuk n kecil) atau formula binomial.
7 . Kesimpulan
Distribusi probabilitas adalah deskripsi matematis yang menjelaskan
bagaimana probabilitas didistribusikan di antara semua nilai yang
mungkin dari variabel acak (random variable). Ini adalah konsep mendasar
dalam statistika dan probabilitas.Tujuan UtamaMemungkinkan kita untuk
memprediksi atau menghitung seberapa sering suatu hasil tertentu akan
terjadi dalam jangka panjang (frekuensi relatif).Memberikan dasar untuk
inferensi statistik, seperti pengujian hipotesis dan penentuan interval
kepercayaan.Jenis-jenis UtamaDistribusi probabilitas diklasifikasikan
berdasarkan jenis variabel acaknya:1. Distribusi DiskritBerlaku untuk
variabel acak yang nilainya terhitung atau terbatas (misalnya, jumlah
mobil, hasil lemparan dadu).Ditentukan oleh Fungsi Massa Probabilitas
(PMF), \(P(X=x)\).Contoh
Penting:Distribusi Binomial: Untuk jumlah keberhasilan dalam sejumlah
percobaan independen (Bernoulli).Distribusi Poisson: Untuk jumlah
kejadian dalam interval waktu atau ruang tertentu.Distribusi Geometrik:
Untuk jumlah percobaan hingga keberhasilan pertama.2. Distribusi
KontinuGetty ImagesBerlaku untuk variabel acak yang nilainya dapat
berupa setiap titik dalam suatu interval (misalnya, tinggi, berat,
waktu).Ditentukan oleh Fungsi Kepadatan Probabilitas (PDF), \(f(x)\). Probabilitas dihitung sebagai area
di bawah kurva (integral).Contoh Penting:Distribusi Normal (Gauss):
Distribusi paling umum, berbentuk lonceng, dan sangat penting untuk
statistik inferensial.Distribusi Seragam: Setiap nilai dalam rentang
yang ditentukan memiliki probabilitas yang sama.Distribusi Eksponensial:
Sering digunakan untuk memodelkan waktu tunggu antar kejadian.