Distribusi Probabilitas
Exercises ~ Week 11
1 . Pendahuluan
Dalam teori dan statistik probabilitas , distribusi probabilitas menggambarkan perilaku acak suatu fenomena yang bergantung pada peluang . Studi tentang fenomena acak dimulai dengan studi tentang permainan peluang – permainan dadu , undian bola guci, dan gambar atau ekor merupakan motivasi untuk memahami dan memprediksi eksperimen acak. Pendekatan awal ini merupakan fenomena diskrit, yang berarti jumlah kemungkinan hasil terbatas atau terhitung. Namun, beberapa isu menunjukkan distribusi probabilitas dengan dukungan tak terhingga yang tak terhitung . Misalnya, ketika lemparan koin cenderung tak terhingga, jumlah gambar mendekati distribusi normal .
Fluktuasi dan variabilitas hadir di hampir setiap nilai terukur selama pengamatan suatu fenomena, terlepas dari sifatnya; lebih lanjut, hampir semua pengukuran memiliki komponen kesalahan intrinsik. Distribusi probabilitas dapat memodelkan ketidakpastian dan menggambarkan fenomena fisika, biologi, ekonomi, dan lainnya. Bidang statistika memungkinkan penemuan distribusi probabilitas yang disesuaikan dengan fenomena acak.
Terdapat banyak distribusi probabilitas yang berbeda. Di antara distribusi probabilitas tersebut, distribusi normal memiliki peran yang sangat penting. Menurut teorema limit pusat, , distribusi normal membahas perilaku asimtotik dari berbagai distribusi probabilitas.
Terdapat dua jenis distribusi probabilitas:
Distribusi Kontinu: Ketika variabel yang diukur dinyatakan dalam skala kontinu, seperti pada karakteristik dimensional.
Distribusi Diskrit: Ketika variabel yang diukur hanya dapat memiliki nilai tertentu, seperti bilangan bulat: 0, 1, 2, dst.
https://pt.wikipedia.org/wiki/Distribui%C3%A7%C3%A3o_de_probabilidade
2 . Probability of Continuous Variables
Video ini memulai dengan meninjau variabel diskrit, yang didefinisikan sebagai variabel yang hanya dapat mengambil sejumlah nilai yang dapat dihitung (\(countable\)) atau terbatas. Sebaliknya, variabel kontinu adalah variabel yang dapat mengambil nilai numerik apa pun dalam rentang tertentu, membuatnya tidak terbatas (infinite) dan tidak dapat dihitung (\(uncountable\)). Perbedaan fundamental dalam perolehan data: diskrit melalui menghitung, sedangkan kontinu melalui mengukur. Perbedaan ini juga terlihat dalam representasi visual dan perhitungan probabilitasnya. Variabel diskrit diwakili oleh diagram batang dengan celah, sedangkan variabel kontinu diwakili oleh histogram tanpa celah atau Kurva Kepadatan (Density Curve). Yang terpenting, probabilitas untuk variabel kontinu dihitung sebagai luas di bawah kurva kepadatan yang mencakup rentang hasil yang diinginkan. Distribusi Normal adalah contoh utama dari kurva kepadatan yang digunakan dalam konteks ini.
2.1 . Variabel Diskrit (Discrete Variables)
Variabel diskrit adalah variabel yang hanya dapat mengambil nilai yang dapat dihitung (countable).
Contoh: Jumlah anak dalam keluarga (Anda tidak mungkin memiliki setengah anak), jumlah sisi kepala saat melempar koin, atau skor tes.
Meskipun dapat dihitung, variabel diskrit tidak hanya terbatas pada bilangan bulat. Contohnya adalah jumlah uang di rekening bank Anda (yang melibatkan sen/cents).
Distribusi probabilitas variabel diskrit biasanya disajikan menggunakan diagram batang (bar chart), yang memiliki celah di antara setiap batang untuk menunjukkan bahwa hasilnya adalah entitas individual dan tidak kontinu. Probabilitas untuk variabel acak diskrit (\(X\)) diwakili oleh Fungsi Massa Probabilitas (PMF), yang dinotasikan sebagai \(P(X=x)\) atau \(f(x)\). Fungsi ini memberikan probabilitas bahwa variabel acak \(X\) akan mengambil nilai tertentu \(x\).1.
- Non-Negatif,Probabilitas untuk setiap nilai x harus berada di antara 0 dan 1.,\(0≤f(x)≤1\)
- Normalisasi,Jumlah total semua probabilitas untuk semua nilai x yang mungkin harus sama dengan 1.,\(x∑f(x)=1\)
| Nama Rumus | Rumus Matematis | Penjelasan | Contoh |
|---|---|---|---|
| Fungsi Massa Probabilitas (PMF) | P(X = x), dengan ∑ P(X = x) = 1 | Probabilitas bahwa X tepat sama dengan nilai tertentu x. Jumlah semua probabilitas harus 1, karena salah satu nilai pasti terjadi. PMF menunjukkan ‘massa’ probabilitas di titik-titik diskrit. | Untuk lemparan koin (X = jumlah kepala dalam 2 lemparan): P(X=0)=0.25, P(X=1)=0.5, P(X=2)=0.25. |
| Harapan (Expectation/Mean) | E[X] = ∑ x · P(X = x) | Nilai rata-rata yang diharapkan dari variabel diskrit, diperoleh dengan menimbang setiap nilai x dengan probabilitasnya. Mewakili ‘pusat’ distribusi. | Untuk distribusi di atas: E[X] = 0·0.25 + 1·0.5 + 2·0.25 = 1. |
| Varians (Variance) | Var(X) = E[X²] - (E[X])², di mana E[X²] = ∑ x² · P(X = x) | Mengukur seberapa tersebar nilai-nilai X di sekitar harapan. Nilai tinggi menunjukkan variasi besar (data lebih menyebar). | Untuk X di atas: E[X²] = 0²·0.25 + 1²·0.5 + 2²·0.25 = 1.5, Var(X) = 1.5 - 1² = 0.5. |
| Deviasi Standar (Standard Deviation) | σ = √Var(X) | Akar kuadrat dari varians, memberikan ukuran penyebaran dalam unit yang sama dengan X. Lebih mudah diinterpretasikan daripada varians. | Dari Var(X)=0.5, σ = √0.5 ≈ 0.707. |
2.2 . Variabel Kontinu (Continuous Variables)
Variabel kontinu adalah variabel yang dapat mengambil nilai numerik apa pun dalam rentang tertentu.
Sifat: Jumlah nilai yang mungkin adalah tak terbatas (infinite) dan tidak dapat dihitung (uncountable).
Nilai-nilai ini mengalir tanpa celah di antara dua titik mana pun.
Cara Memperoleh Data: Dengan mengukur.
Contoh:
Usia: Bisa berusia 23 tahun, 6 bulan, 2 hari, 3 detik, dan terus menerus hingga ke skala yang lebih kecil.
Berat badan, suhu, jarak, tinggi badan.
Konsekuensi: Karena ada tak terhingga kemungkinan nilai, probabilitas untuk mendapatkan nilai tunggal yang tepat (misalnya \(P(X=23)\)) pada variabel kontinu adalah nol. Probabilitas hanya dapat dihitung untuk rentang nilai (misalnya, \(P(20 \leq X \leq 30)\)).
2.3 . Representasi Distribusi Probabilitas
Cara visualisasi dan perhitungan probabilitas berbeda secara signifikan antara kedua jenis variabel tersebut:
| Fitur | Variabel Diskrit | Variabel Kontinu |
|---|---|---|
| Visualisasi | Diagram Batang (Bar Chart) | Histogram / Kurva Kepadatan (Density Curve) |
| Pemisahan Visual | Ada celah antar batang untuk menunjukkan hasil yang terpisah/countable. | Tidak ada celah antar batang (pada histogram) untuk mencerminkan kontinuitas data. |
| Perhitungan Probabilitas | Menggunakan rumus probabilitas dasar (seperti penjumlahan probabilitas untuk setiap hasil yang dapat dihitung). | Diwakili oleh luas di bawah kurva (Kurva Kepadatan). |
| Model Utama | Distribusi Binomial, Poisson. | Distribusi Normal (karena merupakan jenis Kurva Kepadatan). |
1. Bar chart untuk variabel diskrit (contoh: jumlah siswa per kategori nilai A, B, C, D)
2. Histogram untuk variabel kontinu (contoh: tinggi badan siswa)
3. Kurva kepadatan (density curve) untuk distribusi normal, dengan area shaded untuk probabilitas rentang
Distribusi Normal adalah contoh kurva kepadatan klasik kemungkinan (PDF) untuk variabel kontinu, berbentuk lonceng simetris. Kita bisa memvisualisasikan PDF-nya, dan opsional menambahkan elemen seperti CDF (fungsi distribusi akumulasi) atau simulasi data. Contoh: Distribusi normal dengan \(\mu = 5\) dan \(\sigma = 2\) , lalu hitung probabilitas \(P(3 < X < 7) \approx 0.6827\) (satu standar deviasi).
## Probabilitas P(3 < X < 7) = 0.6827
https://informatika.stei.itb.ac.id/~rinaldi.munir/Probstat/2010-2011/Distribusi%20Peluang%20Kontinu.pdf https://www.geeksforgeeks.org/maths/continuous-probability-distributions/ https://lmsspada.kemdiktisaintek.go.id/pluginfile.php/149745/mod_resource/content/1/konsep_distribusi_peluang_kontinu.pdf
3 . Sampling Distributions
distribusi dari sampel-sampel yang diperoleh dari suatu populasi. Prinsip distribusi sampel sangat penting dalam inferensi statistik karena memungkinkan kita untuk membuat estimasi dan memperkirakan parameter populasi berdasarkan data sampel.
3.1 . Definisi
adalah distribusi yang dihasilkan dari mempertimbangkan semua kemungkinan sampel dari suatu populasi. Dengan kata lain, distribusi sampling adalah distribusi yang diperoleh dengan menghitung parameter sampling dari seluruh kemungkinan sampel dari suatu populasi.
Misalnya, jika kita mengekstrak semua sampel yang mungkin dari suatu populasi statistik dan menghitung rata-rata setiap sampel, himpunan rata-rata sampel membentuk distribusi pengambilan sampel. Lebih tepatnya, karena parameter yang dihitung adalah mean aritmatika, maka ini adalah distribusi sampling dari mean. Dalam statistik, distribusi sampling digunakan untuk menghitung probabilitas mendekati nilai parameter populasi ketika mempelajari suatu sampel. Demikian pula, distribusi pengambilan sampel memungkinkan kita memperkirakan kesalahan pengambilan sampel untuk ukuran sampel tertentu.
Populasi adalah keseluruhan individu yang diminati (contoh: 10.000 orang dengan purata tinggi (\(\mu\)) 5’4”).
Sampel adalah sebahagian kecil yang diambil dari populasi.
Min sampel (\(\bar{x}\)) tidak sentiasa sama dengan min populasi (\(\mu\)) kerana sampel lebih kecil, memiliki lebih banyak variabilitas, dan kurang tepat mewakili populasi.
3.2 . Perbedaan Distribusi
Distribusi Sampel: Melibatkan pengambilan satu sampel tunggal dari populasi dan menafsirkan data dari sampel itu saja.
Distribusi Persampelan: Merupakan taburan yang dibuat dari statistik (seperti min, \(\bar{x}\)) dari berbilang (multiple) sampel rawak mudah yang diambil dari populasi yang sama.
3.3 . Sifat dan Perbandingan Distribusi
Jika proses ini dilakukan berulang kali, Distribusi Persampelan akan menjadi Distribusi Normal.
Teorem Had Tengah (Central Limit Theorem) adalah sebab mengapa distribusi persampelan menjadi normal (akan dibahas di video berikutnya).
5.Tujuan Distribusi Persampelan Kemudahan dan Kecekapan: Ia membolehkan kita menganggar nilai min populasi (\(\mu\)) tanpa perlu mengukur setiap individu (contoh: tidak perlu mengukur 8 bilion orang di Bumi).
Pengiraan Kebarangkalian: Ia membolehkan kita mengira kebarangkalian untuk mendapatkan hasil tertentu berdasarkan saiz sampel (\(n\)).
| Konsep/Istilah | Definisi |
|---|---|
| Distribusi Sampel | Distribusi yang dibuat untuk mengukur setiap individu dalam satu sampel. |
| Distribusi Persampelan | Distribusi yang dibuat dengan berulang kali mengambil sampel, menghitung statistik (min xˉ), dan menggabungkan hasilnya. |
| Ralat Piawai (Standard Error) | Nama lain untuk sisihan piawai dari distribusi persampelan (σxˉ). |
| Teorem Had Tengah | Prinsip yang menyebabkan distribusi persampelan menjadi berdistribusi normal jika sampel yang diambil cukup banyak. |
3.4 . Rumus
| Konsep Statistik | Rumus | Keterangan Rumus |
|---|---|---|
| Rata-rata Distribusi Sampling | \[\mu_{\bar{x}} = \mu\] | \(\mu_{\bar{x}}\): Rata-rata dari semua rata-rata sampel.\(\mu\) :(Rata-rata Populasi). |
| Kesesatan Baku (Standard Error) | \[\sigma_{\bar{x}} = \frac{\sigma}{\sqrt{n}}\] | \(\sigma_{\bar{x}}\): Simpangan baku Distribusi Sampling. \(\sigma\): Simpangan baku populasi. \(n\): Ukuran sampel. |
| Z-Score Distribusi Sampling | \[Z = \frac{\bar{x} - \mu}{\sigma/\sqrt{n}}\] | \(Z\): Nilai Z-score untuk rata-rata sampel. \(\bar{x}\): Rata-rata sampel yang spesifik (observasi). \(\mu\): Rata-rata populasi. \(\sigma/\sqrt{n}\): Kesesatan Baku (\(\sigma_{\bar{x}}\)). |
| Z-Score Distribusi Populasi | \[Z = \frac{x - \mu}{\sigma}\] | \(x\): Nilai observasi individual. \(\mu\): Rata-rata populasi. \(\sigma\): Simpangan baku populasi. |
3.5 . contoh
1. Populasi 10.000 orang, \(\mu = 5'4"\). Min sampel (\(\bar{x}\)) mungkin 5’3” atau 5’7”, menunjukkan variabilitas sampel.
2. Ketinggian semua orang Kanada berdistribusi normal dengan \(\mu = 160\) cm dan \(\sigma = 7\) cm.
Distribusi Persampelan (Sampling Distribution) adalah alat yang sangat efisien dan berharga dalam statistik. Meskipun Distribusi Persampelan min sampel memiliki min yang sama dengan min populasi, ia memiliki variabilitas yang jauh lebih rendah—ditunjukkan oleh Sisihan Piawai yang lebih kecil (\(\sigma / \sqrt{n}\)), yang disebut Ralat Piawai. Hal ini memungkinkan para ahli statistik untuk membuat inferens yang tepat tentang populasi dengan hanya mengambil sampel dan menghitung kebarangkalian hasil sampel tertentu
4 . The Central Limit Theorem
Video ini menjelaskan Teorema Limit Pusat (CLT), yang memprediksi bentuk distribusi sampling dari rata-rata sampel (\(\bar{x}\)). CLT menyatakan bahwa jika ukuran sampel (n) cukup besar, distribusi sampling \(\bar{x}\) akan menjadi mendekati normal, terlepas dari bentuk distribusi populasi aslinya. Secara umum, ukuran sampel dianggap cukup besar jika \(n \geq 30\). Konsep ini didasari oleh proses berulang mengambil sampel acak, menghitung rata-rata (\(\bar{x}\)), dan memplotnya untuk membentuk distribusi. CLT sangat berguna karena memungkinkan kita menggunakan rumus terkait distribusi normal untuk menganalisis dan menginterpretasikan set data besar. Pengecualiannya adalah jika populasi awal sudah berdistribusi normal, distribusi sampling akan normal bahkan dengan \(n < 30\). Analisis dimulai dengan meninjau konsep Distribusi Sampling. Distribusi sampling dibuat dengan berulang kali mengambil sampel acak sederhana dari suatu populasi, menghitung statistik (seperti rata-rata sampel, \(\bar{x}\)) untuk setiap sampel, dan kemudian membuat distribusi dari statistik-statistik tersebut.
4.1 . Definisi
Teorema Limit Pusat (CLT) adalah teorema yang memprediksi bentuk distribusi sampling ini berdasarkan ukuran sampel. Dalam teori probabilitas , teorema limit pusat ( CLT ) menyatakan bahwa, dalam kondisi yang tepat, distribusi versi rata-rata sampel yang dinormalisasi akan konvergen ke distribusi normal standar . Hal ini berlaku bahkan jika variabel aslinya sendiri tidak terdistribusi normal . Terdapat beberapa versi CLT, yang masing-masing dapat diterapkan dalam konteks kondisi yang berbeda. Jika ukuran sampel (\(n\)) cukup besar, maka distribusi sampling dari rata-rata sampel (\(\bar{x}\)) akan berdistribusi mendekati normal (approximately normal).
Aturan praktis:
Jika populasi berdistribusi normal → Distribusi sampling mean normal untuk semua \(n\).
Jika populasi tidak normal → Distribusi sampling mean akan mendekati normal jika: \(n≥30\)(aturan umum)
Untuk distribusi populasi yang sangat simetris, \(n\) bisa lebih kecil (10-15). Untuk distribusi sangat skewed, mungkin perlu \(n >50\).
Populasi (Skewed Right):Ambil banyak sampel (n=30), Hitung mean tiap sampel, Plot mean-mean tersebut Hasil: Kurva Bell Shape (Normal)
4.2 . Istilah Penting
| Istilah | Definisi |
|---|---|
| Teorema Limit Pusat (Central Limit Theorem/CLT) | Teorema yang menyatakan bahwa distribusi rata-rata sampel akan normal jika ukuran sampel cukup besar, terlepas dari distribusi populasi. |
| Distribusi Sampling | Distribusi yang dibentuk oleh hasil statistik (misalnya rata-rata) yang dihitung dari sampel berulang yang diambil dari populasi. |
| Rata-rata Sampel (x̄) | |Rata-rata dari satu set sampel data. |
| Rata-rata Populasi (μ) | Rata-rata yang sebenarnya dari seluruh populasi. |
| Ukuran Sampel (n) | Jumlah observasi dalam satu sampel. |
| Distribusi Normal | Distribusi data yang berbentuk lonceng, simetris, dan menjadi hasil akhir yang diprediksi oleh CLT. |
| Distribusi Miring (Skewed) | Distribusi populasi yang tidak simetris (tidak normal). |
4.3 . Rumus-Rumus Dasar Teorema Limit Pusat (CLT)
Teorema Limit Pusat memberikan rumus untuk karakteristik Distribusi Sampling dari Rata-rata Sampel (\(\bar{x}\)).
1.Rata-Rata Distribusi Sampling (\(\mu_{\bar{x}}\)).
Rata-rata dari semua rata-rata sampel (\(\mu_{\bar{x}}\)) akan selalu sama dengan rata-rata populasi (\(\mu\)) aslinya.
\[\mu_{\bar{x}} = \mu\] keteranggan:
\(\mu_{\bar{x}}\): Rata-rata dari Distribusi Sampling Rata-rata Sampel (atau Nilai Harapan dari \(\bar{x}\)).
\(\mu\): Rata-rata Populasi (Mean).
2.Simpangan Baku Distribusi Sampling (\(\sigma_{\bar{x}}\))
Simpangan baku dari distribusi sampling rata-rata sampel, yang juga dikenal sebagai Kesalahan Standar Rata-Rata (Standard Error of the Mean), dihitung dengan membagi simpangan baku populasi (\(\sigma\)) dengan akar kuadrat dari ukuran sampel (\(n\)).
\[\sigma_{\bar{x}} = \frac{\sigma}{\sqrt{n}}\] keteranggan:
\(\sigma_{\bar{x}}\): Simpangan Baku dari Distribusi Sampling Rata-rata Sampel (Standard Error of the Mean).
\(\sigma\): Simpangan Baku Populasi (Standard Deviation).
\(n\): Ukuran Sampel.
Rumus Distribusi Normal (Skor Z)
Ketika CLT diterapkan (yaitu, \(n \geq 30\) atau populasi sudah normal), Distribusi Sampling menjadi normal. Oleh karena itu, kita dapat menggunakan rumus Skor Z untuk menghitung probabilitas nilai rata-rata sampel (\(\bar{x}\)) tertentu:
\[Z = \frac{\bar{x} - \mu_{\bar{x}}}{\sigma_{\bar{x}}} \quad \text{atau} \quad Z = \frac{\bar{x} - \mu}{\frac{\sigma}{\sqrt{n}}}\] keteranggan:
\(Z\): Skor Z (jumlah simpangan baku suatu nilai \(\bar{x}\) berada di atas atau di bawah rata-rata).
\(\bar{x}\): Rata-rata Sampel yang diamati.
\(\mu\): Rata-rata Populasi.
\(\sigma\): Simpangan Baku Populasi.
\(n\): Ukuran Sampel.
4.4 . Contoh
Misalkan kita memiliki populasi dengan distribusi eksponensial (yang miring ke kanan, bukan normal) dengan parameter λ = 1 (mean = 1/λ = 1, varians = 1/λ² = 1). Kita akan mengambil banyak sampel secara acak dari distribusi ini, menghitung rata-rata setiap sampel, dan melihat bagaimana distribusi rata-rata sampel berubah seiring peningkatan ukuran sampel.
Untuk n = 5: Distribusi rata-rata sampel masih miring.
Untuk n = 30 : Sudah mulai mendekati normal.
Untuk n = 100 : Hampir sempurna normal.
Ini menunjukkan CLT dalam aksi: meskipun populasi asli tidak normal, rata-rata sampel menjadi normal dengan n besar. kita lihat di visualisai berikut:
5 . Sampling Distribution of the Sample Proportion
Teorema Limit Pusat memberi tahu kita bahwa distribusi rata-rata sampel mengikuti distribusi normal dalam kondisi yang tepat. Hal ini memungkinkan kita untuk menjawab pertanyaan probabilitas tentang rata-rata sampel. Sekarang kita ingin menyelidiki distribusi sampel untuk parameter penting lainnya—distribusi sampel proporsi sampel. Setelah kita mengetahui distribusi yang diikuti oleh proporsi sampel, kita dapat menjawab pertanyaan probabilitas tentang proporsi sampel. Proporsi adalah persentase, fraksi, atau rasio sampel atau populasi yang memiliki karakteristik yang menarik. Proporsi populasi dilambangkan dengan dan proporsi sampel dilambangkan dengan.
5.1 . Definisi Distribusi Sampling dan Proporsi Sampel:
Distribusi Sampling melibatkan pengambilan sampel berulang dari suatu populasi, menghitung statistik (seperti \(\hat{p}\)), dan membuat distribusi dari statistik tersebut. Proporsi menjelaskan pecahan hasil yang menguntungkan (favorable outcomes) dibandingkan dengan keseluruhan.
Perhitungan Proporsi:
\[\hat{p} = \frac{\text{Jumlah hasil menguntungkan}}{\text{Ukuran Sampel } (n)}\]
Dalam populasi, proporsi dilambangkan dengan \(p\), dan dalam sampel dilambangkan dengan \(\hat{p}\) (P hat).
Sampling Distribution of the Sample Proportion (\(\hat{p}\)): Ini adalah distribusi dari statistik \(\hat{p}\) yang dibuat dari pengambilan sampel acak berulang. Jika distribusi ini normal dan mengikuti Central Limit Theorem (Teorema Batas Pusat), tiga hal yang akan ditemukan adalah:
Mean (\(\mu_{\hat{p}}\)) sama dengan proporsi populasi (\(p\)).
Standard Deviation (\(\sigma_{\hat{p}}\)) sama dengan \(\sqrt{\frac{p \times q}{n}}\), di mana \(q = 1-p\) dan \(n\) adalah ukuran sampel.
Anda dapat menggunakan formula z-score dan tabel untuk menghitung area terkait:
\[Z = \frac{\hat{p} - p}{\sigma_{\hat{p}}}\].
Kondisi Teorema Batas Pusat (Central Limit Theorem/CLT):Agar CLT dapat diterapkan pada distribusi proporsi sampel, dua kondisi harus dipenuhi:\(n \times p \geq 10\)\(n \times (1 - p) \geq 10\)
5.2 . contoh
Misalkan kita ingin mengetahui proporsi pemilih di suatu kota yang mendukung Calon A. Diketahui dari survei populasi sebelumnya, proporsi populasi (\(p\)) pemilih yang mendukung Calon A adalah 0.40 (40%).
Sebuah lembaga survei mengambil sampel acak berulang sebanyak \(\mathbf{n = 100}\) pemilih.
Pertanyaan: Bagaimana distribusi proporsi sampel (\(\hat{p}\)) yang mungkin akan terlihat, dan berapakah probabilitas bahwa proporsi sampel dari 100 pemilih tersebut akan kurang dari 0.35?
Langkah 1: Memeriksa Kondisi CLTKita harus memeriksa apakah distribusi dapat dianggap normal:
1.\(n \times p \geq 10\): \(100 \times 0.40 = 40\). (\(40 \geq 10\), TERPENUHI)
2.\(n \times (1 - p) \geq 10\): \(100 \times (1 - 0.40) = 100 \times 0.60 = 60\). (\(60 \geq 10\), TERPENUHI)
Karena kedua kondisi terpenuhi, distribusi sampling dari \(\hat{p}\) mendekati distribusi normal.
Langkah 2: Menghitung Mean dan Simpangan Baku
Rata-rata (\(\mu_{\hat{p}}\)):\[\mu_{\hat{p}} = p = 0.40\]
Simpangan Baku (\(\sigma_{\hat{p}}\)):
\[\sigma_{\hat{p}} = \sqrt{\frac{p(1-p)}{n}} = \sqrt{\frac{0.40 \times 0.60}{100}} = \sqrt{\frac{0.24}{100}} = \sqrt{0.0024} \approx 0.049\]
Langkah 3: Menghitung \(z\)-score dan ProbabilitasKita ingin mencari \(P(\hat{p} < 0.35)\).
Hitung \(z\)-score: \[Z = \frac{\hat{p} - \mu_{\hat{p}}}{\sigma_{\hat{p}}} = \frac{0.35 - 0.40}{0.049} = \frac{-0.05}{0.049} \approx -1.02\]
Hitung Probabilitas:Menggunakan tabel \(Z\) atau fungsi distribusi normal standar, kita mencari \(P(Z < -1.02)\).\[P(\hat{p} < 0.35) \approx P(Z < -1.02) \approx 0.1539\]
Kesimpulan: Ada sekitar 15.39% probabilitas bahwa proporsi sampel dari 100 pemilih yang mendukung Calon A akan kurang dari 0.35.
6 . Review: Sampling Distribution of the Sample Proportion, Binomial Distribution, Probability
Video ini merangkum dan mengulas konsep-konsep probabilitas, distribusi binomial, dan distribusi sampling dari proporsi sampel (sampling distribution of the sample proportion) melalui tiga contoh soal praktik.
6.1 . Review Probabilitas dan Distribusi BinomialVideo ini menggunakan studi kasus di mana sebuah stoples berisi 200 kelereng hijau (sukses, \(P=0.4\)) dan 300 kelereng biru (gagal, \(1-P=0.6\)).
Contoh
1: Menggambar Tiga Kelereng (Menggunakan Ruang Sampel)Pertanyaan:
Jika satu kelereng diambil tiga kali dengan pengembalian, berapa probabilitas mendapatkan setidaknya dua kelereng hijau?
Metode:Penghitungan probabilitas dilakukan dengan menjumlahkan probabilitas dari semua hasil yang memenuhi kondisi (minimal dua hijau)
.Hasil yang mungkin adalah: 2 hijau dan 1 biru (GGB, GBG, BGG) dan 3 hijau (GGG).Probabilitas mendapatkan 2 kelereng hijau adalah 0.288 dan probabilitas mendapatkan 3 kelereng hijau adalah 0.064.
Jawaban: \(0.288 + 0.064 = \mathbf{0.352}\).
Contoh 2: Menggambar Lima Kelereng (Menggunakan Formula Binomial)
Pertanyaan: Jika satu kelereng diambil lima kali dengan pengembalian, berapa probabilitas mendapatkan setidaknya dua kelereng hijau?
Metode:Karena jumlah percobaan (n) lebih banyak, digunakan Formula Binomial untuk menghitung probabilitas tepat sejumlah sukses (\(k\)).
Probabilitas “setidaknya dua hijau” dihitung sebagai \(P(k\ge 2) = P(k=2) + P(k=3) + P(k=4) + P(k=5)\).
Setelah menghitung masing-masing probabilitas:\(P(k=2) = 0.3456\)
Jawaban Akhir: Hasil penjumlahan dari \(P(k=2)\) hingga \(P(k=5)\) adalah 0.6634.
- Distribusi Sampling dari Proporsi Sampel (Sampling Distribution of the Sample Proportion)
Contoh 3: Menggambar 100 Kelereng (Menggunakan Teorema Batas Pusat)
Pertanyaan: Jika satu kelereng diambil 100 kali dengan pengembalian, berapa perkiraan probabilitas mendapatkan setidaknya 35 kelereng hijau?
Metode:Karena jumlah percobaan (\(n=100\)) sangat besar, formula binomial menjadi tidak praktis.
Sebagai gantinya, digunakan konsep distribusi sampling dari proporsi sampel yang memanfaatkan Teorema Batas Pusat (Central Limit Theorem).
Pengecekan Kondisi CLT: Kedua kondisi, \(n \times P \ge 10\) (\(100 \times 0.4 = 40\)) dan \(n \times (1-P) \ge 10\) (\(100 \times 0.6 = 60\)), terpenuhi.
Perhitungan Z-Score: Digunakan formula standardisasi untuk proporsi: \(Z = \frac{\hat{P} - P}{\sqrt{\frac{P(1-P)}{n}}}\).
Dengan proporsi sampel (\(\hat{P}\)) minimal 35/100 = 0.35, Z-score yang didapatkan adalah -1.02.
Penemuan Probabilitas: Z-score -1.02 memiliki area ke kiri sebesar 0.1539. Karena pertanyaan meminta “setidaknya 35” (area ke kanan), maka dihitung \(1 - 0.1539\).
Jawaban: \(1 - 0.1539 = \mathbf{0.8461}\) atau 84.61%.
Poin Penting:Perhitungan menggunakan Teorema Batas Pusat (CLT) selalu menghasilkan probabilitas perkiraan (approximate probability), bukan probabilitas eksak.Probabilitas eksak hanya bisa didapat melalui formula ruang sampel (untuk n kecil) atau formula binomial.