Probabilitas tidak hanya membantu kita memahami seberapa besar
kemungkinan suatu peristiwa terjadi, tetapi juga membentuk dasar dari
banyak metode statistik yang digunakan untuk pengambilan keputusan.
Ketika suatu proses atau eksperimen menghasilkan berbagai hasil, kita
menggunakan variabel acak untuk merepresentasikan hasil tersebut dan
distribusi probabilitas untuk menjelaskan bagaimana probabilitas
didistribusikan ke setiap nilai yang mungkin. Memahami bentuk dan sifat
distribusi sangat penting karena hal ini menentukan perilaku data, cara
menghitung probabilitas, serta cara membuat prediksi. Mulai dari
distribusi untuk variabel kontinu hingga perilaku statistik seperti
rata-rata sampel, distribusi probabilitas menjadi inti dari statistika
inferensial.
Materi ini akan memandu Anda melalui beberapa konsep utama:
Variabel Acak Kontinu, yang menggambarkan kemungkinan nilai pada
rentang kontinu.
Distribusi Sampling, yang mewakili distribusi statistik sampel
seperti rata-rata sampel atau proporsi sampel.
Teorema Batas Pusat (CLT), salah satu hasil terpenting dalam
statistika, menjelaskan mengapa distribusi rata-rata sampel cenderung
mendekati distribusi normal, terlepas dari bentuk distribusi populasi
asalnya.
Distribusi Proporsi Sampel, banyak digunakan dalam analisis
survei dan penelitian kuantitatif.
Setiap bagian dilengkapi dengan penjelasan video untuk memperdalam
pemahaman konseptual. Dengan menguasai topik-topik ini, Anda akan lebih
siap untuk menganalisis data, membangun model statistik, dan menarik
kesimpulan berdasarkan prinsip-prinsip probabilistik yang kuat.
2 Countinuous Random
Topik ini merupakan fondasi vital dalam statistika inferensial dan
ilmu data, berfungsi sebagai kerangka kerja untuk memodelkan
ketidakpastian (uncertainty) dan membuat keputusan berdasarkan data.
Video ini tidak hanya menyajikan tinjauan teoretis, tetapi juga
menyoroti aplikasi praktis dari berbagai jenis distribusi mulai dari
diskrit hingga kontinu yang digunakan untuk memahami perilaku data.
Fokus utama diletakkan pada pemahaman perbedaan mendasar antara Variabel
Diskrit dan Variabel Kontinu, serta metode visualisasi dan perhitungan
probabilitas yang sesuai untuk masing-masing.
2.1 Variabel Diskrit
(Discrete Variables)
Video diawali dengan tinjauan singkat mengenai variabel diskrit
sebagai dasar pemahaman.
Definisi: Variabel diskrit adalah variabel yang
hanya dapat mengambil nilai yang dapat dihitung (countable number of
values).
Sifat: Sifatnya terbatas atau terhingga (finite),
meskipun nilai tersebut bisa saja melibatkan desimal (misalnya, jumlah
uang di rekening atau skor ujian) selama nilainya masih dapat
dihitung.
Contoh:
Jumlah sisi Heads saat melempar koin.
Jumlah kelereng biru yang diambil.
Nilai siswa pada ujian.
Jumlah anak dalam satu keluarga (misalnya 0, 1, 2, 3, dst., tidak
mungkin 0.73 anak).
2.2 Variabel Kontinu
(Continuous Variables)
Berbeda dengan variabel diskrit, variabel kontinu memiliki sifat yang
tak terbatas.
Definisi: Variabel kontinu adalah variabel yang
dapat mengambil nilai numerik apa pun dalam rentang tertentu.
Sifat: Data untuk variabel kontinu diperoleh melalui
pengukuran (measuring) dan bukan perhitungan (counting). Oleh karena
itu, nilainya tidak terbatas (infinite) dan tidak dapat dihitung
(uncountable).
Contoh:
Usia: Jika diperiksa lebih dekat, seseorang yang berusia 23 tahun
bisa jadi 23 tahun 6 bulan, 2 hari, 3 detik, 8 milidetik, dan seterusnya
hingga tak terhingga.
Berat: Berat seseorang dapat diukur hingga titik desimal apa pun
(misalnya 150.305482…), sehingga kemungkinannya tidak terbatas.
Suhu, jarak, dan waktu juga merupakan contoh variabel
kontinu.
2.3 Representasi
Distribusi Probabilitas
Distribusi probabilitas dari kedua jenis variabel ini
direpresentasikan dengan berbeda secara visual.
Perbandingan Representasi Variabel Diskrit vs. Kontinu
Variabel
Representasi Visual
Ciri Khas
Diskrit
Bar Chart (Diagram Batang)
Setiap elemen ditampilkan sebagai entitas individual yang menunjukkan
hasil yang dapat dihitung. Grafik batang memiliki celah di antara setiap
batang untuk menunjukkan diskontinuitas.
Kontinu
Histogram atau Density Curve (Kurva Kepadatan)
Histogram tidak memiliki celah di antara setiap batang untuk
mencerminkan kesinambungan (continuity) data. Kurva kepadatan (density
curve) juga digunakan untuk mewakili variabel acak kontinu.
2.3.1 Contoh Barchart
untuk Variabel Diskrit
Diagram Batang digunakan untuk merepresentasikan variabel diskrit
karena secara visual mendukung sifat-sifat utama dari variabel
tersebut.
Representasi Entitas Individual
Variabel diskrit adalah variabel yang nilainya dapat dihitung
(countable). Diagram batang merepresentasikan setiap kemungkinan hasil
(misalnya, 0 anak, 1 anak, 2 anak) sebagai entitas atau batang individu.
Ini sesuai dengan sifat data diskrit di mana nilai-nilai di antara
batang tidak mungkin terjadi (misalnya, tidak ada nilai 1.5 anak).
Adanya Celah (Gaps)
Ciri khas diagram batang—yang membedakannya dari histogram—adalah
adanya celah di antara setiap batang. Celah ini penting karena:
Menunjukkan Diskontinuitas: Celah secara visual menunjukkan bahwa
tidak ada kesinambungan (continuity) antar kategori. Artinya, nilai
variabel meloncat dari 1 ke 2, tanpa nilai di antaranya.
Mencerminkan Perhitungan: Karena variabel diskrit didapatkan
melalui perhitungan (counting) dan bukan pengukuran, representasi dengan
celah ini paling tepat untuk menggambarkan hasil yang dapat dihitung
(countable outcomes).
2.3.2 Contoh Histogram
untuk Variabel Kontinu
Variabel kontinu seperti tinggi badan mahasiswa sangat cocok
divisualisasikan menggunakan Histogram karena beberapa alasan utama yang
berhubungan dengan sifat dasar data tersebut.
Tinggi badan adalah contoh klasik dari Variabel Kontinu (data yang
diukur), bukan dihitung.
Sifat Data Kontinu (Nilai Tak Terbatas)
Variabel kontinu dapat mengambil nilai apa pun dalam rentang
tertentu, termasuk angka desimal yang tak terbatas.
Contoh: Tinggi badan mahasiswa tidak hanya 170 cm atau 171 cm.
Tinggi yang mungkin adalah 170.5 cm, 170.53 cm, 170.5321 cm, dan
seterusnya.
Jika kita mencoba membuat batang terpisah untuk setiap nilai
tinggi yang unik, kita akan memiliki ribuan batang sangat pendek yang
tidak memberikan informasi berarti.
Kebutuhan Pengelompokan (Bins)
Histogram mengatasi masalah nilai yang tak terbatas ini dengan
membuat Bins (Keranjang) atau Rentang Interval yang sama lebarnya.
Histogram Mengelompokkan: Data tinggi badan dikelompokkan
(misalnya, 160–165 cm, 165–170 cm, 170–175 cm).
Fokus pada Frekuensi: Setiap batang pada histogram kemudian
menunjukkan frekuensi (jumlah mahasiswa) yang tingginya jatuh ke dalam
rentang bin tersebut.
Representasi Distribusi
Tujuan utama visualisasi data kontinu adalah melihat Distribusi.
Histogram adalah alat terbaik untuk ini karena:
Menunjukkan Kepadatan: Ketinggian batang histogram menunjukkan di
mana data paling banyak terkonsentrasi (pusat data, yang mungkin berada
di sekitar tinggi rata-rata).
Menunjukkan Bentuk: Anda dapat melihat bentuk distribusi data
secara keseluruhan (misalnya, apakah tinggi badan mahasiswa membentuk
kurva lonceng yang simetris—yaitu, Distribusi Normal—atau
miring).
Batang Saling Menyentuh: Dalam histogram, batang-batang saling
menyentuh. Ini secara visual menekankan sifat data yang berkesinambungan
(continuity), yaitu, tidak ada celah nilai yang tidak mungkin terjadi
antara satu rentang tinggi ke rentang tinggi berikutnya. (Berbeda dengan
Bagan Batang untuk data diskret seperti “jumlah anak”, di mana batang
memiliki celah karena tidak mungkin ada “1,5 anak”).
Singkatnya, Histogram mengubah data pengukuran kontinu yang kompleks
menjadi ringkasan visual sederhana yang menunjukkan pola penyebaran dan
konsentrasi data.
2.4 Perhitungan
Probabilitas
Formula / rumus yang digunakan untuk menghitung probabilitas juga
berbeda antara variabel diskrit dan kontinu.
Variabel Diskrit: Menggunakan formula probabilitas
dasar.
Variabel Kontinu: Menggunakan formula yang terkait dengan Kurva
Kepadatan (Density Curves). Hal ini karena area di bawah kurva kepadatan
dapat merepresentasikan probabilitas atau proporsi untuk mengamati
rentang hasil yang bersifat kontinu.
Distribusi Normal: Formula yang berkaitan dengan Distribusi
Normal akan sering digunakan untuk variabel kontinu karena Distribusi
Normal sendiri adalah bentuk dari Kurva Kepadatan. Video ini mengakhiri
dengan menyebutkan bahwa materi selanjutnya dalam seri ini akan berfokus
pada Distribusi Normal.
3 Sampling
Distribution
Video ini menjelaskan konsep penting dalam statistika inferensial,
yaitu Distribusi Sampel (Sampling Distribution). Distribusi sampel
menjadi dasar untuk mengambil kesimpulan tentang populasi besar tanpa
perlu mengukur setiap individu di dalamnya, sehingga sangat membantu
dalam hal efisiensi dan kepraktisan.
Video dimulai dengan membedakan tiga jenis distribusi utama:
Distribusi Sampel (Sample Distribution), Distribusi Populasi (Population
Distribution), dan yang paling penting, Distribusi Sampel (Sampling
Distribution).
3.1 Perbedaan Tiga Jenis
Distribusi
Jenis Distribusi
Keterangan
Distribusi Populasi
Distribusi yang dibuat dari pengukuran setiap individu dalam populasi.
Distribusi Sampel
Distribusi yang dibuat dari pengukuran setiap individu dalam satu sampel
tunggal.
Sampling Distribution
Distribusi dari statistik (misalnya, rata-rata x̄) yang dibuat dari
berbagai sampel acak sederhana yang ditarik dari populasi yang sama.
Penting: Rata-rata sampel \((\bar{x})\) tidak selalu sama dengan
rata-rata populasi \((\mu)\) karena
sampel memiliki variabilitas lebih tinggi dan mengandung lebih sedikit
informasi daripada populasi.
3.2 Proses Pembentukan
Distribusi Sampel
Distribusi sampel dibentuk melalui proses pengambilan sampel berulang
(repeated sampling):
Tentukan Populasi: Identifikasi populasi yang diminati (misalnya,
tinggi badan).
Ambil Sampel 1: Ambil sampel acak sederhana pertama (ukuran
n).
Hitung Statistik: Hitung rata-rata \((\bar{x})\) untuk sampel tersebut.
Plot Hasil: Plot nilai \(\bar{x}\) tersebut ke dalam grafik
distribusi frekuensi.
Ulangi: Lakukan keseluruhan proses ini ratusan hingga ribuan kali
(ambil sampel baru, hitung \(\bar{x},
plot)\).
Hasil akhirnya adalah distribusi yang terdiri dari tumpukan
banyak rata-rata sampel \((\bar{x})\).
Jika data yang dikumpulkan cukup banyak, distribusi sampel akan
cenderung terdistribusi normal.
3.3 Perbandingan Rumus
dan Karakteristik Utama
Perbedaan terbesar antara distribusi populasi dan distribusi sampel
terletak pada sebaran dan simpangan baku-nya.
Karakteristik
Distribusi Populasi
Distribusi Sampel (Rata-rata Sampel)
Rata-rata (Mean)
\(\mu\)
\(\mu_{\bar{x}} = \mu\) (Rata-rata dari
semua \(\bar{x}\) sama dengan rata-rata
populasi)
Simpangan Baku (Standard Deviation)
\(\sigma\)
Simpangan baku lebih kecil dari \(\sigma\)
Nama Simpangan Baku
Simpangan Baku Populasi
Galat Baku (Standard Error)
Rumus Simpangan Baku / Galat Baku
\(\sigma\)
\(\sigma_{\bar{x}} =
\frac{\sigma}{\sqrt{n}}\)
Rumus Standardisasi (Z-Score)
\(Z = \frac{x - \mu}{\sigma}\)
\(Z = \frac{\bar{x} - \mu}{\sigma /
\sqrt{n}}\)
Mengapa Galat Baku Lebih Kecil?
Sebaran distribusi sampel selalu lebih kecil karena rata-rata kurang
bervariasi dibandingkan dengan pengamatan individu. Karena distribusi
sampel dibuat dari rata-rata (bukan dari nilai individu), sebarannya
menjadi lebih sempit dan lebih tinggi.
3.4 Tujuan dan Kegunaan
Distribusi Sampel
Tujuan utama dari distribusi sampel adalah kenyamanan dan
efisiensi.
Menghindari Pengukuran Massal: Distribusi sampel memberikan ide
tentang nilai rata-rata populasi \((\mu)\) tanpa harus mengukur setiap
individu (misalnya, mengukur tinggi 8 miliar manusia).
Perhitungan Probabilitas: Distribusi sampel memungkinkan kita
menghitung probabilitas untuk mendapatkan rata-rata sampel \((\bar{x})\) tertentu berdasarkan ukuran
sampel (n) yang kita gunakan.
3.5 Contoh Soal (Aplikasi
Rumus)
Contoh 1: Menghitung Probabilitas Rata-Rata Sampel
(Menggunakan Distribusi Sampling)
\[Soal:\] Diketahui tinggi orang
Kanada berdistribusi normal dengan rata-rata () 160 cm dan standar
deviasi () 7 cm. Berapa probabilitas rata-rata tinggi badan dari 10
orang Kanada acak (n=10) adalah kurang dari 157 cm?
Penyelesaian:
Hitung Standard Error \((\sigma_{\bar{x}})\): 7 / \(\sqrt{10} \approx\) 2.21.
Hitung Z-score: Z = \(\frac{157 -
160}{2.21}\)\(\approx\)
-1.36.
Cari Luas dari Tabel Z: \(P(Z <
-1.36)\) = 0.0869.
\[Soal:\] Berapa proporsi semua
orang yang memiliki tinggi badan lebih dari 170 cm?
Penyelesaian:
Karena pertanyaannya tentang semua orang (individu), digunakan rumus
Z-score populasi.
Hitung Z-score: Z = \(\frac{170 -
160}{7}\)\(\approx\)
1.43.
Cari Luas ke Kiri: Luas ke kiri dari Z=1.43 adalah
0.9236.
Hitung Luas ke Kanan: 1 - 0.9236 = 0.0764.
Hasil: Proporsinya adalah 0.0764 atau 7.64%.
4 Central Limit
Theorem
Video ini membahas Teorema Limit Pusat (Central Limit Theorem/TLP),
sebuah konsep fundamental dalam statistika inferensial. TLP adalah
teorema yang memprediksi bentuk distribusi sampling dari rata-rata
sampel \((\bar{x})\). Teorema ini
sangat kuat karena memungkinkan kita untuk menganalisis dan menarik
kesimpulan tentang populasi bahkan ketika kita tidak mengetahui bentuk
asli dari distribusi populasi tersebut. Sebelum membahas TLP, video ini
meninjau kembali bahwa distribusi sampling dibentuk dengan mengambil
sampel berulang kali dari populasi, menghitung statistik (seperti \(\bar{x}\)) dari setiap sampel, dan kemudian
menggabungkan hasilnya dalam sebuah grafik.
4.1 Pernyataan Utama
Teorema Limit Pusat
Teorema Limit Pusat menyatakan bahwa:
Jika ukuran sampel (n) cukup besar, maka distribusi sampling dari
rata-rata sampel \((\bar{x})\) akan
berdistribusi mendekati normal (normal approximation).
Prinsip ini berlaku tanpa memandang seperti apa bentuk asli
distribusi populasi (apakah miring/skewed, seragam, atau bentuk
lainnya).
Secara visual, meskipun populasi aslinya miring, plotting semua
rata-rata sampel \((\bar{x})\) secara
berulang akan menghasilkan bentuk lonceng yang simetris (distribusi
normal).
4.2 Mekanisme dan Logika
di Balik TLP
Dalam pengambilan sampel acak, sebagian besar titik data
cenderung berasal dari bagian utama (bulk) distribusi populasi, dan
lebih sedikit yang berasal dari area yang lebih kecil (ekor).
Rata-rata sampel \((\bar{x})\)
cenderung berada di sekitar rata-rata populasi sejati \((\mu)\).
Karena sebagian besar \(\bar{x}\) akan mengelompok di dekat \(\mu\), dan sampel yang sangat ekstrem (jauh
dari \(\mu\)) jarang terjadi, kumpulan
\(\bar{x}\) dari banyak sampel secara
alami akan membentuk distribusi normal (simetris).
4.3 Aturan Praktis
Penerapan TLP
Pertanyaan kunci adalah: Seberapa besar ukuran
sampel (n) yang dianggap “cukup besar”?
\[Aturan Umum (Rule of Thumb):\]
Aman untuk menerapkan Teorema Limit Pusat ketika ukuran sampel (n) lebih
besar dari atau sama dengan 30 \((n \ge
30)\) .
Ketika \(n \ge 30\), distribusi
sampling dijamin mendekati normal, terlepas dari bentuk populasi
aslinya.
Jika n kecil (kurang dari 30), perkiraan normal menjadi tidak
akurat karena sampel kecil memiliki variabilitas, kurang presisi, dan
berisiko lebih besar menghasilkan sampel yang tidak biasa hanya karena
kebetulan.
4.4 Kasus Pengecualian
dan Persyaratan
Ada satu pengecualian penting terhadap aturan \(n \ge 30:\)
Jika distribusi populasi yang dijadikan sampel sudah
berdistribusi normal sejak awal, maka distribusi sampling dari rata-rata
sampel akan berdistribusi normal meskipun ukuran sampel (n) kecil (yaitu
n < 30).
Oleh karena itu, jika Populasi Normal dan n < 30, Distribusi
Sampling Normal.
Jika Populasi Tidak Normal dan n < 30, TLP Tidak Dapat
diterapkan.
4.5 Kegunaan TLP
Teorema Limit Pusat sangat berguna untuk menganalisis kumpulan
data besar.
Dengan mengetahui bahwa distribusi sampling akan normal, kita
dapat menggunakan semua rumus dan metode yang terkait dengan distribusi
normal (seperti Z-score dan tabel probabilitas) untuk menafsirkan data
dan membuat kesimpulan statistik.
5 Sample Proportion
Video ini membahas konsep Distribusi Sampling Proporsi Sampel
(Sampling Distribution of the Sample Proportion), yang dilambangkan
dengan \(\hat{p}\) (P hat). Konsep ini
merupakan bagian penting dari statistika inferensial dan berbeda dari
distribusi sampling rata-rata \((\bar{x})\) karena fokusnya adalah pada
variabel kategorikal atau probabilitas keberhasilan, bukan variabel
kontinu. Materi ini menjelaskan bagaimana statistik proporsi yang
dihitung dari berbagai sampel akan terdistribusi, serta syarat-syarat
agar distribusi ini dapat diperkirakan sebagai distribusi normal
menggunakan Teorema Limit Pusat (TLP).
5.1 Proporsi dan Notasi
Dasar
Proporsi adalah fraksi atau bagian dari hasil yang “menguntungkan”
(favorable outcomes) relatif terhadap keseluruhan. Hasil yang
menguntungkan adalah variabel apa pun yang sedang dipelajari, seperti
mata hijau, berat badan, atau skor tes.
Rumus Proporsi secara umum adalah: (Jumlah Hasil Menguntungkan)
dibagi (Total Jumlah Hasil).
Dalam statistika, proporsi diwakili oleh simbol yang berbeda
tergantung konteksnya:
Proporsi Populasi dilambangkan dengan P.
Proporsi Sampel dilambangkan dengan \(\hat{p}\).
5.2 Distribusi Sampling
Proporsi \((\hat{p})\)
Distribusi Sampling dibentuk dengan mengambil sampel acak berulang
kali dari populasi, menghitung \(\hat{p}\) untuk setiap sampel, dan kemudian
memplot semua nilai \(\hat{p}\)
tersebut ke dalam sebuah grafik.
Distribusi Sampling Proporsi Sampel adalah distribusi dari statistik
\(\hat{p}\) yang dihasilkan dari proses
pengambilan sampel berulang kali ini.
Nilai \(\hat{p}\) bervariasi dari
satu sampel ke sampel lainnya karena adanya probabilitas dan sifat acak
dalam pengambilan sampel.
5.3 Sifat-Sifat Jika
Distribusi \(\hat{p}\) Normal
Jika distribusi sampling proporsi \((\hat{p})\) berdistribusi normal dan
mengikuti Teorema Limit Pusat, maka akan memiliki sifat-sifat
berikut:
Rata-Rata \((\mu_{\hat{p}})\):
Rata-rata dari semua proporsi sampel \((\hat{p})\) yang digabungkan adalah sama
dengan proporsi populasi sejati P \((\mu_{\hat{p}} = P)\).
Standard Error \((\sigma_{\hat{p}})\): Simpangan baku dari
distribusi sampling proporsi disebut Standard Error dan dihitung
menggunakan rumus:
Di mana n adalah ukuran sampel, P adalah proporsi keberhasilan, dan
1-P (sering dilambangkan Q) adalah proporsi kegagalan.
5.4 Rumus Standarisasi
(Z-score) Proporsi
Untuk menghitung probabilitas (area di bawah kurva) yang terkait
dengan nilai \(\hat{p}\) tertentu, kita
dapat menggunakan rumus Z-score yang disesuaikan untuk proporsi:
Dengan menghitung Z-score, kita dapat menggunakan tabel Z untuk
mencari luasan area (probabilitas) yang diinginkan.
5.5 Syarat Penerapan
Teorema Limit Pusat (TLP)
Syarat agar distribusi sampling proporsi \((\hat{p})\) dapat diperkirakan sebagai
distribusi normal berbeda dengan syarat untuk rata-rata sampel \((\bar{x})\) yang hanya memerlukan \(n \ge\) 30.
Untuk proporsi \((\hat{p})\),
Teorema Limit Pusat dapat diterapkan jika dua kondisi berikut terpenuhi
secara simultan:
\(n \cdot P \ge 10:\) Jumlah
perkiraan keberhasilan harus lebih besar dari atau sama dengan
10.
\(n \cdot (1 - P) \ge 10:\)
Jumlah perkiraan kegagalan harus lebih besar dari atau sama dengan
10.
Jika kedua kondisi ini terpenuhi, maka TLP dapat diterapkan,
distribusi \(\hat{p}\) diasumsikan
normal, dan rumus Z-score di atas dapat digunakan.
6 Review Sampling
Distribution
Video ini berfungsi sebagai ulasan dan perbandingan dari tiga konsep
statistik yang saling terkait—Probabilitas Dasar, Distribusi Binomial,
dan Distribusi Sampling Proporsi Sampel—melalui contoh kasus yang sama:
pengambilan kelereng berwarna. Tujuannya adalah untuk menunjukkan metode
perhitungan yang paling efisien dan tepat tergantung pada ukuran
percobaan (n), mulai dari sampel kecil yang dihitung secara manual
hingga sampel sangat besar yang memerlukan perkiraan Distribusi Normal
berdasarkan Teorema Limit Pusat (TLP).
6.1 Kasus 1: Probabilitas
Dasar (Jumlah Percobaan n Sangat Kecil)
Untuk jumlah percobaan (n) yang sangat kecil (misalnya, menarik
kelereng sebanyak 3 kali), probabilitas dapat dihitung secara manual
dengan membuat daftar seluruh ruang sampel yang mungkin.
Langkah: Hitung probabilitas keberhasilan (P) dan
kegagalan (1-P) terlebih dahulu.
Contoh: Jika probabilitas kelereng hijau (P) adalah
0,4 dan kelereng biru (1-P) adalah 0,6.
Perhitungan: Tentukan semua kombinasi hasil yang
memenuhi syarat (misalnya, mendapatkan minimal dua kelereng hijau).
Probabilitas untuk setiap urutan dihitung dengan mengalikan probabilitas
dari setiap peristiwa independen (misalnya, \(0,4 \times 0,4 \times 0,6\)).
Hasil Akhir: Jumlahkan probabilitas dari semua
urutan yang memenuhi syarat tersebut. Metode ini menghasilkan
probabilitas eksak, tetapi menjadi tidak praktis seiring bertambahnya
jumlah percobaan.
6.2 Kasus 2: Distribusi
Binomial (Jumlah Percobaan n Sedang)
Ketika jumlah percobaan (n) bertambah menjadi ukuran sedang
(misalnya, menarik kelereng sebanyak 5 kali), metode ruang sampel
menjadi tidak efisien. Untuk mendapatkan probabilitas eksak dari jumlah
keberhasilan (k) tertentu, digunakan Rumus Distribusi Binomial.
Penerapan: Jika pertanyaan meminta probabilitas
“minimal” atau “paling banyak” sejumlah keberhasilan, kita perlu
menggunakan rumus Binomial secara berulang untuk setiap nilai k yang
termasuk.
Contoh: Untuk mencari probabilitas minimal 2
kelereng hijau dari 5 tarikan, kita harus menghitung secara terpisah
probabilitas untuk k=2, k=3, k=4, dan k=5, lalu menjumlahkan hasilnya.
Metode ini juga menghasilkan probabilitas eksak, tetapi mulai memakan
waktu jika jumlah k yang harus dihitung banyak.
6.3 Kasus 3: Distribusi
Sampling Proporsi Sampel (Jumlah Percobaan n Besar)
Untuk jumlah percobaan (n) yang sangat besar (misalnya, menarik
kelereng sebanyak 100 kali), baik metode ruang sampel maupun rumus
binomial berulang menjadi tidak mungkin dilakukan. Dalam kasus ini, kita
menggunakan Distribusi Sampling Proporsi sebagai perkiraan (approximate
probability) menggunakan Distribusi Normal.
6.3.1 Verifikasi Syarat
TLP
Sebelum menggunakan perkiraan Normal, kita harus memastikan Teorema
Limit Pusat (TLP) dapat diterapkan untuk proporsi. Dua syarat harus
terpenuhi:
Syarat Keberhasilan: Jumlah keberhasilan yang diharapkan \((n \cdot P)\) harus \(\ge 10.\)
Syarat Kegagalan: Jumlah kegagalan yang diharapkan \((n \cdot (1-P))\) harus \(\ge 10.\)
Jika kedua syarat ini terpenuhi (seperti contoh \(100 \times 0,4 = 40\) dan \(100 \times 0,6 = 60\)), maka distribusi
\(\hat{p}\) dapat diasumsikan
Normal.
6.3.2 Perhitungan dengan
Z-score
Setelah TLP dipastikan berlaku, perhitungan dilakukan menggunakan
Rumus Standarisasi Z-score untuk proporsi:
Tentukan proporsi sampel minimal \((\hat{p})\) yang dicari (misalnya, 35
kelereng hijau dari 100, sehingga \(\hat{p} =
0,35\)).
Hitung Skor Z menggunakan rumus di atas.
Gunakan Tabel Z untuk menemukan luasan area (probabilitas) yang
terkait dengan Skor Z.
Hitung probabilitas yang diminta (misalnya, luas ke kanan untuk
“setidaknya 35”) dengan mengurangkan luas yang ditemukan dari total area
kurva (100% atau 1).
Catatan Penting: Metode ini selalu menghasilkan
probabilitas perkiraan (approximate probability), yang biasanya cukup
akurat untuk tujuan statistik tingkat dasar.