Probabilitas tidak hanya membantu kita memahami seberapa besar
kemungkinan suatu peristiwa terjadi, tetapi juga membentuk dasar dari
banyak metode statistik yang digunakan untuk pengambilan keputusan.
Ketika suatu proses atau eksperimen menghasilkan berbagai hasil, kita
menggunakan variabel acak untuk merepresentasikan hasil tersebut dan
distribusi probabilitas untuk menjelaskan bagaimana probabilitas
ditetapkan untuk setiap nilai yang mungkin. Memahami bentuk dan sifat
distribusi sangat penting karena menentukan bagaimana data berperilaku,
bagaimana kita menghitung probabilitas, dan bagaimana kita membuat
prediksi. Dari distribusi untuk variabel kontinu hingga perilaku
statistik seperti rata-rata sampel, distribusi probabilitas berfungsi
sebagai inti dari statistik inferensial.
2 Acak Berkelanjutan
Perubahan acak merupakan suatu fungsi yang memetakan ruang kejadian
(daerah fungsi) ke ruang bilangan ril (wilayah fungsi). Fungsi perubahan
acak merupakan suatu langkah dalam perubahan acak yang menyatakan
banyaknya sisi angka yang muncul pada lantunan statistika untuk
mengkuantifikasikan kejadian-kejadian alam. Untuk Mendefinisikan fungsi
perubahan acak harus mampu memetakan setiap kejadian dengan tepat ke
satu bilangan ril.
Untuk memahami variabel acak kontinu, penting untuk mengetahui
bagaimana probabilitas direpresentasikan menggunakan Fungsi Kepadatan
Probabilitas (PDF). Tidak seperti variabel acak diskrit, variabel acak
kontinu tidak menetapkan probabilitas ke titik-titik individual.
Sebaliknya, probabilitas diperoleh dari luas area di bawah kurva
PDF.
2.1Variabel
Acak
Suatu variabel acak dikatakan kontinu jika dapat
mengambil nilai apa pun dalam suatu interval pada garis bilangan riil.
Contohnya meliputi: tinggi, waktu, suhu, usia, tekanan, dan
kecepatan.
Karakteristik Utama:
Variabel mengambil nilai dalam interval seperti (π, π) atau bahkan
(ββ, +β).
Probabilitas setiap titik tunggal selalu nol:
\[π (π = π₯) = 0\]
Probabilitas hanya bermakna pada interval tertentu:
\[P(a \leq X \leq b) = \int_{a}^{b} f(x)
\, dx\]
2.1.1Fungsi
Kepadatan Probabilitas
Fungsi π(π₯) merupakan Fungsi Kepadatan Probabilitas (PDF) yang valid
jika memenuhi:
1. Non-negatif:
\[π(π₯) β₯ 0 βx\]
2. Luas Total Sama Dengan 1:
\[\int_{-\infty}^{\infty} f(x) \, dx =
1\]
Interpretasi:
Nilai π(π₯) yang lebih besar menunjukkan kepadatan probabilitas yang
lebih tinggi di sekitar nilai tersebut.
Namun, π(π₯) bukanlah probabilitas: probabilitas
berasal dari area di bawah kurva.
Contoh PDF:\(π(π₯) = 3π₯^2
on [0, 1]\)
Pertimbangkan fungsi kepadatan probabilitas:
\[π(π₯) = 3π₯^2, 0 β€ π₯ β€ 1\]
Validasi:
\[\int_{1}^{0}3π₯^2 ππ₯ = 1\]
2.1.2Probabilitas
pada Interval
Untuk menghitung probabilitas dalam suatu interval.
Melalui distribusi sampel, kita dapat memahami variabilitas statistik
tersebut, mengukur ketidakpastian (standard error), serta membuat
inferensi tentang parameter populasi. Intinya, distribusi sampel
menunjukkan bahwa statistik dari sampel tidak tetap, melainkan
berubah-ubah, tetapi pola perubahan itu dapat diprediksi dan digunakan
sebagai dasar untuk estimasi dan pengujian hipotesis.
Menejelaskan Distribusi Sampling sebagai jembatan penting yang
menghubungkan data dari sampel kecil dengan kesimpulan tentang populasi
besar. Ini adalah konsep inti dalam Statistika Inferensial, yang
memungkinkan kita membuat perkiraan dan menguji hipotesis mengenai
parameter populasi (seperti rata-rata \(\mu\)) tanpa perlu mengukur setiap individu
di dalamnya.
3.1Jenis - jenis
Distribusi
Distribusi Populasi
Merupakan distribusi semua nilai data dari setiap individu di
seluruh populasi.
Didefinisikan oleh Rata-rata Populasi (\(\mu\)) dan Simpangan Baku Populasi (\(\sigma\)).
Distribusi Sampel
Distribusi nilai data dari satu sampel tunggal yang diambil dari
populasi. Distribusi ini memiliki variabilitas yang besar.
Ini adalah distribusi yang dibuat dari statistik (misalnya,
rata-rata \(\bar{x}\)) yang dihitung
dari banyak sampel acak yang diambil berulang kali dari populasi yang
sama.
Menyediakan model teoritis yang memungkinkan kita mengukur
seberapa mungkin hasil sampel kita (misalnya, rata-rata \(\bar{x}\)) terjadi, sehingga kita dapat
membuat kesimpulan tentang \(\mu\).
3.2Sifat-Sifat Kunci
Distribusi Sampling
Rata-rata Distribusi Sampling
Rata-rata dari semua rata-rata sampel yang mungkin diambil selalu
sama dengan rata-rata populasi aslinya. Artinya, rata-rata sampel kita
merupakan penduga tak bias (unbiased estimator) dari rata-rata
populasi.
Rumus Rata-rata Distribusi Sampling:
\[\mu_{\bar{x}} = \mu \quad
\text{}\]
Simpangan Baku Distribusi Sampling
Simpangan baku Distribusi Sampling, yang disebut Galat Baku
(\(\sigma_{\bar{x}}\)), selalu lebih
kecil daripada simpangan baku populasi (\(\sigma\)). Galat Baku yang lebih kecil
menunjukkan bahwa rata-rata sampel (\(\bar{x}\)) memiliki variabilitas yang lebih
sedikit dibandingkan dengan nilai individual (\(X\)) dari populasi. Dengan kata lain,
rata-rata sampel cenderung berkumpul (kurva Distribusi Sampling lebih
sempit) di sekitar rata-rata populasi (\(\mu\)).
Keterangan:\(\sigma\) adalah simpangan baku populasi,
dan \(n\) adalah ukuran sampel.
3.3Teorema Limit
Pusat
Jika populasi sudah berdistribusi normal, distribusi sampling
akan selalu normal untuk ukuran sampel \(n\) berapapun.
Jika populasi TIDAK berdistribusi normal, distribusi sampling
rata-rata (\(\bar{x}\)) akan cenderung
normal seiring bertambahnya ukuran sampel (\(n\)), biasanya ketika \(n \geq 30\).
3.4Rumus
Standardisasi untuk Perhitungan Probabilitas
Untuk Nilai Individu (Populasi)
Digunakan ketika pertanyaan mengacu pada satu individu atau
seluruh populasi.
Rumus Z-score Poupulasi:
\[\ Z = \frac{X - \mu}{\sigma} \quad
\]
Untuk Rata-Rata Sampel (Distribusi Sampling)
Digunakan ketika pertanyaan mengacu pada rata-rata dari
sekelompok sampel.
Rumus Z-score Distribusi Sampling:
\[\text Z = \frac{\bar{X} - \mu}{\sigma /
\sqrt{n}} \quad \]
3.5Contoh Soal β
Distribusi Sampling Rata-rata
Sebuah populasi mempunyai rata-rata:
\[π=50ΞΌ=50\]
Dan simpangan baku populasi:
\[π=12\]
Kita mengambil sampel acak sederhana dengan
ukuran:
\[π=36\]
Pertanyaan:
Berapa rata-rata distribusi sampling dari rata-rata
sampel?
Berapa standard error (SE) distribusi sampling dari rata-rata
sampel?
Jika kita mengambil banyak sampel acak ukuran 36, nilai rata-rata
sampel yang diperoleh akan cenderung mendekati distribusi apa?
Penyelesaian:
Rata-rata Distribusi Sampling:
\[\mu_{\bar{X}} = \mu\]
\[= 50\]
Standard Error (SE):
\[ SE = \frac{\sigma}{\sqrt{n}}
\]
Hitung:
\[ SE = \frac{12}{\sqrt{36}}\]
\[= \frac{12}{6}\]
\[= 2\]
Bentuk Distribusi Sampling:
Karena ukuran sampel cukup besar (n = 36 β₯ 30), maka
menurut Teorema Limit Pusat, distribusi sampling dari rata-rata sampel
akan mendekati:
\[Distribusi Normal\]
4 Teorema Batas
Pusat
Teorema Batas Pusat menyatakan bahwa rata-rata sampel dari banyak
sampel acak akan membentuk distribusi yang mendekati normal, meskipun
data asalnya tidak normal, jika ukuran sampel cukup besar. Hal ini
memungkinkan kita menggunakan distribusi normal untuk membuat estimasi
dan pengujian statistik karena rata-rata sampel cenderung mendekati
rata-rata populasi dengan variasi yang semakin kecil saat ukuran sampel
meningkat.
CLT adalah salah satu teorema paling fundamental dalam statistik
inferensial, yang berfungsi sebagai dasar untuk pengujian hipotesis dan
pembuatan interval kepercayaan.
Berfokus pada Teorema Limit Pusat (CLT), yang merupakan prinsip yang
menjelaskan dan memprediksi bentuk dari Distribusi Sampling (Distribusi
Pengambilan Sampel). CLT menghilangkan batasan bentuk Distribusi
Populasi asli dan memungkinkan analisis statistik yang lebih luas.
4.1Inti dan Definisi
Teorema Limit Pusat
Teorema Limit Pusat pada dasarnya memprediksi bentuk Distribusi
Sampling dari Rata-rata Sampel (\(\bar{X}\)).
Definisi Utama:Jika ukuran sampel (\(n\)) cukup besar, maka Distribusi Sampling
dari Rata-rata Sampel (\(\bar{X}\))
akan berdistribusi mendekati Normal, terlepas dari bentuk Distribusi
Populasi aslinya.
Jika populasi asalnya sangat miring (skewed), Distribusi Sampling
yang Anda buat dari rata-rata-rata sampel tersebut akan berbentuk
lonceng (Normal).
4.2Aturan Praktis
Ukuran Sampel
Kapan \(n\) dianggap βcukup
besarβ untuk menerapkan CLT?
Aturan Umum: Umumnya disepakati bahwa aman untuk menerapkan
Teorema Limit Pusat ketika ukuran sampel (\(n\)) lebih besar atau sama dengan 30 (\(n \ge 30\)).
Implikasi: Jika \(n \ge 30\),
kita dapat mengasumsikan Distribusi Sampling adalah Normal, dan oleh
karena itu, kita dapat menggunakan semua rumus dan metode yang terkait
dengan Distribusi Normal (misalnya, Z-score).
4.3Logika Dibalik
Transformasi Bentuk Kurva
Mengapa Distribusi Sampling menjadi normal bahkan jika
populasi asalnya miring:
Pengambilan Sampel Acak: Karena proses pengambilan sampel adalah
acak, rata-rata sampel (\(\bar{X}\))
dari berbagai sampel cenderung mendekati Rata-rata Populasi (\(\mu\)) yang sebenarnya.
Keseimbangan: Sampel yang diambil dari βbulkβ (bagian terbesar)
populasi akan lebih sering terjadi daripada sampel ekstrem. Rata-rata
(\(\bar{X}\)) bertindak sebagai titik
penyeimbang (balancing point) untuk setiap sampel.
Variabilitas: Ketika semua \(\bar{X}\) ini diplot, meskipun beberapa
\(\bar{X}\) mungkin jauh dari \(\mu\) (sampel yang tidak biasa), sebagian
besar \(\bar{X}\) akan terkumpul rapat
di sekitar \(\mu\). Pengumpulan yang
ketat inilah yang menciptakan bentuk lonceng (Distribusi Normal) yang
simetris di sekitar \(\mu\).
4.4Pengecualian dan
Batasan CLT
Populasi Sudah Normal
Jika Populasi awal sudah berdistribusi Normal, maka Distribusi
Sampling juga akan berdistribusi Normal, terlepas dari ukuran sampel
(\(n\)).
Catatan Praktis: Meskipun Distribusi Sampling tetap Normal dengan
\(n < 30\), ukuran sampel kecil
(\(n\) kecil) tetap menghasilkan
perkiraan yang kurang akurat dan memiliki variabilitas (variability)
yang lebih besar. Oleh karena itu, ukuran sampel besar (\(n \ge 30\)) tetap disarankan dalam
praktik.
Populasi Tidak Normal dan \(n <
30\)
Jika Populasi tidak Normal dan ukuran sampel kecil (\(n < 30\)), maka CLT tidak dapat
diterapkan.
Implikasi: Distribusi Sampling dalam kasus ini tidak dapat
diasumsikan Normal, dan metode statistik inferensial standar tidak dapat
digunakan secara akurat.
4.5Pentingnya
CLT
Memungkinkan Inferensi: Dengan mengetahui bahwa Distribusi
Sampling adalah Normal (ketika \(n\)
besar), kita dapat menggunakan probabilitas standar dan rumus Z-score
untuk menginterpretasikan data sampel besar.
Mendasari Metode: CLT adalah fondasi teoritis untuk banyak metode
statistik, termasuk menghitung margin of error (batas kesalahan) dan
membuat interval kepercayaan. Ini memungkinkan para ahli statistik untuk
membuat kesimpulan yang andal tentang populasi besar hanya dari
sampel.
5 Proporsi Sampel
Proporsi sampel adalah ukuran yang menunjukkan bagian atau persentase
suatu karakteristik dalam sampel dan digunakan untuk memperkirakan
proporsi populasi sebenarnya. Nilai ini dapat berubah-ubah antar sampel
karena proses pengambilan sampel, namun semakin besar ukuran sampel,
proporsi sampel cenderung semakin mendekati nilai populasi. Melalui
distribusi proporsi sampel, kita dapat melakukan inferensi statistik
seperti membuat interval kepercayaan dan menguji hipotesis tentang
proporsi populasi.
Menjelaskan bahwa ketika kita mengambil banyak sampel dari suatu
populasi yang memiliki proporsi sebenarnya, setiap sampel akan
menghasilkan nilai proporsi sampel yang berbeda-beda, disebut (sample
proportion). Kumpulan seluruh nilai tersebut akan membentuk suatu pola
atau distribusi sampling, yang menggambarkan bagaimana proporsi sampel
berubah-ubah dari satu sampel ke sampel lainnya.
Distribusi ini memiliki rata-rata yang selalu sama dengan proporsi
populasi sedangkan penyebarannya (simpangan baku) mengikuti rumus yang
berarti bahwa semakin besar ukuran sampel semakin kecil variasi antara
satu proporsi sampel dengan yang lain. Ketika ukuran sampel cukup besar,
distribusi akan mendekati distribusi normal, sehingga kita dapat
menggunakan Z-score untuk menghitung peluang suatu proporsi sampel
berada di bawah atau di atas nilai tertentu.
Proporsi sampel bukanlah angka pasti tetapi nilai yang bervariasi,
dan variasi itu dapat diprediksi secara matematis sehingga memungkinkan
kita melakukan inferensi statistik terhadap populasi hanya berdasarkan
sampel.
5.1Konsep
Dasar
Apa itu Distribusi Sampling
Distribusi sampling melibatkan pengambilan sampel berulang kali
dari suatu populasi.
Untuk setiap sampel, dihitung statistik tertentu (seperti \(\bar{x}\) atau \(\hat{P}\)), dan kemudian semua informasi
ini digabungkan dalam bentuk grafik untuk membuat sebuah
distribusi.
Apa itu Proporsi
Dalam statistika, proporsi menggambarkan pecahan dari hasil yang
menguntungkan (favorable outcomes) dalam kaitannya dengan
keseluruhan.
Rumus umum proporsi: Jumlah Hasil yang Menguntungkan / Jumlah
Total Hasil.
\[\hat{P} = \frac{x}{n}\]
Di mana:
\(x\) = Jumlah βsuksesβ atau
jumlah unit dalam sampel yang memiliki karakteristik yang dicari
(disebut juga hasil yang menguntungkan).
\(n\) = Ukuran sampel (jumlah
total unit yang diamati dalam sampel).
Contoh Ilustrasi: Misalnya, kita ingin mengetahui
proporsi pemilih di suatu kota yang mendukung Calon A (\(P\)). Karena tidak mungkin mensurvei
seluruh populasi, kita mengambil sampel acak 200 pemilih (\(n=200\)).
Jika 110 pemilih dalam sampel tersebut mendukung Calon A (\(x=110\)), maka:
\[\hat{P} = \frac{110}{200} =
0.55\]
Proporsi sampel pemilih yang mendukung Calon A adalah
0.55 atau 55%.
Simbol untuk Proporsi
Proporsi dalam Populasi dilambangkan dengan simbol \(P\).
Proporsi dalam Sampel dilambangkan dengan simbol \(\hat{P}\) (P-topi/P-hat).
5.2Distribusi
Sampling dari Proporsi Sampel (\(\hat{P}\))
Jika sampel diambil berulang kali dari populasi yang sama dan
\(\hat{P}\) dihitung untuk setiap
sampel, hasilnya akan bervariasi.
Distribusi Sampling dari Proporsi Sampel adalah distribusi yang
dibuat dari semua nilai \(\hat{P}\)
yang berbeda ini.
5.3Karakteristik
Distribusi
Rata-rata (\(\text{Mean}\)):
Rata-rata dari semua \(\hat{P}\)
(dinotasikan sebagai \(\mu_{\hat{P}}\))
sama dengan proporsi populasi \(P\)
Rumusnya:
\[\mu_{\hat{P}} = P\]
Simpangan Baku (\(\text{Standard
Deviation}\)):
Rumusnya:
\[\sigma_{\hat{P}} = \sqrt{\frac{P
Q}{n}}\]
\(n\): Ukuran sampel.
\(P\): Proporsi hasil
sukses.
\(Q\): Proporsi hasil tidak
sukses, di mana \(Q = 1 - P\).
Agar Distribusi Sampling dari Proporsi Sampel dapat dianggap normal
(sehingga tabel skor-Z dapat digunakan) ada dua kondisi:
\(n \cdot P \geq 10\)
\(n \cdot (1 - P) \geq
10\)
6 Tinjauan Distribusi
Sampel
Tinjauan distribusi sampel menggambarkan bagaimana statistik
sampelβseperti rata-rata, proporsi, atau variansiβakan berperilaku jika
kita mengambil banyak sampel acak dari suatu populasi. Distribusi ini
penting karena menunjukkan pola variasi alami yang terjadi akibat proses
pengambilan sampel, bukan karena perubahan pada populasi. Melalui
distribusi sampel, kita dapat memahami seberapa dekat nilai statistik
sampel dengan parameter populasi yang sebenarnya, serta seberapa besar
ketidakpastian yang muncul dalam estimasi. Konsep ini menjadi dasar bagi
inferensi statistik, termasuk pembentukan interval kepercayaan dan
pengujian hipotesis, karena memberikan gambaran bahwa meskipun nilai
sampel dapat berubah-ubah, pola distribusinya tetap mengikuti aturan
tertentu, misalnya mendekati distribusi normal berdasarkan Teorema Limit
Pusat.
Berfungsi sebagai ulasan untuk menyatukan konsep-konsep dasar
probabilitas, Distribusi Binomial, dan Distribusi Sampel dari Proporsi
Sampel (Sampling Distribution of the Sample Proportion) melalui
soal-soal latihan.
6.1Ulasan
Probabilitas Dasar
Masalah probabilitas dasar:
Jika sebuah wadah berisi 200 kelereng hijau (Green) dan 300 kelereng
biru (Blue), berapa probabilitas menarik setidaknya dua kelereng hijau
dalam tiga kali pengambilan dengan pengembalian?
Probabilitas Sukses (P) / Kelereng Hijau:
\[200 / 500 = 0.4\]
Probabilitas Gagal (Q) / Kelereng Biru:
\[300 / 500 = 0.6\]
Untuk mendapatkan setidaknya dua kelereng hijau, kita perlu
menghitung probabilitas untuk tepat dua kelereng hijau ditambah
probabilitas untuk tepat tiga kelereng hijau.
Probabilitas Tepat Dua Hijau: Menjumlahkan semua kemungkinan urutan
(GGB, GBG, BGG).
\[0.096 + 0.096 + 0.096 =
0.288\]
Probabilitas Tepat Tiga Hijau (GGG):
\[0.4 \times 0.4 \times 0.4 =
0.064\]
Total Probabilitas (Setidaknya Dua Hijau):
\[0.288 + 0.064 = 0.352\]
6.2Distribusi
Binomial
Jika jumlah percobaan (pengambilan) ditingkatkan menjadi lima kali,
menghitung semua kemungkinan urutan akan memakan waktu.
Untuk kasus ini, digunakan Formula Binomial untuk menghitung
probabilitas jumlah sukses (k) yang tepat:
\[P(X=k) = C(n, k) \cdot p^k \cdot
(1-p)^{n-k}\]
Dalam contoh ini (\(n=5, p=0.4\)),
probabilitas setidaknya dua kelereng hijau dihitung dengan menjumlahkan
probabilitas untuk \(k=2, k=3, k=4,\)
dan \(k=5\).
Setiap probabilitas dihitung menggunakan Formula Binomial
(misalnya, untuk \(k=2\),
probabilitasnya adalah 0.3456.
Setelah perhitungan, semua nilai dijumlahkan. Hasil akhir
probabilitasnya adalah 0.6634
6.3Distribusi Sampel
Proporsi
Jika jumlah percobaan ditingkatkan secara signifikan, misalnya
menarik kelereng 100 kali, menggunakan Formula Binomial secara berulang
(65 kali, dari 35 hingga 100 sukses) menjadi tidak praktis.
Solusinya adalah menggunakan Distribusi Sampel Proporsi dengan
Pendekatan Normal melalui Teorema Batas Pusat (Central Limit
Theorem).