~ Probability Distribution ~
1 Continuous Random
1.1 Gambaran Umum
Pada materi ini dibahas dua konsep inti dalam statistik probabilistik, yaitu:
- Variabel acak diskrit (discrete random variable)
- Variabel acak kontinu (continuous random variable)
Kedua konsep ini adalah fondasi bagi distribusi peluang, normal
distribution, z-score, dan inferensi statistik.
Untuk memahami peluang, kita harus tahu dulu jenis
variabelnya, karena cara menghitung probabilitas berbeda
total.
1.2 Variabel Acak Diskrit
1.2.1 Definisi
Variabel acak diskrit adalah variabel yang nilai‐nilainya dapat dihitung satu per satu. Nilainya berasal dari kegiatan menghitung (counting), bukan mengukur.
Suatu nilai dikatakan diskrit bila memungkinkan untuk menyebutkan semua probabilitas pada setiap titiknya.
1.3 Contoh Kasus Nyata
| Situasi | Data | Alasan Diskrit |
|---|---|---|
| Jumlah anak dalam keluarga | 0,1,2,3,… | Tidak ada “2.63 anak” |
| Hasil lempar koin 3x | 0-3 kepala | Hasil terbatas dan bisa dihitung |
| Nilai ujian | 0-100 | Masih merupakan hasil hitungan |
| Banyak pelanggan datang per jam | 1,2,3,… | Satuan individu dapat dihitung |
Meskipun nilai bisa desimal, selama masih merupakan hasil hitungan, maka tetap diskrit.
1.4 Konsep Probabilitas Diskrit
\[ P(X = x) = f(x) \]
Semua peluang harus berjumlah 1:
\[ \sum_{x}P(X=x)=1 \]
1.4.1 Makna rumus:
Jika daftar peluang tidak berjumlah 1 → model salah atau tidak lengkap.
1.5 Model Matematika Untuk Variabel Diskrit
1.5.1 Distribusi Binomial
Digunakan ketika:
✔ terdapat dua kemungkinan hasil (success/failure)
✔ percobaan independen
✔ peluang tiap percobaan konstan
\[ P(X=k)=\binom{n}{k}p^k(1-p)^{n-k} \]
1.5.2 Contoh Numerik
Lempar koin 4 kali, peluang keluar kepala = 0.5
\(P(X=2)=\binom{4}{2}(0.5)^2(0.5)^2=0.375\)
Artinya peluang tepat 2 kepala dalam 4 lemparan adalah 37.5%
1.6 Variabel Acak Kontinu
1.6.1 Definisi
Variabel acak kontinu adalah variabel yang nilai‐nilainya tak terbatas dan tidak dapat dihitung satu per satu, karena berasal dari pengukuran.
Contoh variabel yang bersifat kontinu:
| Contoh | Bentuk Nilai | Mengapa Kontinu |
|---|---|---|
| Berat badan | 45.52 kg, 45.5213 kg | Bisa terus diperinci |
| Suhu | 30.0°C → 30.001°C → dst | Nilai real tak terbatas |
| Umur | 21.45 tahun | Hasil pengukuran dengan precision |
| Waktu tempuh | 5.2 detik, 5.20041 detik | Tidak berhenti pada angka bulat |
Karena dapat dipecah hingga ketelitian tak hingga, nilai tersebut tak mungkin dihitung satu per satu.
1.6.2 Konsep Peluang Pada Variabel Kontinu
Berbeda dari diskrit, peluang titik tunggal kontinu selalu 0:
\[ P(X = x)=0 \]
Maka peluang dihitung dalam bentuk rentang (interval):
\[ P(a\le X\le b)=\int_a^b f(x)\,dx \]
1.6.3 Makna:
Yang berarti bukan nilai tunggal yang memiliki probabilitas —
melainkan luas area di bawah kurva untuk sebuah
interval.
1.7 Probability Density Function (PDF)
Untuk variabel kontinu berlaku fungsi kerapatan probabilitas (density function).
Ciri PDF yang sah:
\[ f(x) \ge 0 \quad \forall x \]
\[ \int_{-\infty}^{\infty}f(x)\,dx=1 \]
Total area kurva = total kemungkinan = 1 → berlaku universal.
1.8 Distribusi Normal (Fondasi Statistik Lanjut)
Distribusi normal berbentuk simetris, rata-rata (μ) di tengah, dan
sebaran ditentukan deviasi standar (σ).
Inilah rumus fungsi kepadatannya:
\[ f(x)=\frac{1}{\sigma\sqrt{2\pi}} \exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right) \]
Distribusi ini akan mendominasi materi lanjutan karena:
- Digunakan dalam penghitungan z-score
- Digunakan untuk confidence interval & uji hipotesis
- Menjadi dasar Central Limit Theorem dan Sampling Distribution
1.9 PERBEDAAN DISKRIT VS KONTINU — RINGKAS & TAJAM
| Aspek | Diskrit | Kontinu |
|---|---|---|
| Cara perolehan data | Menghitung | Mengukur |
| Nilai | Dapat dihitung satu per satu | Tak hingga |
| Probabilitas | Penjumlahan \(\sum P(x)=1\) | Integral \(\int f(x)=1\) |
| Peluang pada titik | Bisa > 0 | Selalu = 0 |
| Fokus peluang | Titik nilai tertentu | Interval rentang nilai |
| Contoh distribusi | Binomial, Geometrik, Poisson | Normal, Eksponensial, Gamma |
1.10 Kesimpulan Utama Materi
Diskrit = Countable.
Peluang menggunakan penjumlahan, contoh Binomial.Kontinu = Measurable tak hingga.
Peluang menggunakan integral, diukur melalui area PDF.Distribusi normal menjadi pusat pembahasan lanjutan, karena seluruh analisis inferensi statistik modern berporos di atasnya.
2 Sampling Distributions
2.1 Pendahuluan
Dalam kajian statistika inferensial, distribusi sampling (sampling distribution) adalah konsep yang sangat penting karena menjadi dasar bagi pengujian hipotesis dan estimasi parameter populasi. Sebelum membahas lebih jauh tentang distribusi sampling, terlebih dahulu perlu dipahami perbedaan antara:
- Distribusi Populasi
- Distribusi Sampel (Sample Distribution)
- Distribusi Sampling (Sampling Distribution)
Tujuan utama mempelajari distribusi sampling adalah agar kita dapat memperkirakan parameter populasi hanya dengan menggunakan data sampel, tanpa harus mengukur seluruh elemen populasi yang jumlahnya bisa sangat besar.
2.2 Populasi, Sampel, dan Distribusi Sampel
Populasi adalah keseluruhan objek yang menjadi perhatian penelitian. Sampel adalah sebagian kecil dari populasi yang diambil dengan metode tertentu untuk digunakan dalam perhitungan dan penarikan kesimpulan.
Contoh:
Terdapat populasi 10.000 orang, dengan tinggi rata-rata
populasi:
\[ \mu = 5'4" \approx 162.56\text{ cm} \]
Jika kita mengambil sampel secara acak, rata-rata sampel tidak selalu sama dengan rata-rata populasi. Misalnya:
| Sampel Ke | Rata-rata (x̄) |
|---|---|
| 1 | 5.3 ft |
| 2 | 5.7 ft |
| 3 | 5.4 ft |
Ini menunjukkan variabilitas karena sampel hanya sebagian kecil populasi, sehingga kemungkinan berbeda dari nilai populasi sebenarnya.
2.3 Distribusi Sampling
Distribusi sampling adalah distribusi probabilitas dari suatu statistik (umumnya rata-rata sampel x̄) yang diperoleh dari banyak sampel acak ukuran n.
Langkah konseptual pembentukan distribusi sampling:
- Tentukan populasi yang ingin diamati.
Misal variabel tinggi badan. - Ambil sampel acak sederhana berukuran n. Contoh n = 5.
- Hitung rata-rata sampel:
\[ \bar{X} = \frac{1}{n} \sum_{i=1}^{n} X_i \]
- Ulangi pengambilan sampel ratusan hingga ribuan kali.
- Plot semua \(\bar{X}\) dalam histogram → itulah distribusi sampling rata-rata sampel (x̄).
Jika jumlah sampel cukup besar, distribusi sampling akan cenderung berdistribusi normal, sesuai Teorema Limit Tengah (Central Limit Theorem / CLT).
2.4 Perbandingan Penting
2.4.1 Distribusi Populasi
Memiliki parameter:
\[ \mu = \text{mean populasi}, \qquad \sigma = \text{simpangan baku populasi} \]
Jika variabel \(X\) ~ Normal(\(\mu, \sigma\)), maka:
\[ Z = \frac{X - \mu}{\sigma} \]
2.4.2 Distribusi Sampling (Rata-rata Sampel)
Karakteristik penting:
\[ \mu_{\bar{X}} = \mu \]
\[ \sigma_{\bar{X}} = \frac{\sigma}{\sqrt{n}} \quad \text{(Standard Error)} \]
Standard Error lebih kecil daripada σ karena rata-rata sampel lebih stabil dibanding observasi individual.
Standardisasi distribusi sampling:
\[ Z = \frac{\bar{X} - \mu}{\sigma / \sqrt{n}} \]
2.5 Contoh Soal Lengkap
Misal tinggi badan penduduk Kanada berdistribusi normal dengan:
\[ \mu = 160 \text{ cm}, \qquad \sigma = 7 \text{ cm} \]
2.5.1 Probabilitas rata-rata 10 orang < 157 cm
Ukuran sampel:
\[ n = 10 \]
Standard Error:
\[ SE = \frac{7}{\sqrt{10}} = 2.21 \]
Hitung Z-score:
\[ Z = \frac{157 - 160}{2.21} = -1.36 \]
Dari tabel Z:
\[ P(Z < -1.36) = 0.0869 \]
Maka peluang rata-rata tinggi tubuh 10 orang <157 cm adalah 8.69%.
2.5.2 Probabilitas tinggi individu >170 cm
Karena ini individu, bukan rata-rata sampel → gunakan rumus populasi:
\[ Z = \frac{170 - 160}{7} = 1.43 \]
Dari tabel:
\[ P(Z < 1.43) = 0.9236 \]
Maka:
\[ P(X > 170) = 1 - 0.9236 = 0.0764 \]
Artinya hanya sekitar 7.64% populasi memiliki tinggi badan >170 cm.
2.6 Kesimpulan Utama
| Konsep | Karakteristik |
|---|---|
| Distribusi Populasi | Menggambarkan seluruh anggota populasi |
| Distribusi Sampel | Menggambarkan data dalam satu sampel |
| Distribusi Sampling | Dibangun dari banyak sampel — dasar estimasi statistik |
Keuntungan penggunaan distribusi sampling:
✔ Hemat biaya, waktu dan tenaga
✔ Bisa memperkirakan parameter populasi
✔ Dapat menghitung peluang berdasarkan ukuran sampel
✔ Mendukung inferensi statistik (uji-hipotesis, interval estimasi,
CLT)
3 Central Limit Theorem
3.1 Pendahuluan
Central Limit Theorem (CLT) atau Teorema Limit Pusat adalah salah satu konsep paling fundamentaI dalam statistik. CLT menjelaskan bagaimana rata-rata sampel dapat merefleksikan populasi, serta mengapa banyak metode statistik (uji hipotesis, confidence interval, regresi) dapat digunakan meskipun data tidak selalu normal.
Kita akan membedah CLT dari dasar → ilustrasi → rumus matematis → contoh nyata → interpretasi logis.
3.2 Sebelum Masuk ke CLT: Apa itu Distribusi Sampling?
Bayangkan kita memiliki sebuah populasi (misal: tinggi badan seluruh siswa di SMA). Kita tidak mungkin mengukur semua orang setiap saat. Maka, kita ambil sampel berulang kali.
Prosesnya:
1. Ambil sampel acak ukuran \(n\) dari
populasi
2. Hitung rata–rata sampel \(\bar{X}\)
3. Ulangi langkah 1 dan 2 berkali-kali
4. Semua \(\bar{X}\) dikumpulkan →
terbentuk distribusi sampling mean
3.3 Rumus Dasar Rata–Rata Sampel
\[ \bar{X} = \frac{1}{n} \sum_{i=1}^{n} X_i \]
Penjelasan sederhana:
| Simbol | Makna |
|---|---|
| \(X_i\) | nilai data ke-i dalam sampel |
| \(n\) | ukuran sampel |
| \(\bar{X}\) | nilai rata-rata sampel |
Semakin sering proses pengambilan sampel dilakukan, semakin terlihat pola distribusinya.
3.4 Inti Utama CENTRAL LIMIT THEOREM (CLT)
Tidak peduli bagaimana bentuk distribusi populasi: miring (skewed), loncat, tidak simetris, acak, bahkan kacau —
rata-rata sampel akan membentuk distribusi Normal jika ukuran sampel cukup besar.
Secara matematis:
\[ \bar{X} \sim N\left(\mu,\frac{\sigma^2}{n}\right) \]
Dengan ketentuan utama:
| Kondisi | CLT Berlaku |
|---|---|
| \(n \ge 30\) | ✔ Hampir selalu normal |
| Populasi sudah normal | ✔ Meskipun \(n < 30\) |
| \(n < 30\) & populasi tidak normal | ❌ Tidak aman gunakan CLT |
3.4.1 Makna Rumus CLT (Super jelas dan lugas)
| Rumus | Arti | Dampak Statistik |
|---|---|---|
| \(\mu_{\bar{X}} = \mu\) | rata-rata sampel mendekati rata-rata populasi | estimator tidak bias |
| \(\sigma_{\bar{X}} = \frac{\sigma}{\sqrt{n}}\) | semakin banyak sampel → semakin kecil error | hasil semakin presisi |
| \(\bar{X} \sim N(\mu,\sigma^2/n)\) | mean sampel akhirnya berdistribusi normal | bisa analisis memakai Z, CI, uji t |
3.5 Standard Error (SE)
\[ SE = \frac{\sigma}{\sqrt{n}} \]
📌 Makna paling sederhana:
SE adalah ukuran seberapa jauh rata-rata sampel bisa bergeser dari mean populasi.
SE kecil = data stabil & akurat
SE besar = estimasi berisik dan kurang dapat dipercaya
3.6 Konversi Mean Sampel ke Z-score
Jika ingin mencari peluang \(\bar{X}\) terjadi pada nilai tertentu:
\[ Z = \frac{\bar{X}-\mu}{\sigma/\sqrt{n}} \]
Z-score berguna untuk menghitung probabilitas dengan tabel normal.
3.7 Contoh Nyata yang Mudah Dipahami
Misal rata-rata tinggi populasi siswa SMA = 165 cm, σ = 10 cm
Ambil sampel \(n = 40\)
\[ \bar{X} \sim N\left(165,\frac{10^2}{40}\right)=N(165,1.58) \]
Probabilitas rata-rata sampel \(>170\):
\[ Z = \frac{170-165}{10/\sqrt{40}} = 3.16 \]
Nilai Z = 3.16 sangat besar → peluangnya sangat kecil.
Artinya kecil kemungkinan 40 siswa rata–ratanya 170 cm atau lebih.
3.8 Kesimpulan Kuat & Elegan
Central Limit Theorem adalah jembatan yang menghubungkan sampel dengan populasi.
✔ Rata-rata sampel akan mendekati distribusi normal ketika \(n\) cukup besar
✔ Meskipun populasi tidak normal, sampel tetap akan normal → jika \(n\ge30\)
✔ Dari sinilah berbagai metode statistik bisa diterapkan dengan sah
\[ \boxed{\text{CLT = pondasi inferensi statistik modern}} \]
Semakin besar sampel → semakin akurat gambaran populasi.
Tanpa CLT, statistik modern hampir tidak mungkin berjalan.
4 Sample Proportion
4.1 Distribusi Sampling Proporsi
4.2 Konsep Fundamental
Distribusi Sampling Proporsi adalah distribusi probabilitas dari proporsi sampel \(\hat{p}\) yang terbentuk apabila dilakukan banyak pengambilan sampel dari populasi yang memiliki proporsi sebenarnya \(p\) dengan ukuran sampel \(n\) yang sama.
Ilustrasi sederhana:
Misalkan terdapat koin tidak seimbang dengan peluang muncul kepala \(p = 0.6\). Kita melemparnya sebanyak 10
kali dan mencatat \(\hat{p}\). Jika
eksperimen ini diulang 1000 kali, nilai-nilai \(\hat{p}\) membentuk suatu
distribusi sampling proporsi.
4.3 Rumus-Rumus Dasar
4.3.1 📌 Mean Distribusi Sampling
\[ \mu_{\hat{p}} = p \]
4.3.2 📌 Standard Error (variabilitas antar sampel)
\[ \sigma_{\hat{p}} = \sqrt{\frac{p(1 - p)}{n}} \]
SE ≠ SD.
SE menggambarkan variasi antar sampel, bukan variasi dalam satu sampel.
4.3.3 📌 Transformasi ke Z-score
Jika syarat normalitas terpenuhi: \[ z = \frac{\hat{p} - p}{\sqrt{\frac{p(1 - p)}{n}}} \]
4.3.4 📌 Jika \(p\) belum diketahui
\[ SE = \sqrt{\frac{\hat{p}(1 - \hat{p})}{n}} \]
4.4 Syarat Normalitas (Wajib sebelum pakai Z)
| Syarat | Penjelasan |
|---|---|
| Sampling acak & independen | Observasi tidak saling mempengaruhi |
| \(n \le 0.1N\) | Jika sampling tanpa pengembalian |
| \(np ≥ 10\) dan \(n(1-p) ≥ 10\) | Agar distribusi mendekati Normal |
| Ukuran sampel besar dianjurkan | Namun aturan utama tetap \(np≥10\) |
Alasan batas 10: agar distribusi Binomial cukup simetris sehingga pendekatan Normal valid.
4.5 Central Limit Theorem (CLT) pada Proporsi
Jika sampel besar:
\[ \hat{p} \sim N\left(p,\; \frac{p(1-p)}{n}\right) \]
Interpretasi:
- Sampel besar → \(\hat{p}\) makin dekat ke \(p\)
- Varians mengecil seiring \(n\) meningkat
- Estimasi lebih stabil dan akurat
4.6 Contoh dan Studi Kasus
4.6.1 📍 Contoh 1 — Kontrol Kualitas Pabrik
Klaim cacat = \(p = 0.02\)
Sampel = 500 produk, cacat = 18
\[ \hat{p}=\frac{18}{500}=0.036 \] \[ np=10,\quad n(1-p)=490 \Rightarrow syarat normalitas terpenuhi \] \[ \sigma_{\hat{p}}=\sqrt{\frac{0.02\times0.98}{500}}=0.00626 \] \[ z=\frac{0.036-0.02}{0.00626}=2.56 \] \[ P(Z>2.56)=0.0052 \]
Interpretasi: kemungkinan hasil seperti ini hanya 0.52% → klaim mungkin tidak benar.
4.6.2 📍 Contoh 2 — Survei Politik
Nasional: 45% mendukung calon A
Provinsi X: 400 responden, 200 mendukung A → \(\hat{p}=0.50\)
\[ \sigma_{\hat{p}}=\sqrt{\frac{0.45\times0.55}{400}}=0.0249 \] \[ z=\frac{0.50-0.45}{0.0249}=2.01 \] \[ P(|Z|>2.01)=0.0444<0.05 \]
Kesimpulan: Dukungan provinsi X berbeda signifikan dari nasional.
4.7 Tabel Formula Inti (Quick Summary)
| Fungsi | Rumus |
|---|---|
| Mean | \(\mu_{\hat{p}}=p\) |
| Standard Error | \(\sigma_{\hat{p}}=\sqrt{\frac{p(1-p)}{n}}\) |
| Z-score | \(z=\frac{\hat{p}-p}{\sigma_{\hat{p}}}\) |
| Margin of Error | \(ME=z_{\alpha/2}\cdot\sigma_{\hat{p}}\) |
| Minimal ukuran sampel | \(n=\frac{z^2p(1-p)}{E^2}\) |
| Pooled proportion | \(p_{pool}=\frac{x_1+x_2}{n_1+n_2}\) |
4.8 Kesalahan Umum
| Kesalahan | Dampak | Solusi |
|---|---|---|
| Tidak mengecek \(np≥10\) | Hasil analisis bias | Selalu cek syarat |
| SE dikira sama dengan SD | Salah interpretasi variasi | SE = antar sampel, SD = dalam sampel |
| Memaksa Normal pada sampel kecil | Hasil tidak akurat | Pakai CLT + syarat |
4.9 Visualisasi Pemahaman
- \(n\) kecil → sebaran melebar
- \(n\) besar → nilai berkumpul di
sekitar mean
- \(p=0.5\) memberi variasi
terbesar
- Semakin jauh \(p\) dari 0.5 → butuh sampel lebih banyak
4.10 Latihan Soal
Sebuah perusahaan asuransi mengklaim 70% klaim selesai ≤7 hari.
Dari sampel 200 klaim ditemukan 130 selesai tepat waktu.
\[ \hat{p}=0.65,\quad p=0.70,\quad n=200 \] \[ \sigma_{\hat{p}}=\sqrt{\frac{0.70\times0.30}{200}}=0.0324 \] \[ z=\frac{0.65-0.70}{0.0324}=-1.54 \] \[ P(Z\le-1.54)=0.0618 \]
Kesimpulan: Tidak cukup bukti untuk menolak klaim perusahaan pada \(\alpha=5\%\).
4.11 Keterhubungan ke Konsep Statistik Lain
| Konsep | Hubungan |
|---|---|
| Distribusi Binomial | \(\hat{p}=X/n,\; X\sim Binomial(n,p)\) |
| Confidence Interval | CI = \(\hat{p}\pm z_{\alpha/2}\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}\) |
| Hypothesis Testing | \(z=\frac{\hat{p}-p_0}{\sqrt{\frac{p_0(1-p_0)}{n}}}\) |
Kesimpulan akhir:
Distribusi sampling proporsi adalah jembatan utama untuk
menghubungkan data sampel menuju inferensi populasi.
5 Review Sampling Distribution
5.1 Pendahuluan
Dalam statistika, kita sering ingin mengetahui kondisi dari suatu
populasi.
Namun, mengukur seluruh populasi biasanya sulit,
memakan biaya, waktu, dan tenaga.
Karena itu peneliti cukup mengambil sampel, yaitu
sebagian dari populasi, untuk dianalisis.
Masalahnya: hasil sampel tidak selalu sama dengan
populasi.
Rata-rata, proporsi, atau nilai statistik lain dapat berubah-ubah jika
sampelnya berbeda.
Di sinilah konsep distribusi sampling menjadi penting.
5.2 Konsep Dasar yang Harus Dipahami Terlebih Dahulu
5.2.1 Populasi
Populasi adalah seluruh objek yang menjadi perhatian
penelitian.
Contoh: - Semua siswa kelas 11 di sekolah - Semua pembeli di sebuah toko
selama satu tahun - Semua penduduk Indonesia
Populasi memiliki parameter, yaitu nilai asli yang menggambarkan karakter populasi, misalnya: - Rata-rata tinggi badan - Rata-rata pendapatan - Proporsi perokok
Nilai parameter biasanya tidak diketahui, dan inilah yang ingin kita perkirakan.
5.2.2 Sampel
Sampel adalah sebagian dari populasi.
Sampel diambil karena lebih mudah, murah, dan cepat untuk
dianalisis.
Contoh: - Dari 10.000 siswa, hanya 100 yang diukur tinggi badannya - Dari seluruh transaksi toko, hanya 50 hari yang diamati - Dari penduduk Indonesia, hanya 2.000 responden disurvei
Sampel memiliki statistik, yaitu nilai yang kita hitung dari sampel: - Rata-rata sampel (\(\bar{X}\)) - Proporsi sampel (\(\hat{p}\)) - Varians sampel (\(S^2\))
Nilai statistik ini digunakan untuk mendekati parameter populasi.
5.3 Perbedaan Penting
| Konsep | Distribusi Sampel (Sample Distribution) | Distribusi Sampling (Sampling Distribution) |
|---|---|---|
| Apa yang dianalisis? | Data dalam satu sampel | Hasil statistik dari banyak sampel |
| Contoh | Tinggi 50 siswa | Rata-rata dari banyak sampel masing-masing 50 siswa |
| Sifat | Berisi nilai individu | Berisi nilai rata-rata/proposi yang berubah-ubah |
| Tujuan | Melihat variasi data real | Memahami variasi hasil sampel tiap pengambilan |
Penjelasan sederhana:
Distribusi sampel → data mentah dalam satu sampel
Distribusi sampling → bagaimana nilai statistik berubah antar sampel berbeda
5.4 Apa Itu Distribusi Sampling?
Distribusi sampling adalah distribusi dari statistik sampel, seperti rata-rata atau proporsi, ketika kita mengambil banyak sampel dari populasi yang sama.
Misal: - Populasi = 10.000 orang - Tinggi rata-rata populasi = 165
cm
- Kita ambil sampel 100 orang secara acak → hitung rata-rata - Ulangi
100 kali → kita akan mendapatkan 100 nilai rata-rata
Nilai rata-rata ini tidak sama, dan penyebarannya membentuk distribusi sampling.
5.5 Mengapa Distribusi Sampling Penting?
Karena kita tidak mungkin mengambil semua orang dalam populasi, maka kita perlu memprediksi sebaran hasil sampel.
Dengan distribusi sampling kita dapat:
✔ Mengetahui seberapa besar variasi hasil sampel
✔ Mengukur ketidakpastian estimasi
✔ Membuat inferensi statistik (uji hipotesis,
confidence interval, estimasi mean)
Tanpa pemahaman ini, analisis statistik akan salah arah.
5.6 Rumus-Rumus Penting
5.6.1 Mean (Rata-rata Sampel)
\[ \bar{X} = \frac{\sum X}{n} \]
Penjelasan: - Tambahkan semua nilai dalam sampel - Bagi dengan jumlah data \(n\) - Hasilnya adalah rata-rata sampel, bukan populasi
5.6.2 Standard Error (SE)
\[ SE = \frac{\sigma}{\sqrt{n}} \]
Di mana: - \(\sigma\) = standar deviasi populasi - \(n\) = ukuran sampel
Makna SE: - Mengukur seberapa jauh rata-rata sampel cenderung berbeda dari rata-rata populasi - Sampel besar → SE kecil → hasil lebih stabil dan mendekati populasi
5.6.3 Central Limit Theorem (CLT)
Ketika ukuran sampel cukup besar (biasanya \(n ≥ 30\)), maka distribusi sampling dari rata-rata akan mendekati distribusi normal, meskipun populasi aslinya tidak normal.
Secara sederhana:
\[ \bar{X} \sim N \left( \mu,\, \frac{\sigma}{\sqrt{n}} \right) \]
Artinya: - Rata-rata sampel mengikuti distribusi normal - Mean = mean populasi - Standar deviasi = standard error
5.7 Kesimpulan
- Populasi memiliki parameter yang ingin kita
ketahui.
- Sampel diambil untuk memperkirakan parameter
tersebut.
- Distribusi sampel ≠ distribusi sampling.
- Distribusi sampling menunjukkan variasi nilai statistik antar
sampel.
- Semakin besar sampel → hasil semakin mendekati nilai populasi.
- Central Limit Theorem memastikan bahwa rata-rata sampel akan mengikuti distribusi normal jika \(n ≥ 30\).
Dengan memahami konsep ini, Anda bisa membaca dan melakukan analisis statistik dengan jauh lebih percaya diri dan akurat.
6 References
6.1 Referensi Video
| Video Materi | Link YouTube |
|---|---|
| Variabel Acak Kontinu | https://youtu.be/ZyUzRVa6hCM |
| Distribusi Sampling | https://youtu.be/7S7j75d3GM4 |
| Central Limit Theorem | https://youtu.be/ivd8wEHnMCg |
| Proporsi Sampel | https://youtu.be/q2e4mK0FTbw |
| Review Sampling Distribution | https://youtu.be/c0mFEL_SWzE |
6.2 Referensi Buku & Website
6.2.1 Buku Online Interaktif
Nama Buku: Introduction to Probability, Statistics,
and Random Processes
Penulis: H. Pishro-Nik
Tahun: 2014
Link Website: https://www.probabilitycourse.com/
| Materi | Chapter | Halaman/Sub-bab |
|---|---|---|
| Variabel Acak Diskrit | Chapter 3 | 3.1-3.5 Discrete Random Variables |
| Variabel Acak Kontinu | Chapter 4 | 4.1-4.3 Continuous Random Variables |
| Distribusi Normal | Chapter 4 | 4.3 Normal Distribution |
| Central Limit Theorem | Chapter 6 | 6.2 Central Limit Theorem |
| Distribusi Sampling | Chapter 7 | 7.1-7.2 Statistical Inference |
6.2.2 📄 Buku 1
Nama Buku: Probability and Statistics: The Science
of Uncertainty
Penulis: Jeffrey S. Rosenthal
Tahun: 2024
Link PDF: https://utstat.utoronto.ca/mikevans/jeffrosenthal/book.pdf
| Materi | Bab | Halaman |
|---|---|---|
| Variabel Acak Diskrit | Bab 3 | halaman 45-70 |
| Variabel Acak Kontinu | Bab 4 | halaman 71-95 |
| Distribusi Sampling | Bab 5 | halaman 96-120 |
| Central Limit Theorem | Bab 6 | halaman 121-145 |
6.2.3 📄 Buku 2
Nama Buku: Introductory Statistics
Penulis: OpenStax
Tahun: 2018
Link PDF: https://assets.openstax.org/oscms-prodcms/media/documents/IntroductoryStatistics-OP.pdf
| Materi | Bab | Halaman |
|---|---|---|
| Variabel Acak Diskrit | Bab 4 | halaman 259-300 |
| Variabel Acak Kontinu | Bab 5 | halaman 301-350 |
| Central Limit Theorem | Bab 7 | halaman 415-450 |
| Sampling Distributions | Bab 7 | halaman 415-450 |