~ Probability Distribution ~

CONTACT INFORMATION
Email Address
Andremusari276@gmail.com
Student ID
52250065
LinkedIn Profile
View Profile

ANDRE

Data Science Student
ITSB
Institut Teknologi Sains Bandung
ACADEMIC ADVISOR
Bakti Siregar, M.Sc., CDS
CORE COMPETENCIES
Data Analysis
Machine Learning
Statistics
Data Visualization
Institut Teknologi Sains Bandung • Data Science • 2025

1 Continuous Random

1.1 Gambaran Umum

Pada materi ini dibahas dua konsep inti dalam statistik probabilistik, yaitu:

  1. Variabel acak diskrit (discrete random variable)
  2. Variabel acak kontinu (continuous random variable)

Kedua konsep ini adalah fondasi bagi distribusi peluang, normal distribution, z-score, dan inferensi statistik.
Untuk memahami peluang, kita harus tahu dulu jenis variabelnya, karena cara menghitung probabilitas berbeda total.


1.2 Variabel Acak Diskrit

1.2.1 Definisi

Variabel acak diskrit adalah variabel yang nilai‐nilainya dapat dihitung satu per satu. Nilainya berasal dari kegiatan menghitung (counting), bukan mengukur.

Suatu nilai dikatakan diskrit bila memungkinkan untuk menyebutkan semua probabilitas pada setiap titiknya.


1.3 Contoh Kasus Nyata

Situasi Data Alasan Diskrit
Jumlah anak dalam keluarga 0,1,2,3,… Tidak ada “2.63 anak”
Hasil lempar koin 3x 0-3 kepala Hasil terbatas dan bisa dihitung
Nilai ujian 0-100 Masih merupakan hasil hitungan
Banyak pelanggan datang per jam 1,2,3,… Satuan individu dapat dihitung

Meskipun nilai bisa desimal, selama masih merupakan hasil hitungan, maka tetap diskrit.


1.4 Konsep Probabilitas Diskrit

\[ P(X = x) = f(x) \]

Semua peluang harus berjumlah 1:

\[ \sum_{x}P(X=x)=1 \]

1.4.1 Makna rumus:

Jika daftar peluang tidak berjumlah 1 → model salah atau tidak lengkap.


1.5 Model Matematika Untuk Variabel Diskrit

1.5.1 Distribusi Binomial

Digunakan ketika:

✔ terdapat dua kemungkinan hasil (success/failure)
✔ percobaan independen
✔ peluang tiap percobaan konstan

\[ P(X=k)=\binom{n}{k}p^k(1-p)^{n-k} \]

1.5.2 Contoh Numerik

Lempar koin 4 kali, peluang keluar kepala = 0.5
\(P(X=2)=\binom{4}{2}(0.5)^2(0.5)^2=0.375\)

Artinya peluang tepat 2 kepala dalam 4 lemparan adalah 37.5%


1.6 Variabel Acak Kontinu

1.6.1 Definisi

Variabel acak kontinu adalah variabel yang nilai‐nilainya tak terbatas dan tidak dapat dihitung satu per satu, karena berasal dari pengukuran.

Contoh variabel yang bersifat kontinu:

Contoh Bentuk Nilai Mengapa Kontinu
Berat badan 45.52 kg, 45.5213 kg Bisa terus diperinci
Suhu 30.0°C → 30.001°C → dst Nilai real tak terbatas
Umur 21.45 tahun Hasil pengukuran dengan precision
Waktu tempuh 5.2 detik, 5.20041 detik Tidak berhenti pada angka bulat

Karena dapat dipecah hingga ketelitian tak hingga, nilai tersebut tak mungkin dihitung satu per satu.


1.6.2 Konsep Peluang Pada Variabel Kontinu

Berbeda dari diskrit, peluang titik tunggal kontinu selalu 0:

\[ P(X = x)=0 \]

Maka peluang dihitung dalam bentuk rentang (interval):

\[ P(a\le X\le b)=\int_a^b f(x)\,dx \]

1.6.3 Makna:

Yang berarti bukan nilai tunggal yang memiliki probabilitas —
melainkan luas area di bawah kurva untuk sebuah interval.


1.7 Probability Density Function (PDF)

Untuk variabel kontinu berlaku fungsi kerapatan probabilitas (density function).

Ciri PDF yang sah:

\[ f(x) \ge 0 \quad \forall x \]

\[ \int_{-\infty}^{\infty}f(x)\,dx=1 \]

Total area kurva = total kemungkinan = 1 → berlaku universal.


1.8 Distribusi Normal (Fondasi Statistik Lanjut)

Distribusi normal berbentuk simetris, rata-rata (μ) di tengah, dan sebaran ditentukan deviasi standar (σ).
Inilah rumus fungsi kepadatannya:

\[ f(x)=\frac{1}{\sigma\sqrt{2\pi}} \exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right) \]

Distribusi ini akan mendominasi materi lanjutan karena:

  • Digunakan dalam penghitungan z-score
  • Digunakan untuk confidence interval & uji hipotesis
  • Menjadi dasar Central Limit Theorem dan Sampling Distribution

1.9 PERBEDAAN DISKRIT VS KONTINU — RINGKAS & TAJAM

Aspek Diskrit Kontinu
Cara perolehan data Menghitung Mengukur
Nilai Dapat dihitung satu per satu Tak hingga
Probabilitas Penjumlahan \(\sum P(x)=1\) Integral \(\int f(x)=1\)
Peluang pada titik Bisa > 0 Selalu = 0
Fokus peluang Titik nilai tertentu Interval rentang nilai
Contoh distribusi Binomial, Geometrik, Poisson Normal, Eksponensial, Gamma

1.10 Kesimpulan Utama Materi

  • Diskrit = Countable.
    Peluang menggunakan penjumlahan, contoh Binomial.

  • Kontinu = Measurable tak hingga.
    Peluang menggunakan integral, diukur melalui area PDF.

  • Distribusi normal menjadi pusat pembahasan lanjutan, karena seluruh analisis inferensi statistik modern berporos di atasnya.

2 Sampling Distributions

2.1 Pendahuluan

Dalam kajian statistika inferensial, distribusi sampling (sampling distribution) adalah konsep yang sangat penting karena menjadi dasar bagi pengujian hipotesis dan estimasi parameter populasi. Sebelum membahas lebih jauh tentang distribusi sampling, terlebih dahulu perlu dipahami perbedaan antara:

  1. Distribusi Populasi
  2. Distribusi Sampel (Sample Distribution)
  3. Distribusi Sampling (Sampling Distribution)

Tujuan utama mempelajari distribusi sampling adalah agar kita dapat memperkirakan parameter populasi hanya dengan menggunakan data sampel, tanpa harus mengukur seluruh elemen populasi yang jumlahnya bisa sangat besar.

2.2 Populasi, Sampel, dan Distribusi Sampel

Populasi adalah keseluruhan objek yang menjadi perhatian penelitian. Sampel adalah sebagian kecil dari populasi yang diambil dengan metode tertentu untuk digunakan dalam perhitungan dan penarikan kesimpulan.

Contoh:
Terdapat populasi 10.000 orang, dengan tinggi rata-rata populasi:

\[ \mu = 5'4" \approx 162.56\text{ cm} \]

Jika kita mengambil sampel secara acak, rata-rata sampel tidak selalu sama dengan rata-rata populasi. Misalnya:

Sampel Ke Rata-rata (x̄)
1 5.3 ft
2 5.7 ft
3 5.4 ft

Ini menunjukkan variabilitas karena sampel hanya sebagian kecil populasi, sehingga kemungkinan berbeda dari nilai populasi sebenarnya.


2.3 Distribusi Sampling

Distribusi sampling adalah distribusi probabilitas dari suatu statistik (umumnya rata-rata sampel x̄) yang diperoleh dari banyak sampel acak ukuran n.

Langkah konseptual pembentukan distribusi sampling:

  1. Tentukan populasi yang ingin diamati.
    Misal variabel tinggi badan.
  2. Ambil sampel acak sederhana berukuran n. Contoh n = 5.
  3. Hitung rata-rata sampel:

\[ \bar{X} = \frac{1}{n} \sum_{i=1}^{n} X_i \]

  1. Ulangi pengambilan sampel ratusan hingga ribuan kali.
  2. Plot semua \(\bar{X}\) dalam histogram → itulah distribusi sampling rata-rata sampel (x̄).

Jika jumlah sampel cukup besar, distribusi sampling akan cenderung berdistribusi normal, sesuai Teorema Limit Tengah (Central Limit Theorem / CLT).


2.4 Perbandingan Penting

2.4.1 Distribusi Populasi

Memiliki parameter:

\[ \mu = \text{mean populasi}, \qquad \sigma = \text{simpangan baku populasi} \]

Jika variabel \(X\) ~ Normal(\(\mu, \sigma\)), maka:

\[ Z = \frac{X - \mu}{\sigma} \]

2.4.2 Distribusi Sampling (Rata-rata Sampel)

Karakteristik penting:

\[ \mu_{\bar{X}} = \mu \]

\[ \sigma_{\bar{X}} = \frac{\sigma}{\sqrt{n}} \quad \text{(Standard Error)} \]

Standard Error lebih kecil daripada σ karena rata-rata sampel lebih stabil dibanding observasi individual.

Standardisasi distribusi sampling:

\[ Z = \frac{\bar{X} - \mu}{\sigma / \sqrt{n}} \]


2.5 Contoh Soal Lengkap

Misal tinggi badan penduduk Kanada berdistribusi normal dengan:

\[ \mu = 160 \text{ cm}, \qquad \sigma = 7 \text{ cm} \]

2.5.1 Probabilitas rata-rata 10 orang < 157 cm

Ukuran sampel:

\[ n = 10 \]

Standard Error:

\[ SE = \frac{7}{\sqrt{10}} = 2.21 \]

Hitung Z-score:

\[ Z = \frac{157 - 160}{2.21} = -1.36 \]

Dari tabel Z:

\[ P(Z < -1.36) = 0.0869 \]

Maka peluang rata-rata tinggi tubuh 10 orang <157 cm adalah 8.69%.


2.5.2 Probabilitas tinggi individu >170 cm

Karena ini individu, bukan rata-rata sampel → gunakan rumus populasi:

\[ Z = \frac{170 - 160}{7} = 1.43 \]

Dari tabel:

\[ P(Z < 1.43) = 0.9236 \]

Maka:

\[ P(X > 170) = 1 - 0.9236 = 0.0764 \]

Artinya hanya sekitar 7.64% populasi memiliki tinggi badan >170 cm.


2.6 Kesimpulan Utama

Konsep Karakteristik
Distribusi Populasi Menggambarkan seluruh anggota populasi
Distribusi Sampel Menggambarkan data dalam satu sampel
Distribusi Sampling Dibangun dari banyak sampel — dasar estimasi statistik

Keuntungan penggunaan distribusi sampling:

✔ Hemat biaya, waktu dan tenaga
✔ Bisa memperkirakan parameter populasi
✔ Dapat menghitung peluang berdasarkan ukuran sampel
✔ Mendukung inferensi statistik (uji-hipotesis, interval estimasi, CLT)

3 Central Limit Theorem

3.1 Pendahuluan

Central Limit Theorem (CLT) atau Teorema Limit Pusat adalah salah satu konsep paling fundamentaI dalam statistik. CLT menjelaskan bagaimana rata-rata sampel dapat merefleksikan populasi, serta mengapa banyak metode statistik (uji hipotesis, confidence interval, regresi) dapat digunakan meskipun data tidak selalu normal.

Kita akan membedah CLT dari dasar → ilustrasi → rumus matematis → contoh nyata → interpretasi logis.


3.2 Sebelum Masuk ke CLT: Apa itu Distribusi Sampling?

Bayangkan kita memiliki sebuah populasi (misal: tinggi badan seluruh siswa di SMA). Kita tidak mungkin mengukur semua orang setiap saat. Maka, kita ambil sampel berulang kali.

Prosesnya:
1. Ambil sampel acak ukuran \(n\) dari populasi
2. Hitung rata–rata sampel \(\bar{X}\)
3. Ulangi langkah 1 dan 2 berkali-kali
4. Semua \(\bar{X}\) dikumpulkan → terbentuk distribusi sampling mean


3.3 Rumus Dasar Rata–Rata Sampel

\[ \bar{X} = \frac{1}{n} \sum_{i=1}^{n} X_i \]

Penjelasan sederhana:

Simbol Makna
\(X_i\) nilai data ke-i dalam sampel
\(n\) ukuran sampel
\(\bar{X}\) nilai rata-rata sampel

Semakin sering proses pengambilan sampel dilakukan, semakin terlihat pola distribusinya.


3.4 Inti Utama CENTRAL LIMIT THEOREM (CLT)

Tidak peduli bagaimana bentuk distribusi populasi: miring (skewed), loncat, tidak simetris, acak, bahkan kacau —
rata-rata sampel akan membentuk distribusi Normal jika ukuran sampel cukup besar.

Secara matematis:

\[ \bar{X} \sim N\left(\mu,\frac{\sigma^2}{n}\right) \]

Dengan ketentuan utama:

Kondisi CLT Berlaku
\(n \ge 30\) ✔ Hampir selalu normal
Populasi sudah normal ✔ Meskipun \(n < 30\)
\(n < 30\) & populasi tidak normal ❌ Tidak aman gunakan CLT

3.4.1 Makna Rumus CLT (Super jelas dan lugas)

Rumus Arti Dampak Statistik
\(\mu_{\bar{X}} = \mu\) rata-rata sampel mendekati rata-rata populasi estimator tidak bias
\(\sigma_{\bar{X}} = \frac{\sigma}{\sqrt{n}}\) semakin banyak sampel → semakin kecil error hasil semakin presisi
\(\bar{X} \sim N(\mu,\sigma^2/n)\) mean sampel akhirnya berdistribusi normal bisa analisis memakai Z, CI, uji t

3.5 Standard Error (SE)

\[ SE = \frac{\sigma}{\sqrt{n}} \]

📌 Makna paling sederhana:

SE adalah ukuran seberapa jauh rata-rata sampel bisa bergeser dari mean populasi.

SE kecil = data stabil & akurat
SE besar = estimasi berisik dan kurang dapat dipercaya


3.6 Konversi Mean Sampel ke Z-score

Jika ingin mencari peluang \(\bar{X}\) terjadi pada nilai tertentu:

\[ Z = \frac{\bar{X}-\mu}{\sigma/\sqrt{n}} \]

Z-score berguna untuk menghitung probabilitas dengan tabel normal.


3.7 Contoh Nyata yang Mudah Dipahami

Misal rata-rata tinggi populasi siswa SMA = 165 cm, σ = 10 cm
Ambil sampel \(n = 40\)

\[ \bar{X} \sim N\left(165,\frac{10^2}{40}\right)=N(165,1.58) \]

Probabilitas rata-rata sampel \(>170\):

\[ Z = \frac{170-165}{10/\sqrt{40}} = 3.16 \]

Nilai Z = 3.16 sangat besar → peluangnya sangat kecil.
Artinya kecil kemungkinan 40 siswa rata–ratanya 170 cm atau lebih.


3.8 Kesimpulan Kuat & Elegan

Central Limit Theorem adalah jembatan yang menghubungkan sampel dengan populasi.

✔ Rata-rata sampel akan mendekati distribusi normal ketika \(n\) cukup besar
✔ Meskipun populasi tidak normal, sampel tetap akan normal → jika \(n\ge30\)
✔ Dari sinilah berbagai metode statistik bisa diterapkan dengan sah

\[ \boxed{\text{CLT = pondasi inferensi statistik modern}} \]

Semakin besar sampel → semakin akurat gambaran populasi.
Tanpa CLT, statistik modern hampir tidak mungkin berjalan.

4 Sample Proportion

4.1 Distribusi Sampling Proporsi

4.2 Konsep Fundamental

Distribusi Sampling Proporsi adalah distribusi probabilitas dari proporsi sampel \(\hat{p}\) yang terbentuk apabila dilakukan banyak pengambilan sampel dari populasi yang memiliki proporsi sebenarnya \(p\) dengan ukuran sampel \(n\) yang sama.

Ilustrasi sederhana:
Misalkan terdapat koin tidak seimbang dengan peluang muncul kepala \(p = 0.6\). Kita melemparnya sebanyak 10 kali dan mencatat \(\hat{p}\). Jika eksperimen ini diulang 1000 kali, nilai-nilai \(\hat{p}\) membentuk suatu distribusi sampling proporsi.


4.3 Rumus-Rumus Dasar

4.3.1 📌 Mean Distribusi Sampling

\[ \mu_{\hat{p}} = p \]

4.3.2 📌 Standard Error (variabilitas antar sampel)

\[ \sigma_{\hat{p}} = \sqrt{\frac{p(1 - p)}{n}} \]

SE ≠ SD.
SE menggambarkan variasi antar sampel, bukan variasi dalam satu sampel.

4.3.3 📌 Transformasi ke Z-score

Jika syarat normalitas terpenuhi: \[ z = \frac{\hat{p} - p}{\sqrt{\frac{p(1 - p)}{n}}} \]

4.3.4 📌 Jika \(p\) belum diketahui

\[ SE = \sqrt{\frac{\hat{p}(1 - \hat{p})}{n}} \]


4.4 Syarat Normalitas (Wajib sebelum pakai Z)

Syarat Penjelasan
Sampling acak & independen Observasi tidak saling mempengaruhi
\(n \le 0.1N\) Jika sampling tanpa pengembalian
\(np ≥ 10\) dan \(n(1-p) ≥ 10\) Agar distribusi mendekati Normal
Ukuran sampel besar dianjurkan Namun aturan utama tetap \(np≥10\)

Alasan batas 10: agar distribusi Binomial cukup simetris sehingga pendekatan Normal valid.


4.5 Central Limit Theorem (CLT) pada Proporsi

Jika sampel besar:

\[ \hat{p} \sim N\left(p,\; \frac{p(1-p)}{n}\right) \]

Interpretasi:

  • Sampel besar → \(\hat{p}\) makin dekat ke \(p\)
  • Varians mengecil seiring \(n\) meningkat
  • Estimasi lebih stabil dan akurat

4.6 Contoh dan Studi Kasus

4.6.1 📍 Contoh 1 — Kontrol Kualitas Pabrik

Klaim cacat = \(p = 0.02\)
Sampel = 500 produk, cacat = 18

\[ \hat{p}=\frac{18}{500}=0.036 \] \[ np=10,\quad n(1-p)=490 \Rightarrow syarat normalitas terpenuhi \] \[ \sigma_{\hat{p}}=\sqrt{\frac{0.02\times0.98}{500}}=0.00626 \] \[ z=\frac{0.036-0.02}{0.00626}=2.56 \] \[ P(Z>2.56)=0.0052 \]

Interpretasi: kemungkinan hasil seperti ini hanya 0.52% → klaim mungkin tidak benar.


4.6.2 📍 Contoh 2 — Survei Politik

Nasional: 45% mendukung calon A
Provinsi X: 400 responden, 200 mendukung A → \(\hat{p}=0.50\)

\[ \sigma_{\hat{p}}=\sqrt{\frac{0.45\times0.55}{400}}=0.0249 \] \[ z=\frac{0.50-0.45}{0.0249}=2.01 \] \[ P(|Z|>2.01)=0.0444<0.05 \]

Kesimpulan: Dukungan provinsi X berbeda signifikan dari nasional.


4.7 Tabel Formula Inti (Quick Summary)

Fungsi Rumus
Mean \(\mu_{\hat{p}}=p\)
Standard Error \(\sigma_{\hat{p}}=\sqrt{\frac{p(1-p)}{n}}\)
Z-score \(z=\frac{\hat{p}-p}{\sigma_{\hat{p}}}\)
Margin of Error \(ME=z_{\alpha/2}\cdot\sigma_{\hat{p}}\)
Minimal ukuran sampel \(n=\frac{z^2p(1-p)}{E^2}\)
Pooled proportion \(p_{pool}=\frac{x_1+x_2}{n_1+n_2}\)

4.8 Kesalahan Umum

Kesalahan Dampak Solusi
Tidak mengecek \(np≥10\) Hasil analisis bias Selalu cek syarat
SE dikira sama dengan SD Salah interpretasi variasi SE = antar sampel, SD = dalam sampel
Memaksa Normal pada sampel kecil Hasil tidak akurat Pakai CLT + syarat

4.9 Visualisasi Pemahaman

  • \(n\) kecil → sebaran melebar
  • \(n\) besar → nilai berkumpul di sekitar mean
  • \(p=0.5\) memberi variasi terbesar
  • Semakin jauh \(p\) dari 0.5 → butuh sampel lebih banyak

4.10 Latihan Soal

Sebuah perusahaan asuransi mengklaim 70% klaim selesai ≤7 hari.
Dari sampel 200 klaim ditemukan 130 selesai tepat waktu.

\[ \hat{p}=0.65,\quad p=0.70,\quad n=200 \] \[ \sigma_{\hat{p}}=\sqrt{\frac{0.70\times0.30}{200}}=0.0324 \] \[ z=\frac{0.65-0.70}{0.0324}=-1.54 \] \[ P(Z\le-1.54)=0.0618 \]

Kesimpulan: Tidak cukup bukti untuk menolak klaim perusahaan pada \(\alpha=5\%\).


4.11 Keterhubungan ke Konsep Statistik Lain

Konsep Hubungan
Distribusi Binomial \(\hat{p}=X/n,\; X\sim Binomial(n,p)\)
Confidence Interval CI = \(\hat{p}\pm z_{\alpha/2}\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}\)
Hypothesis Testing \(z=\frac{\hat{p}-p_0}{\sqrt{\frac{p_0(1-p_0)}{n}}}\)

Kesimpulan akhir:
Distribusi sampling proporsi adalah jembatan utama untuk menghubungkan data sampel menuju inferensi populasi.

5 Review Sampling Distribution

5.1 Pendahuluan

Dalam statistika, kita sering ingin mengetahui kondisi dari suatu populasi.
Namun, mengukur seluruh populasi biasanya sulit, memakan biaya, waktu, dan tenaga.
Karena itu peneliti cukup mengambil sampel, yaitu sebagian dari populasi, untuk dianalisis.

Masalahnya: hasil sampel tidak selalu sama dengan populasi.
Rata-rata, proporsi, atau nilai statistik lain dapat berubah-ubah jika sampelnya berbeda.

Di sinilah konsep distribusi sampling menjadi penting.


5.2 Konsep Dasar yang Harus Dipahami Terlebih Dahulu

5.2.1 Populasi

Populasi adalah seluruh objek yang menjadi perhatian penelitian.
Contoh: - Semua siswa kelas 11 di sekolah - Semua pembeli di sebuah toko selama satu tahun - Semua penduduk Indonesia

Populasi memiliki parameter, yaitu nilai asli yang menggambarkan karakter populasi, misalnya: - Rata-rata tinggi badan - Rata-rata pendapatan - Proporsi perokok

Nilai parameter biasanya tidak diketahui, dan inilah yang ingin kita perkirakan.


5.2.2 Sampel

Sampel adalah sebagian dari populasi.
Sampel diambil karena lebih mudah, murah, dan cepat untuk dianalisis.

Contoh: - Dari 10.000 siswa, hanya 100 yang diukur tinggi badannya - Dari seluruh transaksi toko, hanya 50 hari yang diamati - Dari penduduk Indonesia, hanya 2.000 responden disurvei

Sampel memiliki statistik, yaitu nilai yang kita hitung dari sampel: - Rata-rata sampel (\(\bar{X}\)) - Proporsi sampel (\(\hat{p}\)) - Varians sampel (\(S^2\))

Nilai statistik ini digunakan untuk mendekati parameter populasi.


5.3 Perbedaan Penting

Konsep Distribusi Sampel (Sample Distribution) Distribusi Sampling (Sampling Distribution)
Apa yang dianalisis? Data dalam satu sampel Hasil statistik dari banyak sampel
Contoh Tinggi 50 siswa Rata-rata dari banyak sampel masing-masing 50 siswa
Sifat Berisi nilai individu Berisi nilai rata-rata/proposi yang berubah-ubah
Tujuan Melihat variasi data real Memahami variasi hasil sampel tiap pengambilan

Penjelasan sederhana:

Distribusi sampel → data mentah dalam satu sampel
Distribusi sampling → bagaimana nilai statistik berubah antar sampel berbeda


5.4 Apa Itu Distribusi Sampling?

Distribusi sampling adalah distribusi dari statistik sampel, seperti rata-rata atau proporsi, ketika kita mengambil banyak sampel dari populasi yang sama.

Misal: - Populasi = 10.000 orang - Tinggi rata-rata populasi = 165 cm
- Kita ambil sampel 100 orang secara acak → hitung rata-rata - Ulangi 100 kali → kita akan mendapatkan 100 nilai rata-rata

Nilai rata-rata ini tidak sama, dan penyebarannya membentuk distribusi sampling.


5.5 Mengapa Distribusi Sampling Penting?

Karena kita tidak mungkin mengambil semua orang dalam populasi, maka kita perlu memprediksi sebaran hasil sampel.

Dengan distribusi sampling kita dapat:

✔ Mengetahui seberapa besar variasi hasil sampel
✔ Mengukur ketidakpastian estimasi
✔ Membuat inferensi statistik (uji hipotesis, confidence interval, estimasi mean)

Tanpa pemahaman ini, analisis statistik akan salah arah.


5.6 Rumus-Rumus Penting

5.6.1 Mean (Rata-rata Sampel)

\[ \bar{X} = \frac{\sum X}{n} \]

Penjelasan: - Tambahkan semua nilai dalam sampel - Bagi dengan jumlah data \(n\) - Hasilnya adalah rata-rata sampel, bukan populasi


5.6.2 Standard Error (SE)

\[ SE = \frac{\sigma}{\sqrt{n}} \]

Di mana: - \(\sigma\) = standar deviasi populasi - \(n\) = ukuran sampel

Makna SE: - Mengukur seberapa jauh rata-rata sampel cenderung berbeda dari rata-rata populasi - Sampel besar → SE kecil → hasil lebih stabil dan mendekati populasi


5.6.3 Central Limit Theorem (CLT)

Ketika ukuran sampel cukup besar (biasanya \(n ≥ 30\)), maka distribusi sampling dari rata-rata akan mendekati distribusi normal, meskipun populasi aslinya tidak normal.

Secara sederhana:

\[ \bar{X} \sim N \left( \mu,\, \frac{\sigma}{\sqrt{n}} \right) \]

Artinya: - Rata-rata sampel mengikuti distribusi normal - Mean = mean populasi - Standar deviasi = standard error


5.7 Kesimpulan

  1. Populasi memiliki parameter yang ingin kita ketahui.
  2. Sampel diambil untuk memperkirakan parameter tersebut.
  3. Distribusi sampel ≠ distribusi sampling.
  4. Distribusi sampling menunjukkan variasi nilai statistik antar sampel.
  5. Semakin besar sampel → hasil semakin mendekati nilai populasi.
  6. Central Limit Theorem memastikan bahwa rata-rata sampel akan mengikuti distribusi normal jika \(n ≥ 30\).

Dengan memahami konsep ini, Anda bisa membaca dan melakukan analisis statistik dengan jauh lebih percaya diri dan akurat.


6 References

6.1 Referensi Video

Video Materi Link YouTube
Variabel Acak Kontinu https://youtu.be/ZyUzRVa6hCM
Distribusi Sampling https://youtu.be/7S7j75d3GM4
Central Limit Theorem https://youtu.be/ivd8wEHnMCg
Proporsi Sampel https://youtu.be/q2e4mK0FTbw
Review Sampling Distribution https://youtu.be/c0mFEL_SWzE

6.2 Referensi Buku & Website

6.2.1 Buku Online Interaktif

Nama Buku: Introduction to Probability, Statistics, and Random Processes
Penulis: H. Pishro-Nik
Tahun: 2014
Link Website: https://www.probabilitycourse.com/

Materi Chapter Halaman/Sub-bab
Variabel Acak Diskrit Chapter 3 3.1-3.5 Discrete Random Variables
Variabel Acak Kontinu Chapter 4 4.1-4.3 Continuous Random Variables
Distribusi Normal Chapter 4 4.3 Normal Distribution
Central Limit Theorem Chapter 6 6.2 Central Limit Theorem
Distribusi Sampling Chapter 7 7.1-7.2 Statistical Inference

6.2.2 📄 Buku 1

Nama Buku: Probability and Statistics: The Science of Uncertainty
Penulis: Jeffrey S. Rosenthal
Tahun: 2024
Link PDF: https://utstat.utoronto.ca/mikevans/jeffrosenthal/book.pdf

Materi Bab Halaman
Variabel Acak Diskrit Bab 3 halaman 45-70
Variabel Acak Kontinu Bab 4 halaman 71-95
Distribusi Sampling Bab 5 halaman 96-120
Central Limit Theorem Bab 6 halaman 121-145

6.2.3 📄 Buku 2

Nama Buku: Introductory Statistics
Penulis: OpenStax
Tahun: 2018
Link PDF: https://assets.openstax.org/oscms-prodcms/media/documents/IntroductoryStatistics-OP.pdf

Materi Bab Halaman
Variabel Acak Diskrit Bab 4 halaman 259-300
Variabel Acak Kontinu Bab 5 halaman 301-350
Central Limit Theorem Bab 7 halaman 415-450
Sampling Distributions Bab 7 halaman 415-450