Tugas Week 11 ~ Probability Distribution

1 . Pendahuluan

Probability Distributions (Distribusi Probabilitas)

Distribusi probabilitas adalah konsep penting dalam statistika. Tujuannya adalah untuk memahami seberapa besar kemungkinan suatu kejadian terjadi. Selain itu, konsep ini juga menjadi dasar dari berbagai metode statistik yang digunakan untuk membuat keputusan.

Dalam suatu proses atau eksperimen (misalnya melempar koin, mengukur tinggi badan, menghitung pelanggan datang), hasilnya bisa berbeda-beda. Untuk mewakili hasil yang berubah-ubah ini, kita memakai:

Variabel acak (random variable) untuk mewakili nilai hasil yang mungkin terjadi

Distribusi probabilitas untuk menjelaskan bagaimana peluang diberikan pada tiap nilai itu

Kenapa bentuk distribusi penting?

Bentuk suatu distribusi membantu kita memahami:

bagaimana data itu berperilaku

bagaimana cara menghitung peluang tertentu

bagaimana membuat prediksi

Misalnya, data tinggi badan membentuk distribusi lonceng (normal), sedangkan data jumlah pelanggan per hari bisa mengikuti distribusi Poisson.

Perannya dalam statistika

Distribusi probabilitas sangat penting karena:

Menjelaskan bagaimana peluang dikelompokkan

Menjadi dasar dari statistik inferensial (misalnya: menghitung rata-rata sampel, varians, membuat confidence interval, uji hipotesis)

Materi penting yang akan dipelajari

Beberapa konsep kunci yang diperkenalkan dalam bagian ini:

Continuous Random Variables (Variabel Acak Kontinu) Variabel yang nilainya bisa berupa angka dalam rentang terus-menerus (misal: tinggi badan, berat badan, waktu). Distribusi probabilitas membantu menjelaskan peluang nilai-nilai tersebut muncul.

Distribusi probabilitas membantu kita memahami bagaimana peluang tersebar pada semua kemungkinan hasil. Ini sangat penting untuk memprediksi data, menganalisis hasil eksperimen, dan mengambil keputusan berdasarkan data.

2 . countinuous Random

Variabel acak kontinu adalah variabel yang bisa mengambil nilai dalam rentang yang tidak terhingga, atau dalam interval tertentu yang tidak terputus.

Contoh variabel acak kontinu:tinggi badan, berat badan,waktu ( misal waktu tempuh 0-10 menit) suhu udara jarak

Nilainya bisa berupa angka desimal, dan ada tak terbatas kemungkinan nilai di antara dua angka.

Disebut continuous karena nilainya terus menerus dan tidak diskrit. Misalnya waktu = 3 detik : masih bisa 3.1, 3.12, 3.123, 3.1234, dan seterusnya.

Ini berbeda dengan variabel diskrit seperti:

jumlah anak (1, 2, 3, …)

jumlah dadu keluar (1–6)

Untuk variabel kontinu, probabilitas tidak dihitung untuk satu nilai tertentu, tetapi untuk rentang nilai.

Karena:

Peluang bahwa variabel acak kontinu tepat sama dengan satu nilai tertentu = 0.

Contohnya: P(tinggi = 170 cm tepat) = 0 Tapi P(tinggi antara 165–175 cm) > 0

Untuk variabel kontinu, kita menggunakan:

PDF (Probability Density Function)

grafik atau fungsi yang menggambarkan bagaimana probabilitas tersebar dalam rentang nilai.

Contoh: Kurva normal (lonceng).

CDF (Cumulative Distribution Function)

menunjukkan peluang bahwa nilai X berada di bawah atau sama dengan suatu angka

Video tersebut memberi pengantar dasar mengenai:

apa itu variabel acak kontinu

bagaimana peluang dihitung

perbedaan kontinu vs diskrit

bagaimana bentuk distribusi probabilitas kontinu

Variabel acak kontinu adalah variabel yang nilainya bisa berupa angka dalam rentang tak terbatas (misalnya waktu, tinggi badan, suhu). Distribusi probabilitas untuk variabel kontinu menggunakan PDF dan CDF, dan peluang dihitung berdasarkan rentang nilai, bukan nilai tunggal.

1 Variabel Acak (Random Variable)

Definisi: Variabel yang nilainya ditentukan oleh hasil dari suatu percobaan acak. Jenis:

Diskrit: Nilainya terhitung (contoh: jumlah kepala dalam pelemparan koin). Kontinu: Nilainya dalam interval (contoh: tinggi badan, waktu).

2 Distribusi Probabilitas Diskrit . Fungsi yang memberukan probabilias untuk setiap nilai variable acak diskrit

syarat 1. 0 < P(X = x)< 1 2. \(\sum x\)

Contoh Distribusi Diskrit: Distribusi Binomial

· Digunakan untuk: Percobaan dengan dua hasil (sukses/gagal), percobaan independen, dan probabilitas sukses tetap.

P(X = k) =\[ \binom{n}{k} p^k (1-p)^{n-k}\]

dengan: · n = jumlah percobaan · k = jumlah sukses · p = probabilitas sukses per percobaan · \[\binom{n}{k} = \frac{n!}{k!(n-k)!} \] ·

contoh Pelemparan koin seimbang 10 kali. Probabilitas mendapatkan tepat 6 kepala? n=10, k=6, p=0.5

P(X=6) =\[ \binom{10}{6} (0.5)^6 (0.5)^4 = 210 \times 0.015625 \times 0.0625 \approx 0.205 \]

Distribusi Probabilitas Kontinu

· Probabilitas dihitung sebagai area di bawah kurva fungsi kepadatan probabilitas (PDF). · Probabilitas pada satu titik tertentu = 0. · Contoh utama: Distribusi Normal.

Distribusi Normal

· Ciri: Bentuk simetris, lonceng, ditentukan oleh mean\[ (\mu) dan standar deviasi (\sigma).\] · PDF: f(x) = \[\frac{1}{\sigma \sqrt{2\pi}} e^{-\frac{1}{2} \left( \frac{x-\mu}{\sigma} \right)^2}\] · Standardisasi: Z = \[\frac{X - \mu}{\sigma} Mengubah distribusi normal umum N(\mu, \sigma^2) menjadi distribusi normal standar N(0, 1)\] . · Contoh: Tinggi badan mahasiswa ~ Normal\[( \mu=170 cm, \sigma=10 cm). Probabilitas tinggi < 185 cm?\] Z = \[\frac{185 - 170}{10} = 1.5 Lihat tabel Z: P(Z < 1.5) \approx 0.9332\] .

4 Menggunakan Tabel Z (Tabel Normal Standar)

· Memberikan \[ P(Z \leq z) \] untuk distribusi normal standar. · Langkah: Standardisasi $ X menjadi \[ Z \]. Cari nilai z pada tabel. Interpretasi area kumulatif.

Konsep Rumus Mean (Harapan) Diskrit \[E(X) = \sum x \cdot P(X=x) \] Varians Diskrit Var\[(X) = \sum (x - \mu)^2 P(X=x) \] Binomial P(X=k) = \[\binom{n}{k} p^k (1-p)^{n-k} \] Z-score Z =\[ \frac{X - \mu}{\sigma} \] Probabilitas Normal Gunakan Tabel Z setelah standardisasi

Soal: Probabilitas produk cacat = 0.1. Diambil sampel 8 produk. Hitung probabilitas maksimal 2 cacat.

Jawab:

P(X ) = P(X=0) + P(X=1) + P(X=2)

P(X=0) =\[ \binom{8}{0} (0.1)^0 (0.9)^8 \approx 0.4305\]

P(X=1) = \[4\binom{8}{1} (0.1)^1 (0.9)^7 \approx 0.3826\]

P(X=2) =\[ \binom{8}{2} (0.1)^2 (0.9)^6 \approx 0.1488 \]

P(X\[ \leq 2) \approx 0.4305 + 0.3826 + 0.1488 = 0.9619\]

· Distribusi Binomial cocok untuk menghitung jumlah sukses dalam percobaan diskrit independen. · Distribusi Normal digunakan untuk data kontinu yang simetris, dapat distandardisasi untuk menggunakan tabel Z. · Pemahaman kedua distribusi ini menjadi dasar untuk analisis statistik inferensial

3 . Sampling Distributions

· Distribusi sampling adalah distribusi probabilitas dari suatu statistik sampel (seperti mean, proporsi, varians) yang dihitung dari banyak sampel acak berukuran sama dari populasi yang sama. · Ini berbeda dengan distribusi populasi (distribusi nilai individu) dan distribusi sampel (distribusi nilai dalam satu sampel).

Distribusi sampling merupakan dasar untuk:

  1. Inferensi statistik (estimasi parameter dan pengujian hipotesis)

  2. Memahami variabilitas statistik sampel dari sampel ke sampel

  3. Menghitung margin of error dan interval kepercayaan

Distribusi Sampling Mean \((\bar{X})\)

Karakteristik (Teorema Limit Pusat)

Untuk sampel acak berukuran n dari populasi dengan mean dan standar deviasi :

. Mean distribusi sampling = mean populasi: \[ \mu_{\bar{x}} = \mu\] . Standar error (standar deviasi distribusi sampling): \[ \sigma_{\bar{x}} = \frac{\sigma}{\sqrt{n}}\] . Bentuk distribusi:

· Jika populasi normal distribusi sampling mean normal untuk semua n · Jika populasi tidak normal distribusi sampling mean mendekati normal jika n (Central Limit Theorem)

Z =\[ \frac{\bar{x} - \ u}{\sigma/\sqrt{n}}\]

Distribusi Normal Populasi

Populasi IQ berdistribusi normal dengan \[\mu = 100, \sigma = 15. Ambil sampel n = 25.\]

Parameter distribusi sampling: \[ \mu_{\bar{x}} = 100\] \[ \sigma_{\bar{x}} = \frac{15}{\sqrt{25}} = 3\] Probabilitas mean sampel > 105: Z = \[\frac{105 - 100}{3} = 1.67 P(\bar{x} > 105) = P(Z > 1.67) = 0.0475\]

Central Limit Theorem

Pendapatan per kapita skew right dengan \[\mu = \$50,000, \sigma = \$20,000. Ambil sampel n = 100.\]

. Bentuk distribusi sampling: Mendekati normal (karena n = 100 ) . Standar error: \[\sigma_{\bar{x}} = \frac{20000}{\sqrt{100}} = 2000\] Probabilitas mean sampel < $48,000: Z =\[ \frac{48000 - 50000}{2000} = -1 P(\bar{x} < 48000) = P(Z < -1) = 0.1587\]

Distribusi Sampling Proporsi \[(\hat{p})\]

Untuk proporsi populasi p dan sampel berukuran n:

. Mean distribusi sampling: \[ \mu_{\hat{p}}\] = p . Standar error: \[\sigma_{\hat{p}} = \sqrt{\frac{p(1-p)}{n}}\] Kondisi pendekatan normal (Rule of Thumb): np \[\geq 10 \quad \text{dan} \quad n(1-p) \geq 10\]

Z = \[\frac{\hat{p} - p}{\sqrt{\frac{p(1-p)}{n}}}\]

30% penduduk kota merokok (p = 0.3). Ambil sampel n = 200.

. Cek kondisi normal: np = 200 \[\times 0.3 = 60 \geq 10 n(1-p) = 200 \times 0.7 = 140 \geq 10 → Distribusi sampling proporsi mendekati normal . Standar error: \] _{} = = = 0.0324

. Probabilitas proporsi sampel > 35%: Z = = 1.54 P( > 0.35) = P(Z > 1.54) = 0.0618

Teorema Limit Pusat (Central Limit Theorem - CLT)

Untuk sampel acak berukuran n dari populasi dengan mean dan varians ^2 terbatas, distribusi sampling mean sampel akan mendekati distribusi normal dengan mean dan varians ^2/n ketika n besar, terlepas dari bentuk distribusi populasi.

Visualisasi CLT

Populasi (Bentuk Apa Saja) ↓ Sampel 1 → Mean₁

Sampel 2 → Mean₂

Sampel 3 → Mean₃ ⋮ Sampel k → Meanₖ ↓ Distribusi Mean₁, Mean₂, …, Meanₖ → NORMAL (bentuk lonceng)

. Implikasi Praktis CLT

  1. Ukuran sampel n biasanya cukup untuk pendekatan normal
  2. Untuk populasi sangat skew, mungkin perlu n > 50
  3. Untuk populasi normal, berlaku untuk semua n

Hubungan dengan Inferensi Statistik

. Estimasi Interval (Interval Kepercayaan)

Untuk mean populasi ():

{x} Z_{/2}

{x} t_{/2}

Untuk proporsi populasi (p):

Z_{/2}

. Contoh 4: Margin of Error

Survei 400 orang menunjukkan 60% setuju kebijakan ( = 0.6). Hitung margin of error 95% CI.

  1. Standar error: SE = = = 0.0245
  2. Z-score 95% = 1.96
  3. Margin of error: ME = 1.96 = 0.048
  4. 95% CI: 0.6 = (0.552, 0.648)

Distribusi Sampling

Statistik Sampel Mean Standar Error Kondisi Normalitas Mean \[(\bar{x}) \mu_{\bar{x}} = \mu \sigma_{\bar{x}}\] = Populasi normal ATAU n \[\geq 30\]

4 . Distribusi sampling

  1. Konsep Dasar Distribusi Sampling

· Distribusi sampling adalah distribusi probabilitas dari suatu statistik sampel (seperti mean, proporsi, varians) yang dihitung dari banyak sampel acak berukuran sama dari populasi yang sama. · Ini berbeda dengan distribusi populasi (distribusi nilai individu) dan distribusi sampel (distribusi nilai dalam satu sampel).

Distribusi sampling merupakan dasar untuk:

  1. Inferensi statistik (estimasi parameter dan pengujian hipotesis)

  2. Memahami variabilitas statistik sampel dari sampel ke sampel

  3. Menghitung margin of error dan interval kepercayaan

  4. Distribusi Sampling Mean \((\bar{X})\)

A. Karakteristik (Teorema Limit Pusat)

Untuk sampel acak berukuran n dari populasi dengan mean \[\mu dan standar deviasi \sigma\]:

  1. Mean distribusi sampling = mean populasi: \[ \mu_{\bar{x}} = \mu\]
  2. Standar error (standar deviasi distribusi sampling): \[ \sigma_{\bar{x}} = \frac{\sigma}{\sqrt{n}}\]
  3. Bentuk distribusi: · Jika populasi normal → distribusi sampling mean normal untuk semua n · Jika populasi tidak normal → distribusi sampling mean mendekati normal jika n \[\geq 30 (Central Limit Theorem)\]

B. Rumus Z-score untuk Mean Sampel

Z = \[\frac{\bar{x} - \mu}{\sigma/\sqrt{n}}\]

C. Contoh 1: Distribusi Normal Populasi

Populasi IQ berdistribusi normal dengan \[\mu = 100, \sigma = 15. Ambil sampel n = 25.\]

  1. Parameter distribusi sampling: \[ \mu_{\bar{x}} = 100 \sigma_{\bar{x}} = \frac{15}{\sqrt{25}} = 3\]
  2. Probabilitas mean sampel > 105: Z = \[\frac{105 - 100}{3} = 1.67 P(\bar{x} > 105) = P(Z > 1.67) = 0.0475\] : Central Limit Theorem

Pendapatan per kapita skew right dengan\[ \mu = \$50,000, \sigma = \$20,000. Ambil sampel n = 100.\]

  1. Bentuk distribusi sampling: Mendekati normal (karena n = 100$$ )
  2. Standar error: $$_{{x}} = = 2000
  3. Probabilitas mean sampel < $48,000: Z = = -1 P({x} < 48000) = P(Z < -1) = 0.1587

  1. Distribusi Sampling Proporsi ()

A. Karakteristik

Untuk proporsi populasi p dan sampel berukuran n:

  1. Mean distribusi sampling: \[ \mu_{\hat{p}\]} = p
  2. Standar error: _{} =
  3. Kondisi pendekatan normal (Rule of Thumb): np n(1-p)

Z-score untuk Proporsi Sampel

Z =\[ \frac{\hat{p} - p}{\sqrt{\frac{p(1-p)}{n}}}\] Proporsi Sampel

30% penduduk kota merokok (p = 0.3). Ambil sampel n = 200.

  1. Cek kondisi normal: np = 200$$ = 60 n(1-p) = 200 = 140 → Distribusi sampling proporsi mendekati normal
  2. Standar error: _{} = = = 0.0324
  3. Probabilitas proporsi sampel > 35%: Z = = 1.54 P( > 0.35) = P(Z > 1.54) = 0.0618

  1. Teorema Limit Pusat (Central Limit Theorem - CLT)

. Pernyataan CLT

Untuk sampel acak berukuran n dari populasi dengan mean dan varians ^2 terbatas, distribusi sampling mean sampel akan mendekati distribusi normal dengan mean dan varians ^2/n ketika n besar, terlepas dari bentuk distribusi populasi.

. Visualisasi CLT

Populasi (Bentuk Apa Saja) ↓ Sampel 1 → Mean₁ Sampel 2 → Mean₂ Sampel 3 → Mean₃ ⋮ Sampel k → Meanₖ ↓ Distribusi Mean₁, Mean₂, …, Meanₖ → NORMAL (bentuk lonceng)

C. Implikasi Praktis CLT

  1. Ukuran sampel n biasanya cukup untuk pendekatan normal

  2. Untuk populasi sangat skew, mungkin perlu n > 50

  3. Untuk populasi normal, berlaku untuk semua n

  4. Hubungan dengan Inferensi Statistik

A. Estimasi Interval (Interval Kepercayaan)

Untuk mean populasi ():

{x} Z_{/2}

{x} t_{/2}

Untuk proporsi populasi (p):

Z_{/2}

B. Contoh 4: Margin of Error

Survei 400 orang menunjukkan 60% setuju kebijakan ( = 0.6). Hitung margin of error 95% CI.

  1. Standar error: SE = = = 0.0245
  2. Z-score 95% = 1.96
  3. Margin of error: ME = 1.96 = 0.048
  4. 95% CI: 0.6 = (0.552, 0.648)

  1. Tabel Ringkasan Distribusi Sampling

Statistik Sampel Mean Standar Error Kondisi Normalitas Mean ({x}) {{x}} = {{x}} = Populasi normal ATAU n Proporsi () {} = p {} = np dan n(1-p) Selisih Mean ({x}_1 - {x}_2) _1 - _2 Masing-masing memenuhi kondisi mean Selisih Proporsi (_1 - _2) p_1 - p_2 Masing-masing memenuhi kondisi proporsi


  1. Contoh Soal Gabungan

Soal:

Perusahaan klaim rata-rata masa pakai baterai 100 jam dengan σ = 20 jam. Diambil sampel 50 baterai.

  1. Apa bentuk distribusi sampling mean masa pakai?
  2. Hitung probabilitas mean sampel < 95 jam.
  3. Hitung probabilitas mean sampel berbeda dari populasi > 3 jam.

Jawab:

  1. Bentuk: Mendekati normal (CLT, n = 50 )

  2. Probabilitas {x} < 95:

[ _{{x}} = = 2.828

[ Z = = -1.77

[ P({x} < 95) = P(Z < -1.77) = 0.0384

  1. Probabilitas |{x} - | > 3:

[ P({x} < 97 {x} > 103)

[ Z_1 = = -1.06

[ Z_2 = = 1.06

[ P = P(Z < -1.06) + P(Z > 1.06) = 0.1446 + 0.1446 = 0.2892


  1. Kesimpulan Utama

  2. Distribusi sampling menjelaskan variabilitas statistik sampel dari sampel ke sampel.

  3. Standar error (/) mengukur presisi estimasi → semakin besar n, semakin kecil error.

  4. Central Limit Theorem memungkinkan inferensi bahkan untuk populasi tidak normal.

  5. Aturan praktis: · Mean: gunakan normal jika populasi normal atau n · Proporsi: gunakan normal jika np dan n(1-p)

  6. Distribusi sampling adalah jembatan antara statistik deskriptif dan inferensial.

#### .Sample proprotion

4.0.0.1 . Rankuman Video Tersebut

Konsep Dasar: Distribusi sampling proporsi adalah distribusi probabilitas dari proporsi sampel() yang diperoleh dari semua sampel mungkin dengan ukuran n yang diambil dari suatu populasi. Proporsi sampel (\[\hat{p})\] digunakan untuk menduga proporsi populasi (p).

  1. Rata-rata dan Simpangan Baku Proporsi Sampel:

· Rata-rata/Rata-rata yang Diharapkan dari\[ \hat{p} sama dengan proporsi populasi p. \] {$$} = p · Simpangan Baku/Standar Error (SE) dari bergantung pada ukuran populasi. · Untuk Populasi Tak Terbatas atau Sampling dengan Pengembalian: {} = · Untuk Populasi Terbatas (ukuran N) tanpa Pengembalian: Perlu faktor koreksi. _{} =

  1. Teorema Limit Pusat untuk Proporsi (CLT for Proportions): Jika ukuran sampeln cukup besar (umumnya np dan n(1-p) ), maka distribusi sampling proporsi akan mendekati distribusi normal dengan parameter:

N ( p, )

Teorema ini memungkinkan kita menggunakan distribusi normal untuk menghitung probabilitas terkait .

  1. Aplikasi: Estimasi Interval untuk Proporsi Dengan CLT,kita dapat membangun Interval Kepercayaan (Confidence Interval/CI) untuk menduga proporsi populasi p.

· Rumus Umum CI 95% untuk p: Z^* SE (Nilai Z^* = 1.96 berasal dari distribusi normal standar untuk tingkat kepercayaan 95%). · Interpretasi: Kita 95% yakin bahwa proporsi populasi sebenarnya (p) berada dalam interval tersebut.

Latar Belakang: Sebuah jajak pendapat terhadap 600 orang pemilik mobil di suatu kota menemukan bahwa 180 di antaranya menggunakan mobil listrik hybrid.

Pertanyaan:

  1. Tentukan proporsi sampel (\[\hat{p}\]).
  2. Hitung Standar Error (SE) dari \[\hat{p}\].
  3. Buatlah estimasi interval kepercayaan 95% untuk proporsi sebenarnya (p) semua pemilik mobil di kota tersebut yang menggunakan hybrid.

Langkah Penyelesaian:

  1. Menghitung Proporsi Sampel (\[\hat{p})\]:

\[\hat{p} = \frac{180}{600}\] = 0.30

Artinya, 30% sampel menggunakan hybrid.

  1. Menghitung Standar Error (SE): Karena ukuran populasi kota diasumsikan jauh lebih besar dari sampel(600), kita gunakan rumus populasi tak terbatas.

SE = $$ = =

SE = = $$

  1. Membangun Interval Kepercayaan 95%:

· Rumus:\[ \hat{p} \pm 1.96 \cdot SE\]

  1. Kesimpulan (Interpretasi): Dengan tingkat kepercayaan 95%,kita memperkirakan proporsi sebenarnya (p) pemilik mobil hybrid di seluruh kota berada di antara 26.33% dan 33.67%.

5 . Review sampling distribution

Distribusi Sampling adalah distribusi probabilitas dari suatu statistik (seperti rata-rata sampel atau proporsi sampel) yang dihitung dari banyak sampel acak berukuran sama yang diambil dari suatu populasi.

Konsep ini penting karena memungkinkan kita memahami variasi statistik sampel dan menghitung probabilitas terkait, yang menjadi dasar inferensi statistik (penarikan kesimpulan tentang populasi dari data sampel).

Ini adalah konsep terpenting. Teorema Limit Pusat menyatakan bahwa jika Anda mengambil sampel acak yang cukup besar dari populasi apa pun, distribusi dari rata-rata sampel akan mendekati distribusi normal.

· Sampel “Cukup Besar”: Konvensinya adalah ukuran sampel (n) ≥ 30. · Untuk Populasi Normal: Jika populasi sudah berdistribusi normal, rata-rata sampel akan berdistribusi normal untuk sampel berukuran berapa pun.

untuk Rata-Rata Sampel (X̄)

CLT memungkinkan kita mendeskripsikan distribusi sampling rata-rata sampel dengan dua parameter ini:

. Rata-rata dari Distribusi Sampling (Nilai Harapan) Ini sama dengan rata-rata populasi(μ). Rata-rata semua kemungkinan rata-rata sampel akan berkumpul di sekitar rata-rata populasi sebenarnya.

\[ μ_X̄ = \]

. Simpangan Baku dari Distribusi Sampling (Galat Baku / Standard Error) Ini mengukur variabilitas rata-rata sampel di sekitar rata-rata populasi.Nilainya tergantung pada simpangan baku populasi (σ) dan ukuran sampel (n).

\[ σ_X̄ = σ / √\]

Galat baku mengecil seiring bertambahnya ukuran sampel. Artinya, sampel yang lebih besar memberikan estimasi yang lebih presisi.

Dengan demikian, distribusi sampling dapat dituliskan sebagai:

X̄ ~ N(μ, σ/√n) (jika n ≥ 30 atau populasi normal)

Menghitung Parameter Distribusi Sampling Sebuah populasi memiliki rata-rata(μ) 112 dan simpangan baku (σ) 40. Sebuah sampel acak berukuran n=50 diambil.

· Rata-rata distribusi sampling: μ_X̄ = 112 · Galat baku: σ_X̄ = 40 / √50 ≈ 40 / 7.071 ≈ 5.657

Menghitung Probabilitas untuk Rata-Rata Sampel Menggunakan populasi di atas,berapa probabilitas rata-rata sampelnya antara 110 dan 114? Karena n=50(≥30), CLT berlaku. Kita standarisasi nilainya menjadi skor-Z:

Z untuk 110: (110 - 112) / 5.657 ≈ -0.35
 Z untuk 114: (114 - 112) / 5.657 ≈ 0.35

Menggunakan tabel Z,probabilitas P(-0.35 < Z < 0.35) ≈ 0.2736 atau 27.36%.

Efek Ukuran Sampel (Mengapa Sampel Besar Lebih Baik)

Kasus Parameter Probabilitas \[(X < 48)\] Keterangan Satu Baterai μ=50 bulan, σ=6\[ P(X < 48)\] ≈ 0.3707 (37.07%) Melihat 1 individu, variasi tinggi. Sampel 36 Baterai μ_X̄=50, σ_X̄=6/√36\[=1 P(X̄ <\] 48) ≈ 0.0228 (2.28%) Melihat rata-rata sampel, variasi kecil.

Probabilitas untuk mendapatkan rata-rata umur sampel yang jauh dari rata-rata populasi (50) jauh lebih kecil daripada probabilitas untuk satu individu. Ini menunjukkan bahwa estimasi dari sampel besar lebih stabil dan dapat dipercaya.

. Distribusi Sampling menggambarkan perilaku statistik (seperti X) di semua kemungkinan sampel. . Teorema Limit Pusat adalah fondasi: dengan sampel yang cukup besar (n ≥ 30), distribusi X̄ akan mendekati normal, tanpa peduli bentuk populasi asalnya. Galat Baku (σ/√n) mengukur presisi estimasi sampel. Semakin besar n, semakin kecil galat bakunya, sehingga estimasi rata-rata populasi semakin tepat.

6 . Referensi

  1. ility and Statistical Inference oleh Robert V. Hogg, Joseph W. McKean
  2. Introduction to Mathematical Statistics and Its Applications oleh Richard J. Larsen dan Morris L. Marx
  3. Statistical Methods for the Social Sciences oleh Alan Agresti dan Barbara Finlay
  4. Introduction to Mathematical Statistics and Its Applications oleh Richard J. Larsen dan Morris L. Marx
