Probability Distributions

Tugas Week-11

December 07, 2025

Profile Photo

KAYLA APRILIA

Data Science Student at ITSB

NIM: 52250057

Email: kaylaaprilia2142@gmail.com

R Programming Data Science Statistics


1 Probability Distributions

Distribusi probabilitas adalah representasi matematis dari kemungkinan berbagai nilai yang dapat diambil oleh variabel acak. Distribusi ini membantu memahami seberapa besar peluang tiap hasil terjadi, baik untuk variabel diskret maupun kontinu, dan menjadi dasar penting dalam analisis data, prediksi, dan pengambilan keputusan statistik.


1.1 Continuous Random

Video: Distribusi Probabilitas Variabel Kontinu.


๐Ÿ“Œ Pengantar Probabilitas Variabel Kontinu

Variabel kontinu adalah variabel yang dapat mengambil semua nilai dalam interval tertentu. Contohnya tinggi badan, berat badan, atau waktu yang dibutuhkan suatu proses. Probabilitas variabel kontinu diukur melalui area di bawah kurva fungsi densitas probabilitas (PDF), bukan melalui nilai tunggal.


๐Ÿงฎ Fungsi Densitas Probabilitas (PDF)

Fungsi densitas probabilitas \(f(x)\) memenuhi sifat:

  1. \(f(x) \ge 0\) untuk semua \(x\)
  2. Total area di bawah kurva = 1

\[ \int_{-\infty}^{\infty} f(x) \, dx = 1 \]

Peluang variabel kontinu berada dalam interval \([a, b]\) dihitung dengan:

\[ P(a \le X \le b) = \int_a^b f(x) \, dx \]


๐Ÿ“ Fungsi Distribusi Kumulatif (CDF)

CDF \(F(x)\) menyatakan peluang variabel acak kurang dari atau sama dengan \(x\):

\[ F(x) = P(X \le x) = \int_{-\infty}^{x} f(t) \, dt \]

Sifat CDF: - \(0 \le F(x) \le 1\) - \(F(x)\) bersifat monoton naik


โš™๏ธ Distribusi Kontinu Populer

  1. Distribusi Uniform Kontinu

\[ f(x) = \begin{cases} \frac{1}{b-a}, & a \le x \le b \\ 0, & \text{lainnya} \end{cases} \]

  1. Distribusi Normal (Gaussian)

\[ f(x) = \frac{1}{\sigma \sqrt{2\pi}} \exp\Big[-\frac{(x-\mu)^2}{2\sigma^2}\Big] \]


โœ… Contoh Probabilitas Variabel Kontinu

Misalkan tinggi badan mahasiswa mengikuti distribusi normal:

\[ X \sim N(165, 5^2) \]

Artinya: - Rataan tinggi badan = 165 cm
- Simpangan baku = 5 cm


๐Ÿ”น Probabilitas pada Interval

Peluang mahasiswa memiliki tinggi badan antara 160 cm dan 170 cm:

\[ P(160 \le X \le 170) \]

Standarisasi:

\[ Z = \frac{X - \mu}{\sigma} \]

\[ Z_1 = \frac{160 - 165}{5} = -1, \quad Z_2 = \frac{170 - 165}{5} = 1 \]

Dari tabel normal:

\[ P(-1 \le Z \le 1) = 0.6826 \]

๐Ÿ“Œ Interpretasi:
Sekitar 68,26% mahasiswa memiliki tinggi badan antara 160โ€“170 cm.


๐Ÿ”น Probabilitas Nilai Tunggal

\[ P(X = 165) = 0 \]

๐Ÿ“Œ Interpretasi:
Untuk variabel kontinu, probabilitas hanya bermakna pada interval, bukan pada satu nilai.


๐Ÿ”น CDF (Singkat)

\[ F(170) = P(X \le 170) \approx 0.8413 \]

๐Ÿ“Œ Interpretasi:
Sekitar 84,13% mahasiswa memiliki tinggi badan โ‰ค 170 cm.


๐Ÿ”Ž Catatan

  • Untuk variabel kontinu, probabilitas pada nilai tunggal selalu nol:

\[ P(X = x) = 0 \]

  • Probabilitas hanya dapat dihitung dalam interval \([a, b]\) melalui integrasi PDF.
  • Rataan (\(E[X]\)) dan varians (\(Var(X)\)) dihitung dengan:

\[ E[X] = \int_{-\infty}^{\infty} x f(x) \, dx, \quad Var(X) = \int_{-\infty}^{\infty} (x - E[X])^2 f(x) \, dx \]


1.2 Sampling Distributions

Video: Distribusi Sampel.


๐ŸŽฏ Distribusi Sampling (Sampling Distribution)

Distribusi sampling adalah distribusi probabilitas dari statistik sampel (misal mean, proporsi) yang diperoleh dari berbagai sampel yang diambil dari populasi yang sama. Distribusi ini memungkinkan kita menilai variabilitas statistik sampel dan melakukan inferensi ke populasi.


๐Ÿ”น 1. Statistik Sampel

Beberapa statistik sampel yang umum digunakan: - ๐ŸŸข Rataan sampel (\(\bar{X}\))
- ๐Ÿ”ต Proporsi sampel (\(\hat{p}\))
- ๐ŸŸก Varians sampel (\(S^2\))


๐Ÿ“ 2. Rataan dan Varians Sampling

Jika populasi memiliki mean \(\mu\) dan varians \(\sigma^2\), maka:

  • โœจ Rataan sampel:

\[ E[\bar{X}] = \mu \]

  • โœจ Varians sampel (Sampling Variance):

\[ Var(\bar{X}) = \frac{\sigma^2}{n} \]

  • โœจ Standar error (SE):

\[ SE(\bar{X}) = \frac{\sigma}{\sqrt{n}} \]

๐Ÿ“ Catatan: \(n\) = ukuran sampel


๐Ÿ“Š 3. Distribusi Sampling Rataan

  • Jika populasi berdistribusi normal, maka distribusi rataan sampel juga normal untuk semua ukuran sampel \(n\).
  • Jika populasi tidak normal, menurut Central Limit Theorem (CLT), \(\bar{X}\) akan mendekati distribusi normal saat \(n\) besar (\(n \ge 30\)).

\[ \bar{X} \sim N\Big(\mu, \frac{\sigma^2}{n}\Big) \]


๐Ÿ“Š 4. Distribusi Sampling Proporsi

Jika proporsi populasi = \(p\), ukuran sampel = \(n\):

  • ๐ŸŸข Rataan: \(E[\hat{p}] = p\)
  • ๐Ÿ”ต Varians: \(Var(\hat{p}) = \frac{p(1-p)}{n}\)
  • ๐ŸŸก Standar error: \(SE(\hat{p}) = \sqrt{\frac{p(1-p)}{n}}\)

โœ… Contoh Distribusi Sampling

Misalkan populasi nilai ujian memiliki:

\[ \mu = 70, \quad \sigma = 10 \]

Diambil sampel acak berukuran:

\[ n = 25 \]


๐Ÿ”น Distribusi Sampling Rataan Sampel

Rataan dan standar error:

\[ E[\bar{X}] = 70, \quad SE(\bar{X}) = \frac{10}{\sqrt{25}} = 2 \]

Distribusi rataan sampel:

\[ \bar{X} \sim N(70, 4) \]

๐Ÿ“Œ Interpretasi:
Rataan sampel berfluktuasi di sekitar 70 dengan penyimpangan rata-rata 2 poin antar sampel.


๐Ÿ”น Probabilitas Rataan Sampel

Peluang rataan sampel lebih besar dari 74:

\[ Z = \frac{74 - 70}{2} = 2 \]

\[ P(\bar{X} > 74) = P(Z > 2) = 0.0228 \]

๐Ÿ“Œ Interpretasi:
Hanya 2,28% sampel yang memiliki rataan di atas 74.


๐Ÿ”น Distribusi Sampling Proporsi

Misalkan proporsi kelulusan populasi:

\[ p = 0.6, \quad n = 100 \]

Standar error proporsi:

\[ SE(\hat{p}) = \sqrt{\frac{0.6(0.4)}{100}} = 0.049 \]

๐Ÿ“Œ Interpretasi:
Proporsi kelulusan sampel biasanya menyimpang sekitar 4,9% dari proporsi populasi.


โœ… Kesimpulan Singkat

  • Statistik sampel bervariasi antar sampel
  • Variabilitas ini diukur melalui distribusi sampling
  • Semakin besar \(n\), standar error semakin kecil

๐Ÿ”Ž Catatan

  • Distribusi sampling menggambarkan variabilitas statistik sampel antar sampel.
  • Informasi ini penting untuk inferensi statistik, seperti membuat interval kepercayaan dan uji hipotesis.
  • Central Limit Theorem memungkinkan kita menggunakan distribusi normal untuk rataan sampel meskipun populasi tidak normal, jika sampel cukup besar.

1.3 Central Limit Theorem

Video: Teorema Batas Pusat.


๐ŸŽฏ Teorema Limit Pusat (Central Limit Theorem / CLT)

Teorema Limit Pusat adalah prinsip fundamental dalam statistika yang menyatakan bahwa:

โ€œJika kita mengambil sampel berukuran \(n\) yang cukup besar dari populasi apa pun (terlepas dari distribusi populasi), maka distribusi rataan sampel \(\bar{X}\) akan mendekati distribusi normal dengan mean \(\mu\) dan varians \(\sigma^2/n\).โ€


๐Ÿ”น 1๏ธโƒฃ Notasi dan Rumus

Jika populasi memiliki mean \(\mu\) dan varians \(\sigma^2\), dan sampel berukuran \(n\), maka:

\[ \bar{X} \sim N\Big(\mu, \frac{\sigma^2}{n}\Big) \]

  • ๐ŸŸข \(\bar{X}\) = rataan sampel
  • ๐Ÿ”ต \(\mu\) = mean populasi
  • ๐ŸŸก \(\sigma^2\) = varians populasi
  • ๐ŸŸฃ \(n\) = ukuran sampel

๐Ÿ’ซ Standar error (SE) rataan sampel:

\[ SE(\bar{X}) = \frac{\sigma}{\sqrt{n}} \]


๐Ÿ”น 2๏ธโƒฃ Syarat CLT

  • ๐ŸŽฒ Sampel diambil secara acak dari populasi
  • ๐Ÿ“ Ukuran sampel cukup besar (\(n \ge 30\))
  • ๐ŸŒ Populasi bisa apa pun bentuk distribusinya (normal atau tidak)

๐Ÿ”น 3๏ธโƒฃ Implikasi

  • ๐Ÿ“Š Memungkinkan penggunaan distribusi normal untuk membuat interval kepercayaan atau uji hipotesis meski populasi tidak normal.
  • ๐Ÿ”ผ Semakin besar \(n\), distribusi rataan sampel semakin mendekati normal.
  • ๐Ÿง  Fundamental dalam inferensi statistik dan analisis data nyata.

๐Ÿ”น 4๏ธโƒฃ Catatan Visualisasi

  • ๐Ÿ“‰ Distribusi populasi mungkin tidak normal.
  • ๐Ÿ”” Distribusi rataan sampel (\(\bar{X}\)) akan membentuk kurva lonceng normal.
  • ๐ŸŽฏ Digunakan untuk memprediksi probabilitas rataan sampel dan mengurangi variabilitas dengan sampel besar.

โœ… Contoh Teorema Limit Pusat (CLT)

Misalkan populasi waktu tunggu layanan memiliki bentuk distribusi yang tidak normal dengan:

\[ \mu = 10 \text{ menit}, \quad \sigma = 4 \text{ menit} \]

Diambil sampel acak berukuran:

\[ n = 40 \]


๐Ÿ”” Distribusi Rataan Sampel

Berdasarkan Teorema Limit Pusat:

\[ \bar{X} \sim N\Big(10, \frac{4^2}{40}\Big) = N(10, 0.4) \]

Standar error:

\[ SE(\bar{X}) = \frac{4}{\sqrt{40}} \approx 0.63 \]


๐ŸŽฏ Probabilitas Rataan Sampel

Peluang rataan sampel lebih besar dari 11 menit:

\[ Z = \frac{11 - 10}{0.63} \approx 1.58 \]

\[ P(\bar{X} > 11) = P(Z > 1.58) \approx 0.057 \]

๐Ÿ“Œ Interpretasi:
Hanya sekitar 5,7% sampel yang memiliki rataan waktu tunggu lebih dari 11 menit.


โœ… Inti CLT

  • Distribusi populasi tidak harus normal
  • Rataan sampel akan mendekati normal saat \(n\) cukup besar
  • CLT memungkinkan kita menghitung peluang, interval kepercayaan, dan uji hipotesis

1.4 Sample Proportion

Video: Distribusi Sampel dan Proporsi Sampel.


๐ŸŽฏ Distribusi Sampel Proporsi Sampel

Distribusi sampel proporsi adalah distribusi probabilitas dari proporsi sampel (\(\hat{p}\)) yang diperoleh dari berbagai sampel dari populasi yang sama. Distribusi ini membantu kita menilai variabilitas proporsi antar sampel dan melakukan inferensi ke populasi.


๐Ÿ”น 1๏ธโƒฃ Notasi dan Rumus

Jika proporsi populasi = \(p\) dan ukuran sampel = \(n\), maka:

  • ๐ŸŸข Rataan proporsi sampel:

\[ E[\hat{p}] = p \]

  • ๐Ÿ”ต Varians proporsi sampel:

\[ Var(\hat{p}) = \frac{p(1-p)}{n} \]

  • ๐ŸŸก Standar error (SE):

\[ SE(\hat{p}) = \sqrt{\frac{p(1-p)}{n}} \]


๐Ÿ”น 2๏ธโƒฃ Distribusi Proporsi Sampel

Jika ukuran sampel cukup besar (\(n \ge 30\)) dan \(np \ge 5\), \(n(1-p) \ge 5\), distribusi sampel proporsi mendekati distribusi normal:

\[ \hat{p} \sim N\Big(p, \frac{p(1-p)}{n}\Big) \]


๐Ÿ”น 3๏ธโƒฃ Syarat Penting

  • Sampel diambil secara acak
  • Ukuran sampel cukup besar untuk mendekati normal
  • Proporsi sampel digunakan untuk membuat interval kepercayaan atau uji hipotesis

๐Ÿ”น 4๏ธโƒฃ Catatan Visualisasi

  • Distribusi proporsi sampel mendekati bentuk kurva lonceng normal
  • Semakin besar ukuran sampel, variabilitas proporsi berkurang
  • Penting untuk analisis survei, polling, dan eksperimen berbasis proporsi

โœ… Contoh Distribusi Sampel Proporsi

Misalkan proporsi populasi mahasiswa yang lulus tepat waktu adalah:

\[ p = 0.60 \]

Diambil sampel acak sebanyak:

\[ n = 100 \]


๐Ÿ“Š Rataan dan Standar Error

  • Rataan proporsi sampel:

\[ E(\hat{p}) = 0.60 \]

  • Standar error:

\[ SE(\hat{p}) = \sqrt{\frac{0.6(1-0.6)}{100}} = 0.049 \]


๐ŸŽฏ Distribusi Proporsi Sampel

Karena:

\[ np = 60 \ge 5 \quad \text{dan} \quad n(1-p) = 40 \ge 5 \]

maka:

\[ \hat{p} \sim N(0.60, 0.049^2) \]


๐Ÿ” Probabilitas Proporsi Sampel

Peluang proporsi sampel lebih dari 0.65:

\[ Z = \frac{0.65 - 0.60}{0.049} \approx 1.02 \]

\[ P(\hat{p} > 0.65) \approx 0.153 \]

๐Ÿ“Œ Interpretasi:
Sekitar 15,3% sampel menunjukkan proporsi kelulusan lebih dari 65%.


โœ… Inti Distribusi Sampel Proporsi

  • Rataan proporsi sampel sama dengan proporsi populasi
  • Ukuran sampel besar โ†’ sebaran makin sempit
  • Digunakan luas dalam survei, polling, dan riset sosial

1.5 Review Sampling Distribution

Video: Tinjauan Distribusi Sampel.


๐ŸŽฏ Review: Probabilitas & Distribusi Sampel

๐Ÿ”น 1๏ธโƒฃ Probability (Probabilitas)

  • Probabilitas mengukur kemungkinan suatu kejadian terjadi:

\[ 0 \le P(A) \le 1 \]

  • Untuk kejadian diskrit:

\[ P(A) = \frac{\text{Jumlah kejadian A}}{\text{Jumlah seluruh kemungkinan}} \]

  • Aturan penting:
    • Kejadian komplemen: \(P(A^c) = 1 - P(A)\)
    • Kejadian gabungan (independen): \(P(A \cap B) = P(A) \cdot P(B)\)

๐Ÿ”น 2๏ธโƒฃ Binomial Distribution (Distribusi Binomial)

  • Digunakan untuk menghitung probabilitas sukses dalam n percobaan independen
  • Rumus PMF (Probability Mass Function):

\[ P(X = k) = \binom{n}{k} p^k (1-p)^{n-k}, \quad k = 0, 1, \dots, n \]

  • Rataan dan varians:

\[ E[X] = n \cdot p, \quad Var(X) = n \cdot p \cdot (1-p) \]

  • Contoh: jumlah kepala dari 10 lemparan koin (\(p = 0.5\))

๐Ÿ”น 3๏ธโƒฃ Sampling Distribution of the Sample Proportion (\(\hat{p}\))

  • Distribusi probabilitas dari proporsi sampel \(\hat{p}\) dari populasi dengan proporsi \(p\).
  • Rataan dan varians proporsi sampel:

\[ E[\hat{p}] = p, \quad Var(\hat{p}) = \frac{p(1-p)}{n}, \quad SE(\hat{p}) = \sqrt{\frac{p(1-p)}{n}} \]

  • Jika \(n\) besar dan \(np \ge 5\), \(n(1-p) \ge 5\), distribusi \(\hat{p}\) mendekati distribusi normal:

\[ \hat{p} \sim N\Big(p, \frac{p(1-p)}{n}\Big) \]

  • Penting untuk interval kepercayaan dan uji hipotesis berbasis proporsi.

โœ… Contoh Probabilitas dan Distribusi Sampel

Misalkan sebuah survei menyelidiki proporsi mahasiswa yang lulus tepat waktu.


๐ŸŽฒ 1๏ธโƒฃ Probabilitas Dasar

Jika peluang seorang mahasiswa lulus tepat waktu adalah:

\[ p = 0.6 \]

maka peluang tidak lulus tepat waktu:

\[ P(A^c) = 1 - 0.6 = 0.4 \]


๐ŸŽฏ 2๏ธโƒฃ Distribusi Binomial

Diambil sampel 10 mahasiswa, dengan peluang lulus tepat waktu \(p=0.6\).
Peluang tepat 7 mahasiswa lulus tepat waktu:

\[ P(X=7) = \binom{10}{7}(0.6)^7(0.4)^3 \]

Distribusi binomial digunakan karena: - Percobaan independen - Hanya dua hasil (lulus / tidak) - Peluang tetap


๐Ÿ“Š 3๏ธโƒฃ Distribusi Sampel Proporsi

Jika diambil sampel lebih besar:

\[ n = 100 \]

  • Rataan proporsi sampel:

\[ E(\hat{p}) = 0.6 \]

  • Standar error:

\[ SE(\hat{p}) = \sqrt{\frac{0.6(1-0.6)}{100}} = 0.049 \]

Karena:

\[ np = 60 \ge 5 \quad \text{dan} \quad n(1-p)=40 \ge 5 \]

maka:

\[ \hat{p} \sim N(0.6, 0.049^2) \]


๐ŸŽฏ Kesimpulan:

  • Probabilitas โ†’ mengukur peluang kejadian
  • Distribusi Binomial โ†’ menghitung jumlah sukses
  • Distribusi Sampel Proporsi โ†’ mempelajari variabilitas proporsi antar sampel
  • Semua konsep menjadi dasar inferensi statistik seperti estimasi dan uji hipotesis

๐Ÿ”น ๐Ÿ“Œ Catatan Umum

  • Semua konsep di atas saling terkait: probabilitas dasar โ†’ distribusi binomial โ†’ distribusi sampel.
  • Central Limit Theorem (CLT) memungkinkan penggunaan distribusi normal pada sampel besar.
  • Visualisasi distribusi (histogram, PMF, PDF) membantu memahami probabilitas dan variabilitas sampel.

2 References

  1. Adhitya, F. K., & Parhusip, J. (2024). Analisis distribusi sampling rataโ€‘rata untuk mengevaluasi performa peserta ujian. Journal of Multidisciplinary Inquiry in Science, Technology and Educational Research, 2(1), 800โ€“807. https://jurnal.serambimekkah.ac.id/index.php/mister/article/view/2556
    • Relevansi: Membahas distribusi sampling rataโ€‘rata dengan data nyata, mendukung konsep distribusi sampling dan CLT.
  2. Nurhaliza, D. R., Kurniati, A., & Yuniati, S. (2024). Model distribusi binomial dalam mengukur probabilitas keberhasilan uji coba kualitas layanan sistem informasi. Jurnal Teknologi dan Manajemen Industri Terapan, 3(4), 405โ€“410. https://jurnal-tmit.com/index.php/home/article/view/506
    • Relevansi: Penerapan distribusi binomial untuk menghitung probabilitas โ€” sesuai materi probabilitas dan distribusi binomial.
  3. Stefhany, C., & Juwita. (2024). Penggunaan distribusi sampling untuk mengidentifikasi kesenjangan digital berdasarkan data akses digital. Jurnal Ilmiah Nusantara, 2(1). https://ejurnal.kampusakademik.co.id/index.php/jinu/article/view/3165
    • Relevansi: Distribusi sampling proporsi sampel untuk analisis data nyata, mendukung materi distribusi proporsi dan aplikasi praktis.
  4. Introduction to Statistics. โ€œ7 Probability Distributions.โ€ In Introduction to Statistics, dsciencelabs. https://bookdown.org/dsciencelabs/intro_statistics/07-Probability_Distributions.html