Probability Distribution

Assignment ~ Week 11

Safina Zahra (52250033)

Student Majoring in Data Science

R Programming

Data Science

Statistics


Pendahuluan

Distribusi probabilitas merupakan fondasi kritis dalam statistika inferensial, yang berperan sebagai kerangka teoritis untuk memahami variasi, menghitung probabilitas, dan melakukan prediksi berdasarkan data. Melalui bab ini, saya akan mempelajari konsep-konsep utama terkait variabel acak kontinu, yang menggambarkan fenomena dengan nilai-nilai dalam suatu rentang kontinu, serta distribusi sampling yang menjadi landasan dalam pengambilan keputusan statistik. Pembahasan akan mencakup distribusi rata-rata sampel dan proporsi sampel, serta Teorema Batas Pusat (Central Limit Theorem) yang menjelaskan konvergensi distribusi rata-rata sampel menuju distribusi normal sebuah prinsip fundamental yang memberdayakan banyak metode analisis data.

Pada kesempatan ini, saya ingin menyampaikan terima kasih yang tulus kepada Bapak Bakti Siregar, M.Sc., CDS., selaku dosen pengampu mata kuliah Statistika. Atas bimbingan, ilmu, serta dedikasi yang telah Bapak berikan, saya dapat memahami konsep-konsep mendalam ini dengan lebih jelas dan terstruktur. Semoga materi ini dapat saya manfaatkan dengan baik dalam pengembangan kompetensi statistik saya lebih lanjut.

1. Acak Beraturan

Klik gambar untuk menonton video

1.1 Variabel Diskrit

Nilainya terbatas dan dapat dihitung (contoh: jumlah anak, hasil lempar koin, nilai ujian). Direpresentasikan dengan diagram batang/ bar chart.

1.2 Variabel kontinu

Nilainya tak terbatas dan diukur, bukan dihitung. Dapat mengambil nilai desimal apa pun dalam suatu rentang (contoh: berat, usia, suhu). Direpresentasikan dengan histogram atau kurva kepadatan.

1.3 Distribusi Probabilitas

Variabel Acak Diskrit

# Visualisasi Variabel Acak Diskrit: Jumlah Kepala dari 4 Koin

n <- 4           # jumlah lemparan koin
p <- 0.5         # peluang muncul kepala
k <- 0:n         # kemungkinan hasil: 0,1,2,3,4 kepala

# Hitung probabilitas distribusi binomial
prob <- dbinom(k, size = n, prob = p)

# Barplot dengan celah antar batang untuk menunjukkan diskrit
barplot(prob,
        names.arg = k,
        space = 0.5,        # memberi jarak antar batang
        ylim = c(0, max(prob) + 0.05),
        xlab = "Number of Heads",
        ylab = "Probability (P)",
        main = "Discrete Random Variables\nProbability Distribution",
        col = "darkgreen",
        border = "white")

abline(h = 0)   # garis dasar

Interpretasi

Variabel jumlah kepala dari 4 lemparan koin adalah diskrit, karena hanya dapat bernilai 0, 1, 2, 3, atau 4. Diagram batang digunakan untuk menunjukkan probabilitas setiap hasil tersebut. Celah antar batang menegaskan bahwa nilai-nilainya terpisah dan tidak kontinu.

variabel acak kontinu

# Visualisasi Variabel Acak Kontinu: Distribusi Probabilitas

set.seed(123)  # agar hasil tetap sama saat diulang

# Contoh data variabel kontinu (misal: tinggi/berat atau data acak normal)
data <- rnorm(500, mean = 5, sd = 1.5)

# Membuat histogram sebagai representasi distribusi probabilitas
hist(data,
     breaks = 10,              # jumlah batang (mirip pada gambar)
     freq = FALSE,            # gunakan densitas, bukan frekuensi
     col = "purple",
     border = "white",
     main = "Continuous Random Variables\nProbability Distribution",
     xlab = "Values",
     ylab = "Density")

# Tambahkan kurva densitas (bentuk halus)
lines(density(data), lwd = 2)

Interpretasi

Variabel acak kontinu memiliki jumlah nilai yang tak terbatas dalam suatu interval. Pada histogram ini, setiap batang mewakili kepadatan probabilitas untuk rentang nilai tertentu. Tidak ada celah seperti pada variabel diskrit karena nilainya bersifat kontinu dapat mengambil nilai berapa pun di dalam interval tersebut. Kurva densitas memperlihatkan bentuk distribusi probabilitasnya secara halus dan berkelanjutan.

1.3 Rumus Probabilitas

Variabel Acak Diskrit

\[P(k) = \binom{n}{k} p^{k} (1 - p)^{,n-k}\]

Keterangan:

  • Rumus distribusi binomial
    1. = jumlah percobaan
    1. = jumlah keberhasilan
    1. = peluang keberhasilan dalam 1 percobaan
  • () = kombinasi dari (n) dipilih (k)

\[P(A \cup B) = P(A) + P(B) - P(A \cap B)\] Keterangan:

  • Peluang gabungan kejadian (A) atau (B)
  • () = union (gabungan)
  • Mengurangi bagian yang tumpang tindih

\[P(A \cap B) = P(A) \times P(B)\] Keterangan:

  • Peluang kedua kejadian terjadi bersama
  • () = intersection (irisan)
  • Berlaku untuk kejadian independen

\[P(A^c) = 1 - P(A)\] Keterangan:

  • Peluang komplemen (kebalikan kejadian (A))
  • (A^c) = kejadian “tidak A”

dan lain-lain.

Variabel Acak Kontinu

\[\int_{-\infty}^{\infty} f(x),dx = 1\]

Keterangan:

  • (f(x)) = fungsi densitas
  • Jumlah total probabilitas = 1

\[F(x) = P(X \le x) = \int_{-\infty}^{x} f(t),dt\]

Keterangan:

  • Probabilitas nilai acak tidak melebihi (x)

\[X \sim N(\mu,,\sigma^2)\]

Dengan transformasi Z-score:

\[z = \frac{x - \mu}{\sigma}\]

Keterangan:

  • () = mean
  • () = standar deviasi
  • Mengubah data ke distribusi normal baku

\[f(x) = \frac{1}{b-a}, \quad a \le x \le b\]

Keterangan:

  • Semua nilai pada interval ([a,b]) punya peluang sama

\[f(x) = \lambda e^{-\lambda x}, \quad x \ge 0\] Keterangan:

  • Untuk waktu tunggu kejadian (misal kedatangan pelanggan)

2. Distribusi Sampel

Klik gambar untuk menonton video

2.1 Distribusi Sampel

Distribusi data dari satu sampel tunggal yang diambil dari populasi.

Fokus : Menjelaskan karakteristik (seperti mean, variansi) dari sampel itu saja.

Tujuan: Untuk menganalisis dan menafsirkan data dari kelompok spesifik yang telah diukur.

Contoh: Anda mengukur tinggi 50 orang mahasiswa di satu kelas dan membuat histogramnya. Histogram itu adalah distribusi sampel untuk kelas tersebut.

2.2 Distribusi Sampling

Distribusi teoritis dari sebuah statistik (misalnya, rata-rata sampel / x̄) yang dihitung dari banyak sampel acak berukuran sama (n) yang diambil berulang kali dari populasi yang sama.

Fokus: Menjelaskan variabilitas dan pola dari statistik sampel (bukan data individu) itu sendiri.

Tujuan: Untuk membuat inferensi statistik tentang parameter populasi (misalnya, rata-rata populasi / μ) dan menghitung probabilitas terkait estimasi sampel.

Contoh: Anda mengambil 200 sampel acak, masing-masing berisi 50 mahasiswa. Untuk setiap sampel, Anda hitung rata-ratanya (x̄). Distribusi dari 200 nilai x̄ tersebut membentuk distribusi sampling dari rata-rata.

Proses membentuk Distribusi Sampling dari Rata-rata(x̄): 1. Dari populasi, ambil sampel acak berukuran n (contoh: n=5). 2. Hitung rata-ratanya \[(\bar{X})\] untuk sampel itu (contoh: \[bar{X}=129 cm\]). 3. Ulangi langkah 1 dan 2 berkali-kali (ratusan/ribuan kali). 4. Kumpulkan semua nilai \[(\bar{X})\] yang didapat, lalu buat distribusi frekuensi dari kumpulan nilai \[(\bar{X})\] tersebut. Distribusi inilah yang disebut Distribusi Sampling.

2.3 Hubungan antara kedua distribusi

1. Distribusi Populasi

  • Distribusi data dari setiap individu dalam populasi.
  • Notasi: X ~ N(μ, σ)
  • Rata-rata (Mean): μ
  • Simpangan Baku: σ
  • Variabilitas: Lebih besar karena mengukur individu-individu dengan nilai yang bisa sangat bervariasi.
  • Rumus Standarisasi (Z-score): \(Z = \frac{X - μ}{σ}\) Digunakan untuk mencari peluang/proporsi terkait satu observasi individu (X).

2. Distribusi Sampling (Rata-rata Sampel)

  • Distribusi dari statistik (misalnya, rata-rata / (x̄) yang dihitung dari banyak sampel berulang berukuran n yang diambil dari populasi.
  • Notasi:x̄ ~ N(μ, σ/√n)
  • Rata-rata (Mean): μ_x̄ = μ (sama dengan mean populasi).
  • Simpangan Baku (Standar Error):** σ_x̄ = σ / √n(selalu lebih kecil dari σ)
  • Variabilitas: Lebih kecil karena adalah rata-rata. Rata-rata dari sekelompok data cenderung lebih stabil dan kurang bervariasi daripada nilai individu.
  • Rumus Standarisasi (Z-score): \(Z = \frac{\bar{x} - \mu}{\sigma / \sqrt{n}}\) Digunakan untuk mencari peluang/proporsi terkait rata-rata sampel (x̄).

2.4 Contoh Soal

Soal 1:

Diketahui bahwa tinggi badan seluruh warga Kanada mengikuti distribusi normal dengan rata-rata 160 cm dan simpangan baku 7 cm. Berapakah peluang bahwa rata-rata tinggi badan dari 10 warga Kanada yang dipilih secara acak kurang dari 157 cm?

Langkah-Langkah Perhitungan:

Diketahui tinggi seluruh orang Kanada berdistribusi normal dengan:

  • Rata-rata populasi (μ) = 160 cm
  • Simpangan baku populasi (σ) = 7 cm

Kita mengambil sampel acak sebanyak n = 10 orang. Tujuan: mencari probabilitas bahwa rata-rata tinggi sampel tersebut kurang dari 157 cm.

  1. Distribusi sampling mean

    \[\mu_{\bar{X}} = \mu = 160,\quad \sigma_{\bar{X}} = \frac{\sigma}{\sqrt{n}} = \frac{7}{\sqrt{10}} \approx 2,21\]

  2. Hitung nilai Z

    \[Z = \frac{157 - 160}{2,21} \approx -1,36\]

  3. Gunakan Tabel Z

    • (Z = -1,36) memberikan nilai probabilitas ≈ 0,0869
    • Artinya: kemungkinan rata-rata tinggi 10 orang Kanada < 157 cm adalah 8,69%
# Parameter populasi dan sampel
mu <- 160
sigma <- 7
n <- 10

# Standard error
se <- sigma / sqrt(n)

# Batas nilai yang dicari
x_value <- 157

# Hitung probabilitas
prob <- pnorm(x_value, mean = mu, sd = se)

# Data untuk kurva
x <- seq(mu - 4*se, mu + 4*se, length = 1000)
y <- dnorm(x, mean = mu, sd = se)

# Plot kurva distribusi sampling
plot(x, y, type = "l", lwd = 2,
     xlab = "Rata-rata Sampel (cm)",
     ylab = "Kerapatan",
     main = "Distribusi Sampling Mean Tinggi Orang Kanada")

# Arsiran area di bawah 157
x_shade <- seq(min(x), x_value, length = 500)
y_shade <- dnorm(x_shade, mean = mu, sd = se)
polygon(c(x_shade, x_value), c(y_shade, 0), density = 20)

# Garis vertikal penanda nilai
abline(v = mu, lwd = 2, lty = 2)     # Mean
abline(v = x_value, col = "red", lwd = 2)
text(x_value, max(y)*0.8, "157 cm", pos = 4, col = "red")

# Tampilkan probabilitas

Soal 2:

Diketahui bahwa tinggi badan seluruh warga Kanada mengikuti distribusi normal dengan rata-rata 160 cm dan simpangan baku 7 cm. Berapakah proporsi dari seluruh warga Kanada yang memiliki tinggi badan lebih dari 170 cm?

Langkah-Langkah Perhitungan:

Karena yang ditanyakan adalah semua orang, maka digunakan distribusi populasi (bukan distribusi sampling).

Diketahui populasi:

  • Mean (μ) = 160 cm
  • Simpangan baku (σ) = 7 cm

Tujuan: mencari probabilitas (X > 170)

  1. Hitung nilai Z

    \[Z = \frac{170 - 160}{7} = \frac{10}{7} \approx 1,43\]

  2. Gunakan tabel Z

    • Area kiri Z = 1,43 → 0,9236

    • Area kanan (yang dicari):

      \[1 - 0,9236 = 0,0764\] Jadi proporsi orang yang tingginya lebih dari 170 cm adalah:

\[ \boxed{0.0764 \text{ atau } 7.64\%} \]

# Parameter populasi
mu <- 160
sigma <- 7

# Batas nilai
x_value <- 170

# Hitung probabilitas
prob <- 1 - pnorm(x_value, mean = mu, sd = sigma)

# Data untuk kurva
x <- seq(mu - 4*sigma, mu + 4*sigma, length = 1000)
y <- dnorm(x, mean = mu, sd = sigma)

# Plot distribusi populasi
plot(x, y, type = "l", lwd = 2,
     xlab = "Tinggi (cm)",
     ylab = "Kerapatan",
     main = "Distribusi Tinggi Orang Kanada")

# Arsiran area di kanan 170 cm
x_shade <- seq(x_value, max(x), length = 500)
y_shade <- dnorm(x_shade, mean = mu, sd = sigma)
polygon(c(x_shade, x_value), c(y_shade, 0), density = 20)

# Garis penanda
abline(v = mu, lwd = 2, lty = 2)      # Mean
abline(v = x_value, col = "red", lwd = 2)
text(x_value, max(y)*0.8, "170 cm", pos = 4, col = "red")

# Tampilkan probabilitas

3. Teorema Limit Pusat

Klik gambar untuk menonton video

3.1 Pengertian

Jika ukuran sampel n cukup besar, maka distribusi sampling dari mean sampel akan mendekati distribusi normal, terlepas dari bentuk distribusi populasi aslinya.

3.2 Syarat Utama

Kondisi Ukuran Sampel Distribusi Sampling
n ≥ 30 Akan mendekati normal → Teorema Limit Pusat berlaku
n < 30 Belum tentu normal → Teorema Limit Pusat tidak berlaku

dan n < 30 tapi populasi normal Jika populasi sudah normal sejak awal, Distribusi sampling tetap normal meskipun sampel kecil.

3.3 Rumus Z untuk Distribusi Sampling (Teorema Limit Pusat)

Jika yang diketahui adalah rata-rata (mean):

\[ z = \frac{x̄ - μ}{σ / \sqrt{n}} \] Keterangan:

  • x̄ = rata-rata sampel
  • μ = rata-rata populasi
  • σ = simpangan baku populasi
  • n = ukuran sampel

Jika yang diketahui adalah proporsi:

\[ z = \frac{p̂ - p}{\sqrt{p q / n}} \] Keterangan:

  • p̂ = proporsi sampel
  • p = proporsi populasi
  • q = 1 − p
  • n = ukuran sampel

3.4 Contoh Soal

Untuk masing-masing populasi di bawah ini, manakah yang akan menghasilkan distribusi sampling yang mendekati normal?

Daftar kasus: a) Populasi berbentuk kotak (rectangular), n = 15 b) Populasi bimodal, n = 29 c) Populasi miring (skewed), n = 40 d) Populasi segitiga (triangular), n = 35 e) Populasi normal, n = 20 f) Populasi normal, n = 30

jawaban:

Konsep Utama yang Dipakai

Aturan Teorema Limit Pusat (Central Limit Theorem / CLT):

1 Jika n ≥ 30 → distribusi sampling ≈ normal (apapun bentuk populasi asalnya)

2️ Jika populasi asal sudah normal → distribusi sampling tetap normal (meskipun ukuran sampel < 30)

maka,

Pilihan Populasi Normal? Ukuran Sampel (n ≥ 30?) CLT Berlaku Hasil
a Tidak Tidak (n = 15) Tidak Salah
b Tidak Tidak (n = 29) Tidak Salah
c Tidak Ya (n = 40) Ya Benar
d Tidak Ya (n = 35) Ya Benar
e Ya Tidak (n = 20) Ya Benar
f Ya Ya (n = 30) Ya Benar

Jawaban yang Benar

c, d, e, dan f

Karena:

c & d memiliki n ≥ 30 → CLT berlaku

e sudah normal dari awal → tetap normal walau n < 30

f normal dan n ≥ 30 → pasti normal

4. Proporsi Sampel

Klik gambar untuk menonton video

4.1 Pengertian

Proporsi adalah perbandingan antara jumlah kejadian yang diinginkan dengan total keseluruhan dalam sebuah populasi atau sampel. Proporsi digunakan untuk menggambarkan karakteristik tertentu dari suatu kelompok, seperti warna mata, tinggi badan, atau nilai ujian.

4.2 Rumus

\[ \text{Proporsi} = \frac{\text{Jumlah kejadian yang diinginkan}}{\text{Total jumlah}} \]

Contoh:

  • Sampel: 2 dari 10 orang bermata hijau → ( \(\hat{p} = \frac{2}{10}\) = 0,2 )
  • Populasi: 900 dari 5000 orang bermata hijau → ( \(p = \frac{900}{5000}\) = 0,18 )

Keterangan:

  • ( p ) = proporsi populasi
  • ( \(\hat{p}\) ) = proporsi sampel

Jika kita mengambil banyak sampel dari populasi dan menghitung ( \(\hat{p}\) ) untuk setiap sampel, nilainya dapat bervariasi karena setiap sampel mungkin berbeda dari populasi aslinya.

4.3 Distribusi sampling dari proporsi sampel

Saat kita mengambil banyak sampel dari suatu populasi dan menghitung proporsi sampel (p̂) dari masing-masing sampel, nilai p̂ akan bervariasi. Kumpulan seluruh p̂ tersebut membentuk distribusi sampling.

3 Hal Penting yang Berlaku:

1️. Rata-rata distribusi sampel proporsi

\[ \mu_{\hat{p}} = p \]

Artinya, rata-rata dari semua proporsi sampel sama dengan proporsi populasi asli.

2️. Standar deviasi distribusi sampel proporsi

\[ \sigma_{\hat{p}} = \sqrt{\frac{p(1-p)}{n}} \] Di mana:

    1. = proporsi populasi
    1. = ukuran sampel
  • (1-p) = proporsi “gagal” (sering dilambangkan (q))

3️. Distribusi p̂ mendekati normal

\[ \hat{p} \approx N\left(p,\ \sqrt{\frac{p(1-p)}{n}}\right) \]

Jika syarat CLT terpenuhi (misalnya (np ≥ 10) dan (n(1-p) ≥ 10)).

Standarisasi (Menggunakan Z-score)

\[ z = \frac{\hat{p}-p}{\sqrt{p(1-p)/n}} \]

Rumus ini memungkinkan kita memakai tabel Z-score untuk mencari peluang/luas area di bawah kurva normal.

5. Tinjauan Distribusi Sampel

Klik gambar untuk menonton video

5.1 Pengertian

Tinjauan Distribusi Sampel adalah studi atau pengamatan tentang perilaku distribusi suatu statistik (misal mean, proporsi) dari banyak sampel yang diambil dari populasi.

Beberapa poin pentingnya:

  1. Distribusi Sampling

    • Kalau kita ambil banyak sampel ukuran n dari populasi, lalu hitung rata-rata sampel () atau proporsi sampel (), nilai-nilai ini akan membentuk distribusi sendiri, disebut distribusi sampling.
  2. Ciri-cirinya

    • Rata-rata dari distribusi sampling = rata-rata populasi (μ)
    • Standar deviasi distribusi sampling = σ / √n (untuk mean)
    • Bentuk distribusi sampling semakin mendekati normal jika n ≥ 30 (Teorema Limit Pusat / Central Limit Theorem)
  3. Fungsi Tinjauan

    • Membantu menaksir parameter populasi dari sampel
    • Menentukan interval kepercayaan dan probabilitas kejadian tertentu

5.2 Contoh

  • Misalkan kita memiliki sebuah toples yang berisi 200 kelereng hijau dan 300 kelereng biru. Jika sebuah kelereng diambil tiga kali dengan pengembalian, berapakah peluang untuk mendapatkan setidaknya dua kelereng hijau?

KASUS 1 — Mengambil 3 kelereng (With Replacement)

Toples:

  • Hijau = 200
  • Biru = 300 Total = 500

Probabilitas: \[ P(\text{hijau}) = \frac{200}{500} = 0.4,\qquad P(\text{biru}) = \frac{300}{500} = 0.6 \]

Ditanya: \[ P(\text{minimal 2 hijau}) = P(X = 2) + P(X = 3) \]

Rumus Binomial: \[ P(X=k)=\binom{n}{k}p^k(1-p)^{n-k} \]

Hitung:

Tepat 2 hijau

\[ P(X=2) = \binom{3}{2}(0.4)^2(0.6)^1 = 3(0.16)(0.6) = 0.288 \] Tepat 3 hijau

\[ P(X=3) = \binom{3}{3}(0.4)^3(0.6)^0 = 1(0.064) = 0.064 \]

➤ Total:

\[ \begin{aligned} P(X \ge 2) &= P(X = 2) + P(X = 3) \\ &= 0.288 + 0.064 \\ &= 0.352 \text{ atau } 35.2\% \end{aligned} \]

  • Misalkan kita memiliki sebuah toples yang berisi 200 kelereng hijau dan 300 kelereng biru. Jika sebuah kelereng diambil lima kali dengan pengembalian, berapakah peluang untuk mendapatkan setidaknya dua kelereng hijau?

KASUS 2 — Mengambil 5 kelereng

Tetap: \[ p = 0.4,\quad n = 5 \]

Ditanya: \[ P(X \ge 2) = P(2)+P(3)+P(4)+P(5) \]

Hitungan:

\[ \begin{aligned} P(2) &= \binom{5}{2} (0.4)^2 (0.6)^3 = 10 \cdot 0.16 \cdot 0.216 = 0.3456 \\[2mm] P(3) &= \binom{5}{3} (0.4)^3 (0.6)^2 = 10 \cdot 0.064 \cdot 0.36 = 0.2304 \\[2mm] P(4) &= \binom{5}{4} (0.4)^4 (0.6)^1 = 5 \cdot 0.0256 \cdot 0.6 = 0.0768 \\[2mm] P(5) &= \binom{5}{5} (0.4)^5 (0.6)^0 = 1 \cdot 0.01024 = 0.01024 \end{aligned} \]

➤ Total:

\[\boxed{P(X\ge 2) = 0.66304 \approx 0.6634 = 66.34\%}\]

  • Misalkan kita memiliki sebuah toples yang berisi 200 kelereng hijau dan 300 kelereng biru. Jika sebuah kelereng diambil 100 kali dengan pengembalian, berapakah peluang untuk mendapatkan setidaknya dua kelereng hijau?

KASUS 3 — Mengambil 100 kelereng

Gunakan CLT (Normal Approx.) karena perhitungan binomial terlalu panjang.

Cek syarat normal: \[ np = 100(0.4)=40 \ge 10 \quad \] \[[ n(1-p)=100(0.6)=60 \ge 10 \quad ]\]

Ditanya: \[ P(X \ge 35) \Rightarrow P\left(\hat{p} \ge 0.35\right) \]

Hitung z-score: \[[ z = \frac{\hat{p}-p}{\sqrt{\frac{p(1-p)}{n}}} = \frac{0.35 - 0.4}{\sqrt{\frac{0.4(0.6)}{100}}} = \frac{-0.05}{0.04899} \approx -1.02 ]\]

Dari tabel Z: \[[ P(Z \le -1.02) = 0.1539 ]\]

Karena diminta sekurangnya 35 → area kanan:

\[ \begin{aligned} P(Z \ge -1.02) &= 1 - 0.1539 \\ &= 0.8461 \text{ atau } 84.61\% \end{aligned} \]

Ini adalah pendekatan, bukan nilai pasti karena menggunakan CLT & distribusi normal.

Ringkasan Akhir Jawaban

Percobaan Ditanya Metode Hasil
n = 3 ≥2 hijau Evaluasi Ruang Sampel / Binomial 0.352 (35.2%)
n = 5 ≥2 hijau Binomial lengkap 0.6634 (66.34%)
n = 100 ≥35 hijau CLT & Z-Score 0.8461 (84.61%) (perkiraan)

Referensi

[1] J. L. Devore, Probability and Statistics for Engineering and the Sciences, 9th ed. Boston: Cengage Learning, 2015.

[2] S. M. Ross, Introduction to Probability and Statistics for Engineers and Scientists, 5th ed. Academic Press, 2014.

[3] D. C. Montgomery and G. C. Runger, Applied Statistics and Probability for Engineers, 6th ed. Wiley, 2014.

[4] M. F. Triola, Elementary Statistics, 13th ed. Pearson, 2018.

[5] Khan Academy, “Central Limit Theorem tutorial.” https://www.khanacademy.org/math/statistics-probability/sampling-distributions-library

[6] A. G. Bluman, Elementary Statistics: A Step by Step Approach, 9th ed. McGraw-Hill Education, 2018.

[7] R. E. Walpole, R. H. Myers, S. L. Myers, and K. Ye, Probability & Statistics for Engineers & Scientists, 9th ed. Pearson, 2012.

[8] “7 Probability Distributions – Introduction to Statistics.” dsciencelabs.bookdown. https://bookdown.org/dsciencelabs/intro_statistics/07-Probability_Distributions.html.