Sebaran normal (Normal Distribution) merupakan salah satu sebaran probabilitas kontinu yang paling penting dalam statistika. Sebaran ini menggambarkan distribusi data yang cenderung berpusat di sekitar nilai rata-rata dan membentuk kurva lonceng (bell curve) yang simetris. Sebaran normal sering digunakan untuk memodelkan berbagai fenomena alam dan sosial, seperti tinggi badan manusia, kesalahan pengukuran, atau nilai ujian mahasiswa (Walpole et al., 2021).
Sebuah peubah acak kontinu \(X\) dikatakan berdistribusi normal apabila fungsi kepadatan peluangnya (probability density function) diberikan oleh: \[ f(x) = \frac{1}{\sigma \sqrt{2\pi}} \, e^{-\frac{(x - \mu)^2}{2\sigma^2}}, \quad -\infty < x < \infty \]
dengan: - \(\mu\): nilai rata-rata (mean) - \(\sigma\): simpangan baku (standard deviation)
Jika \(\mu = 0\) dan \(\sigma = 1\), maka disebut Sebaran Normal Standar.
Nilai ekspektasi dan varians dari sebaran normal adalah:
\[ E(X) = \mu, \quad Var(X) = \sigma^2 \]
Untuk membangkitkan (menghasilkan) bilangan acak dari sebaran normal digunakan fungsi rnorm() dalam bahasa pemrograman R. Fungsi ini digunakan ketika kita ingin mensimulasikan data yang mengikuti distribusi normal, misalnya untuk tinggi badan manusia, nilai ujian, atau data pengukuran yang umumnya menyebar secara simetris di sekitar rata-rata.
1.Syntax rnorm(n, mean = 0, sd = 1)
2.Parameter n :jumlah bilangan acak yang dibangkitkan
mean :nilai rata-rata (μ), default = 0
sd :simpangan baku (σ), default = 1
3.Contoh
rnorm(10, mean = 20, sd = 2)
## [1] 17.87097 18.20422 18.41430 20.62445 18.18467 22.83686 21.62267 16.33642
## [9] 19.96884 20.60147
##Menghitung Peluang Sebaran Normal Untuk menghitung peluang pada sebaran normal, digunakan fungsi pnorm() dalam bahasa pemrograman R. Fungsi ini digunakan ketika kita ingin mengetahui probabilitas suatu nilai berada di bawah, di atas, atau di antara nilai tertentu pada distribusi normal. Distribusi normal sendiri sering digunakan untuk menggambarkan data yang tersebar secara simetris di sekitar rata-rata, seperti tinggi badan, nilai ujian, atau hasil pengukuran ilmiah.
1.Syntax pnorm(q, mean, sd, lower.tail = TRUE)
2.Parameter q : nilai batas (x) yang ingin dicari peluangnya
mean: nilai rata-rata (μ) distribusi
sd : simpangan baku (σ) distribusi
lower.tail = TRUE :digunakan untuk menghitung peluang \(P(X \le q)\).
lower.tail = FALSE :digunakan untuk peluang \(P(X>q)\)
3.Contoh Sebagai contoh, jika variabel acak \(𝑋\) berdistribusi normal dengan rata-rata 20 dan simpangan baku 2, maka peluang
P(X≤22) dapat dihitung dengan:
pnorm(22, mean = 20, sd = 2)
## [1] 0.8413447
P(X>22) dapat dihitung dengan:
pnorm(22, mean = 20, sd = 2, lower.tail = FALSE)
## [1] 0.1586553
##Menghitung Quantile Sebaran Normal
Untuk menghitung kuantil (quantile) atau nilai batas (x) pada sebaran normal digunakan fungsi qnorm() dalam bahasa pemrograman R. Fungsi ini merupakan kebalikan dari pnorm(), yaitu digunakan ketika kita sudah mengetahui peluang (probabilitas) dan ingin mencari nilai data (x) yang sesuai dengan peluang tersebut.
Dengan kata lain, fungsi qnorm() digunakan untuk mencari nilai q yang memenuhi hubungan: \[P(X≤q)=p\] Fungsi ini berguna ketika ingin mengetahui batas persentil dari data yang berdistribusi normal, misalnya menentukan nilai ujian minimum untuk masuk 10% teratas, atau tinggi badan maksimum yang dimiliki 95% populasi.
1.Syntax qnorm(p, mean, sd, lower.tail = TRUE)
2.Parameter p :peluang atau probabilitas kumulatif yang diketahui, mean :rata-rata distribusi (μ) sd :simpangan baku (σ) lower.tail = TRUE :digunakan untuk menghitung p(𝑋≤q) lower.tail = TRUE :digunakan Untuk menghitungp(X>q).
3.Contoh Sebagai contoh, jika tinggi badan seseorang berdistribusi normal dengan rata-rata 170 cm dan simpangan baku 5 cm, maka untuk mengetahui tinggi badan yang mencakup 95% dari populasi, dapat dihitung dengan:
qnorm(0.95, mean = 170, sd = 5)
## [1] 178.2243
Penjelasan digunakan untuk mencari nilai kuantil
ke-95% dari distribusi normal dengan rata-rata (mean) = 170 dan
simpangan baku (sd) = 5. Artinya, kita mencari nilai q sehingga: \[P(X≤q)=0.95\] Ketika dijalankan, R akan
menghasilkan output seperti di atas
ini artinya, 95% data dari distribusi normal N(170,5^2) memiliki nilai
kurang dari atau sama dengan 178.22. Dengan kata lain, hanya 5% data
yang lebih besar dari 178.22.
##Grafik Sebaran Normal Grafik sebaran normal digunakan untuk memvisualisasikan bentuk distribusi data yang mengikuti pola kurva lonceng (bell-shaped curve). Distribusi ini simetris terhadap nilai rata-rata, di mana sebagian besar data terkonsentrasi di sekitar mean dan semakin sedikit data yang berada jauh dari mean.
Grafik sebaran normal dapat dibuat menggunakan fungsi
curve()
dan dnorm()
.
Fungsi dnorm()
digunakan untuk menghitung kepadatan
(density) dari distribusi normal pada setiap titik nilai \(x\), sedangkan curve()
digunakan untuk menggambarkan grafiknya.
1.Syntax Bentuk umum perintahnya adalah: curve(dnorm(x, mean, sd), from = a, to = b)
2.Parameter:
dnorm(x, mean, sd) : menghitung nilai fungsi kepadatan normal.
from dan to : menentukan batas sumbu-x grafik (rentang nilai).
3.Contoh Misalkan suatu data memiliki rata-rata 170 dan simpangan baku 5. Maka grafik sebaran normalnya dapat digambar dengan:
curve(dnorm(x, mean = 170, sd = 5),
from = 150, to = 190,
main = "Grafik Sebaran Normal N(170, 5^2)",
xlab = "Nilai X", ylab = "Kepadatan",
col = "blue", lwd = 2)
Grafik sebaran normal dengan rata-rata 170 dan simpangan baku 5 tersebut memperlihatkan bentuk kurva lonceng yang simetris terhadap sumbu vertikal di titik x = 170, yang merupakan nilai rata-rata sekaligus pusat distribusi. Puncak kurva menunjukkan nilai dengan kemungkinan kemunculan tertinggi, sedangkan sisi kiri dan kanan kurva menggambarkan penurunan kepadatan peluang secara bertahap ketika nilai x menjauh dari 170. Nilai simpangan baku 5 menyebabkan kurva tidak terlalu melebar, menunjukkan bahwa sebagian besar data berkelompok di sekitar nilai rata-rata. Area di bawah kurva antara 165 hingga 175 mewakili sekitar 68% dari seluruh data (±1σ), sedangkan hampir semua data (sekitar 99,7%) berada dalam rentang 150 hingga 190 (±3σ). Dengan demikian, grafik ini menggambarkan distribusi yang stabil dan terpusat, di mana nilai ekstrem sangat jarang muncul dibandingkan nilai di sekitar rata-rata.