Normálne rozdelenie N(µ,σ^2) je jedno z najdôležitejších pravdepodobnostných rozdelení. Je charakterizované dvoma parametrami - strednou hodnotou µ (mi) a smerodajnou odchylkou σ (sigma).
Hodnotu funkcie hustoty normálneho rozdelenia N(3,4) v bode x= 1 vypočítame pomocou príkazu
mi=3
sigma=2
x=1
dnorm(x, mean = mi, sd = sigma)
## [1] 0.1209854
Hodnotu distribučnej funkcie normálneho rozdelenia N(3,4) v bode x= 1 vypočítame pomocou príkazu
mi=3
sigma=2
x=1
pnorm(x, mean = mi, sd = sigma)
## [1] 0.1586553
Hodnotu k-teho kvantilu normálneho rozdelenia N(3,4) pre k=0,25 vypočítame pomocou príkazu
mi=3
sigma=2
k=0.25
qnorm(k, mean = mi, sd = sigma)
## [1] 1.65102
V štatistickej inferencii sú dôležité kvantily normálneho normovaného rozdelenia N(0,1). Vypíšme niekotré.
Poznamka: Pomocou príkazu c(k,z) vypiseme vedla seba hodnotu k aj k-ty kvantil. Keďže chceme, aby sme mali vypísané nad tymito hodotami aj pismena premennych (k a z) použijeme príkaz cbind.
mi=0
sigma=1
k=0.90
z=qnorm(k, mean = mi, sd = sigma)
cbind(k,z)
## k z
## [1,] 0.9 1.281552
mi=0
sigma=1
k=0.95
z=qnorm(k, mean = mi, sd = sigma)
cbind(k,z)
## k z
## [1,] 0.95 1.644854
mi=0
sigma=1
k=0.975
z=qnorm(k, mean = mi, sd = sigma)
cbind(k,z)
## k z
## [1,] 0.975 1.959964
mi=0
sigma=1
k=0.99
z=qnorm(k, mean = mi, sd = sigma)
cbind(k,z)
## k z
## [1,] 0.99 2.326348
mi=0
sigma=1
k=0.995
z=qnorm(k, mean = mi, sd = sigma)
cbind(k,z)
## k z
## [1,] 0.995 2.575829
Vypočítajme, koľko percent údajov je v prípade normálneho rozdelenia N(µ,σ^2) je z intervalu (µ-3σ,µ+3σ).
Bez ujmy na všeobecnosti, možeme uvažovať normálne normovane rozdelenie.
mi=0
sigma=1
dh=mi-3*sigma
hh=mi+3*sigma
podiel= pnorm(hh, mean = mi, sd = sigma) - pnorm(dh, mean = mi, sd = sigma)
podiel
## [1] 0.9973002
Z intervalu (µ-3σ,µ+3σ ) je 99,73 percent údajov. Poznámka: Toto pravidlo je známe v štatistike pod názvom pravidlo troch sigma.
Našou úlohou bude vykresliť funkciu hustoty normálneho rozdelenia N(0,1) na intervale (µ-4σ,µ+4σ).
Do premennej x načítame údaje z intervalu (µ-4σ,µ+4σ) s krokom 0,1. Do premennej h načítame príslušné hodnoty funkcie hustoty. Vykreslíme jednotlivé body.
mi=0
sigma=1
dh=mi-4*sigma
hh=mi+4*sigma
x = seq(dh,hh,by = 0.10)
h=dnorm(x, mean = mi, sd = sigma)
plot(x,h)
Znázornime funkciu hustoty N(0,1) na intervale (µ-4σ,µ+4σ) modrou farbou.
plot(x,h, type="l", col="blue")
Vyznačme na obrázku s funkciou hustoty N(0,1) zvislou zelenou (col=“green”) bodkovanou čiarou (lty=3) čiarou hodnoty mi-2 sigma a mi+2 sigma a červenou (col=“red”) čiarkovanou čiarou (lty=2) hodnoty mi-3 sigma a mi+3 sigma
plot(x,h, type="l", col="blue")
abline(v=c(mi -2*sigma,mi +2*sigma, mi -3*sigma,mi +3*sigma), col=c("green", "green","red","red"), lty=c(3,3,2,2), lwd=c(1,1,1,1))
Znázornime v ďalšom funkciu hustoty N(0,1) červenou farbou a hrubšou čiarou a súčasne aj fukciu hustoty N(0,2) zelenou farbou na intervale (-6,6). Treťou bude funkcia hustoty normálneho rozdelenia N(1,1) modrou farbou.
Popíšme osi - os x nech má označenie “x” a os y nech má označenie “Funkcia hustoty h”. Názov obrázku nech je “Funkcie hustoty normalneho rozdelenia”.
Vpravo hore umiestnime legendu s nazvom “Legenda”.
dh = -6
hh = 6
x = seq(dh,hh,by = 0.10)
h1=dnorm(x, mean = 0, sd = 1)
h2=dnorm(x, mean = 0, sd = sqrt(2))
h3=dnorm(x, mean = 1, sd = 1)
plot(x, h1,
type="l",
col="red",
lwd=2,
main="Funkcie hustoty normalneho rozdelenia",
xlab="x",
ylab="Funkcia hustoty h(x)"
)
lines(x, h2, col="green", lwd=2)
lines(x, h3, col="blue", lwd=2)
legend ("topright",
inset=.05,
c("N(0,1)", "N(0,sqrt 2)", "N(1,1)"),
title="Legenda",
lwd=0.25,
lty=c(1, 1),
col=c("red","green","blue")
)
Poznámka:
hrúbku čiary meníme pomocou parametra lwd
umiestnenie legendy určujeme pomocou “bottomright”, “bottom”, “bottomleft”, “left”, “topleft”, “top”, “topright”, “right” and “center”
výber fontov pre parameter text.font: 1- normal, 2 - bold, 3 - italic, 4 - bold and italic
Našou úlohou bude vykresliť distribučnú funkciu normálneho normovaného rozdelenia N(0,1) na intervale (µ-4σ,µ+4σ).
Do premennej x načítame údaje z intervalu (µ-4σ,µ+4σ) s krokom 0,1. Do premennej F načítame príslušné hodnoty distribučnej funkcie. Vykreslíme jednotlivé body.
mi=0
sigma=1
dh=mi-4*sigma
hh=mi+4*sigma
x = seq(dh,hh,by = 0.10)
F=pnorm(x, mean = mi, sd = sigma)
plot(x,F)
Znázornime distribučnú funkciu N(0,1) na intervale (µ-4σ,µ+4σ) modrou farbou. V bode, kde hodnota distribučnej hodnoty je 0,5 nakreslíme vodorovnú červenú (col=“red”) čiarkovanú čiaru (lty=2)
plot(x,F, type="l", col="blue")
abline(h=0.5, col="red", lty=2)
Znázornime kvantilovú funkciu N(0,1) tmavomodrou farbou.
mi=0
sigma=1
x = seq(0,1,by = 0.001)
Q=qnorm(x, mean = mi, sd = sigma)
plot(x,Q, type="l", col="darkblue")
Poznámka: Definičný obor kvantilovej funkcie je (0,1).
Vygenerujme 50 náhodných hodnôt z N(3,4). Uložme ich do premennej x.
n=50
mi=3
sigma=2
x=rnorm(n,mi,sigma)
x
## [1] 5.9953467 -1.1243264 2.9320503 4.6933246 2.7477443 6.8953043
## [7] 2.1059594 0.6497792 2.3916214 2.7414047 1.9166455 1.0258821
## [13] 4.0449508 4.5373420 4.5269870 2.4025470 2.5677398 4.7828279
## [19] 1.4172615 6.8058947 5.4482280 3.5972370 -0.1444752 0.2231165
## [25] 6.0039851 3.5031073 1.6025666 4.0000934 5.5446461 2.2043458
## [31] 2.5455066 -0.4740747 2.3582151 3.0111830 3.4766852 3.7232179
## [37] 2.3370788 2.1170384 7.1848523 0.8660945 4.0889048 0.7348196
## [43] -3.6394756 2.7251150 -0.2888111 1.3980533 7.3968871 4.9003720
## [49] 2.3033032 4.6470171
Zhrnutie: funkcia hustoty normálneho rozdelenia N(mean, sd) v bode x: dnorm(x, mean, sd)
distribučná funkcia normálneho rozdelenia N(mean, sd) v bode x: pnorm(x, mean, sd)
k-ty kvantil normálneho rozdelenia N(mean, sd): qnorm(k, mean, sd)
generovanie n náhodných čísiel normálneho rozdelenia N(mean, sd): rnorm(n, mean, sd)
Na záver si ukážeme konštrukciu dvoch zmesí pravdepodobnostných rozdelení (červená (col=“red”) hrubá (lwd=4)) čiara. Sú vysvetlením “zvlnenia” funkcie hustoty, resp. “tlstých” rozdelení.
dh = -2
hh = 5
x = seq(dh,hh,by = 0.10)
h3=dnorm(x, mean = 0, sd = 0.35)
h4=dnorm(x, mean = 2, sd = 1)
h5=0.5*h3 +0.5*h4
plot(x, h3,
type="l",
col="blue",
lwd=1,
main="Zmes dvoch normálnych rozdelení",
xlab="x",
ylab="Funkcia hustoty h(x)"
)
lines(x, h4, col="green", lwd=1)
lines(x, h5, col="red", lwd=3)
dh = -5
hh = 5
x = seq(dh,hh,by = 0.10)
h1=dnorm(x, mean = -1, sd =1)
h2=dnorm(x, mean = 1, sd = 1)
h3=0.5*h2 +0.5*h1
plot(x, h1,
type="l",
col="blue",
lwd=1,
main="Zmes dvoch normálnych rozdelení",
xlab="x",
ylab="Funkcia hustoty h(x)"
)
lines(x, h2, col="green", lwd=1)
lines(x, h3, col="red", lwd=3)
Literatúra:
R Core Team (2020). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. URL https://www.R-project.org/.
Paneurópska vysoká škola v Bratislave
GA/2/2019 “Využitie informačných technológií pri rozvoji aplikačných možností kvantitatívnych metód v ekonómii”