Normálne rozdelenie N(µ,σ^2) je jedno z najdôležitejších pravdepodobnostných rozdelení. Je charakterizované dvoma parametrami - strednou hodnotou µ (mi) a smerodajnou odchylkou σ (sigma).

Hodnotu funkcie hustoty normálneho rozdelenia N(3,4) v bode x= 1 vypočítame pomocou príkazu

mi=3
sigma=2
x=1

dnorm(x, mean = mi, sd = sigma)
## [1] 0.1209854

Hodnotu distribučnej funkcie normálneho rozdelenia N(3,4) v bode x= 1 vypočítame pomocou príkazu

mi=3
sigma=2
x=1

pnorm(x, mean = mi, sd = sigma)
## [1] 0.1586553

Hodnotu k-teho kvantilu normálneho rozdelenia N(3,4) pre k=0,25 vypočítame pomocou príkazu

mi=3
sigma=2
k=0.25

qnorm(k, mean = mi, sd = sigma)
## [1] 1.65102

V štatistickej inferencii sú dôležité kvantily normálneho normovaného rozdelenia N(0,1). Vypíšme niekotré.

Poznamka: Pomocou príkazu c(k,z) vypiseme vedla seba hodnotu k aj k-ty kvantil. Keďže chceme, aby sme mali vypísané nad tymito hodotami aj pismena premennych (k a z) použijeme príkaz cbind.

mi=0
sigma=1
k=0.90

z=qnorm(k, mean = mi, sd = sigma)
 cbind(k,z)
##        k        z
## [1,] 0.9 1.281552
mi=0
sigma=1
k=0.95

z=qnorm(k, mean = mi, sd = sigma)
 cbind(k,z)
##         k        z
## [1,] 0.95 1.644854
mi=0
sigma=1
k=0.975

z=qnorm(k, mean = mi, sd = sigma)
 cbind(k,z)
##          k        z
## [1,] 0.975 1.959964
mi=0
sigma=1
k=0.99

z=qnorm(k, mean = mi, sd = sigma)
 cbind(k,z)
##         k        z
## [1,] 0.99 2.326348
mi=0
sigma=1
k=0.995

z=qnorm(k, mean = mi, sd = sigma)
 cbind(k,z)
##          k        z
## [1,] 0.995 2.575829

Vypočítajme, koľko percent údajov je v prípade normálneho rozdelenia N(µ,σ^2) je z intervalu (µ-3σ,µ+3σ).

Bez ujmy na všeobecnosti, možeme uvažovať normálne normovane rozdelenie.

mi=0
sigma=1
dh=mi-3*sigma
hh=mi+3*sigma

podiel= pnorm(hh, mean = mi, sd = sigma) - pnorm(dh, mean = mi, sd = sigma)
podiel
## [1] 0.9973002

Z intervalu (µ-3σ,µ+3σ ) je 99,73 percent údajov. Poznámka: Toto pravidlo je známe v štatistike pod názvom pravidlo troch sigma.

Našou úlohou bude vykresliť funkciu hustoty normálneho rozdelenia N(0,1) na intervale (µ-4σ,µ+4σ).

Do premennej x načítame údaje z intervalu (µ-4σ,µ+4σ) s krokom 0,1. Do premennej h načítame príslušné hodnoty funkcie hustoty. Vykreslíme jednotlivé body.

mi=0
sigma=1
dh=mi-4*sigma
hh=mi+4*sigma

x = seq(dh,hh,by = 0.10)

h=dnorm(x, mean = mi, sd = sigma)
plot(x,h)

Znázornime funkciu hustoty N(0,1) na intervale (µ-4σ,µ+4σ) modrou farbou.

plot(x,h, type="l", col="blue")

Vyznačme na obrázku s funkciou hustoty N(0,1) zvislou zelenou (col=“green”) bodkovanou čiarou (lty=3) čiarou hodnoty mi-2 sigma a mi+2 sigma a červenou (col=“red”) čiarkovanou čiarou (lty=2) hodnoty mi-3 sigma a mi+3 sigma

plot(x,h, type="l", col="blue")
abline(v=c(mi -2*sigma,mi +2*sigma, mi -3*sigma,mi +3*sigma), col=c("green", "green","red","red"), lty=c(3,3,2,2), lwd=c(1,1,1,1))

Znázornime v ďalšom funkciu hustoty N(0,1) červenou farbou a hrubšou čiarou a súčasne aj fukciu hustoty N(0,2) zelenou farbou na intervale (-6,6). Treťou bude funkcia hustoty normálneho rozdelenia N(1,1) modrou farbou.
Popíšme osi - os x nech má označenie “x” a os y nech má označenie “Funkcia hustoty h”. Názov obrázku nech je “Funkcie hustoty normalneho rozdelenia”.
Vpravo hore umiestnime legendu s nazvom “Legenda”.

dh = -6
hh = 6
x = seq(dh,hh,by = 0.10)

h1=dnorm(x, mean = 0, sd = 1)
h2=dnorm(x, mean = 0, sd = sqrt(2))
h3=dnorm(x, mean = 1, sd = 1)

plot(x, h1,
     type="l",
     col="red",
     lwd=2,
     main="Funkcie hustoty normalneho rozdelenia",
     xlab="x",
     ylab="Funkcia hustoty h(x)"
     )

lines(x, h2, col="green", lwd=2)
lines(x, h3, col="blue", lwd=2)


legend ("topright", 
       inset=.05, 
       c("N(0,1)", "N(0,sqrt 2)", "N(1,1)"),
       title="Legenda",
       lwd=0.25, 
       lty=c(1, 1), 
       col=c("red","green","blue")
       )


Poznámka:
hrúbku čiary meníme pomocou parametra lwd
umiestnenie legendy určujeme pomocou “bottomright”, “bottom”, “bottomleft”, “left”, “topleft”, “top”, “topright”, “right” and “center”
výber fontov pre parameter text.font: 1- normal, 2 - bold, 3 - italic, 4 - bold and italic



Našou úlohou bude vykresliť distribučnú funkciu normálneho normovaného rozdelenia N(0,1) na intervale (µ-4σ,µ+4σ).

Do premennej x načítame údaje z intervalu (µ-4σ,µ+4σ) s krokom 0,1. Do premennej F načítame príslušné hodnoty distribučnej funkcie. Vykreslíme jednotlivé body.

mi=0
sigma=1
dh=mi-4*sigma
hh=mi+4*sigma
x = seq(dh,hh,by = 0.10)

F=pnorm(x, mean = mi, sd = sigma)

plot(x,F)


Znázornime distribučnú funkciu N(0,1) na intervale (µ-4σ,µ+4σ) modrou farbou. V bode, kde hodnota distribučnej hodnoty je 0,5 nakreslíme vodorovnú červenú (col=“red”) čiarkovanú čiaru (lty=2)

plot(x,F, type="l", col="blue")
abline(h=0.5, col="red", lty=2)



Znázornime kvantilovú funkciu N(0,1) tmavomodrou farbou.

mi=0
sigma=1
x = seq(0,1,by = 0.001)

Q=qnorm(x, mean = mi, sd = sigma)

plot(x,Q, type="l", col="darkblue")

Poznámka: Definičný obor kvantilovej funkcie je (0,1).

Vygenerujme 50 náhodných hodnôt z N(3,4). Uložme ich do premennej x.

n=50
mi=3
sigma=2
x=rnorm(n,mi,sigma)
x
##  [1]  5.9953467 -1.1243264  2.9320503  4.6933246  2.7477443  6.8953043
##  [7]  2.1059594  0.6497792  2.3916214  2.7414047  1.9166455  1.0258821
## [13]  4.0449508  4.5373420  4.5269870  2.4025470  2.5677398  4.7828279
## [19]  1.4172615  6.8058947  5.4482280  3.5972370 -0.1444752  0.2231165
## [25]  6.0039851  3.5031073  1.6025666  4.0000934  5.5446461  2.2043458
## [31]  2.5455066 -0.4740747  2.3582151  3.0111830  3.4766852  3.7232179
## [37]  2.3370788  2.1170384  7.1848523  0.8660945  4.0889048  0.7348196
## [43] -3.6394756  2.7251150 -0.2888111  1.3980533  7.3968871  4.9003720
## [49]  2.3033032  4.6470171


Zhrnutie: funkcia hustoty normálneho rozdelenia N(mean, sd) v bode x: dnorm(x, mean, sd)
distribučná funkcia normálneho rozdelenia N(mean, sd) v bode x: pnorm(x, mean, sd)
k-ty kvantil normálneho rozdelenia N(mean, sd): qnorm(k, mean, sd)
generovanie n náhodných čísiel normálneho rozdelenia N(mean, sd): rnorm(n, mean, sd)


Na záver si ukážeme konštrukciu dvoch zmesí pravdepodobnostných rozdelení (červená (col=“red”) hrubá (lwd=4)) čiara. Sú vysvetlením “zvlnenia” funkcie hustoty, resp. “tlstých” rozdelení.

dh = -2
hh = 5
x = seq(dh,hh,by = 0.10)

h3=dnorm(x, mean = 0, sd = 0.35)
h4=dnorm(x, mean = 2, sd = 1)
h5=0.5*h3 +0.5*h4

plot(x, h3,
     type="l",
     col="blue",
     lwd=1,
     main="Zmes dvoch normálnych rozdelení",
     xlab="x",
     ylab="Funkcia hustoty h(x)"
     )

lines(x, h4, col="green", lwd=1)
lines(x, h5, col="red", lwd=3)



dh = -5
hh = 5
x = seq(dh,hh,by = 0.10)

h1=dnorm(x, mean = -1, sd =1)
h2=dnorm(x, mean = 1, sd = 1)
h3=0.5*h2 +0.5*h1

plot(x, h1,
     type="l",
     col="blue",
     lwd=1,
     main="Zmes dvoch normálnych rozdelení",
     xlab="x",
     ylab="Funkcia hustoty h(x)"
     )

lines(x, h2, col="green", lwd=1)
lines(x, h3, col="red", lwd=3)


Literatúra:
R Core Team (2020). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. URL https://www.R-project.org/.


Paneurópska vysoká škola v Bratislave
GA/2/2019 “Využitie informačných technológií pri rozvoji aplikačných možností kvantitatívnych metód v ekonómii”