Krabicový graf je jedným zo spôsobov grafickej vizualizácie údajov. V ďalšom si ukážeme, ako ho zostrojiť.

Najskôr načítame údaje, z ktorých zostrojíme krabicový graf, do premennej udajeA:

udajeA = c(15,28,22,35,15,13,28,14,13,50)

V ďaľšom kroku veľmi jednoducho vykreslíme krabicový graf pomocou príkazu:

boxplot (udajeA)

Do krabicového grafu môžeme zakresliť aj 95 percentný interval spoľahlivosti pre medián (notch = TRUE):

boxplot(udajeA,
notch = TRUE
)
## Warning in bxp(list(stats = structure(c(13, 14, 18.5, 28, 35), .Dim = c(5L, :
## some notches went outside hinges ('box'): maybe set notch=FALSE

Vidíme, že jeden údaj (50) je označený ako odľahlý (krúžok). Za odľahlé považujeme hodnoty menšie ako rozdiel prvého kvartilu a 1,5 násobku kvartilového rozpätia, resp. väčšie ako súčet tretieho kvartilu a 1,5 násobku kvartilového rozpätia.

Upozornenie je v dôsledku toho, že dolná hranica 95 percentného intervalu spoľahlivosti pre medián je menšia ako hodnota vypočítaná ako rozdiel prvého kvartilu a 1,5 násobku kvartilového rozpätia (t.j. rozdielu tretieho a prvého kvartilu). Rovnako by sme boli upozornení, keby horná hranica intervalu spoľahlivosti pre medián bola väčšia ako ako súčet tretieho kvartilu a 1,5 násobku kvartilového rozpätia.

Do krabicového grafu môžeme zakresliť aj priemer údajov. Zakreslime ho červeným (col=“red”) krížikom (pch=4). Veľkosť znaku pre priemer môžeme zmeniť pomocou hodnoty parametra lwd (čím je hodnota parametra väčšia, tým je znak väčší):

boxplot (udajeA)
points(mean(udajeA),col="red",pch=4,lwd = 2)

V ďalšom si ukážeme ako môžeme popísať osi krabicového grafu (xlab a ylab), ako vyplniť krabicový graf zelenou farbou (col = “green3”) a pre obrysy grafu zvolíme čiernu farbu (border = “black”). Naviac krabicový graf otočímeme, t.j. zvolíme možnosť, aby bol horizotálny (horizontal = TRUE):

boxplot(udajeA,
main = "Nazov grafu",
xlab = "Popis osi x",
ylab = "Popis osi y",
col = "green3",
border = "black",
horizontal = TRUE
)

Boxploy sú vhodné aj pre porovnanie dvoch, resp. viacerých údajov. V ďalšom si ukážeme, ako znázornime do jedného obrázku dva krabicove grafy. Najskôr načítame údaje za druhý súbor (udajeB):

udajeB=c(2,3,4,8,1,6, 17, 19)

Graf nazvime “Názov grafu” (main = “Nazov grafu”), krabicový graf pre údaje zo súboru udajeA pomenujeme “Prvý súbor” a krabicový graf pre údaje zo súboru udajeB pomenujeme “Druhy subor” (names = c(“Prvy subor”, “Druhy subor”)). Prvý krabicový graf vyfarbíme na zeleno a druhý nech je modrý (col = c(“green3”,“blue2”)).

boxplot(udajeA, udajeB,
main = "Nazov grafu",
at = c(1,2),
names = c("Prvy subor", "Druhy subor"),
col = c("green3","blue2"),border = "black"
)

V niektorých prípadoch môže byť užitočné, keď vieme oddeliť medzerou jeden krabicový graf (alebo aj viac) od ostatných.

Načítajme údaje do tretieho súboru (udajeC):

udajeC = c(2,3,5,7,17,27)

Plochu grafu rozdelíme na päť častí - v našom prípade 5 stĺpcov (at = c(1,2,5)). Krabičkové grafy budú v 1., 2., a 5. stĺpci.

boxplot(udajeA, udajeB, udajeC,
main = "Nazov grafu",
at = c(1,2,5),
names = c("Subor A", "Subor B", "Subor C"),
col = c("green3","blue2", "yellow3"),
border = "black"
)

Rovnako môžeme znázorniť aj horizontálne krabicové grafy. Je estetické a lepšie sa graf číta, keď popis na osi y je na ňu kolmý (las=2):

boxplot(udajeA, udajeB, udajeC,
main = "Nazov grafu",
at = c(1,2,5),
las=2,
names = c("Subor A", "Subor B", "Subor C"),
col = c("green3","blue2", "yellow3"),
border = "black",
horizontal = TRUE
)

Paneurópska vysoká škola v Bratislave

GA/2/2019 “Využitie informačných technológií pri rozvoji aplikačných možností kvantitatívnych metód v ekonómii”