knitr::opts_chunk$set(
  echo = TRUE,
  message = FALSE,
  warning = FALSE
)
set.seed(2025)

Práca s údajmi

Tradičná práca s databázou

Meno <- c("Ela", "Tono", "Ria")
Vek  <- c(10, 11, 9)
Body <- c(83, 96, 74)
udaje <- data.frame(Meno, Vek, Body)
udaje

Základné operácie

udaje$Vek
[1] 10 11  9
mean(udaje$Vek)
[1] 10
udaje[udaje$Meno == "Tono", ]
udaje[3, ]
udaje[, 2:3]
udaje[1, 1]
[1] "Ela"
summary(udaje)
     Meno                Vek            Body      
 Length:3           Min.   : 9.0   Min.   :74.00  
 Class :character   1st Qu.: 9.5   1st Qu.:78.50  
 Mode  :character   Median :10.0   Median :83.00  
                    Mean   :10.0   Mean   :84.33  
                    3rd Qu.:10.5   3rd Qu.:89.50  
                    Max.   :11.0   Max.   :96.00  

Malé cvičenie

Z tabuľky zisti meno študenta s najvyšším počtom Body a vypíš vetu

max_body <- max(udaje$Body)
meno_max <- udaje$Meno[which.max(udaje$Body)]
paste("Najviac bodov má", meno_max, ":", max_body)
[1] "Najviac bodov má Tono : 96"

Pridávanie stĺpcov a riadkov

MaAuto <- c(FALSE, TRUE, FALSE)
udaje <- cbind(udaje, MaAuto)
udaje
novy_riadok <- data.frame(Meno = "Fero", Vek = 12, Body = 88, MaAuto = TRUE)
udaje <- rbind(udaje, novy_riadok)
udaje

Malé cvičenie

Pridaj do tabuľky nového žiaka menom Nina, má 10 rokov, 91 bodov a nemá auto. Keď ju pridáš, vypočítaj medián bodov všetkých žiakov.

udaje <- rbind(udaje, data.frame(Meno = "Nina", Vek = 10, Body = 91, MaAuto = FALSE))
median(udaje$Body)
[1] 88

Tabuľky v prostredí kableExtra

library(knitr)
library(kableExtra)

kable(
  udaje,
  digits = 0,
  align = c("l","c","r","c"),
  caption = "Prehľad žiakov – moje dáta"
) %>%
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed", "responsive"),
    full_width = FALSE,
    position = "center"
  )
Prehľad žiakov – moje dáta
Meno Vek Body MaAuto
Ela 10 83 FALSE
Tono 11 96 TRUE
Ria 9 74 FALSE
Fero 12 88 TRUE
Nina 10 91 FALSE

Malé cvičenie

Z tabuľky si nechaj zobraziť len mená a body. Vytvor z toho peknú tabuľku pomocou kable a nazvi ju „Body podľa mena“.

udaje[, c("Meno", "Body")] %>%
  kable(caption = "Body podľa mena") %>%
  kable_styling(bootstrap_options = c("striped","hover"), full_width = FALSE)
Body podľa mena
Meno Body
Ela 83
Tono 96
Ria 74
Fero 88
Nina 91

Tidyverse – moderná práca s údajmi

library(tidyverse)

dplyr – výber a triedenie

udaje %>%
  filter(Body > 80) %>%
  arrange(desc(Body)) %>%
  kable(caption = "Body > 80 – zostupne") %>%
  kable_styling(full_width = FALSE)
Body > 80 – zostupne
Meno Vek Body MaAuto
Tono 11 96 TRUE
Nina 10 91 FALSE
Fero 12 88 TRUE
Ela 10 83 FALSE

Malé cvičenie

Vyber len tých žiakov, ktorí majú aspoň 90 bodov. Zorad ich abecedne podľa mena a nech sa zobrazí len ich stĺpec Meno.

udaje %>%
  filter(Body >= 90) %>%
  arrange(Meno) %>%
  select(Meno) %>%
  kable(caption = "Meno so ≥ 90 bodmi (A–Z)") %>%
  kable_styling(full_width = FALSE)
Meno so ≥ 90 bodmi (A–Z)
Meno
Nina
Tono

Zoskupenie a sumarizácia

udaje %>%
  group_by(MaAuto) %>%
  summarise(
    Priem_Body = mean(Body),
    Pocet = n()
  ) %>%
  kable(
    caption = "Priemerné Body podľa MaAuto",
    col.names = c("Má Auto", "Priemer Body", "Počet"),
    align = "c"
  ) %>%
  kable_styling(full_width = FALSE)
Priemerné Body podľa MaAuto
Má Auto Priemer Body Počet
FALSE 82.66667 3
TRUE 92.00000 2

Malé cvičenie

Zoskup žiakov podľa toho, či majú auto alebo nemajú. Pre každú skupinu vypíš najvyšší počet bodov a priemerný vek.

udaje %>%
  group_by(MaAuto) %>%
  summarise(Max_Body = max(Body), Avg_Vek = mean(Vek)) %>%
  kable(caption = "Max Body a priemerný vek podľa MaAuto") %>%
  kable_styling(full_width = FALSE)
Max Body a priemerný vek podľa MaAuto
MaAuto Max_Body Avg_Vek
FALSE 91 9.666667
TRUE 96 11.500000

Vytváranie novej premennej (mutate + case_when)

udaje %>%
  mutate(
    grade = case_when(
      Body >= 90 ~ "A",
      Body >= 80 ~ "B",
      Body >= 70 ~ "C",
      TRUE ~ "D"
    ),
    VekPoPlnoletosti = pmax(0, Vek - 18)
  ) %>%
  kable(caption = "Známky a VekPoPlnoletosti") %>%
  kable_styling(full_width = FALSE)
Známky a VekPoPlnoletosti
Meno Vek Body MaAuto grade VekPoPlnoletosti
Ela 10 83 FALSE B 0
Tono 11 96 TRUE A 0
Ria 9 74 FALSE C 0
Fero 12 88 TRUE B 0
Nina 10 91 FALSE A 0

Malé cvičenie

Pridaj do tabuľky nový stĺpec Uspech, ktorý bude mať hodnotu TRUE, ak má žiak aspoň 85 bodov, inak FALSE. Potom ukáž prvé štyri riadky tabuľky.

udaje %>%
  mutate(Uspech = Body >= 85) %>%
  head(4) %>%
  kable(caption = "Uspech podľa Body (prvé 4)") %>%
  kable_styling(full_width = FALSE)
Uspech podľa Body (prvé 4)
Meno Vek Body MaAuto Uspech
Ela 10 83 FALSE FALSE
Tono 11 96 TRUE TRUE
Ria 9 74 FALSE FALSE
Fero 12 88 TRUE TRUE

Záverečné cvičenie – demonštrácia na vlastnom príklade

Vytvor rebríček „A-čkári“ – teda tých, ktorí majú 90 a viac bodov. Zorad ich podľa počtu bodov a pridaj stĺpec Poradie, kde 1 = najviac bodov. Zobraz len Meno a Poradie.

udaje %>%
  filter(Body >= 90) %>%
  arrange(desc(Body)) %>%
  mutate(PoradieVBod = row_number()) %>%
  select(Meno, PoradieVBod) %>%
  kable(caption = "A-čkári a ich poradie v bodovom rebríčku") %>%
  kable_styling(full_width = FALSE)
A-čkári a ich poradie v bodovom rebríčku
Meno PoradieVBod
Tono 1
Nina 2

Môj návrh použitia novinky

set.seed(7)
udaje$Mat  <- c(76, 98, 71, 85, 94)
udaje$Slov <- c(88, 91, 69, 90, 92)
udaje$Eng  <- c(79, 95, 75, 86, 90)
udaje

Môj návrh použitia novinky (jednoduché): percentily + rebríček v skupinách

Idea: spravíme percentilové poradie podľa Body (0–100 %) a zároveň rebríček v rámci skupiny MaAuto (kto má/nemá auto). Je to iný pohľad než len „triedenie podľa bodov“ – uvidíš svoje postavenie v celej triede aj v „podskupine“.


library(dplyr)
library(kableExtra)

# 1) Percentil podľa Body (0–100 %)
vysl_percentil <- udaje %>%
  mutate(
    Percentil_Body = round(100 * (rank(Body, ties.method = "min") - 1) / (n() - 1), 1)
  ) %>%
  arrange(desc(Body)) %>%
  select(Meno, Body, Percentil_Body)

kable(vysl_percentil, caption = "Percentilové poradie podľa Body (0–100 %)") %>%
  kable_styling(full_width = FALSE)
Percentilové poradie podľa Body (0–100 %)
Meno Body Percentil_Body
Tono 96 100
Nina 91 75
Fero 88 50
Ela 83 25
Ria 74 0
NA
# 2) Rebríček v rámci skupiny MaAuto (1 = najviac bodov v danej skupine)
vysl_skupiny <- udaje %>%
  group_by(MaAuto) %>%
  arrange(desc(Body), .by_group = TRUE) %>%
  mutate(Poradie_v_skupine = dense_rank(desc(Body))) %>%
  ungroup() %>%
  select(Meno, MaAuto, Body, Poradie_v_skupine)

kable(vysl_skupiny, caption = "Rebríček v rámci skupiny MaAuto") %>%
  kable_styling(full_width = FALSE)
Rebríček v rámci skupiny MaAuto
Meno MaAuto Body Poradie_v_skupine
Nina FALSE 91 1
Ela FALSE 83 2
Ria FALSE 74 3
Tono TRUE 96 1
Fero TRUE 88 2
NA
# 3) Jednoduché pásma výkonu podľa percentilu (kvintily)
vysl_pasma <- vysl_percentil %>%
  mutate(Pásmo =
           cut(Percentil_Body,
               breaks = c(-Inf, 20, 40, 60, 80, Inf),
               labels = c("E (spodných 20%)", "D", "C", "B", "A (top 20%)"),
               right = TRUE))

kable(vysl_pasma, caption = "Pásma výkonu podľa percentilu (A–E)") %>%
  kable_styling(full_width = FALSE)
Pásma výkonu podľa percentilu (A–E)
Meno Body Percentil_Body Pásmo
Tono 96 100 A (top 20%)
Nina 91 75 B
Fero 88 50 C
Ela 83 25 D
Ria 74 0 E (spodných 20%)
NA
