🌿 Úvod

Tento dokument vychádza z príkladov z predchádzajúcich materiálov, no pridávam doň vlastné dáta, vizuály a drobnú inováciu.
Cieľom je ukázať, že príkazy R viem nielen zopakovať, ale aj aplikovať kreatívne.


📘 Moja mini databáza

Vytvorím malú databázu o žiadateľoch o štipendium, s údajmi o mene, veku, priemere a aktivitách.

Meno <- c("Katarína", "Michal", "Eva", "Júlia", "Martin", "Denis")
Vek <- c(21, 23, 20, 22, 24, 21)
Priemer <- c(1.3, 2.1, 1.8, 1.5, 2.4, 1.7)
Dobrovoľník <- c(TRUE, FALSE, TRUE, TRUE, FALSE, TRUE)

stipendium <- data.frame(Meno, Vek, Priemer, Dobrovoľník)
stipendium

💡 Malé cvičenie 1: Práca s tabuľkou

Úloha:
Vyber len tých študentov, ktorí majú priemer lepší ako 1.8,
a zisti ich priemerný vek.

stipendium[stipendium$Priemer < 1.8, c("Meno", "Vek")]
mean(stipendium$Vek)
## [1] 21.83333

🔷 Tidyverse – moderná manipulácia

library(tidyverse)

💡 Malé cvičenie 2: Filtrovanie a mutácie

Úloha:
Pridaj nový stĺpec Kategória, ktorý označí študentov podľa ich priemeru: - do 1.5 → „výborný“ - 1.6–2.0 → „dobrý“ - nad 2.0 → „dostatočný“

Potom zorad výsledky podľa priemeru.

stipendium %>%
  mutate(
    Kategória = case_when(
      Priemer <= 1.5 ~ "výborný",
      Priemer <= 2.0 ~ "dobrý",
      TRUE ~ "dostatočný"
    )
  ) %>%
  arrange(Priemer)

🌼 Vizualizácia údajov

library(ggplot2)

💡 Malé cvičenie 3: Farebný scatter plot

Vykresli vzťah medzi vekom a priemerom, pričom farba zodpovedá dobrovoľníctvu.

ggplot(stipendium, aes(x = Vek, y = Priemer, color = Dobrovoľník)) +
  geom_point(size = 3) +
  theme_minimal() +
  labs(title = "Vzťah medzi vekom a študijným priemerom",
       x = "Vek študenta", y = "Študijný priemer")


📊 Základné štatistiky

💡 Malé cvičenie 4: Sumarizácia podľa skupín

Vypočítaj priemerný študijný priemer podľa dobrovoľníckej činnosti.

stipendium %>%
  group_by(Dobrovoľník) %>%
  summarise(
    Počet = n(),
    Priemerný_priemer = mean(Priemer)
  )

🧪 Testovanie hypotéz

💡 Malé cvičenie 5: Porovnanie skupín

Zisti, či je medzi dobrovoľníkmi a nedobrovoľníkmi štatisticky významný rozdiel v priemere.

t.test(Priemer ~ Dobrovoľník, data = stipendium)
## 
##  Welch Two Sample t-test
## 
## data:  Priemer by Dobrovoľník
## t = 3.6188, df = 2.1747, p-value = 0.06046
## alternative hypothesis: true difference in means between group FALSE and group TRUE is not equal to 0
## 95 percent confidence interval:
##  -0.06883109  1.41883109
## sample estimates:
## mean in group FALSE  mean in group TRUE 
##               2.250               1.575