Tento dokument vychádza z príkladov z predchádzajúcich materiálov, no
pridávam doň vlastné dáta, vizuály a drobnú
inováciu.
Cieľom je ukázať, že príkazy R viem nielen zopakovať, ale aj
aplikovať kreatívne.
Vytvorím malú databázu o žiadateľoch o štipendium, s údajmi o mene, veku, priemere a aktivitách.
Meno <- c("Katarína", "Michal", "Eva", "Júlia", "Martin", "Denis")
Vek <- c(21, 23, 20, 22, 24, 21)
Priemer <- c(1.3, 2.1, 1.8, 1.5, 2.4, 1.7)
Dobrovoľník <- c(TRUE, FALSE, TRUE, TRUE, FALSE, TRUE)
stipendium <- data.frame(Meno, Vek, Priemer, Dobrovoľník)
stipendium
Úloha:
Vyber len tých študentov, ktorí majú priemer lepší ako 1.8,
a zisti ich priemerný vek.
stipendium[stipendium$Priemer < 1.8, c("Meno", "Vek")]
mean(stipendium$Vek)
## [1] 21.83333
library(tidyverse)
Úloha:
Pridaj nový stĺpec Kategória, ktorý označí študentov podľa
ich priemeru: - do 1.5 → „výborný“ - 1.6–2.0 → „dobrý“ - nad 2.0 →
„dostatočný“
Potom zorad výsledky podľa priemeru.
stipendium %>%
mutate(
Kategória = case_when(
Priemer <= 1.5 ~ "výborný",
Priemer <= 2.0 ~ "dobrý",
TRUE ~ "dostatočný"
)
) %>%
arrange(Priemer)
library(ggplot2)
Vykresli vzťah medzi vekom a priemerom, pričom farba zodpovedá dobrovoľníctvu.
ggplot(stipendium, aes(x = Vek, y = Priemer, color = Dobrovoľník)) +
geom_point(size = 3) +
theme_minimal() +
labs(title = "Vzťah medzi vekom a študijným priemerom",
x = "Vek študenta", y = "Študijný priemer")
Vypočítaj priemerný študijný priemer podľa dobrovoľníckej činnosti.
stipendium %>%
group_by(Dobrovoľník) %>%
summarise(
Počet = n(),
Priemerný_priemer = mean(Priemer)
)
Zisti, či je medzi dobrovoľníkmi a nedobrovoľníkmi štatisticky významný rozdiel v priemere.
t.test(Priemer ~ Dobrovoľník, data = stipendium)
##
## Welch Two Sample t-test
##
## data: Priemer by Dobrovoľník
## t = 3.6188, df = 2.1747, p-value = 0.06046
## alternative hypothesis: true difference in means between group FALSE and group TRUE is not equal to 0
## 95 percent confidence interval:
## -0.06883109 1.41883109
## sample estimates:
## mean in group FALSE mean in group TRUE
## 2.250 1.575
Rozhodla som sa pridať nový prvok – estetickú tému z knižnice
ggthemes
a interaktívny výstup pomocou plotly.
Takýto graf možno použiť v prezentáciách alebo online notebookoch.
# install.packages("ggthemes")
# install.packages("plotly")
library(ggthemes)
library(plotly)
graf <- ggplot(stipendium, aes(x = Vek, y = Priemer, color = Kategória)) +
geom_point(size = 4) +
theme_economist() +
labs(title = "Interaktívny prehľad študentov podľa veku a priemeru") +
theme(plot.title = element_text(face = "bold", hjust = 0.5))
🪶 Komentár:
Tento graf je plne interaktívny – po nabehnutí myšou na bod sa zobrazia
hodnoty,
a tému „Economist“ som zvolila pre profesionálny, no jemný vzhľad.
V dokumente som si precvičila: - vytváranie vlastnej databázy v
data.frame,
- manipuláciu pomocou dplyr,
- vizualizáciu cez ggplot2 a plotly,
- a nakoniec som pridala estetickú tému ako inováciu.
Tento zápisník teda spája praktické zručnosti s osobným dizajnom.