Globálne nastavenie Chunkov
V nižšie uvedenom Chunku je urobené základné globálne nastavenie
Chunkov v celom Notebooku.
- echo nastavuje, či chceme v Notebooku vypisovať
jednotlivé kódy R
- message je nastavený na FALSE, čo znamená,
že sa budú potláčať pracovné výstupy z R, t.j. napríklad výsledok
otvárania knižníc, a niektoré iné výstupy, ktoré ale pre celkový
Notebook nemajú takmer žiaden význam a sú vhodné skôr pri ladení
kódov.
- warning nastavený na FALSE potláča zobrazenie
chybových hlášok
Quitting from Cvicenie2a_scalars_text_logical_vectors_matrices.Rmd:26-32 [setup]
knitr::opts_chunk$set(
echo = TRUE,
message = FALSE,
warning = FALSE
)
Úvod k základným operáciám v R
Tento notebook demonštruje základné operácie v
jazyku R so:
- skalárnymi číslami (t.j. 1 číslo),
- textovými (znakovými) reťazcami,
- logickými (boolovskými) hodnotami a premennými,
- (numerickými) vektormi,
- maticami.
Tam, kde je to užitočné, sú zahrnuté malé cvičenia.
Numerické vektory
Generovanie vektorov
v1 <- c(3, 6, 9, 12)
v2 <- 3:15 # postupnost 1,2,3,4,5
v3 <- seq(from = 0, to = 16, by = 0.55) # postupnost s krokom 0.25
v4 <- rep(3, times = 4) # 3,3,3,3,3 # 5 clenna postupnost trojak
v5 <- runif(4) # generovanie rovnomerne rozdelenych premennych v intervale [0,1]
v6 <- rnorm(4) # generovanie normalne rozdelenych premennych
v1; v2; v3; v4; v5
[1] 3 6 9 12
[1] 3 4 5 6 7 8 9 10 11 12 13 14 15
[1] 0.00 0.55 1.10 1.65 2.20 2.75 3.30 3.85 4.40 4.95
[11] 5.50 6.05 6.60 7.15 7.70 8.25 8.80 9.35 9.90 10.45
[21] 11.00 11.55 12.10 12.65 13.20 13.75 14.30 14.85 15.40 15.95
[1] 3 3 3 3
[1] 0.2540458 0.6141199 0.4359565 0.2626499
Aritmetické operácie s vektormi
v <- c(10, 32, 44, 58)
v + 3 # kazdy prvok vektora zvacsime o 10
[1] 13 35 47 61
v * 9 # kazdy prvok vektora prenasobime 2
[1] 90 288 396 522
[1] 5.5 16.5 22.5 29.5
exp(v) # exponencialna funkcia z kazdeho prvku vektora
[1] 2.202647e+04 7.896296e+13 1.285160e+19 1.545539e+25
sum(c(8,9,10),c(2,3,3)) # skalarny sucin - vysledok je skalar
[1] 35
crossprod(c(4,6,8),c(10,12,14)) # skalarny sucin - vysledok je matica 1x1
[,1]
[1,] 224
c(11,22,333)*c(5,5,5) # Hadamardov sucin (sucin zodpovedajucich prvkov vektora)
[1] 55 110 1665
Matematické operácie s 2 vektormi rovnakého rozmeru
[1] 5
length(v5) #vektor v5 je definovany vyssie
[1] 4
c(6,8,3,10,1) + v5 # pozor, oba vektory musia mat rovnaky rozmer
[1] 6.254046 8.614120 3.435956 10.262650 1.254046
Indexovanie a výber niektorych prvkov vektora
x <- c(3, 8, 33, 1, 2, 18, 29)
x[3] # indexovanie - novy jedno-prvkovy vektor - prvy prvok vektora x
[1] 33
x[1:2] # novy vektor s druhym az stvrtym prvkom vektora x
[1] 3 8
x[-5] # novy vektor - vsetky prvky vektora x okrem prvého
[1] 3 8 33 1 18 29
x[x > 20] # novy vektor definovany prvkami x vacsimi ako 10
[1] 33 29
which(x > 20) # ktore prvky zodpovedaju podmienke vacsieho ako 10?
[1] 3 7
Práca s chýbajúcimi hodnotami
y <- c(1, NA, 3, NA, 5)
is.na(y)
[1] FALSE TRUE FALSE TRUE FALSE
[1] NA
mean(y, na.rm = TRUE) # remove NAs
[1] 3
Základné štatistiky a usporiadanie prvkov vektora podľa
veľkosti
a <- c(1, 6, 3, 9, 4)
mean(a) # priemerna hodnota
[1] 4.6
sd(a) # standardna odchylka
[1] 3.04959
max(a) # maximalna hodnota
[1] 9
summary(a) # rychly prehlad zakladnych statistik o vektore
Min. 1st Qu. Median Mean 3rd Qu. Max.
1.0 3.0 4.0 4.6 6.0 9.0
sort(a) # rastuce usporiadanie
[1] 1 3 4 6 9
sort(a, decreasing = TRUE) # klesajuce
[1] 9 6 4 3 1
Malé cvičenie
Vytvorte vektor w s číslami 1..20 a vypočítajte sumu
všetkých párnych čísel.
k <- 1:18
sum(w[w %% 2 == 0])
[1] 110
Matice
Vytvorenie matíc
m <- matrix(1:12, nrow = 5, ncol = 3) # hodnoty sú zadavane po stlpcoch
m_byrow <- matrix(1:12, nrow = 5, byrow = TRUE) # hodnoty su zadavane po riadkoch
m; m_byrow
[,1] [,2] [,3]
[1,] 1 6 11
[2,] 2 7 12
[3,] 3 8 1
[4,] 4 9 2
[5,] 5 10 3
[,1] [,2] [,3]
[1,] 1 2 3
[2,] 4 5 6
[3,] 7 8 9
[4,] 10 11 12
[5,] 1 2 3
Rozmery matice
[1] 5 3
[,1] [,2] [,3]
[1,] 1 6 11
[2,] 2 7 12
[3,] 3 8 1
[4,] 4 9 2
[5,] 5 10 3
Adresovanie prvkov matice
m[2, 3] # riadok 1, stlpec 2
[1] 12
m[ , 2] # vsetky prvky v tretom stlpci - vysledok matica 3x1
[1] 6 7 8 9 10
m[3, ] # vsetky prvky v druhom riadku - vysledok matica 1*3
[1] 3 8 1
m[1:5, 1:2] # podmatica tvorena riadkami 1, 2 a stlpcami 2, 3
[,1] [,2]
[1,] 1 6
[2,] 2 7
[3,] 3 8
[4,] 4 9
[5,] 5 10
Maticové operácie
A <- matrix(c(6,2,1,5), nrow = 2)
B <- matrix(c(1,3,4,2), nrow = 2)
C <- matrix(c(2,3,5,2), nrow = 2)
A + B # scitanie matic
[,1] [,2]
[1,] 7 5
[2,] 5 7
A * B # Hadamard product - nasobenie po zodpovedajucich prvkoch
[,1] [,2]
[1,] 6 4
[2,] 6 10
A %*% B # nasobenie matic
[,1] [,2]
[1,] 9 26
[2,] 17 18
t(A) # transpozicia matice A - vymena riadkov a stlpcov
[,1] [,2]
[1,] 6 2
[2,] 1 5
det(A) # determinant matice
[1] 28
solve(A) # inverzia matice (ak je matica regularna - teda inverzia sa da spocitat)
[,1] [,2]
[1,] 0.17857143 -0.03571429
[2,] -0.07142857 0.21428571
Zlučovanie vektorov do matíc
C <- cbind(2:4, 1:3) # - po stlpcoch
D <- rbind(8:3, 5:7) # - po riadkoch
C; D
[,1] [,2]
[1,] 2 1
[2,] 3 2
[3,] 4 3
[,1] [,2] [,3] [,4] [,5] [,6]
[1,] 8 7 6 5 4 3
[2,] 5 6 7 5 6 7
Vypočítanie zvolenej štatistiky po riadkoch (stĺpcoch) matice
M <- matrix(2:4, nrow = 2)
M
[,1] [,2]
[1,] 2 4
[2,] 3 2
apply(M, 2, sum) # suma po riadkoch
[1] 5 6
apply(M, 2, mean) # priemery po stĺpcoch
[1] 2.5 3.0
Malé cvičenie
Vytvorte maticu 5x5 s hodnotami po riadkoch 1..25, vypočítajte
stĺpcové sumy a súčin matíc \(M^t
M\).
M2 <- matrix(1:15, nrow = 5, byrow = TRUE)
colSums(M2)
[1] 35 40 45
[,1] [,2] [,3]
[1,] 335 370 405
[2,] 370 410 450
[3,] 405 450 495
# 1) Moje dáta
water <- c(6, 8, 5, 9, 7, 4, 10) # Počet pohárov vody v dňoch 1..7
# 2) Malé úlohy
sum(water >= 8) # a) koľko dní >= 8 pohárov
[1] 3
mean(water) # b) priemer za týždeň
[1] 7
which.max(water) # c) ktorý deň bol najlepší (index dňa 1..7)
[1] 7
water[which.max(water)] # koľko pohárov to bolo
[1] 10
# 3) Graf (časová krivka)
plot(
water, type = "o",
main = "Poháre vody za 7 dní",
xlab = "Deň", ylab = "Počet pohárov",
ylim = c(0, max(water) + 1)
)
abline(h = 8, lty = 2) # vyznačený cieľ 8 pohárov

days <- c("Po","Ut","St","Št","Pi","So","Ne")
plot(1:7, water, type="o", xaxt="n", xlab="Deň", ylab="Poháre")
axis(1, at=1:7, labels=days); abline(h=8, lty=2)

