Globálne nastavenie Chunkov

V nižšie uvedenom Chunku je urobené základné globálne nastavenie Chunkov v celom Notebooku.

  • echo nastavuje, či chceme v Notebooku vypisovať jednotlivé kódy R
  • message je nastavený na FALSE, čo znamená, že sa budú potláčať pracovné výstupy z R, t.j. napríklad výsledok otvárania knižníc, a niektoré iné výstupy, ktoré ale pre celkový Notebook nemajú takmer žiaden význam a sú vhodné skôr pri ladení kódov.
  • warning nastavený na FALSE potláča zobrazenie chybových hlášok

Quitting from Cvicenie2a_scalars_text_logical_vectors_matrices.Rmd:26-32 [setup]
knitr::opts_chunk$set(
  echo = TRUE,
  message = FALSE,
  warning = FALSE
)

Úvod k základným operáciám v R

Tento notebook demonštruje základné operácie v jazyku R so:

  • skalárnymi číslami (t.j. 1 číslo),
  • textovými (znakovými) reťazcami,
  • logickými (boolovskými) hodnotami a premennými,
  • (numerickými) vektormi,
  • maticami.

Tam, kde je to užitočné, sú zahrnuté malé cvičenia.


Skaláre (jednočíselné hodnoty)

Numerické skaláre

# Priradenie konštanty do premennej
a <- 9
b <- 2.3

# Arithmetic
sum_ab      <- a + b        # sucet
diff_ab     <- a - b        # rozdiel
prod_ab     <- a * b        # násobenie
quot_ab     <- a / b        # delenie
power_ab    <- a ^ b        # umocňovanie
mod_ab      <- a %% 4       # zbytok po delení tromi (tzv modulo)


# Rounding
round_b   <- round(b)       # zaokruhlovanie smerom k najblizsiemu celemu cislu
ceil_b    <- ceiling(b)     # najblizsie vyssie cele cislo
floor_b   <- floor(b)       # najblizsie nizsie cele cislo

a; b
[1] 9
[1] 2.3
sum_ab; diff_ab; prod_ab; quot_ab; power_ab; mod_ab;
[1] 11.3
[1] 6.7
[1] 20.7
[1] 3.913043
[1] 156.5877
[1] 1
round_b; ceil_b; floor_b
[1] 2
[1] 3
[1] 2

Poznámky

  • ^ operátor umocňovania.
  • %% je modulo, teda zbytok po delení,
  • round(x, digits = 0) zaokrúhľovanie na určitý počet desatinných miest (digits=). ak digits = 0, potom ide o celočíselné zaokrúhľovanie

Malé cvičenie

Vypočítajte:

\[\frac{(15^2-4)}{7}\]

((21^(1.2) * 8) / (3/2))-(8/2.5)
[1] 202.7026

Text

Vytváranie textovými premennými a práca s nimi

first <- "Barbora"                       # definovanie obsahu textovej premennej first
last  <- "Koprdova"                          # definovanie obsahu text. premennej last
full  <- paste(first, last)               # spojenie dvoch text. premennych do jednej (s medzerou)
full_nospace <- paste0(first, last)       # spojenie bez medzery
csv_line <- paste("stlp", "postel", "papier", sep = ",")  # spojenie textov s oddelovacom ,
first; last; full; full_nospace; csv_line   # bodkočiarka tu nahradzuje odskok na novy riadok 

Dĺžka textového reťazca, podreťazec

x <- "Ahoj ja som Fero!"
nchar(x)                 # počet znakov  v retazci "R is great!"
[1] 17
substr(x, 9, 11)          # podreťazec od 1. do 5. znaku
[1] "som"

Tip: Knižnica stringr mnohé zaujímavé možnosti práce s textami, ale implicitné knižnice R pokrývajú väčšinu bežných potrieb páce s textami.


Logické (boolovské) hodnoty a premenné

Základy

f <- TRUE
j <- FALSE
!a                 # NOT
[1] FALSE
f & j              # AND
[1] FALSE
f | j              # OR
[1] TRUE
xor(f, j)          # exclusive OR - platí len jedno z p,alebo q
[1] TRUE

Logický výsledok porovnávania

281 < 333
[1] TRUE
44 >= 44
[1] TRUE
"obed" == "obed"
[1] TRUE
"obed" != "vecera"   # vykricnik je tu v zmysle negacie. Napr.:   !=, !>, !<, !TRUE
[1] TRUE
!TRUE
[1] FALSE

Zložitejšie logické operácie

y <- 89
y > 3 & x < 200      # a sucasne - logicky prienik (sucin)
[1] FALSE
y < 10 | x > 30     # alebo - logicke zjednotenie (sucet)
[1] TRUE
                    # pri zlozitejsich vztahoch pouzivajte zatvorky ()

Zlučovanie viacerých log. premenných do vektora

vals <- c(TRUE, FALSE, TRUE, TRUE)   # definicia vektora s logickymi hodnotami

Numerické vektory

Generovanie vektorov

v1 <- c(3, 6, 9, 12)
v2 <- 3:15                  # postupnost 1,2,3,4,5
v3 <- seq(from = 0, to = 16, by = 0.55)  # postupnost s krokom 0.25
v4 <- rep(3, times = 4)    # 3,3,3,3,3  # 5 clenna postupnost trojak
v5 <- runif(4)             # generovanie rovnomerne rozdelenych premennych v intervale [0,1]
v6 <- rnorm(4)             # generovanie normalne rozdelenych premennych
v1; v2; v3; v4; v5
[1]  3  6  9 12
 [1]  3  4  5  6  7  8  9 10 11 12 13 14 15
 [1]  0.00  0.55  1.10  1.65  2.20  2.75  3.30  3.85  4.40  4.95
[11]  5.50  6.05  6.60  7.15  7.70  8.25  8.80  9.35  9.90 10.45
[21] 11.00 11.55 12.10 12.65 13.20 13.75 14.30 14.85 15.40 15.95
[1] 3 3 3 3
[1] 0.2540458 0.6141199 0.4359565 0.2626499

Aritmetické operácie s vektormi

v <- c(10, 32, 44, 58)
v + 3           # kazdy prvok vektora zvacsime o 10
[1] 13 35 47 61
v * 9            # kazdy prvok vektora prenasobime 2
[1]  90 288 396 522
(v + 1) / 2
[1]  5.5 16.5 22.5 29.5
exp(v)           # exponencialna funkcia z kazdeho prvku vektora
[1] 2.202647e+04 7.896296e+13 1.285160e+19 1.545539e+25
sum(c(8,9,10),c(2,3,3))          # skalarny sucin - vysledok je skalar
[1] 35
crossprod(c(4,6,8),c(10,12,14))    # skalarny sucin - vysledok je matica 1x1
     [,1]
[1,]  224
c(11,22,333)*c(5,5,5)               # Hadamardov sucin (sucin zodpovedajucich prvkov vektora)
[1]   55  110 1665

Matematické operácie s 2 vektormi rovnakého rozmeru

length(c(2,8,14,1,3))
[1] 5
length(v5)            #vektor v5 je definovany vyssie
[1] 4
c(6,8,3,10,1) + v5     # pozor, oba vektory musia mat rovnaky rozmer
[1]  6.254046  8.614120  3.435956 10.262650  1.254046

Indexovanie a výber niektorych prvkov vektora

x <- c(3, 8, 33, 1, 2, 18, 29)
x[3]           # indexovanie - novy jedno-prvkovy vektor - prvy prvok vektora x
[1] 33
x[1:2]         # novy vektor s druhym az stvrtym prvkom vektora x
[1] 3 8
x[-5]          # novy vektor - vsetky prvky vektora x okrem prvého
[1]  3  8 33  1 18 29
x[x > 20]      # novy vektor definovany prvkami x vacsimi ako 10
[1] 33 29
which(x > 20)  # ktore prvky zodpovedaju podmienke vacsieho ako 10?
[1] 3 7

Práca s chýbajúcimi hodnotami

y <- c(1, NA, 3, NA, 5)
is.na(y)
[1] FALSE  TRUE FALSE  TRUE FALSE
mean(y)                 # NA
[1] NA
mean(y, na.rm = TRUE)   # remove NAs
[1] 3

Základné štatistiky a usporiadanie prvkov vektora podľa veľkosti

a <- c(1, 6, 3, 9, 4)
mean(a)                 # priemerna hodnota
[1] 4.6
sd(a)                  # standardna odchylka
[1] 3.04959
max(a)                  # maximalna hodnota
[1] 9
summary(a)              # rychly prehlad zakladnych statistik o vektore
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
    1.0     3.0     4.0     4.6     6.0     9.0 
sort(a)                 # rastuce usporiadanie 
[1] 1 3 4 6 9
sort(a, decreasing = TRUE)  # klesajuce
[1] 9 6 4 3 1

Malé cvičenie

Vytvorte vektor w s číslami 1..20 a vypočítajte sumu všetkých párnych čísel.

k <- 1:18
sum(w[w %% 2 == 0])
[1] 110

Matice

Vytvorenie matíc

m <- matrix(1:12, nrow = 5, ncol = 3)            # hodnoty sú zadavane po stlpcoch
m_byrow <- matrix(1:12, nrow = 5, byrow = TRUE)  # hodnoty su zadavane po riadkoch
m; m_byrow
     [,1] [,2] [,3]
[1,]    1    6   11
[2,]    2    7   12
[3,]    3    8    1
[4,]    4    9    2
[5,]    5   10    3
     [,1] [,2] [,3]
[1,]    1    2    3
[2,]    4    5    6
[3,]    7    8    9
[4,]   10   11   12
[5,]    1    2    3

Rozmery matice

dim(m)                   # (rows, cols)
[1] 5 3
m
     [,1] [,2] [,3]
[1,]    1    6   11
[2,]    2    7   12
[3,]    3    8    1
[4,]    4    9    2
[5,]    5   10    3

Adresovanie prvkov matice

m[2, 3]      # riadok 1, stlpec 2
[1] 12
m[ , 2]      # vsetky prvky v tretom stlpci - vysledok matica 3x1
[1]  6  7  8  9 10
m[3, ]       # vsetky prvky v druhom riadku - vysledok matica 1*3
[1] 3 8 1
m[1:5, 1:2]  # podmatica tvorena riadkami 1, 2 a stlpcami 2, 3
     [,1] [,2]
[1,]    1    6
[2,]    2    7
[3,]    3    8
[4,]    4    9
[5,]    5   10

Maticové operácie

A <- matrix(c(6,2,1,5), nrow = 2)
B <- matrix(c(1,3,4,2), nrow = 2)
C <- matrix(c(2,3,5,2), nrow = 2)

A + B        # scitanie matic
     [,1] [,2]
[1,]    7    5
[2,]    5    7
A * B        # Hadamard product - nasobenie po zodpovedajucich prvkoch
     [,1] [,2]
[1,]    6    4
[2,]    6   10
A %*% B      # nasobenie matic
     [,1] [,2]
[1,]    9   26
[2,]   17   18
t(A)         # transpozicia matice A - vymena riadkov a stlpcov
     [,1] [,2]
[1,]    6    2
[2,]    1    5
det(A)       # determinant matice
[1] 28
solve(A)     # inverzia matice (ak je matica regularna - teda inverzia sa da spocitat)
            [,1]        [,2]
[1,]  0.17857143 -0.03571429
[2,] -0.07142857  0.21428571

Zlučovanie vektorov do matíc

C <- cbind(2:4, 1:3)   #  - po stlpcoch 
D <- rbind(8:3, 5:7)   #  - po riadkoch 
C; D
     [,1] [,2]
[1,]    2    1
[2,]    3    2
[3,]    4    3
     [,1] [,2] [,3] [,4] [,5] [,6]
[1,]    8    7    6    5    4    3
[2,]    5    6    7    5    6    7

Vypočítanie zvolenej štatistiky po riadkoch (stĺpcoch) matice

M <- matrix(2:4, nrow = 2)
M
     [,1] [,2]
[1,]    2    4
[2,]    3    2
apply(M, 2, sum)   # suma po riadkoch
[1] 5 6
apply(M, 2, mean)  # priemery po stĺpcoch
[1] 2.5 3.0

Malé cvičenie

Vytvorte maticu 5x5 s hodnotami po riadkoch 1..25, vypočítajte stĺpcové sumy a súčin matíc \(M^t M\).

M2 <- matrix(1:15, nrow = 5, byrow = TRUE)
colSums(M2)
[1] 35 40 45
t(M2) %*% M2
     [,1] [,2] [,3]
[1,]  335  370  405
[2,]  370  410  450
[3,]  405  450  495
# 1) Moje dáta 
water <- c(6, 8, 5, 9, 7, 4, 10)  # Počet pohárov vody v dňoch 1..7

# 2) Malé úlohy
sum(water >= 8)           # a) koľko dní >= 8 pohárov
[1] 3
mean(water)               # b) priemer za týždeň
[1] 7
which.max(water)          # c) ktorý deň bol najlepší (index dňa 1..7)
[1] 7
water[which.max(water)]   #    koľko pohárov to bolo
[1] 10
# 3) Graf (časová krivka)
plot(
  water, type = "o",
  main = "Poháre vody za 7 dní",
  xlab = "Deň", ylab = "Počet pohárov",
  ylim = c(0, max(water) + 1)
)
abline(h = 8, lty = 2)  # vyznačený cieľ 8 pohárov


days <- c("Po","Ut","St","Št","Pi","So","Ne")
plot(1:7, water, type="o", xaxt="n", xlab="Deň", ylab="Poháre")
axis(1, at=1:7, labels=days); abline(h=8, lty=2)

