Úvod k základným operáciám v R

Tento dokument demonštruje prácu so základnými typmi hodnôt v R:

  • numerické,
  • textové,
  • logické,
  • vektory a
  • matice.

Pri každej kategórii som zahrnula aj malé cvičenia na sumarizáciu a preopakovanie.


Skaláre (jednočíselné hodnoty)

Numerické skaláre

a <- 8
b <- 3.5
c <- -2

# základné operácie
sucet <- a + b + c
sucin <- a * b * c
priemer <- (a + b + c) / 3

# kombinácie
vyraz1 <- (a^2 + b) / c
vyraz2 <- (a * b) - (b / c)
vyraz3 <- (a %% 3) + (b %% 2)

round(b, 1)
abs(c)       # absolútna hodnota
sqrt(a)      # druhá odmocnina

sucet; sucin; priemer
vyraz1; vyraz2; vyraz3

Malé cvičenie

Vypočítajte nasledujúce výrazy (pri hodnotách a = 8, b = 3.5, c = -2):

  1. \(\frac{a^2 + b^2}{c}\)
  2. \(\frac{a}{b} + \frac{b}{c} + \frac{c}{a}\)
  3. \((a+b+c)^2 - (a \cdot b \cdot c)\)
a <- 8; b <- 3.5; c <- -2

( (a^2 + b^2) / c )
( (a/b) + (b/c) + (c/a) )
( (a+b+c)^2 - (a*b*c) )

Text

Vytváranie textovými premennými a práca s nimi

city <- "Bratislava"                     # premenná obsahujúca názov mesta
food <- "Pizza"                          # premenná obsahujúca jedlo
combo <- paste(city, food)               # spojenie textov s medzerou medzi nimi
combo_nospace <- paste0(city, food)      # spojenie textov bez medzery
list_line <- paste("coffee", "tea", "juice", sep = ",")  # spájanie textov s oddeľovačom ,
city; food; combo; combo_nospace; list_line   # vypísanie viacerých premenných za sebou

Dĺžka textového reťazca, podreťazec

sentence <- "Learning R is fun!"
nchar(sentence)                  # počet znakov v reťazci
substr(sentence, 3, 10)          # výber znakov od 3. po 10. pozíciu

Takýmto spôsobom sa v R pracuje s textovými premennými.

Malé cvičenie

Vytvorte textovú premennú s názvom svojho obľúbeného športu a:
- spojte ju s mestom, kde sa šport hrá,
- vytvorte verziu bez medzery,
- zistite počet znakov v celom reťazci,
- vypíšte iba prvé 4 znaky.

sport <- "Hokej"                     # názov športu
place <- "Kosice"                    # názov mesta

joined <- paste(sport, place)        # spojenie s medzerou
joined_nospace <- paste0(sport, place) # spojenie bez medzery

nchar(joined)                        # počet znakov v celom reťazci
substr(joined, 1, 4)                 # podreťazec - prvé 4 znaky

Logické (boolovské) hodnoty a premenné

Základy

r <- TRUE
s <- FALSE

!r                 # logická negácia (NOT)
r & s              # logický súčin (AND) - pravda len keď obidva sú TRUE
r | s              # logický súčet (OR) - pravda keď aspoň jeden je TRUE
xor(r, s)          # exkluzívne OR - pravda len ak presne jeden z nich je TRUE

Logický výsledok porovnávania

5 > 2                  # je 5 väčšie ako 2?
10 <= 15               # je 10 menšie alebo rovné 15?
"dog" == "dog"         # rovnosť dvoch reťazcov
"apple" != "orange"    # nerovnosť dvoch reťazcov
!FALSE                 # negácia hodnoty FALSE

7 == 3 + 4             # rovnosť čísla a výrazu
20 != 5 * 5            # porovnanie nerovnosti
100 >= 10^2            # mocnina a porovnanie
"car" < "cat"          # porovnanie podľa abecedy (lexikograficky)
"Zoo" > "apple"        # veľké písmená sú v ASCII pred malými

Zložitejšie logické operácie

y <- 25

y >= 20 & y <= 30       # súčasne (AND) - číslo je medzi 20 a 30
y < 0 | y > 100         # alebo (OR) - číslo je menšie ako 0 alebo väčšie ako 100
(y < 20 & y > 10) | (y > 30)   # kombinácia AND a OR - platí, ak y je medzi 10 a 20 alebo väčšie ako 30

Zlučovanie viacerých log. premenných do vektora

checks <- c(TRUE, TRUE, FALSE, FALSE, TRUE)   # vektor logických hodnôt

Malé cvičenie

Základy

Vytvorte dve logické premenné a a b.
- Zistite negáciu a.
- Vypočítajte AND (&) a OR (|).
- Vyskúšajte aj XOR medzi nimi.

a <- TRUE
b <- FALSE

!a
a & b
a | b
xor(a, b)

Logický výsledok porovnávania

Skontrolujte, či platia nasledujúce podmienky:
- číslo 50 je väčšie ako 40 a menšie ako 60,
- číslo 15 nie je rovné 10,
- reťazec “banana” je rovný “banana”,
- reťazec “Apple” je menší ako “apple” (lexikograficky),
- overte, či 7 + 3 = 10 a či 20 - 5 != 15.

num <- 50
num >= 40 & num <= 60       # AND
15 != 10                     # nerovnosť
"banana" == "banana"         # rovnosť reťazcov
"Apple" < "apple"            # lexikografické porovnanie
7 + 3 == 10                  # rovnosť výrazu
20 - 5 != 15                  # nerovnosť výrazu

Zložitejšie logické operácie

Použite číslo y <- 25 a:
- overte, či je medzi 20 a 30 (AND),
- overte, či je menšie ako 0 alebo väčšie ako 100 (OR),
- kombinujte podmienky: medzi 10 a 20 alebo väčšie ako 30,
- vyskúšajte negáciu celej kombinácie.

y <- 25

y >= 20 & y <= 30                        # AND
y < 0 | y > 100                          # OR
(y < 20 & y > 10) | (y > 30)             # kombinácia AND a OR
!( (y < 20 & y > 10) | (y > 30) )        # negácia celej kombinácie

Zlučovanie viacerých log. premenných do vektora

Vytvorte vektor vals <- c(5, 15, 25, 35, 45) a:
- zistite, ktoré hodnoty sú väčšie ako 20,
- ktoré hodnoty sú menšie ako 30,
- ktoré hodnoty sú zároveň väčšie ako 20 a menšie ako 40,
- skombinujte OR a AND vo výraze pre každý prvok, aby ste zistili, ktoré hodnoty sú menšie ako 10 alebo väčšie ako 40.

vals <- c(5, 15, 25, 35, 45)

vals > 20                 # TRUE pre prvky väčšie ako 20
vals < 30                 # TRUE pre prvky menšie ako 30
vals > 20 & vals < 40     # kombinácia AND
(vals < 10 | vals > 40)   # kombinácia OR

Numerické vektory

Generovanie vektorov

a1 <- c(10, 20, 30, 40)
a2 <- 5:12                        # postupnosť čísel od 5 po 12
a3 <- seq(from = 2, to = 4, by = 0.5)   # postupnosť s krokom 0.5
a4 <- rep(7, times = 6)           # vektor so šiestimi sedmičkami
a5 <- runif(6, min = -1, max = 1) # náhodné čísla z intervalu [-1,1]
a6 <- rnorm(6, mean = 50, sd = 10) # normálne rozdelenie so stredom 50

a1; a2; a3; a4; a5; a6

Aritmetické operácie s vektormi

b <- c(2, 4, 6, 8)
b - 3             # každý prvok zmenšíme o 3
b / 2             # každý prvok vydelíme dvomi
(b^2) + 1         # druhá mocnina každého prvku plus 1
log(b)            # prirodzený logaritmus prvkov
sum(c(2,4,6), c(1,1,1))         # skalárny súčin (skrátená forma)
crossprod(c(2,4,6), c(1,1,1))   # skalárny súčin - matica 1x1
c(2,4,6) * c(3,3,3)             # Hadamardov súčin

Matematické operácie s 2 vektormi rovnakého rozmeru

length(c(10,20,30,40))
length(a5)           # dĺžka vektora a5
c(10,20,30,40) + a5  # súčet vektorov
c(10,20,30,40) - a5  # rozdiel vektorov

Indexovanie a výber niektorych prvkov vektora

c1 <- c(9, 15, 2, 27, 5, 18, 0)
c1[3]          # tretí prvok
c1[2:5]        # druhý až piaty prvok
c1[-4]         # všetko okrem štvrtého prvku
c1[c1 %% 3 == 0]  # len tie prvky, ktoré sú deliteľné tromi
which(c1 < 10) # indexy prvkov menších ako 10

Práca s chýbajúcimi hodnotami

d <- c(NA, 4, 8, NA, 12, 16)
is.na(d)                
sum(is.na(d))           # počet chýbajúcich hodnôt
mean(d, na.rm = TRUE)   # priemer bez NA
median(d, na.rm = TRUE) # medián bez NA

Základné štatistiky a usporiadanie prvkov vektora podľa veľkosti

e <- c(25, 7, 14, 32, 19, 3)
mean(e)                  
sd(e)                    
min(e)                   
max(e)                   
summary(e)               
sort(e)                  
sort(e, decreasing = TRUE) 

Malé cvičenie 1

Vytvorte vektor f s číslami 50..100 a vypočítajte aritmetický priemer všetkých nepárnych čísel.

f <- 50:100
mean(f[f %% 2 == 1])

Malé cvičenie 2

Vytvorte vektor 10 náhodných čísel z intervalu [-5,5] a spočítajte, koľko z nich je kladných.

g <- runif(10, min = -5, max = 5)
g
sum(g > 0)

Malé cvičenie 3

Vytvorte vektor h s hodnotami od 1 do 12 a zistite, aký je rozdiel medzi súčtom čísel deliteľných 4 a súčtom čísel deliteľných 3.

h <- 1:12
sum4 <- sum(h[h %% 4 == 0])
sum3 <- sum(h[h %% 3 == 0])
sum4 - sum3

Môj návrh použitia novinky

V sekcii “Skaláre” som:

  • použila aj tretiu premennú c - išlo konkrétne o zápornú hodnotu, čím som rozšírila možnosti výpočtov o prácu so znamienkami,
  • urobila vlastné zložitejšie kombinácie výpočtových operácií,
  • použila ďalšie matematické funkcie, ako sú absolútna hodnota, druhá odmocnina a zaokrúhľovanie na 1 desatinné miesto,
  • som namiesto jedného jednoduchého cvičenia zahrnula tri rôzne úlohy, kde sa kombinujú mocniny, zlomky, súčty a súčiny.

V sekcii “Text” som:

  • pridala malé cvičenie, ktoré rozširuje prácu s textom a dáva priestor na tvorenie vlastného príkladu.

V sekcii “Logické hodnoty” som:

  • pridala viac príkladov logických porovnaní vrátane čísel, výrazov a textov,
  • doplnila jednotlivé operácie o podrobnejšie komentáre,
  • ukázala kombinované logické výrazy s AND, OR a negáciou,
  • pri zlučovaní logických premenných použila číselný vektor a podmienkové filtrovanie,
  • doplnila 4 bloky cvičení (jeden ku každej podkapitole), ktoré rozvíjajú základné aj pokročilé znalosti.

V sekcii “Numerické vektory” som:

  • pri aritmetických operáciách poukázala na odčítanie, delenie, mocniny a logaritmickú funkciu,
  • rozšírila operácie s dvomi vektormi o rozdiel vektorov,
  • pri indexovaní a výbere pridala príklad výberu podľa deliteľnosti, nielen podľa veľkosti,
  • doplnila prácu s chýbajúcimi hodnotami a základné štatistiky o ďalšie funkcie.
