Úvod k základným operáciám v R
Tento dokument demonštruje prácu so základnými typmi
hodnôt v R:
- numerické,
- textové,
- logické,
- vektory a
- matice.
Pri každej kategórii som zahrnula aj malé cvičenia
na sumarizáciu a preopakovanie.
Skaláre (jednočíselné hodnoty)
Numerické skaláre
a <- 8
b <- 3.5
c <- -2
# základné operácie
sucet <- a + b + c
sucin <- a * b * c
priemer <- (a + b + c) / 3
# kombinácie
vyraz1 <- (a^2 + b) / c
vyraz2 <- (a * b) - (b / c)
vyraz3 <- (a %% 3) + (b %% 2)
round(b, 1)
abs(c) # absolútna hodnota
sqrt(a) # druhá odmocnina
sucet; sucin; priemer
vyraz1; vyraz2; vyraz3
Malé cvičenie
Vypočítajte nasledujúce výrazy (pri hodnotách a = 8, b = 3.5, c =
-2):
- \(\frac{a^2 + b^2}{c}\)
- \(\frac{a}{b} + \frac{b}{c} +
\frac{c}{a}\)
- \((a+b+c)^2 - (a \cdot b \cdot
c)\)
a <- 8; b <- 3.5; c <- -2
( (a^2 + b^2) / c )
( (a/b) + (b/c) + (c/a) )
( (a+b+c)^2 - (a*b*c) )
Text
Vytváranie textovými premennými a práca s nimi
city <- "Bratislava" # premenná obsahujúca názov mesta
food <- "Pizza" # premenná obsahujúca jedlo
combo <- paste(city, food) # spojenie textov s medzerou medzi nimi
combo_nospace <- paste0(city, food) # spojenie textov bez medzery
list_line <- paste("coffee", "tea", "juice", sep = ",") # spájanie textov s oddeľovačom ,
city; food; combo; combo_nospace; list_line # vypísanie viacerých premenných za sebou
Dĺžka textového reťazca, podreťazec
sentence <- "Learning R is fun!"
nchar(sentence) # počet znakov v reťazci
substr(sentence, 3, 10) # výber znakov od 3. po 10. pozíciu
Takýmto spôsobom sa v R pracuje s textovými premennými.
Malé cvičenie
Vytvorte textovú premennú s názvom svojho obľúbeného športu a:
- spojte ju s mestom, kde sa šport hrá,
- vytvorte verziu bez medzery,
- zistite počet znakov v celom reťazci,
- vypíšte iba prvé 4 znaky.
sport <- "Hokej" # názov športu
place <- "Kosice" # názov mesta
joined <- paste(sport, place) # spojenie s medzerou
joined_nospace <- paste0(sport, place) # spojenie bez medzery
nchar(joined) # počet znakov v celom reťazci
substr(joined, 1, 4) # podreťazec - prvé 4 znaky
Logické (boolovské) hodnoty a premenné
Základy
r <- TRUE
s <- FALSE
!r # logická negácia (NOT)
r & s # logický súčin (AND) - pravda len keď obidva sú TRUE
r | s # logický súčet (OR) - pravda keď aspoň jeden je TRUE
xor(r, s) # exkluzívne OR - pravda len ak presne jeden z nich je TRUE
Logický výsledok porovnávania
5 > 2 # je 5 väčšie ako 2?
10 <= 15 # je 10 menšie alebo rovné 15?
"dog" == "dog" # rovnosť dvoch reťazcov
"apple" != "orange" # nerovnosť dvoch reťazcov
!FALSE # negácia hodnoty FALSE
7 == 3 + 4 # rovnosť čísla a výrazu
20 != 5 * 5 # porovnanie nerovnosti
100 >= 10^2 # mocnina a porovnanie
"car" < "cat" # porovnanie podľa abecedy (lexikograficky)
"Zoo" > "apple" # veľké písmená sú v ASCII pred malými
Zložitejšie logické operácie
y <- 25
y >= 20 & y <= 30 # súčasne (AND) - číslo je medzi 20 a 30
y < 0 | y > 100 # alebo (OR) - číslo je menšie ako 0 alebo väčšie ako 100
(y < 20 & y > 10) | (y > 30) # kombinácia AND a OR - platí, ak y je medzi 10 a 20 alebo väčšie ako 30
Zlučovanie viacerých log. premenných do vektora
checks <- c(TRUE, TRUE, FALSE, FALSE, TRUE) # vektor logických hodnôt
Malé cvičenie
Základy
Vytvorte dve logické premenné a
a b
.
- Zistite negáciu a
.
- Vypočítajte AND (&
) a OR (|
).
- Vyskúšajte aj XOR medzi nimi.
a <- TRUE
b <- FALSE
!a
a & b
a | b
xor(a, b)
Logický výsledok porovnávania
Skontrolujte, či platia nasledujúce podmienky:
- číslo 50 je väčšie ako 40 a menšie ako 60,
- číslo 15 nie je rovné 10,
- reťazec “banana” je rovný “banana”,
- reťazec “Apple” je menší ako “apple” (lexikograficky),
- overte, či 7 + 3 = 10 a či 20 - 5 != 15.
num <- 50
num >= 40 & num <= 60 # AND
15 != 10 # nerovnosť
"banana" == "banana" # rovnosť reťazcov
"Apple" < "apple" # lexikografické porovnanie
7 + 3 == 10 # rovnosť výrazu
20 - 5 != 15 # nerovnosť výrazu
Zložitejšie logické operácie
Použite číslo y <- 25
a:
- overte, či je medzi 20 a 30 (AND),
- overte, či je menšie ako 0 alebo väčšie ako 100 (OR),
- kombinujte podmienky: medzi 10 a 20 alebo väčšie ako 30,
- vyskúšajte negáciu celej kombinácie.
y <- 25
y >= 20 & y <= 30 # AND
y < 0 | y > 100 # OR
(y < 20 & y > 10) | (y > 30) # kombinácia AND a OR
!( (y < 20 & y > 10) | (y > 30) ) # negácia celej kombinácie
Zlučovanie viacerých log. premenných do vektora
Vytvorte vektor vals <- c(5, 15, 25, 35, 45)
a:
- zistite, ktoré hodnoty sú väčšie ako 20,
- ktoré hodnoty sú menšie ako 30,
- ktoré hodnoty sú zároveň väčšie ako 20 a menšie ako 40,
- skombinujte OR a AND vo výraze pre každý prvok, aby ste zistili, ktoré
hodnoty sú menšie ako 10 alebo väčšie ako 40.
vals <- c(5, 15, 25, 35, 45)
vals > 20 # TRUE pre prvky väčšie ako 20
vals < 30 # TRUE pre prvky menšie ako 30
vals > 20 & vals < 40 # kombinácia AND
(vals < 10 | vals > 40) # kombinácia OR
Numerické vektory
Generovanie vektorov
a1 <- c(10, 20, 30, 40)
a2 <- 5:12 # postupnosť čísel od 5 po 12
a3 <- seq(from = 2, to = 4, by = 0.5) # postupnosť s krokom 0.5
a4 <- rep(7, times = 6) # vektor so šiestimi sedmičkami
a5 <- runif(6, min = -1, max = 1) # náhodné čísla z intervalu [-1,1]
a6 <- rnorm(6, mean = 50, sd = 10) # normálne rozdelenie so stredom 50
a1; a2; a3; a4; a5; a6
Aritmetické operácie s vektormi
b <- c(2, 4, 6, 8)
b - 3 # každý prvok zmenšíme o 3
b / 2 # každý prvok vydelíme dvomi
(b^2) + 1 # druhá mocnina každého prvku plus 1
log(b) # prirodzený logaritmus prvkov
sum(c(2,4,6), c(1,1,1)) # skalárny súčin (skrátená forma)
crossprod(c(2,4,6), c(1,1,1)) # skalárny súčin - matica 1x1
c(2,4,6) * c(3,3,3) # Hadamardov súčin
Matematické operácie s 2 vektormi rovnakého rozmeru
length(c(10,20,30,40))
length(a5) # dĺžka vektora a5
c(10,20,30,40) + a5 # súčet vektorov
c(10,20,30,40) - a5 # rozdiel vektorov
Indexovanie a výber niektorych prvkov vektora
c1 <- c(9, 15, 2, 27, 5, 18, 0)
c1[3] # tretí prvok
c1[2:5] # druhý až piaty prvok
c1[-4] # všetko okrem štvrtého prvku
c1[c1 %% 3 == 0] # len tie prvky, ktoré sú deliteľné tromi
which(c1 < 10) # indexy prvkov menších ako 10
Práca s chýbajúcimi hodnotami
d <- c(NA, 4, 8, NA, 12, 16)
is.na(d)
sum(is.na(d)) # počet chýbajúcich hodnôt
mean(d, na.rm = TRUE) # priemer bez NA
median(d, na.rm = TRUE) # medián bez NA
Základné štatistiky a usporiadanie prvkov vektora podľa
veľkosti
e <- c(25, 7, 14, 32, 19, 3)
mean(e)
sd(e)
min(e)
max(e)
summary(e)
sort(e)
sort(e, decreasing = TRUE)
Malé cvičenie 1
Vytvorte vektor f
s číslami 50..100 a vypočítajte
aritmetický priemer všetkých nepárnych čísel.
f <- 50:100
mean(f[f %% 2 == 1])
Malé cvičenie 2
Vytvorte vektor 10 náhodných čísel z intervalu [-5,5] a spočítajte,
koľko z nich je kladných.
g <- runif(10, min = -5, max = 5)
g
sum(g > 0)
Malé cvičenie 3
Vytvorte vektor h
s hodnotami od 1 do 12 a zistite, aký
je rozdiel medzi súčtom čísel deliteľných 4 a súčtom čísel deliteľných
3.
h <- 1:12
sum4 <- sum(h[h %% 4 == 0])
sum3 <- sum(h[h %% 3 == 0])
sum4 - sum3
Môj návrh použitia novinky
V sekcii “Skaláre” som:
- použila aj tretiu premennú c - išlo konkrétne o zápornú hodnotu, čím
som rozšírila možnosti výpočtov o prácu so znamienkami,
- urobila vlastné zložitejšie kombinácie výpočtových operácií,
- použila ďalšie matematické funkcie, ako sú absolútna hodnota, druhá
odmocnina a zaokrúhľovanie na 1 desatinné miesto,
- som namiesto jedného jednoduchého cvičenia zahrnula tri rôzne úlohy,
kde sa kombinujú mocniny, zlomky, súčty a súčiny.
V sekcii “Text” som:
- pridala malé cvičenie, ktoré rozširuje prácu s textom a dáva
priestor na tvorenie vlastného príkladu.
V sekcii “Logické hodnoty” som:
- pridala viac príkladov logických porovnaní vrátane čísel, výrazov a
textov,
- doplnila jednotlivé operácie o podrobnejšie komentáre,
- ukázala kombinované logické výrazy s AND, OR a negáciou,
- pri zlučovaní logických premenných použila číselný vektor a
podmienkové filtrovanie,
- doplnila 4 bloky cvičení (jeden ku každej podkapitole), ktoré
rozvíjajú základné aj pokročilé znalosti.
V sekcii “Numerické vektory” som:
- pri aritmetických operáciách poukázala na odčítanie, delenie,
mocniny a logaritmickú funkciu,
- rozšírila operácie s dvomi vektormi o rozdiel vektorov,
- pri indexovaní a výbere pridala príklad výberu podľa deliteľnosti,
nielen podľa veľkosti,
- doplnila prácu s chýbajúcimi hodnotami a základné štatistiky o
ďalšie funkcie.
