NPFL112
2020-02-24
tolower("ABC")
[1] "abc"
help("tolower")
nebo
?tolower
Nápověda se objeví v listu Help v pravém dolním okně
v builtin balíčku base, spolu s funkcí chartr - jsou vysvětleny pohromadě
tolower chce znakový vektor nebo něco, z čeho si znakový vektor umí vytvořit sama. library(název knihovny v uvozovkách nebo bez nich) install.packages(název)Packagessample(x, size, replace=FALSE, prob=NULL)
my_sample <- 1:2
set.seed(885) #aby se nahodny generator cisel choval vzdy stejne
sample(x = my_sample, size = 2)
[1] 2 1
sample(my_sample, 2)
[1] 1 2
sample(size = 2, x = my_sample) #musime pojmenovat,kdyz prehodime poradi
[1] 1 2
set.seed(8888)
sample(my_sample, 3, replace = TRUE) #bez nahrazeni nejde, vzorek je mensi
[1] 2 1 2
sample(my_sample, 10, replace = TRUE, prob = c(1,0))
[1] 1 1 1 1 1 1 1 1 1 1
sample(my_sample, 10, replace = TRUE, prob = c(0.7,0.3))
[1] 2 2 1 1 1 1 2 1 2 1
moje_funkce <- function(argumenty na vstupu) {
tady nejaky kod
}
Funkce vygeneruje hromadnou vstupenku podle počtu lidí. Přednastavené hodnoty argumentů.
vytiskni_vstupenku <- function(pocet_osob = 1, cena = 100,
sleva_proc = 50,
od_kolika_osob = 4) {
vyse_slevy <- 0
cena <- cena
if (pocet_osob >= od_kolika_osob) {
vyse_slevy <- sleva_proc * 0.01 * cena
cena <- cena - vyse_slevy
}
cat("Festival KOKOKO", "\n", "Osob: ", pocet_osob, "\n", "Sleva Kč: ", vyse_slevy, "\n", "Cena po slevě Kč: ", cena)
}
vytiskni_vstupenku()
Festival KOKOKO
Osob: 1
Sleva Kč: 0
Cena po slevě Kč: 100
vytiskni_vstupenku(10, 1000)
Festival KOKOKO
Osob: 10
Sleva Kč: 500
Cena po slevě Kč: 500
# A tibble: 212 x 2
test answer
<chr> <chr>
1 Our Our
2 captive captive
3 sat sat
4 ___ in
5 the the
6 cabin cabin
7 opposite opposite
8 ___ to
9 the the
10 iron iron
# … with 202 more rows
https://lindat.mff.cuni.cz/services/udpipe/
Phileas Fogg was a member of the Reform, and that was all. The way in which he got admission to this exclusive club was simple enough. He was recommended by the Barings, with whom he had an open credit. His cheques were regularly paid at sight from his account current, which was always flush. Was Phileas Fogg rich?
https://universaldependencies.org
https://universaldependencies.org/guidelines.html
https://universaldependencies.org/u/pos/all.html
Formát se nazývá conll-u. Je to plaintextová tabulka se zakomentovanými řádky.
Vizualizace závislostního stromu v grafickém rozhraní



masírování dat (wrangling)
vizualizace dat v diagramech (plotting)
vybraná kniha: A.C. Doyle: The Sign of Four (Sherlock Holmes)
https://github.com/COST-ELTeC/ELTeC-eng/blob/master/level0/ENG18900_Doyle.xml
<celý_text><kapitola kolikátá="1"><nadpis>Jak to začalo</nadpis>
<odstavec>Byla jednou jedna babička. Ta měla vnučku.Další věta. Další věta. ...</odstavec>
<odstavec>Říkalo se jí Červená Karkulka, podle červené čepičky. Další věta. Další věta. …</odstavec>
<kapitola kolikátá="2"> <nadpis>Jak to pokračovalo</nadpis>
<odstavec>Na Karkulku v lese číhal vlk. Další věta. Další věta. …</odstavec>
<odstavec> </odstavec> </kapitola>
<kapitola kolikátá="3"> <nadpis>Jak to skončilo</nadpis>
<odstavec>Myslivec vlkovi rozpáral břicho. Další věta. Další věta. …</odstavec>
<odstavec>A to je, milé děti, pohádky konec.</odstavec> </kapitola>
</celý_text>
V TEI vypreparujeme snadno pomocí dotazovacího jazyka pro XML
ptáme se na elementy, které jsou v daném vztahu k předchozímu elementu v dotazu
// - kdekoli pod vrcholem (na začátku dotazu)/ - jako potomek předchozího elementuza určením polohy následuje název elementu (např. odstavec)
můžeme se klást podmínky, např. na hodnoty atributů elementu, když je element má:
kapitola[@kolikátá=3] - chci element kapitola, který má v atributu kolikátá trojku.
XPATH má ještě mnoho dalších funkcí…
tidyverse (dplyr,tidyr, ggplot2, …)XMLudpipe