сл. неделя скорее всего сдвоенный семинар, потом большая работа на 2 недели
A обсудить статью про репутацию
A обсудить join -o, sort -k1, -k1,2 -k1,1 -s, понятие ключа и индекса, pipe, broken pipe
B разобрать домашку
tr (stdin, нет файла), sed 's//g'
завершение по консоли – ssh клиент, универсальность принципов
начинаем R в спешном темпе, надо быть готовым разбираться (хелп: ?command_name, книжки)
Rstudio: console, history: To Console, To Source, RMD: Run, knit
x <- c(1,2,3,5)
x
y = c(1,2,3,5)
x == y
?c
length(x)
x + 5
x**2
x[1]
x[1:3]
x[c(1, 4)]
Docs: ~/materials/lab04/dplyr-intro.html
B обсуждение дейтасетов uinfo-sorted, popular, topuserbyid, обсуждение стэковерфлоу
короткое обсуждение системы пакетов, их установки
пакет dplyr и почему проходим его
A: единый интерфейс к табличным данным (включая базы данных)
install.packages(c("dplyr", "VennDiagram"))
library(dplyr)
read.csv
read.csv( ,header=F)
read.csv2
read.table( ,sep=' ')
names(uinfo)
names(popular)
names(answers)
join
filter(.data, ...)
summarise(.data, ...)
mutate(.data, ...)
arrange(.data, ...)
select(.data, ...)
A:
do
A: