1.5. Работа с таблицами данных

library(readxl)
library(dplyr)

## 
## Присоединяю пакет: 'dplyr'

## Следующие объекты скрыты от 'package:stats':
## 
##     filter, lag

## Следующие объекты скрыты от 'package:base':
## 
##     intersect, setdiff, setequal, union

library(tidyr)
TeachingRatings <- read_excel("TeachingRatings.xls")

names(TeachingRatings)

## [1] "minority"    "age"         "female"      "onecredit"   "beauty"     
## [6] "course_eval" "intro"       "nnenglish"

str(TeachingRatings)

## tibble [463 × 8] (S3: tbl_df/tbl/data.frame)
##  $ minority   : num [1:463] 1 0 0 0 0 0 0 0 0 0 ...
##  $ age        : num [1:463] 36 59 51 40 31 62 33 51 33 47 ...
##  $ female     : num [1:463] 1 0 0 1 1 0 1 1 1 0 ...
##  $ onecredit  : num [1:463] 0 0 0 0 0 0 0 0 0 0 ...
##  $ beauty     : num [1:463] 0.29 -0.738 -0.572 -0.678 1.51 ...
##  $ course_eval: num [1:463] 4.3 4.5 3.7 4.3 4.4 4.2 4 3.4 4.5 3.9 ...
##  $ intro      : num [1:463] 0 0 0 0 0 0 0 0 0 0 ...
##  $ nnenglish  : num [1:463] 0 0 0 0 0 0 0 0 0 0 ...

#отбор нужных столбцов 
data1 <- TeachingRatings[,c(2,3,4)]
data2 <- dplyr::transmute(TeachingRatings, minority = minority, age = age, female = female)

#фильтр по значению 
data3 <- dplyr::filter(data2, minority == 1)
data4 <- dplyr::filter(data2, age %in% c(39,59,33,51))
#не хотим учитывать эти значения возраста
data5 <- dplyr::filter(data2, !(age %in% c(39,59,33,51)))

#делать таблицы длиннее - полезно для графиков 
#cols - какие столбцы мы переносим по строчкам
#names_to - куда переносим названия: minority, age и female 
#values_to - куда переносим значения переменных minority, age и female 
data6 <- pivot_longer(as.data.frame(data5), cols = "minority":"female", names_to = "Names", values_to = "Values")