tidyverse и регулярные выраженияВсе операции, связанные с обработкой данных (добавление столбцов, фильтрация строк и прочее), должны выполняться средствами библиотеки tidyverse.
Загрузите данные из файла Characters.csv, считая, что разделителем столбцов является точка с запятой и что текстовые столбцы должны считываться как строковые, а не как факторные. Сохраните их в датафрейм.
Добавьте в датафрейм столбец Side со значениями Good и Bad, считая, что:
Good присваивается герою в случае, если в Loyalty у него есть слово “Order” или “Hogwarts”;Bad — иначе.Используя критерий хи-квадрат, проверьте, правда ли есть связь между факультетом, на котором учился герой и тем, на чьей стороне он был (столбцы House и Loyalty соответственно).
Добавьте в датафрейм числовой столбец Wand.length, который содержит длину волшебной палочки героя.
Подсказка: необходимо извлечь числа из столбца Wand (там, где они есть).
Добавьте в датафрейм числовой столбец Birth.year, который содержит год рождения героя.
Подсказка: необходимо извлечь числа из столбца Birth (там, где они есть).
Добавьте в датафрейм числовой столбец End.year, который содержит следующие значения:
Death, если герой умер (если соответствующая дата заполнена);Подсказка: можно сначала извлечь годы из столбца Death, а потом на месте пропущенных значений (случаи, где годы не нашлись) поставить 2019. Для заполнения пропусков с помощью tidyverse посмотрите на документацию к функции replace_na().
Добавьте в датафрейм числовой столбец Age, который содержит возраст героев (для простоты считаем, что возраст героев определяется как разность между годом в End.year и Birth.year).
Выведите на экран в отдельной вкладке строки, которые соответствуют героям старше 100 лет, упорядочив их от самого младшего до самого старшего.
Постройте гистограмму для возраста героев, поменяйте цвет, добавьте подписи к осям. Наложите на гистограмму вертикальную линию, которая отчеркивала бы ваш возраст.
Подсказка: вертикальную линию можно добавить с помощью функции abline().