Загрузите таблицу с расширением Titanic.csv
по ссылке и сохраните ее как df
. Посмотрите на нее. Сколько в таблице наблюдений (строк), переменных (столбцов)? Все ли переменные имеют корректный тип? Удалите из таблицы пропущенные значения и сохраните изменения в df
.
Используя функции dplyr
, оставьте в базе данных все столбцы, кроме Ticket
и Cabin
.
Переименуйте столбцы в таблице так, чтобы все названия были записаны с маленькой буквы (dplyr
не требуется).
Добавьте в таблицу столбец age_sq, в котором сохранены значения возраста в квадрате. Добавьте столбец female, состоящий из 0 и 1, где 1 соответствует пассажирам женского пола (функция ifelse()
).
Агрегируйте данные по классам (pclass
) и посчитайте число пассажиров женского и мужского пола среди пассажиров каждого класса. Посчитайте процент пассажиров женского и мужского пола среди пассажиров каждого класса. (Подсказка: сочетайте group_by()
и summarise()
).
Посчитайте число пассажиров, в обращении которых используется слово Mr.
.
Установите библиотеку ggplot2()
и обратитесь к ней через library()
.
Постройте гистограмму для значений переменной age для пассажиров 1) первого класса; 2) третьего класса.
# пример для 1 класса
df %>% filter(pclass == 1) %>% ggplot(aes(x = age)) + geom_histogram()
FALSE Warning: Removed 30 rows containing non-finite values (stat_bin).
df %>% filter(pclass == 1) %>% ggplot(aes(x = age)) + geom_histogram(binwidth = 5) + ggtitle("1st class")
FALSE Warning: Removed 30 rows containing non-finite values (stat_bin).
df %>% filter(pclass == 1) %>% ggplot(aes(x = age)) +
geom_histogram(binwidth = 5, fill = 'thistle', color = 'darkviolet') +
ggtitle("1st class") +
theme_bw()
FALSE Warning: Removed 30 rows containing non-finite values (stat_bin).
geom_density()
) по группам в зависимости от пола пассажиров. Графики для пассажиров женского и мужского пола должны быть в разных «окошках» (фасетках).Подсказка: поменяйте тип графика на geom_density()
, для получения графиков по группам используйте facet_grid(~)
, где после ~
укажите переменную группировки (в нашем случае пол пассажира).