Выполнив это задание, можно получить бонус к семинарской активности. Каждая из частей весит определенное число баллов (1 балл = 1 плюс на семинарах). Максимальное число плюсов, которое можно скомпенсировать, выполнив задание, это 4. Для этого нужно качественно выполнить задания последнего блока. Баллы не суммируются (не нужно выполнять все три блока, более 4 баллов получить невозможно).
I. Задания на 2 и 3 балла оформляются в виде файла с кодом, файла с расширением .R
. Ответы на вопросы/интерпретацию оформить нужно в виде комментариев к коду. Пример:
# гистограмма для x
hist(x)
# пояснения к гистограмме:
# 1)
# 2)
Итог: нужно загрузить на Dropbox файл с расширением .R
.
II. Задание на 4 балла оформляется в виде документа Word, выгруженного из R — связанного из Rmd-файла (R markdown). Ответы на вопросы оформляются в виде текста с разметкой, код - в специальных ячейках (пояснения и инструкции ниже, в самом задании).
Итог: нужно загрузить на Dropbox два файла: документ Word и файл с расширением .Rmd
.
Создайте вектор из следующих значений: 2, 17, 3, 15, 9, 13, 25.
Это и будет ваша выборка.
1. Выведите все описательные статистики для этой выборки (минимум, максимум, среднее, медиана, квартили). Проинтерпретируйте полученные значения.
2. Постройте гистограмму для этой выборки, поменяйте ее цвет.
Загрузите данные из файла Titanic.csv
, с которым мы работали на семинаре.
1. Выведите описательные статистики для всех переменных в таблице. Выберите два показателя (один количественный, один качественный) и проинтерпретируйте все выведенные по ним значения статистик.
2. Постройте для показателя Age
гистограмму, поменяйте ее цвет, добавьте название (заголовок) графика. Напишите, людей какого возраста в базе больше и меньше всего.
3. Постройте для показателя Age
ящик с усами. Напишите, есть ли в выборке нетипичные значения (выбросы), и если есть, то сколько.
1. Выполните задания 1-3 из предыдущего блока (на 3 балла), но представьте свои решения в виде файла Word, связанного из Rmd-файла.
Для этого нужно создать новый RMarkdown файл, разобраться с его разметкой, после набора кода и текста нажать Knit и выбрать Word. Подробнее - см. здесь и здесь.
2. Постройте 95%-ный доверительный интервал для доли женщин среди выживших. Постройте 95%-ный доверительный интервал для доли мужчин среди выживших. Проинтерпретируйте полученные интервалы. Какой из доверительных интервалов длинее? Пересекаются ли доверительные интервалы?