Бонусное задание в R

Выполнив это задание, можно получить бонус к семинарской активности. Каждая из частей весит определенное число баллов (1 балл = 1 плюс на семинарах). Максимальное число плюсов, которое можно скомпенсировать, выполнив задание, это 4. Для этого нужно качественно выполнить задания последнего блока. Баллы не суммируются (не нужно выполнять все три блока, более 4 баллов получить невозможно).

Пояснения к заданию

I. Задания на 2 и 3 балла оформляются в виде файла с кодом, файла с расширением .R. Ответы на вопросы/интерпретацию оформить нужно в виде комментариев к коду. Пример:

# гистограмма для x
hist(x)
# пояснения к гистограмме:
# 1)
# 2)

Итог: нужно загрузить на Dropbox файл с расширением .R.

II. Задание на 4 балла оформляется в виде документа Word, выгруженного из R — связанного из Rmd-файла (R markdown). Ответы на вопросы оформляются в виде текста с разметкой, код - в специальных ячейках (пояснения и инструкции ниже, в самом задании).

Итог: нужно загрузить на Dropbox два файла: документ Word и файл с расширением .Rmd.

Блок 1 (на 2 балла)

Создайте вектор из следующих значений: 2, 17, 3, 15, 9, 13, 25.

Это и будет ваша выборка.

1. Выведите все описательные статистики для этой выборки (минимум, максимум, среднее, медиана, квартили). Проинтерпретируйте полученные значения.

2. Постройте гистограмму для этой выборки, поменяйте ее цвет.

Блок 2 (на 3 балла)

Загрузите данные из файла Titanic.csv, с которым мы работали на семинаре.

1. Выведите описательные статистики для всех переменных в таблице. Выберите два показателя (один количественный, один качественный) и проинтерпретируйте все выведенные по ним значения статистик.

2. Постройте для показателя Age гистограмму, поменяйте ее цвет, добавьте название (заголовок) графика. Напишите, людей какого возраста в базе больше и меньше всего.

3. Постройте для показателя Age ящик с усами. Напишите, есть ли в выборке нетипичные значения (выбросы), и если есть, то сколько.

Блок 3 (на 4 балла)

1. Выполните задания 1-3 из предыдущего блока (на 3 балла), но представьте свои решения в виде файла Word, связанного из Rmd-файла.

Для этого нужно создать новый RMarkdown файл, разобраться с его разметкой, после набора кода и текста нажать Knit и выбрать Word. Подробнее - см. здесь и здесь.

2. Постройте 95%-ный доверительный интервал для доли женщин среди выживших. Постройте 95%-ный доверительный интервал для доли мужчин среди выживших. Проинтерпретируйте полученные интервалы. Какой из доверительных интервалов длинее? Пересекаются ли доверительные интервалы?