В данном практикуме необходимо работать с файлом Ginzberg.csv.

  1. Добавьте в датафрейм столбец state, который состоит из значений TRUE и FALSE, где TRUE соответствует людям с показателем депрессии равным 1 и выше (высокий), а FALSE — людям с показателем депрессии менее 1 (низкий).

Подсказка:

# посмотрите, что это
factor(dep$depression >= 1)
  1. Используя функцию describeBy, выведите описательные статистики по переменной simplicity по группам в соответствии со столбцом state. Прокомментируйте полученные результаты.

  2. Используя библиотеку ggplot2, постройте гистограммы с шагом 0.3 для показателя упрощённого видения мира (simplicity) для людей с высоким уровнем депрессии и с невысоким. Похоже ли распределение в каждой группе на нормальное?

  3. Сохраните строки, соответствующие респондентам с высоким уровнем депрессии (TRUE) в датафрейм yes, а с невысоким (FALSE) в датафрейм no.

  4. Проверьте, используя критерий Колмогорова-Смирнова, гипотезу о нормальности распределения показателя simplicity по группам. Проделайте то же самое, используя критерий Шапиро-Уилка.

  5. Используя библиотеку ggplot2, постройте ящики с усами для показателя simplicity по группам. Прокомментируйте полученные результаты.

  6. Используя подходящий критерий, проверьте, можно ли считать средние значения показателя упрощённости видения мира (simplicity) равными для людей с высоким уровнем депрессии и невысоким. Сделайте выводы.