В данном практикуме необходимо работать с файлом Ginzberg.csv
.
state
, который состоит из значений TRUE
и FALSE
, где TRUE
соответствует людям с показателем депрессии равным 1 и выше (высокий), а FALSE
— людям с показателем депрессии менее 1 (низкий).Подсказка:
# посмотрите, что это
factor(dep$depression >= 1)
Используя функцию describeBy
, выведите описательные статистики по переменной simplicity
по группам в соответствии со столбцом state
. Прокомментируйте полученные результаты.
Используя библиотеку ggplot2
, постройте гистограммы с шагом 0.3 для показателя упрощённого видения мира (simplicity
) для людей с высоким уровнем депрессии и с невысоким. Похоже ли распределение в каждой группе на нормальное?
Сохраните строки, соответствующие респондентам с высоким уровнем депрессии (TRUE
) в датафрейм yes
, а с невысоким (FALSE
) в датафрейм no
.
Проверьте, используя критерий Колмогорова-Смирнова, гипотезу о нормальности распределения показателя simplicity
по группам. Проделайте то же самое, используя критерий Шапиро-Уилка.
Используя библиотеку ggplot2
, постройте ящики с усами для показателя simplicity
по группам. Прокомментируйте полученные результаты.
Используя подходящий критерий, проверьте, можно ли считать средние значения показателя упрощённости видения мира (simplicity
) равными для людей с высоким уровнем депрессии и невысоким. Сделайте выводы.