На этом занятии мы будем работать с файлом Wages.csv, который содержит данные по работающим мужчинам Соединённых Штатов за 1987 год.
Переменные:
nr: id;
year: год;
school: число лет обучения;
exper: число лет опыта работы;
ethn: этническая группа (black, hisp, other);
maried: семейное положение (женат/не женат) ;
health: проблемы со здоровьем (да/нет);
wage: заработная плата в час;
industry: сфера деятельности;
occupation: категория должности;
residence: область проживания (rural area, north east, nothern central, south).
Загрузите данные из файла Wages.csv в R. Приведите Ваш код R.
Постройте (любым способом) гистограммы для заработной платы (переменная wage) с шагом 1.2, отдельно для женатых и неженатых мужчин (переменная maried). Приведите Ваш код R.
Можно ли, основываясь на полученных гистограммах, считать, что распределение заработной платы мужчин в двух группах является нормальным? Прокомментируйте Ваш ответ.
Проверьте, является ли распределение заработной платы мужчин в группах нормальным, используя нормальную вероятностную бумагу. Приведите код R и прокомментируйте Ваш ответ.
Проверьте формально, используя подходящий статистический критерий, является ли распределение заработной платы мужчин в группах нормальным. Приведите код R и прокомментируйте Ваш ответ (ответ должен содержать формулировку нулевой гипотезы и решение об её отвержении/не отвержении).
Используя подходящий статистический критерий, проверьте, можно ли считать, что заработная плата женатых мужчин отличается от заработной платы неженатых мужчин. Приведите код R и прокомментируйте Ваш ответ (ответ должен содержать обоснование выбранного критерия, формулировку нулевой гипотезы и решение об её отвержении/не отвержении).