На этом занятии мы будем работать с файлом Wages.csv
, который содержит данные по работающим мужчинам Соединённых Штатов за 1987 год.
Переменные:
nr
: id;
year
: год;
school
: число лет обучения;
exper
: число лет опыта работы;
ethn
: этническая группа (black
, hisp
, other
);
maried
: семейное положение (женат/не женат) ;
health
: проблемы со здоровьем (да/нет);
wage
: заработная плата в час;
industry
: сфера деятельности;
occupation
: категория должности;
residence
: область проживания (rural area
, north east
, nothern central
, south
).
Загрузите данные из файла Wages.csv
в R. Приведите Ваш код R.
Постройте (любым способом) гистограммы для заработной платы (переменная wage
) с шагом 1.2, отдельно для женатых и неженатых мужчин (переменная maried
). Приведите Ваш код R.
Можно ли, основываясь на полученных гистограммах, считать, что распределение заработной платы мужчин в двух группах является нормальным? Прокомментируйте Ваш ответ.
Проверьте, является ли распределение заработной платы мужчин в группах нормальным, используя нормальную вероятностную бумагу. Приведите код R и прокомментируйте Ваш ответ.
Проверьте формально, используя подходящий статистический критерий, является ли распределение заработной платы мужчин в группах нормальным. Приведите код R и прокомментируйте Ваш ответ (ответ должен содержать формулировку нулевой гипотезы и решение об её отвержении/не отвержении).
Используя подходящий статистический критерий, проверьте, можно ли считать, что заработная плата женатых мужчин отличается от заработной платы неженатых мужчин. Приведите код R и прокомментируйте Ваш ответ (ответ должен содержать обоснование выбранного критерия, формулировку нулевой гипотезы и решение об её отвержении/не отвержении).