Плотникова Виктория, Мухамбеткали Тамерлан, Чеснокова Елена, Струговец Мария, Махнырь Глеб, Выдрина Милана, БЭК195
С помощью данного исследования мы хотим выявить различия в характеристиках бюджетников и небюджетников в России. Мы попытаемся выявить, по какой причине работоспособное население РФ выбирает тот или иной сектор, что влияет на выбор людей и мотивирует на работу в государственной или же, наоборот, в коммерческой организации. Кроме того, мы хотим выяснить, какой же сектор наиболее привлекателен для трудоустройства, какие различия присутствуют в работе в бюджетном и небюджетном секторах и какие привилегии они предоставляют. Данное исследование поможет нам детальнее изучить экономическую ситуацию в России, а так же, понять природу некоторых экономических проблем в стране.
Для работы над данным исследованием, мы изучили большое количество научной литературы, благодаря которой смогли сформировать определенное мнение по теме, на которое опирались в своем анализе. Как известно, в большинстве стран мира государственные служащие, включая работников, аналогичных нашим бюджетникам, получают более впечатляющие заработные платы, нежели работники коммерческого сектора. Об этом свидетельствуют многочисленные эмпирические исследования. По словам Грегори и Борланда: «Работники общественного сектора обычно имеют в среднем более высокие заработки, чем работники частного сектора». Однако, в РФ иная ситуация; в наши дни факт значительной недоплаты за труд в России в бюджетном секторе известен многим. Практически каждому человеку в нашей стране известны примеры, когда высококвалифицированные специалисты достойных профессий не получали достойного вознаграждения за свой труд. Итак, давайте детальнее изучим, базируясь на изученной нами научной литературе, причины, по которым в России происходит подобное несоответствие мировым канонам, а так же, как это сказывается на небюджетном секторе. Прежде всего, стоит отметить, что в России существует достаточно внушительный разрыв в размере заработных плат в пользу небюджетников. С возрастом межсекторный разрыв имеет тенденцию к сокращению. Отчасти это объясняется тем, что в бюджетном секторе зарплата сильно зависит от стажа, который набирается с возрастом. В небюджетном секторе эта связь значительно слабее. Чем выше концентрация населения, тем значительнее разрыв. Более конкурентная экономическая среда крупных городов повышает уровень оплаты труда вне бюджетного сектора. Что касается природы и источников наличия региональной вариации межсекторных разрывов, то в работе протестированы две гипотезы влияния экономических, демографических и бюджетных характеристик регионов на величину межсекторного разрыва. Демографическая гипотеза, суть которой заключается в том, что большая доля лиц, создающих спрос на услуги бюджетного сектора, а именно образование и здравоохранение, в населении региона может влиять на заработную плату в бюджетном секторе и, как следствие, на величину межсекторного разрыва, и фискально-бюджетная гипотеза, которая утверждает, что основное влияние на величину разрыва имеют экономические и бюджетные возможности регионов. В экономически сильных регионах бюджетникам живется относительно хуже. Недоплата работникам бюджетного сектора больше в регионах с высоким уровнем ВРП на душу населения и низкой долей трансфертов в доходах регионального бюджета.
Тем не менее, существуют так же различия в неденежной компенсации. В данном случае, конечно, бюджетный сектор дает своим работникам заметные преимущества. Во-первых, занятость в небюджетном секторе в значительно большей степени связана с выполнением тяжелой физической работы. Доля бюджетников, занятых такой работой, составляет 11-13%, в то время, как небюджетников примерно 1/3. Бюджетники тратят на такую работу примерно треть своего рабочего времени, в то время как для небюджетников этот показатель доходит до половины. Во-вторых, для бюджетников предусмотрены некоторые стандартные блага, такие как: оплата очередных отпусков, больничных листов и отпуска по беременности, родам и уходу за ребенком, что особенно актуально, учитывая тот факт, что в бюджетном секторе преимущественно работают женщины. Кроме того, благодаря сокращенной рабочей неделе учителей и врачей продолжительность рабочего времени в бюджетном секторе в среднем короче по сравнению с небюджетным (38,8 часа против 44,8).
И, наконец, бюджетники чаще имеют вторичную занятость (в среднем 8,1% против 4,1% в небюджетном секторе). Вероятно, сокращенная рабочая неделя позволяет им тратить больше времени на дополнительную работу. Но этому факту может быть дано и другое – дополняющее – объяснение, связанное с низкой заработной платой по основному месту работы, вынуждающей к поиску дополнительных доходов.
В небюджетном секторе эти стандартные блага не являются всеобщими и, как правило, встречаются намного реже. В нескольких случаях, наоборот, небюджетный сектор дает значимые преимущества своим работникам. Прежде всего, это касается предоставления им кредитов, как правило, небюджетникам кредиты предоставляют охотнее. Кроме того, для небюджетников чаще предусмотрено льготное или бесплатное питание, нежели для бюджетников.
Кроме того, традиционно считается, что принадлежность к государственному сектору отчасти мотивируется отсутствием склонности к риску на рынке труда. Это означает, что выбор сектора коррелирует с показателями, характеризующими страх потери работы и неуверенность в нахождении новой работы. Бюджетники также в большей мере уверены в том, что в случае необходимости найдут работу не хуже имеющейся, однако в этом случае межсекторный разрыв еще меньше. Последнее может объясняться и тем, что низкооплачиваемую работу всегда найти легче, чем высокооплачиваемую. Желание сменить место работы может интерпретироваться как косвенная характеристика удовлетворенности имеющейся работой. Тем не менее, не происходит высокой текучести кадров из бюджетного сектора. Это связано с тем, что распределение работников между бюджетными и небюджетными секторами неслучайно и является продуктом как само отбора, так и отбора работодателями. Кроме того, стоит учитывать все компоненты вознаграждений, например, взятки, объем которых может компенсировать небольшую заработную плату.
Чтобы детальнее изучить общую картину, обратимся к статистике. По данным счетной палаты, зарплаты бюджетников в 2012–2019 годах росли быстрее, чем в целом по экономике. В некоторых отраслях рост оплаты труда сопровождался сокращением численности работников и повышением индивидуальной нагрузки. Майские указы, которые были даны президентом России в мае 2012 года, обеспечили опережающий рост оплаты труда бюджетников, однако в ряде регионов целевые показатели не были достигнуты по отдельным сегментам работников бюджетной сферы.
Анализ показал, что рост оплаты труда бюджетников сопровождался сокращением численности сотрудников. Так, в период с 2013 по 2019 год младшего медицинского персонала стало меньше на 61,3%, социальных работников — на 32,6%. Общая численность по всем предусмотренным указами категориям сократилась на 14,5%.
Однако были и отрасли, где численность сотрудников выросла. Речь идет о педагогических работниках дошкольных образовательных учреждений и работниках образовательных учреждений общего образования. «Это связано с тем, что у нас рождаемость была выше в предыдущие годы и открывались новые школы, детские сады. Физически здесь не хватало людей, хотя и здесь есть дефицит работников», — пояснил Штогрин.
Итак, как же формируются заработные платы? Формирование заработной платы почти во всех экономиках является сильно институционализированным процессом. На него влияют государство, профсоюзы, сложившиеся процедуры и традиции. Это особенно верно для рынка труда в бюджетном секторе. Поэтому, прежде всего необходимо рассмотреть институциональный контекст определения величины заработной платы и, как следствие, межсекторных разрывов. Организации, действующие в бюджетном секторе, не являются максимизаторами прибыли. Необходимые параметры прямо или косвенно устанавливаются собственником, т.е. государством, на основании необходимости создания общественных благ, таких как образование, здравоохранение и государственное управление. Предприятия, функционирующие на конкурентном рынке, наоборот, определяют цену труда, стремясь к максимизации экономических результатов. Результатом систематизации теоретических и эмпирических исследований, анализа основных институциональных изменений, которые оказывали свое влияние на механизм зарплатообразования, является заключение, что лишь специальные постановления, которые подтягивают заработную плату определенных категорий бюджетников, оказывают статистически значимое влияние на сокращение разрыва.
В своем исследовании мы проанализируем и изучим не только классические и наиболее популярные факторы, которые мы чаще всего можем встретить в научной литературе, но и более нестандартные (например: «Уровень удовлетворенностью жизнью»), которые позволят нам проанализировать и изучить нашу тему с новой стороны и наиболее детально разобраться в различиях в характеристиках бюджетников и небюджетников в России.
Анализируя перечисленную выше информацию, мы сформировали основную гипотезу и несколько второстепенных гипотез, с помощью которых мы попытаемся изучить последующие взаимосвязи. Работая над основной гипотезой, мы хотим выяснить, есть ли связь в работе в той или иной сфере и количеством рабочих часов в неделю. Работая над второстепенными гипотезами, мы, прежде всего, хотим проанализировать заработные платы бюджетников и небюджетников, а так же сделать вывод о влиянии сферы на наличие дополнительной работы. Далее, мы бы хотели проанализировать уровень удовлетворенности жизнью у бюджетников и небюджетников, что поможет нас детальнее понять, что именно побуждает трудоспособное население работать в бюджетной или небюджетной сфере.
В работе мы использовали данные РМЭЗ (Российский мониторинг экономического положения и здоровья населения НИУ ВШЭ). После проделанной нами работы по их анализу, мы пришли к следующим выводам касаемо их достоинств и недостатков.
Достоинство данных
Главным достоинством наших данных является большое количество разных показателей и факторов, которые несмотря на свой большой объем, требуют минимального ручного вмешательство. Одним из показателей, является большое количество разных возрастов участников, что помогает нам делить их на возрастные группы для прослеживания тенденций в той или иной группе работников.
К недостатку наших данных, мы отнесли следующие моменты:
Одной из основных задач нашей работы, является правильное определение сферы работы опрашиваемых участников, т.е. работает ли человек в бюджетном или же во внебюджетном секторе. Для разделения на такие группы, мы использовали ответ участников на вопрос “Является государство владельцем или совладельцем вашего предприятия, организации?”. Проблема в том, что в случае если же Государство является совладельцем предприятие это не обязательно говорит о том, что работник является бюджетником. Но из за проблем с поиском других данных, мы решили все же оставить данный критерий для разделения на группы.
При анализе важного для нас показателя “заработная плата”, нам пришлось в ручную просмотреть ответы работников для нахождения не числовых значений, которые могут помешать нам для корректного построения ящиковой диаграммы. После нашего просмотра, мы с помощью фильтра убрали такие ответы как: Отказ от ответа, Затрудняюсь ответить, Нет ответа, 1e+0.5, 0. А также проблема возникла из за большого размаха выборки, пришлось считать значения в тыс. руб для корректного просмотра и построения графика.
Опираясь на показатель “Количество рабочих часов в неделю”, мы столкнулись с тем, что у нашей выборки не нормальное распределение. В связи с этим, мы отказались в использовании удобного для нас t.test для ответа на нашу гипотезу.
Почему подходят данные?
Из за обширности нашей темы, мы имеем возможность провести анализ не ограничивая своё исследование определенными показателями. Используемый нами РМЭЗ предоставляет нам возможность взглянуть с разных сторона на характеристики бюджетников и небюджетников. РМЭЗ включает в себя как числовые показатели (ЗП, кол-во рабочих часов в неделю и т.п ) так и категориальные показатели (Уровень удовлетворенностью жизнью, желание сменить работу, доп. работу и т.п.). Поэтому мы решили использовать именно эти данные.
Исследовать данный вопрос можно путём группировки данных и вычислений нужных нам показателей. В нашей работе мы применили описательный метод, то есть исследование взаимосвязей с помощью построения графиков, и статистический анализ (линейная регрессия, t-тест, хи-квадрат тест).
Ниже представлен наш анаоиз данных
library(foreign)
library(dplyr)
data_2019 = read.spss("full_data_2019.sav",
to.data.frame = TRUE)
Для начала возьмём те факторы, которые могут различаться у бюджетников и небюджетников, и сформируем датасет из нужных нам данных.
Ниже приведена интерапетация колонок, которы могли быть взяты для анализа.
Для начала исследуем наличие связи, которое было упомянуто в гипотезе (количество часов работы в неделю и яляется ли работник бюджетником).
project_data = project %>% filter(!is.na(state_employee))
work_hours = project_data %>% select(state_employee, number_of_hours_working_a_week)
work_hours = filter(work_hours, number_of_hours_working_a_week != "ЗАТРУДНЯЮСЬ ОТВЕТИТЬ" & number_of_hours_working_a_week != "НЕТ ОТВЕТА")
work_hours$number_of_hours_working_a_week = as.numeric(work_hours$number_of_hours_working_a_week)
work_hours %>% group_by(state_employee) %>% summarise (mean_work_hours = mean(number_of_hours_working_a_week))
## `summarise()` ungrouping output (override with `.groups` argument)
## # A tibble: 5 x 2
## state_employee mean_work_hours
## <fct> <dbl>
## 1 Да 39.8
## 2 Нет 44.0
## 3 ЗАТРУДНЯЮСЬ ОТВЕТИТЬ 42.9
## 4 ОТКАЗ ОТ ОТВЕТА 41.8
## 5 НЕТ ОТВЕТА 43.7
work_hours %>% mean(number_of_hours_working_a_week)
## Warning in mean.default(., number_of_hours_working_a_week): argument is not
## numeric or logical: returning NA
## [1] NA
library(ggplot2)
ggplot(data = work_hours) + geom_boxplot(aes(x = state_employee, y = number_of_hours_working_a_week), fill = "lightblue")+
xlab("Бюджетники")+
ylab("Количество рабочих часов в неделю")+
labs(title = "Распределение часов работы у бюджетников\n и небюджетников")+
theme_classic()+
theme(axis.text.x = element_text(angle = 8))
ggsave("Graph_work_hours.png")
## Saving 7 x 5 in image
work_hours$bin = ifelse(work_hours$state_employee == "Да", 1,0)
На данной ящиковой диаграме видно, сколько наблюдений мы потеряем во время анализа из-за того, что опрошенные не ответили “да” или “нет” на вопрос о бюджетниках. Также можно заключить, что их данные довольно схожи с показателями, которые получены по небюджетникам. Говоря о средних значениях, их можно увидеть в таблице выше.
Нулевая гипотеза: Между тем, является ли работник бюджетником и количеством рабочих часов в неделю нет связи
work_hours_bin = work_hours %>% filter(state_employee == "Да" | state_employee == "Нет")
ggplot(data = work_hours_bin) + geom_boxplot(aes(x = state_employee, y = number_of_hours_working_a_week), fill = "lightblue")+
xlab("Бюджетники")+
ylab("Количество рабочих часов в неделю")+
labs(title = "Распределение часов работы у бюджетников\n и небюджетников")+
theme_classic()
ggsave("Graph_work_hours_clear.png")
На данном графике изображено распределение часов работы в неделю у бюджетников и небюджетников, и можно заметить, что бюджетники работают немного меньше небюджетников.
Теперь проверим выборку на нормальность, чтобы понять, какой статистический тест можно использовать для наших данных.
install.packages(pkgs=c("nortest"))
install.packages("car") #установка пакета "car"
library(car) #загрузка пакета "car" в среду R
library(nortest)
qqPlot(work_hours_bin$number_of_hours_working_a_week, xlab ="Norm quantiles", ylab = "Количество рабочих часов в неделю", main = "Проверка данных на нормальность")
## [1] 2834 4025
cvm.test(work_hours_bin$number_of_hours_working_a_week)
##
## Cramer-von Mises normality test
##
## data: work_hours_bin$number_of_hours_working_a_week
## W = 92.014, p-value = 7.37e-10
ad.test(work_hours_bin$number_of_hours_working_a_week)
##
## Anderson-Darling normality test
##
## data: work_hours_bin$number_of_hours_working_a_week
## A = 453.33, p-value < 2.2e-16
Построив график и посчитав показатели, которые проверяют, насколько данное распределене приближено к нормальному, мы удостоверились, что у нашей выборки не нормальное распределение (на графике значения сильно выходят за пределы, и значение p-value очень маленькое, что говорит о том, что мы отвергаем нулевую гипотезу, что распределение нормально). С помощью такого анализа можно сделать вывод, что, например, t-test нам не подойдёт для нахождения взаимосвязи между переменными, так как он используется только в случае нормальной выборки.
Для нашего анализа будем использовать линейную регрессию
regression_bin = lm(number_of_hours_working_a_week ~ bin, data = work_hours_bin)
summary(regression_bin)
##
## Call:
## lm(formula = number_of_hours_working_a_week ~ bin, data = work_hours_bin)
##
## Residuals:
## Min 1Q Median 3Q Max
## -43.027 -5.027 -0.767 2.973 50.233
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 44.0266 0.1849 238.06 <2e-16 ***
## bin -4.2595 0.2750 -15.49 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 11.06 on 6521 degrees of freedom
## Multiple R-squared: 0.03547, Adjusted R-squared: 0.03533
## F-statistic: 239.8 on 1 and 6521 DF, p-value: < 2.2e-16
#with(work_hours_bin, plot(bin, number_of_hours_working_a_week))
Исходя из регрессионного анализа очевидно, что нулевая гипотеза отвергается (p-value меньше 5%) и связь между такими показателями как являяется ли работник бюджетником или нет и количество рабочих часов в неделю значима. Более того, мы получили, что бюджетники работают на 4.26 часа меньше небюджетников, на это указывает показатель Estimate (в данном случае он показывает разность этих показателей, так как мы имеем дело с бинарными переменными на оси x). Касательно остальных показателей линейная регрессия показывает, что в среднем все работники имеют 44.03 рабочих часа в неделю и вероятность ошибкии для наших данных 25.12%(11.06/44.0266). Такой индекс как F-statistic показывает, есть ли связь между переменными, которые были взяты. В нашем случае значение намного больше, чем 1, что позволяет нам сделать вывод, что связь у нас есть.
Теперь исследуем различия в наличии дополнительной работы и посмотрим распределение по возрастным группам. Группы формировались следующим образом: elderly - работники, которым больше 60 лет, middle - работники возрастом от 26 до 60 лет и young - до 26 лет.
project_data = project_data %>% filter(state_employee == "Да" | state_employee == "Нет")
extwork_age = project_data %>% select(state_employee, age, work_on_extra_job)
extwork_age = extwork_age %>% filter(work_on_extra_job == "Да"| work_on_extra_job == "Нет")
extwork_age$bin = ifelse(extwork_age$state_employee == "Да", 1,0)
extwork_age$bin_exjob = ifelse(extwork_age$work_on_extra_job == "Да", 1,0)
extwork_age$no_exjob = ifelse(extwork_age$work_on_extra_job == "Да", 0,1)
#ggplot(data = extwork_age) + geom_bar(aes(x = work_on_extra_job, y = age, color = state_employee), stat = "identity")
extwork_age$age = as.numeric(extwork_age$age)
chisq.test(extwork_age$state_employee, extwork_age$work_on_extra_job)
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: extwork_age$state_employee and extwork_age$work_on_extra_job
## X-squared = 4.0009, df = 1, p-value = 0.04548
extwork_age$age_group = case_when(extwork_age$age < 26 ~ "young",
extwork_age$age > 60 ~ "elderly",
T ~ "middle")
suma = extwork_age %>% group_by(state_employee) %>% summarise(have_extra_job = sum(bin_exjob), no_extra_job = sum(no_exjob), proportion = have_extra_job/no_extra_job) %>% select(state_employee,proportion)
suma$proportion = round(suma$proportion, 3)
extwork_age = extwork_age %>% inner_join(suma)
extwork_age = extwork_age %>% filter(bin_exjob ==1)
ggplot(data = extwork_age) + geom_col(aes(x = state_employee, y = proportion), fill = "slateblue1")+
ylim(0,0.1)+
geom_label(aes(state_employee, proportion, label = proportion), vjust = -0.5)+
labs(title = "Доля бюджетников и небюджетников, имеющих\n дополнительную работу")+
xlab("Бюджетники")+
ylab("Доля работников, имеющих\n дополнительную работу")+
theme_classic()
ggsave("Graph_extra_work.png")
ggplot(data = extwork_age) + geom_bar(aes(x = state_employee, fill = age_group))+
scale_fill_discrete(name = "Возрастная группа ")+
labs(title = "Наличие дополнительной работы у бюджетников\n и небюджетников и распределение по\n возрастным группам")+
xlab("Бюджетники")+
ylab("Количество людей, имеющих\n дополнительную работу")+
theme_classic()
По результатам очевидно, что небюджетники чаще имеют дополнительную работу, на это указывает первый график, где была рассчитана доля бюджетников и небюджетников, которые имеют дополнительный заработок. У бюджетников данный показатель равен 5.3%, а у небюджетников - 6.6%. Также на втором графике можно посмотреть тот же фактор, но в абсолютных значениях и распределение по возрасту. По нему мы сделали вывод, что доля молодых людей одинакова как в бюджетном секторе, так и в небюджетном. Основным различием является то, что люди старше 60 лет в бюджетном секторе чаще имеют дополнительную заработную плату по сравнению с теми, кто из той же возрастной категории, но работают в коммерческом секторе. Более того был проведён тест хи-квадрат, который показал, что связь между двумя этими показателями значима (p-value = 0.04548, а это иеньше 5%).
Далее исследуем различия заработной платы у бюджетников и небюджетников.
salary = project_data %>% select(state_employee, salary_per_month)
salary = salary %>% filter(salary_per_month != "ОТКАЗ ОТ ОТВЕТА")
salary = salary %>% filter(salary_per_month != "ЗАТРУДНЯЮСЬ ОТВЕТИТЬ")
salary = salary %>% filter(salary_per_month != "НЕТ ОТВЕТА")
salary = salary %>% filter(salary_per_month != "1e+05")
salary = salary %>% filter(salary_per_month != "0")
salary$bin = ifelse(salary$state_employee == "Да", 1,0)
salary$salary_per_month = as.numeric(salary$salary_per_month)
ggplot(data = salary) + geom_boxplot(aes(x = state_employee, y = salary_per_month), fill = "lightgreen")+
labs(title = "Распределние заработной платы у бюджетников\n и небюджетников")+
xlab("Бюджетники")+
ylab("Заработная плата")+
theme_classic()
t.test(salary_per_month ~ state_employee, data = salary)
##
## Welch Two Sample t-test
##
## data: salary_per_month by state_employee
## t = -7.0475, df = 5854.8, p-value = 2.031e-12
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -15.766920 -8.904253
## sample estimates:
## mean in group Да mean in group Нет
## 136.9040 149.2396
На данной ящиковой диаграмме различия в заработной плате у бюджетников и небюджетников невелики. Медиана, которая выделена на графике черным отрезком, показывает середину наблюдений. Из этого следует, что небюджетники получает немного больше, чем бюджетники. Также, мы видим, что нижний квартиль у бюджетников находится на более низком уровне, чем у небюджетников, из чего можно сделать вывод, что небюджетники получают больше на уровне “болеее низких зарплат”. T-test показал, что связь между переменными присутствует, что означает отвержение нулевой гипотезе об отсутствии связи. Стоит заметить, что данный тест был использован, так как у данных нормальное распределение. Из этого мы сделали вывод, что тот факт, что государство является владельцом предприятия, в котором числится работник, влияет на его заработную плату.
Посмотрим различия между бюджетниками и небюджниками и их степень удовлетворённости жизнью.
library(kableExtra)
project_data$number_of_hours_working_a_week = as.numeric(project_data$number_of_hours_working_a_week)
sat = project_data %>% select(state_employee, level_of_life_satisfaction, desire_find_new_job, number_of_hours_working_a_week)
sat = sat %>% filter(desire_find_new_job != "ЗАТРУДНЯЮСЬ ОТВЕТИТЬ")
sat = sat %>% filter(level_of_life_satisfaction != "ЗАТРУДНЯЮСЬ ОТВЕТИТЬ" & level_of_life_satisfaction != "ОТКАЗ ОТ ОТВЕТА" & level_of_life_satisfaction != "НЕТ ОТВЕТА")
sat = sat %>% filter(desire_find_new_job != "ОТКАЗ ОТ ОТВЕТА")
sat = filter(sat, number_of_hours_working_a_week != "ЗАТРУДНЯЮСЬ ОТВЕТИТЬ" & number_of_hours_working_a_week != "НЕТ ОТВЕТА")
sat$bin = ifelse(sat$state_employee == "Да", 1,0)
sat$bin_no = ifelse(sat$state_employee == "Да", 0,1)
sat$want = ifelse(sat$desire_find_new_job == "Да", 1,0)
sat$no_want = ifelse(sat$desire_find_new_job == "Да", 0,1)
desire = sat %>% group_by(state_employee, desire_find_new_job) %>% summarise("Среднее количество рабочих часов в неделю" = round(mean(number_of_hours_working_a_week),2))
names(desire)[1] = "Статус бюджетника"
names(desire)[2] = "Хочет найти новую работу"
k = sat %>% group_by(level_of_life_satisfaction) %>% summarise(st_em = sum(bin), no_st_em = sum(bin_no), want_new_job = sum(want), not_want_job = sum(no_want), mean_work_hours = mean(number_of_hours_working_a_week))
k = k %>% mutate(perc_st = round(st_em/sum(st_em), 2), perc_no_st = round(no_st_em/sum(no_st_em),2), perc_want = round(want_new_job/sum(want_new_job), 2), perc_no_want = round(not_want_job/sum(not_want_job),2))
level_of_satis = c("Полностью удовлетворены" ,"Полностью удовлетворены", "Скорее удовлетворены", "Скорее удовлетворены", "И да, и нет", "И да, и нет", "Не очень удовлетворены", "Не очень удовлетворены", "Совсем не удовлетворены", "Совсем не удовлетворены")
percentages = c("Доля бюджетников", "Доля небюджетников", "Доля бюджетников", "Доля небюджетников", "Доля бюджетников", "Доля небюджетников", "Доля бюджетников", "Доля небюджетников", "Доля бюджетников", "Доля небюджетников")
values = c(0.09, 0.10, 0.52, 0.49, 0.24, 0.25, 0.12, 0.12, 0.03, 0.03)
satisfaction = data.frame(level_of_satis, percentages, values)
ggplot(data = satisfaction) + geom_bar(aes(x = level_of_satis, y = values, fill = percentages), position = "dodge", stat = "identity")+
theme_bw()+
theme(axis.text.x = element_text(angle = 8))+
scale_fill_discrete(name = " ", type = "viridis")+
labs(title = "Уровень удовлетворённости жизнью\n у бюджетников и небюджетников")+
ylab("Доля работников")+
xlab("Мера удовлетворённости ")
ggsave("Graph_satisfaction.png")
desire %>%
kbl(caption = "Желание найти новую работу и количество рабочих часов у бюджетников и небюджетников") %>%
kable_classic(full_width = F, html_font = "Cambria")
| Статус бюджетника | Хочет найти новую работу | Среднее количество рабочих часов в неделю |
|---|---|---|
| Да | Да | 42.33 |
| Да | Нет | 41.48 |
| Нет | Да | 46.32 |
| Нет | Нет | 46.70 |
На данном графике показано, какая доля от всех бюджетников удовлетворена/не удовлетворена жизнью. По такому же принципу изображена и доля небюджетников. Таким образом можно сравнить, в какой мере какой процент той или иной категории доволен жизнью. Согласно графику, распределение очень схоже, и различий не наблюдается. Кроме того, в приведённой выше таблице приведены значения о желании бюджетников и небюджетников сменить работу и о количестве рабочих часов. Здесь так же не видно чётких отличий, единственная разница в том, что в те, кто в бюджетном секторе и хотят сменить работу, работают чуть больше, чем те, кто в том же секторе, но не хотят поменять работу. У небюджетников ситуация полностью противоположная.
chisq.test(sat$state_employee, sat$level_of_life_satisfaction)
##
## Pearson's Chi-squared test
##
## data: sat$state_employee and sat$level_of_life_satisfaction
## X-squared = 7.8409, df = 4, p-value = 0.09758
Для статистической проверки взаимосвязи был использован хи-квадрат тест, так как в данном случае мы анализируем категориальные переменные. Тест также не показал наличие взаимосвязи в мере удовлетворённости жизнью, так как p-value = 0.098, а это больше 5%.
Далее изучим, как стаж работы влияет на количество рабочих часов в неделю и посмотрим различия по статусу.
exp = project_data %>% select(state_employee, number_of_hours_working_a_week, work_experience)
exp = exp %>% filter(!is.na(work_experience))
exp$work_experience = as.numeric(exp$work_experience)
exp$experience = case_when(exp$work_experience <= 2 ~ "Маленький стаж ",
exp$work_experience > 2 & exp$work_experience < 7~ "Средний стаж",
T ~ "Большой стаж")
#ggplot(data = exp) + geom_bar(aes(x = state_employee, fill = experience))
exper_and_hours = exp %>% group_by(state_employee, experience) %>% summarise(mean_work = mean(number_of_hours_working_a_week))
exper_and_hours$mean_work = round(exper_and_hours$mean_work, 2)
names(exper_and_hours)[1] = "Статус бюджетника"
names(exper_and_hours)[2] = "Стаж работы"
names(exper_and_hours)[3] = "Среднее количество часов работы в неделю"
ggplot(data = exp) + geom_bar(aes(x = state_employee, fill = experience))+
scale_fill_discrete(name = "Опыт работы ")+
labs(title = "Распределение стажа работы у бюджетников и небюджетников")+
xlab("Бюджетники")+
ylab("Количество работников в секторе")+
theme_classic()
exper_and_hours %>%
kbl(caption = "Стаж работы и количество рабочих часов у бюджетников и небюджетников") %>%
kable_classic(full_width = F, html_font = "Cambria")
| Статус бюджетника | Стаж работы | Среднее количество часов работы в неделю |
|---|---|---|
| Да | Большой стаж | 41.99 |
| Да | Маленький стаж | 41.71 |
| Да | Средний стаж | 40.33 |
| Нет | Большой стаж | 45.82 |
| Нет | Маленький стаж | 46.57 |
| Нет | Средний стаж | 45.55 |
chisq.test(exp$state_employee, exp$experience)
##
## Pearson's Chi-squared test
##
## data: exp$state_employee and exp$experience
## X-squared = 47.622, df = 2, p-value = 4.561e-11
Для анализа данные по стажу работы были разделены на три группы: у кого стаж работы меньше или равно 2 года, то мы считали, что у них маленький стаж, у кого от 2 до 7 - средний стаж, у остальных - большой стаж работы. Также для каждой из 6 групп, которые можно увидеть в таблице, были посчитаны средние значения часов работы в неделю. Исходя из полученных данных, работники со средним стажем работают меньше остальных, причём как бюджетники, так и небюджетники. Различии между статусами работников, которое можно заметить из таблицы, заключается в том, что небюджетники с небольшим опытом работают больше, чем бюджетники с таким же опытом. Также тест хи-квадрат показал, что между этими факторами есть связь, однако из описательных наблюдений (графика) прямой связи обнаружить не удалось, что позволило сделать вывод, что принадлежность к бюджетному сектору мало влияет на стаж работы.
Основываясь на изученной нами литературе и проведённом анализе, мы смогли сделать некоторые выводы. Во-первых, наша основная гипотеза подтвердилась. Благодаря статистическому анализу была подтверждена связь между принадлежностью к бюджетному сектору и количеством рабочих часов в неделю: мы выяснили, что бюджетники работают меньше небюджетников. Сравнив наши результаты с используемой литературой, мы получили тот же вывод. Более того, в ходе анализа мы сделали вывод, что бюджетники получают меньшую заработную плату по сравнению с теми, кто к бюджетному сектору не относится. Данный вывод так же совпал с выводом из источников.
Что касается такого фактора как наличие дополнительной работы, то наш анализ привёл к тому, что работники бюджетного сектора имеют дополнительный заработок реже работников небюджетного сектора (Конкретные значения можно увидеть в анализе). Стоит заметить, что наши результаты не совпадают с данными, полученными в научной литературе. Авторы большинства статей пришли к выводу, что бюджетники чаще имеют дополнительную работу, чем небюджетники. Более того, из распределения по возрастным группам мы сделали вывод, что работники бюджетного сектора старше 60 лет чаще имеют дополнительный заработок по сравнению с теми, кто из той же возрастной категории, но относятся к коммерческому сектору.
Также мы исследовали различия в степени удовлетворённости жизнью у бюджетников и небюджетников. Проанализировав данный нестандартный фактор, мы не нашли связи между этими показателями. Кроме этого, в работе был затронут такой фактор как желание сменить работу. Несмотря на то, что для исследования связи между принадлежностью к бюджетному сектору и данным фактором не были проведены статистические тесты, благодоря группированию данных мы сделалм вывод, что бюджетники, которые хотят сменить работу, работают больше тех, у кого такого желания не возникает. В то же время для небюджетников ситуация обратная. Иными словами в бюджетном секторе желание изменить рабочее место мотивирует больше работать, а в небюджетном - такая связь не прослеживается.
Говоря о стаже работы, мы пришли к выводу, что этот фактор мало отличается у работников бюджетного сектора и небюджетного и является второстепенным и незначительным для сравнения этих двух групп.
В итоге бюджетники работают больше небюджетников, что можно объяснить тем, что они чаще имеют дополнительный заработок.
Данный анализ может быть полезен для людей, которые выбирают между бюджетным и небюджетным секторами. С его помощью потенциальные сотрудники смогут детальнее разобраться в тонкостях и особенностях их будущей работы. Кроме того, данное исследование может также полезно для государства как источник данных по бюджетной и небюджетной сферам и распределению ресурсов в бюджетный сектор, чтобы потенциально минимизировать неравенство в данных сферах.
Однако полученные нами результаты могут быть не точны, так как большое количество работников воздерживалось от ответа на вопросы. Более того, в данной работе были рассмотрены только некоторые факторы, которые могут отличаться у бюджетников и небюджетников.