Цель нашего проекта — проанализировать процесс поиска работы на российском рынке труда и выделить основные каналы в зависимости от возраста потенциального сотрудника. Кроме того, мы хотим определить, насколько популярной является стратегия сочетания нескольких разных способов поиска работы.
Данная тема является актуальной, так как понимание механизмов и стимулов, побуждающих выбрать тот или иной канал поиска позволяет усовершенствовать работу государственной службы занятости, а также помочь частным агентствам, которые выступают посредниками при поиске работы, сделав их деятельность более эффективной и персонифицированной. Кроме того, результаты нашего исследования могут помочь снизить транзакционные издержки на рынке труда и сократить среднее количество времени, которое тратит человек на поиск работы. Основными проблемами поиска работы является неполнота информации и неопределенность ситуации на рынке труда. Данные трудности можно частично нивелировать, если комбинировать различные источники информации о работодателе. Стоит учитывать, что функционирование рынка труда невозможно без процесса поиска работы, при этом равновесие на рынке характеризуется пересечением требований работника к потенциальному месту работы и теми условиями, которые работодатель готов предоставить.
В настоящее время наше исследование особенно актуально, так как в результате принятия в 2018 году законопроекта о повышении пенсионного возраста, согласно которому возраст выхода на пенсию по старости для мужчин будет изменен с 60 до 65 лет, а для женщин с 55 до 60 лет, состав экономически активного населения на рынке труда изменится за счет увеличения доли соискателей предпенсионного и пенсионного возраста. Соответственно, необходимо выяснить, какими стратегиями поиска пользуются кандидаты старше 55 и насколько они отличаются от каналов поиска, характерных для более молодых соискателей. Возможно, некоторые каналы поиска необходимо сделать более подходящими для людей пенсионного и предпенсионного возраста.
С другой стороны, получение первого опыта работы молодежью является значимой проблемой, так как первичный выход на рынок труда сопряжен со значительными трудностями и поиск первой работы может занять долгое время. Стоит учитывать, что молодежь составляет значимую часть «работающих бедных» и «безработных». Необходимо усовершенствовать каналы поиска работы, чтобы они позволяли быстро получить опыт работы студентами и выпускниками школ.
Очевидно, что для поддержки студентов, впервые выходящих на рынок труда и соискателей предпенсионного возраста необходимо использовать разные механизмы, в зависимости от предпочитаемых ими каналов поиска. Таким образом, цель нашего проекта – это проведение эмпирического анализа и поиск корреляции между выбором канала поиска работы и возрастом соискателя на рынке рабочей силы в Российской Федерации.
Первый вопрос, которым мы задались в ходе анализа нашей темы, какие существуют каналы поиска работы, а главное, какие выделяют в литературе. В статьях “Выбор каналов поиска работы на российском рынке труда” (2004) и “Формальные и неформальные посредники на российском рынке труда” (2006), основанных на данных РМЭЗ, выделяют шесть разных каналов и описывают их характерные свойства. В более поздней работе “Эволюция технологий поиска работы на рынке труда в интернет-эпоху” (2016) Васильев, Д. С., Рощин, С. Ю., Солнцев, С. А. учитывают также появление новых видов каналов, связанное с широким распространением интернета.
В ходе изучения литературы по теме нашего исследования мы выяснили, что не существует общепринятой классификации каналов поиска работы. Например, в статье «Determinants of the Choice of Job Search Channels by the Unemployed Using a Multivariate Probit Model» (2020) Chiara Mussida и Luca Zanin выделяют следующие каналы поиска работы: реклама в газетах и журналах, сеть родственников и друзей (неформальный), публичный конкурс или прямой контакт с работодателем, интернет и агентства по трудоустройству (государственные или частные). В статье “A typology of job search sources: Exploring the changing nature of job search networks” (2018) Cameron W Piercy выделяет формальный, социальный и онлайн группы. Нам же показалось логичнее распределение по определению, представленному у З.И. Калугиной и П.Е. Лаврусевича в статье “Формальные и неформальные посредники на современном российском рынке труда” (2006). Они разделяют каналы поиска работы на формальные и неформальные, определяя, что к формальным каналам относятся государственная служба занятости, частные агентства по трудоустройству и СМИ. Для неформальных каналов характерно использование личных связей для поиска работы в виде рекомендаций или получения дополнительной информации. К неформальным каналам относится поиск работы через друзей и родственников. Кроме того, авторы выделяют прямое обращение к работодателю без привлечения посредников.
Выбор разделения на возрастные категории тоже показался нам одним из важнейших, и наиболее репрезентативным и учитывающим социально-психологические особенности людей, которые ищут работу, нам показалось распределение на группы с разницей в 10 лет, представленной в статье “Возрастные особенности мотивации трудовой деятельности работников коммерческих организаций” (2014) Прохоровой М.В.
В ходе анализа подобных нашей теме работ С.Ю. Рощина и К.В. Марковой по данным из РМЭЗ в период 1998-2001 гг, оказалось, что большинство людей прибегали к неформальным каналам поиска работы, а именно к помощи друзей и родственников. А в работе “Эволюция технологий поиска работы на рынке труда в интернет-эпоху” (2016) масштабы и динамика использования работниками каналов для поиска работы за 2006–2014 гг уже включают в себя интернет, который стал третьим по популярности, при этом методы поиска работы посредством друзей или родственников остаются наиболее востребованными. Также в этой статье исследуется распределение среди возрастных групп по способу поиска работы на 2008-2014 гг и популярность интернета среди каналов и зависимость его использования от возраста, где он оказался незначим, т.е. работники разных возрастов использовали Интернет одинаково интенсивно.
Сравним российский рынок труда с зарубежным. В статье «Determinants of the Choice of Job Search Channels by the Unemployed Using a Multivariate Probit Model» (2020) Chiara Mussida и Luca Zanin рассматривают разные каналы поиска работы в Италии. Анализ сосредоточен на безработных в возрасте от 15 до 74 лет в период 2014–2018. Авторы выделяют следующие каналы поиска работы: реклама в газетах и журналах; сеть родственников и друзей (неформальный); публичный конкурс или прямой контакт с работодателем; интернет; и агентства по трудоустройству (государственные или частные). Мы видим, что они аналогичны выделенным нами стратегиям поиска работы.
В ходе исследования было установлено, что количество каналов поиска уменьшается с возрастом, особенно для безработных, которые стремятся впервые выйти на рынок труда. Глядя на разницу между безработными с предыдущим опытом работы и без него, авторы отмечают, что для последней группы люди среднего возраста (45–54 лет), как правило, используют на один канал меньше, чем молодые. Кроме того, безработные в возрасте 55-74 года реже, чем люди моложе 34, используют каналы прямого контакта и интернет.
Вклад нашего исследования в существующую литературу заключается в том, что оно основано на актуальных данных за 2019 год, в то время как все найденные нами работы российских ученых на похожие тему оперируют информацией, полученной не позже 2014 года. Кроме того, наше исследование рассматривает корреляцию возраста и частоты использования всех каналов поиска работы, в то время как в других статьях, посвященных российскому рынку труда, авторы либо не учитывают возраст респондентов, либо фокусируются только на одной стратегии поиска (личные связи, интернет).
Отметим, что в рассмотренных нами статьях не достигнут консенсус по поводу того, каким именно образом возраст респондента влияет на вероятность использования им неформальных каналов поиска работы. Информация про корреляцию между выбором неформального канала поиска работы и возрастом соискателя достаточно противоречива. Исследование З.И. Калугиной и П.Е. Лаврусевича 2006 года показывает, что с возрастом доля респондентов, обращающихся к неформальным каналам поиска работы уменьшается. Из-за недостаточного опыта работы и уровня образования, молодым людям приходится задействовать личные связи . В то же время, в статье, описывающей ситуацию на рынке труда в Италии («Determinants of the Choice of Job Search Channels by the Unemployed Using a Multivariate Probit Model”), указано, что вероятность использования неформальных каналов поиска работы не зависит от возраста респондентов. А на рынке труда Америки, в исследовании «Determinants of the Choice of Job Search Channels by the Unemployed Using a Multivariate Probit Model» (2020) Chiara Mussida и Luca Zanin, пожилые люди, ищущие работу, более склонны к обращению к формальным источникам.
Поэтому мы хотим проверить, существует ли корреляция между возрастом респондентов и вероятностью того, что они обратятся к неформальным ресурсам, на российских данных. Наша гипотеза заключается в том, что существует корреляция между выбором каналов для поиска работы и возрастом соискателя. Мы считаем, что чем старше человек, тем с меньшей вероятностью он будет использовать формальные каналы поиска работы.
Список литературы:
Васильев, Д. С., Рощин, С. Ю., Солнцев, С. А (2016) Эволюция технологий поиска работы на рынке труда в интернет-эпоху
Рощин С., Солнцев С., Васильев Д. (2017) Технологии рекрутинга и поиска работы в эпоху интернета
Прохорова М. В.(2014) Возрастные особенности мотивации трудовой деятельности работников коммерческих организаций
С.Ю. Рощин К.В. Маркова (2004) Выбор каналов поиска работы на российском рынке труда
З.И. Калугина, П.Е. Лаврусевич (2006) Формальные и неформальные посредники на российском рынке труда
Chiara Mussida и Luca Zanin (2020) Determinants of the Choice of Job Search Channels by the Unemployed Using a Multivariate Probit Model
Cameron W Piercy , Sun Kyong Lee (2018) A typology of job search sources: Exploring the changing nature of job search networks
В работе использованы данные из «Российского мониторинга экономического положения и здоровья населения НИУ-ВШЭ (RLMS-HSE)», проводимого Национальным исследовательским университетом “Высшая школа экономики” и ООО «Демоскоп» при участии Центра народонаселения Университета Северной Каролины в Чапел Хилле и Института социологии Федерального научно-исследовательского социологического центра РАН.
Всего было 12 228 наблюдений в репрезентативной выборке, из которых, по выбранным нами критериям, осталось всего 374. В опроснике мы выбирали анкеты людей, ответивших положительно на вопросы “Хотели бы Вы найти (другую) работу?” (XJ81) и “Вы обращались куда-нибудь или к кому-нибудь в поисках работы в течение последних 30 дней?” (XJ82), чтобы не учитывать неверно заполненные анкеты. Таким образом, данные, являющиеся ответами на вопросы XJ83, нам подходят, так как отражают каналы, которыми пользуются люди, для поиска работы. Конечно, для ответа на вопрос исследования мы взяли столбец отражающий возраст респондентов.
Вопрос про использование каналов поиска работы позволял выбрать несколько вариантов ответа. Из-за этого не удалось вычислить критерий хи-квадрат для частотной таблицы возрастных групп и выбранных ими каналов поиска работы: в сумме частоты составляли более 100% опрошенных. Были посчитаны хи-квадраты для отдельных каналов поиска, по возрастным группам и делению на тех, кто отметил этот канал или не отметил.
Главным недостатком деления источников на формальные и неформальные является то, что некоторые нельзя отнести строго к одному типу. Даже в разных литературных источниках можно найти определение одного и того же канала как к формальному, так и к неформальному.
Ссылки:
Российский мониторинг экономического положения и здоровья населения НИУ ВШЭ
В нашем проекте мы использовали следующие методы исследования:
Изучение и анализ литературы
Предобработка данных для исследования
Сравнительный анализ использования каналов разными возрастными группами
Визуализация данных
Использование статистических тестов (тест Хи-квадрат Пирсона и коэффициент сопряженности) для выявления взаимосвязи между переменными.
Статистический тест Хи-квадрат Пирсона
\(H_0:\) Переменные в строчках и столбцах независимы
\(H_1:\) Переменные в строчках и столбцах зависимы
\(n = \sum_{i,j}v_{i,j}\)
\(\delta = n \cdot \left(\sum_{i,j} \frac {v_{i,j}^2}{v_i \cdot v_j}-1\right)\)
\(z_{\text{кр.}}=\chi^2_{(r-1)\cdot(s-1);(1-p)}\) - определяется через статистические таблицы.
\(\delta \gtreqless z_{\text{кр.}}\)
Коэффициент сопряжённости
\(\chi^2 = n \cdot \left(\sum_{i,j} \frac {v_{i,j}^2}{v_i \cdot v_j}-1\right)\)
\(C = \sqrt{\frac{\chi^2}{\chi^2+n}}\)
\(C_{\text{max}} = \sqrt{\frac{\text{min}(k,l)-1}{\text{min}(k,l)}}\)
\(C_P = \frac{C}{C_{\text{max}}}\)
Первым делом мы решили рассмотреть, какие возрастные группы чаще выбирают тот или иной канал поиска работы.
#Подключим библиотеки и прочитаем исходный датасет, выделим нужные нам параметры
library(readr)
library(dplyr)
library(rpart)
library(rpart.plot)
library(lubridate)
library(stringr)
library(ggplot2)
library(coin)
library(formattable)
library(moments)
library(readxl)
library(foreign)
library(haven)
data <- read_dta("/Users/nikolajdolgih/Desktop/Прикладная статистика/РМЭЗ.dta") %>% filter(origsm==1)
cleardata = data %>% select(age, j81, j82, j83_1, j83_2, j83_3, j83_4, j83_5, j83_6, j83_7, j83_8)#Отберем подходящих для нас индивидов и разделим их на группы
cleardata$age = as.numeric(cleardata$age)
cleardata$j81 = as.numeric(cleardata$j81)
cleardata$j82 = as.numeric(cleardata$j82)
cleardata$j83_1 = as.numeric(cleardata$j83_1)
cleardata$j83_2 = as.numeric(cleardata$j83_2)
cleardata$j83_3 = as.numeric(cleardata$j83_3)
cleardata$j83_4 = as.numeric(cleardata$j83_4)
cleardata$j83_5 = as.numeric(cleardata$j83_5)
cleardata$j83_6 = as.numeric(cleardata$j83_6)
cleardata$j83_7 = as.numeric(cleardata$j83_7)
cleardata$j83_8 = as.numeric(cleardata$j83_8)
cleardata = cleardata %>% filter(j81==1 & j82==1)
cleardata = cleardata %>% select(-j81, -j82)
cleardata = cleardata %>% filter(age>=16)
cleardata$group[cleardata$age>=16 & cleardata$age<=20] <- "16-20"
cleardata$group[cleardata$age>=21 & cleardata$age<=30] <- "21-30"
cleardata$group[cleardata$age>=31 & cleardata$age<=40] <- "31-40"
cleardata$group[cleardata$age>=41 & cleardata$age<=50] <- "41-50"
cleardata$group[cleardata$age>=51 & cleardata$age<=60] <- "51-60"
cleardata$group[cleardata$age>=61] <- "61 и старше"
n16_20 = nrow(cleardata %>% filter(group == "16-20"))
n21_30 = nrow(cleardata %>% filter(group == "21-30"))
n31_40 = nrow(cleardata %>% filter(group == "31-40"))
n41_50 = nrow(cleardata %>% filter(group == "41-50"))
n51_60 = nrow(cleardata %>% filter(group == "51-60"))
n61 = nrow(cleardata %>% filter(group == "61 и старше"))
cleardata = cleardata %>% select(-age)#Запишем количества индивидов выбравших каждый канал в каждой группе
group83_1 = cleardata %>% filter(j83_1==1) %>% group_by(group) %>% summarise(n())
colnames(group83_1) = c("group","government")
group83_2 = cleardata %>% filter(j83_2==1) %>% group_by(group) %>% summarise(n())
colnames(group83_2) = c("group","notgovernment")
group83_3 = cleardata %>% filter(j83_3==1) %>% group_by(group) %>% summarise(n())
colnames(group83_3) = c("group","friends")
group83_4 = cleardata %>% filter(j83_4==1) %>% group_by(group) %>% summarise(n())
colnames(group83_4) = c("group","relatives")
group83_5 = cleardata %>% filter(j83_5==1) %>% group_by(group) %>% summarise(n())
colnames(group83_5) = c("group","toemployer")
group83_6 = cleardata %>% filter(j83_6==1) %>% group_by(group) %>% summarise(n())
colnames(group83_6) = c("group","advertising")
group83_7 = cleardata %>% filter(j83_7==1) %>% group_by(group) %>% summarise(n())
colnames(group83_7) = c("group","internet")
group83_8 = cleardata %>% filter(j83_8==1) %>% group_by(group) %>% summarise(n())
colnames(group83_8) = c("group","socialnetworks")
g1 = inner_join(group83_1, group83_2, by="group")
g2 = inner_join(g1, group83_3, by="group")
g3 = inner_join(g2, group83_4, by="group")
g4 = inner_join(g3, group83_5, by="group")
g5 = inner_join(g4, group83_6, by="group")
g6 = inner_join(g5, group83_7, by="group")
Groups = inner_join(g6, group83_8, by="group")
Groups = Groups %>% mutate(sum = c(n16_20, n21_30, n31_40, n41_50, n51_60, n61))
Groups$government = Groups$government/Groups$sum
Groups$notgovernment = Groups$notgovernment/Groups$sum
Groups$friends = Groups$friends/Groups$sum
Groups$relatives = Groups$relatives/Groups$sum
Groups$toemployer = Groups$toemployer/Groups$sum
Groups$advertising = Groups$advertising/Groups$sum
Groups$internet = Groups$internet/Groups$sum
Groups$socialnetworks = Groups$socialnetworks/Groups$sum
Groups = Groups %>% select(-sum)#Создадим пользовательскую функцию для коэффициента сопряжённости
Cor_nominal = function(arg){
NObs = sum(arg)
NRow = nrow(arg)
NCol = ncol(arg)
Chi_2 = 0
for(i in 1:NRow)
{
for(j in 1:NCol)
{
Chi_2 = Chi_2 + (arg[[i,j]]^2) / (sum(arg[i,]) * sum(arg[,j]))
}
}
Chi_2 = NObs * (Chi_2 - 1)
C = sqrt(Chi_2 / (Chi_2 + NObs))
min_KL = min(NRow, NCol)
C_max = sqrt((min_KL-1) / min_KL)
C_P = C / C_max
return(C_P)
}
Groups_test = inner_join(g6, group83_8, by="group")
Groups_test = Groups_test %>% mutate(sum = c(n16_20, n21_30, n31_40, n41_50, n51_60, n61))#Построим распределение долей людей, выбравших тот или иной канал
ggplot(data = Groups %>% select(group, advertising)) +
geom_bar(aes(x = group, y = advertising), stat = "identity", fill = "#CBE2EE", color = "#CBE2EE", alpha = 0.9) +
xlim(group83_1$group) +
ylim(0,1)+
ggtitle("Доли людей, использующих рекламные объявления \n в разных возрастных группах") +
xlab('Возраст') +
ylab('Доля')+
theme_minimal() #Вывод p-value статистического теста Хи-квадрат Пирсона
Groups_test.advertising = data.frame(yes = Groups_test$advertising, no=(Groups_test$sum-Groups_test$advertising))
rownames(Groups_test.advertising) = Groups_test$group
ch_Groups_test.advertising = chisq.test(Groups_test.advertising)
cat("Вероятность допустить ошибку первого рода:", ch_Groups_test.advertising$p.value)## Вероятность допустить ошибку первого рода: 0.3320457
#Вывод коэффициента сопряжённости
cat("Коэффициент сопряжённости Пирсона:", Cor_nominal(Groups_test.advertising))## Коэффициент сопряжённости Пирсона: 0.1739144
Описание: Группы 16-20 лет и 41-50 лет одинаково часто пользуются рекламными объявлениями, как каналом поиска работы. В каждой из данных групп около 50% опрошенных, которые выбрали этот канал, в то время как в остальных группах всего 30-40% пользуются рекламными объявлениями. Правда, вероятность допустить ошибку первого рода 0,33, что является высоким показателем случайности данных результатов. А коэффициент сопряженности Пирсона 0,17 показывает, что зависимость между возрастной группой и выбором данного канала поиска работы довольно низкая.
## Вероятность допустить ошибку первого рода: 0.1152421
## Коэффициент сопряжённости Пирсона: 0.2150045
Описание: Мы можем увидеть, что поиск работы через друзей также наиболее популярен среди людей старше 61 года. Практически 100% опрошенных из данной возрастной группы ищут работу таким способом, и этот показатель на 20-25% превосходит результат в остальных группах. Вот только найденное значение p-value равняется 0,11, так что мы не можем гарантированно утверждать, что данные результаты не случайны. Коэффициент Пирсона практически 0,22, а это значит, что взаимосвязь между возрастной группой и выбором друзей в качестве канала поиска работы присутствует.
## Вероятность допустить ошибку первого рода: 0.01266952
## Коэффициент сопряжённости Пирсона: 0.273314
Описание: По графику можно заметить, что в государственные службы занятости чаще всего обращаются люди возраста 51-60 лет. Практически 30% данной группы ищут работу с помощью этого канала. Также в группах 31-40 лет и 41-50 лет около 25% людей ищут работу через государственные службы занятости. В остальных группах доля людей, выбравших этот канал поиска работы, намного ниже. Вероятность допустить ошибку первого рода для данной выборки равна 0,01, что указывает на неслучайность полученных результатов. В то же время коэффициент Пирсона 0,27 показывает наличие слабой зависимости между возрастной группой и выбором данного канала поиска работы.
## Вероятность допустить ошибку первого рода: 3.924708e-06
## Коэффициент сопряжённости Пирсона: 0.4021786
Описание: Данный график четко показывает зависимость между использованием интернета, как канала поиска работы, и возрастом человека: чем старше группа опрошенных, тем меньшая доля людей пользуется интернетом. Так в группе 16-20 лет практически 90% ищут работу через интернет, а в группе 61 и старше только около 30%. Вероятность допустить ошибку первого рода стремиться к нулю, поэтому можно смело утверждать, что полученная зависимость не является случайной. Даже коэффициент Пирсона для данной выборки равен 0,4, что намного выше, чем для предыдущих каналов, рассмотренных в нашей работе.
## Вероятность допустить ошибку первого рода: 0.4216156
## Коэффициент сопряжённости Пирсона: 0.1616837
Описание: Обращение в негосударственные службы занятости наименее популярно среди возрастных групп. Чаще всего по этому каналу ищут работу люди возраста 21-30 (примерно 15%) и 61 и старше (около 25%). Вот только значение p-value достаточно высокое, поэтому данные результаты с большой вероятностью являются случайными. Зависимость между возрастом опрошенных и выбором негосударственной службы занятости достаточно низкая, потому что коэффициент сопряженности равен 0,16.
## Вероятность допустить ошибку первого рода: 0.3786006
## Коэффициент сопряжённости Пирсона: 0.1674121
Описание: Канал поиска работы через родственников пользуется примерно одинаковой популярностью среди опрошенных в группах 16-20 лет, 21-30 лет, 41-50 лет и 51-60 лет. Количество людей, выбирающих именно этот канал, варьируется от 50% до 55% от общего числа в каждой возрастной группе. И все же, чаще всего через родственников обращаются люди возраста 16-20 лет. Вероятность допустить ошибку первого рода, равная 0,37 указывает на случайность полученных результатов, а взаимосвязь между возрастом и выбором данного канала поиска работы находится на уровне 0,16.
## Вероятность допустить ошибку первого рода: 2.69274e-06
## Коэффициент сопряжённости Пирсона: 0.406767
Описание: На примере поиска работы через социальные сети можно заметить, что более молодые люди чаще ищут работу таким способом. Около 50% опрошенных в группе 16-20 лет выбрали социальные сети, как канал поиска работы. В группах 51-60 лет и 61 и старше доля людей, которые ищут работу через данный канал, близка к 5-10%. Значение p-value, близкое к нулю, показывает неслучайность данных результатов, а коэффициент сопряженности Пирсона равен 0,4, что показывает высокую взаимосвязь между возрастной группой и выбором данного канала.
## Вероятность допустить ошибку первого рода: 0.1577703
## Коэффициент сопряжённости Пирсона: 0.2043103
Описание: Как мы можем видеть из графика, напрямую к работодателю чаще всего обращаются люди возраста 41-50 лет и 61 год и старше. Более 50% опрошенных этой возрастной группы выбрали данный канал, как способ поиска работы. В остальных группах доля людей, обратившихся напрямую к работодателю, равна 50% или ниже. Данный результат является случайным с вероятностью 0,15, а зависимость между данными равна 0,2.
Вывод: Рассмотрев каждый канал по отдельности, мы заметили, что в явном виде зависимость прослеживается только для поиска работы через интернет и социальные сети. Для данных каналов можно заметить, что чаще всего ими пользуются молодые люди, а с увеличением возраста уменьшается доля людей, обращающихся к интернету и социальным сетям для поиска работы. Для остальных каналов зависимость представлена в неявном виде, а для некоторых каналов поиска работы (рекламные объявления, негосударственные службы занятости и поиск работы через родственников) вероятность допустить ошибку первого рода достаточно высока, что означает случайность полученных результатов. Исходя из этого, мы решили разделить стратегии поиска работы на три укрупненные группы: обращение в формальные каналы поиска работы, в неформальные и поиск работы без посредника.
К формальным каналам мы отнесли такие стратегии поиска работы, как обращение в государственную и негосударственную службы занятости, поиск через обычную рекламу и интернет-рекламу. К неформальным каналам относятся следующие: поиск работы через друзей и через родственников. Также человек мог найти работу без посредника: через социальные сети или обратиться прямо к работодателю.
#Выделим людей использовавших фаормальные/неформальные/каналы без посредника, и вставим получившиеся данные в новый датасет
severaldata = cleardata
severaldata$j83_1[severaldata$j83_1 != 1] <- 0
severaldata$j83_2[severaldata$j83_2 != 1] <- 0
severaldata$j83_3[severaldata$j83_3 != 1] <- 0
severaldata$j83_4[severaldata$j83_4 != 1] <- 0
severaldata$j83_5[severaldata$j83_5 != 1] <- 0
severaldata$j83_6[severaldata$j83_6 != 1] <- 0
severaldata$j83_7[severaldata$j83_7 != 1] <- 0
severaldata$j83_8[severaldata$j83_8 != 1] <- 0
severaldata = severaldata %>% mutate(count = j83_1+j83_2+j83_3+j83_4+j83_5+j83_6+j83_7+j83_8)
severaldata$number = c(rep("0",nrow(severaldata)))
NRow = nrow(severaldata)
NCol = ncol(severaldata)
for(i in 1:NRow)
{
for(j in 1:(NCol-2))
{
if (severaldata[[i,j]]==1){
severaldata[[i,NCol]]=paste0(severaldata[[i,NCol]], as.character(j))
}
}
}
severaldata$number = severaldata$number %>% str_replace("0","")
notformal = function(arg){
severaldata = severaldata %>% filter(group==arg)
severaldata = severaldata %>% filter(str_detect(severaldata$number, "3")|str_detect(severaldata$number, "4"))
v = nrow(severaldata)
return(v)
}
formal = function(arg){
severaldata = severaldata %>% filter(group==arg)
severaldata = severaldata %>% filter(str_detect(severaldata$number, "1")|str_detect(severaldata$number, "2")|str_detect(severaldata$number, "6")|str_detect(severaldata$number, "7"))
v = nrow(severaldata)
return(v)
}
without = function(arg){
severaldata = severaldata %>% filter(group==arg)
severaldata = severaldata %>% filter(str_detect(severaldata$number, "5")|str_detect(severaldata$number, "8"))
v = nrow(severaldata)
return(v)
}
a16_20nf = notformal(Groups$group[1])
a16_20f = formal(Groups$group[1])
a16_20wth = without(Groups$group[1])
e21_30nf = notformal(Groups$group[2])
e21_30f = formal(Groups$group[2])
e21_30wth = without(Groups$group[2])
e31_40nf = notformal(Groups$group[3])
e31_40f = formal(Groups$group[3])
e31_40wth = without(Groups$group[3])
e41_50nf = notformal(Groups$group[4])
e41_50f = formal(Groups$group[4])
e41_50wth = without(Groups$group[4])
e51_60nf = notformal(Groups$group[5])
e51_60f = formal(Groups$group[5])
e51_60wth = without(Groups$group[5])
e61nf = notformal(Groups$group[6])
e61f = formal(Groups$group[6])
e61wth = without(Groups$group[6])
Groups_3 = data.frame(group = Groups$group, formal = c(a16_20f, e21_30f, e31_40f, e41_50f, e51_60f, e61f), notformal = c(a16_20nf, e21_30nf, e31_40nf, e41_50nf, e51_60nf, e61nf), without = c(a16_20wth, e21_30wth, e31_40wth, e41_50wth, e51_60wth, e61wth), sum = c(n16_20, n21_30, n31_40, n41_50, n51_60, n61))
Groups_3$formal = Groups_3$formal/Groups_3$sum
Groups_3$notformal = Groups_3$notformal/Groups_3$sum
Groups_3$without = Groups_3$without/Groups_3$sum
Groups_3 = Groups_3 %>% select(-sum)
Groups_3_test = data.frame(group = Groups$group, formal = c(a16_20f, e21_30f, e31_40f, e41_50f, e51_60f, e61f), notformal = c(a16_20nf, e21_30nf, e31_40nf, e41_50nf, e51_60nf, e61nf), without = c(a16_20wth, e21_30wth, e31_40wth, e41_50wth, e51_60wth, e61wth), sum = c(n16_20, n21_30, n31_40, n41_50, n51_60, n61))## Вероятность допустить ошибку первого рода: 0.005003997
## Коэффициент сопряжённости Пирсона: 0.292782
Описание: Мы видим, что все представители группы 16-20 лет в выборке пользуется формальными каналами поиска работы, а наименее распространен этот канал среди представителей группы 61 и старше (меньше 60 процентов). В целом очевидно, что чем старше соискатели, тем меньше они пользуются формальными каналами. Мы видим, что, вероятность допустить ошибку первого рода составляет только 0,5%, что является низким показателем случайности данных результатов. В то же время коэффициент сопряженности Пирсона 0,29 показывает, что зависимость между возрастной группой и выбором данного канала поиска работы не очень высокая.
## Вероятность допустить ошибку первого рода: 0.05249888
## Коэффициент сопряжённости Пирсона: 0.2384553
Описание: Получается, что все опрошенные в группе 61 год и старше, представленные в выборке, пользуется неформальными каналами поиска работы, а наименее распространен этот канал среди соискателей в возрасте 31-40 (чуть меньше 75 процентов). В остальных группах доля опрошенных, ищущих работу с помощью неформальных каналов, практически одинакова и колеблется между 75 и 85 процентами. Мы видим, что вероятность допустить ошибку первого рода составляет чуть больше 5%, что показывает небольшую случайность в выборке. Мы предполагаем, что это случайность приходится на группу 31-40, то есть, что около 75 процентов представителей этой группы ищут работу с помощью неформальных каналов. Таким образом, мы предполагаем, что существует восходящий тренд. В то же время коэффициент сопряженности Пирсона 0,238 показывает, что зависимость между возрастной группой и выбором данного канала поиска работы не очень высокая.
## Вероятность допустить ошибку первого рода: 0.01074428
## Коэффициент сопряжённости Пирсона: 0.2769234
Описание: Группы 41-50 лет и 61 и старше одинаково часто отказываются от помощи посредников в поисках работы. В группе 51-60 лет меньше 50 процентов респондентов ищут работу самостоятельно. В остальных группах между 60 и 70% представителей ищут работу без посредников. Вероятность допустить ошибку первого рода составляет 1%, что является низким показателем случайности данных результатов. А коэффициент сопряженности Пирсона 0,27 показывает, что зависимость между возрастной группой и выбором данного канала поиска работы довольно высокая.
Вывод: Таким образом, в укрупненных группах полученные результаты с большой вероятностью не являются случайными, если не считать небольшого выброса на графике поиска работы через неформальные каналы. Данные результаты подтверждают нашу гипотезу о том, что с возрастом люди реже используют формальные каналы поиска работы. Скорее всего, они начинают чаще обращаться к неформальным каналам, но мы не можем быть уверены в этом за счет неточности полученных результатов. Также мы можем заметить наличие зависимости выбора стратегии поиска работы без посредника от возраста, но в данной группе не прослеживается четкого восходящего или нисходящего тренда.
Кроме того, каждый человек мог выбрать не один канал поиска работы. Мы решили рассмотреть, насколько популярной является такая стратегия поиска работы (через несколько каналов сразу) в различных возрастных группах.
#Посмотрим сколько каналов выбрал каждый индивид и если выбрал больше одного запишем в таблицу
comoncanaldata = cleardata
comoncanaldata$j83_1[comoncanaldata$j83_1 != 1] <- 0
comoncanaldata$j83_2[comoncanaldata$j83_2 != 1] <- 0
comoncanaldata$j83_3[comoncanaldata$j83_3 != 1] <- 0
comoncanaldata$j83_4[comoncanaldata$j83_4 != 1] <- 0
comoncanaldata$j83_5[comoncanaldata$j83_5 != 1] <- 0
comoncanaldata$j83_6[comoncanaldata$j83_6 != 1] <- 0
comoncanaldata$j83_7[comoncanaldata$j83_7 != 1] <- 0
comoncanaldata$j83_8[comoncanaldata$j83_8 != 1] <- 0
comoncanaldata = comoncanaldata %>% mutate(number = j83_1+j83_2+j83_3+j83_4+j83_5+j83_6+j83_7+j83_8)
comoncanaldata_1 = comoncanaldata %>% filter(number > 1)
comoncanaldata_2 = comoncanaldata %>% filter(number == 1)
share_1 = comoncanaldata_1 %>% group_by(group) %>% summarise(use = n())
share_2 = comoncanaldata_2 %>% group_by(group) %>% summarise(notuse = n())
share_3 = full_join(share_1, share_2, by = "group")
share_3$notuse[is.na(share_3$notuse)] <- 0
share_3 = share_3 %>% mutate(sum = c(n16_20, n21_30, n31_40, n41_50, n51_60, n61))
share_3$use = share_3$use/share_3$sum
share_3$notuse = share_3$notuse/share_3$sum
share_3 = share_3 %>% select(-sum, -notuse)
share_3_test = full_join(share_1, share_2, by = "group") %>% mutate(sum = c(n16_20, n21_30, n31_40, n41_50, n51_60, n61))
share_3_test$notuse[is.na(share_3_test$notuse)]=0
share_3_test = share_3_test %>% select(-sum)
rownames(share_3_test) = share_3_test$group
share_3_test = share_3_test %>% select(-group)## Вероятность допустить ошибку первого рода: 0.0716096
## Коэффициент сопряжённости Пирсона: 0.2296676
Описание: Мы видим, что все опрошенные в группе 61 год и старше, представленные в выборке, привлекают несколько каналов поиска работы, а соискатели в возрасте 31-40 (чуть меньше 75 процентов) чаще всех ограничиваются одним каналом. В остальных группах доля опрошенных, ищущих работу с помощью нескольких каналов, практически одинакова и колеблется между 75 и 85 процентами. Получается, что вероятность допустить ошибку первого рода составляет только 7%, что является достаточно низким показателем случайности данных результатов. В то же время коэффициент сопряженности Пирсона 0,23 показывает, что зависимость между возрастной группой и выбором нескольких каналов поиска работы не очень высокая.
Глобальный вывод исследования: Перед нами стояла задача: проверить, каким образом возраст респондента влияет на выбор канала поиска работы. Проведя все исследования, мы можем заметить явное наличие обратной зависимости между возрастом человека и вероятностью того, что он будет искать работу через формальные каналы. Также, в неявном виде присутствует корреляция между возрастом опрошенных и выбором неформального канала поиска работы. Из-за того, что большинство респондентов реализуют стратегию поиска работы через несколько каналов, доли людей, выбравших тот или иной вариант достаточно высоки. Можно предположить, что отсутствие явного тренда при поиске работы без посредника обусловлено тем, что данный способ часто является второстепенным для респондентов. Среди формальных каналов поиска работы стоит выделить обращение к интернет рекламе, для которой существует явная зависимость: чем старше группа опрошенных, тем меньшая доля выбирает данный канал. Похожую зависимость мы можем наблюдать при поиске работы через социальные сети, что относится к поиску работы без посредника. Таким образом, мы можем наблюдать явную корреляцию между возрастом и стратегией поиска работы как для отдельных каналов, так и для укрупненных групп.