Аннотация

В последнее время во многих странах, в том числе и в России, наблюдается заметное расслоение по уровню заработных плат у работников. Довольно значимая разница в доходах наблюдается по отраслям работы. В данной статье мы производим анализ российского рынка труда для выявления среднего уровня заработных плат по индивидам в различных отраслях, а также для выявления факторов, оказывающих влияние на представленные тенденции.

Объект и Методы Исследования

Тип работы: исследование

Цель работы: с помощью статистических данных и приложенных научных статей выяснить, работники какой отрасли имеют самые высокие заработные платы на российском рынке труда и рассмотреть возможные интерпретации полученных результатов

Объект исследования: российский рынок труда, конкретно, данные по заработной плате работников

Методы исследования: анализ и синтез данных по заработным платам и отраслям, построение ящичковых диаграмм (графический метод), рассмотрение теоретических положений о возможных факторах, влияющих на заработную плату

Инструменты анализа: база данных РМЭЗ НИУ ВШЭ, язык программирования R

Конечный продукт: страница на сайте RPubs с выводами исследования

Введение

С начала становления рыночных отношений в 1990-е годы российский рынок труда стал приобретать всё более диверсифицированную форму как по отраслям деятельности (прежде всего, торговля розничная), так и по вознаграждению за труд, которые получают работники в той или иной сфере занятости. Заработная плата стала средством удовлетворения потребительских запросов работника и его семьи, поэтому главной мотивацией стало личное благополучие, в отличие от командно-административной модели, где в ранг было возведена максимальная отдача работника во благо страны с минимальными затратами. В нынешнее время появились новые (рыночные) факторы различия в заработной плате того или иного работника. Можно выделить три из них: уровень образования, квалификация (ранг), специализация. Кроме того, внутренняя культура работника (стремление добиться успеха, опытность) непосредственно влияет на оплату труда, так как влияет на конечный результат его труда (качество и количество проделанной работы). В этом плане, в нашем исследовании стоит делать акцент на работниках частных предприятий, так как они явным образом подчиняются модели спроса и предложения как на рынке труда, так и на потребительских рынках, в отличие от трудящихся на государственных предприятий, где стимулы к труду занижены в силу предопределенности карьерного роста работника, а конечный результат непосредственно связан с конкретным государственный заказом и даже, скорее, с волей заказчика, у которого нерыночная мотивационная культура.

Анализ Заработных Плат

В данной работе мы использовали базу данных РМЭЗ НИУ ВШЭ. Нами были выбраны данные по индивидам, так как целью является сравнение заработных плат отдельных работников по отраслям, а не сравнение целых домохозяйств.

{
  library(devtools)
  library(rlms)
  library(dplyr)
  library(tidyr)
  library(ggplot2)
}

setwd("C:/Users/79211/Desktop/Project")
all_data <- rlms_read("r28i_os_32.sav")

#colnames(all_data)

Методология и ход исследования

1 - Отобрали всех работающих респондентов, у которых есть основная работа 2 - Нашли их почасовую ставку заработной платы (мес.) 3 - Построили медианы для каждой из сфер и проранжировали их 4 - Проверили на статистическую значимость отличия средних по отраслям с общей средней 5 - Выявили, что заработная плата мужчин выше, чем заработная плата женщин 6 - Выявили, что заработная плата работников с качественным образованием выше, чем у работников с некачественным

Ключевой показатель: медианное значение заработной платы

# выбираем переменные интереса
data <- all_data %>% select(id_ind = idind, working = xj77, 
  job_1 = xj4.1, wage_1 = xj13.2, hours_1 = xj6.2,
  working_2 = xj32, job_2 = xj35.1, wage_2 = xj40, hours_2 = xj36.1a,
  edu = x_educ, diplom = x_diplom, exp = xj5a, age = x_age, sex = xh5 )
#summary(data)
# убираем неработающих (это тестовый прогон)
data1 <- data %>% subset(working == 1)
#summary(data1) # по working нет NA

data2 <- data %>% subset(working == 1 | is.na(working) == TRUE)
#summary(data2) # по working есть NA
# проверим значения з/п у тех, у кого working == NA
View(subset(data2, is.na(working) == TRUE))
#summary(subset(data2, is.na(working) == TRUE)) # тут все NA => можем удалить data2

rm(data1, data2) # удаляем data1, data2

# убираем неработающих (это нормальный прогон)
data <- data %>%
  subset(working == 1) %>%
  drop_na(job_1, wage_1) # убираем пропуски по job_1, wage_1
#summary(data)
#summary(as.factor(data$job_1)) # пока заметим, что, начиная с 18-ой профессии, наблюдений мало

# создаем почасовую ставку
# data$wage_rate_1 <- data$wage_1 / data$hours_1 # первый вариант создания новой переменной
data <- data %>% # второй вариант создания новой переменной
  mutate(wage_rate_1 = wage_1 / hours_1/4) %>%
  subset(wage_1 != 0) # убираем тех, у кого ставка в месяц равна 0 (это ошибочне наблюдения)
#summary(data)

# убираем выбросы сверху
#nrow(subset(data, wage_rate_1 >= 2500)) # количество наблюдений, где з/п в час выше 2500
data <- data %>% subset(wage_rate_1 <= 2500)
#summary(data)

# возможные преобразования:
# 1) оставим тех, кого только основная (первая) работа
data_1 <- data %>% subset(working_2 == 2)
#summary(data_1)
#summary(as.factor(data_1$job_1))
ggplot(data = data_1, aes(x = as.factor(job_1), y = wage_1)) + geom_boxplot() +
  xlab('Индексы отраслей') + ylab('Заработная плата в месяц') + 
  ggtitle('Боксплот по месячной ставке заработной платы')# боксплот по месячной ставке з/п

ggplot(data = data_1, aes(x = as.factor(job_1), y = wage_rate_1)) + geom_boxplot() + xlab('Индексы отраслей') +
  ylab('Заработная плата в час') + 
  ggtitle('Боксплот по часовой ставке заработной платы')

#summary(subset(data_1, job_1 == 1))
ggplot(data = subset(data_1, job_1 == 1), aes(x = wage_1)) + geom_histogram() +
  xlab('Заработная плата в месяц') + ylab('Количество наблюдений') + 
  ggtitle('Частоты значений заработных плат')

Строим медианы и средние ставки з/п в час по отраслям

summary_table <- data_1 %>%
  group_by(job_1) %>%
  summarise(
    median = median(wage_rate_1, na.rm = TRUE),
    mean = mean(wage_rate_1, na.rm = TRUE)) #%>% arrange(desc(median))

Добавим расшифровки к переменной job_1

job_label <- stack(attr(summary_table$job_1, "labels")) # расшифровки
summary_table <- merge(summary_table, job_label, by.x = "job_1", by.y = "values") %>%
  arrange(desc(median)) # сортировка по медиане

Тест Стьюдента на равенство средней з/п по отрасли средней з/п по всей выборке

mean_wage_rate <- mean(data_1$wage_rate_1) # средняя ставка з/п
summary_table$p_val <- 0

Cоздадим колонку со значениями p-value

j <- 1
for (i in as.numeric(summary_table$job_1)) {
  t_stat <- t.test(data_1[which(data_1$job_1 == i),]$wage_rate_1, mu = mean_wage_rate)
  summary_table$p_val[j] <- t_stat$p.value
  j <- j + 1
}

# сделаем индикатор принятой гипотезы
summary_table$hypothesis <- 0
summary_table$hypothesis[summary_table$p_val <= 0.05] <- 1 # принята альтернативная => различия значимы


#t_stat$conf.int
summary(data_1)
##      id_ind         working      job_1           wage_1          hours_1      
##  Min.   :    3   Min.   :1   Min.   : 1.00   Min.   :   700   Min.   :  2.00  
##  1st Qu.:26468   1st Qu.:1   1st Qu.: 7.00   1st Qu.: 17000   1st Qu.: 40.00  
##  Median :39494   Median :1   Median :10.00   Median : 25000   Median : 40.00  
##  Mean   :37133   Mean   :1   Mean   :10.48   Mean   : 29191   Mean   : 43.69  
##  3rd Qu.:50502   3rd Qu.:1   3rd Qu.:14.00   3rd Qu.: 35000   3rd Qu.: 48.00  
##  Max.   :59410   Max.   :1   Max.   :31.00   Max.   :200000   Max.   :168.00  
##                                                                               
##    working_2     job_2          wage_2         hours_2           edu       
##  Min.   :2   Min.   : 1     Min.   : 4000   Min.   : 1.00   Min.   : 5.00  
##  1st Qu.:2   1st Qu.:11     1st Qu.: 4000   1st Qu.: 1.00   1st Qu.:16.00  
##  Median :2   Median :16     Median : 5000   Median : 3.00   Median :18.00  
##  Mean   :2   Mean   :16     Mean   : 6714   Mean   : 4.25   Mean   :17.75  
##  3rd Qu.:2   3rd Qu.:17     3rd Qu.: 7500   3rd Qu.: 7.25   3rd Qu.:21.00  
##  Max.   :2   Max.   :31     Max.   :15000   Max.   :10.00   Max.   :23.00  
##              NA's   :3959   NA's   :3961    NA's   :3960    NA's   :1      
##      diplom           exp            age             sex       
##  Min.   :1.000   Min.   :1965   Min.   :18.00   Min.   :1.000  
##  1st Qu.:4.000   1st Qu.:2007   1st Qu.:33.00   1st Qu.:1.000  
##  Median :5.000   Median :2013   Median :42.00   Median :2.000  
##  Mean   :4.898   Mean   :2010   Mean   :42.99   Mean   :1.539  
##  3rd Qu.:6.000   3rd Qu.:2017   3rd Qu.:53.00   3rd Qu.:2.000  
##  Max.   :6.000   Max.   :2019   Max.   :86.00   Max.   :2.000  
##  NA's   :1       NA's   :20                                    
##   wage_rate_1      
##  Min.   :   3.646  
##  1st Qu.:  98.734  
##  Median : 145.833  
##  Mean   : 172.471  
##  3rd Qu.: 208.333  
##  Max.   :1187.500  
## 
data_1$exp <- 2019 - data_1$exp #Стаж работы
summary(data_1)
##      id_ind         working      job_1           wage_1          hours_1      
##  Min.   :    3   Min.   :1   Min.   : 1.00   Min.   :   700   Min.   :  2.00  
##  1st Qu.:26468   1st Qu.:1   1st Qu.: 7.00   1st Qu.: 17000   1st Qu.: 40.00  
##  Median :39494   Median :1   Median :10.00   Median : 25000   Median : 40.00  
##  Mean   :37133   Mean   :1   Mean   :10.48   Mean   : 29191   Mean   : 43.69  
##  3rd Qu.:50502   3rd Qu.:1   3rd Qu.:14.00   3rd Qu.: 35000   3rd Qu.: 48.00  
##  Max.   :59410   Max.   :1   Max.   :31.00   Max.   :200000   Max.   :168.00  
##                                                                               
##    working_2     job_2          wage_2         hours_2           edu       
##  Min.   :2   Min.   : 1     Min.   : 4000   Min.   : 1.00   Min.   : 5.00  
##  1st Qu.:2   1st Qu.:11     1st Qu.: 4000   1st Qu.: 1.00   1st Qu.:16.00  
##  Median :2   Median :16     Median : 5000   Median : 3.00   Median :18.00  
##  Mean   :2   Mean   :16     Mean   : 6714   Mean   : 4.25   Mean   :17.75  
##  3rd Qu.:2   3rd Qu.:17     3rd Qu.: 7500   3rd Qu.: 7.25   3rd Qu.:21.00  
##  Max.   :2   Max.   :31     Max.   :15000   Max.   :10.00   Max.   :23.00  
##              NA's   :3959   NA's   :3961    NA's   :3960    NA's   :1      
##      diplom           exp              age             sex       
##  Min.   :1.000   Min.   : 0.000   Min.   :18.00   Min.   :1.000  
##  1st Qu.:4.000   1st Qu.: 2.000   1st Qu.:33.00   1st Qu.:1.000  
##  Median :5.000   Median : 6.000   Median :42.00   Median :2.000  
##  Mean   :4.898   Mean   : 8.755   Mean   :42.99   Mean   :1.539  
##  3rd Qu.:6.000   3rd Qu.:12.000   3rd Qu.:53.00   3rd Qu.:2.000  
##  Max.   :6.000   Max.   :54.000   Max.   :86.00   Max.   :2.000  
##  NA's   :1       NA's   :20                                      
##   wage_rate_1      
##  Min.   :   3.646  
##  1st Qu.:  98.734  
##  Median : 145.833  
##  Mean   : 172.471  
##  3rd Qu.: 208.333  
##  Max.   :1187.500  
## 
summary(subset(data_1, job_1 %in% c(27, 23))) #IT and Chemical sphere
##      id_ind         working      job_1           wage_1          hours_1     
##  Min.   :  776   Min.   :1   Min.   :23.00   Min.   : 15000   Min.   :20.00  
##  1st Qu.:26295   1st Qu.:1   1st Qu.:23.00   1st Qu.: 27500   1st Qu.:40.00  
##  Median :33843   Median :1   Median :27.00   Median : 37000   Median :40.00  
##  Mean   :34900   Mean   :1   Mean   :25.58   Mean   : 49710   Mean   :39.84  
##  3rd Qu.:48417   3rd Qu.:1   3rd Qu.:27.00   3rd Qu.: 58500   3rd Qu.:40.00  
##  Max.   :59156   Max.   :1   Max.   :27.00   Max.   :150000   Max.   :50.00  
##                                                                              
##    working_2     job_2         wage_2       hours_2         edu       
##  Min.   :2   Min.   : NA   Min.   : NA   Min.   : NA   Min.   : 9.00  
##  1st Qu.:2   1st Qu.: NA   1st Qu.: NA   1st Qu.: NA   1st Qu.:18.00  
##  Median :2   Median : NA   Median : NA   Median : NA   Median :21.00  
##  Mean   :2   Mean   :NaN   Mean   :NaN   Mean   :NaN   Mean   :18.77  
##  3rd Qu.:2   3rd Qu.: NA   3rd Qu.: NA   3rd Qu.: NA   3rd Qu.:21.00  
##  Max.   :2   Max.   : NA   Max.   : NA   Max.   : NA   Max.   :22.00  
##              NA's   :31    NA's   :31    NA's   :31                   
##      diplom           exp              age             sex      
##  Min.   :3.000   Min.   : 0.000   Min.   :22.00   Min.   :1.00  
##  1st Qu.:5.000   1st Qu.: 1.000   1st Qu.:29.00   1st Qu.:1.00  
##  Median :6.000   Median : 3.000   Median :34.00   Median :1.00  
##  Mean   :5.226   Mean   : 5.774   Mean   :36.48   Mean   :1.29  
##  3rd Qu.:6.000   3rd Qu.: 8.500   3rd Qu.:41.00   3rd Qu.:2.00  
##  Max.   :6.000   Max.   :42.000   Max.   :66.00   Max.   :2.00  
##                                                                 
##   wage_rate_1    
##  Min.   : 93.75  
##  1st Qu.:156.70  
##  Median :250.00  
##  Mean   :309.31  
##  3rd Qu.:365.62  
##  Max.   :937.50  
## 
summary(subset(data_1, !job_1 %in% c(27, 23))) #NOT IT and Chemical sphere
##      id_ind         working      job_1           wage_1          hours_1      
##  Min.   :    3   Min.   :1   Min.   : 1.00   Min.   :   700   Min.   :  2.00  
##  1st Qu.:26484   1st Qu.:1   1st Qu.: 7.00   1st Qu.: 17000   1st Qu.: 40.00  
##  Median :39513   Median :1   Median :10.00   Median : 25000   Median : 40.00  
##  Mean   :37150   Mean   :1   Mean   :10.36   Mean   : 29029   Mean   : 43.72  
##  3rd Qu.:50524   3rd Qu.:1   3rd Qu.:14.00   3rd Qu.: 35000   3rd Qu.: 48.00  
##  Max.   :59410   Max.   :1   Max.   :31.00   Max.   :200000   Max.   :168.00  
##                                                                               
##    working_2     job_2          wage_2         hours_2           edu       
##  Min.   :2   Min.   : 1     Min.   : 4000   Min.   : 1.00   Min.   : 5.00  
##  1st Qu.:2   1st Qu.:11     1st Qu.: 4000   1st Qu.: 1.00   1st Qu.:16.00  
##  Median :2   Median :16     Median : 5000   Median : 3.00   Median :18.00  
##  Mean   :2   Mean   :16     Mean   : 6714   Mean   : 4.25   Mean   :17.74  
##  3rd Qu.:2   3rd Qu.:17     3rd Qu.: 7500   3rd Qu.: 7.25   3rd Qu.:21.00  
##  Max.   :2   Max.   :31     Max.   :15000   Max.   :10.00   Max.   :23.00  
##              NA's   :3928   NA's   :3930    NA's   :3929    NA's   :1      
##      diplom           exp              age             sex       
##  Min.   :1.000   Min.   : 0.000   Min.   :18.00   Min.   :1.000  
##  1st Qu.:4.000   1st Qu.: 2.000   1st Qu.:33.00   1st Qu.:1.000  
##  Median :5.000   Median : 6.000   Median :42.00   Median :2.000  
##  Mean   :4.895   Mean   : 8.779   Mean   :43.04   Mean   :1.541  
##  3rd Qu.:6.000   3rd Qu.:12.000   3rd Qu.:53.00   3rd Qu.:2.000  
##  Max.   :6.000   Max.   :54.000   Max.   :86.00   Max.   :2.000  
##  NA's   :1       NA's   :20                                      
##   wage_rate_1      
##  Min.   :   3.646  
##  1st Qu.:  98.142  
##  Median : 143.750  
##  Mean   : 171.393  
##  3rd Qu.: 208.333  
##  Max.   :1187.500  
## 
summary(subset(data_1, job_1 %in% c(23))) # Chemical sphere
##      id_ind         working      job_1        wage_1         hours_1     
##  Min.   :  776   Min.   :1   Min.   :23   Min.   :21000   Min.   :28.00  
##  1st Qu.:11136   1st Qu.:1   1st Qu.:23   1st Qu.:27500   1st Qu.:38.50  
##  Median :25133   Median :1   Median :23   Median :35000   Median :40.00  
##  Mean   :23601   Mean   :1   Mean   :23   Mean   :34091   Mean   :39.27  
##  3rd Qu.:33111   3rd Qu.:1   3rd Qu.:23   3rd Qu.:40000   3rd Qu.:40.00  
##  Max.   :54146   Max.   :1   Max.   :23   Max.   :55000   Max.   :48.00  
##                                                                          
##    working_2     job_2         wage_2       hours_2         edu       
##  Min.   :2   Min.   : NA   Min.   : NA   Min.   : NA   Min.   : 9.00  
##  1st Qu.:2   1st Qu.: NA   1st Qu.: NA   1st Qu.: NA   1st Qu.:14.00  
##  Median :2   Median : NA   Median : NA   Median : NA   Median :16.00  
##  Mean   :2   Mean   :NaN   Mean   :NaN   Mean   :NaN   Mean   :15.73  
##  3rd Qu.:2   3rd Qu.: NA   3rd Qu.: NA   3rd Qu.: NA   3rd Qu.:18.00  
##  Max.   :2   Max.   : NA   Max.   : NA   Max.   : NA   Max.   :21.00  
##              NA's   :11    NA's   :11    NA's   :11                   
##      diplom           exp              age             sex       
##  Min.   :3.000   Min.   : 0.000   Min.   :22.00   Min.   :1.000  
##  1st Qu.:4.000   1st Qu.: 2.500   1st Qu.:34.50   1st Qu.:1.000  
##  Median :4.000   Median : 7.000   Median :40.00   Median :1.000  
##  Mean   :4.364   Mean   : 9.818   Mean   :42.45   Mean   :1.455  
##  3rd Qu.:5.000   3rd Qu.:11.500   3rd Qu.:54.00   3rd Qu.:2.000  
##  Max.   :6.000   Max.   :42.000   Max.   :66.00   Max.   :2.000  
##                                                                  
##   wage_rate_1   
##  Min.   :141.9  
##  1st Qu.:156.7  
##  Median :231.2  
##  Mean   :218.7  
##  3rd Qu.:250.0  
##  Max.   :312.5  
## 
summary(subset(data_1, job_1 %in% c(27))) #IT
##      id_ind         working      job_1        wage_1          hours_1     
##  Min.   :15100   Min.   :1   Min.   :27   Min.   : 15000   Min.   :20.00  
##  1st Qu.:31030   1st Qu.:1   1st Qu.:27   1st Qu.: 28750   1st Qu.:40.00  
##  Median :40763   Median :1   Median :27   Median : 47500   Median :40.00  
##  Mean   :41115   Mean   :1   Mean   :27   Mean   : 58300   Mean   :40.15  
##  3rd Qu.:52018   3rd Qu.:1   3rd Qu.:27   3rd Qu.: 70000   3rd Qu.:40.00  
##  Max.   :59156   Max.   :1   Max.   :27   Max.   :150000   Max.   :50.00  
##                                                                           
##    working_2     job_2         wage_2       hours_2         edu       
##  Min.   :2   Min.   : NA   Min.   : NA   Min.   : NA   Min.   :16.00  
##  1st Qu.:2   1st Qu.: NA   1st Qu.: NA   1st Qu.: NA   1st Qu.:20.75  
##  Median :2   Median : NA   Median : NA   Median : NA   Median :21.00  
##  Mean   :2   Mean   :NaN   Mean   :NaN   Mean   :NaN   Mean   :20.45  
##  3rd Qu.:2   3rd Qu.: NA   3rd Qu.: NA   3rd Qu.: NA   3rd Qu.:21.00  
##  Max.   :2   Max.   : NA   Max.   : NA   Max.   : NA   Max.   :22.00  
##              NA's   :20    NA's   :20    NA's   :20                   
##      diplom          exp             age            sex       wage_rate_1    
##  Min.   :4.00   Min.   : 0.00   Min.   :22.0   Min.   :1.0   Min.   : 93.75  
##  1st Qu.:5.75   1st Qu.: 1.00   1st Qu.:29.0   1st Qu.:1.0   1st Qu.:179.69  
##  Median :6.00   Median : 1.50   Median :33.0   Median :1.0   Median :265.62  
##  Mean   :5.70   Mean   : 3.55   Mean   :33.2   Mean   :1.2   Mean   :359.17  
##  3rd Qu.:6.00   3rd Qu.: 5.00   3rd Qu.:35.0   3rd Qu.:1.0   3rd Qu.:437.50  
##  Max.   :6.00   Max.   :15.00   Max.   :49.0   Max.   :2.0   Max.   :937.50  
## 

Проверка гипотезы о том, что з/п мужчин больше, чем з/п женщин

Cтроим медианы и средние ставки з/п в час по полу

summary_table_2 <- data_1 %>%
  group_by(sex) %>%
  summarise(
    median = median(wage_rate_1, na.rm = TRUE),
    mean = mean(wage_rate_1, na.rm = TRUE)) #%>% arrange(desc(median))

# добавим расшифровки к переменной job_1
sex_label <- stack(attr(summary_table_2$sex, "labels")) # расшифровки
summary_table_2 <- merge(summary_table_2, sex_label, by.x = "sex", by.y = "values") %>%
  arrange(desc(median)) # сортировка по медиане
#subset(data_1, sex==1)$wage_rate_1 #З/п мужчин

#subset(data_1, sex==2)$wage_rate_1 #з/п женщин
t.test(subset(data_1, sex==1)$wage_rate_1, subset(data_1, sex==2)$wage_rate_1)# Статиститеская значимость различий з.п мужчин и женщин
## 
##  Welch Two Sample t-test
## 
## data:  subset(data_1, sex == 1)$wage_rate_1 and subset(data_1, sex == 2)$wage_rate_1
## t = 9.0082, df = 3619.4, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  25.51703 39.71457
## sample estimates:
## mean of x mean of y 
##  190.0445  157.4287

Итоговые таблицы

summary_table_3 <- data_1 %>% 
  mutate(industry = case_when(
    job_1 %in% c(23,27) ~ "IT and Chemical ind.",
    !job_1 %in% c(23,27) ~ "Not IT and Chem."))%>%
  group_by(industry) %>%
  summarise(
    median_wage = median(wage_rate_1, na.rm = TRUE),
    mean_wage = mean(wage_rate_1, na.rm = TRUE),
    education = mean(edu, na.rm = TRUE)) #%>% arrange(desc(median))
job_1 median mean ind p_val hypothesis
27 265.62500 359.16667 IT, ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ 0.0032471 1
23 231.25000 218.66225 ХИМИЧЕСКАЯ ПРОМЫШЛЕННОСТЬ 0.0343587 1
4 187.50000 257.87175 НЕФТЕГАЗОВАЯ ПРОМЫШЛЕННОСТЬ 0.0000045 1
18 187.50000 193.57600 ОПЕРАЦИИ С НЕДВИЖИМОСТЬЮ 0.4048090 0
21 187.50000 223.28518 ЮРИСПРУДЕНЦИЯ 0.0667665 0
28 187.50000 184.37500 ЭКОЛОГИЯ, ЗАЩИТА ОКРУЖАЮЩЕЙ СРЕДЫ 0.0318018 1
31 187.50000 225.50154 РЕКЛАМА, МАРКЕТИНГ 0.3116617 0
25 183.03571 196.20573 СПОРТ, ТУРИЗМ, РАЗВЛЕЧЕНИЯ 0.2437611 0
15 182.29167 227.52322 ФИНАНСЫ 0.0027851 1
16 182.29167 202.27625 ЭНЕРГЕТИЧЕСКАЯ ПРОМЫШЛЕННОСТЬ 0.0096779 1
3 181.77083 194.47334 ВОЕННО-ПРОМЫШЛЕННЫЙ КОМПЛЕКС 0.0140916 1
6 168.75000 194.70715 СТРОИТЕЛЬСТВО 0.0027074 1
2 156.25000 179.41926 ГРАЖДАНСКОЕ МАШИНОСТРОЕНИЕ 0.4843840 0
5 156.25000 178.81213 ДРУГАЯ ОТРАСЛЬ ТЯЖЕЛОЙ ПРОМЫШЛЕННОСТИ 0.3484106 0
7 156.25000 181.81752 ТРАНСПОРТ, СВЯЗЬ 0.1291637 0
11 146.42857 177.58880 НАУКА, КУЛЬТУРА 0.6387181 0
9 143.75000 171.83873 ОРГАНЫ УПРАВЛЕНИЯ 0.9512819 0
13 138.19444 164.31966 АРМИЯ, МВД, ОРГАНЫ БЕЗОПАСНОСТИ 0.2479182 0
1 133.33333 156.36041 ЛЕГКАЯ, ПИЩЕВАЯ ПРОМЫШЛЕННОСТЬ 0.0036741 1
14 132.58929 160.48522 ТОРГОВЛЯ, БЫТОВОЕ ОБСЛУЖИВАНИЕ 0.0008400 1
26 132.50000 163.82211 УСЛУГИ НАСЕЛЕНИЮ 0.7179180 0
30 131.25000 173.99700 СМИ, ИЗДАТЕЛЬСТВО, ПЕЧАТЬ, ТЕЛЕКОММУНИКАЦИИ 0.9535676 0
12 130.20833 158.21410 ЗДРАВООХРАНЕНИЕ 0.0138526 1
10 125.00000 157.71235 ОБРАЗОВАНИЕ 0.0041808 1
17 125.00000 154.78788 ЖИЛИЩНО-КОММУНАЛЬНОЕ ХОЗЯЙСТВО 0.0266331 1
20 125.00000 147.77240 СОЦИАЛЬНОЕ ОБСЛУЖИВАНИЕ 0.1885886 0
8 104.16667 118.87755 СЕЛЬСКОЕ ХОЗЯЙСТВО 0.0000000 1
24 104.16667 109.08120 ДЕРЕВООБРАБАТЫВАЮЩАЯ ПРОМЫШЛЕННОСТЬ, ЛЕСНОЕ ХОЗЯЙСТВО 0.0004759 1
29 76.56250 76.04167 ОРГАНИЗАЦИЯ ОБЩЕСТВЕННОГО ПИТАНИЯ 0.0001271 1
22 52.08333 79.86111 ЦЕРКОВЬ 0.1076561 0
## 
## =================================================================================================
##    job_1 median   mean                            ind                           p_val  hypothesis
## -------------------------------------------------------------------------------------------------
## 1   27   265.625 359.167             IT, ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ              0.003      1     
## 2   23   231.250 218.662               ХИМИЧЕСКАЯ ПРОМЫШЛЕННОСТЬ                0.034      1     
## 3    4   187.500 257.872              НЕФТЕГАЗОВАЯ ПРОМЫШЛЕННОСТЬ              0.00000     1     
## 4   18   187.500 193.576               ОПЕРАЦИИ С НЕДВИЖИМОСТЬЮ                 0.405      0     
## 5   21   187.500 223.285                     ЮРИСПРУДЕНЦИЯ                      0.067      0     
## 6   28   187.500 184.375           ЭКОЛОГИЯ, ЗАЩИТА ОКРУЖАЮЩЕЙ СРЕДЫ            0.032      1     
## 7   31   187.500 225.502                  РЕКЛАМА, МАРКЕТИНГ                    0.312      0     
## 8   25   183.036 196.206              СПОРТ, ТУРИЗМ, РАЗВЛЕЧЕНИЯ                0.244      0     
## 9   15   182.292 227.523                        ФИНАНСЫ                         0.003      1     
## 10  16   182.292 202.276             ЭНЕРГЕТИЧЕСКАЯ ПРОМЫШЛЕННОСТЬ              0.010      1     
## 11   3   181.771 194.473             ВОЕННО-ПРОМЫШЛЕННЫЙ КОМПЛЕКС               0.014      1     
## 12   6   168.750 194.707                     СТРОИТЕЛЬСТВО                      0.003      1     
## 13   2   156.250 179.419              ГРАЖДАНСКОЕ МАШИНОСТРОЕНИЕ                0.484      0     
## 14   5   156.250 178.812         ДРУГАЯ ОТРАСЛЬ ТЯЖЕЛОЙ ПРОМЫШЛЕННОСТИ          0.348      0     
## 15   7   156.250 181.818                   ТРАНСПОРТ, СВЯЗЬ                     0.129      0     
## 16  11   146.429 177.589                    НАУКА, КУЛЬТУРА                     0.639      0     
## 17   9   143.750 171.839                   ОРГАНЫ УПРАВЛЕНИЯ                    0.951      0     
## 18  13   138.194 164.320            АРМИЯ, МВД, ОРГАНЫ БЕЗОПАСНОСТИ             0.248      0     
## 19   1   133.333 156.360            ЛЕГКАЯ, ПИЩЕВАЯ ПРОМЫШЛЕННОСТЬ              0.004      1     
## 20  14   132.589 160.485            ТОРГОВЛЯ, БЫТОВОЕ ОБСЛУЖИВАНИЕ              0.001      1     
## 21  26   132.500 163.822                   УСЛУГИ НАСЕЛЕНИЮ                     0.718      0     
## 22  30   131.250 173.997      СМИ, ИЗДАТЕЛЬСТВО, ПЕЧАТЬ, ТЕЛЕКОММУНИКАЦИИ       0.954      0     
## 23  12   130.208 158.214                    ЗДРАВООХРАНЕНИЕ                     0.014      1     
## 24  10     125   157.712                      ОБРАЗОВАНИЕ                       0.004      1     
## 25  17     125   154.788            ЖИЛИЩНО-КОММУНАЛЬНОЕ ХОЗЯЙСТВО              0.027      1     
## 26  20     125   147.772                СОЦИАЛЬНОЕ ОБСЛУЖИВАНИЕ                 0.189      0     
## 27   8   104.167 118.878                  СЕЛЬСКОЕ ХОЗЯЙСТВО                      0        1     
## 28  24   104.167 109.081 ДЕРЕВООБРАБАТЫВАЮЩАЯ ПРОМЫШЛЕННОСТЬ, ЛЕСНОЕ ХОЗЯЙСТВО 0.0005      1     
## 29  29   76.562  76.042            ОРГАНИЗАЦИЯ ОБЩЕСТВЕННОГО ПИТАНИЯ           0.0001      1     
## 30  22   52.083  79.861                         ЦЕРКОВЬ                         0.108      0     
## -------------------------------------------------------------------------------------------------
## 
## ===============================================================================================
##                          industry                        median_wage mean_wage p_val hypothesis
## -----------------------------------------------------------------------------------------------
## 1              IT, ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ                265.6      359.2   0.003     1     
## 2                ХИМИЧЕСКАЯ ПРОМЫШЛЕННОСТЬ                  231.2      218.7   0.03      1     
## 3               НЕФТЕГАЗОВАЯ ПРОМЫШЛЕННОСТЬ                 187.5      257.9   0.000     1     
## 4                ОПЕРАЦИИ С НЕДВИЖИМОСТЬЮ                   187.5      193.6    0.4      0     
## 5                      ЮРИСПРУДЕНЦИЯ                        187.5      223.3    0.1      0     
## 6            ЭКОЛОГИЯ, ЗАЩИТА ОКРУЖАЮЩЕЙ СРЕДЫ              187.5      184.4   0.03      1     
## 7                   РЕКЛАМА, МАРКЕТИНГ                      187.5      225.5    0.3      0     
## 8               СПОРТ, ТУРИЗМ, РАЗВЛЕЧЕНИЯ                  183.0      196.2    0.2      0     
## 9                         ФИНАНСЫ                           182.3      227.5   0.003     1     
## 10             ЭНЕРГЕТИЧЕСКАЯ ПРОМЫШЛЕННОСТЬ                182.3      202.3   0.01      1     
## 11             ВОЕННО-ПРОМЫШЛЕННЫЙ КОМПЛЕКС                 181.8      194.5   0.01      1     
## 12                     СТРОИТЕЛЬСТВО                        168.8      194.7   0.003     1     
## 13              ГРАЖДАНСКОЕ МАШИНОСТРОЕНИЕ                  156.2      179.4    0.5      0     
## 14         ДРУГАЯ ОТРАСЛЬ ТЯЖЕЛОЙ ПРОМЫШЛЕННОСТИ            156.2      178.8    0.3      0     
## 15                   ТРАНСПОРТ, СВЯЗЬ                       156.2      181.8    0.1      0     
## 16                    НАУКА, КУЛЬТУРА                       146.4      177.6    0.6      0     
## 17                   ОРГАНЫ УПРАВЛЕНИЯ                      143.8      171.8    1.0      0     
## 18            АРМИЯ, МВД, ОРГАНЫ БЕЗОПАСНОСТИ               138.2      164.3    0.2      0     
## 19            ЛЕГКАЯ, ПИЩЕВАЯ ПРОМЫШЛЕННОСТЬ                133.3      156.4   0.004     1     
## 20            ТОРГОВЛЯ, БЫТОВОЕ ОБСЛУЖИВАНИЕ                132.6      160.5   0.001     1     
## 21                   УСЛУГИ НАСЕЛЕНИЮ                       132.5      163.8    0.7      0     
## 22      СМИ, ИЗДАТЕЛЬСТВО, ПЕЧАТЬ, ТЕЛЕКОММУНИКАЦИИ         131.2      174.0    1.0      0     
## 23                    ЗДРАВООХРАНЕНИЕ                       130.2      158.2   0.01      1     
## 24                      ОБРАЗОВАНИЕ                          125       157.7   0.004     1     
## 25            ЖИЛИЩНО-КОММУНАЛЬНОЕ ХОЗЯЙСТВО                 125       154.8   0.03      1     
## 26                СОЦИАЛЬНОЕ ОБСЛУЖИВАНИЕ                    125       147.8    0.2      0     
## 27                  СЕЛЬСКОЕ ХОЗЯЙСТВО                      104.2      118.9     0       1     
## 28 ДЕРЕВООБРАБАТЫВАЮЩАЯ ПРОМЫШЛЕННОСТЬ, ЛЕСНОЕ ХОЗЯЙСТВО    104.2      109.1   0.000     1     
## 29           ОРГАНИЗАЦИЯ ОБЩЕСТВЕННОГО ПИТАНИЯ              76.6       76.0    0.000     1     
## 30                        ЦЕРКОВЬ                           52.1       79.9     0.1      0     
## -----------------------------------------------------------------------------------------------
## 
## =============================
## sex     median_wage mean_wage
## -----------------------------
## МУЖСКОЙ    156.2      190.0  
## ЖЕНСКИЙ    130.2      157.4  
## -----------------------------
## 
## =========================================================
## industry             median_wage mean_wage mean_education
## ---------------------------------------------------------
## IT and Chemical ind.     250      309.31       18.77     
## Not IT and Chem.       143.75     171.39       17.74     
## ---------------------------------------------------------

Интерпретация полученных результатов

Химическая промышленность как ключевая отрасль российской экономики

Крупнейшие предприятия химической промышленности в России находятся в частных руках («СИБУР Холдинг», «Еврохим», «Газпром нефтехим Салават», «Нижнекамскнефтехим», «Акрон», «Казаньоргсинтез», «Уралкалий», «ТольяттиАзот»). Некоторые из них являются лидерами в Европе и во всем мире по объему производства.

Стоит добавить то, что химическая промышленность в России напрямую связана с другими промышленными сферами, так как, кроме бытовой и сельскохозяйственной продукции, она снабжает машиностроительный комплекс, металлургию, сырьевой комплекс (один из ключевых составляющих экспорта России), оборонную промышленность, медицинскую и фармакологическую индустрию, добывающие предприятия. Отсюда, химическая промышленность остается одним из приоритетных направлений развития российской экономики, так как национальная конкурентоспособность напрямую зависит именно от неё. Более того, страна не испытывает дефицита ресурсов, которые идут на развитие этой отрасли (богатство источников сырья в Сибири и т.д.). Вклад в экономику (2012-2013) составил 10%, и именно в те годы она оказалась устойчивой к начинающейся стагнации экономики.

Немаловажным фактором высокой оплаты труда в этой сфере является повышенный риск для здоровья, который, с одной стороны, отрицательно влияет на спрос на данную профессию, что приводит к дефициту кадров (отсюда, широта предложения на рынке труда), с другой стороны, требует огромных финансовых вложений со стороны руководства в обеспечение безопасности работников, чтобы последние могли быть уверены, что риски для их здоровья сведены к нулю.

В дополнение, заработные платы в химической промышленности (как составляющей обрабатывающей промышленности в целом) имеют низкий коэффициент Джини (2013 год), что подтверждает факт своеобразной однородности труда в этой сфере промышленности.

Однако речь идёт не только об однородности, но и о степени ответственности, которую несет конкретный работник: так, по данным исследования, проведенного в Соединенных Штатах Америки, работники химической индустрии находятся под частыми проверками со стороны начальства. Это сказывается на качестве работы и, соответственно, высокой заработной плате. Хотя «синие воротнички» в этой же сфере подвержены разительно меньшему контролю. Из последнего можно сделать вывод о том, что высшая квалификация влияет на заработную плату (об этом мы говорили во вступительном параграфе).

IT индустрия и цифровизация экономики

Сейчас происходит постепенная цифровизация всей экономики, которая, с одной стороны, увеличивает скорость обработки данных и позволяет работать с большими массивами данных, с другой стороны, меняет рынок труда, обостряя проблему структурной безработицы: так всё больше говорится о «рутинизации» производства. Имеется ввиду, что машинное оборудование заменяет труд «синего воротничка». Растёт потребность в квалифицированном IT-специалисте, в то время как класс «middle-skilled» исчезает с рынка труда. Отсюда, происходит поляризация по уровню дохода (заработной плате). Стоит подчеркнуть, что мы говорим об общемировой тенденции, а, так как Россия вносит свой вклад в развитие ИКТ-технологий и, в целом, продолжает конкурировать с ведущими развитыми экономиками на мировом уровне, IT-специалист становится востребованной и высокооплачиваемой профессией.

Стоит отметить, что когда заходит речь об IT-специалисте, мы, прежде всего, имеем в виду профессию, которая находит платформу для реализации во всех областях экономики: от промышленности до сферы услуг (реже, сельское хозяйство). Факт того, что цифровизация будет продолжаться, «айтишник» не перестанет быть востребованным работником в мире, конкретно, в России.

Ссылая на тот факт, что IT-услуги достаточно недавно были представлены на потребительских рынках, мы можем сделать предположение, что молодой возраст работников (в силу новизны профессии) может вполне быть основанием для более высокой оплаты труда. У молодых работников более высокие стимулы к труду (в первую очередь, карьерный рост), они также остаются более мобильными.

Гендерное неравенство в трудовой сфере

Гендерное неравенство является тем фактором, который снижает общий уровень заработной платы работников (в совокупности). Ежегодно эта разница в оплате становится меньше, хоть и незначительно (около 0.2 процентов). Поэтому гендерная принадлежность может являться одним из основных факторов, влияющих на заработную плату, независимо от уровня образования, квалификации и специализации.

Выводы исследования

  1. В отрасли, которая является драйвером других отраслей, у работников наблюдается повышенная заработная плата, что отражает динамический характер рынка труда.

  2. Цифровизация, как продолжающийся и показывающий экономическую эффективость процесс, повышает спрос на новых высококлассных специалистов в сфере IT, что расширяет предложение со стороны работодателей на рынке труда

  3. Гендерное неравество в сфере оплаты труда работников стабильно сохраняется.

Практическая польза выводов исследования

Во-первых, подтверждение суждения и гипотезы о гендерном неравенстве на основе эмпирического опыта (в сфере оплаты труда в различных отраслях на российском рынке труда)

Во-вторых, данные можно использовать для направления развития IT-Индустрии в России

В-третьих, почва для проведения дальнейших исследований о том, как взаимозависимые отрасли (хим - другие) влияют на общее (коалиционное) благосостояние.

Список использованной литературы

I. Различия в оплате труда работников разных профессий (Л. Г. Зубова)

  1. Job Polarization and Structural Change (ZsÓfia L. Bárány and Christian Siegel)

  2. Supervision and Wages Across Industries (Derek Neal)

  3. Влияние цифровизации экономики на рынок труда (С.В. Климовицкий, Г.В. Осипов)

V. Отраслевые сдвиги и межотраслевое неравенство (В.Е. Гимпельсон)

  1. Профессиональный риск для здоровья работников химической промышленности (Э.Т. Валеева, А.Б. Бакиров, Л.К. Каримова)

  2. Химическая промышленность и современные проблемы её развития в Российской Федерации (А.А. Шерстобитова, Э.Т. Феткуллова)

  3. Химическая промышленность России: современное состояние и проблемы развития (Е.В. Кулясова)

  4. A Meta-analysis of the international gender wage gap (Doris Weichselbaumer, Rudolf Winter-Ebmer)