최근 우리나라에서는 남녀 갈등이 극심화된 부분이 있다. 이에 따라 특히 소득 부분에서 남녀 간의 임금 격차에 대한 논란이 끊이지 않으므로 실제로 남녀 임금차별이 존재하는지를 데이터 분석을 통해 알아보고자 한다. 또한 특히 여성이 결혼을 하면 육아로 인한 휴직 등의 요소로 인해 임금 차별이 일어난다는 의견이 많음에 따라 결혼 여부에 따른 임금 차이를 데이터 분석을 통해 알아보고자 한다.
최신 데이터인 한국복지패널의 2023년 18차 조사 데이터를 활용하였다. 2023년 18차 한국복지패널 조사의 가구원을 성별에 따라 분류한 후 직업, 소득, 결혼 여부 등을 활용하여 남녀 간의 임금 격차를 알아보았다.
2023년 18차 한국복지패널조사 자료를 불러와 할당하고, 분석에 사용할 변수를 쉬운 단어로 바꾸어 할당하였다.
raw_welfare <- read.spss(file="Koweps_hpda18_2023_beta1.sav",
to.data.frame=T)
welfare<-raw_welfare
welfare<-rename(welfare,
sex=h18_g3,
birth=h18_g4,
marriage=h18_g10,
income=p1802_8aq1,
code_job=h18_eco9)
welfare$age <- 2023-welfare$birth +1
또한 조사 결과의 숫자 데이터들을 이름을 붙여 할당하였고, 데이터 분석에 필요한 조사 결과 이외의 데이터는 결측 처리하였다.
welfare$sex <- ifelse(welfare$sex==1, "male", "female")
welfare$marriage_real <- ifelse(welfare$marriage==1, "marriage",
ifelse(welfare$marriage==5, "single",NA))
welfare$marriage_mf <- ifelse(welfare$sex == "male", "male",
ifelse(is.na(welfare$marriage_real), NA,
ifelse(welfare$marriage_real == "single", "single female", "marriage female")))
우선 구분 없이 성별에 따른 남녀의 임금을 비교하였다.
welfare$income <- ifelse(welfare$income %in% c(0,9999), NA, welfare$income)
sex_income <-welfare %>%
filter(!is.na(income)) %>%
group_by(sex) %>%
summarise(mean_income=mean(income))
sex_income
## # A tibble: 2 × 2
## sex mean_income
## <chr> <dbl>
## 1 female 201.
## 2 male 374.
직종, 직급과 같은 요소별 구분 없이 남성과 여성만 구분하여 임금 평균을 내면 다음과 같이 남성이 약 374만원, 여성이 약 201만원으로 남성의 월급이 많다.
ggplot(data=sex_income, aes(x=sex,y=mean_income)) +
geom_col()
그러나 성별 이외의 많은 요인에 의해 임금이 달라질 수 있으므로 다양한 요인별로 그래프를 활용해 분석을 하고자 한다.
먼저 직종에 따라 성별간 임금의 평균을 분류하면 다음과 같다.
list_job <-read_excel("Koweps_Codebook.xlsx",col_names=T,sheet=2)
list_job <- as.data.frame(list_job)
welfare <- left_join(welfare, list_job, by="code_job")
male_job <- welfare %>%
filter(!is.na(job)&sex=="male") %>%
select(job)
female_job <- welfare %>%
filter(!is.na(job)&sex=="female") %>%
select(job)
job_sex <- welfare %>%
filter(!is.na(income) & job %in% male_job$job & job %in% female_job$job) %>%
group_by(job, sex) %>%
summarise(mean_income = mean(income)) %>%
arrange(desc(mean_income))
top_job <- job_sex %>%
head(10)
job_sex_top <- job_sex %>%
filter(job %in% top_job$job)
ggplot(data = job_sex_top, aes(x = job, y = mean_income, fill = sex))+
geom_col(position = "dodge")+
coord_flip()
평균 임금이 높은 10개의 직업을 골라 남녀의 평균 임금을 비교하였다. 대부분의 직종에서 남성의 임금이 높은 것을 확인할 수 있다.
직종별로 나이에 따라 성별을 구분하여 남녀의 평균 임금을 비교하면 다음과 같다. 평균 임금이 가장 높은 ‘의료진료 전문가’와 여성의 임금이 더 높은 ’건설 전기 및 생산 관련 관리자’ 의 성별과 나이에 따른 평균 임금을 비교하는 그래프를 만들었다.
sex_age_1 <- welfare %>%
filter(!is.na(income) & job == "의료진료 전문가") %>%
group_by(age, sex) %>%
summarise(mean_income = mean(income))
sex_age_gp1 <- ggplot(data = sex_age_1, aes(x = age, y = mean_income, col = sex)) +
geom_point()+geom_line()+
ggtitle("의료진료 전문가")
sex_age_gp1
의료진료 전문가는 나이에 따라 보면 남성의 임금이 여성보다 더 높은 형태를 가진다.
sex_age_2 <- welfare %>%
filter(!is.na(income) & job == "건설 전기 및 생산 관련 관리자") %>%
group_by(age, sex) %>%
summarise(mean_income = mean(income))
sex_age_gp2 <- ggplot(data = sex_age_2, aes(x = age, y = mean_income, col = sex))+
geom_point()+geom_line()+
ggtitle("건설 전기 및 생산 관련 관리자")
sex_age_gp2
건설 전기 및 생산 관련 관리자는 여성의 데이터가 부족하나 동일 나이의 여성의 임금이 남성보다 높은 것을 확인 할 수 있다.
따라서 특정 직업에서는 그렇지 않은 경우가 있지만, 대체적으로 남성의 임금이 여성보다 더 높은 형태를 가지는 것을 알 수 있다. 이는 사회적으로 여성들이 임금 차이가 불합리하다고 느끼는 이유의 원인이 될 수 있다.
특히 여성의 경우에는 결혼 후 육아로 인한 휴직과 같은 이유로 남성과의 임금 격차가 일어나는 의견이 많기에 결혼에 따른 남녀의 임금 차이를 분석하였다.
먼저 남성의 경우 결혼 유무에 따른 평균 임금의 차이를 분석하면 다음과 같다.
male_marriage_income <- welfare %>%
filter(!is.na(marriage_real) & !is.na(income) & sex == "male") %>%
group_by(age, marriage_real) %>%
summarise(mean_income = mean(income)) %>%
mutate(tot_group = sum(n()))
table(male_marriage_income$marriage_real)
##
## marriage single
## 65 50
ggplot(data = male_marriage_income, aes(x = age, y = mean_income, col = marriage_real))+
geom_line()
남성의 경우 결혼을 한 경우에 임금이 더욱 높은 것을 알 수 있다. 이는 연차에 따른 경력으로 인한 임금 상승일 가능성이 크다.
남성과 여성의 결혼 유무에 따른 평균 임금의 차이를 분석하면 다음과 같다
marriage_mf_income <- welfare %>%
filter(!is.na(marriage_mf) & !is.na(income)) %>%
group_by(age, marriage_mf) %>%
summarise(mean_income = mean(income)) %>%
mutate(tot_group = sum(n()))
ggplot(data = marriage_mf_income, aes(x = age, y = mean_income, col = marriage_mf))+
geom_line()
여성의 임금이 남성의 임금보다 낮은 형태를 가지고, 미혼 여성보다 기혼 여성의 임금이 더욱 낮은 것을 확인할 수 있다. 또한 대체적을 결혼을 하는 연령대 전후로 미혼 여성은 남성과 임금이 비슷하나 기혼 여성은 확연히 낮은 임금임을 확인할 수 있다. 이는 육아로 인한 결과일 가능성이 크다.
성별과 나이, 직종, 결혼 유무에 따른 임금 차이에 대한 데이터를 분석하였다. 그 결과에 따르면 임금 격차는 남성과 여성의 성별적 문제보다는 결혼으로 인한 육아로 임금 차이가 일어난다고 볼 수 있다. 현재 우리나라는 출산율이 계속해서 하락하고 있는데, 육아에 대한 이러한 문제점이 해결되지 못하면 앞으로도 계속해서 출산율 저하는 일어날 것으로 보인다. 따라서 임금 차이로 인한 성별 갈등 보다는 육아와 출산에 대한 다양한 제도 마련이 필요할 것이라고 생각된다.