연구 목적 및 배경 설명

최근 몇 년 동안 아시아에서 여성의식이 각성되기 시작했다. 여성들이 자신의 권익을 쟁취하기 시작한 가운데 한국의 페미니즘 운동은 아시아를 선도하고 있다. 여성의 지위가 높아지고 있지만 여성의 직업 문제는 항상 중요하게 여겨야 할 문제였다. 여성은 고정관념상 취약계층이고, 남성보다 월급도 훨씬 낮다. 한국복지패널이 여성층의 월소득 등 경제활동 실태를 조사한 결과 2022년 여성의 소득은 여전히 저조한 것으로 나타났다. 향후 여성의 구직과 직업복지를 더욱 발전시키기 위해서는 여성임금의 영향요인에 대한 조사가 가치가 있다고 생각한다. 이어서 한국복지패널이 2022년 17차 복지조사를 통해 여성 임금이 얼마나 되는지에 영향을 미치는 요인을 살펴보겠다.

데이터에 대한 개괄적인 설명

본 연구에 사용된 데이터는 ’2022년 17차 한국복지패널조사’이다.

본 연구에서 설정한 주요 종속변수는 변수 이름이 p1702_8aq1인 ‘일한달의 월 평균 임금’이다. 이 종속변수에 대해 필자는 개인적 독립변수와 사회적 독립변수를 설정했다. 그 중 개인적 독립 변수는 h17_g3 ’성별’, h17_g4 ‘생년’ p1702_4 ‘작업 시작년’ 및 h17_g10 ’혼인 상태’이다. 사회적 독립변수로는 h17_reg7 ’생활지역’과 p1707_3aq1 ’교육상황’이 있다.

이 중 ‘혼인상태’와 월급의 상관관계에 대한 연구에서는 ’결혼상태’에 영향을 미치는 요인으로 ’연령’ 변수를 추가하였다. 여성의 나이가 결혼 상태에 영향을 미쳐 월급 수준에 영향을 미치는지 알아보는 데 의미가 있다.

‘생활지역’과 월급 사이의 관계에 대한 연구에서 h1707_9’생활비’ 변수를 또 다른 종속변수로 추가했다. 생활비 수준과 월급 수준이 지역에서 상관관계가 있는지 탐구하는 데 의미가 있다.

‘교육 상황’과 월급 사이의 관계에 대한 연구에서는 최종 학력이 대학인 여성의 출신 대학 소재지가 월급에 미치는 영향에 대한 파생 연구를 확장했다. p1707_3aq6이라는 ’출신 대학 소재지 코드’ 변수를 사용해 kormaps2014 함수에 있는 한국 지도를 결합해 연구했다.

데이터 정제 및 가공 과정

1 정체 데이터 정제

먼저 한국복지패널 데이터의 복사본을 만든 후, 사용할 변수들의 변수명을 바꿔었다.

raw_welfare22 <- read.spss(file = "Koweps_hpwc17_2022_beta1.sav",
                           to.data.frame = T)
## Warning in read.spss(file = "Koweps_hpwc17_2022_beta1.sav", to.data.frame = T):
## Koweps_hpwc17_2022_beta1.sav: Compression bias (0) is not the usual value of
## 100
## Warning in read.spss(file = "Koweps_hpwc17_2022_beta1.sav", to.data.frame = T):
## Koweps_hpwc17_2022_beta1.sav: Very long string record(s) found (record type 7,
## subtype 14), each will be imported in consecutive separate variables
welfare22 <- raw_welfare22 %>%
  select(sex = h17_g3,
         birth = h17_g4, 
         marrige = h17_g10, 
         region = h17_reg7, 
         income = p1702_8aq1,
         education = p1707_3aq1, 
         college_locode = p1707_3aq6,
         work_start = p1702_4, 
         living_cost = h1707_9)

2-1 종속변수(월급)의 데이터에 대한 검토 및 전처리

#데이터를 검토하기
summary(welfare22$income)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##     0.0   125.0   236.0   275.6   363.0  2017.0   10958
#이상치 유무 확인하고 처리하기
table(is.na(welfare22$income))
## 
## FALSE  TRUE 
##  5633 10958
welfare22 <- welfare22 %>% filter(!is.na(income))

2-2 독립변수(성별,연령,근무 연한,혼인상태,생활지역,교육상황)의 데이터에 대한 검토 및 전처리

2-2-1 성별 데이터에 대한 검토 및 전처리

#데이터를 검토하기
table(welfare22$sex)
## 
##    1    2 
## 2745 2888
#이상치 유무 확인하기
table(is.na(welfare22$sex))
## 
## FALSE 
##  5633
#값의 내용 바뀌기
welfare22$sex <- ifelse(welfare22$sex == 1, "male", "female")
table(welfare22$sex)
## 
## female   male 
##   2888   2745

코드북을 이용한 데이터 변환을 진행했다. 코드북에 따르면 해당 값들은’1.남성 2.여성’

2-2-2 연령 데이터에 대한 검토 및 전처리

#데이터를 검토하기
summary(welfare22$birth)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    1929    1959    1972    1971    1983    2003
#이상치 유무 확인하기
table(is.na(welfare22$birth))
## 
## FALSE 
##  5633
#파생변수 추가히기
welfare22 <- welfare22 %>%
  mutate(age = 2022 - birth +1)

2-2-3 근무 연한 데이터에 대한 검토 및 전처리

#데이터를 검토하기
summary(welfare22$work_start)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    1960    2012    2018    2015    2020    2021
#이상치 유무 확인하기
table(is.na(welfare22$work_start))
## 
## FALSE 
##  5633
#파생변수 추가히기
welfare22 <- welfare22 %>%
  mutate(work_age = 2022 - work_start +1)

2-2-4 혼인상태 데이터에 대한 검토 및 전처리

#데이터를 검토하기
table(welfare22$marrige)
## 
##    1    2    3    4    5 
## 3469  538  347   31 1248
#이상치 유무 확인하기
table(is.na(welfare22$marrige))
## 
## FALSE 
##  5633
#값의 내용 바뀌기
welfare22$marrige <- ifelse(welfare22$marrige == 1, "유배우", 
                            ifelse(welfare22$marrige == 2, "사별", 
                                   ifelse(welfare22$marrige == 3, "이혼", 
                                          ifelse(welfare22$marrige == 4, "별거", "미혼(18세이상/미혼모포함)"))))
welfare22 %>%
  count(marrige, sort = T)
##                     marrige    n
## 1                    유배우 3469
## 2 미혼(18세이상/미혼모포함) 1248
## 3                      사별  538
## 4                      이혼  347
## 5                      별거   31

코드북을 이용한 데이터 변환을 진행했다. 코드북에 따르면 해당 값들은’1.유배우 2.사별 3.이혼 4.별거 5.미혼(18세이상/미혼모포함)’

2-2-5 생활지역괴 지역생활비 데이터에 대한 검토 및 전처리

#데이터를 검토하기
table(welfare22$region)
## 
##    1    2    3    4    5    6    7 
##  820 1400  915  581  594  450  873
summary(welfare22$living_cost)
##     Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
##     38.0    259.0    432.0    493.9    620.0 114446.0
#이상치 유무 확인하기
table(is.na(welfare22$region))
## 
## FALSE 
##  5633
table(is.na(welfare22$living_cost))
## 
## FALSE 
##  5633
#값의 내용 바뀌기
welfare22$region <- ifelse(welfare22$region == 1, "서울", 
                            ifelse(welfare22$region == 2, "수도권(인천/경기)", 
                                   ifelse(welfare22$region == 3, "부산/경남/울산", 
                                          ifelse(welfare22$region == 4, "대구/경북",
                                                 ifelse(welfare22$region == 5, "대전/충남/세종", 
                                                        ifelse(welfare22$region == 6, "강원/충북", 
                                                               "광주/전남/전북/제주도"))))))
welfare22 %>%
  count(region, sort = T)
##                  region    n
## 1     수도권(인천/경기) 1400
## 2        부산/경남/울산  915
## 3 광주/전남/전북/제주도  873
## 4                  서울  820
## 5        대전/충남/세종  594
## 6             대구/경북  581
## 7             강원/충북  450

코드북을 이용한 데이터 변환을 진행했다. 코드북에 따르면 해당 값들은’1.서울 2.수도권(인천/경기) 3.부산/경남/울산 4.대구/경북 5.대전/충남/세종 6.강원/충북 7.광주/전남/전북/제주도’

2-2-6 교육상황 데이터에 대한 검토 및 전처리

#값의 내용 바뀌기
table(welfare22$education)
## 
##   1   2   3   4   5 
## 379 350 125 354  54
#이상치 유무 확인하기
table(is.na(welfare22$education))
## 
## FALSE  TRUE 
##  1262  4371
#값의 내용 바뀌기
welfare22$education <- ifelse(welfare22$education == 1, "중학교졸업이하", 
                            ifelse(welfare22$education == 2, "고등학교중퇴/졸업", 
                                   ifelse(welfare22$education == 3, "전문대학재학/중퇴/졸업", 
                                          ifelse(welfare22$education == 4, "대학교(4년제)재학/중퇴/졸업", 
                                                 "대학원이상"))))
welfare22 %>%
  count(education, sort = T)
##                     education    n
## 1                        <NA> 4371
## 2              중학교졸업이하  379
## 3 대학교(4년제)재학/중퇴/졸업  354
## 4           고등학교중퇴/졸업  350
## 5      전문대학재학/중퇴/졸업  125
## 6                  대학원이상   54

코드북을 이용한 데이터 변환을 진행했다. 코드북에 따르면 해당 값들은’1.중학교졸업이하 2.고등학교중퇴/졸업 3.전문대학재학/중퇴/졸업 4.대학교(4년제)재학/중퇴/졸업 5.대학원이상’

#변수 추가히기
list_region <- data.frame(college_locode = c(11, 21:26, 31:43), 
                          college_loc = c("서울특별시",
                                          "부산광역시",
                                          "대구광역시",
                                          "인천광역시",
                                          "광주광역시",
                                          "대전광역시",
                                          "울산광역시",
                                          "경기도",
                                          "강원도",
                                          "충청북도",
                                          "충청남도",
                                          "전라북도",
                                          "전라남도",
                                          "경상북도",
                                          "경상남도",
                                          "제주도",
                                          "검정고시",
                                          "북한",
                                          "외국",
                                          "세종특별자치시"))

welfare22 <- left_join(welfare22, list_region, by = "college_locode")

데이터 분석

1 남녀 평균 월급 대비

성별에 따른 평균 월급을 분석했다.

income_sex <- welfare22 %>%
  filter(!is.na(income)) %>% 
  group_by(sex) %>% 
  summarise(mean_income_sex = mean(income))

income_sex
## # A tibble: 2 × 2
##   sex    mean_income_sex
##   <chr>            <dbl>
## 1 female            191.
## 2 male              365.

필자는 남성과 여성의 평균 월 소득을 별도로 계산했다. 남성의 월평균 소득은 356만1064원 반면 여성의 월평균 소득은 190만6147원이다. 여성의 월소득이 남성의 월소득에 비해 절반 가까이 적음을 알 수 있는데, 이는 남성과 여성의 월소득에 큰 차이가 있음을 의미하므로 여성의 월급에 영향을 미치는 요인에 대한 본 연구는 의미가 있다.

2 여성 월급에 영향을 미치는 개인적 요인

2-1 연령과 월급사이의 데이터 분석

연령에 따른 평균 월급을 분석했다.

age_income <- welfare22 %>%
  filter(sex == "female") %>%
  group_by(age) %>% 
  summarise(mean_income_age = mean(income))

aged_income <- age_income %>%
  mutate(aged = ifelse(age < 30, "young", 
                       ifelse(age < 50, "middle", "old"))) %>%
  group_by(aged) %>%
  summarise(mean_income_aged = mean(mean_income_age))
aged_income
## # A tibble: 3 × 2
##   aged   mean_income_aged
##   <chr>             <dbl>
## 1 middle             270.
## 2 old                115.
## 3 young              189.

필자는 age 변수를 이용해 30대 이하 여성을 young, 30-50대 여성을 middle, 50대 이상을 old로 설정해 세 연령층으로 나눠 세대별 평균 월급을 계산했다. 이에 따르면 middle 평균 월급은 270만2007원으로 old의 114만8873원과 young의 188만8495원보다 훨씬 많다.

2-2 근무 연한과 월급사이의 데이터 분석

근무 연한에 따른 평균 월급을 분석했다.

workage_income <- welfare22 %>%
  filter(sex == "female") %>%
  group_by(work_age) %>% 
  summarise(mean_income_workage = mean(income))

workaged_income <- workage_income %>%
  mutate(workaged = ifelse(work_age < 10, "short", 
                       ifelse(work_age < 30, "middle", "long")))

workaged_income %>%
  group_by(workaged) %>%
  summarise(mean_income_workaged = mean(mean_income_workage))
## # A tibble: 3 × 2
##   workaged mean_income_workaged
##   <chr>                   <dbl>
## 1 long                     494.
## 2 middle                   338.
## 3 short                    172.

필자는 work_age 변수를 사용하여 근속연한이 10년 이하인 여성을 short, 10-30년인 여성을 middle, 30년 이상인 여성을 long으로 설정하고 이를 세 개의 근속층으로 나누어 각 근속층의 평균 월급을 계산했다. 월평균 급여는 long이 494만3564원으로 가장 높은 것으로 나타났다. long, middle, short의 평균 월급은 단계적으로 줄어든다.

2-3 혼인상태와 월급사이의 데이터 분석

혼인상태에 따른 평균 월급을 분석했다.

marrige_income <- welfare22 %>%
  filter(sex == "female") %>%
  select(marrige, age, income)

marrige_income %>%
  group_by(marrige) %>%
  summarise(mean_income_marrige = mean(income)) %>%
  arrange(desc(mean_income_marrige))
## # A tibble: 5 × 2
##   marrige                   mean_income_marrige
##   <chr>                                   <dbl>
## 1 미혼(18세이상/미혼모포함)               246. 
## 2 유배우                                  213. 
## 3 별거                                    178. 
## 4 이혼                                    176. 
## 5 사별                                     64.6

데이터에 따르면 미혼과 유배우자의 월 소득은 각각 246만 274원 및 212만 5691원이다. 그 차이는 크지 않다.

3 여성 월급에 영향을 미치는 사화적 요인

3-1 생화지역, 그지역의 생활비와 월급사이의 데이터 분석

생활 지역에 따른 평균 월급과 평균 생활비를 분석했다.

region_income <- welfare22 %>%
  filter(sex == "female") %>%
  select(region, income, living_cost) %>%
  group_by(region) %>%
  summarise(mean_income_region = mean(income), mean_lvc_region = mean(living_cost)) %>%
  arrange(desc(mean_income_region))
region_income
## # A tibble: 7 × 3
##   region                mean_income_region mean_lvc_region
##   <chr>                              <dbl>           <dbl>
## 1 서울                                234.            520.
## 2 수도권(인천/경기)                   202.            498.
## 3 대전/충남/세종                      194.            415.
## 4 부산/경남/울산                      184.            425.
## 5 광주/전남/전북/제주도               173.            383.
## 6 대구/경북                           167.            393.
## 7 강원/충북                           157.            364.

동시에 지역별로 월평균 소득과 평균 생활비를 계산했다. 월평균 소득과 평균 생활비가 가장 높은 지역은 서울, 2위는 수도권(인천/경기)인 것으로 나타났다. 월평균 소득은 서울과 수도권만 200만원 이상이고, 그 외 지역은 156만~193만원까지 다양하다. 평균 생활비는 서울이 500만 원 이상으로 다른 지역을 크게 웃돌았고, 서울 지역 여성 평균 소득의 2배가 넘었다.

3-2 교육상황과 월급사이의 데이터 분석

최중 학력에 따른 평균 월급을 분석했다.

edu_income <- welfare22 %>%
  filter(sex == "female") %>%
  filter(!is.na(education)) %>%
  select(age, income, education, college_loc, college_locode)

edu_income %>%
  group_by(education) %>%
  summarise(mean_income_edu = mean(income)) %>%
  arrange(desc(mean_income_edu))
## # A tibble: 5 × 2
##   education                   mean_income_edu
##   <chr>                                 <dbl>
## 1 대학원이상                            393. 
## 2 대학교(4년제)재학/중퇴/졸업           238. 
## 3 전문대학재학/중퇴/졸업                229. 
## 4 고등학교중퇴/졸업                     166. 
## 5 중학교졸업이하                         72.3

최종 학력이 대학원 이상인 여성의 월평균 소득은 393만4286원으로 2위인 4년제 대학의 238만1489원보다 100만원 이상 많은 것으로 나타났다. 최종 학력이 중하교졸업이하인 여성의 월평균 소득은 72만2543위안에 불과해 4위 고등학교중퇴/졸업 여성의 월평균 소득과 큰 차이가 있다.

3-2-1 최중 학력은 대학인 여성의 대학 소재지와 월급사이의 데이터 분석

졸업 대학 소재지에 따른 평균 월급을 분석했다.

edu_income %>%
  filter(!is.na(college_locode)) %>%
  group_by(college_loc) %>%
  summarise(mean_income_collegeloc = mean(income)) %>%
  arrange(desc(mean_income_collegeloc))
## # A tibble: 12 × 2
##    college_loc mean_income_collegeloc
##    <chr>                        <dbl>
##  1 서울특별시                    555 
##  2 광주광역시                    408 
##  3 충청북도                      321 
##  4 경상북도                      285 
##  5 제주도                        266 
##  6 대구광역시                    255 
##  7 울산광역시                    240 
##  8 외국                          192 
##  9 대전광역시                    188.
## 10 강원도                        154 
## 11 경기도                         80 
## 12 충청남도                        0

최종 학력이 대학인 여성은 대학 소재지에 따라 월급 차이가 있을 수 있다. 데이터에 따르면 대학을 졸업한 서울특별시에 있는 여성의 월 평균 소득은 555만원에 달한다. 2위인 광주광역시 출신 여성의 월평균 소득은 408만 원으로 1위와 150만 원 정도 차이가 났다.

그래프 만들기

1 성별에 따른 월급 그래프

남성과 여성의 평균 월 소득을 비교한 그래프이다. 두 그룹 간의 평균 월 소득의 차이를 직관적으로 보여주기 위해 막대 그래프를 선택했다. x축은 남녀 2개의 변수만 있기 때문에 막대 그래프를 사용하면 두 변수 값 간의 차이를 더 잘 강조할 수 있다. 그래프에 따르면 남성의 월평균 소득은 350만 원 이상, 여성은 200만 원 이하이다. 남성의 월평균 소득은 여성의 월평균 소득보다 150만 원 이상 높다. 성별이 임금 수준에 큰 영향을 미친다고 추정할 수 있다고 생각합니다. 따라서 본 연구는 가치가 있다고 생각합니다.

income_sex %>%
  ggplot(aes(x = sex, y = mean_income_sex)) +
  geom_col(stat="identity", fill = "lightpink", width = 0.4) +
  ggtitle("Difference of Income between Male and Female") +
  theme(plot.title = element_text(face = "bold", hjust = 0.5, size = 15, color = "darkred")) +
  labs(x = "sex", y = "income per month")
## Warning in geom_col(stat = "identity", fill = "lightpink", width = 0.4):
## Ignoring unknown parameters: `stat`

2-1 연령에 따른 월급 그래프

다양한 연령대의 여성의 평균 월 소득을 나타내는 인터랙티브 그래프이다. 연령에 따라 월평균 소득은 지속적인 추세를 보일 수 있다고 추측하여 라인 그래프를 사용함과 동시에 그래프에 추세 곡선을 추가하여 그래프를 보다 직관적이고 효과적으로 만든다. 그래프에 따르면 여성의 월평균 소득은 20~40대에 정비례하여 증가하며 40세에 316만 명으로 정점을 찍었다. 40세 이후에는 반비례적인 하향 추세를 보이다가 80세 이후에는 완만하게 안정된다. 그래서 나이가 여성의 임금 수준에 큰 영향을 미친다는 것을 추측했다. 젊은 여성에서 중년 여성의 임금 수준은 증가 추세에 있으며 40대 중반에는 크게 하락한다.

p1 <- age_income %>%
  ggplot(aes(x = age, y = mean_income_age)) +
  geom_line() +
  stat_smooth() +
  ggtitle("Income with different Ages") +
  theme(plot.title = element_text(face = "bold", hjust = 0.5, size = 15, color = "darkred")) +
  labs(x = "age", y = "income per month")
ggplotly(p1)
## `geom_smooth()` using method = 'loess' and formula = 'y ~ x'

2-2 근무 연한에 따른 월급 그래프

짧은 근속 연수와 긴 근속 여성 간의 월 소득 수준을 비교하는 인터랙티브 그래프이다. 데이터 분석에 따르면 다양한 근무 연령 그룹의 여성의 평균 월 소득은 크게 다르다. 따라서 boxplot 형식의 그래프를 사용하면 데이터 분석에 대한 극단값의 영향을 줄일 수 있다. 그리고 boxplot의 값의 집합적 특성을 통해 집단 간의 차이를 효과적으로 관찰하고 분석했다. 그래프에 따르면 단기, 중간 및 장기 근무 연한 여성의 평균 월 소득은 근무 기간이 증가함에 따라 증가했다. 이 중 긴 근무 연한 여성의 평균 월급은 562만5000원으로 단근무 연한 여성의 평균 월급인 168만200원보다 400만원가량 많다. 여성의 경우 근무연수가 길수록 임금이 높다는 것을 짐작할 수 있다. 하지만 갓 입사한 급여 수준은 매우 낮다.

p2 <- workaged_income %>%
  ggplot(aes(x = workaged, y = mean_income_workage, fill = workaged)) +
  geom_boxplot(show.legend = F) +
  scale_x_discrete(limits = c("short", "middle", "long")) +
  ggtitle("Income with Work ages") +
  theme(plot.title = element_text(face = "bold", hjust = 0.5, size = 15, color = "darkred")) +
  labs(x = "Work age", y = "income per month")
ggplotly(p2)

2-3 혼인상태와 연령에 따른 월급 그래프

연령별 여성의 결혼 상황과 결혼 상황 간의 평균 월 소득 분포를 보여주는 인터랙티브 그래프이다. 이 데이터 분석에는 세 가지 변수가 있고 연속적인 영향 변수이기 때문에 산점 그래프가 사용되었다. 산점 그래프는 데이터의 분포 유형을 관찰할 수 있으며, 이 그래프에서는 다양한 연령대의 여성의 결혼 상태를 관찰할 수 있을 뿐만 아니라 다양한 결혼 상태가 평균 월 소득에 미치는 영향을 분석할 수 있다. 따라서 산점 그래프를 사용하면 전체 분석을 보다 효율적으로 수행할 수 있다. 그래프 데이터에 따르면 미혼 여성은 40세 이전에 집중 분포되어 있다. 이 중 25세 이전의 미혼 여성은 월평균 임금이 300만 원 이하에 집중되어 있다. 배우자가 있는 여성은 30세에서 50세 사이에 널리 분포되어 있다. 다른 결혼 상태의 여성에 비해 배우자가 있는 여성의 평균 월수입은 300만 원 이상, 최고 1,167만 원으로 극단적 이상치이다.

p3 <- marrige_income %>%
  ggplot(aes(x = age, y = income, col = marrige)) +
  geom_point() + 
  ggtitle("Income with Marrige Situstions in Different Ages") +
  theme(plot.title = element_text(face = "bold", hjust = 0.5, size = 15, color = "darkred")) +
  labs(x = "age", y = "income per month")
ggplotly(p3)

3-1 생화지역에 따른 월급 그래프

지역에 따라 거주하는 여성의 평균 월소득 차이를 비교한 인터랙티브 그래프이다. 지역 변수의 단순성으로 인해 막대 그래프를 선택하여 데이터를 표시하여 데이터 내용을 한눈에 볼 수 있다. 그래프에 따르면 서울과 수도권에 생활하는 여성의 월평균 소득 상위 2위의 자리에 차지고 있다.

p4 <- region_income %>%
  ggplot(aes(x = reorder(region, mean_income_region), y = mean_income_region)) +
  geom_col(fill = "lightpink", width = 0.6) + 
  geom_smooth() +
  coord_flip() +
  ggtitle("Income with Region") +
  theme(plot.title = element_text(face = "bold", hjust = 0.5, size = 15, color = "darkred")) +
  labs(x = " ", y = "income per month")
ggplotly(p4)
## `geom_smooth()` using method = 'loess' and formula = 'y ~ x'

3-2 교육상황에 따른 월급 그래프

최종 학력이 다른 여성의 임금 수준을 비교하는 인터랙티브 그래프이다. 막대그래프를 선택한 이유는 최종 학력이 여성 임금 수준에 미치는 영향을 잘 관찰할 수 있기 때문이다. 그래프에 따르면 최종 학력이 대학원 이상인 여성의 평균 월급은 393만 원으로 다른 학력 여성의 평균 월급과 단애식 차이를 보이고 있다. 학력 정도에 따라 여성의 평균 월급 수준과 정상과이다. 그래서 학력 수준이 여성의 임금 수준에 영향을 미치는 중요한 요소라고 추정했다.

p5 <- edu_income %>%
  group_by(education) %>%
  summarise(mean_income_edu = mean(income)) %>%
  arrange(desc(mean_income_edu)) %>%
  ggplot(aes(x = reorder(education, -mean_income_edu), y = mean_income_edu)) +
  geom_col(fill = "lightpink", width = 0.6) +
  ggtitle("Income with Education Situations") +
  theme(plot.title = element_text(face = "bold", hjust = 0.5, size = 15, color = "darkred")) +
  labs(x = "education situation", y = "income per month")
ggplotly(p5)

3-2-1 대학 소재지에 따른 최중학력은 대학인 여성의 월급 그래프

이것은 3-2 교육 상황이 여성의 월급에 미치는 영향에 대한 연구를 확장한 연구이다. 본 연구에서는 대학 이상의 최종 학력을 가진 여성을 선정하여 출신대학 소재지가 급여 수준에 미치는 영향을 연구했다. 이 그래프는 코드복에서의 지역 코드를 사용하여 kormap2014 함수의 한국 지도를 결합하여 인트랙티브 지도 데이터 테이블을 생성했다. 지역별 대졸 여성의 월 소득 현황을 더 직관적이고 효과적으로 관찰할 수 있다. 지도에 따르면 서울 소재 대학을 졸업한 여성의 평균 월급은 850만원으로 다른 지역에 비해 많이 높다. 지도에서도 매우 짙은 색을 띄고 있다. 이는 서울지역 대졸 여성의 소득수준이 매우 높고, 대학지역이 소득수준에 미치는 영향은 상당할 것으로 추정될 수 있다고 생각한다.

library(kormaps2014)
edu_income %>%
  filter(!is.na(college_locode)) %>%
  ggChoropleth(aes(fill = income,
                 map_id = college_locode,
                 tooltip = college_loc),
             map = kormap1, 
             interactive = T) 

결론

여성의 임금 수준에 영향을 미치는 요인을 연구하기 위해 필자는 6 가지 가상를 제시했니다. 첫째, 여성의 임금 수준은 연령에 따라 달라진다. 둘째, 근무연한가 길수록 여성의 임금 수준이 높아진니다. 셋째, 여성의 임금 수준은 결혼에 들어감에 따라 떨어진다. 넷째, 수도권에 가까울수록, 생활비가 많이 드는 지역에 가까울수록 여성의 임금 수준이 높아진다. 다섯째, 교육 수준이 높을수록 여성의 임금 수준이 높아진다. 여섯째, 여대생 출신 대학이 수도권에 가까울수록 임금 수준이 높아진다.

이 여섯 가지 가상은 모두 필자가 개인과 주변 여성들의 보편적인 생각에서 출발한 추측이다. 2022년 한국복지패널조사 데이터를 선정·분석한 결과, 이 여섯 가지 가상에 대해 다음과 같은 결론을 내렸다:

1 여성의 임금 수준은 연령에 따라 달라진니다. 그런데 임금 수준이 계속 늘어나는 건 아니다. 본 연구에서 임금 수준의 정점은 중년 여성 그룹이었다. 젊은 여성과 나이든 여성의 임금 수준은 모두 낮다.

2 근무연수가 길수록 여성의 임금 수준이 높아진다. 본 연구에서 근무 기간이 긴 여성 그룹은 다른 그룹보다 평균 소득이 훨씬 높았다. 이는 근무연수가 높은 여성이 직장에서 고위직의 역할을 할 수 있음을 추측할 수 있다.

3 여성의 임금 수준은 결혼에 따라 떨어지지 않다. 반면 결혼 후 여성의 근무 상태는 더 안정적이다. 기혼 여성은 젊은 미혼 여성보다 높은 소득을 얻는 경우가 많다.

4 수도권에 가까울수록, 생활비가 많이 드는 지역에 가까울수록 여성의 임금 수준이 높다. 그 중에서도 생활비가 높은 것과 소득수준이 높은 것은 정상관관계가 있다.

5 교육 수준이 높을수록 여성의 임금 수준이 높아진다. 또 서울과 가까운 지역에서 대학교육을 받을수록 임금 수준도 높아진다.

결론적으로 사회복지부는 미래 한국 여성의 직업적 문제를 해결하기 위해 저연령·고령 여성의 근로복지 혜택을 중시해야 한다고 생각합니다. 여성의 직장 내 직권을 직시하고 여성 약자에 대한 고정관념을 줄여야 한다고 생각합니다. 또 여성의 교육 수준에 대한 강력한 관심을 가지고 적령기 여성에게 더 많은 취업 길을 열어줘야 한다고 생각합니다. 그리고 지방 여성 직업의 복지 혜택도 강화해야 한다고 생각합니다.