연구 목적 및 배경 설명

2024년 2월 6일 발표된 보건복지부 장관이 의대 정원을 2000명 증원한다고 발표했다. 이 여파로 전공의 파업, 대형 병원의 휴진, 의대생 휴학 등이 발생했다. 또한 고등학교 3학년인 학생들 외에도 대학을 다니거나 회사를 다니는 사람들이 다시 대학수학능력시험에 도전하는 경우도 많이 발생했다. 이러한 현상에는 학교를 졸업했을 때 취업이 보장되며 정년이 보장된다는 점, 연봉이 높다는 점 등이 원인으로 꼽힌다. 정년과 연봉 등의 요소가 의대 쏠림 현상과 관련이 있는지를 밝히며 직업 선택에 영향을 끼치는 요소에 대해 알아보고자 한다.

데이터에 대한 개괄적인 설명

2023년 18차 한국복지패널 데이터를 사용했다. 직업 선택에 영향을 주는 요소를 확인하기 위해서 근로 유형, 구직 여부, 구직 기간, 기대 수입, 월평균 임금, 직업 만족도, 직업을 관둔 이유, 구직 과정 중 어려움, 직업 기술 보유 직종, 습득한 기술의 해당 직종 등의 데이터를 참고했다.

데이터 분석은 다음과 같은 과정으로 진행되었다.

  1. 결측치를 제거한 각각의 데이터를 통해 데이터의 구성을 확인한다.
  2. 기대 수입과 월평균 임금을 비교해 수익이 구직 과정에 미치는 영향을 확인한다.
  3. 습득한 기술의 해당 직종과 직업 기술 보유 직종을 분석해 선호하는 직업군에 대해 분석한다.
  4. 근무기간과 직업을 관둔 이유, 만족도를 비교해 정년이 직업 선택에 미치는 영향을 분석한다.

데이터 정제 및 가공 과정

householdnum = read.spss(file = “Koweps_p18_2023_beta1.sav”, to.data.frame = T)

medical = householdnum %>% select(worktype = p1802_1,
jobsearch_status = p1802_10,
jobsearch_period = p1802_12,
M_averagewave = p1802_8aq1, expect_income = p1802_31, job_occupation = p1803_9,
jobtech = np1806_28, new_tech = p1802_aq4, job_difficulty = p1802_8aq3, retire = p1802_3, workperiod = p1802_6 )

medical

필요한 데이터를 medical 파일로 정리했으며 이를 요약했다.

summary(medical)

c_expect_income <- medical %>% filter(!is.na(expect_income)) %>% select(expect_income)

c_expect_income

c_M_averagewave <- medical %>% filter(!is.na(M_averagewave)) %>% select(M_averagewave)

c_M_averagewave

c_new_tech <- medical %>% filter(!is.na(new_tech)) %>% select(new_tech)

c_new_tech

c_jobtech <- medical %>% filter(!is.na(jobtech)) %>% select(jobtech)

c_jobtech

c_job_occupation <- medical %>% filter(!is.na(job_occupation)) %>% select(job_occupation)

c_job_occupation

c_jobsearch <- medical %>% filter(worktype == 4 & jobsearch_status == 1) %>% filter(!is.na(job_difficulty)) %>% select(job_difficulty)

데이터 분석의 편의를 위해 각각의 데이터의 결측치를 제거해 추출했다.

데이터 분석

ggplot(c_expect_income, aes(y = expect_income)) + geom_boxplot(fill = “skyblue”, color = “black”) + labs(title = “Boxplot of Expected Income”, y = “Expected Income”) + theme_minimal()

ggplot(c_M_averagewave, aes(y = M_averagewave)) + geom_boxplot(fill = “lightgreen”, color = “black”) + labs(title = “Boxplot of M Average Wave”, y = “M Average Wave”) + theme_minimal()

기대 수입과 월평균 임금을 각각 상자 그림으로 나타냈다. 그림과 위에서 정리한 데이터에 따르면 기대 수익의 중앙값이 실제 월평균 임금과 큰 차이가 없는 것을 확인할 수 있다. 기대 수입은 대부분 200~400만원 사이에 위치해 있었고 월평균 임금 역시 비슷한 위치에 존재하는 것을 확인할 수 있었다. 특이점으론 월평균 임금의 최댓값이 기대 수익에 비해 확연히 큰 점, 중앙값에서 벗어난 점들이 많이 존재한다는 점이 있었다. 이는 근로 기간이 길거나 나이에 따른 차이로 볼 수 있고 기대 수입의 경우 구직 활동을 하고 있는 사람을 대상으로 조사한 것이므로 이에 따른 차이로 볼 수 있다.

new_tech. jobtech의 숫자 변수가 나타내는 것은 다음과 같다.
1. 기계, 금속 2. 화공, 세라믹 3. 전기, 전자 4. 통신 5. 조선 6. 항공 7. 섬유 8. 토목, 건축 9. 광업자원 10. 정보처리 11. 국토개발 12. 농림 13. 해양 14. 산업디자인 15. 에너지 16. 환경 17. 안전관리 18. 산업응용 19. 교통 20. 공예 21. 사무관리 22. 음료품, 식료품 23. 위생 24. 보건, 의료, 사회 25. 금융, 무역, 유통 26. 교육, 공무원 관련 자격 27. 외국어, 관광 28. 기타

frequency <- table(c_new_tech$new_tech)

frequency_df <- data.frame(new_tech = as.factor(names(frequency)), count = as.vector(frequency))

ggplot(frequency_df, aes(x = new_tech, y = count)) + geom_bar(stat = “identity”, fill = “skyblue”, color = “black”) + labs(title = “Bar Chart of new_tech”, x = “new_tech”, y = “Frequency”) + theme_minimal()

1순위로 습득한 새로운 기술의 해당 직종의 빈도를 구해 막대그래프로 나타냈다. 24. 보건, 의료, 사회의 빈도 수가 확연히 큰 것을 확인할 수 있다.

frequency_jobtech <- table(c_jobtech$jobtech)

frequency_jobtech_df <- as.data.frame(frequency_jobtech) names(frequency_jobtech_df) <- c(“jobtech”, “Freq”)

ggplot(frequency_jobtech_df, aes(x = factor(jobtech), y = Freq)) + geom_bar(stat = “identity”, fill = “lightgreen”, color = “black”) + labs(title = “Bar chart of jobtech”, x = “jobtech”, y = “Frequency”) + theme_minimal()

직업 기술 보유 직종 1순위 역시 24. 보건, 의료, 사회가 가장 높게 나타나는 것을 알 수 있다. 이는 의료 관련 직업의 선호도를 보여준다.

sum(is.na(medical$retire))

medical_r <- medical[!is.na(medical$retire), ]

medical_r

medical의 retire 변수 결측치를 제거했다.

retire_4 <- medical_r %>% filter(retire == 4)

head(retire_4)

retire의 4는 정년 퇴직을 의미한다. 정년 퇴직으로 직업을 관둔 사람을 대상으로 직업 만족도와 근로 기간을 조사했다.

summary(c_job_occupation)

ggplot(retire_4, aes(x = workperiod, y = job_occupation)) + geom_point() + labs(x = “Period”, y = “Job Occupation”) + ggtitle(“Scatter Plot of Period vs Job Occupation”)

정년 퇴직한 사람의 근로 기간과 직업 만족도를 산점도로 표현했다. 구직 기간의 공통점은 찾기 어려웠고 만족도는 최소 3.0으로 나타났다.

not_retire_4 <- medical_r[medical_r$retire != 4, ]

not_retire_4

정년 퇴직을 하지 않은 사람을 대상으로 위의 과정을 반복했으며 각각의 평균을 막대그래프로 비교하고자 한다.

mean_workperiod_retire_4 <- mean(retire_4\(workperiod) mean_workperiod_not_retire_4 <- mean(not_retire_4\)workperiod)

compare_means <- data.frame( group = c(“Retire 4”, “Not Retire 4”), mean_workperiod = c(mean_workperiod_retire_4, mean_workperiod_not_retire_4) )

ggplot(compare_means, aes(x = group, y = mean_workperiod, fill = group)) + geom_bar(stat = “identity”, position = “dodge”) + labs(x = “Retire Status”, y = “Mean Work Period”, title = “Comparison of Mean workperiod between Retire 4 and Not Retire 4”) + theme_minimal()

정년 퇴직을 한 사람의 평균 근로 기간이 그렇지 않은 사람에 비해 짧은 것을 확인할 수 있다.

not_retire_4_clean <- na.omit(not_retire_4$job_occupation)

mean_job_occupation_retire_4 <- mean(retire_4$job_occupation) mean_job_occupation_not_retire_4 <- mean(not_retire_4_clean)

compare_meansop <- data.frame( group = c(“Retire 4”, “Not Retire 4”), mean_job_occupation = c(mean_job_occupation_retire_4, mean_job_occupation_not_retire_4) )

ggplot(compare_meansop, aes(x = group, y = mean_job_occupation, fill = group)) + geom_bar(stat = “identity”) + labs(x = “Retire Status”, y = “Mean Job Occupation”, title = “Comparison of Mean Job Occupation between Retire 4 and Not Retire 4”) + theme_minimal()

근로기간과는 반대로 직업 만족도는 정년 퇴직을 한 사람이 그렇지 않은 사람에 비해 높은 것을 확인 할 수 있다.

분석 결과

연구 이전 예상했던 요인 중 직업 만족도를 제외한 나머지 요소는 유의미한 결과를 제공하는데 실패했다. 앞서 나온 결과를 종합하면 의료 분야 직업에 대한 선호도는 높은데에 반해 기대 임금과 근로 기간에선 인과 관계를 찾기 힘들었기 때문에 ‘정년이 긴 직업을 선호한다’, ‘고수익 직종을 선호한다’ 라는 가설을 만족하지 못했다. 정년 퇴직의 직업 만족도가 높은 것을 통해 정년을 마치고 그만 두는 것이 긍정적인 영향을 제공하는 것을 알 수 있었다. 결과적으로 고수익, 긴 근로 기간보다 안정적인 직장에 대한 선호가 의대 쏠람 현상에 영향을 준다고 볼 수 있다. 따라서 이러한 현상의 해결을 위해서는 의료 분야의 직업 뿐 아니라 다른 분야의 정년 보장이 필요하다는 것을 알 수 있었다.