본 보고서는 한국보건사회연구원에서 제공하는 <한국복지패널데이터>를 활용하여 출생년도, 교육 수준, 그리고 종교 신앙 유무 간의 관계를 분석하는 것을 목적으로 한다. 이 세 변수는 개인의 사회적 배경과 생활양식, 가치관 형성에 중요한 영향을 미치며, 이들의 상호작용을 이해하는 것은 현대 한국 사회의 다양한 사회문화적 현상을 설명하는 데 필수적이다. 특히, 출생년도에 따른 세대별 특징은 교육 기회와 사회 환경의 변화를 반영하며, 교육 수준은 개인의 사회경제적 지위를 나타내는 중요한 지표이다. 또한, 종교 신앙은 개인의 삶의 태도와 공동체 참여에 깊은 영향을 미치는 요인으로 알려져 있다. 따라서 본 분석을 통해 세 변수 간의 상관관계를 탐구함으로써 세대 변화에 따른 교육과 종교 신앙의 변화를 파악하고, 이를 통해 한국 사회 내 사회적 다양성과 통합의 이해를 증진시키고자 한다.
한국복지패널데이터(Korea Welfare Panel Study, KOWEPS)는 한국보건사회연구원이 매년 수집 및 제공하는 대표적인 종단 패널 조사 데이터이다. 이 데이터는 한국 내 가구와 개인의 경제적, 사회적, 건강 및 복지 관련 다양한 변수를 포함하며, 사회 전반의 복지 수준과 변화 양상을 분석하는 데 매우 유용하다. 저는 태어난 연도, 교육 수준, 종교 세 가지 변수 간의 상호 관계를 중심으로 분석할 예정입니다.구체적으로 교육 수준이 신앙 여부에 미치는 영향, 연령과 신앙의 관계, 그리고 서로 다른 학력별 출생 연도 분포 세 가지 측면에서 분석을 진행할 것입니다.
#install.packages("foreign") # foreign 패키지 설치
library(foreign) # SPSS 파일 로드
library(dplyr) # 전처리
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(ggplot2) # 시각화
library(readxl) # 엑셀 파일 불러오기
# 데이터 불러오기
raw_welfare <- read.spss(file = "Koweps_h10_2015_beta10.sav",
to.data.frame = T)
## Warning in read.spss(file = "Koweps_h10_2015_beta10.sav", to.data.frame = T):
## Koweps_h10_2015_beta10.sav: Compression bias (0) is not the usual value of 100
## Warning in read.spss(file = "Koweps_h10_2015_beta10.sav", to.data.frame = T):
## Koweps_h10_2015_beta10.sav: Very long string record(s) found (record type 7,
## subtype 14), each will be imported in consecutive separate variables
# 복사본 만들기
welfare <- raw_welfare
welfare <- welfare %>% select(birth = h1001_5, # 태어난 연도
religion = h1001_12, # 종교
education_level = h1001_6) # 교육 수준
class(welfare$education_level)
## [1] "numeric"
table(welfare$education_level)
##
## 2 3 4 5 6 7 8 9
## 790 1608 929 1903 450 1046 163 25
class(welfare$religion)
## [1] "numeric"
table(welfare$religion)
##
## 1 2
## 3422 3492
교육수준 분류코드 목록 불러오기
library(readxl)
list_education <- read_excel("Koweps_Codebook.xlsx", col_names = T, sheet = 2)
list_education
## # A tibble: 9 × 2
## code_education education
## <dbl> <chr>
## 1 1 미취학(만7세미만)
## 2 2 무학(만7세이상)
## 3 3 초등학교
## 4 4 중학교
## 5 5 고등학교
## 6 6 전문대학
## 7 7 대학교
## 8 8 대학원(석사)
## 9 9 대학원(박사)
종교 유무 분류코드 목록 불러오기
welfare$religion <- ifelse(welfare$religion == 1, "yes", "no")
table(welfare$religion)
##
## no yes
## 3492 3422
qplot(welfare$religion)
## Warning: `qplot()` was deprecated in ggplot2 3.4.0.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
이 그래프는 교육 수준에 따른 종교 신앙 유무 비율을 보여줍니다. x축은 교육 수준을 나타내며, 각 교육 수준별로 종교를 믿는 사람과 믿지 않는 사람의 비율이 색상으로 구분되어 있습니다.position = “fill” 옵션을 사용해 각 교육 수준 내에서 종교 신앙 비율이 100%로 맞춰져, 상대적인 비율 차이를 쉽게 비교할 수 있습니다. 그래프를 통해 교육 수준에 따라 종교 신앙 비율에 차이가 있음을 알 수 있습니다. 예를 들어, 일부 교육 수준에서는 신앙을 가진 비율이 높고, 다른 교육 수준에서는 비신앙 비율이 더 높은 경향을 보입니다. 이는 교육 수준과 종교 신앙 간에 일정한 관련성이 있을 가능성을 시사하며, 사회문화적 배경을 이해하는 데 중요한 단서를 제공합니다.
ggplot(welfare %>% filter(!is.na(religion), !is.na(education_level)),
aes(x = education_level, fill = religion)) +
geom_bar(position = "fill") +
labs(title = "교육 수준에 따른 종교 유무 비율",
x = "교육 수준",
y = "비율",
fill = "종교 유무") +
scale_y_continuous(labels = scales::percent) +
theme_minimal()
이 그래프는 태어난 연도별 종교 신앙 비율 변화를 나타냅니다. 데이터는 종교 신앙 여부가 결측치가 아닌 관측치만 사용했으며, 종교가 있는 경우를 1, 없는 경우를 0으로 표시하여 종교 신앙 비율을 계산했습니다. 각 태어난 연도별로 종교 신앙 비율(즉, 해당 연도에 태어난 사람 중 종교를 가진 사람의 평균 비율)을 산출했습니다.x축은 태어난 연도, y축은 해당 연도 출생자의 종교 신앙 비율을 나타내며, 파란색 선과 점으로 변화를 시각화했습니다. 그래프에서 태어난 연도에 따른 종교 신앙 비율의 증감 추세를 확인할 수 있으며, 이를 통해 특정 세대별로 종교 신앙 경향이 어떻게 변화했는지 파악할 수 있습니다.예를 들어, 특정 연도 구간에서는 신앙 비율이 높거나 낮은 패턴이 나타날 수 있어 사회문화적 요인의 변화를 반영할 수 있습니다.
welfare %>%
filter(!is.na(religion), !is.na(birth)) %>%
mutate(religion_flag = ifelse(religion == "yes", 1, 0)) %>%
group_by(birth) %>%
summarise(religion_rate = mean(religion_flag)) %>%
ggplot(aes(x = birth, y = religion_rate)) +
geom_line(color = "blue") +
geom_point(color = "blue") +
labs(title = "태어난 연도별 종교 신앙 비율 변화",
x = "태어난 연도",
y = "종교 신앙 비율 (0~1)") +
theme_minimal()
이 그래프는 태어난 연도 구간별 교육 수준 분포를 보여줍니다. 먼저 태어난 연도를 10년 단위로 구간을 나누어 각 사람의 태어난 연도를 해당 구간에 할당했습니다.x축은 10년 단위 태어난 연도 구간(각 구간의 시작 연도), y축은 교육 수준을 나타냅니다.각 구간별로 교육 수준의 분포를 박스플롯(boxplot)으로 시각화하여 중앙값, 사분위수, 그리고 이상치를 확인할 수 있습니다. 이 그래프를 통해 세대별 교육 수준 차이와 추세를 한눈에 파악할 수 있으며, 일반적으로 시간이 지날수록 교육 수준이 높아지는 경향을 관찰할 수 있습니다.
library(stringr)
breaks_vec <- seq(1914, 2014, by = 10)
labels_vec <- breaks_vec[-length(breaks_vec)]
welfare %>%
filter(!is.na(education_level), !is.na(birth)) %>%
mutate(birth_year_group = cut(birth, breaks = breaks_vec, labels = labels_vec)) %>%
ggplot(aes(x = birth_year_group, y = education_level)) +
geom_boxplot(fill = "skyblue") +
labs(title = "태어난 연도별 교육 수준 분포",
x = "태어난 연도 구간 (시작 연도)",
y = "교육 수준") +
theme_minimal()
출생 연도를 10년 단위로 그룹화하여 각 그룹별 교육 수준 분포를 분석한 결과, 출생 연도가 이후로 갈수록 교육 수준이 전반적으로 향상되는 경향을 확인할 수 있었다. 젊은 세대일수록 고등 교육을 받은 비율이 높아, 한국 교육 보급과 교육 제도의 발전 역사를 반영한다.그룹별 막대그래프(dodge 위치)를 활용하여 교육 수준별로 신앙 여부 비율을 나타낸 결과, 교육 수준이 종교 신앙에 일정한 영향을 미치는 것으로 나타났다. 일반적으로 교육 수준이 높은 집단에서 종교 신앙 비율에 차이가 존재하여, 교육 배경과 종교 신앙 태도 간의 복잡한 연관성을 보여준다.출생 연도별 신앙 비율을 선 그래프로 분석하여, 각 세대별 종교 신앙의 변화를 관찰한 결과, 세대 간 종교 신앙 비율에 뚜렷한 차이가 있음을 확인하였다. 이는 사회·문화적 환경과 가치관이 시간의 흐름에 따라 변화한 영향을 반영한다. 출생 연도별 교육 수준 분포를 분석한 결과, 젊은 세대로 갈수록 교육 수준이 향상되는 경향이 나타났으며, 이는 한국 교육 제도의 발전을 반영합니다. 교육 수준에 따른 종교 신앙 비율 분석에서는 교육 배경이 종교 신앙에 영향을 미치는 것으로 나타났습니다. 또한 출생 연도별 종교 신앙 변화 추이를 살펴본 결과, 세대별로 종교 신앙 비율에 차이가 있어 사회적, 문화적 변화가 반영됨을 알 수 있었습니다. 이러한 분석은 한국 사회의 세대 간 교육과 종교 신앙의 특성을 이해하는 데 중요한 시사점을 제공합니다.