몇 년 전 인터넷에서 ’똑같이 울더라도 벤치에서 우는 것보다 벤츠에서 우는 것이 더 낫다.’라는 말이 화제였던 적이 있습니다. 과연 실제로도 그러할까요? 본 연구는 이 사소한 의문에서 시작되었으며, 저의 핵심 질문은 다음과 같습니다.
“소득 수준은 개인의 정신 건강에 어떤 영향을 미치는가? 소득 수준이 낮을수록 정신 건강에 부정적 영향이, 소득 수준이 높을수록 정신 건강에 긍정적 영향이 있을까?”
정신 건강은 개인의 삶의 질, 사회적 기능, 경제적 생산성에 직결되는
중요한 건강 영역으로, 최근 들어 사회적 관심이 높아지고 있습니다. 특히
사회경제적 지위와 정신 건강 간의 관계는 다수의 선행 연구에서 반복적으로
제기되어 왔으며, 소득 수준은 그 중심에 위치하는 대표적인 변수 중
하나입니다. 따라서 본 연구에서는 소득 격차가 단순히 물질적 불평등에
그치지 않고, 심리적·정서적 불균형으로 이어질 수 있는지를 실증적으로
검토하고자 합니다. 정확히는, 소득이 낮은 계층일수록 가정생활에서 더 큰
스트레스를 느끼거나, 우울감을 더 자주 경험할 가능성이 있는가를
확인하고자 합니다.
분석에 사용된 데이터는 한국보건사회연구원과 서울대학교 사회복지연구소가 공동으로 수행한 「2024년 제19차 한국복지패널조사」입니다. 이 패널조사는 2006년부터 매년 실시되며, 전국 약 7,000여 가구를 대상으로 소득, 고용, 건강, 교육, 가족관계, 주거환경 등 복지 관련 변수를 종합적으로 수집합니다.
파일 형식은 .sav (SPSS 포맷)이며, 각 항목은 가구 정보, 개인 정보, 소득 및 건강 정보 등으로 구성되어 있습니다. 해당 보고서에서는 개인 파일 중 p1902_8aq1(월평균 임금), p1904_3aq6(가정 스트레스), p1905_11(우울감)을 분석 대상으로 선택했습니다.
데이터는 정형화된 설문 응답 데이터로, 대부분 범주형 또는 리커트
척도로 구성되어 있으며, 응답 누락 및 이상치가 존재하기 때문에 전처리가
필요합니다.
데이터는 haven 패키지를 통해 .sav 파일을 R로 불러온 후, 아래와 같은
과정을 거쳐 정제하였습니다.
1. 불필요한 변수 제거 및
필요한 변수 선택
분석에 필요한 주요 변수는 p1902_8aq1(개인의 월평균 임금 소득), p1904_3aq6(가정생활로부터 받은 스트레스), p1905_11(우울감 정도)입니다.
# 데이터 불러오기
data <- read_sav("koweps_hpc19_2024_beta1.sav")
# 주요 변수 선택 및 이름 재정의
df <- data %>%
select(
income = p1902_8aq1, # 월평균 임금
home_stress = p1904_3aq6, # 스트레스
depression = p1905_11 # 우울감
)
2. 소득 변수의 결측값 및 0 이하 값
필터링
월평균 소득이 NA이거나 0 이하인 값은 분석에서 제외하였으며, 정신 건강 관련 지표(home_stress, depression)도 결측치 제거 처리하였습니다.
df <- df %>%
filter(!is.na(income), income > 0,
!is.na(home_stress), !is.na(depression))
3. 소득을 기반으로 4단계 그룹 변수(income_group)
생성
소득은 연속형 변수이므로 분석과 시각화를 용이하게 하기 위해 “4단계 범주형 변수 income_group”로 재가공하였습니다.
기준은 다음과 같습니다.
~100만원: 저소득층
100~300만원: 중하층
300~500만원: 중상층
500만원 이상: 고소득층
Likert 척도 변수(스트레스/우울감)의 결측값 제거 및 정수형 유지
data <- read_sav("koweps_hpc19_2024_beta1.sav")
df <- data %>%
select(
income = p1902_8aq1,
home_stress = p1904_3aq6,
depression = p1905_11
) %>%
filter(!is.na(income), income > 0,
!is.na(home_stress), !is.na(depression)) %>%
mutate(
income_group = case_when(
income < 100 ~ "1. 저소득층",
income < 300 ~ "2. 중하층",
income < 500 ~ "3. 중상층",
TRUE ~ "4. 고소득층"
),
income_group = factor(income_group, levels = c("1. 저소득층", "2. 중하층", "3. 중상층", "4. 고소득층"))
)
데이터 정제 이후 총 n개의 유효한 관측값이 남았으며, 모든
변수는 분석과 시각화에 적합한 형식으로 변환하였습니다.
summary(df)
## income home_stress depression income_group
## Min. : 5.0 Min. :1.000 Min. :1.000 1. 저소득층:1042
## 1st Qu.: 140.0 1st Qu.:1.000 1st Qu.:1.000 2. 중하층 :2087
## Median : 255.0 Median :2.000 Median :1.000 3. 중상층 :1317
## Mean : 296.9 Mean :2.008 Mean :1.226 4. 고소득층: 850
## 3rd Qu.: 390.0 3rd Qu.:2.000 3rd Qu.:1.000
## Max. :2097.0 Max. :5.000 Max. :4.000
분석에는 총 3개의 주요 변수를 사용하였으며, income을 기준으로 그룹을 나누었고 스트레스와 우울감은 종속 변수로서 분석 대상이 되었습니다.
p1902_8aq1: 개인의 월평균 임금 (소득 수준을 직접적으로
반영)
p1904_3aq6: 가정생활이 스트레스 요인이 되는가 (1~5점)
(대표적인 스트레스 인식 지표)
p1905_11: 본인의 우울감 정도 (1~5점) (대표적인 우울감
수준 지표)
한편, 분석은 크게 세 가지 방향으로 진행되었습니다.
1. 소득 그룹별 스트레스 평균 비교: 막대그래프를 통해 소득 수준이 높을수록 스트레스 점수가 낮아지는 경향 확인
소득 그룹별 평균 스트레스 점수를 비교한 결과, 소득이 낮을수록 가정생활에서 스트레스를 더 많이 받는 경향이 확인되었습니다. 특히 ‘저소득층’ 그룹에서의 평균 스트레스 점수가 가장 높았고, ’고소득층’으로 갈수록 점진적으로 감소하였습니다.
이는 경제적 어려움이 가정 내 갈등, 부담, 불안감으로 연결되며, 그로
인해 스트레스 인지 수준이 높아질 수 있음을 시사합니다. 즉, 경제적 안정이
정서적 안정과 밀접한 관련이 있음을 보여줍니다.
2. 소득 그룹별 우울감 점수 분포: 지터 플롯을 통해 각 그룹 내 응답자들이 어느 점수대에 분포하는지 시각화
지터 플롯을 통해 각 소득 그룹 내에서 우울감 점수가 어떻게 분포되어 있는지를 확인한 결과, 저소득층 그룹에서는 높은 점수(4~5점)에 몰린 응답자들이 눈에 띄게 많았습니다.
반면, 고소득층 그룹에서는 우울감 점수가 1~2점에 집중되어 있었으며, 전반적으로 분산이 좁고 낮은 점수 중심으로 나타났습니다.
이는 소득 수준이 낮을수록 우울감을 경험하는 정도가 더 높고, 분산도
커져 불안정한 심리 상태가 존재할 가능성을 의미합니다.
3. 소득과 우울감 간의 관계 분석: 산점도 및 선형 회귀선을 통해 소득이 높을수록 우울감 점수가 낮아지는 음의 상관관계 확인
마지막으로, 연속형 변수인 월평균 소득과 우울감 점수 간의 상관관계를 산점도와 선형 회귀선을 통해 분석한 결과, 우울감 점수는 소득이 증가할수록 감소하는 경향을 보였습니다.
회귀선은 음의 기울기를 가지며, 이는 두 변수 간에 약한 음의 상관관계가 있음을 시사합니다. 비록 결정계수(R²)는 낮을 수 있으나, 전체적인 방향성 측면에서는 유의미한 해석 가능성을 제공합니다.
# 변수 요약
summary(df$income)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 5.0 140.0 255.0 296.9 390.0 2097.0
table(df$home_stress)
##
## 1 2 3 4 5
## 1487 2717 682 381 29
table(df$depression)
##
## 1 2 3 4
## 4303 815 152 26
df %>%
group_by(income_group) %>%
summarise(avg_stress = mean(home_stress)) %>%
ggplot(aes(x = income_group, y = avg_stress, fill = income_group)) +
geom_col(show.legend = FALSE) +
labs(title = "소득 수준별 가정 스트레스 평균", x = "소득 그룹", y = "스트레스 평균점수") +
theme_minimal()
이 그래프는 개인의 월평균 소득을 기준으로 4개 그룹(저소득층, 중하층, 중상층, 고소득층)으로 구분한 뒤, 각 소득 그룹에 속한 응답자들의 가정생활 스트레스(p1904_3aq6) 평균 점수를 group_by()와 summarise()를 통해 계산하여 geom_col()을 이용한 막대그래프로 나타낸 것입니다. 막대그래프는 집단 간 평균값의 절대 크기를 명확하게 비교할 수 있기 때문에, 이처럼 카테고리형(소득 그룹) 변수와 연속형(스트레스 점수) 변수 간 관계를 시각화할 때 가장 효과적입니다. 특히 어떤 소득 계층이 상대적으로 더 많은 스트레스를 경험하는지 한눈에 비교 가능하다는 장점이 있습니다.
ggplot(df, aes(x = income_group, y = depression, color = income_group)) +
geom_jitter(width = 0.2, alpha = 0.4) +
labs(title = "소득 그룹별 우울감 점수 분포 (Jitter Plot)", x = "소득 그룹", y = "우울감 점수") +
theme_minimal() +
theme(legend.position = "none")
이 그래프는 각 소득 그룹별로 개별 응답자의 우울감 정도(p1905_11) 점수를 하나하나 점으로 표시한 것입니다. 우울감 점수는 1~5점 리커트 척도이므로, geom_jitter()를 이용해 각 점을 수평으로 조금씩 흩어지게 시각화했습니다. 지터 플롯은 개별 응답값의 분포 양상을 시각화할 때 효과적인 도구입니다. 특히 우울감 점수처럼 이산형(1~5점) 데이터가 반복될 경우, 점이 겹쳐서 보이지 않게 되는데, 지터 플롯은 점을 수평으로 살짝 흩뿌려서 데이터의 밀집도와 분포 구조를 자연스럽게 보여줍니다. 처음에는 박스플롯을 사용하여 그래프를 제작하였으나, 뚜렷한 상자 형태가 드러나지 않아 더 직관적으로 확인할 수 있는 지터 플롯을 사용하였습니다. 그래프를 두 번 만들어본 결과 지터플롯을 활용한 그래프가 개별 데이터 하나하나를 보여주기 때문에 박스플롯보다 세밀한 비교가 가능하다는 것을 깨달았습니다.
ggplot(df, aes(x = income, y = depression)) +
geom_point(alpha = 0.3) +
geom_smooth(method = "lm", se = FALSE, color = "tomato") +
labs(title = "소득과 우울감 간의 관계", x = "월평균 소득 (만원)", y = "우울감 점수") +
theme_minimal()
## `geom_smooth()` using formula = 'y ~ x'
이 그래프는 연속형 변수인 소득(income)과 우울감 점수(depression) 간의
관계를 살펴보기 위해 산점도와 선형 회귀선을 함께 시각화한 것입니다.
산점도는 두 연속형 변수 간의 관계를 탐색하는 데 가장 기본이자 강력한
시각화 도구입니다. 여기에 회귀선을 추가하면 전반적인 경향성(상관관계의
방향과 강도)을 시각적으로 쉽게 이해할 수 있습니다. 또한 붉은색 계열의
색을 사용하면 경향성이 한눈에 잘 들어올 것 같았는데, 마침 강의 시간에
교수님께서 tomato라는 색을 사용하셨던 것이 떠올라 이름이 특이했던 tomato
색을 사용하게 되었습니다.
본 보고서에서는 한국복지패널 제19차 데이터를 활용하여, 개인의 소득 수준이 정신 건강에 미치는 영향을 실증적으로 탐색하였습니다.
분석 결과에 따르면, 소득이 낮을수록 가정 내 스트레스 인지 수준이 높았고, 우울감 점수 역시 소득이 낮을수록 평균적으로 더 높았습니다. 이와 달리 소득이 증가할수록 우울감은 줄어드는 음의 관계가 나타났습니다.
이러한 경향은 단순히 개인 차원의 문제가 아니라, 경제적 요인이 정서적 건강과 직결되는 구조적 문제임을 시사합니다. 즉, 소득 수준은 단지 물질적 풍요를 넘어서, 심리적 안정과 삶의 질을 결정짓는 중요한 사회적 지표라는 점에서 중요한 분석 대상이 됩니다.
더 나아가 정책적 관점에서는 정신 건강 복지체계를 설계할 때, 소득 취약 계층에 대한 선별적 개입 필요성을 제기하는 근거로 활용될 수 있을 것입니다.