title: “주관적 건강 인식과 삶의 만족도 분석” author: “이건희” date: “2025-06-16” output: html_document ———————-
현대사회에서 삶의 질은 단순한 경제적 조건을 넘어 정신적·신체적 건강, 사회적 관계 등 다양한 요소에 의해 결정된다. 그 중에서도 ’건강’은 핵심적인 삶의 조건으로, 개인이 인식하는 주관적 건강감은 삶의 만족도에 중요한 영향을 미친다.
고령화가 진행 중인 한국 사회에서 ’건강한 삶’에 대한 관심이 높아지고 있으나, 기존 연구는 주로 객관적 건강지표에 집중했다. 본 연구는 주관적 건강 인식이 삶의 만족도에 미치는 영향을 분석하여 정책적 시사점을 제공하고자 한다.
본 보고서는 한국복지패널조사 2020년 데이터를 활용하여 다음 질문을 다룬다:
본 연구에 사용된 한국복지패널조사(KOWEPS) 2020년 제15차 개인 데이터는 한국보건사회연구원 및 서울대 사회복지연구소에서 제공한다.
# SPSS 파일 경로를 작업 폴더에 맞게 지정하세요
raw <- read_sav("Koweps_p15_2020_beta5.sav")
# 필수 변수 선택 및 이름 변경
# p1501_1: 주관적 건강 인식, p1501_2: 삶의 만족도, p1502_8aq1: 월평균 근로소득
df <- raw %>%
select(p1501_1, p1501_2, p1502_8aq1) %>%
rename(
health = p1501_1,
lifesat = p1501_2,
income = p1502_8aq1
) %>%
filter(!is.na(health) & !is.na(lifesat))
| 새 변수명 | 원 변수명 | 설명 |
|---|---|---|
| health | p1501_1 | 주관적 건강 인식 (1: 매우 나쁨 ~ 5: 매우 좋음) |
| lifesat | p1501_2 | 삶의 전반적 만족도 (0~10점) |
| income | p1502_8aq1 | 월평균 근로소득 (단위: 만원) |
ggplot(df, aes(x = factor(health), y = lifesat)) +
geom_boxplot(fill = "lightgreen") +
labs(
x = "주관적 건강 인식",
y = "삶의 만족도",
title = "건강 수준별 삶의 만족도 분포"
)
건강 인식을 긍정적으로 할수록 삶의 만족도가 높아지는 경향을 볼 수 있다. 특히 5점(매우 좋음) 그룹의 중앙값이 뚜렷이 높게 나타난다.
# 소득 4분위 구간별 평균 삶의 만족도 계산
df_summary <- df %>%
mutate(income_group = ntile(income, 4)) %>%
group_by(income_group) %>%
summarize(mean_lifesat = mean(lifesat, na.rm = TRUE))
# 막대그래프 그리기
ggplot(df_summary, aes(x = factor(income_group), y = mean_lifesat)) +
geom_col(fill = "skyblue") +
labs(
x = "소득 4분위 그룹",
y = "평균 삶의 만족도",
title = "소득 수준별 평균 삶의 만족도"
)
소득 상위 그룹으로 갈수록 평균 삶의 만족도가 증가하는 경향을 확인할 수 있다.
ggplot(df, aes(x = health, y = lifesat)) +
geom_point(alpha = 0.3) +
geom_smooth(method = "lm", se = FALSE, color = "blue") +
labs(
x = "주관적 건강 인식",
y = "삶의 만족도",
title = "건강 인식과 삶의 만족도 회귀선"
)
health와 lifesat 간에는 뚜렷한 양의
상관관계가 있음을 보여준다.
삶의 만족도(lifesat)를 종속 변수로, 주관적 건강 인식(health)과 소득(income)을 독립 변수로 하는 단순 선형 회귀 모형을 구성한다.
model <- lm(lifesat ~ health + income, data = df)
summary(model)
##
## Call:
## lm(formula = lifesat ~ health + income, data = df)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.0677 -0.2149 -0.1030 0.0130 5.0088
##
## Coefficients: (1 not defined because of singularities)
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 0.9492422 0.0438770 21.634 < 2e-16 ***
## health NA NA NA NA
## income 0.0013981 0.0002268 6.164 1.42e-09 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.6801 on 519 degrees of freedom
## (결측으로 인하여 1692개의 관측치가 삭제되었습니다.)
## Multiple R-squared: 0.06822, Adjusted R-squared: 0.06643
## F-statistic: 38 on 1 and 519 DF, p-value: 1.423e-09