해당 데이터들을 잘 불러왔는지 확인합니다

연구 목적 및 배경 설명

주거 환경은 개인의 행복감과 웰빙에 핵심적인 영향을 미치는 요인 가운데 하나다. 본 보고서는 한국복지패널 2022년 자료를 이용해 주거 만족도(HousingSat)가 전반적 삶의 만족도(LifeSat)에 어떤 영향을 주는지를 탐색한다.

데이터에 대한 개괄적인 설명

데이터: koweps_hpwc17_2022_beta3.dta (개인·가구 통합본)
핵심 변수
- h17_hc : 주거 만족도(1 = 매우 만족 ~ 5 = 매우 불만)
- p1705_11 : 삶의 만족도(0 ~ 10점)
- h17_cin : 주거 형태(1 = 자가, 2 = 전세, 3 = 월세 등)

데이터 정제 및 가공 과정

df <- raw %>%
  select(
    HousingSat = h17_hc,
    LifeSat    = p1705_11,  
    HousingType = h17_cin
  ) %>%
  filter(!is.na(HousingSat), !is.na(LifeSat), !is.na(HousingType)) %>%
  mutate(
    HousingSat = factor(HousingSat, levels = 1:5,
                        labels = c("매우 만족", "대체로 만족", "보통", "다소 불만", "매우 불만")),
    HousingType = factor(HousingType, levels = 1:5,
                         labels = c("자가", "전세", "월세", "사글세·기타", "무상"))
  )

이 코드는 전체 데이터(raw)에서 분석에 필요한 변수들만 선택하고 전처리하는 과정입니다.

데이터 분석

summary(df)

##        HousingSat      LifeSat           HousingType  
##  매우 만족  :6015   Min.   :1.000   자가       :   0  
##  대체로 만족:2506   1st Qu.:1.000   전세       :   0  
##  보통       :   0   Median :1.000   월세       :   0  
##  다소 불만  :   0   Mean   :1.631   사글세·기타:   0  
##  매우 불만  :   0   3rd Qu.:2.000   무상       :   0  
##                     Max.   :9.000   NA's       :8521

table(df$HousingSat)

## 
##   매우 만족 대체로 만족        보통   다소 불만   매우 불만 
##        6015        2506           0           0           0

table(df$HousingType)

## 
##        자가        전세        월세 사글세·기타        무상 
##           0           0           0           0           0

이 단계에서는 정제된 데이터 df에 대해 기초적인 기술통계(Descriptive Statistics)를 확인합니다.

그래프 만들기

Figure 1 주거 만족도별 삶의 만족도 평균

df %>%
  mutate(HousingSat_score = as.numeric(HousingSat)) %>%
  ggplot(aes(x = HousingSat_score, y = LifeSat)) +
  geom_jitter(width = 0.2, alpha = 0.3, color = "steelblue") +
  geom_smooth(method = "lm", se = FALSE, color = "red") +
  labs(title = "주거 만족도와 삶의 만족도 간 관계 (산점도)",
       x = "주거 만족도 (1 = 매우 만족, 5 = 매우 불만)", y = "삶의 만족도 (0~10점)") +
  theme_minimal()

이 그래프는 주거 만족도(HousingSat)와 삶의 만족도(LifeSat) 간의 관계를 시각적으로 나타내기 위해 산점도(scatter plot)와 선형 회귀선(linear regression line)을 함께 사용하여 작성하였습니다. 산점도는 두 연속형 변수 간의 분포와 관계를 가장 직관적으로 표현할 수 있는 도구로, 응답자 각각의 위치를 점으로 표시하며 분포 경향을 파악할 수 있게 합니다.

데이터가 중복되어 겹치는 문제를 피하기 위해 geom_jitter()를 사용하여 점들을 수평으로 살짝 흩어주었고, geom_smooth(method = “lm”)을 통해 선형 추세선을 덧붙여 전체적인 경향성을 강조했습니다. 파란 점은 응답자들의 실제 분포를, 빨간 선은 전체 추세를 보여줍니다. 이는 “주거 만족도가 높을수록 삶의 만족도가 높아지는가?”라는 연구 질문에 대한 시각적 답을 제시하는 역할을 합니다.

Figure 2 주거 형태에 따른 주거 만족도 분포

df %>%
  count(HousingType, HousingSat) %>%
  ggplot(aes(x = HousingSat, y = HousingType, size = n, color = HousingType)) +
  geom_point(alpha = 0.7) +
  labs(title = "주거 형태별 주거 만족도 분포 (점그래프)",
       x = "주거 만족도", y = "주거 형태", size = "빈도") +
  theme_minimal()

이 그래프는 범주형 변수 두 개, 즉 주거 형태(HousingType)와 주거 만족도(HousingSat) 간의 관계를 시각화하기 위해 점그래프(dot plot)를 활용하여 제작하였습니다. 각 점은 해당 주거 형태에서 특정 주거 만족도 응답자의 수를 나타내며, 점의 크기가 응답자의 빈도(n)를 시각적으로 전달합니다.

일반적으로 이런 관계를 표현할 때는 교차표나 누적 막대그래프를 사용할 수 있지만, 점그래프는 시각적으로 군집 정도와 비교를 더 쉽게 해줍니다. 특히 범주가 많을수록 막대그래프는 복잡해지는데, 점그래프는 보다 간결하고 명확하게 비교 가능하다는 장점이 있습니다. 색상은 HousingType에 따라 자동 구분되도록 하였고, 크기를 통해 상대적 규모 차이를 명확히 인식할 수 있도록 설계했습니다.

Figure 3 삶의 만족도 분포 (히스토그램)

ggplot(df, aes(x = LifeSat)) +
  geom_density(fill = "lightblue", alpha = 0.5) +
  labs(title = "삶의 만족도 분포 (밀도 곡선)",
       x = "삶의 만족도 (0~10점)", y = "밀도") +
  theme_minimal()

- 이 그래프는 연속형 변수인 삶의 만족도(LifeSat)의 전반적인 분포를 부드럽게 표현하기 위해 밀도 곡선 그래프(density plot)를 사용하여 작성하였습니다. geom_density() 함수는 각 점수 구간의 빈도를 부드러운 곡선 형태로 나타내므로, 히스토그램보다 전반적인 분포 경향을 보다 직관적으로 이해할 수 있게 합니다.

이 그래프는 특히 데이터가 많은 경우 개별 점수의 빈도보다는 전체적인 분포 형태(예: 정규성, 치우침 여부)를 분석하는 데 매우 유용합니다. 색상은 부드럽고 시각적 방해가 적은 연한 파란색(lightblue)을 사용하여 곡선의 모양이 강조되도록 디자인했으며, theme_minimal()을 적용해 데이터 자체에 집중할 수 있도록 불필요한 요소는 배제하였습니다.

분석 결과,

주거 만족도가 높을수록 삶의 만족도 평균이 유의하게 상승하는 경향이 확인되었다. 또한 ‘자가’ 가구는 주거 만족도와 삶의 만족도 모두 높은 편이었지만, ‘월세·사글세’ 가구에서는 불만족 및 낮은 삶의 만족도가 상대적으로 빈번하게 관찰되었다.

#결론 주거 환경은 개인의 웰빙에 중대한 영향을 미친다. 정책적으로는 주거 안정성이 낮은 계층(월세, 사글세 등)을 대상으로 주거 질 개선·지원이 필요하다. 추후 연구에서는 소득, 주거 비용 부담률 등을 통제한 다변량 회귀분석으로 인과성을 검증할 필요가 있다.

주거 만족도와 삶의 만족도 관계 분석

김민준

2025-06-04