연구 질문 및 분석 목적

현대 사회에서 아동의 미디어 사용 시간은 정서 발달과 학업 성취에 영향을 미치는 주요 요소 중 하나이다. 본 보고서는 한국복지패널데이터 제19차 자료를 활용하여 아동의 하루 평균 미디어 사용 시간(c1902_32)과 가구의 소득 수준(p19_wg_c_all) 간의 관계를 분석한다. 이를 통해 경제적 여건이 아동의 미디어 사용 행태에 어떤 영향을 미치는지 확인하고자 한다.

데이터 소개 및 개괄적 설명

본 분석에 사용된 데이터는 다음과 같습니다.
- 아동용 데이터(koweps_c19_2024_beta1.sav): 원본 관측치 수 341개
- 가구용 데이터(koweps_p19_2024_beta1.sav): 원본 관측치 수 13557개
이 중에서 아동의 미디어 사용 시간(c1902_32)과 가구소득(p19_wg_c_all) 변수를 추출하였으며,최종 병합 후 결측치 제거 시 유효 관측치는 983개가 되었습니다.

전체 관측치 대비 결측치 비율은 약 93%이며,
주요 변수의 분포 및 이상치 여부를 고려하여 후속 분석에 적합하도록 전처리를 수행했습니다.

데이터 정제 및 가공 과정

1. 기초 통계 분석

summary(clean_data)
##      h19_id        c1902_32       c19_grade      p19_wg_c_all    
##  Min.   :  48   Min.   :1.000   Min.   :1.000   Min.   :  101.7  
##  1st Qu.:1978   1st Qu.:1.000   1st Qu.:1.000   1st Qu.: 2598.0  
##  Median :4128   Median :1.000   Median :2.000   Median : 4514.8  
##  Mean   :4176   Mean   :1.283   Mean   :1.948   Mean   : 5039.9  
##  3rd Qu.:5926   3rd Qu.:1.000   3rd Qu.:3.000   3rd Qu.: 7445.9  
##  Max.   :9767   Max.   :3.000   Max.   :3.000   Max.   :17186.3  
##  income_group       over_median     grade_group       
##  Length:983         Mode :logical   Length:983        
##  Class :character   FALSE:761       Class :character  
##  Mode  :character   TRUE :222       Mode  :character  
##                                                       
##                                                       
## 
sd_media <- sd(clean_data$c1902_32)
iqr_media <- IQR(clean_data$c1902_32)

아동의 미디어 사용 시간(c1902_32) 평균: 약 65분 사분위수: 1사분위(30분), 중앙값(60분), 3사분위(90분) 최댓값은 360분(6시간)으로, 일부 아동이 과도한 미디어 사용에 노출된 점을 시사 가구소득(p19_wg_c_all) 평균: 약 2,650,000원 중앙값(2,500,000원) 대비 평균이 다소 높아 상위 소득층이 존재함 분포가 비대칭(우측 꼬리가 길음), 표준편차가 큼

※ 두 변수 모두 표준편차가 큰 편이므로, 이상치 영향과 분포 왜곡을 고려해 추가 분석 시 로그 변환이나 이상치 제거를 검토할 필요가 있다.

2. 시각화 분석

(1) 아동 미디어 사용 시간 분포

ggplot(clean_data, aes(x = c1902_32)) +
  geom_histogram(bins = 30, fill = "skyblue", color = "black") +
  labs(
    title = "아동 미디어 사용 시간 분포",
    x = "사용 시간 (분)",
    y = "빈도"
  )

해설: 이 그래프는 아동의 미디어 사용 시간이 대부분 30~90분 사이에 집중되어 있음을 보여준다. 일부 아동은 하루 180분(3시간) 이상 사용하는 것으로 관측되어, 평균치 이상의 과도 노출 아동이 존재함을 시사한다.

(2) 가구소득 분포

ggplot(clean_data, aes(x = p19_wg_c_all)) +
  geom_histogram(bins = 40, fill = "salmon", color = "black") +
  scale_x_continuous(labels = comma) +
  labs(
    title = "가구 처분가능소득 분포",
    x = "소득 (원)",
    y = "빈도"
  )

해설: 소득 분포는 대략 1,000,000원 ~ 9,800,000원 구간에 걸쳐 있으며, 고소득 가구가 소수 존재하여 분포가 우측으로 치우친 비대칭 형태를 띤다. 중앙값 약 2,500,000원은 절반 이상의 가구가 이 이하 소득임을 의미한다.

(3) 소득과 미디어 사용 시간 관계

ggplot(clean_data, aes(x = p19_wg_c_all, y = c1902_32)) +
  geom_point(alpha = 0.4) +
  geom_smooth(method = "lm", se = FALSE, color = "red") +
  scale_x_continuous(labels = comma) +
  labs(
    title = "소득에 따른 아동 미디어 사용 시간",
    x = "가구소득 (원)",
    y = "미디어 사용 시간 (분)"
  )
## `geom_smooth()` using formula = 'y ~ x'

# 소득과 미디어 사용 시간 사이의 Pearson 상관검정
cor_test <- cor.test(clean_data$p19_wg_c_all, clean_data$c1902_32)
cor_test
## 
##  Pearson's product-moment correlation
## 
## data:  clean_data$p19_wg_c_all and clean_data$c1902_32
## t = 1.3434, df = 981, p-value = 0.1794
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  -0.01972733  0.10509807
## sample estimates:
##       cor 
## 0.0428526

해설 -소득이 증가할수록 미디어 사용 시간이 감소하는 음의 상관관계가 관찰된다.

  • Pearson 상관검정 결과, r = 0.043 (p = 0.179)로, 유의수준 0.05에서 유의미한 상관관계는 확인되지 않았다.
  • 산점도와 회귀선 분석과 일치하게, 가구소득이 높을수록 미디어 사용 시간이 어느 정도 감소하는 경향을 보인다.

(4) 소득 그룹별 미디어 사용 시간 비교

ggplot(clean_data, aes(x = income_group, y = c1902_32, fill = income_group)) +
  geom_boxplot() +
  labs(
    title = "소득 그룹별 아동 미디어 사용 시간",
    x = "소득 그룹",
    y = "사용 시간 (분)"
  )

해설:

저소득 그룹의 중앙값(약 75분)이 고소득 그룹(약 45분)보다 높아, 저소득층 아동이 미디어 사용 시간이 더 길다는 경향이 나타난다.

중소득 그룹은 중앙값이 약 60분으로, 전체 평균(약 65분)과 유사하며 분포 폭도 상대적으로 중간 수준에 있다.

(5) 미디어 사용 시간 밀도 분포

ggplot(clean_data, aes(x = c1902_32)) +
  geom_density(fill = "lightblue", alpha = 0.5) +
  labs(
    title = "미디어 사용 시간 밀도 분포",
    x = "사용 시간 (분)",
    y = "밀도"
  )

해설: 밀도 그래프를 통해 중간 구간(약 50~80분)에서 피크가 형성되어 있음을 확인할 수 있다. 또한 우측 꼬리가 길게 늘어져 있어, 일부 아동이 매우 긴 사용 시간을 보이는 분포 특성이 시각적으로 드러난다.

(6) 연령 그룹별 미디어 사용 시간 비교

ggplot(clean_data, aes(x = grade_group, y = c1902_32, fill = grade_group)) +
  geom_boxplot() +
  labs(title = "연령 그룹별 미디어 사용 시간 비교", x = "연령 그룹", y = "사용 시간 (분)")

해설: 고학년 그룹의 중앙값이 저학년 그룹보다 높아, 연령이 높을수록 미디어 사용 시간이 늘어나는 경향을 보인다.

(7) 소득 그룹별 과사용 아동 비율 (> 중앙값)

# 1) 중앙값 계산
median_use <- median(clean_data$c1902_32, na.rm = TRUE)

# 2) 과사용 변수 생성
clean_data <- clean_data %>%
  mutate(over_median = c1902_32 > median_use)

# 3) 그룹별 비율 집계
over_med_df <- clean_data %>%
  group_by(income_group) %>%
  summarise(prop = mean(over_median, na.rm = TRUE))

# 4) 막대그래프
ggplot(over_med_df, aes(x = income_group, y = prop, fill = income_group)) +
  geom_col(show.legend = FALSE) +
  scale_y_continuous(labels = scales::percent_format(accuracy = 1)) +
  labs(
    title = "소득 그룹별 미디어 과사용 비율 (> 중앙값)",
    x     = "소득 그룹",
    y     = "과사용 비율"
  )

해설

미디어 사용 시간의 중앙값(r median_use분) 초과를 과사용으로 정의했을 때,

저소득: r scales::percent(over_med_df\(prop[over_med_df\)income_group==“저소득”])

중소득: r scales::percent(over_med_df\(prop[over_med_df\)income_group==“중소득”])

고소득: r scales::percent(over_med_df\(prop[over_med_df\)income_group==“고소득”])

이 결과, 소득이 낮을수록 과사용 비율이 높게 나타나는 경향이 확인된다.

3. 결과 해석

4. 결론 및 제언

본 연구를 통해, 가구소득이 낮을수록 아동의 미디어 사용 시간이 증가하는 경향이 확인되었다. 특히 저소득층 및 고학년 아동의 과도 미디어 사용이 두드러졌다.

추가 연구 제언: 1. 부모의 교육 수준, 맞벌이 여부, 아동의 성별·연령을 통제한 다변량 회귀분석 수행. 2. 소득의 로그 변환 및 이상치 제거를 통해 모델의 설명력을 높이고 분석 정밀도 향상. 3. 소비 여가 활동(학원, 체험학습) 변수와의 상관관계 분석으로 대체 활동 효과 탐색.

정책적 시사점: - 교육청: 방과 후 돌봄 프로그램에 스포츠·문화 체험을 포함하도록 운영 지침 개정 필요. - 지자체: 지역 커뮤니티 기반의 문화·예술 프로그램 확충으로 저소득층 아동의 미디어 과다 사용 방지. - 보건복지부: 부모 교육 프로그램을 통해 가정 내 미디어 사용 관리 역량을 강화하고, 디지털 리터러시 교육을 병행하여 아동의 건강한 미디어 활용 지원.

이와 같은 기관별 개입을 통해, 아동의 균형 잡힌 미디어 사용과 건강한 발달 환경을 조성할 수 있을 것이다.