연구 목적 및 배경 설명

인터넷 시대로의 진입은 인류에 혁신적인 변화를 불러일으켰다. 그러나 그 이면에서는 유해성에 대한 강한 경계와 함께 실증적인 연구가 끊임없이 진행되었다. 인터넷 중독, 인터넷 과의존과 같은 표현이 쏟아져 나왔고 범죄와 결합된 부정적인 인식은 사회에 익숙하게 자리 잡았다. 반면 인터넷 사용 경험이 삶에 긍정적인 영향을 미친다는 의외의 결과를 내놓는 연구들도 존재한다. 2024년 미국 심리학회 학술지 ’Technology, Mind and Behavior’에 게재된 논문 ‘A Multiverse Analysis of the Associations Between Internet Use and Well-Being’에 따르면, 인터넷 연결과 웰빙 사이에는 84.9%의 높은 긍정적 연관성이 있는 것으로 나타났다. 이처럼 상반된 연구 결과들은 인터넷이 삶에 미치는 영향력을 어느 한 쪽으로 단정 지을 수 없음을 시사한다. 여전히 유효한 사회적 질문으로서 지속적인 탐색이 필요한 주제인 것이다.

본 보고서에서는 한국복지패널 데이터를 활용하여 인터넷 사용이 삶의 만족도와 어떤 관련성을 가지는지 분석하고자 한다. 특히 관계 만족도와 자아존중감이라는 심리적 변수에 주목하여 인터넷이 개인의 관계 인식 및 자기 인식에 어떠한 영향을 미치는지를 중점적으로 살펴볼 것이다. 세대 간 디지털 격차의 영향을 고려해 연령대별로 결과를 나누어 비교하고, 만약 특정 연령층에서 부정적인 관련성이 나타날 경우 해당 집단의 구체적인 인터넷 사용 실태도 파악하고자 한다.

데이터에 대한 개괄적인 설명

분석에 사용한 데이터는 ’2024년 19차 한국복지패널조사(가구용, 가구원용, 아동용)’이다. 해당 데이터는 국내 복지 환경과 관련한 다양한 정보를 수집한 결과로서 한국보건사회연구원에서 발간하였다. 가구 일반 사항, 건강 및 의료, 경제활동 상태, 생활여건, 만족 및 의식 등의 내용으로 구성되어 있다. 가구원용은 만 15세 이상, 아동용 은 만 15세 미만을 조사 대상으로 한다. 본 연구를 위해 추출할 변수는 다음과 같다.

가구용/가구원용 조사 데이터

  • 출생년도(h1901_5): 태어난 년도의 네 자리 숫자

  • 인터넷 사용 여부(p1903_1): 1.그렇다 2.아니다

  • 전반적 만족도(p1903_12): 1.매우 불만족 2.대체로 만족 3.그저 그렇다 4.대체로 만족 5.매우 만족

  • 사회적 친분관계 만족도(p1903_10): 1.매우 불만족 2.대체로 만족 3.그저 그렇다 4.대체로 만족 5.매우 만족

  • 가족관계 만족도(p1903_8): 1.매우 불만족 2.대체로 만족 3.그저 그렇다 4.대체로 만족 5.매우 만족

  • 자아존중감(여러 변수를 결합해 임의 생성): 1 ~ 5 사이의 숫자

    (가) 나는 가치있는 사람이다(p1905_20): 1.대체로 그렇지 않다 2.보통이다 3.대체로 그렇다 4.항상 그렇다
    (나) 나는 좋은 성품을 지녔다(p1905_21): 위와 같음
    (다) 나는 실패한 사람이라는 느낌이든다(p1905_22): 위와 같음
    (라) 다른 사람들과 같이 일을 잘할수 있다(p1905_23): 위와 같음
    (마) 자랑할 것이 별로 없다(p1905_24): 위와 같음
    (바) 긍정적인 태도를 가졌다(p1905_25): 위와 같음
    (사) 대체로 만족(p1905_26): 위와 같음
    (아) 내 자신을 존경할수 있으면 좋겠다(p1905_27): 위와 같음
    (자) 내 자신이 쓸모없는 사람이라는 느낌(p1905_28): 위와 같음
    (차) 내가 좋지 않은 사람이라고 생각한다(p1905_29): 위와 같음

아동용 조사 데이터

  • 일일 평균 인터넷 사용시간(c1905_19): 하루 평균 인터넷을 사용한 분 단위의 숫자

  • 인터넷 중독 점수(여러 변수를 결합해 임의 생성): 1 ~ 5 사이의 숫자

    (가) 인터넷사용으로 건강이 이전보다 나빠진 것 같다(c1905_7aq1): 1.전혀 그렇지 않다 2.때때로 그렇다 3.자주 그렇다 4.항상 그렇다
    (나) 인터넷을 너무 사용해서 머리가 아프다(c1905_7aq2): 위와 같음
    (다) 인터넷을 하다가 계획한 일들을 제대로 못한 적이 있다(c1905_7aq3): 위와 같음
    (라) 인터넷을 하느라고 피곤해서 수업시간에 잠을 자기도 한다(c1905_7aq4): 위와 같음
    (마)인터넷을 너무 사용해서 시력 등에 문제가 생겼다(c1905_7aq5): 위와 같음
    (바) 다른 할 일이 많을 때에도 인터넷을 사용하게 된다(c1905_7aq6): 위와 같음
    (사) 인터넷을 하지 못하면 생활이 지루하고 재미가 없다(c1905_7aq7): 위와 같음
    (아) 인터넷을 하지 못하면 안절부절못하고 초조해진다(c1905_7aq8): 위와 같음
    (자) 인터넷을 하고 있지 않을 때에도 인터넷에 대한 생각이 자꾸 떠오른다(c1905_7aq9): 위와 같음
    (차) 인터넷을 할 때 누군가 방해를 하면 짜증스럽고 화가 난다(c1905_7aq10): 위와 같음
    (카) 인터넷에서 알게 된 사람들이 현실에서 아는 사람들보다 나에게 더 잘해준다(c1905_7aq11): 위와 같음
    (타) 오프라인에서보다 온라인에서 나를 인정해주는 사람이 더 많다(c1905_7aq12): 위와 같음
    (파) 실제에서 보다 인터넷에서 만난 사람들을 더 잘 이해하게 된다(c1905_7aq13): 위와 같음
    (하) 인터넷을 하는 동안 나는 더욱 자신감이 생긴다(c1905_7aq14): 위와 같음
    A 인터넷 사용시간을 속이려고 한 적이 있다(c1905_7aq15): 위와 같음
    B 인터넷 때문에 돈을 더 많이 쓰게 된다(c1905_7aq16): 위와 같음
    C 인터넷을 하다가 그만 두면 또 하고 싶다(c1905_7aq17): 위와 같음
    D 인터넷 사용 시간을 줄이려고 해보았지만 실패한다(c1905_7aq18): 위와 같음
    E 인터넷 사용을 줄여야 한다는 생각이 끊임없이 들곤 한다(c1905_7aq19): 위와 같음
    F 주위 사람들이 내가 인터넷을 너무 많이 한다고 지적한다(c1905_7aq20): 위와 같음

  • 신체적부작용(인터넷 중독 점수의 하위 변수 생성): 1 ~ 5 사이의 숫자
    (가), (나), (마)

  • 일상기능손상(인터넷 중독 점수의 하위 변수 생성): 1 ~ 5 사이의 숫자
    (다), (라), (바)

  • 심리적의존(인터넷 중독 점수의 하위 변수 생성): 1 ~ 5 사이의 숫자
    (사), (아), (자), (차), C, D, E

  • 사회관계대체(인터넷 중독 점수의 하위 변수 생성): 1 ~ 5 사이의 숫자
    (카), (타), (파)

  • 자기통찰과조절(인터넷 중독 점수의 하위 변수 생성): 1 ~ 5 사이의 숫자
    (하), A, F

  • 경제적비용(인터넷 중독 점수의 하위 변수 생성): 1 ~ 5 사이의 숫자
    B

  • 사회관계 만족도(여러 변수를 결합해 임의 생성): 1 ~ 5 사이의 숫자

    (나) 나는 학교생활을 매우 좋아한다(c1902_7aq10): 1.전혀 그렇지 않다 2.별로 그렇지 않다 3. 보통이다 4.다소 그렇다 5.매우 그렇다
    (라) 나는 내가 속한 집단에 소속감을 느낀다(c1902_7aq12): 위와 같음
    (마) 나는 주변사람과 잘 어울린다(c1902_7aq13): 위와 같음
    (바) 나는 아무런 이유 없이 무척 외롭다(c1902_7aq14): 위와 같음
    (나) 말을 하지 않으려 한다(c1902_39): 1.전혀 아니다 2. 그런 편이다 3.자주 그렇다
    (다) 숨기는 것이 많고 남에게 속을 털어놓지 않는다(c1902_40): 위와 같음
    (사) 비활동적이고 행동이 느리며 기운이 없다(c1902_44): 위와 같음
    (자) 위축되서 남들과 어울리지 않으려고 한다(c1902_46): 위와 같음
    (가) 친구들과 오랫동안 친구로 지내고 싶다(c1904_4aq3): 1.전혀 그렇지 않다 2.그렇지 않은 편이다 3.보통이다 4.그런 편이다 5.매우 그렇다
    (나) 친구들과 함께 있으면 즐겁다(c1904_4aq4): 위와 같음
    (다) 친구들과 같은 생각과 감정을 가지려고 노력하는 편이다(c1904_4aq5): 위와 같음
    (라) 친구들과 서로의 고민을 솔직하게 이야기 하는 편이다(c1904_4aq6): 위와 같음

  • 가족관계 만족도(여러 변수를 결합해 임의 생성): 1 ~ 5 사이의 숫자

    (가) 부모님과 나는 학교 생활이나 친구에 대해 대화한다(c1903_4aq1): 1.전혀 그렇지 않다 2.별로 그렇지 않다 3.그런 편이다 4.항상 그렇다
    (나) 우리 부모님은 학교 선생님과 이야기하기위해 학교에 찾아가신다(c1903_4aq2): 위와 같음
    (다) 우리 부모님은 학교가 주최하는 행사에 참석하신다(c1903_4aq3): 위와 같음
    (라) 우리 부모님은 내가 숙제를 다 했는지 관심을 가지고 확인한다(c1903_4aq4): 위와 같음
    (마) 부모님은 내가 집에 없을때 어디에 누구와 있는지 알고 계신다(c1903_4aq5): 위와 같음
    (바) 부모님은 내가 몇 시에 들어오는지 알고 계신다(c1903_4aq6): 위와 같음
    (사) 부모님은 내가 집에 없을 때 무엇을 하는지 알고 계신다(c1903_4aq7): 위와 같음
    (아) 부모님은 내가 어른 없이 집에 있을때 전화를 하신다(c1903_4aq8): 위와 같음

  • 자아존중감(여러 변수를 결합해 임의 생성): 1 ~ 5 사이의 숫자

    (가) 내가 적어도 다른 사람만큼은 가치 있는 사람이라고 느낀다(c1902_1): 1.전혀 그렇지 않다 2.거의 그렇 지않다 3.그런 편이다 4.항상 그렇다
    (나) 내가 좋은 자질을 많이 가지고 있다고 느낀다(c1902_2): 위와 같음
    (다) 남들이 하는 만큼 뭐든지 할 수 있다(c1902_3): 위와 같음
    (라) 긍정적인 태도를 지니고 있다(c1902_4): 위와 같음
    (마) 대체로 나 자신에 만족한다(c1902_5): 위와 같음
    (바) 나는 재주가 많다고 생각한다(c1902_6): 위와 같음
    (사) 다른 사람들보다 의지가 강하다(c1902_7): 위와 같음
    (아) 처음에 못 할지라도 잘할 때까지 열심히 한다(c1902_8): 위와 같음
    (자) 내가 실패자라고 느끼는 경향이 있다(c1902_9): 위와 같음
    (차) 나는 자랑스러워 할만한 것이 별로 없다고 느낀다(c1902_10): 위와 같음
    (카) 때때로 나 자신이 쓸데없는 존재라고 느낀다(c1902_11): 위와 같음
    (타) 때때로 유능하지 않다고 생각한다(c1902_12): 위와 같음
    (파) 나 자신을 좀 더 존중할 수 있으면 하고 바란다(c1902_13): 위와 같음


데이터 정제 및 가공 과정

먼저 가구용, 가구원용, 아동용 조사 데이터를 각각 data_h_raw, data_p_raw, data_c_raw 변수에 불러온다.

data_h_raw <- read.spss(file = "koweps_h19_2024_beta1.sav", to.data.frame = T)
data_p_raw <- read.spss(file = "koweps_p19_2024_beta1.sav", to.data.frame = T)
data_c_raw <- read.spss(file = "koweps_c19_2024_beta1.sav", to.data.frame = T)



가구용과 가구원용 데이터의 변수를 함께 사용하기 위해 개인식별 ID를 기준으로 병합한다. left_join() 함수를 사용하기 위해서는 결합 기준이 되는 공통 변수가 있어야 하는데, 가구용 데이터에서는 ‘h19_pid’ 변수에 모든 가구원의 ID가 저장되어 있고 가구원용 데이터에는 ‘h19_pid1’, ‘h19_pid2’, ’h19_pid3’처럼 구성원의 번호에 따라 다른 변수에 ID가 저장되어 있다. pivot_longer() 함수를 이용해 ’h19_pid’라는 변수명에 하나의 열로 펼쳐준 뒤 진행한다.

data_h_pid <- data_h_raw %>%
  pivot_longer(cols = starts_with("h19_pid"), 
               names_to = "h19_pn", 
               values_to = "h19_pid") %>%
  filter(!is.na(h19_pid))

data_h_p_raw <- data_h_pid %>%
  left_join(data_p_raw, by = "h19_pid")



가구용/가구원용 조사 데이터에서 select() 함수를 이용해 필요한 변수를 선택하고 data_h_p_select 변수에 저장한다. 변수명은 의미에 맞는 단어들로 변경하여 이후 데이터 분석 과정에서 직관적인 이해가 가능하도록 한다.

data_h_p_select <- data_h_p_raw %>%
  select(birthyear = h1901_5,
         internet = p1903_1,
         satisfaction = p1903_12,
         satisfaction_social = p1903_10,
         satisfaction_family = p1903_8,
         p_self1 = p1905_20,
         p_self2 = p1905_21,
         p_self3 = p1905_22,
         p_self4 = p1905_23,
         p_self5 = p1905_24,
         p_self6 = p1905_25,
         p_self7 = p1905_26,
         p_self8 = p1905_27,
         p_self9 = p1905_28,
         p_self10 = p1905_29)



마찬가지로 아동용 조사 데이터에서도 필요한 변수들을 선택하고 적절한 변수명을 부여해 data_c_select 변수에 저장한다.

data_c_select <- data_c_raw %>%
  select(internet_time = c1905_19,
         c_internet1 = c1905_7aq1,
         c_internet2 = c1905_7aq2,
         c_internet3 = c1905_7aq3,
         c_internet4 = c1905_7aq4,
         c_internet5 = c1905_7aq5,
         c_internet6 = c1905_7aq6,
         c_internet7 = c1905_7aq7,
         c_internet8 = c1905_7aq8,
         c_internet9 = c1905_7aq9,
         c_internet10 = c1905_7aq10,
         c_internet11 = c1905_7aq11,
         c_internet12 = c1905_7aq12,
         c_internet13 = c1905_7aq13,
         c_internet14 = c1905_7aq14,
         c_internet15 = c1905_7aq15,
         c_internet16 = c1905_7aq16,
         c_internet17 = c1905_7aq17,
         c_internet18 = c1905_7aq18,
         c_internet19 = c1905_7aq19,
         c_internet20 = c1905_7aq20,
         c_social1 = c1902_7aq10,
         c_social2 = c1902_7aq12,
         c_social3 = c1902_7aq13,
         c_social4 = c1902_7aq14,
         c_social5 = c1902_39,
         c_social6 = c1902_40,
         c_social7 = c1902_44,
         c_social8 = c1902_46,
         c_social9 = c1904_4aq3,
         c_social10 = c1904_4aq4,
         c_social11 = c1904_4aq5,
         c_social12 = c1904_4aq6,
         c_family1 = c1903_4aq1,
         c_family2 = c1903_4aq2,
         c_family3 = c1903_4aq3,
         c_family4 = c1903_4aq4,
         c_family5 = c1903_4aq5,
         c_family6 = c1903_4aq6,
         c_family7 = c1903_4aq7,
         c_family8 = c1903_4aq8,
         c_self1 = c1902_1,
         c_self2 = c1902_2,
         c_self3 = c1902_3,
         c_self4 = c1902_4,
         c_self5 = c1902_5,
         c_self6 = c1902_6,
         c_self7 = c1902_7,
         c_self8 = c1902_8,
         c_self9 = c1902_9,
         c_self10 = c1902_10,
         c_self11 = c1902_11,
         c_self12 = c1902_12,
         c_self13 = c1902_13)



data_h_p_select 데이터 프레임에서 filter() 함수를 이용해 birthyear, internet, satisfaction 값에 결측치가 있는 행을 모두 제거한다. 이후 mutate() 함수로 기존 변수에 저장된 값의 의미를 명확히 하거나 추가적으로 필요한 변수들을 생성하는 작업을 수행한다. internet은 인터넷 사용 여부를 1과 2로 표현하는 변수이므로 ‘Yes’와 ’No’로 의미를 알 수 있게 변경한다. birthyear을 이용해 2024년 기준 만 나이를 나타내는 age 변수를 만들고, 연령대별 분석을 위해 만 35세 미만은 ’청년’, 만 35세에서 65세 미만은 ‘중장년’, 만 65세 이상은 ’노년’으로 분류하는 ageg 변수를 추가한다. 마지막으로 1 ~ 5점 사이의 자아존중감 점수를 계산하여 self_esteem 변수를 생성하고 결측치가 있는 행을 제거한다. 그 결과를 data_adult에 저장하여 이후 데이터 분석에 사용할 수 있도록 한다.

data_adult <- data_h_p_select %>%
  filter(
    !is.na(birthyear),
    !is.na(internet),
    !is.na(satisfaction)
  ) %>%
  mutate(
    internet = ifelse(internet == 1, "Yes", "No"),
    age = 2024 - birthyear,
    ageg = ifelse(age < 35, "청년",
                  ifelse(age < 65, "중장년",
                         "노년")),
    self_esteem = rowMeans(bind_cols(
      select(., p_self1, p_self2, p_self4, p_self6, p_self7, p_self8),
      5 - select(., p_self3, p_self5, p_self9, p_self10)
    ), na.rm = TRUE) * 5 / 4
  ) %>%
  filter(
    !is.na(self_esteem)
  )



data_c_select 데이터 프레임에서는 filter() 함수를 이용해 internet_time 값에 결측치가 있는 행을 제거한다. mutate() 함수를 이용해 분석에 필요한 변수들을 모두 생성한다. 1 ~ 5점 사이의 인터넷 중독 점수 internet_total과 그 하위 변수들을 계산하여 각각 저장한다. 사회관계와 가족관계, 자아존중감 점수도 각각 social, family, self 변수로 생성한다. 이때 부정 문항은 점수를 역산정하고 4점, 3점 척도의 설문 응답에는 최고점이 5점이 되도록 점수 가중치를 부여한 후 일관되게 계산한다. rowMeans() 함수에 na.rm = TRUE 옵션을 사용하여 행 단위로 결측치를 제외한 평균을 구하도록 한다.

data_child <- data_c_select %>%
  filter(!is.na(internet_time)) %>%
  mutate(
    internet_total = rowMeans(select(., c_internet1:c_internet20), na.rm = TRUE) * 5 / 4,
    internet_physical = rowMeans(select(., c_internet1, c_internet2, c_internet5), na.rm = TRUE) * 5 / 4,
    internet_lifeimpairment = rowMeans(select(., c_internet3, c_internet4, c_internet6), na.rm = TRUE) * 5 / 4,
    internet_dependence = rowMeans(select(., c_internet7, c_internet8, c_internet9, c_internet10,
                                          c_internet17, c_internet18, c_internet19), na.rm = TRUE) * 5 / 4,
    internet_socialsub = rowMeans(select(., c_internet11, c_internet12, c_internet13), na.rm = TRUE) * 5 / 4,
    internet_selfcontrol = rowMeans(select(., c_internet14, c_internet15, c_internet20), na.rm = TRUE) * 5 / 4,
    internet_economic = c_internet16 * 5 / 4,
    social = rowMeans(bind_cols(
      select(., c_social1, c_social2, c_social3),
      tibble(c_social4_rev = 6 - pull(., c_social4)),
      as.data.frame((4 - select(., c_social5, c_social6, c_social7, c_social8)) * 5 / 3),
      select(., c_social9, c_social10, c_social11, c_social12)
    ), na.rm = TRUE),
    family = rowMeans(select(., c_family1:c_family8), na.rm = TRUE) * 5 / 4,
    self = rowMeans(bind_cols(
      select(., c_self1:c_self8),
      as.data.frame(5 - select(., c_self9:c_self13))
    ), na.rm = TRUE) * 5 / 4
  )



데이터 분석 및 그래프 만들기



Figure 1

data_adult 데이터를 이용하여 먼저 만 15세 이상을 대상으로 인터넷 사용 여부에 따라 삶의 전반적인 만족도에 차이가 있는지 살펴보았다. group_by() 함수를 이용해 인터넷 사용 여부에 따라 그룹화하고, summarise() 함수로 그룹별 전반적 만족도의 평균을 산출했다.

data_figure1 <- data_adult %>%
  group_by(internet) %>%
  summarise(satisfaction_mean = mean(satisfaction))

data_figure1
## # A tibble: 2 × 2
##   internet satisfaction_mean
##   <chr>                <dbl>
## 1 No                    3.43
## 2 Yes                   3.72



인터넷 사용 여부를 독립변수로 하고 전반적인 삶의 만족도를 종속변수로 하여 그래프를 구성하였다. x축은 범주형 변수인 ’인터넷 사용 여부’를, y축은 연속형 변수인 ’전반적인 삶의 만족도’를 나타낸다. 각 그룹의 평균 만족도를 한눈에 비교할 수 있도록 막대그래프 유형을 선택하였으며 이를 통해 두 집단 간의 차이를 직관적으로 전달하는 효과를 높였다. 막대의 너비를 0.6으로 축소하여 높이 차이에 집중되도록 하고 불필요한 범례는 생략했다.

ggplot(data = data_figure1, aes(x = internet, y = satisfaction_mean, fill = internet)) +
  geom_col(width = 0.6, show.legend = FALSE) +
  labs(
    title = "인터넷 사용 여부에 따른 삶의 전반적인 만족도",
    x = "인터넷 사용 여부",
    y = "삶의 전반적인 만족도"
  )

인터넷을 사용하지 않는 그룹의 평균 만족도는 3.43, 사용하는 그룹은 3.72로 막대의 높이를 통해 두 집단 간의 차이를 시각적으로 확인할 수 있다. 이 결과는 인터넷을 사용하는 것이 전반적인 삶의 만족도와 긍정적인 관계를 가진다는 점을 시사한다.

t.test(satisfaction ~ internet, data = data_adult,
       var.equal = TRUE)
## 
##  Two Sample t-test
## 
## data:  satisfaction by internet
## t = -25.735, df = 12713, p-value < 2.2e-16
## alternative hypothesis: true difference in means between group No and group Yes is not equal to 0
## 95 percent confidence interval:
##  -0.3093467 -0.2655574
## sample estimates:
##  mean in group No mean in group Yes 
##          3.433805          3.721257

이러한 차이의 유의미성을 검증하기 위해 T-검정를 실시했다. t값은 -25.735, 자유도는 12,713, p값은 2.2e-16 미만으로, 많은 표본에 기반해 신뢰도가 높고 우연에 의한 결과일 가능성이 매우 낮아 통계적으로 유의미한 차이라고 할 수 있다.

Figure 2

앞선 결과(Figure 1)를 바탕으로, 연령대에 따라서는 인터넷 사용이 삶의 만족도에 미치는 영향이 달라질 수 있는지를 살펴보기 위해 추가적인 분석을 진행하였다. 이후의 시각화 단계에서 연령 흐름이 자연스럽게 표현되도록 factor()를 사용하여 범주의 순서를 청년, 중장년, 노년 순으로 지정하였다. 청년, 중장년, 노년의 순서로 factor를 group_by() 함수를 이용해 연령대별로 인터넷 사용 여부에 따라 그룹화하고, summarise() 함수로 그룹별 만족도의 평균을 산출했다.

data_figure2 <- data_adult %>%
  mutate(ageg = factor(ageg, levels = c("청년", "중장년", "노년"))) %>%
  group_by(ageg, internet) %>%
  summarise(satisfaction_mean = mean(satisfaction))
## `summarise()` has grouped output by 'ageg'. You can override using the
## `.groups` argument.
data_figure2
## # A tibble: 6 × 3
## # Groups:   ageg [3]
##   ageg   internet satisfaction_mean
##   <fct>  <chr>                <dbl>
## 1 청년   No                    3.7 
## 2 청년   Yes                   3.88
## 3 중장년 No                    3.40
## 4 중장년 Yes                   3.75
## 5 노년   No                    3.44
## 6 노년   Yes                   3.63



연령대를 독립변수로, 전반적인 삶의 만족도를 종속변수로 하여 그래프를 구성하였다. x축은 범주형 변수인 ‘연령대’를, y축은 연속형 변수인 ’삶의 전반적인 만족도’ 평균값을 나타낸다. 인터넷 사용 여부에 따라 각각 두 그룹으로 나누고, 막대의 색상으로 구분하여 연령대 내에서 인터넷 사용자와 비사용자의 만족도 차이를 비교하도록 했다. position_dodge()를 사용해 막대를 옆으로 나란히 배치함으로써 높이 차이를 쉽게 파악할 수 있도록 하고, 너비는 0.6으로 조절하여 막대 간 간격과 높이 차이를 뚜렷하게 했다. 그래프의 제목과 축 이름, 범례 제목을 지정하여 그래프의 정보를 효과적으로 전달한다.

ggplot(data = data_figure2, aes(x = ageg, y = satisfaction_mean, fill = internet)) +
  geom_col(position = position_dodge(width = 0.7), width = 0.6) +
  labs(
    title = "연령대별 인터넷 사용 여부에 따른 삶의 만족도",
    x = "연령대",
    y = "삶의 전반적인 만족도",
    fill = "인터넷 사용 여부"
  )

연령대별 세 그룹 모두 인터넷을 사용하는 집단의 삶의 전반적인 만족도가 더 높은 것을 막대 높이의 차이로 확인할 수 있다. 각 평균의 차이는 청년층 0.17점, 중장년층 0.35점, 노년층 0.20점으로 중장년층에서 가장 뚜렷한 차이를 보였다. 인터넷 사용 여부와 관계없이 연령대가 높아질수록 삶의 만족도는 전반적으로 낮아지는 경향도 나타났다. 이에 연령 증가와 인터넷 사용 간에 차이나 경향성이 존재하는지 알아보기 위해 T검정을 실시했다.

t.test(age ~ internet, data = data_adult,
       var.equal = TRUE)
## 
##  Two Sample t-test
## 
## data:  age by internet
## t = 89.953, df = 12713, p-value < 2.2e-16
## alternative hypothesis: true difference in means between group No and group Yes is not equal to 0
## 95 percent confidence interval:
##  20.05116 20.94449
## sample estimates:
##  mean in group No mean in group Yes 
##          77.76026          57.26244

검정 결과 인터넷을 사용하지 않는 그룹의 평균 연령은 약 77.76세, 사용하는 그룹은 약 57.26세로 나타났다. 두 집단 간 평균 연령 차이는 약 20세에 달하며 p값이 매우 작은 유의미한 결과를 보였다. 인터넷 비사용자가 상대적으로 고령층에 몰려 있다는 것은 연령대가 높을수록 삶의 만족도가 낮아지는 경향이 인터넷 사용률이 낮다는 점에 일부 영항을 받을 수 있음을 의미한다. 다만 삶의 만족도는 다양한 요인의 영향을 받기 때문에 단일 원인으로 해석하기에는 한계가 있다. 따라서 정확한 원인을 파악하기 위해서는 연령과 관련해 소득, 건강 등 다양한 변수를 통제한 후속 연구가 필요할 것이다.

Figure 3

이번에는 인터넷 사용 여부에 따른 관계 만족도를 살펴보기 위해 정제 및 가공 과정에서 임의로 계산한 사회관계와 가족관계 점수를 활용하였다. group_by() 함수를 통해 데이터를 인터넷 사용 여부에 따라 그룹화하고, summarise() 함수로 각 그룹의 사회관계 및 가족관계 만족도 평균을 산출하였다. 이후 pivot_longer() 로 두 관계 유형을 하나의 열로 묶어 시각화 단계에서 관계 유형에 따라 막대 색상을 구분해 사용하도록 데이터 형태를 변환했다.

data_figure3 <- data_adult %>%
  group_by(internet) %>%
  summarise(
    사회관계 = mean(satisfaction_social, na.rm = TRUE),
    가족관계 = mean(satisfaction_family, na.rm = TRUE)
  ) %>%
  pivot_longer(
    cols = c(사회관계, 가족관계),
    names_to = "relationship",
    values_to = "satisfaction"
  )

data_figure3
## # A tibble: 4 × 3
##   internet relationship satisfaction
##   <chr>    <chr>               <dbl>
## 1 No       사회관계             3.57
## 2 No       가족관계             3.76
## 3 Yes      사회관계             3.82
## 4 Yes      가족관계             3.99



인터넷 사용 여부를 독립변수로, 사회관계 및 가족관계 만족도를 종속변수로 하여 그래프를 구성하였다. x축은 범주형 변수인 ’인터넷 사용 여부’를, y축에는 연속형 변수인 ’관계 만족도’의 평균값을 나타낸다. 사회관계와 가족관계 두 관계 유형을 하나의 막대로 쌓고 색상으로 구분하여 인터넷 사용 여부에 따른 각 관계 만족도의 차이를 드러냈다. 이때 group_fill 변수를 생성하고 scale_fill_manual() 함수로 사회관계와 가족관계에 유사한 계열의 색상을 지정하여 관계 만족도의 하위 개념이라는 시각적 일관성과 구분을 동시에 확보하였다. 너비는 너무 두껍지 않도록 0.6으로 설정하여 막대의 높이 차이를 잘 보여주고 그래프의 제목, 축 이름, 범례를 두어 시각화된 대상의 정보를 전달한다.

data_figure3 <- data_figure3 %>%
  mutate(group_fill = paste(internet, relationship, sep = "_"))

ggplot(data = data_figure3, aes(x = internet, y = satisfaction, fill = group_fill)) +
  geom_col(width = 0.6) +
  labs(
    title = "인터넷 사용 여부에 따른 관계 만족도",
    x = "인터넷 사용 여부",
    y = "관계 만족도",
    fill = "그룹"
  ) +
  scale_fill_manual(values = c(
    "No_사회관계" = "#E74C3C",    
    "No_가족관계" = "#EC7063",   
    "Yes_사회관계" = "#4A90E2",  
    "Yes_가족관계" = "#7FB3D5"   
  ))

인터넷을 사용하지 않는 그룹의 관계 만족도는 사회관계 3.57, 가족관계 3.76인 반면에 인터넷을 사용하는 그룹은 사회관계 3.82, 가족관계 3.99로 나타났다. 삶의 전반적인 만족도와 마찬가지로 막대그래프의 높이를 통해 두 그룹 간의 차이를 시각적으로 확인할 수 있다. 이 결과는 인터넷을 사용하는 것이 사회관계 및 가족관계에 있어서 관계 만족도에 긍정적인 영향을 미친다는 것을 보여준다.

t.test(satisfaction_social ~ internet, data = data_adult,
       var.equal = TRUE)
## 
##  Two Sample t-test
## 
## data:  satisfaction_social by internet
## t = -21.566, df = 12713, p-value < 2.2e-16
## alternative hypothesis: true difference in means between group No and group Yes is not equal to 0
## 95 percent confidence interval:
##  -0.2787786 -0.2323234
## sample estimates:
##  mean in group No mean in group Yes 
##          3.567586          3.823137
t.test(satisfaction_family ~ internet, data = data_adult,
       var.equal = TRUE)
## 
##  Two Sample t-test
## 
## data:  satisfaction_family by internet
## t = -18.407, df = 12713, p-value < 2.2e-16
## alternative hypothesis: true difference in means between group No and group Yes is not equal to 0
## 95 percent confidence interval:
##  -0.251581 -0.203156
## sample estimates:
##  mean in group No mean in group Yes 
##          3.760492          3.987860

두 표본의 T-검정 결과에서 인터넷 사용 여부에 따라 사회관계 만족도와 가족관계 만족도에 유의미한 차이가 있는 것으로 나타났다.

첫 번째 결과는 사회관계 만족도를 분석한 것으로 두 그룹 간 평균 차이가 통계적으로 유의미하다(t = -21.566, df = 12713, p < 0.001). 95% 신뢰구간은 -0.279에서 -0.232 사이로 인터넷 비사용 그룹의 만족도가 인터넷 사용 그룹보다 낮음을 의미한다.

두 번째 결과는 가족관계 만족도를 분석한 것으로 통계적으로 유의미한 차이가 있음이 확인되었다(t = -18.407, df = 12713, p < 0.001). 95% 신뢰구간은 -0.252에서 -0.203 사이로 사회관계 만족도 결과와 마찬가지로 인터넷을 사용하는 그룹의 만족도가 더 높음을 보여준다.

Figure 4

다음으로 인터넷 사용 여부에 따른 자아존중감을 살펴보았다. 정제 및 가공 과정에서 계산한 자아존중감 점수을 이용해 상자그림으로 시각화했다. 상자그림은 데이터의 중앙값과 사분위수, 이상치를 한눈에 보여주어 집단 간 분포 차이와 데이터의 변동성을 직관적으로 파악할 수 있다는 장점이 있다. 이 그래프에서는 독립변수인 ’인터넷 사용 여부’를 x축에, 종속변수인 ’자아존중감 점수’를 y축에 배치하였다. 집단별 자아존중감 분포를 비교하여 인터넷 사용 여부에 따른 자아존중감의 분포 특성을 확인할 수 있다. fill 옵션을 통해 인터넷 사용 여부에 따라 박스 색상을 구분하여 시각적 대비를 높였고 범례는 생략하여 깔끔하게 표현했다.

data_adult %>%
  ggplot(aes(x = internet, y = self_esteem, fill = internet)) +
  geom_boxplot(show.legend = FALSE) +
  labs(
    title = "인터넷 사용 여부에 따른 자아존중감",
    x = "인터넷 사용 여부",
    y = "자아존중감"
  )

인터넷을 사용하는 그룹의 상자그림 중앙값이 더 높은 위치에 있고 사분위 범위의 위아래 폭이 좁게 형성되었다. 해당 그룹의 자아존중감 점수 분포가 전반적으로 더 높고 상대적으로 덜 퍼져 있어 비교적 균일하게 높은 자아존중감을 보인다는 것을 의미한다. 반면 인터넷을 사용하지 않는 그룹은 중앙값이 낮고 분포가 더 넓어서 자아존중감 수준이 낮을 뿐만 아니라 개인 간 차이도 큰 편으로 해석된다. 따라서 인터넷 사용 여부가 자아존중감에 긍정적인 영향을 준다는 결론을 얻을 수 있다. 다만 인터넷을 사용하는 그룹은 낮은 값의 이상치를 더 많이 가지고 있어서 일부 사용자에게 자아존중감이 낮게 나타나는 예외적인 사례의 가능성을 보여준다.

t.test(self_esteem ~ internet, data = data_adult,
       var.equal = TRUE)
## 
##  Two Sample t-test
## 
## data:  self_esteem by internet
## t = -36.872, df = 12713, p-value < 2.2e-16
## alternative hypothesis: true difference in means between group No and group Yes is not equal to 0
## 95 percent confidence interval:
##  -0.3724694 -0.3348672
## sample estimates:
##  mean in group No mean in group Yes 
##          3.657460          4.011128

인터넷 사용 여부에 따른 자아존중감의 평균 차이가 통계적으로 유의한지 검증하기 위해 T-검정을 실시했다. 그 결과 t값은 -36.872, 자유도는 12,713이며, p값은 2.2e-16보다 작아 매우 유의미한 차이가 있음이 확인되었다. 95% 신뢰구간은 -0.372에서 -0.335 사이로 나타났으며 인터넷을 사용하는 그룹의 자아존중감 평균이 사용하지 않는 그룹보다 통계적으로 유의하게 더 높다는 것을 시사한다. 실제 평균값은 인터넷 비사용 그룹이 3.66인 반면 인터넷 사용 그룹은 4.01로 수치적으로도 높게 나타났다.

Figure 5

지금까지는 만 15세 이상을 대상으로 청년층, 중장년층, 노년층의 연령별 데이터를 분석하였다. 모든 연령대에서 인터넷 사용이 삶의 전반적인 만족도, 세부적으로는 관계 만족도와 자아존중감에 긍정적인 영향을 미치는 경향을 확인하였다. 이에 따라 만 15세 미만 아동 데이터에서도 동일한 경향이 나타나는지를 분석하고자 한다. 먼저 data_child 데이터프레임에서 filter() 함수를 사용해 social, family, self 변수에 결측치가 있는 행을 제거하였다. mutate() 함수로는 사회관계 와 가족관계 점수를 합산한 관계 만족도 변수를 생성하였다.

data_figure5 <- data_child %>%
  filter(!is.na(social), !is.na(family), !is.na(self)) %>%
  mutate(social_family = social + family)



일일 평균 인터넷 사용 시간을 독립변수로, 관계 만족도를 종속변수로 하여 그래프를 구성하였다. x축에는 ’인터넷 사용 시간(분)’을, y축에는 ’관계 만족도’를 배치하여 두 변수 간의 관계를 시각화하였다. 연속형 변수 간의 연관성을 파악하기 위해 산점도 그래프를 선택하였으며 점의 불투명도를 0.4로 설정해 데이터가 밀집된 구간을 강조했다. 점들이 많이 중첩될수록 색상이 뚜렷하게 표현되어 밀집도에 따른 패턴을 인식하기 쉬운 효과를 갖는다. 변수 간의 전반적인 경향을 시각화하기 위해 선형 회귀선을 추가했고 인터넷 사용 시간과 관계 만족도 간에 어떤 관계성이 있는지 직관적으로 파악할 수 있도록 했다. 시각화된 내용의 해석이 용이하도록 그래프의 제목과 축 이름도 명확히 지정했다.

ggplotly(
  ggplot(data_figure5, aes(x = internet_time, y = social_family)) +
    geom_point(alpha = 0.4) +
    geom_smooth(method = "lm") +
    labs(
      x = "일일 평균 인터넷 사용시간 (분)",
      y = "관계 만족도",
      title = "일일 인터넷 사용 시간과 관계 만족도의 연관성"
    )
)
## `geom_smooth()` using formula = 'y ~ x'

일일 평균 인터넷 사용 시간이 증가함에 따라 선형 회귀선이 완만하게 하락하는 추세를 보인다. 같은 사용 시간을 가진 그룹 내에서 만족도의 분포가 꽤 넓게 퍼져 있어 개인 간 차이는 존재하지만, 데이터가 가장 많이 밀집된 60분, 120분, 180분 사용 시간대를 살펴보면 관계 만족도의 중앙값이 점차 낮아짐을 뚜렷하게 인식할 수 있다. 인터넷 사용 시간이 길어질수록 사회관계 및 가족관계 만족도가 낮아지는 경향이 있다는 결과를 직관적으로 보여준다.

cor.test(data_figure5$internet_time, data_figure5$social_family)
## 
##  Pearson's product-moment correlation
## 
## data:  data_figure5$internet_time and data_figure5$social_family
## t = -4.4773, df = 324, p-value = 1.048e-05
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  -0.3410675 -0.1363352
## sample estimates:
##        cor 
## -0.2413855

두 변수 간의 연관성을 통계적으로 검증하기 위해 상관분석을 실시하였다. 분석 결과 상관계수는 -0.24로 강하지는 않지만 유의미한 음의 상관관계가 나타났다. p값도 0.00001 정도로 통계적으로 매우 유의하였다. 유의미한 수준에서 일일 평균 인터넷 사용 시간이 증가할수록 사회관계 및 가족관계 만족도가 낮아지는 음의 방향성을 갖는다고 해석할 수 있다.

동일한 방법으로 일일 평균 인터넷 사용시간과 자아존중감 사이의 관계를 살펴보았다.

ggplotly(
  ggplot(data_figure5, aes(x = internet_time, y = self)) +
    geom_point(alpha = 0.4) +
    geom_smooth(method = "lm") +
    labs(
      x = "일일 평균 인터넷 사용시간 (분)",
      y = "자아존중감",
      title = "일일 인터넷 사용 시간과 자아존중감의 연관성"
    )
)
## `geom_smooth()` using formula = 'y ~ x'

이전 그래프와 마찬가지로 일일 평균 인터넷 사용 시간이 증가함에 따라 선형 회귀선이 완만하게 하락하는 추세를 보인다. 자아존중감도 인터넷 사용 시간이 길어질수록 함께 낮아지는 경향이 있다는 결과를 나타낸다.

cor.test(data_figure5$internet_time, data_figure5$self)
## 
##  Pearson's product-moment correlation
## 
## data:  data_figure5$internet_time and data_figure5$self
## t = -3.1794, df = 324, p-value = 0.001618
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  -0.27732782 -0.06657567
## sample estimates:
##        cor 
## -0.1739428

두 변수 간의 상관분석을 진행한 결과, 일일 평균 인터넷 사용시간과 자아존중감 사이에는 통계적으로 유의미한 음의 상관관계가 있는 것으로 나타났다. 상관계수는 -0.174이고 p값은 0.0016으로 일반적인 기준에서 유의미하다. 다만 상관계수의 절댓값이 0.2에 못 미치는 수준으로 상관의 강도는 관계 만족도에 비해서 약한 편이다.

Figure 6

앞선 분석(Figure 5)에서 청소년층은 청년층, 중장년층, 노년층과는 달리 인터넷 사용 시간이 증가함에 따라 관계 만족도와 자아존중감이 모두 낮아진다는 흥미로운 결과를 도출해냈다. 이에 단순한 사용 시간보다 인터넷 중독 정도가 만족도 하락과 더 강한 연관성을 가지진 않을지 추가로 살펴보았다. 사용 시간과 중독 정도의 연관성도 함께 나타내기 위해 mutate() 함수를 사용하여 일일 평균 인터넷 사용 시간을 기준으로 세 그룹으로 나눈 범주형 변수를 새롭게 추가하였다. 구간은 1시간 반 이하, 1시간 반에서 3시간, 3시간 이상으로 설정하였다.

data_figure6 <- data_figure5 %>%
  mutate(사용시간 = cut(internet_time, breaks = c(0, 90, 180, Inf),
                          labels = c("1시간 반 이하", "1시간 반~3시간", "3시간 이상")))



인터넷 중독 점수를 독립변수로, 관계 만족도를 종속변수로 하여 산점도 그래프를 구성하였다. x축은 연속형 변수인 ‘인터넷 중독 점수’를, y축은 ‘관계 만족도’ 점수를 나타낸다. 세 집단으로 나눈 사용시간을 다른 색상에 반영하여 각 집단의 경향성을 동시에 파악할 수 있도록 했다. 점의 불투명도 0.4로 낮춰 데이터의 밀집 정도를 시각적으로 표현하고 각 집단별 선형 추세선을 추가하여 인터넷 중독 점수와 관계 만족도 간의 방향성을 한 눈에 보여준다. 중독 수준에 따라 사용시간이 어떻게 분포하는지도 함께 확인할 수 있다.

ggplotly(
  ggplot(data_figure6, aes(x = internet_total, y = social_family, color = 사용시간)) +
    geom_point(alpha = 0.4) +
    geom_smooth(method = "lm") +
    labs(
      x = "인터넷 중독 점수",
      y = "관계 만족도",
      title = "인터넷 중독과 관계 만족도의 연관성"
    )
)
## `geom_smooth()` using formula = 'y ~ x'
## Warning: Removed 13 rows containing non-finite outside the scale range
## (`stat_smooth()`).

전반적으로 인터넷 중독 점수가 높을수록 관계 만족도가 하락하는 경향성을 보인다. 모든 사용시간 그룹에서 이러한 음의 방향성이 공통적으로 확인된다. 사용 시간이 많은 그룹일수록 추세선이 길어지는 것은 높은 중독 점수 구간까지 데이터가 퍼져 있음을 의미하고, 인터넷 사용 시간과 중독 점수 사이에도 일정 수준의 연관성이 있음을 유추할 수 있다.

cor.test(data_figure6$internet_total, data_figure6$social_family)
## 
##  Pearson's product-moment correlation
## 
## data:  data_figure6$internet_total and data_figure6$social_family
## t = -7.9408, df = 311, p-value = 3.696e-14
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  -0.4987391 -0.3140114
## sample estimates:
##        cor 
## -0.4105794

상관 분석 결과, 인터넷 중독 점수와 사회관계 및 가족관계 만족도 간에는 유의미한 음의 상관관계가 나타났다. 상관계수는 약 -0.41로 인터넷 사용시간과 관계 만족도 사이보다 강한 중간 정도의 관계성이 존재한다. 인터넷 중독 점수가 높아질수록 관계 만족도가 낮아지는 경향이 통계적으로 유의하게 관찰되었고 이는 단순한 우연이라 보기 어려운 결과이다.

동일한 방법으로 인터넷 중독 점수와 자아존중감 사이의 관계를 살펴보았다.

ggplotly(
  ggplot(data_figure6, aes(x = internet_total, y = self, color = 사용시간)) +
    geom_point(alpha = 0.4) +
    geom_smooth(method = "lm") +
    labs(
      x = "인터넷 중독 점수",
      y = "자아존중감",
      title = "인터넷 중독과 자아존중감의 연관성"
    )
)
## `geom_smooth()` using formula = 'y ~ x'
## Warning: Removed 13 rows containing non-finite outside the scale range
## (`stat_smooth()`).

인터넷 중독 점수가 높을수록 자아존중감이 하락하는 경향성을 보이며 모든 사용시간 그룹에서 이러한 음의 방향성이 뚜렷하다. 사용 시간이 적은 1시간 반 이하 그룹에서 추세선의 기울기가 가장 완만하고, 사용 시간이 많은 3시간 이상 그룹의 기울기가 가장 가파르다. 따라서 사용시간은 자아존중감에 대한 중독 정도의 영향을 증폭시켜주는 역할을 한다고 해석할 수 있다. 사용시간에 관계 없이 전반적인 하락 기울기가 앞선 관계 만족도 그래프보다 가파른 것은 인터넷 중독 정도가 관계 만족도보다 자아존중감에 더욱 큰 영향력을 미친다는 것을 나타낸다.

cor.test(data_figure6$internet_total, data_figure6$self)
## 
##  Pearson's product-moment correlation
## 
## data:  data_figure6$internet_total and data_figure6$self
## t = -10.875, df = 311, p-value < 2.2e-16
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  -0.6007947 -0.4396146
## sample estimates:
##        cor 
## -0.5248942

상관분석 결과에 따르면 인터넷 중독 점수와 자아존중감 사이에는 통계적으로 유의미한 음의 상관관계가 있는 것으로 나타났다. 상관계수는 -0.52로 인터넷 중독 점수가 높을수록 자아존중감이 낮아지는 경향이 뚜렷하다. 이는 앞서 분석한 인터넷 중독과 관계 만족도 간의 상관계수 -0.41보다 더 강한 관계성을 보여주며, 청소년층에서 인터넷 중독이 자아 개념에 보다 직접적이고 부정적인 영향을 미칠 수 있음을 시사한다.

Figure 7

그렇다면 청소년층의 자아존중감 하락에 큰 영향을 미치는 인터넷 중독이 세부적으로는 어떤 증상들로 나타나고 있는지 파악하고자 한다. 자아존중감 점수를 기준으로 ‘낮음’, ‘보통’, ’높음’의 세 그룹을 만들고 인터넷 중독 점수를 구성하는 6가지 하위 요인(신체적 부작용, 일상기능 손상, 심리적 의존, 사회관계 대체, 자기통찰과 조절, 경제적 비용)의 평균값을 각 그룹별로 산출했다. 이때 pivot_longer()로 넓은 형태의 데이터를 하위 요인 변수와 그에 해당하는 평균 점수로 길게 변환해 시각화 및 분석이 용이하도록 구조를 바꾸었다. group_by() 함수로 자아존중감 수준별 데이터를 그룹화하고, mutate() 함수를 활용해 각 하위 요인의 상대적 비중을 계산했다.

data_figure7 <- data_figure5 %>%
  mutate(
    self_esteem_group = cut(self, breaks = c(0, 3.5, 4.25, 5),
                            labels = c("낮음", "보통", "높음"))
  )%>%
  group_by(self_esteem_group) %>%
  summarise(
    신체적부작용 = mean(internet_physical, na.rm = TRUE),
    일상기능손상 = mean(internet_lifeimpairment, na.rm = TRUE),
    심리적의존 = mean(internet_dependence, na.rm = TRUE),
    사회관계대체 = mean(internet_socialsub, na.rm = TRUE),
    자기통찰과조절 = mean(internet_selfcontrol, na.rm = TRUE),
    경제적비용 = mean(internet_economic, na.rm = TRUE)
  ) %>%
  pivot_longer(
    cols = c("신체적부작용", "일상기능손상", "심리적의존",
             "사회관계대체", "자기통찰과조절", "경제적비용"),
    names_to = "subscale",
    values_to = "mean_score"
  ) %>%
  group_by(self_esteem_group) %>%
  mutate(prop = mean_score / sum(mean_score)) %>%
  ungroup()



자아존중감 수준에 따라 인터넷 중독의 하위 증상이 어떻게 구성되어 있는지를 살펴보기 위해 자아존중감을 독립변수로, 각 하위 증상의 상대적 비율(%)을 종속변수로 설정하여 누적 막대그래프를 구성하였다. x축에는 범주형 변수인 ‘자아존중감 수준(‘낮음’, ‘보통’, ‘높음’)’을 두었고, y축에는 ’인터넷 중독의 세부 증상이 자아존중감 그룹 내에서 차지하는 상대적 비율(%)’을 나타내어 비교가 용이하도록 했다. 자아존중감 그룹별로 총합이 100%인 하위 증상들의 구성을 시각적으로 한눈에 보여주기 위해 막대그래프 형식을 선택했다. 이때 coord_flip() 함수를 활용해 축을 전환하여 가로 방향으로 증상별 비율을 구성했다. 수평선 상에서 자아존중감 수준별로 직관적인 비교가 가능하도록 했다.

채우기 색상은 Set3 계열의 RColorBrewer 팔레트를 사용하여 6가지 세부 증상을 명확하게 구분했다. 이 팔레트는 색상 간 대비가 뚜렷하면서도 시각적으로 부드럽기 때문에 가독성과 정보 전달력 모두를 고려한 선택이다. 또한 geom_text()로 각 세부 증상의 비율을 막대 내부 중앙에 표시하고 글자 크기는 3으로, 색상은 검정으로 지정해 배경색 위에서도 잘 읽히도록 설정했다. 비율 표시는 scales::percent() 함수로 소수점 없이 정수 %로 나타내어 복잡함을 줄이고 해석의 명료성을 높였다.

세부 증상들의 표시 순서는 subscale_order 변수를 통해 자아존중감이 낮은 그룹에서의 평균 점수 순서를 기준으로 정렬했다. 그래프 내 세부 항목의 순서를 의미 있는 기준에 따라 배열하여 해석의 흐름과 일관성을 제공한다. 자아존중감 수준이 낮을 때 인터넷 중독의 어떤 증상이 더 두드러지는지와 상대적 구성에 어떤 차이가 있는지를 분석할 수 있다.

subscale_order <- data_figure7 %>%
  filter(self_esteem_group == "낮음") %>%
  arrange(mean_score) %>%
  pull(subscale)

data_figure7 <- data_figure7 %>%
  mutate(subscale = factor(subscale, levels = subscale_order))

data_figure7 <- data_figure7 %>%
  group_by(self_esteem_group) %>%
  arrange(self_esteem_group, subscale) %>%
  mutate(
    pos = cumsum(prop) - 0.5 * prop,
    percent_label = scales::percent(prop, accuracy = 1)
  ) %>%
  ungroup()

ggplot(data_figure7, aes(x = self_esteem_group, y = prop, fill = subscale)) +
  geom_col(position = "stack") +
  geom_text(
    aes(label = scales::percent(prop, accuracy = 1)),
    position = position_stack(vjust = 0.5),
    size = 3, color = "black"
  ) +
  scale_y_continuous(labels = scales::percent_format(accuracy = 1)) +
  scale_fill_brewer(palette = "Set3") +
  coord_flip() +
  labs(
    title = "자아존중감 그룹별 인터넷 중독 세부증상 비율",
    x = "자아존중감",
    y = "비율 (%)",
    fill = "세부증상"
  )

자아존중감이 낮은 그룹에서 인터넷 중독의 세부 증상으로 심리적 의존이 20%, 자기통찰과 조절이 19%로 가장 높은 비율을 차지하고 있다. 자아존중감이 높은 그룹일수록 두 증상이 차지하는 비율이 감소하는 것도 함께 확인할 수 있다. 이는 해당 증상이 인터넷 사용 시 자아존중감 저하에 특히 강한 영향을 미쳤을 가능성을 시사한다. 반면 경제적 비용과 사회관계 대체는 자아존중감이 낮은 그룹에서 각각 13%, 14%로 가장 낮은 비율을 차지한다. 자아존중감이 높은 그룹일수록 비율이 증가하는 경향을 보이므로 이 증상들이 자아존중감 저하에 미치는 영향은 상대적으로 작을 수 있음을 보여준다.

결론

본 연구에서는 먼저 만 15세 이상 전 연령층을 대상으로 인터넷 사용 여부가 삶의 만족도에 미치는 영향을 살펴보았다. 그 결과 청년층, 중장년층, 노년층에서는 인터넷을 사용하는 집단이 사용하지 않는 집단보다 전반적인 삶의 만족도, 사회관계 및 가족관계 만족도, 자아존중감 수준이 모두 더 높은 경향을 보였다. 이는 인터넷 사용이 해당 연령대에서 삶의 질을 높이는 데 일정 부분 긍정적인 역할을 할 수 있음을 나타낸다.

반면 만 15세 미만 청소년층에서는 다른 결과가 발생했다. 청소년의 경우 일일 평균 인터넷 사용 시간이 길어질수록 사회적 관계 만족도와 자아존중감이 모두 낮아지는 경향이 관찰되었고 통계적으로 유의미한 약한 음의 상관관계를 보였다. 사용 시간과의 관계에서는 관계 만족도가 자아존중감보다 더 뚜렷한 음의 상관관계가 있었지만, 인터넷 중독 점수와의 관계에서는 자아존중감이 관계 만족도보다 더 강한 음의 상관관계를 나타냈다. 전반적으로 두 종속변수 모두에서 단순한 사용 시간보다 인터넷 중독 수준이 더 높은 관련성을 보였으며 특히 자아존중감은 인터넷 중독과 가장 밀접한 연관이 있었다.

청소년의 자아존중감 저하와 관련하여 인터넷 중독의 세부 증상 중 ’심리적 의존’과 ’자기 통찰 및 조절 부족’이 자아존중감이 낮은 그룹에서 가장 높은 비율을 차지했다. 자기 조절 능력과 심리적 독립성이 약화된 상태가 인터넷 사용의 부정적 영향에 더 취약할 수 있음을 보여준다.

요약하면 인터넷 사용은 성인에게는 삶의 만족도에 긍정적인 영향을 미칠 수 있는 반면, 청소년에게는 인터넷 중독 수준에 따라 오히려 관계 만족도와 자아존중감을 저해할 수 있는 요인으로 작용한다. 특히 청소년의 자아존중감 보호를 위해서는 단순한 인터넷 사용 시간의 조절뿐만 아니라 심리적 중독 증상의 관리가 중요함을 시사한다.