##얘는 Sd가 아니고 Variance이다.
요인의 개수를 4개 또는 5개로 추천해 주고 있다. 여튼 4개 이상의 요인 구성해보고 시작해보자.
로딩값 0.4이상인 것을 하나의 동일한 요인으로 구분해보고, 우리의 생각과 비슷한지 관찰해 보자.
0.9로 매우 높다. 설문의 내적 신뢰도가 매우 높아 잘 구성된 설문으로 판단된다. 이와 마찬가지로, 각 5개 요인별 신뢰도를 구해서 비교해 보면 다음과 같다.
gg1 %>% select(no_2, burn_score, grep('RC', colnames(.))) %>%
dplyr::rename(ID = no_2) %>% drop_na() %>%
gather (key = factor, value=score, RC1:RC5) %>%
filter (score < 2.5 & score >-2.5) %>%
ggplot (aes(x = score, y =burn_score, group=factor)) +
geom_point (aes(color = factor), alpha=0.05)+
geom_smooth(aes(color = factor), method='lm', se=F) +
facet_wrap (factor ~.) +
theme_minimal ()RC1
각 factor 들은 depression_score와 burn_out_score에 각각 다른 영향을 미치게 된다. 예를 들어 위의 분석에 따르면 RC1과 RC3, RC4, RC5 는 양의 상관관계를 가지게 되고 RC2는 음의 상관관계를 가지게 된다. depression_score일 때도 마찬가지였다. 따라서 factor들을 합산해서 같이 사용하게 된다면 가지고 있는 정보들을 더 잘 보여주지 못할 것이다. 따라서 각 factor요인들은 다로 사용하는 것이 더 좋을 것으로 예상된다.