본 강의에서는 2014년 장세진 등이 연구한 한국형 감정노동 설문지의 연구 계발 중 감정노동 설문지 하부 구조 구성에 대한 내용이다. 감정근로자를 대상으로한 질적 면담을 통해 총 26개 질적 항목이 도출되었다. 이를 조사 문항으로 변경하였고, 2014년 약 2000명의 고객 응대 근로자를 조사하였다. 이 중 변수를 축소할 수 있으지, 불필요한 변수가 있는지, 변수 사이에 일정한 특성이 있어 하부 구조를 만들수 있는지 여부를 판단하는 것이 실습 목표이다. 요인분석 이전까지의 Data step은 저번 강의를 참조하고, 이번 강의에서는 Data step에서 필요한 부분만 시행하겠다.
이번 실습에서는 감정노동 하의 요인1이 직접 작용하는 것인지 요인 2를 거쳐 작용하는 것인지 알아본다.
tidyverse 를 통해 대부분의 data step 과정을 수행할 것이며, 라벨 작업을 위해 labelled package를 이용할 것이다. spss 파일을 불러오기위해 haven package 사용할 것이다.
spss 파일인 data_n2221.sav를 불러 dat에 저장한다. 이후 처음부터 100번째 줄만 사용한다.
dat<-read_sav("data_n2221.sav")
dat <-dat[, 1:100 ]
dat2 <- dat %>% dplyr::select(!grep('^b|c\\d', names(dat)))
gg<-dat2 %>% drop_na(grep('^a\\d', names(dat2)))
em <-gg %>% dplyr::select(grep('^a\\d', names(gg)))
fit <-princomp(em, cor=TRUE)
#summary(fit)그림을 그려보자
요인의 개수를 4개 또는 5개로 추천해 주고 있다. 여튼 4개 이상의 요인 구성해보고 시작해보자.
요인값 (score)는 fit모델의 scores라는 list에 데이터 형식으로 저장되어 있다. 이를 gg 파일에 회병합한다.
PHQ-9 설문지가 d1~d9까지있고, 우선 단순 합으로 계산한다(9번 문항의 별도 가중치 고려하지 않음).
5개의 factor score와 PHQ-9의 총합의 상관관계를 분석해 본다.
gg1 %>% dplyr::select(no_2, dep_score, grep('RC', colnames(.))) %>%
dplyr::rename(ID = no_2) %>% drop_na() %>%
gather (key = factor, value=score, RC1:RC5) %>%
filter (score < 2.5 & score >-2.5) %>%
ggplot (aes(x = score, y =dep_score, group=factor)) +
geom_point (aes(color = factor), alpha=0.05)+
geom_smooth(aes(color = factor), method='lm', se=F) +
facet_wrap (factor ~.) +
theme_minimal ()## `geom_smooth()` using formula 'y ~ x'
R1은 양의 상관관계, RC2는 음의 상관관계, RC3는 특이 사항 없고, RC4, RC5는 양의 상관관계가 있다. 각 항목별로 기울기 등 관련성의 특성이 다르므로 각각 사용하는 것이 좋겠다. 모두 합산하기 보다는 각 요인별로 설문지의 값을 더하고 이것을 이용하자는 것이다. R1은 주로 감정의 소진, R2는 감정노동 보호체계 이런 식으로 나타낼 수 있다. 연구자가 의도에 맞게 명명을 하면 된다.
필요한 library를 불러오자
RC5는 감당하기 어려운 고객을 상대하는 것이고, RC1은 마음의 상처였다. 우선 RC5, 소진과 우울간의 관계를 설명하는지 알아보자.
어려운 고객을 상대하는 것에서 우울로 Total effect (without burnout),와 Total effect에서 direct effect를 제외한 average causal mediaion effect를 Path A, B, C를 통한 회귀분석을 하면서 알아보자.
data <- c(0, "'path B'", 0,
0, 0, 0,
"'path C'", "'path A'", 0)
M<- matrix (nrow=3, ncol=3, byrow = TRUE, data=data)
plot<- plotmat (M, pos=c(1,2),
name= c( "burnout","Engaging \nout of control", "Depression"),
box.type = "rect", box.size = 0.12, box.prop=0.5, curve=0)결측값을 제외하여 분석을 준비하자.
gg1 <-gg1 %>%
mutate(burnout = e1+e2+e3+e4+e5) %>%
filter(!is.na(burnout), !is.na(dep_score), !is.na(RC3))path A 의 회귀 분석 수행하고 \[Depression = b_{0} + b_{1}RC1 + e\]
| Estimate | Std. Error | t value | Pr(>|t|) | |
|---|---|---|---|---|
| (Intercept) | 7.597578 | 0.1291604 | 58.82283 | 0 |
| RC5 | 0.877671 | 0.1307459 | 6.71280 | 0 |
b1 = 0.8776, p <0.001로 나타났다. 즉 어려운 고객을 상대하는 것은 우울과 관계있고 회귀계수가 0.88 정도이다.
두번째는 어려운 고객을 상대하는 것인 매개변수로 여겨지는 소진을 어떻게 설명하는지 분석하는 것이다.
\[Burnout = b_{0} + b_{2}RC1 + e\]
| Estimate | Std. Error | t value | Pr(>|t|) | |
|---|---|---|---|---|
| (Intercept) | 14.2992138 | 0.0927035 | 154.246717 | 0 |
| RC5 | 0.7289394 | 0.0938415 | 7.767772 | 0 |
| `b2 = 0.7289, | p <0.001`로 나 | 타났다. 즉 어 | 려운 고객을 상 | 대하는 것은 소진과 관계있고 회귀계수가 0.73 정도이다. |
\[Depression = b_{0} + b_{3} Burnout +b_{4} RC1 + e\]
| Estimate | Std. Error | t value | Pr(>|t|) | |
|---|---|---|---|---|
| (Intercept) | -5.2686545 | 0.3585568 | -14.694057 | 0.0000000 |
| burnout | 0.8997860 | 0.0241078 | 37.323484 | 0.0000000 |
| RC5 | 0.2217815 | 0.1013842 | 2.187534 | 0.0288221 |
b3 = 0.90, p <0.001로 b4 = 0.22, p = 0.03로 나타났다. 이를 해석하기 위해 Tingley, Yamamoto, Hirose, Keele, & Imai (2014)등이 제시한 방법을 사용하자.
mediation페키지의 mediate는 ACE, average causal mediaton effects와 ADE, a direct effect 를 계산하고 그 값이 0이 아닌지의 귀무가설을 bootstrapping 방법으로 계산해 준다. 본 실습에서는 상기 방법에 대한 자세한 내용은 생략하며, 실습을 중심으로 진행한다.
exp <-
mediate(fit.M,
fit.Y,
treat = 'RC5', # 독립변수
mediator = 'burnout', # 매개변수
boot = TRUE,
sims = 500)## Running nonparametric bootstrap
##
## Causal Mediation Analysis
##
## Nonparametric Bootstrap Confidence Intervals with the Percentile Method
##
## Estimate 95% CI Lower 95% CI Upper p-value
## ACME 0.6559 0.4793 0.86 <2e-16 ***
## ADE 0.2218 0.0483 0.43 0.024 *
## Total Effect 0.8777 0.6226 1.10 <2e-16 ***
## Prop. Mediated 0.7473 0.5850 0.94 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Sample Size Used: 1950
##
##
## Simulations: 500
앞서 분석한 결과에서 b1 = 0.8776, p <0.001, b2 = 0.7289, p <0.001, b3 = 0.90, p <0.001, b4 = 0.22, p = 0.03를 기억하자. 지금 분석한 결과에서 Total Effect 0.8777 은 b1으로 어려운 고객 상대가 우울에 미치는 회귀계수이다. ADE 0.22는 b4로 3번째 모델에서 소진과 어려운 고객상대가 모형에 동시에 존재할 때 우울에 대한 감정노동 요인의 회기계수이다. 이것을 direct effect로 부른다. Total Effect에서 direct effect를 뺀 값은 0.66이고 이 값이 ACME가 된다. 해석에서 가장 중요한 부분은 b1에서 b4를 뺀 부분이 ACME라는 것이다. 또한 0.88에서 0.22로 0.66 만큼 줄었고 그 값에 대한 p value 가 0.05보다 작다는 것이다. 즉 번아웃의 매개효과의 크기가 크고 통계적으로 유의한 수준으로 존재한다.
설문지를 개발하여 나타나는 요인들을 사용할 때 주의할 점 중 하나가 매개효과에 관한 것이다. 우리가 예상했던 설문지안에는 여러 요소가 들어 있고 어떤 요소는 스트레스의 원인/반응/매개 중에 하나에 특화된 것이 있다. 예를 들어 원인은 가끔 조직적/사회적인 것을 조사하며, 반응은 매우 생물학적인 것을 대변한다. 따라서 원인과 반응간에 매개변수가 필요할 수 가 있다. 상기 매개변수를 찾는 다면, 스트레스 원인이 건강영향을 일으키는데 중재할 수 있는 지식을 발굴해 낼 수 있다.