R은 시각화가 뛰어난 프로그램이다. 그렇지만 사회과학에서 많이 사용하는 모델을 그려주는 패키지가 영 시원치 않아서 직접 만들어 보았다(물론 내가 만든것도 시원치 않다). 단순매개 모형부터 시작하였다. 매개 모형 그림을 그리기 위해서는 아래 내용이 필요 하다. 1) 세가지 변수의 변수명을 넣을 그림판 2) 변수명 3) 유의도에 따른 화살표 4) 회귀계수와 유의도에 따른 표기(***)

##1. 세가지 변수의 변수명을 넣을 그림판 단순매개 모형은 세 변수를 삼각형 모양으로 그리곤 한다. 그러기 위한 코드는 아래와 같다.

plot(0, xlim= c(-5,5), ylim=c(-5,5), col= "#FFFFFF", xlab="", ylab="", xaxt='n', yaxt='n') ##아무것도 없는 흰색 판
rect(-4,-4,-2,-2, lwd = 2) ##독립변수 사각형
rect(-1,2,1,4, lwd = 2) ##매개변수 사각형
rect(2,-4,4,-2, lwd = 2) ##종속속변수 사각형

구조방정식을 사용해서 잠재변수를 사용할 경우 rect 대신 원형을 그리면 된다.

##2. 변수명 데이터에서 변수명을 뽑아내야 저 모델 이미지에 넣을 수 있다. 간단히 colnames함수를 쓰면 된다. 이를 바탕으로 데이터에서 변수명을 뽑는 함수를 만들어 보았다.

var_name<-function(indi1, medi1, depen, dd){ ###각각 독립변수, 매개변수, 종소변수가 몇번째 열에 있는지 쓰면 된다. 마지막은 dataframe을 넣으면 된다.
  var_name_sum<-c()
  var_name_sum[1]<-colnames(dd[indi1])
  var_name_sum[2]<-colnames(dd[medi1])
  var_name_sum[3]<-colnames(dd[depen])
  print(var_name_sum)
}

한번 적용해보자

#적용
##가짜 데이터 만들기
독립변수<-rnorm(100)
매개변수<-rnorm(100) + 독립변수
종속변수<-독립변수+매개변수+rnorm(100,0,2)
d<-data.frame(독립변수, 매개변수, 종속변수)

##변수명 뽑아내기
var_name(1,2,3,d) ##각 열이 몇번째인지 알아야 가능하다.
[1] "독립변수" "매개변수" "종속변수"

변수명을 뽑아냈으니 이를 그래프에 그려보자.

#빈 서판
plot(0, xlim= c(-5,5), ylim=c(-5,5), col= "#FFFFFF", xlab="", ylab="", xaxt='n', yaxt='n') ##아무것도 없는 흰색 판
rect(-4,-4,-2,-2, lwd = 2) ##독립변수 사각형
rect(-1,2,1,4, lwd = 2) ##매개변수 사각형
rect(2,-4,4,-2, lwd = 2) ##종속속변수 사각형

#변수명 넣어보기
  var_name_sum<-var_name(1, 2, 3, d)
[1] "독립변수" "매개변수" "종속변수"
  text(-3,-3, labels = var_name_sum[1], cex= 2)
  text(0,3, labels = var_name_sum[2], cex= 2)
  text(3,-3, labels = var_name_sum[3], cex= 2)

##3. 유의도에 따른 화살표 흔히 유의할 경우 실선으로 그리고 아닐경우 점선으로 그리곤 한다. 그래서 이를 고려하여 작성하면 다음과 같다. 일단 이 그림을 그리려면 두가지 회귀 모델이 있어야 한다. 첫번째는 매개~독립이고 두번째는 종속~ 독립+ 매개이다. 여기 작성한 코드 자체가 변수 순서를 바탕으로 추출하기 때문에 아래 순서를 벗어나면 다른 결과가 나오니 주의해야 한다. 일단 모델 부터 만들어보자

#가짜 데이터 만들기
x<-rnorm(100)
me<-rnorm(100) + x
y<-x+me+rnorm(100,0,2)
cont1<-rnorm(100)
d<-data.frame(x, me, y, cont1)

#회귀모델 만들기
lm1<-lm(me~x + cont1, data= d) #매개~독립 + 통제변인

lm2<-lm(y~x+me + cont1, data = d) #종속 ~ 매개 + 독립 + 통제변인

summary(lm1)

Call:
lm(formula = me ~ x + cont1, data = d)

Residuals:
    Min      1Q  Median      3Q     Max 
-2.4693 -0.7100  0.1238  0.7080  2.0952 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) -0.09498    0.10183  -0.933    0.353    
x            1.11801    0.11366   9.837 3.02e-16 ***
cont1       -0.14010    0.10309  -1.359    0.177    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 1.015 on 97 degrees of freedom
Multiple R-squared:  0.5006,    Adjusted R-squared:  0.4903 
F-statistic: 48.62 on 2 and 97 DF,  p-value: 2.366e-15
summary(lm2)

Call:
lm(formula = y ~ x + me + cont1, data = d)

Residuals:
    Min      1Q  Median      3Q     Max 
-3.9772 -1.4470 -0.1586  1.1932  4.7461 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) -0.14764    0.21540  -0.685  0.49475    
x            0.90837    0.33829   2.685  0.00854 ** 
me           1.00058    0.21383   4.679 9.43e-06 ***
cont1        0.04925    0.21916   0.225  0.82268    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 2.137 on 96 degrees of freedom
Multiple R-squared:  0.4986,    Adjusted R-squared:  0.483 
F-statistic: 31.83 on 3 and 96 DF,  p-value: 2.274e-14

그다음 필요한 파라미터를 추출하는 함수를 작성하였다. 추출 파라미터는 회귀계수와 p-value다.

  medi_model_coe1<-function(lm1,lm2){
    mo_me<-summary(lm1)
    mo_me_d<-as.data.frame(mo_me[4])
    coe1<-mo_me_d[2,1]
    p_val1<-mo_me_d[2,4]
    
    mo_me2<-summary(lm2)
    mo_me_d2<-as.data.frame(mo_me2[4])
    coe2<-mo_me_d2[3,1]###y~me
    coe3<-mo_me_d2[2,1]###y~x
    p_val2<-mo_me_d2[3,4]
    p_val3<-mo_me_d2[2,4]
    para_sum<-c(coe1,coe2, coe3, p_val1, p_val2,p_val3)
  }
mm<-medi_model_coe1(lm1, lm2)
print(round(mm,3))
[1] 1.118 1.001 0.908 0.000 0.000 0.009

화살표는 arrows함수를 쓰면 된다. 이름처럼 회살표다. 다만 이경우 선 종류(lty= )을 유의하면 1 유의하지 않으면 2(점선)으로 그리도록 조건문을 썼다. arrows(x좌표, y좌표)이기 때문에 나중에 변경하려면 좌표를 이동해야한다. 수학 모르는 문과라 꼭짓점 좌표를 다 구했다…ㅠㅠ 1))이건 모두 유의하게 나온경우이다.

#빈 서판
plot(0, xlim= c(-5,5), ylim=c(-5,5), col= "#FFFFFF", xlab="", ylab="", xaxt='n', yaxt='n') ##아무것도 없는 흰색 판
rect(-4,-4,-2,-2, lwd = 2) ##독립변수 사각형
rect(-1,2,1,4, lwd = 2) ##매개변수 사각형
rect(2,-4,4,-2, lwd = 2) ##종속속변수 사각형

#변수명 넣어보기
  var_name_sum<-var_name(1, 2, 3, d)
[1] "x"  "me" "y" 
  text(-3,-3, labels = var_name_sum[1], cex= 2)
  text(0,3, labels = var_name_sum[2], cex= 2)
  text(3,-3, labels = var_name_sum[3], cex= 2)
#유의도에 따른 화살표 넣어보기
arrows(-3,-2, -1.05,3, lwd=2, length = 0.15, lty = ifelse(mm[4]<=.05,1,2))
arrows(1,3, 3,-1.8, lwd=2, length = 0.15, lty = ifelse(mm[5]<=.05,1,2))
arrows(-2,-3, 2,-3, lwd=2, length = 0.15, lty = ifelse(mm[6]<=.05,1,2))

2))요건 유의하지 않은거다

x<-rnorm(1000)
me<-rnorm(1000)
y<-rnorm(100,0,2)
cont1<-rnorm(100)
d<-data.frame(x, me, y, cont1)

#회귀모델 만들기
lm1<-lm(me~x + cont1, data= d) #매개~독립 + 통제변인

lm2<-lm(y~x+me + cont1, data = d) #종속 ~ 매개 + 독립 + 통제변인
mm<-medi_model_coe1(lm1, lm2)

#빈 서판
plot(0, xlim= c(-5,5), ylim=c(-5,5), col= "#FFFFFF", xlab="", ylab="", xaxt='n', yaxt='n') ##아무것도 없는 흰색 판
rect(-4,-4,-2,-2, lwd = 2) ##독립변수 사각형
rect(-1,2,1,4, lwd = 2) ##매개변수 사각형
rect(2,-4,4,-2, lwd = 2) ##종속속변수 사각형

#변수명 넣어보기
  var_name_sum<-var_name(1, 2, 3, d)
[1] "x"  "me" "y" 
  text(-3,-3, labels = var_name_sum[1], cex= 2)
  text(0,3, labels = var_name_sum[2], cex= 2)
  text(3,-3, labels = var_name_sum[3], cex= 2)
#유의도에 따른 화살표 넣어보기
arrows(-3,-2, -1.05,3, lwd=2, length = 0.15, lty = ifelse(mm[4]<=.05,1,2))
arrows(1,3, 3,-1.8, lwd=2, length = 0.15, lty = ifelse(mm[5]<=.05,1,2))
arrows(-2,-3, 2,-3, lwd=2, length = 0.15, lty = ifelse(mm[6]<=.05,1,2))

##4. 회귀계수와 유의도에 따른 표기(***) 마지막으로 각 화살표에 필요한 계수와 p-value를 표기 하였다. 첫번째로 비표준화 회귀계수를 넣어 보았다.

x<-rnorm(1000)
me<-rnorm(1000)
y<-rnorm(100,0,2)
cont1<-rnorm(100)
d<-data.frame(x, me, y, cont1)

#회귀모델 만들기
lm1<-lm(me~x + cont1, data= d) #매개~독립 + 통제변인

lm2<-lm(y~x+me + cont1, data = d) #종속 ~ 매개 + 독립 + 통제변인
mm<-medi_model_coe1(lm1, lm2)

#빈 서판
plot(0, xlim= c(-5,5), ylim=c(-5,5), col= "#FFFFFF", xlab="", ylab="", xaxt='n', yaxt='n') ##아무것도 없는 흰색 판
rect(-4,-4,-2,-2, lwd = 2) ##독립변수 사각형
rect(-1,2,1,4, lwd = 2) ##매개변수 사각형
rect(2,-4,4,-2, lwd = 2) ##종속속변수 사각형

#변수명 넣어보기
  var_name_sum<-var_name(1, 2, 3, d)
[1] "x"  "me" "y" 
  text(-3,-3, labels = var_name_sum[1], cex= 2)
  text(0,3, labels = var_name_sum[2], cex= 2)
  text(3,-3, labels = var_name_sum[3], cex= 2)
#유의도에 따른 화살표 넣어보기
arrows(-3,-2, -1.05,3, lwd=2, length = 0.15, lty = ifelse(mm[4]<=.05,1,2))
arrows(1,3, 3,-1.8, lwd=2, length = 0.15, lty = ifelse(mm[5]<=.05,1,2))
arrows(-2,-3, 2,-3, lwd=2, length = 0.15, lty = ifelse(mm[6]<=.05,1,2))
#유의도에 따라 별표 넣기
text(-2.5,1, paste0("b=",round(mm[1], 3), ifelse(mm[4]>=.05, ", ns", ifelse(mm[4]<.05 & mm[4]>=.01, "*", 
                                                                          ifelse(mm[4]<.01 & mm[4]>=.001,"**","***")))), srt=56)
text(0,-4, paste0("b=",round(mm[3], 3), ifelse(mm[6]>=.05, ", ns", ifelse(mm[6]<.05 & mm[6]>=.01, "*", 
                                                                          ifelse(mm[6]<.01 & mm[6]>=.001,"**","***")))), srt=0)
text(2.5,1, paste0("b=",round(mm[2], 3), ifelse(mm[5]>=.05, ", ns", ifelse(mm[5]<.05 & mm[5]>=.01, "*", 
                                                                         ifelse(mm[5]<.01 & mm[5]>=.001,"**","***")))), srt=-56)

##4. <종합> 위에 나온 과정을 한방에 진행하는 코드다.

##medi_model(독립변수 열번호, 매개변수 열번호, 종속변수 열번호, 데이터, 매개~독립모델, 종속~독립모델)

medi_model<-function(indi1, medi1, depen, dd, lm1, lm2){
  medi_model_coe1<-function(lm1,lm2){
    mo_me<-summary(lm1)
    mo_me_d<-as.data.frame(mo_me[4])
    coe1<-mo_me_d[2,1]
    p_val1<-mo_me_d[2,4]
    
    mo_me2<-summary(lm2)
    mo_me_d2<-as.data.frame(mo_me2[4])
    coe2<-mo_me_d2[3,1]###y~me
    coe3<-mo_me_d2[2,1]###y~x
    p_val2<-mo_me_d2[3,4]
    p_val3<-mo_me_d2[2,4]
    para_sum<-c(coe1,coe2, coe3, p_val1, p_val2,p_val3)
  }
  mm<-medi_model_coe1(lm1, lm2)
  
  plot(0, xlim= c(-10,10), ylim=c(-10,10), col= "#FFFFFF", xlab="", ylab="",xaxt='n', yaxt='n')
rect(-8,-8,-4,-4, lwd = 2)
rect(-2,5,2,9, lwd = 2)
rect(8,-8,4,-4, lwd = 2)
arrows(-6,-4, -2.2,7, lwd=2, length = 0.15, lty = ifelse(mm[4]<=.05,1,2))
arrows(2,7,6,-4, lwd=2, length = 0.15, lty = ifelse(mm[5]<=.05,1,2))
arrows(-4,-6,4,-6, lwd=2, length = 0.15, lty = ifelse(mm[6]<=.05,1,2))
var_name<-function(indi1, medi1, depen, dd){
  var_name_sum<-c()
  var_name_sum[1]<-colnames(dd[indi1])
  var_name_sum[2]<-colnames(dd[medi1])
  var_name_sum[3]<-colnames(dd[depen])
  print(var_name_sum)
}
var_name_sum<-var_name(indi1, medi1, depen, dd)
text(-6,-6, labels = var_name_sum[1], cex= 2)
text(0,7, labels = var_name_sum[2], cex= 2)
text(6,-6, labels = var_name_sum[3], cex= 2)

text(-5,1, paste0("b=",round(mm[1], 3), ifelse(mm[4]>=.05, ", ns", ifelse(mm[4]<.05 & mm[4]>=.01, "*", 
                                                                          ifelse(mm[4]<.01 & mm[4]>=.001,"**","***")))), srt=56)
text(0,-7, paste0("b=",round(mm[3], 3), ifelse(mm[6]>=.05, ", ns", ifelse(mm[6]<.05 & mm[6]>=.01, "*", 
                                                                          ifelse(mm[6]<.01 & mm[6]>=.001,"**","***")))), srt=0)
text(5,1, paste0("b=",round(mm[2], 3), ifelse(mm[5]>=.05, ", ns", ifelse(mm[5]<.05 & mm[5]>=.01, "*", 
                                                                         ifelse(mm[5]<.01 & mm[5]>=.001,"**","***")))), srt=-56)
}

#test
아침밥<-rnorm(100)
점심밥<-x+rnorm(100)
저녁밥<-me +rnorm(100)
d<-data.frame(아침밥, 점심밥, 저녁밥)
lm1<-lm(me~x, d)
lm2<-lm(y~x + me , d)
medi_model(1,2,3,d,lm1,lm2)
[1] "아침밥" "점심밥" "저녁밥"

흔히 말하는 완죤매개다(난 이표현 싫어한다. )

