상관관계 correlation

두 집단 사이의 양, 음의 관계를 선형차트로 표현

강한 양의 상관관계

library(ggplot2)
## Warning: package 'ggplot2' was built under R version 3.5.1
var.corr <- data.frame(
  grp_1 <- 1:50,
  grp_2 <- 1:50
)
cor(
  var.corr$grp_1,
  var.corr$grp_2
)
## [1] 1

강한 음의 상관관계

var.corr <- data.frame(
  grp_1 <- 50:1,
  grp_2 <- 1:50
)
cor(
  var.corr$grp_1,
  var.corr$grp_2
)
## [1] -1

예제) 허리둘레와 패스트푸드 사이의 관계

set.seed(165)
var.weist <- sample(seq(28,33,by=0.01),size = 100)

var.weist <- var.weist[order(var.weist)] #오름차순으로 정렬

set.seed(165)
var.fastfood <- sample(c(0,0,1),size = 100, replace = T)

var.corr <- data.frame(
  var.days <- 1:100,
  var.weist,
  var.fastfood
)
var.corr[,'var.ff_cumsum'] <- cumsum(var.corr$var.fastfood) #var.ff_cumsum 누적값을 추가 

ggplot(
  data = var.corr
)+geom_line(
  aes(
    x = var.days,
    y = var.weist
  ), color = "#FFA500",
  size = 1.3
)+geom_line(
  aes(
    x = var.days,
    y = var.ff_cumsum
  ), color = "#00A0FF",
  size = 1.3
)+ theme(
  axis.text = element_text(size = 13),
  axis.text.x =  element_text(size = 16, face = 'bold'),
  axis.text.y =  element_blank()
)

cor(var.corr$var.weist,
var.corr$var.ff_cumsum)
## [1] 0.975454