t 검정 - 두 집단의 평균 비교

t 검정(t-test)은 두 집단의 평균에 통계적으로 유의한 차이가 있는지 알아볼 때 사용하는 통계분석 기법. t.test() 사용

1.compact 자동차와 suv 자동차의 도시 연비 t 검정

소형차와 SUV 가 도시 연비에서 통계적으로 유의한 차이가 있는지?

mpg <- as.data.frame(ggplot2::mpg)
mpg_diff <- mpg %>% 
  select(class, cty) %>% 
  filter(class %in% c("compact", "suv"))

table(mpg_diff$class)
## 
## compact     suv 
##      47      62
t.test(data = mpg_diff, cty ~ class, var.equal = T) # 집단간 분산이 같다고 가정
## 
##  Two Sample t-test
## 
## data:  cty by class
## t = 11.917, df = 107, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  5.525180 7.730139
## sample estimates:
## mean in group compact     mean in group suv 
##              20.12766              13.50000
  • p-value < 2.2e-16 : compact 와 SUV 간 평균도시 연비 차이가 통계적으로 유의함.

2. 일반 휘발유와 고급 휘발유의 도시연비 t 검정

일반휘발유(Regular)를 사용하는 자동차와 고급휘발류(Premium)를 사용하는 자동차 간 도시 연비 차이가 통계적으로 유의한지?

mpg_diff2 <- mpg %>% 
  select(fl, cty) %>% 
  filter(fl %in% c("r", "p")) # r:regular, p:premium

table(mpg_diff2$fl)
## 
##   p   r 
##  52 168
t.test(data = mpg_diff2, cty ~ fl, var.equal = T)
## 
##  Two Sample t-test
## 
## data:  cty by fl
## t = 1.0662, df = 218, p-value = 0.2875
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -0.5322946  1.7868733
## sample estimates:
## mean in group p mean in group r 
##        17.36538        16.73810
  • p-value 가 유의수준 0.05% 보다 큰 0.2875 : 일반 휘발유와 고급휘발유를 사용하는 자동차 간 도시 연비 차이가 통계적으로 유의하지 않음.