과제

데이터 iris는 3 가지 붓꽃(Species)의 특징 (Sepal.Length, Sepal.Width, Petal.Length, Petal.Width)에 관한 데이터이다. 붓꽃 종류(Species)별 Sepal.Width의 차이가 존재하는지를 5% 유의수준으로 검정하세요.

1. 가설 세우기

귀무가설: 종별로 Sepal.Width의 평균 차이가 없다. 대립가설: 종별로 Sepal.Width의 평균 차이가 있다.

2. 데이터 가져오기

data(iris)
dat <- iris

3. 시각화 해보기

library(ggplot2)

ggplot(dat, aes(x = Species, y = Sepal.Width)) +
  geom_boxplot() +
  labs(title = "종류별 특징 확인인", x = "종류", y = "Sepal Width")

4. 등분산 검정

library(car)
## 필요한 패키지를 로딩중입니다: carData
leveneTest(Sepal.Width ~ Species, data = dat)
## Levene's Test for Homogeneity of Variance (center = median)
##        Df F value Pr(>F)
## group   2  0.5902 0.5555
##       147

등분산 검정시 p value가 0.55로 0.05보다 크므로 귀무가설을 기각할 수 없고, 이는 분산이 동일하다는 것을 뜻한다.

5. 분산 분석

anova_result <- aov(Sepal.Width ~ Species, data = dat)
summary(anova_result)
##              Df Sum Sq Mean Sq F value Pr(>F)    
## Species       2  11.35   5.672   49.16 <2e-16 ***
## Residuals   147  16.96   0.115                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

6. 결과 분석

분산 분석 결과 p value가 0.05보다 많이 작으므로 귀무가설을 기각할 수 있다. 즉, 붓꽃의 종류(Species)에 따라 Sepal.Width의 평균값에 유의미한 차이가 존재한다.