과제

Q. 펭귄의 종 (Species)과 발견된 섬 (Island) 간에 유의미한 관계가 있는가? 1. 데이터 전처리 펭귄의 종 (Species)과 발견된 섬 (Island) 변수만을 사용하여 데이터프레임 만들기 결측치를 포함한 행을 제거하기. 2. 교차표 작성 3. 카이제곱 검정 수행하기 4. 결과 해석하기 카이제곱 검정 결과 해석, p-value 바탕으로 귀무가설 기각여부 결정

1. 데이터 전처리

library(palmerpenguins)
data("penguins")
penguin_filtered <- penguins[, c("species", "island")]
penguin_filtered <- na.omit(penguin_filtered)
head(penguin_filtered)
## # A tibble: 6 × 2
##   species island   
##   <fct>   <fct>    
## 1 Adelie  Torgersen
## 2 Adelie  Torgersen
## 3 Adelie  Torgersen
## 4 Adelie  Torgersen
## 5 Adelie  Torgersen
## 6 Adelie  Torgersen

2. 교차표 작성

cross_table <- table(penguin_filtered$species, penguin_filtered$island)
print(cross_table)
##            
##             Biscoe Dream Torgersen
##   Adelie        44    56        52
##   Chinstrap      0    68         0
##   Gentoo       124     0         0

3. 가설 세우기

  • 귀무가설: 펭귄의 종과 발견된 섬 간에 유의미한 관계가 없다.
  • 대립가설: 펭귄의 종과 발견된 섬 간에 유의미한 관계가 있다.

4. 카이제곱 검정 수행하기

chi_square_test <- chisq.test(cross_table)
print(chi_square_test)
## 
##  Pearson's Chi-squared test
## 
## data:  cross_table
## X-squared = 299.55, df = 4, p-value < 2.2e-16

5. 결과 해석하기

p-value가 0.05보다 작기 때문에 귀무가설을 기각한다. 즉, 폥귄의 종과 발견된 섬 간에 유의미한 관계가 있다.