Q. 펭귄의 종 (Species)과 발견된 섬 (Island) 간에 유의미한 관계가 있는가?

head(penguins)
## # A tibble: 6 × 8
##   species island    bill_length_mm bill_depth_mm flipper_length_mm body_mass_g
##   <fct>   <fct>              <dbl>         <dbl>             <int>       <int>
## 1 Adelie  Torgersen           39.1          18.7               181        3750
## 2 Adelie  Torgersen           39.5          17.4               186        3800
## 3 Adelie  Torgersen           40.3          18                 195        3250
## 4 Adelie  Torgersen           NA            NA                  NA          NA
## 5 Adelie  Torgersen           36.7          19.3               193        3450
## 6 Adelie  Torgersen           39.3          20.6               190        3650
## # ℹ 2 more variables: sex <fct>, year <int>

1. 데이터 전처리 펭귄의 종 (Species)과 발견된 섬 (Island) 변수만을 사용하여 데이터프레임 만들기 결측치를 포함한 행을 제거하기.

summary(penguins_clean)
##       species          island   
##  Adelie   :152   Biscoe   :168  
##  Chinstrap: 68   Dream    :124  
##  Gentoo   :124   Torgersen: 52

2. 교차표 만들기

print(penguins_table)
##            
##             Biscoe Dream Torgersen
##   Adelie        44    56        52
##   Chinstrap      0    68         0
##   Gentoo       124     0         0

3. 카이제곱 검정 수행

print(chi_test)
## 
##  Pearson's Chi-squared test
## 
## data:  penguins_table
## X-squared = 299.55, df = 4, p-value < 2.2e-16

4. 결과 해석

if (chi_test$p.value < 0.05) {
  print("p-value < 0.05 → 펭귄의 종과 발견된 섬 간에 유의미한 관계가 있음.")
} else {
  print("p-value >= 0.05 → 펭귄의 종과 발견된 섬 간에 유의미한 관계 없음.")
}
## [1] "p-value < 0.05 → 펭귄의 종과 발견된 섬 간에 유의미한 관계가 있음."