Palmer Penguins 패키지 설치 install.packages(“palmerpenguins”)
패키지 로드 및 데이터셋 확인 library(palmerpenguins)
데이터셋 로드 data(“penguins”)
head(penguins)
## # A tibble: 6 × 8
## species island bill_length_mm bill_depth_mm flipper_length_mm body_mass_g
## <fct> <fct> <dbl> <dbl> <int> <int>
## 1 Adelie Torgersen 39.1 18.7 181 3750
## 2 Adelie Torgersen 39.5 17.4 186 3800
## 3 Adelie Torgersen 40.3 18 195 3250
## 4 Adelie Torgersen NA NA NA NA
## 5 Adelie Torgersen 36.7 19.3 193 3450
## 6 Adelie Torgersen 39.3 20.6 190 3650
## # ℹ 2 more variables: sex <fct>, year <int>
1. 데이터 전처리 펭귄의 종 (Species)과 발견된 섬 (Island) 변수만을 사용하여 데이터프레임 만들기 결측치를 포함한 행을 제거하기.
summary(penguins_clean)
## species island
## Adelie :152 Biscoe :168
## Chinstrap: 68 Dream :124
## Gentoo :124 Torgersen: 52
2. 교차표 만들기
print(penguins_table)
##
## Biscoe Dream Torgersen
## Adelie 44 56 52
## Chinstrap 0 68 0
## Gentoo 124 0 0
3. 카이제곱 검정 수행
print(chi_test)
##
## Pearson's Chi-squared test
##
## data: penguins_table
## X-squared = 299.55, df = 4, p-value < 2.2e-16
4. 결과 해석
if (chi_test$p.value < 0.05) {
print("p-value < 0.05 → 펭귄의 종과 발견된 섬 간에 유의미한 관계가 있음.")
} else {
print("p-value >= 0.05 → 펭귄의 종과 발견된 섬 간에 유의미한 관계 없음.")
}
## [1] "p-value < 0.05 → 펭귄의 종과 발견된 섬 간에 유의미한 관계가 있음."