Bueno, venimos usando la base de datos de los pinguinillos. Y vamos a perseverar en ello.
Vamos a usar una variable con varias categorías, que me parece que es species.
Cargamos primero los datos.
## Warning: package 'palmerpenguins' was built under R version 4.3.3
## Warning: package 'ggplot2' was built under R version 4.3.3
## Warning: package 'dplyr' was built under R version 4.3.3
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
Visualizamos un poco.
ggplot(data, aes(fill = species, y = flipper_length_mm))+
geom_boxplot()+
theme_light()
Bien. Intuitivamente - sin ningún número mediante - podríamos decir que la especie Gentoo pareciera comportarse de un modo diferencial en relación a la métrica índice de masa corporal. Pero testéemoslo.
ModeloAnova <- aov(body_mass_g ~ species, data = data)
summary(ModeloAnova)
## Df Sum Sq Mean Sq F value Pr(>F)
## species 2 145190219 72595110 341.9 <2e-16 ***
## Residuals 330 70069447 212332
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Ok, da significativo así que vamos a hacer un posthoc para ver qué onda.
TukeyHSD(ModeloAnova)
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = body_mass_g ~ species, data = data)
##
## $species
## diff lwr upr p adj
## Chinstrap-Adelie 26.92385 -132.3528 186.2005 0.916431
## Gentoo-Adelie 1386.27259 1252.2897 1520.2554 0.000000
## Gentoo-Chinstrap 1359.34874 1194.4304 1524.2671 0.000000
Los resultados indican que hay diferencias entre:
Gento vs Adelie.
Gento vs Chinstrap
Y no hay diferencias entre Chinstrap y Adelie, tal como vimos en el gráfico.