1 Introducción

Bueno, venimos usando la base de datos de los pinguinillos. Y vamos a perseverar en ello.

Vamos a usar una variable con varias categorías, que me parece que es species.

Cargamos primero los datos.

## Warning: package 'palmerpenguins' was built under R version 4.3.3
## Warning: package 'ggplot2' was built under R version 4.3.3
## Warning: package 'dplyr' was built under R version 4.3.3
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

Visualizamos un poco.

ggplot(data, aes(fill = species, y = flipper_length_mm))+
  geom_boxplot()+
  theme_light()

Bien. Intuitivamente - sin ningún número mediante - podríamos decir que la especie Gentoo pareciera comportarse de un modo diferencial en relación a la métrica índice de masa corporal. Pero testéemoslo.

2 Manos a la obra

ModeloAnova <- aov(body_mass_g ~ species, data = data)
summary(ModeloAnova)
##              Df    Sum Sq  Mean Sq F value Pr(>F)    
## species       2 145190219 72595110   341.9 <2e-16 ***
## Residuals   330  70069447   212332                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Ok, da significativo así que vamos a hacer un posthoc para ver qué onda.

3 Post Hoc análisis

TukeyHSD(ModeloAnova)
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = body_mass_g ~ species, data = data)
## 
## $species
##                        diff       lwr       upr    p adj
## Chinstrap-Adelie   26.92385 -132.3528  186.2005 0.916431
## Gentoo-Adelie    1386.27259 1252.2897 1520.2554 0.000000
## Gentoo-Chinstrap 1359.34874 1194.4304 1524.2671 0.000000

Los resultados indican que hay diferencias entre:

  • Gento vs Adelie.

  • Gento vs Chinstrap

Y no hay diferencias entre Chinstrap y Adelie, tal como vimos en el gráfico.