Os Penguins de Palmer na Antártica

Authors
Affiliations

Orlando Hernández

Café {eco}digo

Orientadora

Published

October 6, 2027

##| echo: true
library(PenguinR)  # for data
Warning: pacote 'PenguinR' foi compilado no R versão 4.5.3
library(tidyverse)  # for data wrangling and visualization
Warning: pacote 'tidyverse' foi compilado no R versão 4.5.1
Warning: pacote 'ggplot2' foi compilado no R versão 4.5.1
Warning: pacote 'dplyr' foi compilado no R versão 4.5.1
library(knitr)      # for tables
#library(broom)      # for model summary tidy(modelo)
penguins_df <- PenguinR::penguins_df
#penguins_df

Resumo

O conjunto de dados penguins_df contém medições morfológicas de 344 pinguins adultos pertencentes a 3 espécies, amostrados em três ilhas do arquipélago Palmer, na Antártica (jadhav2022?; jadhav2022a?) . Para cada indivíduo foram registradas variáveis como o comprimento e a profundidade do bico, o comprimento da nadadeira, a massa corporal, o sexo e o ano de observação. As species são Adelie, Gentoo, Chinstrap. Você pode conseguir esta informação e outras no summary do pacote PenguinsR.

Conhecendo os pinguins

Na Table 1 resumimos o comprimento da nadadeira e da massa corporal para cada sexo por especie.

peng_df %>%
  filter(!is.na(flipper_length), !is.na(body_mass)) %>%
  group_by(species, sex) %>%
  summarise(
    mean_flipper = mean(flipper_length, na.rm = TRUE),
    mean_mass = mean(body_mass, na.rm = TRUE),
    .groups = "drop") %>% 
  kable(digits = 2,
        align = "cccc")
Table 1: Principais atributos que discriminam as especies de pinguins de Palmer.
species sex mean_flipper mean_mass
Adelie f 187.79 3368.84
Adelie m 192.41 4043.49
Chinstrap f 191.74 3527.21
Chinstrap m 199.91 3938.97
Gentoo f 212.71 4679.74
Gentoo m 221.54 5484.84

Tests ANOVA

Na biología gostamos de fazer comparações com algum suporte estatístico! Na Table 2 queremos saber se a media do comprimento da nadadeira e da biomassa são diferentes entre as espécies dos pinguins.

#Anova nadadeira
anova_flipper <- summary(
  aov(flipper_length_mm ~ species, data = penguins_df))[[1]]

# Transformar em data frames
anova_flipper <- data.frame(
  Variavel = "Comprimento da nadadeira",
  DF = anova_flipper$Df[1],
  SM = anova_flipper$`Sum Sq`[1],
  F = anova_flipper$`F value`[1],
  pvalue = anova_flipper$`Pr(>F)`[1])

#Anova massa corporal
anova_mass <- summary(
  aov(body_mass_g ~ species, data = penguins_df))[[1]]



anova_mass <- data.frame(
  Variável = "Massa corporal",
  DF = anova_mass$Df[1],
  SM = anova_mass$`Sum Sq`[1],
  F = anova_mass$`F value`[1],
  pvalue = anova_mass$`Pr(>F)`[1])

# Unir resultados
anova_tab <- bind_rows(anova_flipper, anova_mass)

# Tabela
kable(anova_tab,
      digits = 3,
      align = "lcccccc")
Table 2: Diferenças do comprimento da nadadeira e da massa corporal entre as especies de pinguins.
Variavel DF SM F pvalue Variável
Comprimento da nadadeira 2 52473.28 594.802 0 NA
NA 2 146864214.16 343.626 0 Massa corporal

Todos os pinguins são diferentes?

Entendimos que os comprimentos das nadadeiras e as massas corporais são diferentes entre os pinguins… Maas, são as três especies diferentes? há alguma especie que tenha um comprimento de nadadeira ou massa corporal semelhante com outra especie? Há dois caminhos, um deles é numérico e o outro visual. Na Figure 1 Usaremos o caminho visual para entender a distribuição da nadadeira e da massa corporal entre as três especies de pinguins.

ggplot(peng_df, aes(x = flipper_length, y = body_mass, color = species, shape = sex)) +
  geom_point(size = 2, alpha = 0.8) +
  geom_smooth(method = "lm", se = FALSE, linetype = "dashed", color = "black") +
  labs(
    title = "",
    subtitle = "",
    x = " ",
    y = "",
    color = "Species",
    shape = "Sex"
  ) +
  theme_minimal() +
  theme(
    plot.title = element_text(face = "bold"),
    axis.text.x = element_text(angle = 45, hjust = 1)
  )
Figure 1: Distribuição do comprimento da nadadeira e da massa corporal entre as três especies de pinguins de Palmer.

Referências

(Perez 2025)

References

Perez, Juan Pablo Vargas. 2025. “PenguinR: A Comprehensive Collection of Penguin Datasets for Statistical Analysis and Experimental Design.” https://github.com/jpablovargas340/PenguinR.