“RMarkdown is the best tool to create reproducible reports, dynamic
documents, and dashboards in R” – Yihui Xie.
Acesse o rpubs pet_estatisticaufc para saber como
construir um documento no RMarkdown.
Pinguim Gentoo
O pinguim Gentoo (Pygoscelis papua) é uma das espécies de
pinguins mais reconhecidas e fascinantes. Ele se
destaca por sua faixa branca característica que vai de um lado ao outro
da cabeça, como uma “tiara”.
O gentoo é uma das três espécies representadas na base de dados
penguins do pacote palmerpenguins. A seguir é
mostrada uma imagem que ilustra esses pinguins.
Pinguins da base de dados penguins
A seguir é colocado um comparativo das caractrísticas dos 3
pinguins.
| Identificação |
Cabeça preta com um anel branco em volta dos olhos |
Faixa branca em forma de “tiara” na cabeça |
Faixa preta como um “capacete” que passa sob o queixo |
| Habitat |
Costa Antártica |
Ilhas subantárticas e Península Antártica |
Ilhas subantárticas e Península Antártica |
| Status de conservação |
Pouco preocupante |
Quase ameaçado |
Pouco preocupante |
Marque a seguir os pinguins que você já conhecia!
Características Físicas
- Tamanho: O gentoo é o terceiro maior pinguim,
depois do imperador e do rei.
- O imperador e o rei tem, respectivamente, 51 e 90 cm,
aproximadamente.
- Peso: Geralmente pesa entre 4,5 e 8,5 kg,
dependendo da época do ano e da disponibilidade de alimentos.
- Plumagem: Sua parte dorsal é preta, enquanto o
ventre é branco. As nadadeiras possuem um tom acinzentado.
- Bico: O bico é alaranjado brilhante, contrastando
com sua plumagem.
Conservação
- Atualmente, o pinguim-gentoo é classificado como quase ameaçado pela
IUCN devido à perda de habitat, mudanças climáticas e atividades
humanas, como pesca excessiva e turismo descontrolado.
- Esforços estão sendo feitos para proteger suas colônias e garantir a
sustentabilidade de seus habitats.
Análise exploratória
Para fazer a nossa análise, será utilizado a linguagem r. Para
utilizá-la, recomendamos a IDE RStudio.
Primeiramente, vamos baixar os pacotes palmerpenguins e
ggplot2 com o seguinte código.
install.packages("palmerpenguins")
install.packages("tidyverse")
Agora basta carregar os pacotes.
library(palmerpenguins)
library(tidyverse)
Vamos fazer uma análise focada no pinguim gentoo.
Base de dados
Na tabela seguinte é mostrado as 10 primeiras linhas da base de dados.
|
species
|
island
|
bill_length_mm
|
bill_depth_mm
|
flipper_length_mm
|
body_mass_g
|
sex
|
year
|
|
Adelie
|
Torgersen
|
39.1
|
18.7
|
181
|
3750
|
male
|
2007
|
|
Adelie
|
Torgersen
|
39.5
|
17.4
|
186
|
3800
|
female
|
2007
|
|
Adelie
|
Torgersen
|
40.3
|
18.0
|
195
|
3250
|
female
|
2007
|
|
Adelie
|
Torgersen
|
NA
|
NA
|
NA
|
NA
|
NA
|
2007
|
|
Adelie
|
Torgersen
|
36.7
|
19.3
|
193
|
3450
|
female
|
2007
|
|
Adelie
|
Torgersen
|
39.3
|
20.6
|
190
|
3650
|
male
|
2007
|
|
Adelie
|
Torgersen
|
38.9
|
17.8
|
181
|
3625
|
female
|
2007
|
|
Adelie
|
Torgersen
|
39.2
|
19.6
|
195
|
4675
|
male
|
2007
|
|
Adelie
|
Torgersen
|
34.1
|
18.1
|
193
|
3475
|
NA
|
2007
|
|
Adelie
|
Torgersen
|
42.0
|
20.2
|
190
|
4250
|
NA
|
2007
|
Como nós estamos interessados no pinguim gentoo, a seguir é colocado
todas as observações de pinguins dessa espécie.
Estatísticas descritivas
Vamos começar calculando algumas estatísticas descritivas para a
espécie gentoo.
gentoo <- penguins |>
filter(species == "Gentoo")
summary(gentoo)
## species island bill_length_mm bill_depth_mm
## Adelie : 0 Biscoe :124 Min. :40.90 Min. :13.10
## Chinstrap: 0 Dream : 0 1st Qu.:45.30 1st Qu.:14.20
## Gentoo :124 Torgersen: 0 Median :47.30 Median :15.00
## Mean :47.50 Mean :14.98
## 3rd Qu.:49.55 3rd Qu.:15.70
## Max. :59.60 Max. :17.30
## NA's :1 NA's :1
## flipper_length_mm body_mass_g sex year
## Min. :203.0 Min. :3950 female:58 Min. :2007
## 1st Qu.:212.0 1st Qu.:4700 male :61 1st Qu.:2007
## Median :216.0 Median :5000 NA's : 5 Median :2008
## Mean :217.2 Mean :5076 Mean :2008
## 3rd Qu.:221.0 3rd Qu.:5500 3rd Qu.:2009
## Max. :231.0 Max. :6300 Max. :2009
## NA's :1 NA's :1
A variância da massa corporal dessa espécie de pinguins é 643131,1. A
fórmula da variância amostral é \(s^2 =
\frac{1}{n-1} \sum_{i=1}^n (x_i - \bar{x})^2\) enquanto a
variância populacional é \[\text{Var}(X) =
\sigma^2 = \frac{1}{n} \sum_{i=1}^n (x_i - \mu)^2\]
Gráficos
Para fazer o próximo grafico baixe o pacote plotly.
install.packages("plotly")
Após baixado, carregue-o.
Os seguintes boxplots mostram a diferença do tamanho da nadadeira das
3 espécies de pinguim, evidenciando que, possivelmente, o gentoo é o
maior.
grafico1 <- penguins |>
ggplot(aes(x = species, y = flipper_length_mm))+
geom_boxplot()
ggplotly(grafico1)
