Introdução ao RMarkdown


“RMarkdown is the best tool to create reproducible reports, dynamic documents, and dashboards in R” – Yihui Xie.


Acesse o rpubs pet_estatisticaufc para saber como construir um documento no RMarkdown.


1 Pinguim Gentoo

O pinguim Gentoo (Pygoscelis papua) é uma das espécies de pinguins mais reconhecidas e fascinantes. Ele se destaca por sua faixa branca característica que vai de um lado ao outro da cabeça, como uma “tiara”.

O gentoo é uma das três espécies representadas na base de dados penguins do pacote palmerpenguins. A seguir é mostrada uma imagem que ilustra esses pinguins.

Pinguins da base de dados penguins
Pinguins da base de dados penguins


A seguir é colocado um comparativo das caractrísticas dos 3 pinguins.

Característica Adelie Gentoo Chinstrap
Identificação Cabeça preta com um anel branco em volta dos olhos Faixa branca em forma de “tiara” na cabeça Faixa preta como um “capacete” que passa sob o queixo
Habitat Costa Antártica Ilhas subantárticas e Península Antártica Ilhas subantárticas e Península Antártica
Status de conservação Pouco preocupante Quase ameaçado Pouco preocupante

Marque a seguir os pinguins que você já conhecia!

1.1 Características Físicas

  • Tamanho: O gentoo é o terceiro maior pinguim, depois do imperador e do rei.
    • O imperador e o rei tem, respectivamente, 51 e 90 cm, aproximadamente.
  • Peso: Geralmente pesa entre 4,5 e 8,5 kg, dependendo da época do ano e da disponibilidade de alimentos.
  • Plumagem: Sua parte dorsal é preta, enquanto o ventre é branco. As nadadeiras possuem um tom acinzentado.
  • Bico: O bico é alaranjado brilhante, contrastando com sua plumagem.

1.2 Conservação

  1. Atualmente, o pinguim-gentoo é classificado como quase ameaçado pela IUCN devido à perda de habitat, mudanças climáticas e atividades humanas, como pesca excessiva e turismo descontrolado.
  2. Esforços estão sendo feitos para proteger suas colônias e garantir a sustentabilidade de seus habitats.

2 Análise exploratória

Para fazer a nossa análise, será utilizado a linguagem r1. Para utilizá-la, recomendamos a IDE RStudio.

Primeiramente, vamos baixar os pacotes palmerpenguins e ggplot2 com o seguinte código.

install.packages("palmerpenguins")
install.packages("tidyverse")

Agora basta carregar os pacotes.

library(palmerpenguins)
library(tidyverse)

Vamos fazer uma análise focada no pinguim gentoo.

2.1 Base de dados

Na tabela seguinte é mostrado as 10 primeiras linhas da base de dados.
species island bill_length_mm bill_depth_mm flipper_length_mm body_mass_g sex year
Adelie Torgersen 39.1 18.7 181 3750 male 2007
Adelie Torgersen 39.5 17.4 186 3800 female 2007
Adelie Torgersen 40.3 18.0 195 3250 female 2007
Adelie Torgersen NA NA NA NA NA 2007
Adelie Torgersen 36.7 19.3 193 3450 female 2007
Adelie Torgersen 39.3 20.6 190 3650 male 2007
Adelie Torgersen 38.9 17.8 181 3625 female 2007
Adelie Torgersen 39.2 19.6 195 4675 male 2007
Adelie Torgersen 34.1 18.1 193 3475 NA 2007
Adelie Torgersen 42.0 20.2 190 4250 NA 2007


Como nós estamos interessados no pinguim gentoo, a seguir é colocado todas as observações de pinguins dessa espécie.

2.2 Estatísticas descritivas

Vamos começar calculando algumas estatísticas descritivas para a espécie gentoo.

gentoo <- penguins |> 
  filter(species == "Gentoo")
summary(gentoo)
##       species          island    bill_length_mm  bill_depth_mm  
##  Adelie   :  0   Biscoe   :124   Min.   :40.90   Min.   :13.10  
##  Chinstrap:  0   Dream    :  0   1st Qu.:45.30   1st Qu.:14.20  
##  Gentoo   :124   Torgersen:  0   Median :47.30   Median :15.00  
##                                  Mean   :47.50   Mean   :14.98  
##                                  3rd Qu.:49.55   3rd Qu.:15.70  
##                                  Max.   :59.60   Max.   :17.30  
##                                  NA's   :1       NA's   :1      
##  flipper_length_mm  body_mass_g       sex          year     
##  Min.   :203.0     Min.   :3950   female:58   Min.   :2007  
##  1st Qu.:212.0     1st Qu.:4700   male  :61   1st Qu.:2007  
##  Median :216.0     Median :5000   NA's  : 5   Median :2008  
##  Mean   :217.2     Mean   :5076               Mean   :2008  
##  3rd Qu.:221.0     3rd Qu.:5500               3rd Qu.:2009  
##  Max.   :231.0     Max.   :6300               Max.   :2009  
##  NA's   :1         NA's   :1

A variância da massa corporal dessa espécie de pinguins é 643131,1. A fórmula da variância amostral é \(s^2 = \frac{1}{n-1} \sum_{i=1}^n (x_i - \bar{x})^2\) enquanto a variância populacional é \[\text{Var}(X) = \sigma^2 = \frac{1}{n} \sum_{i=1}^n (x_i - \mu)^2\]

2.3 Gráficos

Para fazer o próximo grafico baixe o pacote plotly.

install.packages("plotly")

Após baixado, carregue-o.

library(plotly)

Os seguintes boxplots mostram a diferença do tamanho da nadadeira das 3 espécies de pinguim, evidenciando que, possivelmente, o gentoo é o maior.

grafico1 <- penguins |> 
  ggplot(aes(x = species, y = flipper_length_mm))+
  geom_boxplot()

ggplotly(grafico1)

Referências

Bootswatch. 2025. “Bootswatch: Free Themes for Bootstrap”. https://bootswatch.com/.

  1. O R é uma linguagem de programação e um ambiente de software livre projetado principalmente para estatística, ciência de dados, visualização e análise de dados. Criado por Ross Ihaka e Robert Gentleman no início dos anos 1990, o R é amplamente utilizado por estatísticos, cientistas de dados e analistas para explorar, modelar e comunicar insights a partir de conjuntos de dados.↩︎

