1-2-5-Exercicio

Author

Marcos Donizete de Moraes

1. Quantas linhas existem em na base de dados pinguins? E quantas colunas?

Para saber a quantidade de linhas basta executar os comandos:

library(tidyverse)
── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
✔ dplyr     1.1.4     ✔ readr     2.1.5
✔ forcats   1.0.0     ✔ stringr   1.5.1
✔ ggplot2   3.5.1     ✔ tibble    3.2.1
✔ lubridate 1.9.3     ✔ tidyr     1.3.1
✔ purrr     1.0.2     
── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
✖ dplyr::filter() masks stats::filter()
✖ dplyr::lag()    masks stats::lag()
ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
library(dados)

O dataframe pinguins encontrado no pacote dados tem 344 linhas e 8 colunas, conforme mostrado em Tibble: 344 x /

2. O que a variável profundidade_bico no data frame pinguins descreve?

Para saber o que a variável profundidade_bico descreve basta acessar a documentação da base de dados pinguins através do comando abaixo

library(dados)
pinguins
# A tibble: 344 × 8
   especie        ilha  comprimento_bico profundidade_bico comprimento_nadadeira
   <fct>          <fct>            <dbl>             <dbl>                 <int>
 1 Pinguim-de-ad… Torg…             39.1              18.7                   181
 2 Pinguim-de-ad… Torg…             39.5              17.4                   186
 3 Pinguim-de-ad… Torg…             40.3              18                     195
 4 Pinguim-de-ad… Torg…             NA                NA                      NA
 5 Pinguim-de-ad… Torg…             36.7              19.3                   193
 6 Pinguim-de-ad… Torg…             39.3              20.6                   190
 7 Pinguim-de-ad… Torg…             38.9              17.8                   181
 8 Pinguim-de-ad… Torg…             39.2              19.6                   195
 9 Pinguim-de-ad… Torg…             34.1              18.1                   193
10 Pinguim-de-ad… Torg…             42                20.2                   190
# ℹ 334 more rows
# ℹ 3 more variables: massa_corporal <int>, sexo <fct>, ano <int>

Após a execução podemos verificar que a variável produndidade_bico descreve:

“Um número inteiro que indica a profundidade do bico (em milímetros)

3. Faça um gráfico de dispersão de profundidade_bico em função de comprimento_bico. Ou seja, faça um gráfico de dispersão com profundidade_bico no eixo y e comprimento_bico no eixo x. Descreva a relação entre essas duas variáveis.

Para construir este gráfico execute o comando abaixo:

library(dados)
library(ggthemes) 
ggplot(
  data = pinguins,
  mapping = aes( x = comprimento_bico, y = profundidade_bico )
  ) + geom_point()
Warning: Removed 2 rows containing missing values or values outside the scale range
(`geom_point()`).

O resultado mostra que há uma grande dispersão com relação ao comprimento e a profundidade do bico dos pinguins, o que demonstra que não há uma correlação importante no relacionamento dessas duas variáveis.

4. O que acontece se você fizer um gráfico de dispersão de especie em função de profundidade_bico? Qual seria uma melhor escolha de geometria (geom)?

ggplot(
  data = pinguins,
  mapping = aes(
    x = especie,
    y = profundidade_bico
  )
) + geom_point()
Warning: Removed 2 rows containing missing values or values outside the scale range
(`geom_point()`).

O gráfico de dispersão não é o mais adequado para apresentar pois difuculta visualizar a distribuição da profundidade do bico em relação às espécies.

5. Por que o seguinte erro ocorre e como você poderia corrigi-lo?

#> Error in geom_point():

#> ! Problem while setting up geom.

#> ℹ Error occurred in the 1st layer.

#> Caused by error in compute_geom_1():

#> ! geom_point() requires the following missing aesthetics: x and y

Este erro occorreu porque a função geom_plot() necessita dos parâmetro x e y e estas não foram passada nem na função ggplot() e nem em si própria.