Dados de biometrias
Os dados crus aprensentam alguns caracteres nulos, caracteres de controle que não podem ser visualizados, devendo, portanto, ser retirados. Há, assim, uma etapa de pré-processamento para retirada desses caracteres.
Ao todo são 14 variáveis para biometrias. A maioria trata de valores categóricos.
names(Biometrias)
## [1] "Código" "Identificador da ocorrência"
## [3] "Identificador do indivíduo" "Espécies - Classe"
## [5] "Espécies - Ordem" "Espécies - Subordem"
## [7] "Espécies - Família" "Espécies - Gênero"
## [9] "Espécies - Espécie" "Ficha de campo"
## [11] "Instituição executora" "Data"
## [13] "Tipo" "Responsável"
# especies <- as.factor(Biometrias$`Espécies - Espécie`)
Biometrias %>% group_by( `Espécies - Espécie`) %>% summarise( total = n()) %>% arrange( desc(total) ) %>% gt()
| Espécies - Espécie | total |
|---|---|
| Chelonia mydas | 2827 |
| Sula leucogaster | 572 |
| Sotalia guianensis | 376 |
| Phalacrocorax brasilianus | 355 |
| Fregata magnificens | 309 |
| Caretta caretta | 148 |
| Nycticorax nycticorax | 108 |
| Larus dominicanus | 106 |
| Spheniscus magellanicus | 103 |
| Ardea alba | 91 |
| Puffinus puffinus | 66 |
| Thalassarche chlororhynchos | 59 |
| Lepidochelys olivacea | 49 |
| NA | 43 |
| Ardea cocoi | 27 |
| Thalasseus acuflavidus | 21 |
| Egretta thula | 15 |
| Dermochelys coriacea | 14 |
| Steno bredanensis | 13 |
| Tursiops truncatus | 11 |
| Bubulcus ibis | 7 |
| Sterna hirundo | 7 |
| Thalasseus maximus | 7 |
| Calonectris diomedea | 6 |
| Eretmochelys imbricata | 6 |
| Pontoporia blainvillei | 5 |
| Procellaria aequinoctialis | 5 |
| Butorides striata | 4 |
| Megaptera novaeangliae | 4 |
| Egretta caerulea | 3 |
| Stenella frontalis | 3 |
| Calidris alba | 2 |
| Macronectes giganteus | 2 |
| Nyctanassa violacea | 2 |
| Oceanites oceanicus | 2 |
| Thalassarche melanophris | 2 |
| Vanellus chilensis | 2 |
| Aramides saracura | 1 |
| Arctocephalus australis | 1 |
| Delphinus delphis | 1 |
| Gallinula angulata | 1 |
| Halobaena caerulea | 1 |
| Ixobrychus involucris | 1 |
| Pterodroma mollis | 1 |
| Puffinus gravis | 1 |
| Stenella longirostris | 1 |
| Stercorarius longicaudus | 1 |
| Sterna hirundinacea | 1 |
# sort(table(especies))
# tipo <- as.factor(Biometrias$Tipo)
#sort(table(tipo))
Biometrias %>% group_by(Tipo) %>% summarise( total = n() ) %>% arrange(desc(total)) %>% gt()
| Tipo | total |
|---|---|
| Quelônio | 3052 |
| Aves voadoras | 1810 |
| Odontoceti | 423 |
| Aves não voadoras | 103 |
| Mysticeti | 4 |
| Pinípedes | 1 |
ggplot(Biometrias, aes(x=Tipo) ) + geom_bar() + ggtitle("Biometrias") + xlab("Tipo") + ylab("Atendimentos")
Também conhecidas como tartarugas marinhas.
Neste caso as variáveis são em sua maioria medidas contínuas, relativas ao tamanho, peso, etc…
names(Quelonio)
## [1] "Código"
## [2] "Identificador da ocorrência"
## [3] "Identificador do indivíduo"
## [4] "Espécies - Classe"
## [5] "Espécies - Ordem"
## [6] "Espécies - Subordem"
## [7] "Espécies - Família"
## [8] "Espécies - Gênero"
## [9] "Espécies - Espécie"
## [10] "Ficha de campo"
## [11] "Instituição executora"
## [12] "Data"
## [13] "Tipo"
## [14] "Responsável"
## [15] "Comprimento total (cm)"
## [16] "Comprimento curvilíneo carapaça (cm)"
## [17] "Largura máxima curvilínea carapaça (cm)"
## [18] "Comprimento curvilíneo plastrão (cm)"
## [19] "Largura máxima curvilínea plastrão (cm)"
## [20] "Comprimento cabeça (cm)"
## [21] "Largura máxima cabeça (cm)"
## [22] "Comprimento cloaca ao final cauda (cm)"
## [23] "Comprimento plastrão ao final cauda (cm)"
## [24] "Peso total (kg)"
Contagem dos dados categóricos para espécies de tartaruga marinha. Nota-se que algumas não puderam ser identificadas, provavelmente por estarem em fase avançada de putrefação.
Quelonio %>%
group_by(`Espécies - Espécie`) %>%
summarise(total = n()) %>%
arrange( desc(total) ) %>%
gt()
| Espécies - Espécie | total |
|---|---|
| Chelonia mydas | 2827 |
| Caretta caretta | 148 |
| Lepidochelys olivacea | 49 |
| Dermochelys coriacea | 14 |
| NA | 7 |
| Eretmochelys imbricata | 6 |
| Thalassarche chlororhynchos | 1 |
Valores médios dos parâmetros medidos, agrupado por espécie.
grupos <- Quelonio %>%
group_by(`Espécies - Espécie`)
grupos %>%
summarise(
Total = n(),
comprimento_medio = mean(`Comprimento total (cm)`, na.rm = T),
carapaca_media = mean(`Comprimento curvilíneo carapaça (cm)`, na.rm = T)
) %>%
filter(Total > 10) %>%
gt()
| Espécies - Espécie | Total | comprimento_medio | carapaca_media |
|---|---|---|---|
| Caretta caretta | 148 | 103.72500 | 77.89141 |
| Chelonia mydas | 2827 | 52.45906 | 40.31884 |
| Dermochelys coriacea | 14 | 186.55714 | 140.69286 |
| Lepidochelys olivacea | 49 | 84.80000 | 65.02045 |
Como existe um alto número de exemplares da espécie Chelonia Mydas, é de interesse obeservar sua distribuição no diversos parâmetros. Tratando-a à parte das demais espécies.
mydas <- Quelonio %>% filter(`Espécies - Espécie` == 'Chelonia mydas')
ggplot(mydas, aes(x = `Comprimento total (cm)`)) + geom_histogram( na.rm = T, bins = 50)
Usando os gráficos de whiskers (que mostra a variância, média mediana e outliers).
whisk_plot <- function(col_var) {
grupos %>%
filter( !is.na(`Espécies - Espécie`) ) %>%
group_by(`Espécies - Espécie`) %>%
ggplot(aes(y = !! col_var , fill=factor(`Espécies - Espécie`))) + geom_boxplot( na.rm = T)
}
whisk_plot(quo(`Comprimento total (cm)`))
whisk_plot(quo(`Comprimento cabeça (cm)`))
whisk_plot(quo(`Largura máxima curvilínea plastrão (cm)`))
Algumas coisas podem começar a ser exploradas como correlacionadas, por exemplo, descobrir como o comprimento afeta a largura do plastrão. A relação é a mesma em diferentes espécies ? Existem medidas indiretas que podem ser tomadas para melhor correlação, exemplo, largura máxima x comprimento máximo (área virtual) x comprimento total ?
mydas %>%
ggplot(aes(x = `Largura máxima curvilínea carapaça (cm)`, y= `Comprimento total (cm)`)) + geom_point( na.rm = T)
mydas %>%
ggplot(aes(x = `Largura máxima cabeça (cm)`, y = `Comprimento cabeça (cm)`)) + geom_point(na.rm = T)