Biometria

Dados de biometrias

Pré processamento

Os dados crus aprensentam alguns caracteres nulos, caracteres de controle que não podem ser visualizados, devendo, portanto, ser retirados. Há, assim, uma etapa de pré-processamento para retirada desses caracteres.

Variáveis

Ao todo são 14 variáveis para biometrias. A maioria trata de valores categóricos.

names(Biometrias)
##  [1] "Código"                      "Identificador da ocorrência"
##  [3] "Identificador do indivíduo"  "Espécies - Classe"          
##  [5] "Espécies - Ordem"            "Espécies - Subordem"        
##  [7] "Espécies - Família"          "Espécies - Gênero"          
##  [9] "Espécies - Espécie"          "Ficha de campo"             
## [11] "Instituição executora"       "Data"                       
## [13] "Tipo"                        "Responsável"

Contagens

Espécies

# especies <- as.factor(Biometrias$`Espécies - Espécie`)
Biometrias %>% group_by( `Espécies - Espécie`) %>% summarise( total = n()) %>% arrange( desc(total) ) %>% gt()
Espécies - Espécie total
Chelonia mydas 2827
Sula leucogaster 572
Sotalia guianensis 376
Phalacrocorax brasilianus 355
Fregata magnificens 309
Caretta caretta 148
Nycticorax nycticorax 108
Larus dominicanus 106
Spheniscus magellanicus 103
Ardea alba 91
Puffinus puffinus 66
Thalassarche chlororhynchos 59
Lepidochelys olivacea 49
NA 43
Ardea cocoi 27
Thalasseus acuflavidus 21
Egretta thula 15
Dermochelys coriacea 14
Steno bredanensis 13
Tursiops truncatus 11
Bubulcus ibis 7
Sterna hirundo 7
Thalasseus maximus 7
Calonectris diomedea 6
Eretmochelys imbricata 6
Pontoporia blainvillei 5
Procellaria aequinoctialis 5
Butorides striata 4
Megaptera novaeangliae 4
Egretta caerulea 3
Stenella frontalis 3
Calidris alba 2
Macronectes giganteus 2
Nyctanassa violacea 2
Oceanites oceanicus 2
Thalassarche melanophris 2
Vanellus chilensis 2
Aramides saracura 1
Arctocephalus australis 1
Delphinus delphis 1
Gallinula angulata 1
Halobaena caerulea 1
Ixobrychus involucris 1
Pterodroma mollis 1
Puffinus gravis 1
Stenella longirostris 1
Stercorarius longicaudus 1
Sterna hirundinacea 1
# sort(table(especies))

Biometrias por categorias (Tipos)

# tipo <- as.factor(Biometrias$Tipo)
#sort(table(tipo))
Biometrias %>% group_by(Tipo) %>% summarise( total = n() ) %>% arrange(desc(total)) %>% gt()
Tipo total
Quelônio 3052
Aves voadoras 1810
Odontoceti 423
Aves não voadoras 103
Mysticeti 4
Pinípedes 1
ggplot(Biometrias, aes(x=Tipo) ) + geom_bar() +  ggtitle("Biometrias") + xlab("Tipo") + ylab("Atendimentos")

Quelônios

Também conhecidas como tartarugas marinhas.

Variáveis

Neste caso as variáveis são em sua maioria medidas contínuas, relativas ao tamanho, peso, etc…

names(Quelonio)
##  [1] "Código"                                  
##  [2] "Identificador da ocorrência"             
##  [3] "Identificador do indivíduo"              
##  [4] "Espécies - Classe"                       
##  [5] "Espécies - Ordem"                        
##  [6] "Espécies - Subordem"                     
##  [7] "Espécies - Família"                      
##  [8] "Espécies - Gênero"                       
##  [9] "Espécies - Espécie"                      
## [10] "Ficha de campo"                          
## [11] "Instituição executora"                   
## [12] "Data"                                    
## [13] "Tipo"                                    
## [14] "Responsável"                             
## [15] "Comprimento total (cm)"                  
## [16] "Comprimento curvilíneo carapaça (cm)"    
## [17] "Largura máxima curvilínea carapaça (cm)" 
## [18] "Comprimento curvilíneo plastrão (cm)"    
## [19] "Largura máxima curvilínea plastrão (cm)" 
## [20] "Comprimento cabeça (cm)"                 
## [21] "Largura máxima cabeça (cm)"              
## [22] "Comprimento cloaca ao final cauda (cm)"  
## [23] "Comprimento plastrão ao final cauda (cm)"
## [24] "Peso total (kg)"

Espécies

Contagem dos dados categóricos para espécies de tartaruga marinha. Nota-se que algumas não puderam ser identificadas, provavelmente por estarem em fase avançada de putrefação.

Quelonio %>%
  group_by(`Espécies - Espécie`) %>%
  summarise(total = n()) %>%
  arrange( desc(total) ) %>%
  gt()
Espécies - Espécie total
Chelonia mydas 2827
Caretta caretta 148
Lepidochelys olivacea 49
Dermochelys coriacea 14
NA 7
Eretmochelys imbricata 6
Thalassarche chlororhynchos 1

Médias por espécie

Valores médios dos parâmetros medidos, agrupado por espécie.

grupos <- Quelonio %>%
  group_by(`Espécies - Espécie`)
  
grupos %>%
  summarise(
    Total = n(),
    comprimento_medio = mean(`Comprimento total (cm)`, na.rm = T),
    carapaca_media = mean(`Comprimento curvilíneo carapaça (cm)`, na.rm = T)
  ) %>%
  filter(Total > 10) %>%
  gt()
Espécies - Espécie Total comprimento_medio carapaca_media
Caretta caretta 148 103.72500 77.89141
Chelonia mydas 2827 52.45906 40.31884
Dermochelys coriacea 14 186.55714 140.69286
Lepidochelys olivacea 49 84.80000 65.02045

Distribuição para as Chelonia Mydas

Como existe um alto número de exemplares da espécie Chelonia Mydas, é de interesse obeservar sua distribuição no diversos parâmetros. Tratando-a à parte das demais espécies.

mydas <- Quelonio %>% filter(`Espécies - Espécie` == 'Chelonia mydas')
ggplot(mydas, aes(x = `Comprimento total (cm)`)) + geom_histogram( na.rm = T, bins = 50)

Distribuição do Tamanho (cm) todas espécies

Usando os gráficos de whiskers (que mostra a variância, média mediana e outliers).

whisk_plot <- function(col_var) {
grupos %>%
  filter( !is.na(`Espécies - Espécie`) ) %>%
  group_by(`Espécies - Espécie`) %>%
  ggplot(aes(y = !! col_var , fill=factor(`Espécies - Espécie`))) + geom_boxplot( na.rm = T)
}
whisk_plot(quo(`Comprimento total (cm)`))

Distribuição do tamanho cabeça (cm) Todas espécies

whisk_plot(quo(`Comprimento cabeça (cm)`))

Distribuição Largura máxima curvilínea plastrão

whisk_plot(quo(`Largura máxima curvilínea plastrão (cm)`))

Correlacionando e modelando

Algumas coisas podem começar a ser exploradas como correlacionadas, por exemplo, descobrir como o comprimento afeta a largura do plastrão. A relação é a mesma em diferentes espécies ? Existem medidas indiretas que podem ser tomadas para melhor correlação, exemplo, largura máxima x comprimento máximo (área virtual) x comprimento total ?

Chelonia Mydas

Comprimento total x Largura máxima curvilínea

mydas %>%
  ggplot(aes(x = `Largura máxima curvilínea carapaça (cm)`, y= `Comprimento total (cm)`)) + geom_point( na.rm = T)

Medidas da cabeça: Comprimento x Largura

mydas %>%
  ggplot(aes(x = `Largura máxima cabeça (cm)`, y = `Comprimento cabeça (cm)`)) + geom_point(na.rm = T)