1.1 - Introdução

Este trabalho pretende analisar a longevidade de 163 especies de mamíferos de modo estatístico, a relacionando aos períodos de crescimento. O trabalho pretende, assim, gerar conhecimento sobre o período de vida dos mamíferos.

Apesar de ser aluno de Administração Pública, este tema da Biologia me interessou graças a sua relevância universal. É interessante pensar que, apesar dos avanços dos últimos dois séculos no conhecimento cientìfico, esse ainda não se encontra difundido de forma prática na população, com as escolas de ensino primário e secundário falhando em ensinar a prática científica e apenas ensinando conceitos rígidos, muitas vezes obsoletos. O tema para esta breve análise estatística foi escolhido com a intenção de se adquirir algum conhecimento científico prático sobre o mesmo.

1.2 - Objetivo

O objetivo deste trabalho é analisar a relação entre tempo de vida máximo de 163 espécies de mamíferos e seus períodos de crescimento, especificamente maturidade sexual masculina e feminina, tempo de gestação e taxa de crescimento. As variáveis primárias eleitas foram longevidade e taxa de crescimento. As hipóteses do trabalho testam a relação entre longevidade e taxa de crescimento e a relação entre a taxa de crescimento e o tempo de gestação.

2.1 - Material

A base de dados aqui utilizada, com 163 espécies de mamíferos e 11 variáveis, foi extraída da base de dados “The Animal Aging and Longevity Database”, disponível em: https://genomics.senescence.info/species/index.html. A base de dados original conta com 4.220 espécies de diversos filos e 31 variáveis. Essa base de dados foi simplificada por mim através do Microsoft Excel, filtrando os mamíferos e se reduzindo as variáveis.

A base de dados gerada no Excel ainda contava com 1.330 espécies de mamíferos. Estas, no entanto, foram reduzidas pelo comando do R “na.omit” para 163, sendo selecionadas assim apenas as com informação completa para as 11 variáveis selecionadas (das quais apenas 5, as quantitativas, apresentavam dados faltantes), criando a base de dados aqui utilizada.

As 11 variáveis são:

  1. HAGRID - Identificação da espécie no banco Human Ageing Genomic Resources. Não utilizada.
  2. Classe - O filo do animal. Todos selecionados são mamíferos.
  3. Ordem - Subdivisão do filo. Única variável qualitativa utilizada neste trabalho.
  4. Família - Subdivisão da ordem. Não utilizada.
  5. Gênero - Subdivisão da família. Não utilizada.
  6. Espécie - Subdivisão do gênero. Não utilizada.
  7. Maturidade Feminina - O tempo que as fêmeas da espécie demoram para alcançar a maturidade sexual, em dias.
  8. Maturidade Masculina - O tempo que os machos da espécie demoram para alcançar a maturidade sexual, em dias.
  9. Gestação - O tempo de gestação após a fertilização, em dias.
  10. Taxa de Crescimento - Derivada de curvas de Gompertz, representa a taxa para os animais chegarem ao seu tamanho máximo, desde o nascimento, em 1/dias ou dias^-1.
  11. Longevidade Máxima - O período máximo já registrado de vida dos animais, em anos.

2.2 - Operacionalização das Variáveis

Como já explicado no tópico anterior, as espécies com informações faltantes foram excluídas através do comando “na.omit”. Além disso, o único ajuste necessário foi a transformação da Longevidade Máxima de anos para dias, realizada pela sua multiplicação por 365, ignorando-se, portanto, anos bissextos.

2.3 - Método

Primeiramente, separei as 163 espécies em Ordens através de tabela do R que será apresentada na próxima seção. Foram elaborados, então, as tabelas e os gráficos boxplot relacionando Ordem à longevidade máxima e à taxa de crescimento, e os gráficos relacionando as variáveis quantitativas primárias (longevidade e taxa de crescimento) entre si e com as variáveis quantitativas secundárias (gestação e maturidade), assim como uma matriz de correlação entre as 5 variáveis.

Antes do teste de hipóteses todas as variáveis quantitativas foram analisadas pelo teste de normalidade de Shapiro, que demonstrou anormalidade para todas. Portanto, foi realizado o teste de Spearman para correlação entre as variáveis e teste de hipóteses.

3 - Análise de Resultados e Discussão

As tabelas relacionando Ordens a longevidade máxima e taxa de crescimento devem ser interpretadas dentro das limitações das amostras da tabela.

table(anage1$Order)
## 
##    Afrosoricida    Artiodactyla       Carnivora         Cetacea      Chiroptera 
##               4              21              35               1              12 
##       Cingulata Didelphimorphia   Diprotodontia      Hyracoidea   Macroscelidea 
##               2               1              11               1               1 
##     Monotremata Peramelemorphia  Perissodactyla          Pilosa        Primates 
##               1               2               2               2              18 
##     Proboscidea        Rodentia         Sirenia    Soricomorpha   Tubulidentata 
##               1              39               1               7               1

A tabela de Ordens demonstra essas limitações que serão vistas nas tabelas e nos gráficos boxplot. As ordens com apenas 1 ou 2 representantes não apresentam uma mediana, média ou desvio padrão confiavéis. Ainda assim, é importante sua presença para a análise das variáveis quantitativas entre si.

anage1 %>% select(Order, `Maximum longevity (yrs)`) %>% group_by(Order) %>% 
  summarise(mediana_longevidade_anos=round(median(`Maximum longevity (yrs)`),1), desvio.padrao_longevidade=round(sd(`Maximum longevity (yrs)`),1)) %>% 
  data.frame() %>% flextable()
boxplot(longevity~anage1$Order, xlab = 'Ordem', ylab = 'Longevidade (dias)')

Podemos observar que, apesar dos humanos representarem outlier, contando com a maior longevidade máxima da tabela utilizada, em 122,5 anos, os primatas de fato apresentam a maior variação dentro as ordens dos mamíferos. Os roedores, ordem mais populosa da tabela, apresentam a menor longevidade junto com a ordem Soricomorpha (que inclui toupeiras e animais parecidos), apresentando a segunda menor mediana e limite máximo abaixo da mediana de diversas ordens, salvo por dois outliers. A segunda maior variação é apresentada pela Ordem chiroptera, composta por morcegos.

anage1 %>% select(Order, `Growth rate (1/days)`) %>% group_by(Order) %>%
  summarise(média_taxa_crescimento=round(mean(`Growth rate (1/days)`),4), desvio.padrao_taxa=round(sd(`Growth rate (1/days)`),4)) %>% 
  data.frame() %>% flextable()
boxplot(anage1$`Growth rate (1/days)`~anage1$Order, xlab = 'Ordem', ylab = 'Taxa de Crescimento (1/dias)')

A tabela e gráfico de taxa de crescimento apresentam resultados interessantes, com a ordem de 7 integrantes que havia apresentado menor longevidade, Soricomorpha, apresentando uma taxa de crescimento muito maior. A ordem dos Chiroptera apresenta novamente a segunda maior variação na taxa de crescimento, dessa vez atrás dos Soricomorpha, enquanto os primatas apresentam pouca variação, com os humanos no limite inferior em 0.0005, e no outlier um lemure com 0.0362 taxa de crescimento e 18.2 anos de longevidade máxima.

Foram comparados, então, a longevidade à taxa de crescimento.

plot(anage1$`Growth rate (1/days)`, longevity, xlab = 'Taxa de Crescimento (1/dias)', ylab = 'Longevidade (dias)')
abline(lsfit(anage1$`Growth rate (1/days)`, longevity))

O gráfico faz uma função inversamente proporcional, indicando que maiores taxas de crescimento representam menor longevidade, confirmando a comparação entre os dois gráficos boxplot. Nota-se também que a maioria das espécies tem uma taxa de crescimento entre 0.00 e 0.05.

Foram produzidos a seguir os gráficos relacionando longevidade à gestação e amadurecimento sexual, de forma a observar se havia proporcionalidade.

plot(anage1$`Gestation/Incubation (days)`, longevity, xlab = 'Gestação (dias)', ylab = 'Longevidade (dias)')
  abline(lsfit(anage1$`Gestation/Incubation (days)`, longevity))

plot(anage1$`Male maturity (days)`, longevity, xlab = 'Maturidade Sexual masculina (dias)', ylab = 'Longevidade (dias)')
  abline (lsfit(anage1$`Male maturity (days)`, longevity))

plot(anage1$`Female maturity (days)`, longevity, xlab = 'Maturidade Sexual feminina (dias)', ylab = 'Longevidade (dias)')
  abline(lsfit(anage1$`Female maturity (days)`, longevity))

Nota-se proporcionalidade nos três gráficos, com o período de gestação sendo menos associado à longevidade do que a maturidade sexual, e com a maturidade feminina ligeiramente mais associada à longevidade que a masculina.

Foi produzido, ainda, o gráfico relacionando a taxa de crescimento ao tempo de gestação, que nada mais é que o crescimento pré-natal.

plot(anage1$`Gestation/Incubation (days)`, anage1$`Growth rate (1/days)`, xlab = 'Gestação (dias)', ylab = 'Taxa de Crescimento 1/dias')
  abline(lsfit(anage1$`Gestation/Incubation (days)`, anage1$`Growth rate (1/days)`))

Nota-se que a taxa de crescimento pré e pós-natal possuem a esperada proporcionalidade inversa, evidenciando que crescem mais rápido os que nascem em menos tempo, mantendo um ritmo de crescimento.

Por fim, foi produzida uma matriz de correlação entre as 5 variáveis quantitativa.

MC <- cor(variaveis, method = 'spearman')
corrplot(MC, method = 'number', type = 'lower')

Teste de Hipóteses

A primeira hipótese, portanto, é se há relação entre a taxa de crescimento e o tempo de gestação. Para isso foi testada a normalidade das variáveis pelo teste de Shapiro.

#H0 = Há normalidade
#H1 = Não há normalidade
shapiro.test(anage1$`Growth rate (1/days)`)
## 
##  Shapiro-Wilk normality test
## 
## data:  anage1$`Growth rate (1/days)`
## W = 0.68124, p-value < 2.2e-16
shapiro.test(anage1$`Gestation/Incubation (days)`)
## 
##  Shapiro-Wilk normality test
## 
## data:  anage1$`Gestation/Incubation (days)`
## W = 0.79264, p-value = 6.283e-14

Com ambos p-valores menores que 0.05, a hipótese de normalidade é rejeitada e portanto é realizado o teste de Spearman para correlação entre as variáveis.

#H0= Não há relação
#H1= Há relação
cor.test (anage1$`Gestation/Incubation (days)`, anage1$`Growth rate (1/days)`, method = 'spearman')
## Warning in cor.test.default(anage1$`Gestation/Incubation (days)`, anage1$`Growth
## rate (1/days)`, : Cannot compute exact p-value with ties
## 
##  Spearman's rank correlation rho
## 
## data:  anage1$`Gestation/Incubation (days)` and anage1$`Growth rate (1/days)`
## S = 1200826, p-value < 2.2e-16
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
##        rho 
## -0.6637376

Com o p-valor < 2.2e-16, a hipótese nula é rejeitada. A correlação de -0.66 demonstra que há grau moderado de associação inversa.

A segunda hipótese é sobre a relação entre longevidade e taxa de crescimento, para isso é testada a normalidade da longevidade em dias.

#H0= Há normalidade
#H1= Não há normalidade
shapiro.test(longevity)
## 
##  Shapiro-Wilk normality test
## 
## data:  longevity
## W = 0.82429, p-value = 1.007e-12

Como o p-valor é < 0.05, é realizado o teste de Spearman.

#H0= Não há relação
#H1= Há relação
cor.test (anage1$`Growth rate (1/days)`, longevity, method = 'spearman')
## Warning in cor.test.default(anage1$`Growth rate (1/days)`, longevity, method =
## "spearman"): Cannot compute exact p-value with ties
## 
##  Spearman's rank correlation rho
## 
## data:  anage1$`Growth rate (1/days)` and longevity
## S = 1236014, p-value < 2.2e-16
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
##        rho 
## -0.7124902

Com o p-valor < 2.2e-16, a hipótese nula é rejeitada. A correlação de -0.71 demonstra que há grau forte de associação inversa.

4 - Conclusão

A conclusão da análise de dados é que há, de fato, proporcionalidade entre a taxa de crescimento e longevidade dos mamíferos aqui apresentados. Indicando que há certa proporcionalidade entre suas fases de vida, com animais que passam por elas (aqui analisadas a gestação e a maturidade) mais rápido em geral vivendo menos. A comparação dos gráficos boxplot da ordem associada à longevidade e à taxa de crescimento demonstra essa proporcionalidade inversa e há de se assumir que os outliers de um são diferentes dos outliers dos outros, por exemplo apesar dos primatas ainda terem um outlier na taxa de crescimento este é um lemure e não mais os humanos, que tem a segunda menor taxa de crescimento da tabela e a maior longevidade.

5 - Referência Bibliográfica

The Animal Aging and Longevity Database. HAGR. Disponível em: https://genomics.senescence.info/species/index.html

6 - Anexo (código do R)

library(readxl)
library(flextable)
library(dplyr)
library(corrplot)
anage <- read_excel("C:/Users/usuario/Downloads/anage.xlsx", 
                    col_types = c("numeric", "text", "text", 
                                  "text", "text", "text", "numeric", 
                                  "numeric", "numeric", "numeric", 
                                  "numeric"))

anage1 <- na.omit(anage)

#####################AJUSTE VÁRIAVEIS#########################

longevity <- anage1$`Maximum longevity (yrs)`*365

variaveis <- data.frame(anage1$`Female maturity (days)`, anage1$`Male maturity (days)`, anage1$`Gestation/Incubation (days)`, 
                        anage1$`Growth rate (1/days)`, longevity)
colnames(variaveis) <- c('Maturidade ♀', 'Maturidade ♂', 'Gestação', 'Taxa de Crescimento (1/dias)', 'Longevidade')

###################TESTE NORMALIDADE###########################

shapiro.test(longevity)
shapiro.test(anage1$`Growth rate (1/days)`)
shapiro.test(anage1$`Female maturity (days)`)
shapiro.test(anage1$`Male maturity (days)`)
shapiro.test(anage1$`Gestation/Incubation (days)`)

#####################CORRELAÇÔES###############################

cor.test (anage1$`Growth rate (1/days)`, longevity, method = 'spearman', exact = FALSE)
cor.test (anage1$`Female maturity (days)`, longevity, method = 'spearman', exact = FALSE)
cor.test (anage1$`Male maturity (days)`, longevity, method = 'spearman', exact = FALSE)
cor.test (anage1$`Gestation/Incubation (days)`, longevity, method = 'spearman', exact = FALSE)
cor.test (anage1$`Gestation/Incubation (days)`, anage1$`Growth rate (1/days)`, method = 'spearman', exact = FALSE)


################GRÁFICOS################################

anage1 %>% select(Order, `Maximum longevity (yrs)`) %>% group_by(Order) %>% 
  summarise(mediana_longevidade_anos=round(median(`Maximum longevity (yrs)`),1), desvio.padrao_longevidade=round(sd(`Maximum longevity (yrs)`),1)) %>% 
  data.frame() %>% flextable()

anage1 %>% select(Order, `Growth rate (1/days)`) %>% group_by(Order) %>%
  summarise(média_taxa_crescimento=round(mean(`Growth rate (1/days)`),4), desvio.padrao_taxa=round(sd(`Growth rate (1/days)`),4)) %>% 
  data.frame() %>% flextable()

boxplot(longevity~anage1$Order, xlab = 'Ordem', ylab = 'Longevidade (dias)')
boxplot(anage1$`Growth rate (1/days)`~anage1$Order, xlab = 'Ordem', ylab = 'Taxa de Crescimento (1/dias)')

plot(anage1$`Growth rate (1/days)`, longevity, xlab = 'Taxa de Crescimento (1/dias)', ylab = 'Longevidade (dias)')+
abline(lsfit(anage1$`Growth rate (1/days)`, longevity))

plot(anage1$`Gestation/Incubation (days)`, longevity, xlab = 'Gestação (dias)', ylab = 'Longevidade (dias)')+
  abline(lsfit(anage1$`Gestation/Incubation (days)`, longevity))

plot(anage1$`Male maturity (days)`, longevity, xlab = 'Maturidade Sexual ♂ (dias)', ylab = 'Longevidade (dias)')+
  abline (lsfit(anage1$`Male maturity (days)`, longevity))

plot(anage1$`Female maturity (days)`, longevity, xlab = 'Maturidade Sexual ♀ (dias)', ylab = 'Longevidade (dias)')+
  abline(lsfit(anage1$`Female maturity (days)`, longevity))

plot(anage1$`Gestation/Incubation (days)`, anage1$`Growth rate (1/days)`, xlab = 'Gestação (dias)', ylab = 'Taxa de Crescimento 1/dias')+
  abline(lsfit(anage1$`Gestation/Incubation (days)`, anage1$`Growth rate (1/days)`))

plot(anage1$`Growth rate (1/days)`, anage1$`Male maturity (days)`)+
  abline(lsfit(anage1$`Growth rate (1/days)`, anage1$`Male maturity (days)`))

MC <- cor(variaveis, method = 'spearman')
corrplot(MC, method = 'number', type = 'lower')