Hoje, calcularemos a diversidade filogenética com dois índices clássicos e amplamente utilizados. O índice “mean parwise distance” (MPD) de Webb et al. (2002) e o índice PD de Faith (1992). Note que você já havia visto o índice PD na aula de introdução à diversidade filogenética, no primeiro módulo da disciplina.
Primeiramente, limpe sua área de trabalho e de gráficos.
rm(list=ls())
graphics.off()
Carregue os pacotes a serem usados (ape, picante). Se você ainda não os tem instalados, antes de carregá-los, deve utilizar a função “install.packages”.
library(ape)
library(picante)
Para você calcular a diversidade filogenética, você precisará dos seguintes dados: uma filogenia e a abundância (ou ocorrência) das espécies da filogenia em comunidades. Vamos utilizar os dados disponíveis em http://goo.gl/ErFXcC. Baixe os dados da pasta para o seu diretório de trabalho do R. Esses dados provêm de Carlucci et al. (2017), disponível em http://goo.gl/tA9bST.
Antes de carregar os dados, tenha em mente de que se tratam de 5504 espécies de árvores em comunidades de florestas tropicais. Portanto, carregar a visualização completa da matriz de comunidades pode trancar seu computador dependendo de sua memória de processamento. Utilize os seguintes comandos para carregar os dados.
tree <- read.tree("phylotree.txt")
comm <- read.csv("comm.csv", row.names = 1)
Você pode observar a estrutura da matriz de comunidades, observando apenas algumas linhas e colunas.
comm[1:4,1:4]
Você pode plotar a filogenia, mas isso trancar seu computador se ele for lento.
par(mar=c(0,1,0,1))
plot(tree, show.node=F, show.tip.label = F, cex=0.6, type="fan")
Para calcular a diversidade filogenética de cada uma das comunidades de floresta tropical, você precisa de uma medida de distância filogenética entre pares de espécies. Como a árvore filogenética é datada, podemos utilizar a distância cofenética para obter a distância entre espécies em milhões de anos.
phydist <- cophenetic(tree)
class(phydist)
dim(phydist)
phydist[1:3,1:4]
Agora, confira se todas as espécies das comunidades estão na matriz de distâncias filogenéticas.
summary(colnames(comm) %in% colnames(phydist))
Se todas as espécies das comunidades estão na matriz de distâncias, então podemos calcular a diversidade filogenética com o índice MPD de Webb et al. (2002).
MPD <- mpd(comm, phydist)
MPD
Agora calcule a diversidade filogenética com o índice PD de Faith (1992).
PD <- pd(comm, tree)
ls(PD)
PD$PD
Veja se os dois índices calculados são correlacionados. Para determinar o método de correlação, antes avalie se a distribuição de cada variável é normal.
plot(PD$PD, MPD)
hist(PD$PD)
hist(MPD)
cor.test(PD$PD, MPD, method = "spearman")
Avalie se os índices são influenciados pela riqueza de espécies.
plot(PD$SR, PD$PD)
plot(PD$SR, MPD)
hist(PD$SR)
cor.test(PD$SR, PD$PD, method = "spearman")
cor.test(PD$SR, MPD, method = "spearman")
Explique com suas palavras quais as diferenças entre os índices PD e MPD.
A que você atribui o fato de um índice ser correlacionado e o outro não ser correlacionado com a riqueza?
*Lembre-se de colocar os gráficos na sua resposta, além dos valores da estatística, valor de P e a interpretação.