Preparando e analizando dados

Baixando os dados

Para dar início à atividade, foi necessária a instalação do Rtools, uma extensão do R para ser usada no Windows, servindo como um conjunto ou compilado de pacotes que podem ser usados pelo RStudio. Após isso, intalei o pacote ‘devtools’ através do comando install.packages("devtools"). O devtools permite o meu acesso ao pacote feito pelo professor da disciplina para a realização da atividade. E para finalmente conseguir os dados, no formato de ‘ecodados’, tive que istalar o devtools::install_github("paternogbc/ecodados"), sendo que antes tive de pôr outro códido para que a instalação de fato ocorresse options(download.file.method = "wininet"). Também instalei o pacote ‘vegan’ pelo comando install.packages("vegan"). E também instalei o pacote ‘ggplot’ pelo comando install.packages("ggplot2"), para que os gráficos necessários sejam construídos. Outro pacote foi o ‘kableExtra’, que instalei usando o install.packages("kableExtra"), que usei apenas modificar o layout das tabelas. Por fim, tomei a liberdade de instalar o pacote ‘tidyverse’ com o único objetivo de poder rodar a função pipe %>%.

## Warning in !is.null(rmarkdown::metadata$output) && rmarkdown::metadata$output
## %in% : 'length(x) = 2 > 1' in coercion to 'logical(1)'


Explorando a base de dados

Agora estarei apresentando a tabela de dados contendo as comunidades (amostras) e as espécies presentes em cada uma delas. Também é possível ver a relação da abundância das espécies e constatar variações de sua distribuição nas amostras. Seguidamente, analisei os dados utilizando alguns comandos como rowSums e dim.

sp1 sp2 sp3 sp4 sp5 sp6 sp7 sp8 sp9 sp10
Com_1 10 10 10 10 10 10 10 10 10 10
Com_2 91 1 1 1 1 1 1 1 1 1
Com_3 1 3 6 25 1 0 0 0 0 0
Com_4 0 0 0 0 0 15 15 18 17 16
Com_5 0 9 0 6 0 11 0 2 12 0
Com_6 3 0 5 0 12 1 0 13 12 0
Com_7 0 0 2 0 0 0 2 0 0 0
Com_8 12 0 0 0 0 3 0 3 2 0
Com_9 2 1 0 2 0 3 3 4 0 0
Com_10 0 4 1 0 4 0 0 2 0 0


Dimensão da matriz

O resultado mostra que a matriz de dados composicao_especies possui 10 linhas, equivalentes às comunidades, e 10 colunas, equivalentes às espécies, respectivamente.

## [1] 10 10


Abundância total das comunidades

Aqui eu fiz a soma da abundância das espécies presentes em cada amostra.

##  Com_1  Com_2  Com_3  Com_4  Com_5  Com_6  Com_7  Com_8  Com_9 Com_10 
##    100    100     36     81     40     46      4     20     15     11


Abundância total das espécies

Aqui eu fiz a soma da abundância de cada espécie.

##  sp1  sp2  sp3  sp4  sp5  sp6  sp7  sp8  sp9 sp10 
##  119   28   25   44   28   44   31   53   54   27


Curvas de Rank-abundância

Nesta etapa eu promovi a criação de curvas de rank-abundância, que são capazes de organizar as espécies em ordem decrescente de abundância em uma comunidade, excluindo as que não tiveram presença confirmada na comunidade. Dessa forma, a observação de uma possível equitabilidade ou concentração de dominância é mais facilitada.


Comunidade 1

## Warning in qt(0.975, df = n - 1): NaNs produzidos


Comunidade 2

## Warning in qt(0.975, df = n - 1): NaNs produzidos


Comunidade 3

## Warning in qt(0.975, df = n - 1): NaNs produzidos


Comunidade 4

## Warning in qt(0.975, df = n - 1): NaNs produzidos


Comunidade 5

## Warning in qt(0.975, df = n - 1): NaNs produzidos


Comunidade 6

## Warning in qt(0.975, df = n - 1): NaNs produzidos


Comunidade 7

## Warning in qt(0.975, df = n - 1): NaNs produzidos


Comunidade 8

## Warning in qt(0.975, df = n - 1): NaNs produzidos


Comunidade 9

## Warning in qt(0.975, df = n - 1): NaNs produzidos


Comunidade 10

## Warning in qt(0.975, df = n - 1): NaNs produzidos


Abundância do Conjunto

Para promover ainda mais visualização, fiz o plot de um gráfico de relação entre abundância e espécie, reunindo todas as comunidades mostradas acima, mas com organização da espécie 1 para a 10, incluindo as espécies que apresentearam abundância 0. Dessa forma pode-se constatar com mais rapidez e eficácia a diferença ou igualdade entre as comunidades.

## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## i Please use `linewidth` instead.


Índices de diversidade

Riqueza

Riqueza Alfa

Com este comando specnumber(composicao_especies) pude observar a riqueza α (Alfa) de espécies por amostra, mostrando uma clara discrepância nas comunidades, em especial as 1 e 2 (Com_1 e Com_2), pois são as que apresentaram maiores riquezas de espécies, enquanto a comunidade 7 (Com_7) é a que tem menor riqueza.

x
Com_1 10
Com_2 10
Com_3 5
Com_4 5
Com_5 5
Com_6 6
Com_7 2
Com_8 4
Com_9 6
Com_10 4


Riqueza Gama

Adquiri a riqueza γ (Gama) através da soma da riqueza de todas as comunidades, com o comando: specnumber(colSums(composicao_especies)). Adquirimos o resultado de 10 espécies encontradas em todas as amostras/comunidades.

x
10


Shannon-Wiener (H’)

Aqui a comunidade 1 (‘Com_1’) é a que possui maior diversidade, possivelmente por conta da semelhante distribuição da abundância entre as espécies, diferente da comunidade 2 (Com_2), que nos mostra uma abundância excessiva na espécie 1, configurando uma baixa diversidade. Comando utilizado: diversity(composicao_especies, index = "shannon", MARGIN = 1)

x
Com_1 2.3025851
Com_2 0.5002880
Com_3 0.9580109
Com_4 1.6068659
Com_5 1.4861894
Com_6 1.5607038
Com_7 0.6931472
Com_8 1.1058899
Com_9 1.7140875
Com_10 1.2636544


Simpson (C)

Este índice pertence ao intervalo de 0,1 (mínima) até 1,0 (máxima). Nesse índice a comunidade com maior valor também é a que possui maior diversidade. Mais uma vez a comunidade 1 (‘Com_1’) é a que possui maior diversidade, alcançando o valor máximo, possivelmente por conta da semelhante distribuição da abundância entre as espécies, diferente da comunidade 2 (‘Com_2’), que nos mostra uma abundância excessiva na espécie 1, configurando uma baixa diversidade. Comando usado: diversity(composicao_especies, index = "simpson", MARGIN = 1)

x
Com_1 0.9000000
Com_2 0.1710000
Com_3 0.4814815
Com_4 0.7989636
Com_5 0.7587500
Com_6 0.7674858
Com_7 0.5000000
Com_8 0.5850000
Com_9 0.8088889
Com_10 0.6942149


Equidade de Pielou (J’)

Este índice pertence ao intervelo de 0,1 (mínima) até 1,0 (máxima) e leva em consideração a abundância dos indivíduos entre as espécies, comparando os resultados dos índices de Shannon com essa distribuição. Aqui, quanto maior o seu valor, maior a diversidade da amostra. Dito isto, também é possível analizar que a comunidade 1 mais uma vez apresenta o maior valor de diversidades. No entanto, a comunidade 7 (Com_7) também obteve o mesmo valor da comunidade 1, por motivos que não compreendo. A comunidade 2 permanece tendo a menor diversidade de todas as comunidades. Comando utilizado: shannon_comunidades / log(nspecies)

x
Com_1 1.0000000
Com_2 0.2172723
Com_3 0.5952456
Com_4 0.9984019
Com_5 0.9234214
Com_6 0.8710454
Com_7 1.0000000
Com_8 0.7977309
Com_9 0.9566505
Com_10 0.9115340


Relação diversidade e precipitação

Matriz de precipitação

É sabido que as amostras foram coletadas em um mesmo tipo de ambiente, mas cada amostra foi coletada em um local com uma taxa de precipitação diferente, dessa forma fazendo-se necessária a constatação de uma possível relação entre a precipitação de cada comunidade e seus índices de diversidade correspondentes. Abaixo exibo a tabela de dados de precipitação, com o escopo de viabilizar a sua verificação.


prec
Com_1 3200
Com_2 3112
Com_3 2800
Com_4 1800
Com_5 2906
Com_6 3005
Com_7 930
Com_8 1000
Com_9 1300
Com_10 987


Data frame único

Aqui eu fiz a união dos dados de precipitação, índices de Shannon, Simpson, Pielou e a riqueza de cada comunidade em uma única tabela (Data frame), isso facilita a comparação e visualização dos valores, além de propiciar o cálculo de ANOVA.

Também denominei novos nomes para as colunas da tabela.

Precipitacao Riqueza Shannon Simpson Pielou
Com_1 3200 10 2.3025851 0.9000000 1.0000000
Com_2 3112 10 0.5002880 0.1710000 0.2172723
Com_3 2800 5 0.9580109 0.4814815 0.5952456
Com_4 1800 5 1.6068659 0.7989636 0.9984019
Com_5 2906 5 1.4861894 0.7587500 0.9234214
Com_6 3005 6 1.5607038 0.7674858 0.8710454
Com_7 930 2 0.6931472 0.5000000 1.0000000
Com_8 1000 4 1.1058899 0.5850000 0.7977309
Com_9 1300 6 1.7140875 0.8088889 0.9566505
Com_10 987 4 1.2636544 0.6942149 0.9115340


ANOVA

A Análise de Variância (ANOVA) é uma forma de utilizar as médias aritméticas das amostras, nesse caso são as médias dos índices de diversidade das comunidades, para comparar as variâncias entre elas. No caso dessa atividade estamos comparando a média de precipitação, que seria a variável independente, com a média dos índices de diversidade já testados, que seriam as variáveis dependentes, que são estes: ‘Shannon’, ‘Simpson’, ‘Pielou’ e ‘riqueza’. Logo após, pus o comando para realizar os cálculos e comparações necessárias, e, em seguida, fiz o plot dos resultados.


ANOVA Shannon

## Analysis of Variance Table
## 
## Response: Shannon
##              Df  Sum Sq Mean Sq F value Pr(>F)
## Precipitacao  1 0.10989 0.10989  0.3627 0.5637
## Residuals     8 2.42366 0.30296


ANOVA Simpson

## Analysis of Variance Table
## 
## Response: Simpson
##              Df  Sum Sq  Mean Sq F value Pr(>F)
## Precipitacao  1 0.00132 0.001325  0.0252 0.8778
## Residuals     8 0.42064 0.052580


ANOVA Riqueza

## Analysis of Variance Table
## 
## Response: Riqueza
##              Df Sum Sq Mean Sq F value  Pr(>F)  
## Precipitacao  1 30.622 30.6224  8.9156 0.01744 *
## Residuals     8 27.478  3.4347                  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1


ANOVA Pielou

## Analysis of Variance Table
## 
## Response: Pielou
##              Df  Sum Sq  Mean Sq F value Pr(>F)
## Precipitacao  1 0.09080 0.090798  1.5792 0.2443
## Residuals     8 0.45997 0.057496

Referências