Aula 5.25

CA - Matriz de distância de variáveis com Presença/Aunsência + Abundância através da métrica do Qui-Quadrado

Objetivo: Desenvolver uma CA através de uma matriz de distâncias da composição de espécies do conjunto de dados “varespec” pelo método Qui-Quadrado para entender qual o grau de semelhança das unidades amostrais de acordo com a composição/abundância de espécies. Além disso, após essa análise de ordenação, se faz um teste de explicação das variáveis fisico-químicas do solo “varechem” através da função env.fit().

Este material está disponível em: http://rpubs.com/leonardoreffatti.

CA da Matriz de Distância da composição de espécies pelo método Qui-Quadrado (Presença/Ausência + Abundância) com os dados varespec. Carregar conjunto de dados varespec, criação da matriz de distâncias pelo método Qui-Quadrado com a função cca(), plotagem da CA, carregar o conjunto de dados varechem, com a função env.fit() relacionar este conjunto de dados com o resultado da CA do conjunto de dados varespec, plotar os resultados de env.fit no plot do resultado CA para avaliar quais variáveis fisico-químicas mais explicaram os resultados da CA.

library(permute)
library(lattice)
library(vegan)
## This is vegan 2.5-2
#Carregando um primeiro conjunto de dados do pacote vegan
data("varespec")
str(varespec)
## 'data.frame':    24 obs. of  44 variables:
##  $ Callvulg: num  0.55 0.67 0.1 0 0 ...
##  $ Empenigr: num  11.13 0.17 1.55 15.13 12.68 ...
##  $ Rhodtome: num  0 0 0 2.42 0 0 1.55 0 0.35 0.07 ...
##  $ Vaccmyrt: num  0 0.35 0 5.92 0 ...
##  $ Vaccviti: num  17.8 12.1 13.5 16 23.7 ...
##  $ Pinusylv: num  0.07 0.12 0.25 0 0.03 0.12 0.1 0.1 0.05 0.12 ...
##  $ Descflex: num  0 0 0 3.7 0 0.02 0.78 0 0.4 0 ...
##  $ Betupube: num  0 0 0 0 0 0 0.02 0 0 0 ...
##  $ Vacculig: num  1.6 0 0 1.12 0 0 2 0 0.2 0 ...
##  $ Diphcomp: num  2.07 0 0 0 0 0 0 0 0 0.07 ...
##  $ Dicrsp  : num  0 0.33 23.43 0 0 ...
##  $ Dicrfusc: num  1.62 10.92 0 3.63 3.42 ...
##  $ Dicrpoly: num  0 0.02 1.68 0 0.02 0.02 0 0.23 0.2 0 ...
##  $ Hylosple: num  0 0 0 6.7 0 0 0 0 9.97 0 ...
##  $ Pleuschr: num  4.67 37.75 32.92 58.07 19.42 ...
##  $ Polypili: num  0.02 0.02 0 0 0.02 0.02 0 0 0 0 ...
##  $ Polyjuni: num  0.13 0.23 0.23 0 2.12 1.58 0 0.02 0.08 0.02 ...
##  $ Polycomm: num  0 0 0 0.13 0 0.18 0 0 0 0 ...
##  $ Pohlnuta: num  0.13 0.03 0.32 0.02 0.17 0.07 0.1 0.13 0.07 0.03 ...
##  $ Ptilcili: num  0.12 0.02 0.03 0.08 1.8 0.27 0.03 0.1 0.03 0.25 ...
##  $ Barbhatc: num  0 0 0 0.08 0.02 0.02 0 0 0 0.07 ...
##  $ Cladarbu: num  21.73 12.05 3.58 1.42 9.08 ...
##  $ Cladrang: num  21.47 8.13 5.52 7.63 9.22 ...
##  $ Cladstel: num  3.5 0.18 0.07 2.55 0.05 ...
##  $ Cladunci: num  0.3 2.65 8.93 0.15 0.73 0.25 2.38 0.82 0.05 0.95 ...
##  $ Cladcocc: num  0.18 0.13 0 0 0.08 0.1 0.17 0.15 0.02 0.17 ...
##  $ Cladcorn: num  0.23 0.18 0.2 0.38 1.42 0.25 0.13 0.05 0.03 0.05 ...
##  $ Cladgrac: num  0.25 0.23 0.48 0.12 0.5 0.18 0.18 0.22 0.07 0.23 ...
##  $ Cladfimb: num  0.25 0.25 0 0.1 0.17 0.1 0.2 0.22 0.1 0.18 ...
##  $ Cladcris: num  0.23 1.23 0.07 0.03 1.78 0.12 0.2 0.17 0.02 0.57 ...
##  $ Cladchlo: num  0 0 0.1 0 0.05 0.05 0.02 0 0 0.02 ...
##  $ Cladbotr: num  0 0 0.02 0.02 0.05 0.02 0 0 0.02 0.07 ...
##  $ Cladamau: num  0.08 0 0 0 0 0 0 0 0 0 ...
##  $ Cladsp  : num  0.02 0 0 0.02 0 0 0.02 0.02 0 0.07 ...
##  $ Cetreric: num  0.02 0.15 0.78 0 0 0 0.02 0.18 0 0.18 ...
##  $ Cetrisla: num  0 0.03 0.12 0 0 0 0 0.08 0.02 0.02 ...
##  $ Flavniva: num  0.12 0 0 0 0.02 0.02 0 0 0 0 ...
##  $ Nepharct: num  0.02 0 0 0 0 0 0 0 0 0 ...
##  $ Stersp  : num  0.62 0.85 0.03 0 1.58 0.28 0 0.03 0.02 0.03 ...
##  $ Peltapht: num  0.02 0 0 0.07 0.33 0 0 0 0 0.02 ...
##  $ Icmaeric: num  0 0 0 0 0 0 0 0.07 0 0 ...
##  $ Cladcerv: num  0 0 0 0 0 0 0 0 0 0 ...
##  $ Claddefo: num  0.25 1 0.33 0.15 1.97 0.37 0.15 0.67 0.08 0.47 ...
##  $ Cladphyl: num  0 0 0 0 0 0 0 0 0 0 ...
#Informando somente o grupo de dados varespec, se faz a análise de correspondência na função cca()
resultado.ca <- cca(varespec)
summary(resultado.ca)
## 
## Call:
## cca(X = varespec) 
## 
## Partitioning of scaled Chi-square:
##               Inertia Proportion
## Total           2.083          1
## Unconstrained   2.083          1
## 
## Eigenvalues, and their contribution to the scaled Chi-square 
## 
## Importance of components:
##                          CA1    CA2    CA3     CA4     CA5     CA6     CA7
## Eigenvalue            0.5249 0.3568 0.2344 0.19546 0.17762 0.12156 0.11549
## Proportion Explained  0.2520 0.1713 0.1125 0.09383 0.08526 0.05835 0.05544
## Cumulative Proportion 0.2520 0.4233 0.5358 0.62962 0.71489 0.77324 0.82868
##                           CA8     CA9    CA10    CA11    CA12    CA13
## Eigenvalue            0.08894 0.07318 0.05752 0.04434 0.02546 0.01710
## Proportion Explained  0.04269 0.03513 0.02761 0.02129 0.01222 0.00821
## Cumulative Proportion 0.87137 0.90650 0.93411 0.95539 0.96762 0.97583
##                           CA14     CA15     CA16     CA17     CA18
## Eigenvalue            0.014896 0.010160 0.007830 0.006032 0.004008
## Proportion Explained  0.007151 0.004877 0.003759 0.002896 0.001924
## Cumulative Proportion 0.982978 0.987855 0.991614 0.994510 0.996434
##                           CA19      CA20      CA21      CA22      CA23
## Eigenvalue            0.002865 0.0019275 0.0018074 0.0005864 0.0002434
## Proportion Explained  0.001375 0.0009253 0.0008676 0.0002815 0.0001168
## Cumulative Proportion 0.997809 0.9987341 0.9996017 0.9998832 1.0000000
## 
## Scaling 2 for species and site scores
## * Species are scaled proportional to eigenvalues
## * Sites are unscaled: weighted dispersion equal on all dimensions
## 
## 
## Species scores
## 
##                 CA1       CA2       CA3        CA4        CA5       CA6
## Callvulg  0.0219651 -0.954204  0.055461 -1.2797244  0.0579945  0.798814
## Empenigr  0.0544138  0.226569  0.190301  0.0104668  0.3611286 -0.139798
## Rhodtome  0.8007640  0.895570  1.473304  0.0531002  1.3623062 -0.098847
## Vaccmyrt  1.0588751  0.969421  1.318804  0.1024323  0.1940588  0.248430
## Vaccviti  0.1063608  0.187223  0.071157  0.1076563  0.2894671 -0.051537
## Pinusylv -0.3492265  0.351537 -0.174403 -0.0561897  0.1713089  0.134792
## Descflex  1.1120135  0.728024  0.908150 -0.0005922 -0.5536573 -0.024661
## Betupube  0.4850314  1.165876  1.859362  0.6142811  3.2012930 -0.085239
## Vacculig -0.0601925 -0.973199  0.508703  0.3548606 -0.1289134 -0.566683
## Diphcomp -0.3946082 -0.619767  0.253144  0.4157072  0.1551830 -0.377569
## Dicrsp    1.3128632  0.215210 -2.382601  1.3654912  0.5844397  0.055023
## Dicrfusc  0.9204864 -0.336282 -0.192310 -1.2951865  0.1621852 -0.839809
## Dicrpoly  0.5251420  0.841839  0.389001  0.8468878  1.9249346  0.451664
## Hylosple  1.4535654  1.041666  1.101762  0.4106708 -1.5866910  0.786165
## Pleuschr  0.9492748  0.348263 -0.004863  0.0607013 -0.4727038  0.069878
## Polypili -0.2756876 -0.743016  0.264334  0.6530831 -0.3066610 -0.135153
## Polyjuni  0.7342157  0.059161 -1.087953  0.6678730  0.3257684 -1.067713
## Polycomm  0.6135426  0.789529  0.549966  0.5043274  1.1310269 -0.210949
## Pohlnuta -0.0098863  0.351998 -0.172088  0.0598978  0.3948858  0.138502
## Ptilcili  0.3060113  0.954875  1.663059  0.6189861  2.6639607  0.069360
## Barbhatc  0.3635903  1.265933  2.214206  0.7485792  3.4180314  0.225229
## Cladarbu -0.1109771 -0.886362  0.096956  0.0856283  0.0309403  0.125141
## Cladrang -0.3986726 -0.647506  0.196349  0.3201157 -0.1415224 -0.117122
## Cladstel -1.0413659  0.643770 -0.214966 -0.1662016 -0.1020550  0.001469
## Cladunci  0.5906105 -0.601021 -0.884064 -0.6143250  0.6762879  1.281624
## Cladcocc -0.1545561 -0.349095 -0.103782 -0.2510695 -0.0001597 -0.050661
## Cladcorn  0.1906382 -0.106239 -0.215287  0.1204409  0.1682545 -0.106946
## Cladgrac  0.1417851 -0.185868 -0.115694  0.1675663  0.2079021  0.013103
## Cladfimb  0.0006675 -0.096419  0.089396 -0.1927202  0.2036121 -0.050120
## Cladcris  0.2443835 -0.280964 -0.024662 -0.3642363  0.3026955  0.221793
## Cladchlo -0.4492051  0.721138  0.105982  0.1885373  0.8220828  0.042090
## Cladbotr  0.4091550  0.625599  1.284697  0.4013205  1.8942808  0.418963
## Cladamau -0.4780500 -0.903682  0.403090  0.6975202 -0.0171626 -0.494790
## Cladsp   -0.5947602  0.284425 -0.240895 -0.4413346 -0.1008616  0.136249
## Cetreric  0.1781014 -0.411694 -0.815501 -0.0582176  0.3135336  0.827893
## Cetrisla -0.2510628  0.813972  0.415902  0.1754087  1.1601226  0.138273
## Flavniva -1.0427252 -0.497924 -0.062553  0.0031262 -0.6254890  1.030965
## Nepharct  1.2181611  0.119157 -2.098997  0.9858735  0.4029573 -1.908139
## Stersp   -0.3747802 -1.362441  0.483100  1.0509067 -0.3747848 -0.502492
## Peltapht  0.2924068 -0.025844  0.021972  0.3143596  0.0769010 -0.293298
## Icmaeric  0.0274415 -1.445286  0.349268  0.1597361 -0.1574714 -0.729434
## Cladcerv -0.6689408 -0.003126 -0.590988  0.1349723 -0.3431706  0.144390
## Claddefo  0.3760557 -0.296651 -0.073940 -0.3076779  0.3810806  0.316994
## Cladphyl -0.9300080  0.690432 -0.386922 -0.3276803 -0.0677692  0.171024
## 
## 
## Site scores (weighted averages of species scores)
## 
##          CA1      CA2       CA3      CA4       CA5      CA6
## 18 -0.149232 -0.89910  0.474143  0.55218  0.333521 -0.40879
## 15  0.962177 -0.24177 -0.065652 -0.49180 -0.649787 -0.23363
## 24  1.363110  0.25182 -2.784969  1.82017  0.734410  1.34152
## 27  1.175623  0.83541  0.916089  0.27768 -1.142455  0.21767
## 23  0.496714 -0.09389  0.301149  0.34124  0.570712 -0.50968
## 19  0.004893  0.61971  0.057333  0.13950 -0.274987 -0.09789
## 22  1.188001 -0.19259  0.228980 -2.31092  0.183260 -1.73611
## 16  0.879113 -0.55664  0.002314 -1.80490  0.031028 -1.55021
## 28  1.765788  1.36537  1.383872  0.52333 -2.118872  1.19840
## 13 -0.269156 -1.34875  0.243060 -1.31835 -0.001711  1.52215
## 14  0.729491 -1.17893 -1.069360 -1.96412  1.355664  2.62928
## 20  0.528439 -0.31283 -0.009892  0.22972  0.108702  0.60480
## 25  1.367405  0.20034 -2.292582  1.01623  0.447480 -2.02763
## 7  -0.365350 -1.77480  0.691674  1.03984 -0.077502 -0.57207
## 5  -0.591300 -2.02176  0.773139  1.69572 -0.616039 -0.87384
## 6  -0.456210 -1.29742  0.270061  0.50646  0.150121  0.25985
## 3  -1.241648  0.20216 -0.156431  0.08690 -0.353443 -0.34506
## 4  -1.063176 -0.59183 -0.069763 -0.04061 -0.713689  1.27068
## 2  -1.369446  0.84240 -0.325298 -0.15990 -0.252740 -0.28474
## 9  -1.293505  1.31734 -0.533097 -0.43829 -0.081513 -0.03610
## 12 -1.002610  0.82306 -0.324741 -0.19673 -0.025098 -0.08034
## 10 -1.383095  1.19263 -0.488500 -0.42168 -0.054969 -0.14134
## 11 -0.445323 -0.06481 -0.002680  0.20422 -0.351513  0.19887
## 21  0.358204  1.35180  2.321948  0.81614  3.663041  0.20222
plot(resultado.ca)
#Na CA a métrica de distâncias é o qui-quadrado. Por natuzera essa métrica ignora os duplos zeros. A CA usa uma métrica que é adequada para quando se tem duplos zeros. A distância de qui-quadrado dá um peso maior para menos abundantes. Se temos muitas espécies "raras" e queremos dar um peso maior para elas a aplicação da CA pode ser adequada.

#Carregando um segundo conjunto dados de variáveis do solos para correlacionar com o primeiro conjunto de dados
data(varechem)
resultado.envfit <- envfit(resultado.ca, varechem, permutations = 10000)
resultado.envfit
## 
## ***VECTORS
## 
##               CA1      CA2     r2   Pr(>r)   
## N         0.47470 -0.88015 0.2196 0.088291 . 
## P         0.44827  0.89390 0.3054 0.031997 * 
## K         0.73616  0.67680 0.1773 0.144386   
## Ca        0.69724  0.71684 0.3064 0.027597 * 
## Mg        0.77318  0.63419 0.2466 0.055094 . 
## S         0.05137  0.99868 0.0902 0.395460   
## Al       -0.97491 -0.22260 0.4995 0.001500 **
## Fe       -0.96390 -0.26627 0.3682 0.009599 **
## Mn        0.91444  0.40473 0.4750 0.001300 **
## Zn        0.77039  0.63758 0.1766 0.143086   
## Mo       -0.63809 -0.76997 0.0539 0.595640   
## Baresoil  0.97947 -0.20161 0.2533 0.055894 . 
## Humdepth  0.91602  0.40112 0.4524 0.003300 **
## pH       -0.99831  0.05818 0.2187 0.079492 . 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## Permutation: free
## Number of permutations: 10000
#Algumas das variáveis fisico-químicas do solo apresentam efeito estatisticamente significativo, alguns dos coeficientes de determinação são relativamente altos, exemplo Mn com 0.4750.

#Plotando os dados das variáveis de fisico-químicas do solo com a presença das espécies e UAs do teste de CA. Buscar os valores que apresentaram diferença significativa para interpretar os dados desse plot. Ex: Al, Fe, Mn, Humdepth, P, Ca.
plot(resultado.envfit)

#A vantagem de utilizar o envfit sobre a CCA é que o envfit traz o resultado por variável. CCA analisa o conjunto.
#A CCA traz como a proporção de explicação se altera com a inserção dos dados fisico-químicos.