Objetivo: Desenvolver uma CA através de uma matriz de distâncias da composição de espécies do conjunto de dados “varespec” pelo método Qui-Quadrado para entender qual o grau de semelhança das unidades amostrais de acordo com a composição/abundância de espécies. Além disso, após essa análise de ordenação, se faz um teste de explicação das variáveis fisico-químicas do solo “varechem” através da função env.fit().
Este material está disponível em: http://rpubs.com/leonardoreffatti.
CA da Matriz de Distância da composição de espécies pelo método Qui-Quadrado (Presença/Ausência + Abundância) com os dados varespec. Carregar conjunto de dados varespec, criação da matriz de distâncias pelo método Qui-Quadrado com a função cca(), plotagem da CA, carregar o conjunto de dados varechem, com a função env.fit() relacionar este conjunto de dados com o resultado da CA do conjunto de dados varespec, plotar os resultados de env.fit no plot do resultado CA para avaliar quais variáveis fisico-químicas mais explicaram os resultados da CA.
library(permute)
library(lattice)
library(vegan)
## This is vegan 2.5-2
#Carregando um primeiro conjunto de dados do pacote vegan
data("varespec")
str(varespec)
## 'data.frame': 24 obs. of 44 variables:
## $ Callvulg: num 0.55 0.67 0.1 0 0 ...
## $ Empenigr: num 11.13 0.17 1.55 15.13 12.68 ...
## $ Rhodtome: num 0 0 0 2.42 0 0 1.55 0 0.35 0.07 ...
## $ Vaccmyrt: num 0 0.35 0 5.92 0 ...
## $ Vaccviti: num 17.8 12.1 13.5 16 23.7 ...
## $ Pinusylv: num 0.07 0.12 0.25 0 0.03 0.12 0.1 0.1 0.05 0.12 ...
## $ Descflex: num 0 0 0 3.7 0 0.02 0.78 0 0.4 0 ...
## $ Betupube: num 0 0 0 0 0 0 0.02 0 0 0 ...
## $ Vacculig: num 1.6 0 0 1.12 0 0 2 0 0.2 0 ...
## $ Diphcomp: num 2.07 0 0 0 0 0 0 0 0 0.07 ...
## $ Dicrsp : num 0 0.33 23.43 0 0 ...
## $ Dicrfusc: num 1.62 10.92 0 3.63 3.42 ...
## $ Dicrpoly: num 0 0.02 1.68 0 0.02 0.02 0 0.23 0.2 0 ...
## $ Hylosple: num 0 0 0 6.7 0 0 0 0 9.97 0 ...
## $ Pleuschr: num 4.67 37.75 32.92 58.07 19.42 ...
## $ Polypili: num 0.02 0.02 0 0 0.02 0.02 0 0 0 0 ...
## $ Polyjuni: num 0.13 0.23 0.23 0 2.12 1.58 0 0.02 0.08 0.02 ...
## $ Polycomm: num 0 0 0 0.13 0 0.18 0 0 0 0 ...
## $ Pohlnuta: num 0.13 0.03 0.32 0.02 0.17 0.07 0.1 0.13 0.07 0.03 ...
## $ Ptilcili: num 0.12 0.02 0.03 0.08 1.8 0.27 0.03 0.1 0.03 0.25 ...
## $ Barbhatc: num 0 0 0 0.08 0.02 0.02 0 0 0 0.07 ...
## $ Cladarbu: num 21.73 12.05 3.58 1.42 9.08 ...
## $ Cladrang: num 21.47 8.13 5.52 7.63 9.22 ...
## $ Cladstel: num 3.5 0.18 0.07 2.55 0.05 ...
## $ Cladunci: num 0.3 2.65 8.93 0.15 0.73 0.25 2.38 0.82 0.05 0.95 ...
## $ Cladcocc: num 0.18 0.13 0 0 0.08 0.1 0.17 0.15 0.02 0.17 ...
## $ Cladcorn: num 0.23 0.18 0.2 0.38 1.42 0.25 0.13 0.05 0.03 0.05 ...
## $ Cladgrac: num 0.25 0.23 0.48 0.12 0.5 0.18 0.18 0.22 0.07 0.23 ...
## $ Cladfimb: num 0.25 0.25 0 0.1 0.17 0.1 0.2 0.22 0.1 0.18 ...
## $ Cladcris: num 0.23 1.23 0.07 0.03 1.78 0.12 0.2 0.17 0.02 0.57 ...
## $ Cladchlo: num 0 0 0.1 0 0.05 0.05 0.02 0 0 0.02 ...
## $ Cladbotr: num 0 0 0.02 0.02 0.05 0.02 0 0 0.02 0.07 ...
## $ Cladamau: num 0.08 0 0 0 0 0 0 0 0 0 ...
## $ Cladsp : num 0.02 0 0 0.02 0 0 0.02 0.02 0 0.07 ...
## $ Cetreric: num 0.02 0.15 0.78 0 0 0 0.02 0.18 0 0.18 ...
## $ Cetrisla: num 0 0.03 0.12 0 0 0 0 0.08 0.02 0.02 ...
## $ Flavniva: num 0.12 0 0 0 0.02 0.02 0 0 0 0 ...
## $ Nepharct: num 0.02 0 0 0 0 0 0 0 0 0 ...
## $ Stersp : num 0.62 0.85 0.03 0 1.58 0.28 0 0.03 0.02 0.03 ...
## $ Peltapht: num 0.02 0 0 0.07 0.33 0 0 0 0 0.02 ...
## $ Icmaeric: num 0 0 0 0 0 0 0 0.07 0 0 ...
## $ Cladcerv: num 0 0 0 0 0 0 0 0 0 0 ...
## $ Claddefo: num 0.25 1 0.33 0.15 1.97 0.37 0.15 0.67 0.08 0.47 ...
## $ Cladphyl: num 0 0 0 0 0 0 0 0 0 0 ...
#Informando somente o grupo de dados varespec, se faz a análise de correspondência na função cca()
resultado.ca <- cca(varespec)
summary(resultado.ca)
##
## Call:
## cca(X = varespec)
##
## Partitioning of scaled Chi-square:
## Inertia Proportion
## Total 2.083 1
## Unconstrained 2.083 1
##
## Eigenvalues, and their contribution to the scaled Chi-square
##
## Importance of components:
## CA1 CA2 CA3 CA4 CA5 CA6 CA7
## Eigenvalue 0.5249 0.3568 0.2344 0.19546 0.17762 0.12156 0.11549
## Proportion Explained 0.2520 0.1713 0.1125 0.09383 0.08526 0.05835 0.05544
## Cumulative Proportion 0.2520 0.4233 0.5358 0.62962 0.71489 0.77324 0.82868
## CA8 CA9 CA10 CA11 CA12 CA13
## Eigenvalue 0.08894 0.07318 0.05752 0.04434 0.02546 0.01710
## Proportion Explained 0.04269 0.03513 0.02761 0.02129 0.01222 0.00821
## Cumulative Proportion 0.87137 0.90650 0.93411 0.95539 0.96762 0.97583
## CA14 CA15 CA16 CA17 CA18
## Eigenvalue 0.014896 0.010160 0.007830 0.006032 0.004008
## Proportion Explained 0.007151 0.004877 0.003759 0.002896 0.001924
## Cumulative Proportion 0.982978 0.987855 0.991614 0.994510 0.996434
## CA19 CA20 CA21 CA22 CA23
## Eigenvalue 0.002865 0.0019275 0.0018074 0.0005864 0.0002434
## Proportion Explained 0.001375 0.0009253 0.0008676 0.0002815 0.0001168
## Cumulative Proportion 0.997809 0.9987341 0.9996017 0.9998832 1.0000000
##
## Scaling 2 for species and site scores
## * Species are scaled proportional to eigenvalues
## * Sites are unscaled: weighted dispersion equal on all dimensions
##
##
## Species scores
##
## CA1 CA2 CA3 CA4 CA5 CA6
## Callvulg 0.0219651 -0.954204 0.055461 -1.2797244 0.0579945 0.798814
## Empenigr 0.0544138 0.226569 0.190301 0.0104668 0.3611286 -0.139798
## Rhodtome 0.8007640 0.895570 1.473304 0.0531002 1.3623062 -0.098847
## Vaccmyrt 1.0588751 0.969421 1.318804 0.1024323 0.1940588 0.248430
## Vaccviti 0.1063608 0.187223 0.071157 0.1076563 0.2894671 -0.051537
## Pinusylv -0.3492265 0.351537 -0.174403 -0.0561897 0.1713089 0.134792
## Descflex 1.1120135 0.728024 0.908150 -0.0005922 -0.5536573 -0.024661
## Betupube 0.4850314 1.165876 1.859362 0.6142811 3.2012930 -0.085239
## Vacculig -0.0601925 -0.973199 0.508703 0.3548606 -0.1289134 -0.566683
## Diphcomp -0.3946082 -0.619767 0.253144 0.4157072 0.1551830 -0.377569
## Dicrsp 1.3128632 0.215210 -2.382601 1.3654912 0.5844397 0.055023
## Dicrfusc 0.9204864 -0.336282 -0.192310 -1.2951865 0.1621852 -0.839809
## Dicrpoly 0.5251420 0.841839 0.389001 0.8468878 1.9249346 0.451664
## Hylosple 1.4535654 1.041666 1.101762 0.4106708 -1.5866910 0.786165
## Pleuschr 0.9492748 0.348263 -0.004863 0.0607013 -0.4727038 0.069878
## Polypili -0.2756876 -0.743016 0.264334 0.6530831 -0.3066610 -0.135153
## Polyjuni 0.7342157 0.059161 -1.087953 0.6678730 0.3257684 -1.067713
## Polycomm 0.6135426 0.789529 0.549966 0.5043274 1.1310269 -0.210949
## Pohlnuta -0.0098863 0.351998 -0.172088 0.0598978 0.3948858 0.138502
## Ptilcili 0.3060113 0.954875 1.663059 0.6189861 2.6639607 0.069360
## Barbhatc 0.3635903 1.265933 2.214206 0.7485792 3.4180314 0.225229
## Cladarbu -0.1109771 -0.886362 0.096956 0.0856283 0.0309403 0.125141
## Cladrang -0.3986726 -0.647506 0.196349 0.3201157 -0.1415224 -0.117122
## Cladstel -1.0413659 0.643770 -0.214966 -0.1662016 -0.1020550 0.001469
## Cladunci 0.5906105 -0.601021 -0.884064 -0.6143250 0.6762879 1.281624
## Cladcocc -0.1545561 -0.349095 -0.103782 -0.2510695 -0.0001597 -0.050661
## Cladcorn 0.1906382 -0.106239 -0.215287 0.1204409 0.1682545 -0.106946
## Cladgrac 0.1417851 -0.185868 -0.115694 0.1675663 0.2079021 0.013103
## Cladfimb 0.0006675 -0.096419 0.089396 -0.1927202 0.2036121 -0.050120
## Cladcris 0.2443835 -0.280964 -0.024662 -0.3642363 0.3026955 0.221793
## Cladchlo -0.4492051 0.721138 0.105982 0.1885373 0.8220828 0.042090
## Cladbotr 0.4091550 0.625599 1.284697 0.4013205 1.8942808 0.418963
## Cladamau -0.4780500 -0.903682 0.403090 0.6975202 -0.0171626 -0.494790
## Cladsp -0.5947602 0.284425 -0.240895 -0.4413346 -0.1008616 0.136249
## Cetreric 0.1781014 -0.411694 -0.815501 -0.0582176 0.3135336 0.827893
## Cetrisla -0.2510628 0.813972 0.415902 0.1754087 1.1601226 0.138273
## Flavniva -1.0427252 -0.497924 -0.062553 0.0031262 -0.6254890 1.030965
## Nepharct 1.2181611 0.119157 -2.098997 0.9858735 0.4029573 -1.908139
## Stersp -0.3747802 -1.362441 0.483100 1.0509067 -0.3747848 -0.502492
## Peltapht 0.2924068 -0.025844 0.021972 0.3143596 0.0769010 -0.293298
## Icmaeric 0.0274415 -1.445286 0.349268 0.1597361 -0.1574714 -0.729434
## Cladcerv -0.6689408 -0.003126 -0.590988 0.1349723 -0.3431706 0.144390
## Claddefo 0.3760557 -0.296651 -0.073940 -0.3076779 0.3810806 0.316994
## Cladphyl -0.9300080 0.690432 -0.386922 -0.3276803 -0.0677692 0.171024
##
##
## Site scores (weighted averages of species scores)
##
## CA1 CA2 CA3 CA4 CA5 CA6
## 18 -0.149232 -0.89910 0.474143 0.55218 0.333521 -0.40879
## 15 0.962177 -0.24177 -0.065652 -0.49180 -0.649787 -0.23363
## 24 1.363110 0.25182 -2.784969 1.82017 0.734410 1.34152
## 27 1.175623 0.83541 0.916089 0.27768 -1.142455 0.21767
## 23 0.496714 -0.09389 0.301149 0.34124 0.570712 -0.50968
## 19 0.004893 0.61971 0.057333 0.13950 -0.274987 -0.09789
## 22 1.188001 -0.19259 0.228980 -2.31092 0.183260 -1.73611
## 16 0.879113 -0.55664 0.002314 -1.80490 0.031028 -1.55021
## 28 1.765788 1.36537 1.383872 0.52333 -2.118872 1.19840
## 13 -0.269156 -1.34875 0.243060 -1.31835 -0.001711 1.52215
## 14 0.729491 -1.17893 -1.069360 -1.96412 1.355664 2.62928
## 20 0.528439 -0.31283 -0.009892 0.22972 0.108702 0.60480
## 25 1.367405 0.20034 -2.292582 1.01623 0.447480 -2.02763
## 7 -0.365350 -1.77480 0.691674 1.03984 -0.077502 -0.57207
## 5 -0.591300 -2.02176 0.773139 1.69572 -0.616039 -0.87384
## 6 -0.456210 -1.29742 0.270061 0.50646 0.150121 0.25985
## 3 -1.241648 0.20216 -0.156431 0.08690 -0.353443 -0.34506
## 4 -1.063176 -0.59183 -0.069763 -0.04061 -0.713689 1.27068
## 2 -1.369446 0.84240 -0.325298 -0.15990 -0.252740 -0.28474
## 9 -1.293505 1.31734 -0.533097 -0.43829 -0.081513 -0.03610
## 12 -1.002610 0.82306 -0.324741 -0.19673 -0.025098 -0.08034
## 10 -1.383095 1.19263 -0.488500 -0.42168 -0.054969 -0.14134
## 11 -0.445323 -0.06481 -0.002680 0.20422 -0.351513 0.19887
## 21 0.358204 1.35180 2.321948 0.81614 3.663041 0.20222
plot(resultado.ca)
#Na CA a métrica de distâncias é o qui-quadrado. Por natuzera essa métrica ignora os duplos zeros. A CA usa uma métrica que é adequada para quando se tem duplos zeros. A distância de qui-quadrado dá um peso maior para menos abundantes. Se temos muitas espécies "raras" e queremos dar um peso maior para elas a aplicação da CA pode ser adequada.
#Carregando um segundo conjunto dados de variáveis do solos para correlacionar com o primeiro conjunto de dados
data(varechem)
resultado.envfit <- envfit(resultado.ca, varechem, permutations = 10000)
resultado.envfit
##
## ***VECTORS
##
## CA1 CA2 r2 Pr(>r)
## N 0.47470 -0.88015 0.2196 0.088291 .
## P 0.44827 0.89390 0.3054 0.031997 *
## K 0.73616 0.67680 0.1773 0.144386
## Ca 0.69724 0.71684 0.3064 0.027597 *
## Mg 0.77318 0.63419 0.2466 0.055094 .
## S 0.05137 0.99868 0.0902 0.395460
## Al -0.97491 -0.22260 0.4995 0.001500 **
## Fe -0.96390 -0.26627 0.3682 0.009599 **
## Mn 0.91444 0.40473 0.4750 0.001300 **
## Zn 0.77039 0.63758 0.1766 0.143086
## Mo -0.63809 -0.76997 0.0539 0.595640
## Baresoil 0.97947 -0.20161 0.2533 0.055894 .
## Humdepth 0.91602 0.40112 0.4524 0.003300 **
## pH -0.99831 0.05818 0.2187 0.079492 .
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## Permutation: free
## Number of permutations: 10000
#Algumas das variáveis fisico-químicas do solo apresentam efeito estatisticamente significativo, alguns dos coeficientes de determinação são relativamente altos, exemplo Mn com 0.4750.
#Plotando os dados das variáveis de fisico-químicas do solo com a presença das espécies e UAs do teste de CA. Buscar os valores que apresentaram diferença significativa para interpretar os dados desse plot. Ex: Al, Fe, Mn, Humdepth, P, Ca.
plot(resultado.envfit)
#A vantagem de utilizar o envfit sobre a CCA é que o envfit traz o resultado por variável. CCA analisa o conjunto.
#A CCA traz como a proporção de explicação se altera com a inserção dos dados fisico-químicos.