Atividades 2º Módulo

Leonardo Souza

2023-03-14

Análise de Cluster

1) Foram coletadas cinco amostras, três da área um e duas da área dois. Utilize a análise exploratória de Cluster para analisar as semelhanças entre as áreas.

As cinco amostra (A1=4, A2=5, A3=1, B1=2 e B2=3) apresentam o mesmo indice de similaridade. Os grupos são 1 (sp1, sp2, sp4, sp14, sp15 e sp16), 2 (sp3, sp6, sp17, sp18 e sp19), 3 (sp5,sp7, sp20, sp21 e sp22), 4 (sp8, sp9, sp10 e sp11) e 5 (sp12 e sp13).

C1<-read.table("C1.txt",header=T)
C1

##      A1 A2 A3 B1 B2
## sp1  13 12  2  3 11
## sp2   8  9  5 12 31
## sp3   0  0  2 21  2
## sp4   3 11  4  0  0
## sp5   0  0  0  1 31
## sp6   0  0 11 12  0
## sp7   0  0  3  0 21
## sp8   2  3  0  0  0
## sp9   1  0  0  0  0
## sp10  1  0  0  0  0
## sp11  1  1  0  0  0
## sp12  0  1  0  0  0
## sp13  0  1  0  0  0
## sp14  0  0  1  0  0
## sp15  0  0  1  0  0
## sp16  0  0  1  0  0
## sp17  0  0  0  1  0
## sp18  0  0  0  1  0
## sp19  0  0  0  1  0
## sp20  0  0  0  0  1
## sp21  0  0  0  0  1
## sp22  0  0  0  0  1

nrow(C1);ncol(C1)

## [1] 22

## [1] 5

names(C1); row.names(C1);str(C1)

## [1] "A1" "A2" "A3" "B1" "B2"

##  [1] "sp1"  "sp2"  "sp3"  "sp4"  "sp5"  "sp6"  "sp7"  "sp8"  "sp9"  "sp10"
## [11] "sp11" "sp12" "sp13" "sp14" "sp15" "sp16" "sp17" "sp18" "sp19" "sp20"
## [21] "sp21" "sp22"

## 'data.frame':    22 obs. of  5 variables:
##  $ A1: int  13 8 0 3 0 0 0 2 1 1 ...
##  $ A2: int  12 9 0 11 0 0 0 3 0 0 ...
##  $ A3: int  2 5 2 4 0 11 3 0 0 0 ...
##  $ B1: int  3 12 21 0 1 12 0 0 0 0 ...
##  $ B2: int  11 31 2 0 31 0 21 0 0 0 ...

library(vegan)

## Carregando pacotes exigidos: permute

## Carregando pacotes exigidos: lattice

## This is vegan 2.6-4

C1t<-log1p(C1)
C1t

##             A1        A2        A3        B1        B2
## sp1  2.6390573 2.5649494 1.0986123 1.3862944 2.4849066
## sp2  2.1972246 2.3025851 1.7917595 2.5649494 3.4657359
## sp3  0.0000000 0.0000000 1.0986123 3.0910425 1.0986123
## sp4  1.3862944 2.4849066 1.6094379 0.0000000 0.0000000
## sp5  0.0000000 0.0000000 0.0000000 0.6931472 3.4657359
## sp6  0.0000000 0.0000000 2.4849066 2.5649494 0.0000000
## sp7  0.0000000 0.0000000 1.3862944 0.0000000 3.0910425
## sp8  1.0986123 1.3862944 0.0000000 0.0000000 0.0000000
## sp9  0.6931472 0.0000000 0.0000000 0.0000000 0.0000000
## sp10 0.6931472 0.0000000 0.0000000 0.0000000 0.0000000
## sp11 0.6931472 0.6931472 0.0000000 0.0000000 0.0000000
## sp12 0.0000000 0.6931472 0.0000000 0.0000000 0.0000000
## sp13 0.0000000 0.6931472 0.0000000 0.0000000 0.0000000
## sp14 0.0000000 0.0000000 0.6931472 0.0000000 0.0000000
## sp15 0.0000000 0.0000000 0.6931472 0.0000000 0.0000000
## sp16 0.0000000 0.0000000 0.6931472 0.0000000 0.0000000
## sp17 0.0000000 0.0000000 0.0000000 0.6931472 0.0000000
## sp18 0.0000000 0.0000000 0.0000000 0.6931472 0.0000000
## sp19 0.0000000 0.0000000 0.0000000 0.6931472 0.0000000
## sp20 0.0000000 0.0000000 0.0000000 0.0000000 0.6931472
## sp21 0.0000000 0.0000000 0.0000000 0.0000000 0.6931472
## sp22 0.0000000 0.0000000 0.0000000 0.0000000 0.6931472

mC1<-vegdist(C1t, "bray")
mC1

##            sp1       sp2       sp3       sp4       sp5       sp6       sp7
## sp2  0.1581088                                                            
## sp3  0.5364767 0.4591672                                                  
## sp4  0.3650610 0.4047802 0.7959658                                        
## sp5  0.5565311 0.4953160 0.6206773 1.0000000                              
## sp6  0.6735471 0.4984249 0.2912521 0.6943282 0.8494588                    
## sp7  0.5108210 0.4669707 0.5500074 0.7215711 0.2841677 0.7089816          
## sp8  0.6074002 0.6643642 1.0000000 0.3760863 1.0000000 1.0000000 1.0000000
## sp9  0.8724304 0.8934882 1.0000000 0.7754547 1.0000000 1.0000000 1.0000000
## sp10 0.8724304 0.8934882 1.0000000 0.7754547 1.0000000 1.0000000 1.0000000
## sp11 0.7601591 0.7977475 1.0000000 0.5962406 1.0000000 1.0000000 1.0000000
## sp12 0.8724304 0.8934882 1.0000000 0.7754547 1.0000000 1.0000000 1.0000000
## sp13 0.8724304 0.8934882 1.0000000 0.7754547 1.0000000 1.0000000 1.0000000
## sp14 0.8724304 0.8934882 0.7682330 0.7754547 1.0000000 0.7586116 0.7318831
## sp15 0.8724304 0.8934882 0.7682330 0.7754547 1.0000000 0.7586116 0.7318831
## sp16 0.8724304 0.8934882 0.7682330 0.7754547 1.0000000 0.7586116 0.7318831
## sp17 0.8724304 0.8934882 0.7682330 1.0000000 0.7142857 0.7586116 1.0000000
## sp18 0.8724304 0.8934882 0.7682330 1.0000000 0.7142857 0.7586116 1.0000000
## sp19 0.8724304 0.8934882 0.7682330 1.0000000 0.7142857 0.7586116 1.0000000
## sp20 0.8724304 0.8934882 0.7682330 1.0000000 0.7142857 1.0000000 0.7318831
## sp21 0.8724304 0.8934882 0.7682330 1.0000000 0.7142857 1.0000000 0.7318831
## sp22 0.8724304 0.8934882 0.7682330 1.0000000 0.7142857 1.0000000 0.7318831
##            sp8       sp9      sp10      sp11      sp12      sp13      sp14
## sp2                                                                       
## sp3                                                                       
## sp4                                                                       
## sp5                                                                       
## sp6                                                                       
## sp7                                                                       
## sp8                                                                       
## sp9  0.5637914                                                            
## sp10 0.5637914 0.0000000                                                  
## sp11 0.2837911 0.3333333 0.3333333                                        
## sp12 0.5637914 1.0000000 1.0000000 0.3333333                              
## sp13 0.5637914 1.0000000 1.0000000 0.3333333 0.0000000                    
## sp14 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000          
## sp15 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000 0.0000000
## sp16 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000 0.0000000
## sp17 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000
## sp18 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000
## sp19 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000
## sp20 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000
## sp21 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000
## sp22 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000
##           sp15      sp16      sp17      sp18      sp19      sp20      sp21
## sp2                                                                       
## sp3                                                                       
## sp4                                                                       
## sp5                                                                       
## sp6                                                                       
## sp7                                                                       
## sp8                                                                       
## sp9                                                                       
## sp10                                                                      
## sp11                                                                      
## sp12                                                                      
## sp13                                                                      
## sp14                                                                      
## sp15                                                                      
## sp16 0.0000000                                                            
## sp17 1.0000000 1.0000000                                                  
## sp18 1.0000000 1.0000000 0.0000000                                        
## sp19 1.0000000 1.0000000 0.0000000 0.0000000                              
## sp20 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000                    
## sp21 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000 0.0000000          
## sp22 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000 0.0000000 0.0000000

dC1<-hclust(mC1, method="complete")
dC1

## 
## Call:
## hclust(d = mC1, method = "complete")
## 
## Cluster method   : complete 
## Distance         : bray 
## Number of objects: 22

Gráfico

plot(dC1, hang=-1,ann=FALSE, cex.axis=1.1,col=1)
title(ylab="Dissimilaridade",
main="Dendrograma C1",xlab="Amostras",cex.lab=1.2)
rect.hclust(dC1,5, border=2:6)

Grupos

gC1<- cutree(dC1,5)
gC1

##  sp1  sp2  sp3  sp4  sp5  sp6  sp7  sp8  sp9 sp10 sp11 sp12 sp13 sp14 sp15 sp16 
##    1    1    2    1    3    2    3    4    4    4    4    5    5    1    1    1 
## sp17 sp18 sp19 sp20 sp21 sp22 
##    2    2    2    3    3    3

cgC1<- cbind(C1, cluster=gC1)
cgC1

##      A1 A2 A3 B1 B2 cluster
## sp1  13 12  2  3 11       1
## sp2   8  9  5 12 31       1
## sp3   0  0  2 21  2       2
## sp4   3 11  4  0  0       1
## sp5   0  0  0  1 31       3
## sp6   0  0 11 12  0       2
## sp7   0  0  3  0 21       3
## sp8   2  3  0  0  0       4
## sp9   1  0  0  0  0       4
## sp10  1  0  0  0  0       4
## sp11  1  1  0  0  0       4
## sp12  0  1  0  0  0       5
## sp13  0  1  0  0  0       5
## sp14  0  0  1  0  0       1
## sp15  0  0  1  0  0       1
## sp16  0  0  1  0  0       1
## sp17  0  0  0  1  0       2
## sp18  0  0  0  1  0       2
## sp19  0  0  0  1  0       2
## sp20  0  0  0  0  1       3
## sp21  0  0  0  0  1       3
## sp22  0  0  0  0  1       3

2) Faça o cluster das capitais brasileiras e compare os resultados.

Foram encontrados 6 grupos: 1 (Maceio, Aracaju, Salvador, Palmas e Rio branco), 2 (Boa vista, Manaus, Sao luis e Belem), 3 (Brasilia, Goiania, Cuiaba, Curitiba, Florianopolis, Porto alegre, Rio de janeiro, Sao paulo, Belo horizonte, Vitoria e Campo grande), 4 (Recife, João pessoa, Natal, Fortaleza e Teresina), 5 (Macapa) e 6 (Porto velho). O grupo 1 e 4 são mais semelhantes entre si, igualmente os grupo 3 e 6 são semelhantes. Os dois grande grupos supracitados são mais similares entre si do que o grande grupo de 2 e 5, que por sua vez são mais semelhantes entre si. Analisando os grupos, as cidades foram agrupadas por proximidade.

C2<-read.table("C2.txt",header=T)
C2

##                 LAT  LONG
## Aracaju       10.91 37.07
## Belem          1.46 48.50
## BeloHorizonte 19.92 43.94
## BoaVista       2.82 60.67
## Brasilia      15.78 47.93
## CampoGrande   20.44 54.65
## Cuiaba        15.60 56.10
## Curitiba      25.43 49.27
## Florianopolis 27.60 48.55
## Fortaleza      3.68 38.54
## Goiania       16.68 49.25
## JoaoPessoa     7.11 34.86
## Macapa         0.04 51.07
## Maceio         9.67 35.74
## Manaus         3.10 60.02
## Natal          5.79 35.21
## Palmas        10.21 48.36
## PortoAlegre   30.03 51.23
## PortoVelho    51.23 63.90
## Recife         8.05 34.88
## RioBranco      9.74 67.81
## RioJaneiro    22.90 43.21
## Salvador      12.97 38.51
## SaoLuis        2.53 44.30
## SaoPaulo      23.53 46.64
## Teresina       5.09 42.80
## Vitoria       20.32 40.34

nrow(C2);ncol(C2)

## [1] 27

## [1] 2

names(C2); row.names(C2);str(C2)

## [1] "LAT"  "LONG"

##  [1] "Aracaju"       "Belem"         "BeloHorizonte" "BoaVista"     
##  [5] "Brasilia"      "CampoGrande"   "Cuiaba"        "Curitiba"     
##  [9] "Florianopolis" "Fortaleza"     "Goiania"       "JoaoPessoa"   
## [13] "Macapa"        "Maceio"        "Manaus"        "Natal"        
## [17] "Palmas"        "PortoAlegre"   "PortoVelho"    "Recife"       
## [21] "RioBranco"     "RioJaneiro"    "Salvador"      "SaoLuis"      
## [25] "SaoPaulo"      "Teresina"      "Vitoria"

## 'data.frame':    27 obs. of  2 variables:
##  $ LAT : num  10.91 1.46 19.92 2.82 15.78 ...
##  $ LONG: num  37.1 48.5 43.9 60.7 47.9 ...

C2t<-log1p(C2)
C2t

##                      LAT     LONG
## Aracaju       2.47737838 3.639427
## Belem         0.90016135 3.901973
## BeloHorizonte 3.04070564 3.805328
## BoaVista      1.34025042 4.121798
## Brasilia      2.82018770 3.890391
## CampoGrande   3.06525834 4.019082
## Cuiaba        2.80940270 4.044804
## Curitiba      3.27449973 3.917408
## Florianopolis 3.35340672 3.902982
## Fortaleza     1.54329811 3.677313
## Goiania       2.87243406 3.917011
## JoaoPessoa    2.09309787 3.579622
## Macapa        0.03922071 3.952589
## Maceio        2.36743607 3.603866
## Manaus        1.41098697 4.111202
## Natal         1.91545094 3.589335
## Palmas        2.41680624 3.899140
## PortoAlegre   3.43495448 3.955657
## PortoVelho    3.95565704 4.172848
## Recife        2.20276476 3.580180
## RioBranco     2.37397509 4.231349
## RioJaneiro    3.17387846 3.788951
## Salvador      2.63691217 3.676554
## SaoLuis       1.26129787 3.813307
## SaoPaulo      3.19989686 3.863673
## Teresina      1.80664808 3.779634
## Vitoria       3.05964560 3.721831

mC2<-vegdist(C2t, "bray")
mC2

##                   Aracaju       Belem BeloHorizonte    BoaVista    Brasilia
## Belem         0.168492849                                                  
## BeloHorizonte 0.056255343 0.192063568                                      
## BoaVista      0.139866961 0.064292896   0.163869931                        
## Brasilia      0.046289523 0.167780471   0.022541057 0.140589558            
## CampoGrande   0.073291781 0.192000278   0.017106971 0.145677255 0.027094180
## Cuiaba        0.056849988 0.176047769   0.034362812 0.125537005 0.012178476
## Curitiba      0.080781909 0.199246771   0.024638533 0.169009469 0.034621850
## Florianopolis 0.085214051 0.203528654   0.029098197 0.175491031 0.039078675
## Fortaleza     0.085730869 0.086582729   0.134703805 0.060615289 0.124880046
## Goiania       0.052117360 0.171444343   0.020531283 0.141776250 0.005841931
## JoaoPessoa    0.037667727 0.144659455   0.093724467 0.116304401 0.083811115
## Macapa        0.272175779 0.103657354   0.290532485 0.155517290 0.265657088
## Maceio        0.012036856 0.163864275   0.068245988 0.135141243 0.058293899
## Manaus        0.132156316 0.069743523   0.156497190 0.007404471 0.133249631
## Natal         0.052662211 0.128838382   0.108595836 0.101001142 0.098711105
## Palmas        0.025761470 0.136667220   0.054529143 0.110308509 0.031637842
## PortoAlegre   0.094304234 0.212296524   0.038251821 0.175904808 0.048225229
## PortoVelho    0.141218392 0.257247204   0.085643424 0.196199280 0.095553496
## Recife        0.028056066 0.153460930   0.084178550 0.124867300 0.074249161
## RioBranco     0.054654830 0.158071160   0.081237252 0.094741104 0.059115106
## RioJaneiro    0.064682581 0.202868353   0.010830006 0.174365874 0.033285810
## Salvador      0.015821137 0.176523956   0.040470226 0.147926072 0.030490715
## SaoLuis       0.124198916 0.045541566   0.149940499 0.036770985 0.138816127
## SaoPaulo      0.071831392 0.197041449   0.015639245 0.169075198 0.029506516
## Teresina      0.069292620 0.099035848   0.101328829 0.073184041 0.091429558
## Vitoria       0.051531766 0.201977305   0.007516976 0.173100668 0.030241358
##               CampoGrande      Cuiaba    Curitiba Florianopolis   Fortaleza
## Belem                                                                      
## BeloHorizonte                                                              
## BoaVista                                                                   
## Brasilia                                                                   
## CampoGrande                                                                
## Cuiaba        0.020201365                                                  
## Curitiba      0.021778480 0.042181961                                      
## Florianopolis 0.028188817 0.048603609 0.006459807                          
## Fortaleza     0.151461752 0.135289486 0.158815246   0.163162464            
## Goiania       0.021255613 0.013986353 0.028785741   0.035241835 0.130626680
## JoaoPessoa    0.110654022 0.094315746 0.118090302   0.122488611 0.059439128
## Macapa        0.279206286 0.263912298 0.292430437   0.299051680 0.193147233
## Maceio        0.085253427 0.068839737 0.092728600   0.097151258 0.080199398
## Manaus        0.138530674 0.118355404 0.161812984   0.168300356 0.052705069
## Natal         0.125469716 0.109185315 0.132878833   0.137260298 0.042901006
## Palmas        0.057341592 0.040869698 0.064848312   0.069291122 0.094944760
## PortoAlegre   0.029922115 0.050172550 0.013626130   0.009163825 0.172069013
## PortoVelho    0.068637013 0.085051218 0.061133892   0.056686494 0.217834187
## Recife        0.101139875 0.084770845 0.108591859   0.112999959 0.068759540
## RioBranco     0.066002366 0.046210568 0.088022381   0.094346091 0.117091226
## RioJaneiro    0.024115263 0.044895943 0.016183892   0.020645264 0.142998897
## Salvador      0.057537362 0.041065786 0.065043902   0.069486594 0.094881722
## SaoLuis       0.165288638 0.149185179 0.172608408   0.176934973 0.040600844
## SaoPaulo      0.020501110 0.041071614 0.009002757   0.013465079 0.150026994
## Teresina      0.118230855 0.101919221 0.125653656   0.130043594 0.033836828
## Vitoria       0.021842512 0.042037973 0.029372416   0.033830844 0.130049484
##                   Goiania  JoaoPessoa      Macapa      Maceio      Manaus
## Belem                                                                    
## BeloHorizonte                                                            
## BoaVista                                                                 
## Brasilia                                                                 
## CampoGrande                                                              
## Cuiaba                                                                   
## Curitiba                                                                 
## Florianopolis                                                            
## Fortaleza                                                                
## Goiania                                                                  
## JoaoPessoa    0.089609171                                                
## Macapa        0.266090725 0.251108295                                    
## Maceio        0.064113995 0.025642497 0.268684954                        
## Manaus        0.134477545 0.108414468 0.160855501 0.127357712            
## Natal         0.104492778 0.016762216 0.235819644 0.040651123 0.093074513
## Palmas        0.036130015 0.053652861 0.235845129 0.028048954 0.102877737
## PortoAlegre   0.042395242 0.131504826 0.298600955 0.106220517 0.168786949
## PortoVelho    0.089761672 0.177939591 0.341302615 0.152995183 0.190929204
## Recife        0.080056366 0.009621830 0.259439046 0.016024621 0.117008741
## RioBranco     0.060680219 0.075957033 0.246624656 0.050412727 0.089312255
## RioJaneiro    0.031231485 0.102101543 0.301086659 0.076659752 0.167011544
## Salvador      0.036326175 0.053457007 0.278859753 0.027852690 0.140302596
## SaoLuis       0.144540842 0.099139510 0.150154075 0.119101052 0.042237659
## SaoPaulo      0.027488646 0.109203644 0.293937665 0.083795796 0.161805016
## Teresina      0.097219562 0.043206416 0.202585505 0.063729212 0.065466165
## Vitoria       0.028177273 0.089026684 0.301781959 0.063529216 0.165644122
##                     Natal      Palmas PortoAlegre  PortoVelho      Recife
## Belem                                                                    
## BeloHorizonte                                                            
## BoaVista                                                                 
## Brasilia                                                                 
## CampoGrande                                                              
## Cuiaba                                                                   
## Curitiba                                                                 
## Florianopolis                                                            
## Fortaleza                                                                
## Goiania                                                                  
## JoaoPessoa                                                               
## Macapa                                                                   
## Maceio                                                                   
## Manaus                                                                   
## Natal                                                                    
## Palmas        0.068621832                                                
## PortoAlegre   0.146240177 0.078405161                                    
## PortoVelho    0.192449381 0.125484729 0.047547369                        
## Recife        0.026264721 0.044053773 0.122037412 0.168606433            
## RioBranco     0.090877611 0.029024997 0.095504256 0.111320922 0.066383720
## RioJaneiro    0.116946434 0.065311862 0.029803450 0.077241362 0.092570655
## Salvador      0.068426337 0.035052502 0.078600369 0.125678049 0.043857735
## SaoLuis       0.083003338 0.108979948 0.185797546 0.231301554 0.108182225
## SaoPaulo      0.124024443 0.061179959 0.022626112 0.070098069 0.099686558
## Teresina      0.026967768 0.061304882 0.139041723 0.185363641 0.052384430
## Vitoria       0.103911983 0.062619128 0.042981343 0.090344081 0.079472931
##                 RioBranco  RioJaneiro    Salvador     SaoLuis    SaoPaulo
## Belem                                                                    
## BeloHorizonte                                                            
## BoaVista                                                                 
## Brasilia                                                                 
## CampoGrande                                                              
## Cuiaba                                                                   
## Curitiba                                                                 
## Florianopolis                                                            
## Fortaleza                                                                
## Goiania                                                                  
## JoaoPessoa                                                               
## Macapa                                                                   
## Maceio                                                                   
## Manaus                                                                   
## Natal                                                                    
## Palmas                                                                   
## PortoAlegre                                                              
## PortoVelho                                                               
## Recife                                                                   
## RioBranco                                                                
## RioJaneiro    0.091560096                                                
## Salvador      0.063297906 0.048911497                                    
## SaoLuis       0.131055528 0.160909422 0.132802785                        
## SaoPaulo      0.087322217 0.007182181 0.056073980 0.163860282            
## Teresina      0.083585564 0.109692832 0.078433939 0.054312876 0.116783008
## Vitoria       0.089281158 0.013194796 0.035739767 0.159397038 0.020375046
##                  Teresina
## Belem                    
## BeloHorizonte            
## BoaVista                 
## Brasilia                 
## CampoGrande              
## Cuiaba                   
## Curitiba                 
## Florianopolis            
## Fortaleza                
## Goiania                  
## JoaoPessoa               
## Macapa                   
## Maceio                   
## Manaus                   
## Natal                    
## Palmas                   
## PortoAlegre              
## PortoVelho               
## Recife                   
## RioBranco                
## RioJaneiro               
## Salvador                 
## SaoLuis                  
## SaoPaulo                 
## Teresina                 
## Vitoria       0.105985319

dC2<-hclust(mC2, method="complete")
dC2

## 
## Call:
## hclust(d = mC2, method = "complete")
## 
## Cluster method   : complete 
## Distance         : bray 
## Number of objects: 27

Gráfico

plot(dC2, hang=-1,ann=FALSE, cex.axis=1.1,col=1)
title(ylab="Dissimilaridade",
main="Dendrograma C2",xlab="Amostras",cex.lab=1.2)
rect.hclust(dC2,6, border=2:6)

Grupos

gC2<- cutree(dC2,6)
gC2

##       Aracaju         Belem BeloHorizonte      BoaVista      Brasilia 
##             1             2             3             2             3 
##   CampoGrande        Cuiaba      Curitiba Florianopolis     Fortaleza 
##             3             3             3             3             4 
##       Goiania    JoaoPessoa        Macapa        Maceio        Manaus 
##             3             4             5             1             2 
##         Natal        Palmas   PortoAlegre    PortoVelho        Recife 
##             4             1             3             6             4 
##     RioBranco    RioJaneiro      Salvador       SaoLuis      SaoPaulo 
##             1             3             1             2             3 
##      Teresina       Vitoria 
##             4             3

cgC2<- cbind(C2, cluster=gC2)
cgC2

##                 LAT  LONG cluster
## Aracaju       10.91 37.07       1
## Belem          1.46 48.50       2
## BeloHorizonte 19.92 43.94       3
## BoaVista       2.82 60.67       2
## Brasilia      15.78 47.93       3
## CampoGrande   20.44 54.65       3
## Cuiaba        15.60 56.10       3
## Curitiba      25.43 49.27       3
## Florianopolis 27.60 48.55       3
## Fortaleza      3.68 38.54       4
## Goiania       16.68 49.25       3
## JoaoPessoa     7.11 34.86       4
## Macapa         0.04 51.07       5
## Maceio         9.67 35.74       1
## Manaus         3.10 60.02       2
## Natal          5.79 35.21       4
## Palmas        10.21 48.36       1
## PortoAlegre   30.03 51.23       3
## PortoVelho    51.23 63.90       6
## Recife         8.05 34.88       4
## RioBranco      9.74 67.81       1
## RioJaneiro    22.90 43.21       3
## Salvador      12.97 38.51       1
## SaoLuis        2.53 44.30       2
## SaoPaulo      23.53 46.64       3
## Teresina       5.09 42.80       4
## Vitoria       20.32 40.34       3

3) Faça o cluster da fauna de três áreas (‘aulapi.txt’)*. Utilize os coeficientes de associação ‘distancia euclidiana’ e Bray-Curtis’ e compare os resultados.

Utilizando o coeficiente de Bray-Curtis foi encontrado 5 grupos, em ordem decrescente de semelhança: 1 (A1,A2 e A3), 4 (B3), 2 (B1), 5 (C1 e C2) e 3 (B2 e C3). Enquanto o coeficiente de Distância Euclidiana gerou 4 grupos: 1 (A1, B2 e C3), 2 (A2, A3 e B3), 3 (B1) e 4 (C1 e C2). Os grupos 1 e 4 são mais próximos entre si, do mesmo modo os grupos 2 e 3 são mais semelhantes.

*Renomeado para C3.

C3<-read.table("C3.txt",header=T)
C3

##    sp1 sp2 sp3 sp4 sp5 sp6 sp7 sp8 sp9 sp10 sp11 sp12 sp13 sp14 sp15
## A1   3   3   1   2   3   3   2   5   5    1   85    2    5    5    4
## A2  44   3   4  90   4  18   5   3   3    5    3    3    5    3    4
## A3   5   1  70   3  50   1  67   1   2    2    1    3    3    1    5
## B1   0  14   0   4   0  13 120   0   0    0    0    5    0    0   15
## B2   0   0   9   3   0   0   0   0   0    1   70   50    8   10    0
## B3  14  12   0   6  32   0   9   8   0   85    0    0    0    0    1
## C1  21  30  25   0   0   0   0  13   8    0    0    0   16   22   10
## C2  24  25   0   0   0   0   0  11  14    0    0   20    0    0   19
## C3   0   0   0   7  22  12   0   0   0    0    0   12   17   20    9

nrow(C3);ncol(C3)

## [1] 9

## [1] 15

names(C3); row.names(C3);str(C3)

##  [1] "sp1"  "sp2"  "sp3"  "sp4"  "sp5"  "sp6"  "sp7"  "sp8"  "sp9"  "sp10"
## [11] "sp11" "sp12" "sp13" "sp14" "sp15"

## [1] "A1" "A2" "A3" "B1" "B2" "B3" "C1" "C2" "C3"

## 'data.frame':    9 obs. of  15 variables:
##  $ sp1 : int  3 44 5 0 0 14 21 24 0
##  $ sp2 : int  3 3 1 14 0 12 30 25 0
##  $ sp3 : int  1 4 70 0 9 0 25 0 0
##  $ sp4 : int  2 90 3 4 3 6 0 0 7
##  $ sp5 : int  3 4 50 0 0 32 0 0 22
##  $ sp6 : int  3 18 1 13 0 0 0 0 12
##  $ sp7 : int  2 5 67 120 0 9 0 0 0
##  $ sp8 : int  5 3 1 0 0 8 13 11 0
##  $ sp9 : int  5 3 2 0 0 0 8 14 0
##  $ sp10: int  1 5 2 0 1 85 0 0 0
##  $ sp11: int  85 3 1 0 70 0 0 0 0
##  $ sp12: int  2 3 3 5 50 0 0 20 12
##  $ sp13: int  5 5 3 0 8 0 16 0 17
##  $ sp14: int  5 3 1 0 10 0 22 0 20
##  $ sp15: int  4 4 5 15 0 1 10 19 9

C3t<-log1p(C3)
C3t

##         sp1       sp2       sp3      sp4      sp5       sp6      sp7       sp8
## A1 1.386294 1.3862944 0.6931472 1.098612 1.386294 1.3862944 1.098612 1.7917595
## A2 3.806662 1.3862944 1.6094379 4.510860 1.609438 2.9444390 1.791759 1.3862944
## A3 1.791759 0.6931472 4.2626799 1.386294 3.931826 0.6931472 4.219508 0.6931472
## B1 0.000000 2.7080502 0.0000000 1.609438 0.000000 2.6390573 4.795791 0.0000000
## B2 0.000000 0.0000000 2.3025851 1.386294 0.000000 0.0000000 0.000000 0.0000000
## B3 2.708050 2.5649494 0.0000000 1.945910 3.496508 0.0000000 2.302585 2.1972246
## C1 3.091042 3.4339872 3.2580965 0.000000 0.000000 0.0000000 0.000000 2.6390573
## C2 3.218876 3.2580965 0.0000000 0.000000 0.000000 0.0000000 0.000000 2.4849066
## C3 0.000000 0.0000000 0.0000000 2.079442 3.135494 2.5649494 0.000000 0.0000000
##         sp9      sp10      sp11     sp12     sp13      sp14      sp15
## A1 1.791759 0.6931472 4.4543473 1.098612 1.791759 1.7917595 1.6094379
## A2 1.386294 1.7917595 1.3862944 1.386294 1.791759 1.3862944 1.6094379
## A3 1.098612 1.0986123 0.6931472 1.386294 1.386294 0.6931472 1.7917595
## B1 0.000000 0.0000000 0.0000000 1.791759 0.000000 0.0000000 2.7725887
## B2 0.000000 0.6931472 4.2626799 3.931826 2.197225 2.3978953 0.0000000
## B3 0.000000 4.4543473 0.0000000 0.000000 0.000000 0.0000000 0.6931472
## C1 2.197225 0.0000000 0.0000000 0.000000 2.833213 3.1354942 2.3978953
## C2 2.708050 0.0000000 0.0000000 3.044522 0.000000 0.0000000 2.9957323
## C3 0.000000 0.0000000 0.0000000 2.564949 2.890372 3.0445224 2.3025851

Bray-Curtis

mC3<-vegdist(C3t, "bray")
mC3

##           A1        A2        A3        B1        B2        B3        C1
## A2 0.2797460                                                            
## A3 0.3906023 0.3441442                                                  
## B1 0.6139334 0.5478403 0.5172709                                        
## B2 0.4373725 0.5894142 0.6026655 0.8101994                              
## B3 0.5648573 0.4690447 0.4735969 0.6090384 0.8891980                    
## C1 0.4728200 0.4827732 0.5325941 0.7401733 0.6564688 0.6233629          
## C2 0.5596537 0.5631617 0.6574870 0.5725496 0.8254379 0.5711716 0.3400284
## C3 0.5165241 0.4860973 0.5282868 0.5261336 0.5219348 0.7034512 0.6064157
##           C2
## A2          
## A3          
## B1          
## B2          
## B3          
## C1          
## C2          
## C3 0.7317608

dC3<-hclust(mC3, method="complete")
dC3

## 
## Call:
## hclust(d = mC3, method = "complete")
## 
## Cluster method   : complete 
## Distance         : bray 
## Number of objects: 9

Gráfico

plot(dC3, hang=-1,ann=FALSE, cex.axis=1.1,col=1)
title(ylab="Dissimilaridade",
main="Dendrograma C3",xlab="Amostras",cex.lab=1.2)
rect.hclust(dC3,5, border=2:6)

Grupos

gC3<- cutree(dC3,5)
gC3

## A1 A2 A3 B1 B2 B3 C1 C2 C3 
##  1  1  1  2  3  4  5  5  3

cgC3<- cbind(C3, cluster=gC3)
cgC3

##    sp1 sp2 sp3 sp4 sp5 sp6 sp7 sp8 sp9 sp10 sp11 sp12 sp13 sp14 sp15 cluster
## A1   3   3   1   2   3   3   2   5   5    1   85    2    5    5    4       1
## A2  44   3   4  90   4  18   5   3   3    5    3    3    5    3    4       1
## A3   5   1  70   3  50   1  67   1   2    2    1    3    3    1    5       1
## B1   0  14   0   4   0  13 120   0   0    0    0    5    0    0   15       2
## B2   0   0   9   3   0   0   0   0   0    1   70   50    8   10    0       3
## B3  14  12   0   6  32   0   9   8   0   85    0    0    0    0    1       4
## C1  21  30  25   0   0   0   0  13   8    0    0    0   16   22   10       5
## C2  24  25   0   0   0   0   0  11  14    0    0   20    0    0   19       5
## C3   0   0   0   7  22  12   0   0   0    0    0   12   17   20    9       3

Distância Euclidiana

mC3e<-vegdist(C3t, "euclidean")
mC3e

##           A1        A2        A3        B1        B2        B3        C1
## A2  5.700450                                                            
## A3  6.903270  6.316713                                                  
## B1  7.521120  7.387786  7.209153                                        
## B2  5.401294  8.044140  8.314087  9.173068                              
## B3  7.615049  6.613724  6.921923  8.067030 10.035801                    
## C1  6.771893  7.502569  7.931208  9.287243  8.762570  8.857762          
## C2  6.882649  7.690750  8.748798  7.638438  8.983244  7.992743  6.199365
## C3  6.564405  6.737954  7.556452  7.670264  6.993737  8.797906  8.431393
##           C2
## A2          
## A3          
## B1          
## B2          
## B3          
## C1          
## C2          
## C3  8.576294

dC3e<-hclust(mC3e, method="complete")
dC3e

## 
## Call:
## hclust(d = mC3e, method = "complete")
## 
## Cluster method   : complete 
## Distance         : euclidean 
## Number of objects: 9

Gráfico

plot(dC3e, hang=-1,ann=FALSE, cex.axis=1.1,col=1)
title(ylab="Dissimilaridade",
main="Dendrograma C3",xlab="Amostras",cex.lab=1.2)
rect.hclust(dC3e,4, border=2:6)

Grupos

gC3e<- cutree(dC3e,4)
gC3e

## A1 A2 A3 B1 B2 B3 C1 C2 C3 
##  1  2  2  3  1  2  4  4  1

cgC3e<- cbind(C3, cluster=gC3e)
cgC3e

##    sp1 sp2 sp3 sp4 sp5 sp6 sp7 sp8 sp9 sp10 sp11 sp12 sp13 sp14 sp15 cluster
## A1   3   3   1   2   3   3   2   5   5    1   85    2    5    5    4       1
## A2  44   3   4  90   4  18   5   3   3    5    3    3    5    3    4       2
## A3   5   1  70   3  50   1  67   1   2    2    1    3    3    1    5       2
## B1   0  14   0   4   0  13 120   0   0    0    0    5    0    0   15       3
## B2   0   0   9   3   0   0   0   0   0    1   70   50    8   10    0       1
## B3  14  12   0   6  32   0   9   8   0   85    0    0    0    0    1       2
## C1  21  30  25   0   0   0   0  13   8    0    0    0   16   22   10       4
## C2  24  25   0   0   0   0   0  11  14    0    0   20    0    0   19       4
## C3   0   0   0   7  22  12   0   0   0    0    0   12   17   20    9       1

4) Os dados abióticos de três prados de ervas marinhas foram coletados. Descreva os três ambientes utilizando a analise de Cluster. discuta o uso do tipo de cluster escolhido e do coeficiente de associação.(HaloduleAbiotico.txt)*

Foram obtidos três grupos: 1 (SA, SB e SC), 2 (CA, CB e CC) e 3 (TA, TB e TC). Os grupos 2 e 3 apresentam maior índice de similaridade. Foi utilizado o índice de Bray-Curtis por se tratar de um índice simétrico (mais adequado para dados abióticos) e o cluster médio (para não tendenciar o resultado).

*Renomeado para C4.

C4<-read.table("C4.txt",header=T)
C4

##       Meanmm       Gravel     Sand         mo     CaCO3 MediaNumTalos
## SA 0.1977082  0.006820706 90.74722  0.7793154  2.026049          15.8
## SB 0.1567520  0.029504556 93.53834  0.7671558  1.683111          27.6
## SC 0.1291095  1.248660748 84.63238  1.1246418  1.725585          25.4
## CA 0.1877505 10.549661500 50.00886 14.8964874 55.111331          15.8
## CB 0.2312549 12.271879160 61.60721  9.2596896 48.454016          17.6
## CC 0.1424418  4.379080900 63.82608  7.5375690 36.201956           2.8
## TA 0.1488571  0.602777746 84.24157  5.0433597 45.048717          24.2
## TB 0.1562217  0.381141022 83.32625  7.6325583 48.014157          25.6
## TC 0.1019311  0.830105288 76.12643  7.7981446 44.563297          25.8
##    NfolhasMdia compmedio TempC  mmHg    O2 Salinidade   pH
## SA   1.2768436 10.395455  26.5 765.2  7.63   26.32565 7.78
## SB   1.1068510 10.200502  27.1 764.8  7.12   27.37123 8.07
## SC   1.1030042  8.912925  28.2 765.5  6.45   26.71685 8.06
## CA   1.5822222 20.793562  27.9 762.8  8.08   29.77950 8.32
## CB   1.2344612 17.311197  27.5 763.1 10.25   29.49495 8.03
## CC   0.9833333 10.471429  28.5 763.0  9.62   30.25719 8.31
## TA   1.6772310  7.040551  26.9 762.5  7.55   25.28981 7.68
## TB   1.2680418  6.413243  27.7 762.2  8.30   26.32682 7.99
## TC   1.2573583  7.390939  29.1 761.6  6.51   29.05001 8.17

nrow(C4);ncol(C4)

## [1] 9

## [1] 13

names(C4); row.names(C4);str(C4)

##  [1] "Meanmm"        "Gravel"        "Sand"          "mo"           
##  [5] "CaCO3"         "MediaNumTalos" "NfolhasMdia"   "compmedio"    
##  [9] "TempC"         "mmHg"          "O2"            "Salinidade"   
## [13] "pH"

## [1] "SA" "SB" "SC" "CA" "CB" "CC" "TA" "TB" "TC"

## 'data.frame':    9 obs. of  13 variables:
##  $ Meanmm       : num  0.198 0.157 0.129 0.188 0.231 ...
##  $ Gravel       : num  0.00682 0.0295 1.24866 10.54966 12.27188 ...
##  $ Sand         : num  90.7 93.5 84.6 50 61.6 ...
##  $ mo           : num  0.779 0.767 1.125 14.896 9.26 ...
##  $ CaCO3        : num  2.03 1.68 1.73 55.11 48.45 ...
##  $ MediaNumTalos: num  15.8 27.6 25.4 15.8 17.6 2.8 24.2 25.6 25.8
##  $ NfolhasMdia  : num  1.28 1.11 1.1 1.58 1.23 ...
##  $ compmedio    : num  10.4 10.2 8.91 20.79 17.31 ...
##  $ TempC        : num  26.5 27.1 28.2 27.9 27.5 28.5 26.9 27.7 29.1
##  $ mmHg         : num  765 765 766 763 763 ...
##  $ O2           : num  7.63 7.12 6.45 8.08 10.25 ...
##  $ Salinidade   : num  26.3 27.4 26.7 29.8 29.5 ...
##  $ pH           : num  7.78 8.07 8.06 8.32 8.03 8.31 7.68 7.99 8.17

C4t<-log1p(C4)
C4t

##        Meanmm     Gravel     Sand        mo     CaCO3 MediaNumTalos NfolhasMdia
## SA 0.18040988 0.00679755 4.519037 0.5762287 1.1072579      2.821379   0.8227901
## SB 0.14561606 0.02907767 4.549005 0.5693714 0.9869769      3.353407   0.7451944
## SC 0.12142924 0.81033482 4.450063 0.7536032 1.0026832      3.273364   0.7433669
## CA 0.17206121 2.44665613 3.931999 2.7660982 4.0273378      2.821379   0.9486504
## CB 0.20803386 2.58564745 4.136880 2.3282226 3.9010433      2.923162   0.8040001
## CC 0.13316790 1.68251752 4.171708 2.1444763 3.6163613      1.335001   0.6847789
## TA 0.13876763 0.47173822 4.445489 1.7989601 3.8296999      3.226844   0.9847830
## TB 0.14515752 0.32290999 4.434693 2.1555409 3.8921092      3.280911   0.8189168
## TC 0.09706422 0.60437350 4.345446 2.1745409 3.8191025      3.288402   0.8141952
##    compmedio    TempC     mmHg       O2 Salinidade       pH
## SA  2.433215 3.314186 6.641443 2.155245   3.307826 2.172476
## SB  2.415959 3.335770 6.640921 2.094330   3.345376 2.204972
## SC  2.293839 3.374169 6.641835 2.008214   3.322040 2.203869
## CA  3.081615 3.363842 6.638306 2.206074   3.426849 2.232163
## CB  2.907513 3.349904 6.638699 2.420368   3.417561 2.200552
## CC  2.439859 3.384390 6.638568 2.362739   3.442249 2.231089
## TA  2.084498 3.328627 6.637913 2.145931   3.269182 2.161022
## TB  2.003268 3.356897 6.637520 2.230014   3.307869 2.196113
## TC  2.127152 3.404525 6.636734 2.016235   3.402863 2.215937

mC4<-vegdist(C4t, "bray")
mC4

##            SA         SB         SC         CA         CB         CC         TA
## SB 0.01643882                                                                  
## SC 0.03500389 0.02374315                                                       
## CA 0.13507939 0.14530515 0.13078175                                            
## CB 0.12626243 0.13341091 0.11931028 0.02153364                                 
## CC 0.12829011 0.13593659 0.11989819 0.06444486 0.05276512                      
## TA 0.08545546 0.08476893 0.07650908 0.07507942 0.06751369 0.07432125           
## TB 0.09004147 0.08689533 0.08295545 0.07211815 0.06052891 0.06906210 0.01547776
## TC 0.09720666 0.09037292 0.07523232 0.06791936 0.05748433 0.06269482 0.01915548
##            TB
## SB           
## SC           
## CA           
## CB           
## CC           
## TA           
## TB           
## TC 0.01468438

dC4<-hclust(mC4, method="average")
dC4

## 
## Call:
## hclust(d = mC4, method = "average")
## 
## Cluster method   : average 
## Distance         : bray 
## Number of objects: 9

Gráfico

plot(dC4, hang=-1,ann=FALSE, cex.axis=1.1,col=1)
title(ylab="Dissimilaridade",
main="Dendrograma C4",xlab="Amostras",cex.lab=1.2)
rect.hclust(dC4,3, border=2:6)

Grupos

gC4<- cutree(dC4,3)
gC4

## SA SB SC CA CB CC TA TB TC 
##  1  1  1  2  2  2  3  3  3

cgC4<- cbind(C4, cluster=gC4)
cgC4

##       Meanmm       Gravel     Sand         mo     CaCO3 MediaNumTalos
## SA 0.1977082  0.006820706 90.74722  0.7793154  2.026049          15.8
## SB 0.1567520  0.029504556 93.53834  0.7671558  1.683111          27.6
## SC 0.1291095  1.248660748 84.63238  1.1246418  1.725585          25.4
## CA 0.1877505 10.549661500 50.00886 14.8964874 55.111331          15.8
## CB 0.2312549 12.271879160 61.60721  9.2596896 48.454016          17.6
## CC 0.1424418  4.379080900 63.82608  7.5375690 36.201956           2.8
## TA 0.1488571  0.602777746 84.24157  5.0433597 45.048717          24.2
## TB 0.1562217  0.381141022 83.32625  7.6325583 48.014157          25.6
## TC 0.1019311  0.830105288 76.12643  7.7981446 44.563297          25.8
##    NfolhasMdia compmedio TempC  mmHg    O2 Salinidade   pH cluster
## SA   1.2768436 10.395455  26.5 765.2  7.63   26.32565 7.78       1
## SB   1.1068510 10.200502  27.1 764.8  7.12   27.37123 8.07       1
## SC   1.1030042  8.912925  28.2 765.5  6.45   26.71685 8.06       1
## CA   1.5822222 20.793562  27.9 762.8  8.08   29.77950 8.32       2
## CB   1.2344612 17.311197  27.5 763.1 10.25   29.49495 8.03       2
## CC   0.9833333 10.471429  28.5 763.0  9.62   30.25719 8.31       2
## TA   1.6772310  7.040551  26.9 762.5  7.55   25.28981 7.68       3
## TB   1.2680418  6.413243  27.7 762.2  8.30   26.32682 7.99       3
## TC   1.2573583  7.390939  29.1 761.6  6.51   29.05001 8.17       3

5) Estas amostras representam apenas uma associação de espécies? Faça o dendrograma, justificando o uso de transformação dos dados, coeficiente de associação e técnica utilizada.

Não. Elas tem três associações: similaridade entre as amostras, distância das semelhanças e correlação entre as espécies. O uso de transformação dos dados auxilia a diminuir a influência excessiva das espécies dominantes, além de evitar uma grande diferença (a grau de magnitude) entre as réplicas. O índice de Bray-Curtis foi utilizado para diminuir a influência excessiva das espécies dominantes (por utilizar a soma da mínima abundâncias das espécies comuns as amostras). Enquanto a técnica de cluster médio visou evitar algum tipo de tendência nos resultados.

C5<-read.table("C5.txt",header=T)
C5

##          X1 X2 X3 X4 X5 X6 X7 X8 X9 X10
## Especie1 24 27 24  8 10 14 14 36 36  41
## Especie2 32 30 29 20 18 20 22 14  8  12
## Especie3  3  1  2 11 14 13 12  8  8   6

nrow(C5);ncol(C5)

## [1] 3

## [1] 10

names(C5); row.names(C5);str(C5)

##  [1] "X1"  "X2"  "X3"  "X4"  "X5"  "X6"  "X7"  "X8"  "X9"  "X10"

## [1] "Especie1" "Especie2" "Especie3"

## 'data.frame':    3 obs. of  10 variables:
##  $ X1 : int  24 32 3
##  $ X2 : int  27 30 1
##  $ X3 : int  24 29 2
##  $ X4 : int  8 20 11
##  $ X5 : int  10 18 14
##  $ X6 : int  14 20 13
##  $ X7 : int  14 22 12
##  $ X8 : int  36 14 8
##  $ X9 : int  36 8 8
##  $ X10: int  41 12 6

C5t<-log1p(C5)
C5t

##                X1        X2       X3       X4       X5       X6       X7
## Especie1 3.218876 3.3322045 3.218876 2.197225 2.397895 2.708050 2.708050
## Especie2 3.496508 3.4339872 3.401197 3.044522 2.944439 3.044522 3.135494
## Especie3 1.386294 0.6931472 1.098612 2.484907 2.708050 2.639057 2.564949
##                X8       X9      X10
## Especie1 3.610918 3.610918 3.737670
## Especie2 2.708050 2.197225 2.564949
## Especie3 2.197225 2.197225 1.945910

mC5<-vegdist(C5t, "bray")
mC5

##           Especie1  Especie2
## Especie2 0.1022667          
## Especie3 0.2373059 0.2015688

dC5<-hclust(mC5, method="average")
dC5

## 
## Call:
## hclust(d = mC5, method = "average")
## 
## Cluster method   : average 
## Distance         : bray 
## Number of objects: 3

Gráfico

plot(dC5, hang=-1,ann=FALSE, cex.axis=1.1,col=1)
title(ylab="Dissimilaridade",
main="Dendrograma C5",xlab="Amostras",cex.lab=1.2)
rect.hclust(dC5,2, border=2:6)

Grupos

gC5<- cutree(dC5,2)
gC5

## Especie1 Especie2 Especie3 
##        1        1        2

cgC5<- cbind(C5, cluster=gC5)
cgC5

##          X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 cluster
## Especie1 24 27 24  8 10 14 14 36 36  41       1
## Especie2 32 30 29 20 18 20 22 14  8  12       1
## Especie3  3  1  2 11 14 13 12  8  8   6       2

6) Faça uma pergunta multivariada e descreva passo a passo a realização do dendrograma, explicando suas escolhas, faça uma conclusão.

Utilizando o coeficiente de Jaccard foi encontrado 5 grupos, em ordem decrescente de semelhança: 1 (spA, spB, spC e spE), 5 (spJ), 2 (spD e spI), 4 (spH) e 3 (spG). Este índice foi utilizado por ser um índice assimétrico, que não considera o duplo zero, ou seja considera que o zero pode ser falta de informação. Enquanto a técnica de cluster médio visou evitar algum tipo de tendência nos resultados.

C6<-read.table("C6.txt",header=T)
C6

##     A1 A2 A3 A4 A5 A6 A7 A8 A9 A10
## spA 15  0  6  0  2  0  5  0 15   0
## spB  4  1  1  1  0  0  2  6  8   1
## spC  0  4  1  0  8 19  6  0  0   7
## spD  0  8  0 16  0  3  0  2  0   5
## spE  1  0  0  0 10  0  0  0  0  11
## spG  0  0  1  0  0  0  0  0  0   0
## spH  1  0  0  0  0  0  0  0  0   0
## spI  0  0  0  8  0  0  0  0  0   0
## spJ  0  0  0  0  0  0  3  0  0   0

nrow(C6);ncol(C6)

## [1] 9

## [1] 10

names(C6); row.names(C6);str(C6)

##  [1] "A1"  "A2"  "A3"  "A4"  "A5"  "A6"  "A7"  "A8"  "A9"  "A10"

## [1] "spA" "spB" "spC" "spD" "spE" "spG" "spH" "spI" "spJ"

## 'data.frame':    9 obs. of  10 variables:
##  $ A1 : int  15 4 0 0 1 0 1 0 0
##  $ A2 : int  0 1 4 8 0 0 0 0 0
##  $ A3 : int  6 1 1 0 0 1 0 0 0
##  $ A4 : int  0 1 0 16 0 0 0 8 0
##  $ A5 : int  2 0 8 0 10 0 0 0 0
##  $ A6 : int  0 0 19 3 0 0 0 0 0
##  $ A7 : int  5 2 6 0 0 0 0 0 3
##  $ A8 : int  0 6 0 2 0 0 0 0 0
##  $ A9 : int  15 8 0 0 0 0 0 0 0
##  $ A10: int  0 1 7 5 11 0 0 0 0

C6t<-log1p(C6)
C6t

##            A1        A2        A3        A4       A5       A6       A7       A8
## spA 2.7725887 0.0000000 1.9459101 0.0000000 1.098612 0.000000 1.791759 0.000000
## spB 1.6094379 0.6931472 0.6931472 0.6931472 0.000000 0.000000 1.098612 1.945910
## spC 0.0000000 1.6094379 0.6931472 0.0000000 2.197225 2.995732 1.945910 0.000000
## spD 0.0000000 2.1972246 0.0000000 2.8332133 0.000000 1.386294 0.000000 1.098612
## spE 0.6931472 0.0000000 0.0000000 0.0000000 2.397895 0.000000 0.000000 0.000000
## spG 0.0000000 0.0000000 0.6931472 0.0000000 0.000000 0.000000 0.000000 0.000000
## spH 0.6931472 0.0000000 0.0000000 0.0000000 0.000000 0.000000 0.000000 0.000000
## spI 0.0000000 0.0000000 0.0000000 2.1972246 0.000000 0.000000 0.000000 0.000000
## spJ 0.0000000 0.0000000 0.0000000 0.0000000 0.000000 0.000000 1.386294 0.000000
##           A9       A10
## spA 2.772589 0.0000000
## spB 2.197225 0.6931472
## spC 0.000000 2.0794415
## spD 0.000000 1.7917595
## spE 0.000000 2.4849066
## spG 0.000000 0.0000000
## spH 0.000000 0.0000000
## spI 0.000000 0.0000000
## spJ 0.000000 0.0000000

mC6<-vegdist(C6t, "jaccard")
mC6

##           spA       spB       spC       spD       spE       spG       spH
## spB 0.6114045                                                            
## spC 0.8043806 0.8231134                                                  
## spD 1.0000000 0.7982550 0.7015374                                        
## spE 0.8735138 0.8996415 0.6664113 0.8631335                              
## spG 0.9332322 0.9279755 0.9398356 1.0000000 1.0000000                    
## spH 0.9332322 0.9279755 1.0000000 1.0000000 0.8756898 1.0000000          
## spI 1.0000000 0.9377106 1.0000000 0.7639196 1.0000000 1.0000000 1.0000000
## spJ 0.8664644 0.8891573 0.8796713 1.0000000 1.0000000 1.0000000 1.0000000
##           spI
## spB          
## spC          
## spD          
## spE          
## spG          
## spH          
## spI          
## spJ 1.0000000

dC6<-hclust(mC6, method="average")
dC6

## 
## Call:
## hclust(d = mC6, method = "average")
## 
## Cluster method   : average 
## Distance         : jaccard 
## Number of objects: 9

Gráfico

plot(dC6, hang=-1,ann=FALSE, cex.axis=1.1,col=1)
title(ylab="Dissimilaridade",
main="Dendrograma C6",xlab="Amostras",cex.lab=1.2)
rect.hclust(dC6,5, border=2:6)

Grupos

gC6<- cutree(dC6,5)
gC6

## spA spB spC spD spE spG spH spI spJ 
##   1   1   1   2   1   3   4   2   5

cgC6<- cbind(C6, cluster=gC6)
cgC6

##     A1 A2 A3 A4 A5 A6 A7 A8 A9 A10 cluster
## spA 15  0  6  0  2  0  5  0 15   0       1
## spB  4  1  1  1  0  0  2  6  8   1       1
## spC  0  4  1  0  8 19  6  0  0   7       1
## spD  0  8  0 16  0  3  0  2  0   5       2
## spE  1  0  0  0 10  0  0  0  0  11       1
## spG  0  0  1  0  0  0  0  0  0   0       3
## spH  1  0  0  0  0  0  0  0  0   0       4
## spI  0  0  0  8  0  0  0  0  0   0       2
## spJ  0  0  0  0  0  0  3  0  0   0       5

7) Faça uma análise de Cluster utilizando os diferentes tipos de ligação média (os quatro) com a matriz de dados abaixo. Não é necessário transformar os dados. Utilize a distância euclidiana como índice similaridade.

Só foi possível encontrar um cluster de média. Foram formados 4 grupos: 1 (1 e 2), 2 (3, 4 e 5), 3 (7, 8, 6 e 9) e 4 (10). Os grupos 1 e 2 são mais semelhantes entre si, o mesmo ocorre entre os grupos 3 e 4.

C7<-read.table("C7.txt",header=T)
C7

##    sp1 sp2
## 1   15  75
## 2   21  72
## 3   33  58
## 4   32  46
## 5   34  32
## 6   51  27
## 7   54  45
## 8   64  42
## 9   66  20
## 10  82  15

nrow(C7);ncol(C7)

## [1] 10

## [1] 2

names(C7); row.names(C7);str(C7)

## [1] "sp1" "sp2"

##  [1] "1"  "2"  "3"  "4"  "5"  "6"  "7"  "8"  "9"  "10"

## 'data.frame':    10 obs. of  2 variables:
##  $ sp1: int  15 21 33 32 34 51 54 64 66 82
##  $ sp2: int  75 72 58 46 32 27 45 42 20 15

mC7<-vegdist(C7, "euclidean")
mC7

##            1         2         3         4         5         6         7
## 2   6.708204                                                            
## 3  24.758837 18.439089                                                  
## 4  33.615473 28.231188 12.041595                                        
## 5  47.010637 42.059482 26.019224 14.142136                              
## 6  60.000000 54.083269 35.846897 26.870058 17.720045                    
## 7  49.203658 42.638011 24.698178 22.022716 23.853721 18.248288          
## 8  59.076222 52.430907 34.885527 32.249031 31.622777 19.849433 10.440307
## 9  75.006666 68.767725 50.328918 42.801869 34.176015 16.552945 27.730849
## 10 89.938868 83.486526 65.192024 58.830264 50.921508 33.241540 41.036569
##            8         9
## 2                     
## 3                     
## 4                     
## 5                     
## 6                     
## 7                     
## 8                     
## 9  22.090722          
## 10 32.449961 16.763055

dC7<-hclust(mC7, method="average")
dC7

## 
## Call:
## hclust(d = mC7, method = "average")
## 
## Cluster method   : average 
## Distance         : euclidean 
## Number of objects: 10

Gráfico

plot(dC7, hang=-1,ann=FALSE, cex.axis=1.1,col=1)
title(ylab="Dissimilaridade",
main="Dendrograma C7",xlab="Amostras",cex.lab=1.2)
rect.hclust(dC7,4, border=2:6)

Grupos

gC7<- cutree(dC7,4)
gC7

##  1  2  3  4  5  6  7  8  9 10 
##  1  1  2  2  2  3  3  3  3  4

cgC7<- cbind(C7, cluster=gC7)
cgC7

##    sp1 sp2 cluster
## 1   15  75       1
## 2   21  72       1
## 3   33  58       2
## 4   32  46       2
## 5   34  32       2
## 6   51  27       3
## 7   54  45       3
## 8   64  42       3
## 9   66  20       3
## 10  82  15       4

8) Faça uma análise de Cluster utilizando o método de médias não ponderadas (UPGMA) com a matriz de dados abaixo. Transforme os dados se achar necessário. Utilize o índice similaridade que você achar mais adequado. Justifique suas escolhas.

Foi utilizado o índice de Jaccard por se tratar de um índice assimétrico (não considera o duplo zero; considera que o zero pode ser falta de informação). Foram obtidos três grupos: 1 (sp1, sp2, sp3, sp7, sp8 e sp9), 2 (sp4, sp5 e sp6) e 3 (sp10). Os grupos 1 e 2 apresentam maior índice de similaridade.

C8<-read.table("C8.txt",header=T)
C8

##      X1 X2 X3 X4 X5 X6 X7 X8
## Sp1   0  1  1  1  0  0  0  1
## Sp2   0  1  1  0  1  0  0  1
## Sp3   0  1  1  1  0  0  0  1
## Sp4   1  0  0  0  1  1  1  0
## Sp5   1  1  1  1  1  1  1  0
## Sp6   1  1  1  1  0  1  1  0
## Sp7   1  1  1  0  1  0  0  1
## Sp8   0  1  1  1  0  0  0  1
## Sp9   0  1  1  1  0  0  0  1
## Sp10  0  0  0  0  0  0  0  1

nrow(C8);ncol(C8)

## [1] 10

## [1] 8

names(C8); row.names(C8);str(C8)

## [1] "X1" "X2" "X3" "X4" "X5" "X6" "X7" "X8"

##  [1] "Sp1"  "Sp2"  "Sp3"  "Sp4"  "Sp5"  "Sp6"  "Sp7"  "Sp8"  "Sp9"  "Sp10"

## 'data.frame':    10 obs. of  8 variables:
##  $ X1: int  0 0 0 1 1 1 1 0 0 0
##  $ X2: int  1 1 1 0 1 1 1 1 1 0
##  $ X3: int  1 1 1 0 1 1 1 1 1 0
##  $ X4: int  1 0 1 0 1 1 0 1 1 0
##  $ X5: int  0 1 0 1 1 0 1 0 0 0
##  $ X6: int  0 0 0 1 1 1 0 0 0 0
##  $ X7: int  0 0 0 1 1 1 0 0 0 0
##  $ X8: int  1 1 1 0 0 0 1 1 1 1

C8t<-log1p(C8)
C8t

##             X1        X2        X3        X4        X5        X6        X7
## Sp1  0.0000000 0.6931472 0.6931472 0.6931472 0.0000000 0.0000000 0.0000000
## Sp2  0.0000000 0.6931472 0.6931472 0.0000000 0.6931472 0.0000000 0.0000000
## Sp3  0.0000000 0.6931472 0.6931472 0.6931472 0.0000000 0.0000000 0.0000000
## Sp4  0.6931472 0.0000000 0.0000000 0.0000000 0.6931472 0.6931472 0.6931472
## Sp5  0.6931472 0.6931472 0.6931472 0.6931472 0.6931472 0.6931472 0.6931472
## Sp6  0.6931472 0.6931472 0.6931472 0.6931472 0.0000000 0.6931472 0.6931472
## Sp7  0.6931472 0.6931472 0.6931472 0.0000000 0.6931472 0.0000000 0.0000000
## Sp8  0.0000000 0.6931472 0.6931472 0.6931472 0.0000000 0.0000000 0.0000000
## Sp9  0.0000000 0.6931472 0.6931472 0.6931472 0.0000000 0.0000000 0.0000000
## Sp10 0.0000000 0.0000000 0.0000000 0.0000000 0.0000000 0.0000000 0.0000000
##             X8
## Sp1  0.6931472
## Sp2  0.6931472
## Sp3  0.6931472
## Sp4  0.0000000
## Sp5  0.0000000
## Sp6  0.0000000
## Sp7  0.6931472
## Sp8  0.6931472
## Sp9  0.6931472
## Sp10 0.6931472

mC8<-vegdist(C8t, "jaccard")
mC8

##            Sp1       Sp2       Sp3       Sp4       Sp5       Sp6       Sp7
## Sp2  0.4000000                                                            
## Sp3  0.0000000 0.4000000                                                  
## Sp4  1.0000000 0.8571429 1.0000000                                        
## Sp5  0.6250000 0.6250000 0.6250000 0.4285714                              
## Sp6  0.5714286 0.7500000 0.5714286 0.5714286 0.1428571                    
## Sp7  0.5000000 0.2000000 0.5000000 0.7142857 0.5000000 0.6250000          
## Sp8  0.0000000 0.4000000 0.0000000 1.0000000 0.6250000 0.5714286 0.5000000
## Sp9  0.0000000 0.4000000 0.0000000 1.0000000 0.6250000 0.5714286 0.5000000
## Sp10 0.7500000 0.7500000 0.7500000 1.0000000 1.0000000 1.0000000 0.8000000
##            Sp8       Sp9
## Sp2                     
## Sp3                     
## Sp4                     
## Sp5                     
## Sp6                     
## Sp7                     
## Sp8                     
## Sp9  0.0000000          
## Sp10 0.7500000 0.7500000

dC8<-hclust(mC8, method="average")
dC8

## 
## Call:
## hclust(d = mC8, method = "average")
## 
## Cluster method   : average 
## Distance         : jaccard 
## Number of objects: 10

Gráfico

plot(dC8, hang=-1,ann=FALSE, cex.axis=1.1,col=1)
title(ylab="Dissimilaridade",
main="Dendrograma C8",xlab="Amostras",cex.lab=1.2)
rect.hclust(dC8,3, border=2:6)

Grupos

gC8<- cutree(dC8,3)
gC8

##  Sp1  Sp2  Sp3  Sp4  Sp5  Sp6  Sp7  Sp8  Sp9 Sp10 
##    1    1    1    2    2    2    1    1    1    3

cgC8<- cbind(C8, cluster=gC8)
cgC8

##      X1 X2 X3 X4 X5 X6 X7 X8 cluster
## Sp1   0  1  1  1  0  0  0  1       1
## Sp2   0  1  1  0  1  0  0  1       1
## Sp3   0  1  1  1  0  0  0  1       1
## Sp4   1  0  0  0  1  1  1  0       2
## Sp5   1  1  1  1  1  1  1  0       2
## Sp6   1  1  1  1  0  1  1  0       2
## Sp7   1  1  1  0  1  0  0  1       1
## Sp8   0  1  1  1  0  0  0  1       1
## Sp9   0  1  1  1  0  0  0  1       1
## Sp10  0  0  0  0  0  0  0  1       3

Análises Multivariadas

1) Estime os seguintes coeficientes de associação: distância euclidiana, Bray curtis. Qual o índice mais adequado? Qual a justificativa.

O índice de Bray-Curtis é o mais adequado para análise de dados bióticos.

AM1<-read.table("AM1.txt",header=T)

## Warning in read.table("AM1.txt", header = T): incomplete final line found by
## readTableHeader on 'AM1.txt'

AM1

##          Estacao1 Estacao2 Estacao3 Estacao4 Estacao5
## Especie1        2        5        4        8        0
## Especie2        0        1        4        8        1
## Especie3        2        5        1        4        0
## Especie4        0        3        2        4        1

nrow(AM1);ncol(AM1)

## [1] 4

## [1] 5

names(AM1); row.names(AM1);str(AM1)

## [1] "Estacao1" "Estacao2" "Estacao3" "Estacao4" "Estacao5"

## [1] "Especie1" "Especie2" "Especie3" "Especie4"

## 'data.frame':    4 obs. of  5 variables:
##  $ Estacao1: int  2 0 2 0
##  $ Estacao2: int  5 1 5 3
##  $ Estacao3: int  4 4 1 2
##  $ Estacao4: int  8 8 4 4
##  $ Estacao5: int  0 1 0 1

library(vegan)
AM1t<-log1p(AM1)
AM1t

##          Estacao1  Estacao2  Estacao3 Estacao4  Estacao5
## Especie1 1.098612 1.7917595 1.6094379 2.197225 0.0000000
## Especie2 0.000000 0.6931472 1.6094379 2.197225 0.6931472
## Especie3 1.098612 1.7917595 0.6931472 1.609438 0.0000000
## Especie4 0.000000 1.3862944 1.0986123 1.609438 0.6931472

Bray-Curtis

mAM1<-vegdist(AM1t, "bray")
mAM1

##           Especie1  Especie2  Especie3
## Especie2 0.2430928                    
## Especie3 0.1264995 0.4231163          
## Especie4 0.2869807 0.1795269 0.2607788

dAM1<-hclust(mAM1, method="average")
dAM1

## 
## Call:
## hclust(d = mAM1, method = "average")
## 
## Cluster method   : average 
## Distance         : bray 
## Number of objects: 4

Gráfico

plot(dAM1, hang=-1,ann=FALSE, cex.axis=1.1,col=1)
title(ylab="Dissimilaridade",
main="Dendrograma AM1",xlab="Amostras",cex.lab=1.2)
rect.hclust(dAM1,2, border=2:6)

Grupos

gAM1<- cutree(dAM1,2)
gAM1

## Especie1 Especie2 Especie3 Especie4 
##        1        2        1        2

cgAM1<- cbind(AM1, cluster=gAM1)
cgAM1

##          Estacao1 Estacao2 Estacao3 Estacao4 Estacao5 cluster
## Especie1        2        5        4        8        0       1
## Especie2        0        1        4        8        1       2
## Especie3        2        5        1        4        0       1
## Especie4        0        3        2        4        1       2

Distância Euclidiana

mAM1e<-vegdist(AM1t, "euclidean")
mAM1e

##          Especie1 Especie2 Especie3
## Especie2 1.701279                  
## Especie3 1.088615 2.019761         
## Especie4 1.567878 1.042540 1.419932

dAM1e<-hclust(mAM1e, method="complete")
dAM1e

## 
## Call:
## hclust(d = mAM1e, method = "complete")
## 
## Cluster method   : complete 
## Distance         : euclidean 
## Number of objects: 4

Gráfico

plot(dAM1e, hang=-1,ann=FALSE, cex.axis=1.1,col=1)
title(ylab="Dissimilaridade",
main="Dendrograma AM1",xlab="Amostras",cex.lab=1.2)
rect.hclust(dAM1e,2, border=2:6)

Grupos

gAM1e<- cutree(dAM1e,2)
gAM1e

## Especie1 Especie2 Especie3 Especie4 
##        1        2        1        2

cgAM1e<- cbind(AM1, cluster=gAM1e)
cgAM1e

##          Estacao1 Estacao2 Estacao3 Estacao4 Estacao5 cluster
## Especie1        2        5        4        8        0       1
## Especie2        0        1        4        8        1       2
## Especie3        2        5        1        4        0       1
## Especie4        0        3        2        4        1       2

2) Faça uma matriz com o índice de Jaccard e com o índice de Sorensen com os dados abaixo.

Ambos os índices tiveram resultados semelhantes.

AM2<-read.table("AM2.txt",header=T)

## Warning in read.table("AM2.txt", header = T): incomplete final line found by
## readTableHeader on 'AM2.txt'

AM2

##          Estacao1 Estacao2 Estacao3 Estacao4
## Especie1        1        0        0        1
## Especie2        1        1        1        0
## Especie3        1        0        1        1
## Especie4        0        1        1        1

nrow(AM2);ncol(AM2)

## [1] 4

## [1] 4

names(AM2); row.names(AM2);str(AM2)

## [1] "Estacao1" "Estacao2" "Estacao3" "Estacao4"

## [1] "Especie1" "Especie2" "Especie3" "Especie4"

## 'data.frame':    4 obs. of  4 variables:
##  $ Estacao1: int  1 1 1 0
##  $ Estacao2: int  0 1 0 1
##  $ Estacao3: int  0 1 1 1
##  $ Estacao4: int  1 0 1 1

library(vegan)
AM2t<-log1p(AM2)
AM2t

##           Estacao1  Estacao2  Estacao3  Estacao4
## Especie1 0.6931472 0.0000000 0.0000000 0.6931472
## Especie2 0.6931472 0.6931472 0.6931472 0.0000000
## Especie3 0.6931472 0.0000000 0.6931472 0.6931472
## Especie4 0.0000000 0.6931472 0.6931472 0.6931472

Índice de Soresen

The naming conventions vary. The one adopted here is traditional rather than truthful to priority. The function finds either quantitative or binary variants of the indices under the same name, which correctly may refer only to one of these alternatives For instance, the Bray index is known also as Steinhaus, Czekanowski and Sørensen index.

mAM2<-vegdist(AM2t, "bray")
mAM2

##           Especie1  Especie2  Especie3
## Especie2 0.6000000                    
## Especie3 0.2000000 0.3333333          
## Especie4 0.6000000 0.3333333 0.3333333

dAM2<-hclust(mAM2, method="average")
dAM2

## 
## Call:
## hclust(d = mAM2, method = "average")
## 
## Cluster method   : average 
## Distance         : bray 
## Number of objects: 4

Gráfico

plot(dAM2, hang=-1,ann=FALSE, cex.axis=1.1,col=1)
title(ylab="Dissimilaridade",
main="Dendrograma AM2",xlab="Amostras",cex.lab=1.2)
rect.hclust(dAM2,2, border=2:6)

Grupos

gAM2<- cutree(dAM2,2)
gAM2

## Especie1 Especie2 Especie3 Especie4 
##        1        2        1        2

cgAM2<- cbind(AM2, cluster=gAM2)
cgAM2

##          Estacao1 Estacao2 Estacao3 Estacao4 cluster
## Especie1        1        0        0        1       1
## Especie2        1        1        1        0       2
## Especie3        1        0        1        1       1
## Especie4        0        1        1        1       2

Índice de Jaccard

mAM2j<-vegdist(AM2t, "jaccard")
mAM2j

##           Especie1  Especie2  Especie3
## Especie2 0.7500000                    
## Especie3 0.3333333 0.5000000          
## Especie4 0.7500000 0.5000000 0.5000000

dAM2j<-hclust(mAM2j, method="average")
dAM2j

## 
## Call:
## hclust(d = mAM2j, method = "average")
## 
## Cluster method   : average 
## Distance         : jaccard 
## Number of objects: 4

Gráfico

plot(dAM2j, hang=-1,ann=FALSE, cex.axis=1.1,col=1)
title(ylab="Dissimilaridade",
main="Dendrograma AM2",xlab="Amostras",cex.lab=1.2)
rect.hclust(dAM2j,2, border=2:6)

Grupos

gAM2j<- cutree(dAM2j,2)
gAM2j

## Especie1 Especie2 Especie3 Especie4 
##        1        2        1        2

cgAM2j<- cbind(AM2, cluster=gAM2j)
cgAM2j

##          Estacao1 Estacao2 Estacao3 Estacao4 cluster
## Especie1        1        0        0        1       1
## Especie2        1        1        1        0       2
## Especie3        1        0        1        1       1
## Especie4        0        1        1        1       2

3) Faça um estudo entre vários índices e indique o mais adequado para os dados abaixo.

Utilizando o coeficiente de Soresen e Jaccard resultaram em 5 grupos, em ordem decrescente de semelhança: 2 (Especie2 e Especie4), 4 (Especie5), 3 (Especie3), 1 (Especie1) e 5 (Especie5). Enquanto o coeficiente de Distância Euclidiana gerou 5 grupos, em ordem decrescente de semelhança: 2 (Especie2 e Especie6), 4 (Especie4), 5 (Especie5), o 1 (Especie1) e 3 (Especie3) são igualmente dissemelhante dos outros grupos. Os índices de Soresen e Jaccard são mais adequados por serem índices assimétricos, que não considera o duplo zero, ou seja considera que o zero pode ser falta de informação.

AM3<-read.table("AM3.txt",header=T)
AM3

##          X1986 X1987 X1988 X1989
## Especie1     0     1    15     2
## Especie2     4     4     2     2
## Especie3     0    12     1    10
## Especie4    25     2     1     4
## Especie5     2     0     1     5
## Especie6     7     2     0     0

nrow(AM3);ncol(AM3)

## [1] 6

## [1] 4

names(AM3); row.names(AM3);str(AM3)

## [1] "X1986" "X1987" "X1988" "X1989"

## [1] "Especie1" "Especie2" "Especie3" "Especie4" "Especie5" "Especie6"

## 'data.frame':    6 obs. of  4 variables:
##  $ X1986: int  0 4 0 25 2 7
##  $ X1987: int  1 4 12 2 0 2
##  $ X1988: int  15 2 1 1 1 0
##  $ X1989: int  2 2 10 4 5 0

library(vegan)
AM3t<-log1p(AM3)
AM3t

##             X1986     X1987     X1988    X1989
## Especie1 0.000000 0.6931472 2.7725887 1.098612
## Especie2 1.609438 1.6094379 1.0986123 1.098612
## Especie3 0.000000 2.5649494 0.6931472 2.397895
## Especie4 3.258097 1.0986123 0.6931472 1.609438
## Especie5 1.098612 0.0000000 0.6931472 1.791759
## Especie6 2.079442 1.0986123 0.0000000 0.000000

Índice Soresen

The naming conventions vary. The one adopted here is traditional rather than truthful to priority. The function finds either quantitative or binary variants of the indices under the same name, which correctly may refer only to one of these alternatives For instance, the Bray index is known also as Steinhaus, Czekanowski and Sørensen index.

mAM3<-vegdist(AM3t, "bray")
mAM3

##           Especie1  Especie2  Especie3  Especie4  Especie5
## Especie2 0.4207932                                        
## Especie3 0.5137331 0.3856270                              
## Especie4 0.5572014 0.2547142 0.4476462                    
## Especie5 0.5601893 0.3576680 0.4621129 0.3358861          
## Especie6 0.8209478 0.3697925 0.7512777 0.3538799 0.6750424

dAM3<-hclust(mAM3, method="average")
dAM3

## 
## Call:
## hclust(d = mAM3, method = "average")
## 
## Cluster method   : average 
## Distance         : bray 
## Number of objects: 6

Gráfico

plot(dAM3, hang=-1,ann=FALSE, cex.axis=1.1,col=1)
title(ylab="Dissimilaridade",
main="Dendrograma AM3",xlab="Amostras",cex.lab=1.2)
rect.hclust(dAM3,5, border=2:6)

Grupos

gAM3<- cutree(dAM3,5)
gAM3

## Especie1 Especie2 Especie3 Especie4 Especie5 Especie6 
##        1        2        3        2        4        5

cgAM3<- cbind(AM3, cluster=gAM3)
cgAM3

##          X1986 X1987 X1988 X1989 cluster
## Especie1     0     1    15     2       1
## Especie2     4     4     2     2       2
## Especie3     0    12     1    10       3
## Especie4    25     2     1     4       2
## Especie5     2     0     1     5       4
## Especie6     7     2     0     0       5

Índice de Jaccard

mAM3j<-vegdist(AM3t, "jaccard")
mAM3j

##           Especie1  Especie2  Especie3  Especie4  Especie5
## Especie2 0.5923356                                        
## Especie3 0.6787631 0.5566101                              
## Especie4 0.7156446 0.4060116 0.6184470                    
## Especie5 0.7181043 0.5268858 0.6321166 0.5028663          
## Especie6 0.9016709 0.5399248 0.8579766 0.5227641 0.8060004

dAM3j<-hclust(mAM3j, method="average")
dAM3j

## 
## Call:
## hclust(d = mAM3j, method = "average")
## 
## Cluster method   : average 
## Distance         : jaccard 
## Number of objects: 6

Gráfico

plot(dAM3j, hang=-1,ann=FALSE, cex.axis=1.1,col=1)
title(ylab="Dissimilaridade",
main="Dendrograma AM3",xlab="Amostras",cex.lab=1.2)
rect.hclust(dAM3j,5, border=2:6)

Grupos

gAM3j<- cutree(dAM3j,5)
gAM3j

## Especie1 Especie2 Especie3 Especie4 Especie5 Especie6 
##        1        2        3        2        4        5

cgAM3j<- cbind(AM3, cluster=gAM3j)
cgAM3j

##          X1986 X1987 X1988 X1989 cluster
## Especie1     0     1    15     2       1
## Especie2     4     4     2     2       2
## Especie3     0    12     1    10       3
## Especie4    25     2     1     4       2
## Especie5     2     0     1     5       4
## Especie6     7     2     0     0       5

Distância Euclidiana

mAM3e<-vegdist(AM3t, "euclidean")
mAM3e

##          Especie1 Especie2 Especie3 Especie4 Especie5
## Especie2 2.496413                                    
## Especie3 3.084778 2.314267                           
## Especie4 3.919772 1.845092 3.658825                  
## Especie5 2.547927 1.869783 2.855401 2.429725         
## Especie6 3.658234 1.701689 3.564348 2.111864 2.420709

dAM3e<-hclust(mAM3e, method="average")
dAM3e

## 
## Call:
## hclust(d = mAM3e, method = "average")
## 
## Cluster method   : average 
## Distance         : euclidean 
## Number of objects: 6

Gráfico

plot(dAM3e, hang=-1,ann=FALSE, cex.axis=1.1,col=1)
title(ylab="Dissimilaridade",
main="Dendrograma AM3",xlab="Amostras",cex.lab=1.2)
rect.hclust(dAM3e,5, border=2:6)

Grupos

gAM3e<- cutree(dAM3e,5)
gAM3e

## Especie1 Especie2 Especie3 Especie4 Especie5 Especie6 
##        1        2        3        4        5        2

cgAM3e<- cbind(AM3, cluster=gAM3e)
cgAM3e

##          X1986 X1987 X1988 X1989 cluster
## Especie1     0     1    15     2       1
## Especie2     4     4     2     2       2
## Especie3     0    12     1    10       3
## Especie4    25     2     1     4       4
## Especie5     2     0     1     5       5
## Especie6     7     2     0     0       2

4) Faça a matriz de distância dos dados do arquivo exerpast.txt*. Justifique qual a transformação dos dados realizada.

O arquivo exerpast.txt não estava anexado ao exercício, impossibilitando a realização dessa atividade.

5) Faça a matriz de similaridade dos dados do arquivo biot1.txt*. Justifique qual a transformação dos dados realizada.

O arquivo biot1.txt não estava anexado ao exercício, impossibilitando a realização dessa atividade.