Análises de Consistência - Cleidiane (ITS e COI)

obs: todas as interpretações descritas aqui são de intuito ilustrativo para auxiliar no maior entendimento das análises. Portanto quaisquer equívocos sobre a natureza e características das espécies e dos dados devem ser desconsiderados.

Como entrada de dados foram utilizadas as matrizes de distância obtidas entre amostras pelos alinhamentos realizados no software “GeneIOUS”. As mesmas foram expressas em número de nucleotídeos diferentes entre todas as sequências par-a-par.

Pacotes usados:

library(ade4)
library(adegenet)
## Registered S3 method overwritten by 'spdep':
##   method   from
##   plot.mst ape
## 
##    /// adegenet 2.1.3 is loaded ////////////
## 
##    > overview: '?adegenet'
##    > tutorials/doc/questions: 'adegenetWeb()' 
##    > bug reports/feature requests: adegenetIssues()

Análises de Consistência para ITS

Leitura e montagem dos arquivos de dados:

As matrizes obtidas pelas análises de alinhamento das sequências foram importandas para o R. Em seguida foram montados data-frames com colunas contendo as identificações das amostras, os códigos, os nomes das espécies, bem como as procedências a nível de inseto hospedeiro e plantas.

its = read.csv("ITS2.csv", header = TRUE)

codigos_originais_its = colnames(its)

nomes_its = c("T.pret 01",
          "T.pret 02",
          "T.pret 03",
          "T.brun",
          "T.las",
          "T.mar",
          "T.gal 01",
          "T.pret 04",
          "T.pret 05",
          "T.pret 06",
          "T.pret 07",
          "T.pret 08",
          "T.pret 09",
          "T.pret 10",
          "T.gal 02",
          "T.gal 03")

especie_its =  c("Trichogramma pretiosum",
                    "Trichogramma pretiosum",
                    "Trichogramma pretiosum",
                     "Trichogramma bruni",
                     "Trichogramma lasallei",
                     "Trichogramma marandobai",
                     "Trichogramma galloi",
                     "Trichogramma pretiosum",
                     "Trichogramma pretiosum",
                     "Trichogramma pretiosum",
                     "Trichogramma pretiosum",
                     "Trichogramma pretiosum",
                     "Trichogramma pretiosum",
                     "Trichogramma pretiosum",
                     "Trichogramma galloi",
                     "Trichogramma galloi")

ins.hosp_its = c("Anticarsia gemmatalis",
             "Anagasta kuehniella",
             "Spodoptera sp.",
             "Anticarsia gemmatalis",
             "Rupela albinella",
             "Erinnyis ello",
             "Diatraea saccharalis",
             "Spodoptera sp.",
             "Agraulius vanillae",
             "no. ident",
             "Alabama argillacea",
             "Heraclides thoas brasiliensis",
             "Spodoptera frugiperda",
             "Spodoptera sp.",
             "Diatraea saccharalis",
             "Diatraea saccharalis")

plant.hosp_its = c("Soja",
              "Milho",
              "Cana-de-açúcar",
              "Soja",
              "Arroz",
              "Mandioca",
              "Cana-de-açúcar",
              "Asclepiadaceae",
              "Maracujá",
              "planta do cerrado",
              "Algodão",
              "Pimenta-de-macaco",
              "Arroz",
              "Algodão",
              "Cana-de-açúcar",
              "Arroz")

procedencias_its = data.frame("Código" = codigos_originais_its,
                              "Nome" = nomes_its,
                              "Espécie" = especie_its, 
                              "Inseto" = ins.hosp_its,
                              "Planta" = plant.hosp_its)

procedencias_its[,2:5]
##         Nome                 Espécie                        Inseto
## 1  T.pret 01  Trichogramma pretiosum         Anticarsia gemmatalis
## 2  T.pret 02  Trichogramma pretiosum           Anagasta kuehniella
## 3  T.pret 03  Trichogramma pretiosum                Spodoptera sp.
## 4     T.brun      Trichogramma bruni         Anticarsia gemmatalis
## 5      T.las   Trichogramma lasallei              Rupela albinella
## 6      T.mar Trichogramma marandobai                 Erinnyis ello
## 7   T.gal 01     Trichogramma galloi          Diatraea saccharalis
## 8  T.pret 04  Trichogramma pretiosum                Spodoptera sp.
## 9  T.pret 05  Trichogramma pretiosum            Agraulius vanillae
## 10 T.pret 06  Trichogramma pretiosum                     no. ident
## 11 T.pret 07  Trichogramma pretiosum            Alabama argillacea
## 12 T.pret 08  Trichogramma pretiosum Heraclides thoas brasiliensis
## 13 T.pret 09  Trichogramma pretiosum         Spodoptera frugiperda
## 14 T.pret 10  Trichogramma pretiosum                Spodoptera sp.
## 15  T.gal 02     Trichogramma galloi          Diatraea saccharalis
## 16  T.gal 03     Trichogramma galloi          Diatraea saccharalis
##               Planta
## 1               Soja
## 2              Milho
## 3     Cana-de-açúcar
## 4               Soja
## 5              Arroz
## 6           Mandioca
## 7     Cana-de-açúcar
## 8     Asclepiadaceae
## 9           Maracujá
## 10 planta do cerrado
## 11           Algodão
## 12 Pimenta-de-macaco
## 13             Arroz
## 14           Algodão
## 15    Cana-de-açúcar
## 16             Arroz

Montagem das matrizes de distância

Por praticidade foram extraídas apenas as diagonais inferiores de cada matriz (compatível com os pacotes utilizados).

rownames(its) = nomes_its
colnames(its) = nomes_its
its_dist = as.matrix(its)
dist_its = as.dist(its_dist)

Análise Discriminante sob componentes principais - DAPC

Essa análise tem como objetivo separar as amostras em grupos e comparar os mesmos com informações previamente obtidas (ou seja , grupos teoricamente formados) para verificar a consistência do agrupamento das mesmas com as informações previas. Para tal é realizada unicialmente uma PCA e em seguida os eixos que retém maior variação são submetidos a formação da análise discriminante (o que, geralmente aumenta o poder da análise para separar os dados em grupos distintos).

No presente estudo, foram utilizados:

Sendo assim, foi testada a consistência para agrupamento das amostras em espécies, insetos hospedeiros e plantas hospedeiras.

Teste a nível de espécies:
dapc_its_especies <- dapc(its_dist, grp = especie_its, n.pca = 3, n.da = 2) 

compoplot(dapc_its_especies, 
          txt.leg=c( levels(as.factor(especie_its))), 
          posi = 1,
          cleg = 0.6,
          bg = transp("white"),
          border = NA,
          show.lab = TRUE,
          ncol=2)

Cada coluna representa uma amostra. A cor da coluna representa (em porcentagem) o nível de ajuste dos dados de sequênciamento da amostra com o grupo pretendido (informações prévia de espécie, nesse caso).

De acordo com o gráfico, observa-se um ajuste perfeito (colorações das barras 100% uniformes e compatíveis a cada espécie identificada; sendo essas: Marrom - T.pret; Azul - T.brun; Vermelho: T.las; Lilás: T.mar; e Verde: T.gal) entre os dados de cada amostra e a informação a nível de espécie previamente fornecida (identificada por dados morfológicos e moleculares).

Teste a nível de inseto hosp.:
dapc_its_inseto <- dapc(its_dist, grp = ins.hosp_its, n.pca = 3, n.da = 2)

compoplot(dapc_its_inseto, 
          txt.leg=c( levels(as.factor(ins.hosp_its))), 
          posi = 1,
          cleg = 0.5,
          bg = transp("white"),
          border = NA,
          show.lab = TRUE,
          ncol=2)

Para o teste da formação de grupos com base nos insetos hospedeiros observou-se consistência de 100% para as espécies “T.mar”, T.las" e T.gal. “T.brun” mostrou-se majoritariamente agrupada em A.gemmatalis. O resultado pode indicar que todas as espécies citadas podem ser consideradas bastante adaptadas aos hospedeiros correspondentes.

A espécie T.pretiossum mostrou-se variável e pouco consistente para o agrupamento com base nos insetos hosp. Tal fato pode ser compatível com ampla adaptação da espécie a hospedeiros diferenes. Observa-se também T.pret divide-se em dois subgrupos de acordo com essa preferência.

Teste a nível de planta hosp.:
dapc_its_planta <- dapc(its_dist, grp = plant.hosp_its, n.pca = 3, n.da = 2) 

compoplot(dapc_its_planta, 
          legend = TRUE,
          txt.leg=c( levels(as.factor(plant.hosp_its))), 
          posi = 1,
          cleg = 0.7,
          bg = transp("white"),
          border = NA,
          show.lab = TRUE,
          ncol=2)

Aqui, acredito que as espécies se diversificaram mais, embora alguns grupos possam ser identificados (T.galloi mostrou-se consistente e apresentando um mesmo padrão de preferência).

Análises de Consistência para COI

Leitura e montagem dos arquivos de dados:

coi = read.csv("COI_CDS.csv", header = TRUE)

codigos_originais_coi = colnames(coi)

nomes_coi = c("T.brun",
              "T.las",
              "T.mar" ,
              "T.pret 03",
              "T.pret 04",
              "T.pret 01" ,
              "T.pret 02",
              "T.pret 05",
              "T.pret 08",  
              "T.pret 10",
              "T.pret 07" ,
              "T.pret 09",
              "T.pret 06" ,
              "T.gal 01",
              "T.gal 02",  
              "T.gal 03" )

especie_coi =  c("Trichogramma bruni",
                 "Trichogramma lasallei",
                 "Trichogramma marandobai",
                 "Trichogramma pretiosum",
                 "Trichogramma pretiosum",
                 "Trichogramma pretiosum",
                 "Trichogramma pretiosum",
                 "Trichogramma pretiosum",
                 "Trichogramma pretiosum",
                 "Trichogramma pretiosum",
                 "Trichogramma pretiosum",
                 "Trichogramma pretiosum",
                 "Trichogramma pretiosum",
                 "Trichogramma galloi",
                 "Trichogramma galloi",
                 "Trichogramma galloi")

ins.hosp_coi = c("Anticarsia gemmatalis",     
                  "Rupela albinella",             
                 "Erinnyis ello",          
                 "Spodoptera sp.",    
                 "Spodoptera sp.",    
                 "Anticarsia gemmatalis",              
                 "Anagasta kuehniella",             
                 "Agraulius vanillae",          
                 "Heraclides thoas brasiliensis", 
                 "Spodoptera sp.",           
                 "Alabama argillacea",           
                 "Spodoptera frugiperda",             
                 "no. ident", 
                 "Diatraea saccharalis",    
                 "Diatraea saccharalis",    
                 "Diatraea saccharalis")             
                 
                

plant.hosp_coi = c("Soja",
                   "Arroz",
                   "Mandioca",
                   "Cana-de-açúcar",
                   "Asclepiadaceae",
                   "Soja",
                   "Milho",
                   "Maracujá",
                   "Pimenta-de-macaco",
                   "Algodão",
                   "Algodão",
                   "Arroz",
                   "planta do cerrado",
                   "Cana-de-açúcar",
                   "Cana-de-açúcar",
                   "Arroz")

procedencias_coi = data.frame("Código" = codigos_originais_coi,
                              "Nome" = nomes_coi,
                              "Espécie" = especie_coi, 
                              "Inseto" = ins.hosp_coi,
                              "Planta" = plant.hosp_coi)

procedencias_coi[,2:5]
##         Nome                 Espécie                        Inseto
## 1     T.brun      Trichogramma bruni         Anticarsia gemmatalis
## 2      T.las   Trichogramma lasallei              Rupela albinella
## 3      T.mar Trichogramma marandobai                 Erinnyis ello
## 4  T.pret 03  Trichogramma pretiosum                Spodoptera sp.
## 5  T.pret 04  Trichogramma pretiosum                Spodoptera sp.
## 6  T.pret 01  Trichogramma pretiosum         Anticarsia gemmatalis
## 7  T.pret 02  Trichogramma pretiosum           Anagasta kuehniella
## 8  T.pret 05  Trichogramma pretiosum            Agraulius vanillae
## 9  T.pret 08  Trichogramma pretiosum Heraclides thoas brasiliensis
## 10 T.pret 10  Trichogramma pretiosum                Spodoptera sp.
## 11 T.pret 07  Trichogramma pretiosum            Alabama argillacea
## 12 T.pret 09  Trichogramma pretiosum         Spodoptera frugiperda
## 13 T.pret 06  Trichogramma pretiosum                     no. ident
## 14  T.gal 01     Trichogramma galloi          Diatraea saccharalis
## 15  T.gal 02     Trichogramma galloi          Diatraea saccharalis
## 16  T.gal 03     Trichogramma galloi          Diatraea saccharalis
##               Planta
## 1               Soja
## 2              Arroz
## 3           Mandioca
## 4     Cana-de-açúcar
## 5     Asclepiadaceae
## 6               Soja
## 7              Milho
## 8           Maracujá
## 9  Pimenta-de-macaco
## 10           Algodão
## 11           Algodão
## 12             Arroz
## 13 planta do cerrado
## 14    Cana-de-açúcar
## 15    Cana-de-açúcar
## 16             Arroz

Montagem das matrizes de distância:

rownames(coi) = nomes_coi
colnames(coi) = nomes_coi
coi_dist = as.matrix(coi)
dist_coi = as.dist(coi_dist)
Teste a nível de espécie:
dapc_coi_especies <- dapc(coi_dist, grp = especie_coi, n.pca = 3, n.da = 2)

compoplot(dapc_coi_especies, 
          txt.leg=c( levels(as.factor(especie_coi))), 
          posi = 1,
          cleg = 0.6,
          bg = transp("white"),
          border = NA,
          show.lab = TRUE,
          ncol=2)

Resultados semelhantes aos obtidos para ITS

Teste a nível de inseto hosp.:
dapc_coi_inseto <- dapc(coi_dist, grp = ins.hosp_coi, n.pca = 3, n.da = 2)

compoplot(dapc_coi_inseto, 
          txt.leg=c( levels(as.factor(ins.hosp_coi))), 
          posi = 1,
          cleg = 0.5,
          bg = transp("white"),
          border = NA,
          show.lab = TRUE,
          ncol=2)

Verifica-se resultados semelhantes aos obtidos para ITS também, no entanto, percebe-se que a amostra T.pret 01 apresentou um padrão de hospedeiro semelhantes ao de T.galloi, embora tenha como hospedeiro Anticarsia gemmatalis, o mesmo hosp. de T. brunni (Acredito que essa interpretação deva ser feito à luz de informações mais precisas sobre essas espécies) . As demais amostras de T.pret apresetaram padão semelhante e característico de um grupo diferente dos demais (adaptação ampla).

Teste a nível de planta hosp.:
dapc_coi_planta <- dapc(coi_dist, grp = plant.hosp_coi, n.pca = 3, n.da = 2)

compoplot(dapc_coi_planta, 
          legend = TRUE,
          txt.leg=c( levels(as.factor(plant.hosp_coi))), 
          posi = 1,
          cleg = 0.6,
          bg = transp("white"),
          border = NA,
          show.lab = TRUE,
          ncol=2)

Aqui, apenas T. mar apresentou adaptação específica e consistente para uam espécie de planta (mandioca). Novamente T.pret. 01 apresentou padrão semelhantes às espécies de T.gal. T. pret. 03 apresentou padrão diferente (obs: curioso o fato de possuir como hospedeiro Spodoptera sp. comum a outras espécies de T.pretiosum, porém, nesse caso, encontrado em cana-de-açucar, tais como os insetos onde coletou-se T.galloi).

Teste de Mantel

Foi realizado o Teste de Mantel para verificar o nível de relacionamento entre as duas matrizes de distância (ITS e COI):

mantel.randtest(dist_coi,dist_its, nrepet = 10000)
## Monte-Carlo test
## Call: mantel.randtest(m1 = dist_coi, m2 = dist_its, nrepet = 10000)
## 
## Observation: 0.7226209 
## 
## Based on 10000 replicates
## Simulated p-value: 0.00039996 
## Alternative hypothesis: greater 
## 
##     Std.Obs Expectation    Variance 
## 3.995676987 0.001377012 0.032582435

Portanto, como esperado, foi observada a presença de relação positiva significativa (0,7226**) entre as duas matrizes de distância.