Bruno Rodrigo Assunção 2024-02-14
Este é um fluxo de análise para investigar o enriquecimento de vias moleculares para os genes envolvidos em vias biológicas da Leucêmia Mielóide Aguda. Genes os quais nesse conjunto experimental possuem alterações no número de cópias gênicas apresentam correlação estatísticas com a expressão gênicas.
O conjunto de dados utilizados para esta análise parte da experimentação prévia realizada por ASSUNCAO B.R (2023) CNeExp. Deste modo, temos dois data frames para filtragem e anotação de vias.
Estes são:
anotação de cnvs e os seus genes de um experimento tcga.
correlação entre estes cnvs e expressão gênica.
Como esses genes possuem diferentes alelos e assim diferentes nomenclaturas, vamos utilizar um grep para buscar todos os genes na tabela de cnvs, utilizando a lista acima como referência. Deste modo, é possível obter todos os símbolos gênicos.
Utilizamos um loop for() e a função grep() em R
Do modo acima, a nossa lista foi atualizada para todas as variações presentes a partir da nossa lista de entrada. Então, podemos finalmente selecionar os cnvs envolvendo os nossos genes de interesse presentes na tabela de cnvs.
Primeiro devemos modificar os simbólos de genes para entrez id. Visto que esse é o input esperado pelo pacote reactomePA. Para isso vamos utilizar a função criada localmente symbols_to_entrez_id(), a qual esta depositada no pacote CNeEXP.
Função criada:
symbols_to_entrez_id <-function(input){
library(org.Hs.eg.db) # mudar a forma de carregar essa library
entrez_ids=NULL
for (i in input) {
x <-AnnotationDbi::select(x = org.Hs.eg.db,
keys=i,
keytype = "SYMBOL",
columns = "ENTREZID")
entrez_ids=rbind(entrez_ids, x)}
}Correlações positivas
## NULL
Correlações Negativas
##
## Registered S3 methods overwritten by 'treeio':
## method from
## MRCA.phylo tidytree
## MRCA.treedata tidytree
## Nnode.treedata tidytree
## Ntip.treedata tidytree
## ancestor.phylo tidytree
## ancestor.treedata tidytree
## child.phylo tidytree
## child.treedata tidytree
## full_join.phylo tidytree
## full_join.treedata tidytree
## groupClade.phylo tidytree
## groupClade.treedata tidytree
## groupOTU.phylo tidytree
## groupOTU.treedata tidytree
## inner_join.phylo tidytree
## inner_join.treedata tidytree
## is.rooted.treedata tidytree
## nodeid.phylo tidytree
## nodeid.treedata tidytree
## nodelab.phylo tidytree
## nodelab.treedata tidytree
## offspring.phylo tidytree
## offspring.treedata tidytree
## parent.phylo tidytree
## parent.treedata tidytree
## root.treedata tidytree
## rootnode.phylo tidytree
## sibling.phylo tidytree
## ReactomePA v1.44.0 For help: https://yulab-smu.top/biomedical-knowledge-mining-book/
##
## If you use ReactomePA in published research, please cite:
## Guangchuang Yu, Qing-Yu He. ReactomePA: an R/Bioconductor package for reactome pathway analysis and visualization. Molecular BioSystems 2016, 12(2):477-479
reactomePositiveCorrelations <- enrichPathway(
sort(na.omit(inputPosCor$ENTREZID)), ## espera entrez_id
organism = "human",
pvalueCutoff = 0.05,
pAdjustMethod = "BH",
qvalueCutoff = 0.2,
#universe,
minGSSize = 10,
maxGSSize = 500,
readable = FALSE
)## --> No gene can be mapped....
## --> Expected input gene ID: 23218,51300,84320,2277,64750,3745
## --> return NULL...
library(ReactomePA)
reactomeNegativeCorrelations <- enrichPathway(
sort(na.omit(inputNegCor$ENTREZID)), ## espera entrez_id
organism = "human",
pvalueCutoff = 0.05,
pAdjustMethod = "BH",
qvalueCutoff = 0.2,
#universe,
minGSSize = 10,
maxGSSize = 500,
readable = FALSE
)Armazenar os resultados em um data frame
## data frame with 0 columns and 5 rows