Ⅰ数据准备

MetDNA需要准备的数据包括一级数据peak table(csv格式),二级数据(mgf格式)和样品信息sample.info(csv格式)。点击下载正离子demo数据负离子demo数据

demo数据信息

组别 个数 含义
QC 8 QC
W03 10 野生型3天
W15 10 野生型15天
W30 10 野生型30天
E03 10 突变型E3天
E30 10 突变型E30天
P03 10 突变型P3天
P30 10 突变型P30天

1. 一级数据

一级数据可以是使用XCMS,MZmine,MS-DIAL或者其他软件处理之后的数据。第一列为代谢物峰的名字,“name”,第二列为“mz”,第三列为保留时间(RT),且单位必须为秒,其他为样品的峰强度。

一级数据peak table格式示例

一级数据peak table格式示例

2. 二级数据

二级质谱原始数据可以是使用QC样品采集的DDA或者targeted MS/MS数据。对于DDA数据来说,也可以是分段采集的二级数据。质谱原始二级数据需要使用ProteoWizard软件转为mgf格式,转换时参数设置参考下图。二级数据最多不能超过十个。

ProteoWizard参数设置

ProteoWizard参数设置

3. 样品信息

样品信息是样品的分组信息。第一列是样品名,“sample.name”,第二列是样品的分组信息,“group”。

样品信息示例

样品信息示例


Ⅱ 数据整理

将一级数据,二级数据和样品信息放置于同一个文件夹下。并将该文件夹设置为工作路径。现在MetDNA已经部署在了小服务器中,因此可以将数据放在小服务器中(labdata)。例如“V:/workreport/申小涛/demo”。

将所需数据放置在文件夹中

将所需数据放置在文件夹中

setwd("/mnt/data/samba/labdata/workreport/申小涛/demo")
library(MetDNA)

Ⅲ 数据处理

1. 使用二级谱图进行注释

运行函数ms2Annotation

ms2Annotation(ms1.file = "data.csv",
              ms2.file = c("Sample12-QC12-POS-QC12.mgf", 
                           "Sample1-QC11-POS-QC11.mgf",
                           "Sample23-QC13-POS-QC13.mgf",
                           "Sample34-QC14-POS-QC14.mgf",
                           "Sample45-QC15-POS-QC15.mgf", 
                           "Sample56-QC16-POS-QC16.mgf",
                           "Sample67-QC17-POS-QC17.mgf", 
                           "Sample78-QC18-POS-QC18.mgf"),
              polarity = "positive",
              column = "hilic",
              ce = "30")

参数含义如下:

  • ms1.file:一级数据的名字。
  • ms2.file:二级数据的名字。
  • polarity:数据采集极性,“positive”或者“negative”。
  • column:使用的柱子类型,“hilic”或者“rp”。
  • ce:二级采集的碰撞能量,支持“10”,“15”,“20”,“25”,“30”,“35”,“35,15” (35±15),“40”, “45”,“50”,“55”,“60”,“65”,“70”。

输出的结果存放在ms2Annotation result文件夹内:

  • annotation.result.csv:二级谱图注释结果。
  • ms2:所有采集到的二级谱图。
  • MS2 match spectrum:二级谱图匹配图。
ms2Annotation输出结果

ms2Annotation输出结果

二级谱图匹配结果

二级谱图匹配结果

2. 基于MRN的注释

运行函数metABM

metABM(prefer.adduct = "M+H",
       column = "hilic",
       polarity = "positive",
       threads = 3)

参数含义如下:

  • prefer.adduct:使用那些加合物形式的注释用于RT预测模型的建立,默认使用所有的注释,推荐正离子模式下使用“M+H”,负离子模式下使用“M-H”。
  • polarity:数据采集极性,“positive”或者“negative”。
  • column:使用的柱子类型,“hilic”或者“rp”。
  • threads:使用线程数,默认为3,可以根据电脑本身配置进行修改。

输出的结果存放在metABM result文件内:

  • metABM.annotation.result.csv:metABM注释之后的结果。
metABM注释结果

metABM注释结果

3. Module和pathway分析

运行函数metModule

metModule(group = c("W03", "W30"),
          uni.test = "t",
          column = "hilic",
          polarity = "positive",
          correct = TRUE,
          p.cutoff = 0.01,
          threads = 3,
          species = "dme")

参数含义如下:

  • group:要对哪些分组的样品进行分析,注意,计算fold change时,使用后面的样品除以前面的样品。
  • uni.test:单变量分析的方法,“t”,student t test;“wilcox”,wilcox test;“anova”,ANOVA分析。
  • polarity:数据采集极性,“positive”或者“negative”。
  • column:使用的柱子类型,“hilic”或者“rp”。
  • correct:是否需要对p值进行FDR校正。
  • p.cutoff:选择dysregulated peak时的p值cutoff。
  • threads:使用线程数,默认为3,可以根据电脑本身配置进行修改。
  • species:所研究样品的物种来源,“dme”,果蝇;“hsa”,人类;“mmu”,小鼠;“rat”,大鼠,“bta”,牛;“gga”,Gallus gallus (鸡);“dre”,Danio rerio (斑马鱼);“cel”,Caenorharomyces elegans (线虫); “sce”,Saccharomyces cerevisaiae (酵母); “ath”,Arabidopsis thaliana (拟南芥); “smm”,Schistosoma mansoni;“pfa”,Plasmodum falciparum 3D7; “tbr”,Trypanosoma brucei;“eco”, Escherichia coli K-12 MG1655(大肠杆菌); “ppu”,Pseudomonas putida KT2440;“syf”,Synechococcus elongatus。

输出的结果存放在metModule result文件内:

  • Module information:包含了每个module的定量boxplot图。
  • pathway information:包含了每个pathway的定量boxplot图。
  • quantitative information:包含代谢物定量的信息。
  • Module_MSE analysis文件夹:包含了每个module和dysregulated network的pathway enrichment分析结果,以及用于cytoscape作图的文件。
metModule输出结果

metModule输出结果

4. 生成分析报告

运行函数analysisReport

analysisReport()

输出的结果存放在Analysis_report文件夹内:

分析报告

分析报告