Summary

基于FDR对照的非靶向代谢组的鉴定和定量集成工作流程

Published: September 20, 2022
doi:

Summary

我们构建了一个非靶向代谢组学工作流程,将XY-Meta和metaX集成在一起。在该协议中,我们展示了如何使用XY-Meta从开放获取光谱参考中生成诱饵光谱库,然后进行FDR控制,并在鉴定代谢组学光谱后使用metaX定量代谢物。

Abstract

近年来,非靶向代谢组学技术被广泛使用。然而,快速增加的通量和样品数量会产生大量的光谱,这给质谱光谱的质量控制带来了挑战。为了减少误报,必须进行错误发现率(FDR)质量控制。最近,我们开发了一种用于FDR控制非靶向代谢组鉴定的软件,该软件基于名为XY-Meta的目标诱饵策略。在这里,我们演示了一个完整的分析管道,它将 XY-Meta 和 metaX 集成在一起。该协议展示了如何使用XY-meta从现有参考数据库生成诱饵数据库,并使用Target-诱饵策略在开放获取数据集上进行大规模代谢组鉴定来执行FDR控制。差异分析和代谢物注释是在运行metaX进行代谢物峰检测和定量后进行的。为了帮助更多的研究人员,我们还为这些分析开发了一个用户友好的基于云的分析平台,无需生物信息学技能或任何计算机语言。

Introduction

代谢物在生物过程中起着重要作用。代谢物通常是各种过程的调节剂,如能量转移,激素调节,神经递质调节,细胞通讯和蛋白质翻译后修饰等1234。非靶向代谢组学提供了许多代谢物的全球视图56。随着质谱和色谱技术的进步,代谢组MS/MS谱的通量近年来迅速增加7891011为了从这些庞大的数据集中鉴定代谢物,开发了各种注释软件11,例如MZmine12,MS-FINDER13,CFM-ID14,MetFrag15和SLAW16。但是,这些标识通常包含许多误报。原因包括:(1)MS/MS光谱包含随机噪声,这可能会误导峰值匹配。(2)异构体和碎片能量的差异导致多个光谱指纹,从而增加参考库的体积。(3) 参考库的质量各不相同。需要一个适当的标准来建立一个良好的参考光谱库。因此,非目标代谢组学的系统性错误发现率(FDR)控制对于功能代谢组研究78917至关重要。

经验贝叶斯方法和目标诱饵策略都普遍解决了罗斯福的控制问题。Kerstin Scheubert等人认为,基于碎片树的方法对诱饵数据库生成的目标诱饵策略是FDR控制9的最佳方法。王旭生等人设计了一种基于化学八位字节规则的诱饵生成方法,提高了FDR估计的精度17。演示了用于生成诱饵数据库的光谱库以获得更好的性能18.在这里,我们改进了基于光谱库的方法,并开发了一种名为XY-Meta19 的软件,可以进一步提高FDR估计的精度。它使用现有的参考光谱库为目标诱饵方案下的 FDR 控制生成诱饵库。XY-Meta 支持自己的光谱匹配和余弦相似性算法。它允许传统的搜索和迭代搜索模式。在 FDR 评估的步骤中,它支持目标诱饵串联模式和分离模式。为了获得更好的灵活性,XY-Meta 接受外部诱饵库。

代谢物的峰检测和定量也是非靶向代谢组分析的重要步骤。峰检测是代谢组鉴定的主要方法。一般而言,代谢物峰检测的准确性受多种因素的影响,如质谱的噪声信号、代谢物丰度低、污染物、代谢物降解产物20等。当样品数量过多或液相色谱柱被非靶向代谢组实验替换时,可能会出现显著的批次效应,这是代谢组定量的主要挑战212223。目前,XCMS24、Workflow4蛋白质25、iMet-Q26和metaX19 等软件可以对非靶向代谢组进行峰检测和定量,但我们建议metaX的管道更完整,更易于使用。在这里,我们演示了使用XY-Meta的公开数据集msv000084112的鉴定和FDR控制过程,以及使用metaX对代谢物的峰检测和定量。此工作流只需要两个组,每个组至少需要两个样本。无论质谱仪平台、电离模式、电荷模式和样品类型如何,都需要MS/MS光谱数据,并且可以支持基于样品的归一化和基于峰的归一化。按照这个例子,研究人员可以以易于处理的方式进行代谢组学鉴定和定量。使用此管道需要 R 编程功能。为了帮助没有任何编程知识的研究人员,我们还开发了一个用于代谢组学分析的云分析平台。我们在 补充材料 5 中演示了此云分析平台。

Protocol

1. 准备代谢组学数据集进行分析 注意:在本演示中,我们使用不含QC样品的代谢组学数据集。需要病例组和对照组的数据。为了进行演示,我们使用GNPS数据库27中的公共数据集。 转到网页 https://gnps.ucsd.edu/ProteoSAFe/static/gnps-splash.jsp。单击浏览数据集。 在 “标题 ”列中搜索关键字“msv000084112”。单击数据?…

Representative Results

msv000084112的原始数据通过ms转换进行转换.exe并生成mgf文件(补充材料S6)。 XY 元生成的 GNPS-NIST14-MATCHES_Decoy.mgf 文件位于 /database 文件夹下。这是从原始参考光谱库GNPS-NIST14-Match.mgf生成的诱饵库。这个诱饵库可以重复使用。重用此诱饵库时,用户应在 parameter.default 文件中将decoy_pattern设置为 1,并将诱饵输入设置为诱饵库的绝对路径。鉴定结果在/mgf文件夹(后缀为.m…

Discussion

罗斯福对非靶向代谢物的控制一直是一个巨大的挑战。在这里,我们展示了一个完整的大规模非靶向代谢组学分析(定性和定量)管道,具有罗斯福控制。这有效地减少了在MS分析中非常常见的误报。

为您的研究准备适当的参考光谱库是一个关键点。成功且灵敏的MS/MS识别不仅需要适当的匹配算法,还需要适当的参考光谱库。由于以下原因,公共光谱库的适用性受到限制:(1…

Divulgations

The authors have nothing to disclose.

Acknowledgements

本研究由国家重点研发计划(2018YFC0910200/2017YFA0505001)和广东省重点研发计划(2019B020226001)支持。

Materials

GNPS open source n/a https://gnps.ucsd.edu/ProteoSAFe/static/gnps-splash.jsp
XY-Meta open source n/a https://github.com/DLI-ShenZhen/XY-Meta
metaX open source n/a https://github.com/wenbostar/metaX
ProteoWizard Free Download 3.0.22116.18c918b-x86_64 https://proteowizard.sourceforge.io/download.html
CHI.Client Free Download ndp48-x86-x64-allos-enu http://www.chi-biotech.com/technology.html?ty=ypt

References

  1. Misra, B. B., Fahrmann, J. F., Grapov, D. Review of emerging metabolomic tools and resources: 2015-2016. Electrophoresis. 38 (18), 2257-2274 (2017).
  2. Idle, J. R., Gonzalez, F. J. Metabolomics. Cell Metabolism. 6 (5), 348-351 (2007).
  3. Fiehn, O., Town, C. Metabolomics — the link between genotypes and phenotypes. Functional Genomics. , 155-171 (2002).
  4. Town, C. . Functional Genomics. , (2002).
  5. Dettmer, K., Aronov, P. A., Hammock, B. D. Mass spectrometry-based metabolomics. Mass Spectrometry Reviews. 26 (1), 51-78 (2007).
  6. Vinayavekhin, N., Saghatelian, A. Untargeted metabolomics. Current Protocols in Molecular Biology. , 1-24 (2010).
  7. Chaleckis, R., Meister, I., Zhang, P., Wheelock, C. E. Challenges, progress and promises of metabolite annotation for LC-MS-based metabolomics. Current Opinion in Biotechnology. 55, 44-50 (2019).
  8. Palmer, A., et al. FDR-controlled metabolite annotation for high-resolution imaging mass spectrometry. Nature Methods. 14 (1), 57-60 (2017).
  9. Scheubert, K., et al. Significance estimation for large scale metabolomics annotations by spectral matching. Nature Communications. 8 (1), 1494 (2017).
  10. Schrimpe-Rutledge, A. C., Codreanu, S. G., Sherrod, S. D., McLean, J. A. Untargeted metabolomics strategies-challenges and emerging directions. Journal of the American Society for Mass Spectrometry. 27 (12), 1897-1905 (2016).
  11. Blaženović, I., Kind, T., Ji, J., Fiehn, O. Software tools and approaches for compound identification of LC-MS/MS data in metabolomics. Metabolites. 8 (2), (2018).
  12. Katajamaa, M., Miettinen, J., Oresic, M. MZmine: toolbox for processing and visualization of mass spectrometry based molecular profile data. Bioinformatics. 22 (5), 634-636 (2006).
  13. Tsugawa, H., et al. Hydrogen rearrangement rules: computational MS/MS fragmentation and structure elucidation using MS-FINDER software. Analytical chemistry. 88 (16), 7946-7958 (2016).
  14. Wang, F., et al. CFM-ID 4.0: More accurate ESI-MS/MS spectral prediction and compound identification. Analytical Chemistry. 93 (34), 11692-11700 (2021).
  15. Ruttkies, C., Schymanski, E. L., Wolf, S., Hollender, J., Neumann, S. MetFrag relaunched: incorporating strategies beyond in silico fragmentation. Journal of Cheminformatics. 8, 3 (2016).
  16. Delabriere, A., Warmer, P., Brennsteiner, V., Zamboni, N. SLAW: A scalable and self-optimizing processing workflow for untargeted LC-MS. Analytical chemistry. 93 (45), 15024-15032 (2021).
  17. Wang, X., et al. Target-decoy-based false discovery rate estimation for large-scale metabolite identification. Journal of Proteome Research. 17 (7), 2328-2334 (2018).
  18. Li, D., et al. XY-Meta: a high-efficiency search engine for large-scale metabolome annotation with accurate FDR estimation. Analytical Chemistry. 92 (8), 5701-5707 (2020).
  19. Wen, B., Mei, Z., Zeng, C., Liu, S. metaX: a flexible and comprehensive software for processing metabolomics data. BMC Bioinformatics. 18 (1), 183 (2017).
  20. Aberg, K. M., Torgrip, R. J. O., Kolmert, J., Schuppe-Koistinen, I., Lindberg, J. Feature detection and alignment of hyphenated chromatographic-mass spectrometric data. Extraction of pure ion chromatograms using Kalman tracking. Journal of Chromatography. A. 1192 (1), 139-146 (2008).
  21. Liu, Q., et al. Addressing the batch effect issue for LC/MS metabolomics data in data preprocessing. Scientific Reports. 10 (1), 13856 (2020).
  22. Han, W., Li, L. Evaluating and minimizing batch effects in metabolomics. Mass Spectrometry Reviews. 41 (3), 421-442 (2022).
  23. Fei, F., Bowdish, D. M. E., McCarry, B. E. Comprehensive and simultaneous coverage of lipid and polar metabolites for endogenous cellular metabolomics using HILIC-TOF-MS. Analytical and Bioanalytical Chemistry. 406 (15), 3723-3733 (2014).
  24. Smith, C. A., Want, E. J., O’Maille, G., Abagyan, R., Siuzdak, G. XCMS: processing mass spectrometry data for metabolite profiling using nonlinear peak alignment, matching, and identification. Analytical Chemistry. 78 (3), 779-787 (2006).
  25. Giacomoni, F., et al. Workflow4Metabolomics: a collaborative research infrastructure for computational metabolomics. Bioinformatics. 31 (9), 1493-1495 (2015).
  26. Chang, H. -. Y., et al. iMet-Q: A user-friendly tool for label-free metabolomics quantitation using dynamic peak-width determination. PloS One. 11 (1), 0146112 (2016).
  27. Wang, M., et al. Sharing and community curation of mass spectrometry data with Global Natural Products Social Molecular Networking. Nature Biotechnology. 34 (8), 828-837 (2016).
  28. Schmid, R., et al. Ion identity molecular networking for mass spectrometry-based metabolomics in the GNPS environment. Nature Communications. 12 (1), 3832 (2021).
  29. Kessner, D., Chambers, M., Burke, R., Agus, D., Mallick, P. ProteoWizard: open source software for rapid proteomics tools development. Bioinformatics. 24 (21), 2534-2536 (2008).
  30. Johnson, S. R., Lange, B. M. Open-access metabolomics databases for natural product research: present capabilities and future potential. Frontiers in Bioengineering and Biotechnology. 3, 22 (2015).
  31. Horai, H., et al. MassBank: a public repository for sharing mass spectral data for life sciences. Journal of Mass Spectrometry: JMS. 45 (7), 703-714 (2010).
  32. Rawlinson, C., et al. Hierarchical clustering of MS/MS spectra from the firefly metabolome identifies new lucibufagin compounds. Scientific Reports. 10 (1), 6043 (2020).
check_url/fr/63625?article_type=t

Play Video

Citer Cet Article
Li, D., Liang, J., Zhang, Y., Zhang, G. An Integrated Workflow of Identification and Quantification on FDR Control-Based Untargeted Metabolome. J. Vis. Exp. (187), e63625, doi:10.3791/63625 (2022).

View Video