Summary

Een geïntegreerde workflow van identificatie en kwantificering op FDR Control-Based Untargeted Metabolome

Published: September 20, 2022
doi:

Summary

We bouwden een ongerichte metabolomische workflow die XY-Meta en metaX samen integreerde. In dit protocol hebben we laten zien hoe we XY-Meta kunnen gebruiken om een lokspectrale bibliotheek te genereren uit open access spectrareferentie, en vervolgens FDR-controle uitgevoerd en de metaX gebruikt om de metabolieten te kwantificeren na het identificeren van de metabolomics-spectra.

Abstract

Ongerichte metabolomics-technieken worden de laatste jaren veel gebruikt. De snel toenemende doorvoer en het aantal monsters creëren echter een enorme hoeveelheid spectra, waardoor de kwaliteitscontrole van de massaspectrometriespectra wordt uitgedaagd. Om de false positives te verminderen, is kwaliteitscontrole (False Discovery Rate) (FDR) noodzakelijk. Onlangs hebben we een software ontwikkeld voor FDR-controle van ongerichte metaboloomidentificatie die is gebaseerd op een Target-Decoy-strategie genaamd XY-Meta. Hier demonstreerden we een complete analysepijplijn die XY-Meta en metaX samen integreert. Dit protocol laat zien hoe U XY-meta kunt gebruiken om een lokdatabase te genereren uit een bestaande referentiedatabase en FDR-besturing uit te voeren met behulp van de Target-Decoy-strategie voor grootschalige metaboloomidentificatie op een open-access dataset. De differentiële analyse en metabolietenannotatie werden uitgevoerd na het uitvoeren van metaX voor metabolieten pieken detectie en kwantificering. Om meer onderzoekers te helpen, ontwikkelden we ook een gebruiksvriendelijk cloudgebaseerd analyseplatform voor deze analyses, zonder de noodzaak van bioinformaticavaardigheden of computertalen.

Introduction

Metabolieten spelen een belangrijke rol in biologische processen. Metabolieten zijn vaak regulatoren van verschillende processen zoals energieoverdracht, hormoonregulaties, regulatie van neurotransmitters, cellulaire communicatie en eiwit posttranslationele modificaties, enz. 1,2,3,4. Untargeted metabolomics biedt een globaal beeld van talrijke metabolieten 5,6. Met de vooruitgang in massaspectrometrie- en chromatografietechnologieën neemt de doorvoer van metaboloom MS/MS-spectra de afgelopen jaren snel toe 7,8,9,10,11. Om metabolieten uit deze enorme datasets te identificeren, werden verschillende annotatiesoftware ontwikkeld11, zoals MZmine12, MS-FINDER13, CFM-ID14, MetFrag15 en SLAW16. Deze identificaties bevatten echter vaak veel valse positieven. De redenen zijn onder meer: (1) De MS/MS-spectra bevatten willekeurige ruis, die de piekmatching kan misleiden. (2) Isomeren en verschillen in fragmentatie-energieën veroorzaken meerdere spectra-vingerafdrukken en verhogen zo het volume van de referentiebibliotheek. (3) De kwaliteit van referentiebibliotheken varieert. Een goede standaard om een goede referentiespectrabibliotheek op te bouwen is nodig. Daarom is een systematische false discovery rate (FDR) controle voor ongerichte metabolomics essentieel voor functioneel metaboloomonderzoek 7,8,9,17.

Zowel de Empirical Bayes-benadering als de Target-Decoy-strategie pakten het FDR-controleprobleem in het algemeen aan. Kerstin Scheubert et al. toonden aan dat de Target-Decoy-strategie op decoy-database gegenereerd uit fragmentatieboomgebaseerde methode de beste methode is voor FDR-controle9. Xusheng Wang et al. ontwierpen een methode voor het genereren van lokvogels op basis van de octetregel in de chemie en verbeterden de precisie van FDR-schatting17. De spectrale bibliotheek voor het genereren van lokvogeldatabase werd gedemonstreerd voor betere prestaties18. Hier hebben we de spectrale bibliotheekgebaseerde methode verbeterd en een software ontwikkeld met de naam XY-Meta19 die de precisie van FDR-schattingen verder kan verbeteren. Het maakt gebruik van de bestaande referentiespectraalbibliotheek om een lokbibliotheek te genereren voor de FDR-besturing onder het Target-Decoy-schema. XY-Meta ondersteunt zijn eigen spectra matching en cosinus gelijkenis algoritmen. Het maakt conventionele zoek- en iteratieve zoekmodi mogelijk. In de stap van FDR-beoordeling ondersteunt het target-decoy-aaneengeschakelde modus en de gescheiden modus. Voor een betere flexibiliteit accepteert XY-Meta externe lokbibliotheken.

Piekdetectie en kwantificering van metabolieten is ook een belangrijke stap in de analyse van ongerichte metabolooms. Piekdetectie is de belangrijkste methode voor metaboloomidentificatie. Over het algemeen werd de nauwkeurigheid van piekdetectie van metabolieten beïnvloed door meerdere factoren, zoals ruissignalen van massaspectrometrie, lage abundantie van metabolieten, contaminanten en afbraakproducten van metabolieten20. Wanneer het aantal monsters van te groot is of de vloeistofchromatografiekolom werd vervangen in experimenten met ongericht metaboloom, kunnen opmerkelijke batcheffecten optreden, wat een grote uitdaging is voor metabolome kwantificering 21,22,23. Momenteel kan software zoals XCMS24, Workflow4Metabolomic25, iMet-Q26 en metaX19 piekdetectie en kwantificering van ongericht metaboloom uitvoeren, maar we stellen voor dat de pijplijn van metaX completer en gemakkelijker te gebruiken is. Hier demonstreren we het proces van identificatie en FDR-controle voor een openbaar beschikbare dataset msv000084112 met behulp van XY-Meta, en de piekdetectie en kwantificering van metabolieten met behulp van metaX. Deze workflow vereist slechts twee groepen en elke groep heeft ten minste twee voorbeelden nodig. MS/MS-spectragegevens zijn nodig, ongeacht het massaspectrometerplatform, de ionisatiemodus, de laadmodus en het monstertype, en kunnen op monsters gebaseerde normalisatie en piekgebaseerde normalisatie ondersteunen. Naar aanleiding van dit voorbeeld kunnen onderzoekers metabolomics-identificatie en kwantificering op een gemakkelijk te hanteren manier uitvoeren. Het gebruik van deze pijplijn vereist R-programmeermogelijkheden. Om de onderzoeker zonder enige programmeerkennis te helpen, ontwikkelden we ook een cloudanalyseplatform voor metabolomics-analyse. We hebben dit cloudanalyseplatform gedemonstreerd in Aanvullend Materiaal 5.

Protocol

1. Metabolomics datasets voorbereiden voor analyse OPMERKING: In deze demonstratie gebruiken we metabolomics-datasets zonder QC-monster. Gegevens voor case- en controlegroepen zijn nodig. Voor demonstratie gebruiken we een openbare dataset in GNPS-database27. Ga naar de webpagina https://gnps.ucsd.edu/ProteoSAFe/static/gnps-splash.jsp. Klik op Bladeren door datasets. Zoek op het trefwoord ‘msv000084112’ in de kolom <…

Representative Results

De ruwe gegevens van msv000084112 zijn geconverteerd door msconvert.exe en gegenereerde mgf-bestanden (Aanvullend materiaal S6). XY-Meta gegenereerd GNPS-NIST14-MATCHES_Decoy.mgf bestand onder /database map. Dit is de lokbibliotheek die is gegenereerd uit de oorspronkelijke referentiespectrale bibliotheek GNPS-NIST14-MATCHES.mgf. Deze lokbibliotheek kan worden hergebruikt. Wanneer de gebruiker deze lokbibliotheek opnieuw gebruikt, moet de gebruiker de decoy_pattern instellen a…

Discussion

De FDR-controle van ongerichte metabolieten is een grote uitdaging geweest. Hier demonstreerden we een complete pijplijn van grootschalige ongerichte metabolomics-analyse (kwalitatief en kwantitatief) met FDR-controle. Dit vermindert effectief de valse positieven, die veel voorkomen in MS-analyse.

Het opstellen van een geschikte spectrale referentiebibliotheek voor uw studie is een belangrijk punt. Een succesvolle en gevoelige MS/MS-identificatie vereist niet alleen de juiste matching-algoritm…

Divulgazioni

The authors have nothing to disclose.

Acknowledgements

Dit werk wordt ondersteund door het National Key Research and Development Program (2018YFC0910200/2017YFA0505001) en het Guangdong Key R&D Program (2019B020226001).

Materials

GNPS open source n/a https://gnps.ucsd.edu/ProteoSAFe/static/gnps-splash.jsp
XY-Meta open source n/a https://github.com/DLI-ShenZhen/XY-Meta
metaX open source n/a https://github.com/wenbostar/metaX
ProteoWizard Free Download 3.0.22116.18c918b-x86_64 https://proteowizard.sourceforge.io/download.html
CHI.Client Free Download ndp48-x86-x64-allos-enu http://www.chi-biotech.com/technology.html?ty=ypt

Riferimenti

  1. Misra, B. B., Fahrmann, J. F., Grapov, D. Review of emerging metabolomic tools and resources: 2015-2016. Electrophoresis. 38 (18), 2257-2274 (2017).
  2. Idle, J. R., Gonzalez, F. J. Metabolomics. Cell Metabolism. 6 (5), 348-351 (2007).
  3. Fiehn, O., Town, C. Metabolomics — the link between genotypes and phenotypes. Functional Genomics. , 155-171 (2002).
  4. Town, C. . Functional Genomics. , (2002).
  5. Dettmer, K., Aronov, P. A., Hammock, B. D. Mass spectrometry-based metabolomics. Mass Spectrometry Reviews. 26 (1), 51-78 (2007).
  6. Vinayavekhin, N., Saghatelian, A. Untargeted metabolomics. Current Protocols in Molecular Biology. , 1-24 (2010).
  7. Chaleckis, R., Meister, I., Zhang, P., Wheelock, C. E. Challenges, progress and promises of metabolite annotation for LC-MS-based metabolomics. Current Opinion in Biotechnology. 55, 44-50 (2019).
  8. Palmer, A., et al. FDR-controlled metabolite annotation for high-resolution imaging mass spectrometry. Nature Methods. 14 (1), 57-60 (2017).
  9. Scheubert, K., et al. Significance estimation for large scale metabolomics annotations by spectral matching. Nature Communications. 8 (1), 1494 (2017).
  10. Schrimpe-Rutledge, A. C., Codreanu, S. G., Sherrod, S. D., McLean, J. A. Untargeted metabolomics strategies-challenges and emerging directions. Journal of the American Society for Mass Spectrometry. 27 (12), 1897-1905 (2016).
  11. Blaženović, I., Kind, T., Ji, J., Fiehn, O. Software tools and approaches for compound identification of LC-MS/MS data in metabolomics. Metabolites. 8 (2), (2018).
  12. Katajamaa, M., Miettinen, J., Oresic, M. MZmine: toolbox for processing and visualization of mass spectrometry based molecular profile data. Bioinformatics. 22 (5), 634-636 (2006).
  13. Tsugawa, H., et al. Hydrogen rearrangement rules: computational MS/MS fragmentation and structure elucidation using MS-FINDER software. Analytical chemistry. 88 (16), 7946-7958 (2016).
  14. Wang, F., et al. CFM-ID 4.0: More accurate ESI-MS/MS spectral prediction and compound identification. Analytical Chemistry. 93 (34), 11692-11700 (2021).
  15. Ruttkies, C., Schymanski, E. L., Wolf, S., Hollender, J., Neumann, S. MetFrag relaunched: incorporating strategies beyond in silico fragmentation. Journal of Cheminformatics. 8, 3 (2016).
  16. Delabriere, A., Warmer, P., Brennsteiner, V., Zamboni, N. SLAW: A scalable and self-optimizing processing workflow for untargeted LC-MS. Analytical chemistry. 93 (45), 15024-15032 (2021).
  17. Wang, X., et al. Target-decoy-based false discovery rate estimation for large-scale metabolite identification. Journal of Proteome Research. 17 (7), 2328-2334 (2018).
  18. Li, D., et al. XY-Meta: a high-efficiency search engine for large-scale metabolome annotation with accurate FDR estimation. Analytical Chemistry. 92 (8), 5701-5707 (2020).
  19. Wen, B., Mei, Z., Zeng, C., Liu, S. metaX: a flexible and comprehensive software for processing metabolomics data. BMC Bioinformatics. 18 (1), 183 (2017).
  20. Aberg, K. M., Torgrip, R. J. O., Kolmert, J., Schuppe-Koistinen, I., Lindberg, J. Feature detection and alignment of hyphenated chromatographic-mass spectrometric data. Extraction of pure ion chromatograms using Kalman tracking. Journal of Chromatography. A. 1192 (1), 139-146 (2008).
  21. Liu, Q., et al. Addressing the batch effect issue for LC/MS metabolomics data in data preprocessing. Scientific Reports. 10 (1), 13856 (2020).
  22. Han, W., Li, L. Evaluating and minimizing batch effects in metabolomics. Mass Spectrometry Reviews. 41 (3), 421-442 (2022).
  23. Fei, F., Bowdish, D. M. E., McCarry, B. E. Comprehensive and simultaneous coverage of lipid and polar metabolites for endogenous cellular metabolomics using HILIC-TOF-MS. Analytical and Bioanalytical Chemistry. 406 (15), 3723-3733 (2014).
  24. Smith, C. A., Want, E. J., O’Maille, G., Abagyan, R., Siuzdak, G. XCMS: processing mass spectrometry data for metabolite profiling using nonlinear peak alignment, matching, and identification. Analytical Chemistry. 78 (3), 779-787 (2006).
  25. Giacomoni, F., et al. Workflow4Metabolomics: a collaborative research infrastructure for computational metabolomics. Bioinformatics. 31 (9), 1493-1495 (2015).
  26. Chang, H. -. Y., et al. iMet-Q: A user-friendly tool for label-free metabolomics quantitation using dynamic peak-width determination. PloS One. 11 (1), 0146112 (2016).
  27. Wang, M., et al. Sharing and community curation of mass spectrometry data with Global Natural Products Social Molecular Networking. Nature Biotechnology. 34 (8), 828-837 (2016).
  28. Schmid, R., et al. Ion identity molecular networking for mass spectrometry-based metabolomics in the GNPS environment. Nature Communications. 12 (1), 3832 (2021).
  29. Kessner, D., Chambers, M., Burke, R., Agus, D., Mallick, P. ProteoWizard: open source software for rapid proteomics tools development. Bioinformatics. 24 (21), 2534-2536 (2008).
  30. Johnson, S. R., Lange, B. M. Open-access metabolomics databases for natural product research: present capabilities and future potential. Frontiers in Bioengineering and Biotechnology. 3, 22 (2015).
  31. Horai, H., et al. MassBank: a public repository for sharing mass spectral data for life sciences. Journal of Mass Spectrometry: JMS. 45 (7), 703-714 (2010).
  32. Rawlinson, C., et al. Hierarchical clustering of MS/MS spectra from the firefly metabolome identifies new lucibufagin compounds. Scientific Reports. 10 (1), 6043 (2020).
check_url/it/63625?article_type=t

Play Video

Citazione di questo articolo
Li, D., Liang, J., Zhang, Y., Zhang, G. An Integrated Workflow of Identification and Quantification on FDR Control-Based Untargeted Metabolome. J. Vis. Exp. (187), e63625, doi:10.3791/63625 (2022).

View Video