Summary

En integrert arbeidsflyt for identifisering og kvantifisering på FDR-kontrollbasert ikke-målrettet metabolom

Published: September 20, 2022
doi:

Summary

Vi konstruerte en ikke-målrettet metabolomisk arbeidsflyt som integrerte XY-Meta og metaX sammen. I denne protokollen viste vi hvordan du bruker XY-Meta til å generere et lokkeduespektralbibliotek fra åpen tilgangsspektrareferanse, og deretter utførte FDR-kontroll og brukte metaX til å kvantifisere metabolittene etter å ha identifisert metabolomics-spektrene.

Abstract

Målrettede metabolomics-teknikker blir mye brukt de siste årene. Den raskt økende gjennomstrømningen og antall prøver skaper imidlertid en enorm mengde spektra, noe som gir utfordringer for kvalitetskontroll av massespektrometrispektrene. For å redusere falske positiver, er kvalitetskontroll av falsk oppdagelsesrate (FDR) nødvendig. Nylig utviklet vi en programvare for FDR-kontroll av ikke-målrettet metabolomidentifikasjon som er basert på en Target-Decoy-strategi kalt XY-Meta. Her demonstrerte vi en komplett analysepipeline som integrerer XY-Meta og metaX sammen. Denne protokollen viser hvordan du bruker XY-meta til å generere en lokkedatabase fra en eksisterende referansedatabase og utføre FDR-kontroll ved hjelp av Target-Decoy-strategien for storskala metabolomidentifikasjon på et datasett med åpen tilgang. Differensialanalysen og merknaden av metabolitter ble utført etter å ha kjørt metaX for påvisning og kvantifisering av metabolitttopper. For å hjelpe flere forskere utviklet vi også en brukervennlig skybasert analyseplattform for disse analysene, uten behov for bioinformatikkferdigheter eller dataspråk.

Introduction

Metabolitter spiller viktige roller i biologiske prosesser. Metabolitter er ofte regulatorer av ulike prosesser som energioverføring, hormonreguleringer, regulering av nevrotransmittere, cellulær kommunikasjon og protein etter translasjonelle modifikasjoner, etc. 1,2,3,4. Ikke-målrettet metabolomikk gir et globalt syn på mange metabolitter 5,6. Med fremskritt innen massespektrometri og kromatografiteknologier øker gjennomstrømningen av metabolom MS / MS-spektra raskt de siste årene 7,8,9,10,11. For å identifisere metabolitter fra disse enorme datasettene ble det utviklet forskjellige merknadsprogramvare11, for eksempel MZmine12, MS-FINDER13, CFM-ID14, MetFrag15 og SLAW16. Imidlertid inneholder disse identifikasjonene ofte mange falske positiver. Årsakene inkluderer: (1) MS / MS-spektrene inneholder tilfeldig støy, noe som kan villede toppmatchingen. (2) Isomerer og forskjeller i fragmenteringsenergier forårsaker flere spektra fingeravtrykk og øker dermed volumet av referansebiblioteket. (3) Kvaliteten på referansebibliotekene varierer. En skikkelig standard for å bygge et godt referansespektralbibliotek er nødvendig. Derfor er en systematisk falsk oppdagelsesrate (FDR) kontroll for ikke-målrettet metabolomikk avgjørende for funksjonell metabolomforskning 7,8,9,17.

Både Den empiriske Bayes-tilnærmingen og Target-Decoy-strategien taklet FDR-kontrollproblemet generelt. Kerstin Scheubert og medarbeidere viste at Target-Decoy-strategien på lokkedatabase generert fra fragmenteringstrebasert metode er den beste metoden for FDR-kontroll9. Xusheng Wang og medarbeidere utviklet en metode for lokkeduegenerering basert på oktetregelen i kjemi og forbedret presisjonen i FDR-estimering17. Spektralbiblioteket for generering av lokkedatabase ble demonstrert for bedre ytelse18. Her forbedret vi den spektralbibliotekbaserte metoden og utviklet en programvare kalt XY-Meta19 som kan forbedre FDR-estimeringens presisjon ytterligere. Den bruker det eksisterende referansespektralbiblioteket til å generere et lokkebibliotek for FDR-kontrollen under Target-Decoy-ordningen. XY-Meta støtter sine egne spektramatchings- og cosinuslikhetsalgoritmer. Det tillater konvensjonelle søke- og iterative søkemoduser. I trinnet med FDR-vurdering støtter den Target-Decoy-konkatenert modus og separert modus. For bedre fleksibilitet godtar XY-Meta eksterne lokkebiblioteker.

Toppdeteksjon og kvantifisering av metabolitter er også et viktig skritt i ikke-målrettet metabolomanalyse. Toppdeteksjon er den viktigste metoden for metabolomidentifikasjon. Generelt ble nøyaktigheten av toppdeteksjon av metabolitter påvirket av flere faktorer, for eksempel støysignaler fra massespektrometri, lav overflod av metabolitter, kontaminanter og nedbrytningsprodukter av metabolitter20. Når antall prøver av er for store eller væskekromatografikolonnen ble erstattet i eksperimenter med ikke-målrettet metabolom, kan det oppstå bemerkelsesverdige batcheffekter, noe som er en stor utfordring for metabolomkvantifisering 21,22,23. For øyeblikket kan programvare som XCMS24, Workflow4Metabolomic25, iMet-Q26 og metaX19 utføre toppdeteksjon og kvantifisering av ikke-målrettet metabolom, men vi foreslår at rørledningen til metaX er mer komplett og enklere å bruke. Her demonstrerer vi prosessen med identifikasjon og FDR-kontroll for et offentlig tilgjengelig datasett msv000084112 ved hjelp av XY-Meta, og toppdeteksjon og kvantifisering av metabolitter ved bruk av metaX. Denne arbeidsflyten krever bare to grupper, og hver gruppe trenger minst to eksempler. MS/MS-spektradata er nødvendig, uavhengig av massespektrometerplattform, ioniseringsmodus, lademodus og prøvetype, og kan støtte prøvebasert normalisering og toppbasert normalisering. Etter dette eksemplet kan forskere utføre metabolomics identifikasjon og kvantifisering på en enkel å håndtere måte. Bruk av denne pipelinen krever R-programmeringsfunksjonalitet. For å hjelpe forskeren uten programmeringskunnskap utviklet vi også en skyanalyseplattform for metabolomics analyse. Vi demonstrerte denne skyanalyseplattformen i Supplementary Material 5.

Protocol

1. Forbered metabolomics datasett for analyse MERK: I denne demonstrasjonen bruker vi metabolomics datasett uten QC-prøve. Data for saks- og kontrollgrupper er nødvendig. For demonstrasjon bruker vi et offentlig datasett i BNP-database27. Gå til nettsiden https://gnps.ucsd.edu/ProteoSAFe/static/gnps-splash.jsp. Klikk Bla gjennom datasett. Søk etter nøkkelordet “msv000084112” i Tittel-kolonnen . …

Representative Results

Rådata for msv000084112 ble konvertert av msconvert.exe og genererte mgf-filer (Supplementary Material S6). XY-Meta genererte GNPS-NIST14-MATCHES_Decoy.mgf-filen under /database-mappen. Dette er lokkebiblioteket som genereres fra det opprinnelige referansespektralbiblioteket GNPS-NIST14-MATCHES.mgf. Dette lokkebiblioteket kan gjenbrukes. Når du bruker dette lokkebiblioteket på nytt, bør brukeren angi decoy_pattern som 1 i parameter.default-filen, og angi decoyinput som den…

Discussion

FDR-kontroll av ikke-målrettede metabolitter har vært en stor utfordring. Her demonstrerte vi en komplett pipeline av storskala ikke-målrettet metabolomics-analyse (kvalitativ og kvantitativ) med FDR-kontroll. Dette reduserer effektivt de falske positive, som er svært vanlige i MS-analyse.

Å forberede et passende referansespektralbibliotek for studiet ditt er et sentralt punkt. En vellykket og sensitiv MS / MS-identifikasjon krever ikke bare riktige samsvarende algoritmer, men også rikti…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Dette arbeidet støttes av National Key Research and Development Program (2018YFC0910200/2017YFA0505001) og Guangdong Key R&D Program (2019B020226001).

Materials

GNPS open source n/a https://gnps.ucsd.edu/ProteoSAFe/static/gnps-splash.jsp
XY-Meta open source n/a https://github.com/DLI-ShenZhen/XY-Meta
metaX open source n/a https://github.com/wenbostar/metaX
ProteoWizard Free Download 3.0.22116.18c918b-x86_64 https://proteowizard.sourceforge.io/download.html
CHI.Client Free Download ndp48-x86-x64-allos-enu http://www.chi-biotech.com/technology.html?ty=ypt

References

  1. Misra, B. B., Fahrmann, J. F., Grapov, D. Review of emerging metabolomic tools and resources: 2015-2016. Electrophoresis. 38 (18), 2257-2274 (2017).
  2. Idle, J. R., Gonzalez, F. J. Metabolomics. Cell Metabolism. 6 (5), 348-351 (2007).
  3. Fiehn, O., Town, C. Metabolomics — the link between genotypes and phenotypes. Functional Genomics. , 155-171 (2002).
  4. Town, C. . Functional Genomics. , (2002).
  5. Dettmer, K., Aronov, P. A., Hammock, B. D. Mass spectrometry-based metabolomics. Mass Spectrometry Reviews. 26 (1), 51-78 (2007).
  6. Vinayavekhin, N., Saghatelian, A. Untargeted metabolomics. Current Protocols in Molecular Biology. , 1-24 (2010).
  7. Chaleckis, R., Meister, I., Zhang, P., Wheelock, C. E. Challenges, progress and promises of metabolite annotation for LC-MS-based metabolomics. Current Opinion in Biotechnology. 55, 44-50 (2019).
  8. Palmer, A., et al. FDR-controlled metabolite annotation for high-resolution imaging mass spectrometry. Nature Methods. 14 (1), 57-60 (2017).
  9. Scheubert, K., et al. Significance estimation for large scale metabolomics annotations by spectral matching. Nature Communications. 8 (1), 1494 (2017).
  10. Schrimpe-Rutledge, A. C., Codreanu, S. G., Sherrod, S. D., McLean, J. A. Untargeted metabolomics strategies-challenges and emerging directions. Journal of the American Society for Mass Spectrometry. 27 (12), 1897-1905 (2016).
  11. Blaženović, I., Kind, T., Ji, J., Fiehn, O. Software tools and approaches for compound identification of LC-MS/MS data in metabolomics. Metabolites. 8 (2), (2018).
  12. Katajamaa, M., Miettinen, J., Oresic, M. MZmine: toolbox for processing and visualization of mass spectrometry based molecular profile data. Bioinformatics. 22 (5), 634-636 (2006).
  13. Tsugawa, H., et al. Hydrogen rearrangement rules: computational MS/MS fragmentation and structure elucidation using MS-FINDER software. Analytical chemistry. 88 (16), 7946-7958 (2016).
  14. Wang, F., et al. CFM-ID 4.0: More accurate ESI-MS/MS spectral prediction and compound identification. Analytical Chemistry. 93 (34), 11692-11700 (2021).
  15. Ruttkies, C., Schymanski, E. L., Wolf, S., Hollender, J., Neumann, S. MetFrag relaunched: incorporating strategies beyond in silico fragmentation. Journal of Cheminformatics. 8, 3 (2016).
  16. Delabriere, A., Warmer, P., Brennsteiner, V., Zamboni, N. SLAW: A scalable and self-optimizing processing workflow for untargeted LC-MS. Analytical chemistry. 93 (45), 15024-15032 (2021).
  17. Wang, X., et al. Target-decoy-based false discovery rate estimation for large-scale metabolite identification. Journal of Proteome Research. 17 (7), 2328-2334 (2018).
  18. Li, D., et al. XY-Meta: a high-efficiency search engine for large-scale metabolome annotation with accurate FDR estimation. Analytical Chemistry. 92 (8), 5701-5707 (2020).
  19. Wen, B., Mei, Z., Zeng, C., Liu, S. metaX: a flexible and comprehensive software for processing metabolomics data. BMC Bioinformatics. 18 (1), 183 (2017).
  20. Aberg, K. M., Torgrip, R. J. O., Kolmert, J., Schuppe-Koistinen, I., Lindberg, J. Feature detection and alignment of hyphenated chromatographic-mass spectrometric data. Extraction of pure ion chromatograms using Kalman tracking. Journal of Chromatography. A. 1192 (1), 139-146 (2008).
  21. Liu, Q., et al. Addressing the batch effect issue for LC/MS metabolomics data in data preprocessing. Scientific Reports. 10 (1), 13856 (2020).
  22. Han, W., Li, L. Evaluating and minimizing batch effects in metabolomics. Mass Spectrometry Reviews. 41 (3), 421-442 (2022).
  23. Fei, F., Bowdish, D. M. E., McCarry, B. E. Comprehensive and simultaneous coverage of lipid and polar metabolites for endogenous cellular metabolomics using HILIC-TOF-MS. Analytical and Bioanalytical Chemistry. 406 (15), 3723-3733 (2014).
  24. Smith, C. A., Want, E. J., O’Maille, G., Abagyan, R., Siuzdak, G. XCMS: processing mass spectrometry data for metabolite profiling using nonlinear peak alignment, matching, and identification. Analytical Chemistry. 78 (3), 779-787 (2006).
  25. Giacomoni, F., et al. Workflow4Metabolomics: a collaborative research infrastructure for computational metabolomics. Bioinformatics. 31 (9), 1493-1495 (2015).
  26. Chang, H. -. Y., et al. iMet-Q: A user-friendly tool for label-free metabolomics quantitation using dynamic peak-width determination. PloS One. 11 (1), 0146112 (2016).
  27. Wang, M., et al. Sharing and community curation of mass spectrometry data with Global Natural Products Social Molecular Networking. Nature Biotechnology. 34 (8), 828-837 (2016).
  28. Schmid, R., et al. Ion identity molecular networking for mass spectrometry-based metabolomics in the GNPS environment. Nature Communications. 12 (1), 3832 (2021).
  29. Kessner, D., Chambers, M., Burke, R., Agus, D., Mallick, P. ProteoWizard: open source software for rapid proteomics tools development. Bioinformatics. 24 (21), 2534-2536 (2008).
  30. Johnson, S. R., Lange, B. M. Open-access metabolomics databases for natural product research: present capabilities and future potential. Frontiers in Bioengineering and Biotechnology. 3, 22 (2015).
  31. Horai, H., et al. MassBank: a public repository for sharing mass spectral data for life sciences. Journal of Mass Spectrometry: JMS. 45 (7), 703-714 (2010).
  32. Rawlinson, C., et al. Hierarchical clustering of MS/MS spectra from the firefly metabolome identifies new lucibufagin compounds. Scientific Reports. 10 (1), 6043 (2020).
check_url/63625?article_type=t&slug=an-integrated-workflow-identification-quantification-on-fdr-control

Play Video

Cite This Article
Li, D., Liang, J., Zhang, Y., Zhang, G. An Integrated Workflow of Identification and Quantification on FDR Control-Based Untargeted Metabolome. J. Vis. Exp. (187), e63625, doi:10.3791/63625 (2022).

View Video