Summary

Ein integrierter Workflow zur Identifizierung und Quantifizierung von FDR-Kontroll-basierten, ungezielten Metabolomen

Published: September 20, 2022
doi:

Summary

Wir haben einen ungezielten metabolomischen Workflow entwickelt, der XY-Meta und metaX zusammen integriert. In diesem Protokoll zeigten wir, wie XY-Meta verwendet werden kann, um eine Lockvogel-Spektralbibliothek aus der Open-Access-Spektrenreferenz zu generieren, und führten dann eine FDR-Kontrolle durch und verwendeten das metaX, um die Metaboliten nach der Identifizierung der Metabolomik-Spektren zu quantifizieren.

Abstract

Ungezielte Metabolomik-Techniken sind in den letzten Jahren weit verbreitet. Der schnell steigende Durchsatz und die Anzahl der Proben erzeugen jedoch eine enorme Menge an Spektren, was die Qualitätskontrolle der Massenspektrometriespektren vor Herausforderungen stellt. Um die Fehlalarme zu reduzieren, ist eine Qualitätskontrolle der False Discovery Rate (FDR) erforderlich. Vor kurzem haben wir eine Software zur FDR-Kontrolle der ungezielten Identifizierung von Metabolomen entwickelt, die auf einer Target-Decoy-Strategie namens XY-Meta basiert. Hier demonstrierten wir eine komplette Analyse-Pipeline, die XY-Meta und metaX miteinander integriert. Dieses Protokoll zeigt, wie XY-meta verwendet wird, um eine Lockvogeldatenbank aus einer vorhandenen Referenzdatenbank zu generieren und eine FDR-Kontrolle mit der Target-Decoy-Strategie für die Identifizierung von Metabolomen in großem Maßstab in einem Open-Access-Datensatz durchzuführen. Die Differentialanalyse und die Annotation der Metaboliten wurden nach dem Ausführen von metaX für den Nachweis und die Quantifizierung von Metabolitenspitzen durchgeführt. Um mehr Forschern zu helfen, haben wir auch eine benutzerfreundliche Cloud-basierte Analyseplattform für diese Analysen entwickelt, ohne dass bioinformatische Kenntnisse oder Computersprachen erforderlich sind.

Introduction

Metaboliten spielen eine wichtige Rolle in biologischen Prozessen. Metaboliten sind oft Regulatoren verschiedener Prozesse wie Energieübertragung, Hormonregulation, Regulation von Neurotransmittern, zellulärer Kommunikation und posttranslationalen Proteinmodifikationen usw. 1,2,3,4. Untargeted metabolomics bietet einen globalen Überblick über zahlreiche Metaboliten 5,6. Mit den Fortschritten in der Massenspektrometrie und Chromatographietechnologie nimmt der Durchsatz von Metabolom-MS/MS-Spektren in den letzten Jahren rapide zu 7,8,9,10,11. Um Metaboliten aus diesen riesigen Datensätzen zu identifizieren, wurden verschiedene Annotationssoftware11 entwickelt, wie MZmine12, MS-FINDER 13, CFM-ID 14,MetFrag 15 undSLAW 16. Diese Identifikationen enthalten jedoch oft viele Fehlalarme. Zu den Gründen gehören: (1) Die MS/MS-Spektren enthalten zufälliges Rauschen, das die Spitzenübereinstimmung irreführen kann. (2) Isomere und Unterschiede in den Fragmentierungsenergien verursachen mehrere Spektrenfingerabdrücke und erhöhen so das Volumen der Referenzbibliothek. (3) Die Qualität der Präsenzbibliotheken ist unterschiedlich. Ein geeigneter Standard, um eine gute Referenzspektralbibliothek zu erstellen, ist erforderlich. Daher ist eine systematische FDR-Kontrolle (False Discovery Rate) für ungezielte Metabolomik für die funktionelle Metabolomforschungunerlässlich 7,8,9,17.

Sowohl der empirische Bayes-Ansatz als auch die Target-Decoy-Strategie befassten sich mit dem FDR-Kontrollproblem im Allgemeinen. Kerstin Scheubert et al. zeigten, dass die Target-Decoy-Strategie auf der Lockvogeldatenbank, die aus der fragmentierten baumbasierten Methode generiert wurde, die beste Methode für die FDR-Kontrolle9 ist. Xusheng Wang et al. entwarfen eine Methode zur Lockvogelerzeugung, die auf der Oktettregel in der Chemie basiert und die Genauigkeit der FDR-Schätzung17 verbessert. Die Spektralbibliothek zur Generierung einer Lockvogeldatenbank wurde für eine bessere Leistungdemonstriert 18. Hier haben wir die auf der Spektralbibliothek basierende Methode verbessert und eine Software namens XY-Meta19 entwickelt, die die Genauigkeit der FDR-Schätzung weiter verbessern kann. Es verwendet die vorhandene Referenzspektralbibliothek, um eine Lockvogelbibliothek für die FDR-Kontrolle im Rahmen des Target-Decoy-Schemas zu generieren. XY-Meta unterstützt seine eigenen Spektrenanpassungs- und Kosinus-Ähnlichkeitsalgorithmen. Es ermöglicht konventionelle Such- und iterative Suchmodi. Im Schritt der FDR-Bewertung unterstützt es den Target-Decoy-Verkettungsmodus und den getrennten Modus. Für mehr Flexibilität akzeptiert XY-Meta externe Lockvogelbibliotheken.

Der Spitzennachweis und die Quantifizierung von Metaboliten ist ebenfalls ein wichtiger Schritt der ungezielten Metabolomanalyse. Die Peak-Detektion ist die Hauptmethode zur Identifizierung von Metabolomen. Im Allgemeinen wurde die Genauigkeit der Spitzendetektion von Metaboliten durch mehrere Faktoren beeinflusst, wie z. B. Rauschsignale der Massenspektrometrie, geringe Häufigkeit von Metaboliten, Verunreinigungen und Abbauprodukten von Metaboliten20. Wenn die Anzahl der Proben von zu groß ist oder die flüssige Chromatographiesäule in Experimenten mit ungezieltem Metabolom ersetzt wurde, können bemerkenswerte Chargeneffekte auftreten, was eine große Herausforderung für die Metabolomquantifizierung darstellt21,22,23. Derzeit können Software wie XCMS 24, Workflow4Metabolomic25, iMet-Q26 und metaX19 Spitzenerkennung und Quantifizierung von ungezielten Metabolomen durchführen, aber wir schlagen vor, dass die Pipeline von metaX vollständiger und einfacher zu bedienen ist. Hier demonstrieren wir den Prozess der Identifizierung und FDR-Kontrolle für einen öffentlich zugänglichen Datensatz msv000084112 mit XY-Meta und den Spitzennachweis und die Quantifizierung von Metaboliten mit metaX. Dieser Workflow erfordert nur zwei Gruppen, und jede Gruppe benötigt mindestens zwei Beispiele. MS/MS-Spektrendaten werden unabhängig von der Massenspektrometerplattform, dem Ionisationsmodus, dem Ladungsmodus und dem Probentyp benötigt und können die probenbasierte Normalisierung und die peakbasierte Normalisierung unterstützen. Nach diesem Beispiel können Forscher die Identifizierung und Quantifizierung von Metabolomics auf einfache Weise durchführen. Die Verwendung dieser Pipeline erfordert R-Programmierfunktionen. Um dem Forscher ohne Programmierkenntnisse zu helfen, haben wir auch eine Cloud-Analyseplattform für die Metabolomik-Analyse entwickelt. Wir haben diese Cloud-Analyseplattform in Supplementary Material 5 demonstriert.

Protocol

1. Metabolomics-Datensätze für die Analyse vorbereiten HINWEIS: In dieser Demonstration verwenden wir Metabolomik-Datensätze ohne QC-Stichprobe. Daten für Fall- und Kontrollgruppen werden benötigt. Zur Demonstration verwenden wir einen öffentlichen Datensatz in der GNPS-Datenbank27. Rufen Sie die Webseite https://gnps.ucsd.edu/ProteoSAFe/static/gnps-splash.jsp auf. Klicken Sie auf Datasets durchsuchen. Suchen S…

Representative Results

Die Rohdaten von msv000084112 wurden von msconvert konvertiert.exe und erzeugten mgf-Dateien (Supplementary Material S6). XY-Meta hat die GNPS-NIST14-MATCHES_Decoy.mgf-Datei unter /database Ordner generiert. Dies ist die Lockvogelbibliothek, die aus der ursprünglichen Referenzspektralbibliothek GNPS-NIST14-MATCHES.mgf generiert wurde. Diese Lockvogelbibliothek kann wiederverwendet werden. Bei der Wiederverwendung dieser Köderbibliothek sollte der Benutzer die decoy_pattern i…

Discussion

Die FDR-Kontrolle von nicht zielgerichteten Metaboliten war eine große Herausforderung. Hier demonstrierten wir eine vollständige Pipeline von groß angelegten, ungezielten Metabolomik-Analysen (qualitativ und quantitativ) mit FDR-Kontrolle. Dies reduziert effektiv die falsch positiven Ergebnisse, die in der MS-Analyse sehr häufig vorkommen.

Die Vorbereitung einer geeigneten Referenzspektralbibliothek für Ihre Studie ist ein wichtiger Punkt. Eine erfolgreiche und sensitive MS/MS-Identifizi…

Declarações

The authors have nothing to disclose.

Acknowledgements

Diese Arbeit wird durch das National Key Research and Development Program (2018YFC0910200/2017YFA0505001) und das Guangdong Key R&D Program (2019B020226001) unterstützt.

Materials

GNPS open source n/a https://gnps.ucsd.edu/ProteoSAFe/static/gnps-splash.jsp
XY-Meta open source n/a https://github.com/DLI-ShenZhen/XY-Meta
metaX open source n/a https://github.com/wenbostar/metaX
ProteoWizard Free Download 3.0.22116.18c918b-x86_64 https://proteowizard.sourceforge.io/download.html
CHI.Client Free Download ndp48-x86-x64-allos-enu http://www.chi-biotech.com/technology.html?ty=ypt

Referências

  1. Misra, B. B., Fahrmann, J. F., Grapov, D. Review of emerging metabolomic tools and resources: 2015-2016. Electrophoresis. 38 (18), 2257-2274 (2017).
  2. Idle, J. R., Gonzalez, F. J. Metabolomics. Cell Metabolism. 6 (5), 348-351 (2007).
  3. Fiehn, O., Town, C. Metabolomics — the link between genotypes and phenotypes. Functional Genomics. , 155-171 (2002).
  4. Town, C. . Functional Genomics. , (2002).
  5. Dettmer, K., Aronov, P. A., Hammock, B. D. Mass spectrometry-based metabolomics. Mass Spectrometry Reviews. 26 (1), 51-78 (2007).
  6. Vinayavekhin, N., Saghatelian, A. Untargeted metabolomics. Current Protocols in Molecular Biology. , 1-24 (2010).
  7. Chaleckis, R., Meister, I., Zhang, P., Wheelock, C. E. Challenges, progress and promises of metabolite annotation for LC-MS-based metabolomics. Current Opinion in Biotechnology. 55, 44-50 (2019).
  8. Palmer, A., et al. FDR-controlled metabolite annotation for high-resolution imaging mass spectrometry. Nature Methods. 14 (1), 57-60 (2017).
  9. Scheubert, K., et al. Significance estimation for large scale metabolomics annotations by spectral matching. Nature Communications. 8 (1), 1494 (2017).
  10. Schrimpe-Rutledge, A. C., Codreanu, S. G., Sherrod, S. D., McLean, J. A. Untargeted metabolomics strategies-challenges and emerging directions. Journal of the American Society for Mass Spectrometry. 27 (12), 1897-1905 (2016).
  11. Blaženović, I., Kind, T., Ji, J., Fiehn, O. Software tools and approaches for compound identification of LC-MS/MS data in metabolomics. Metabolites. 8 (2), (2018).
  12. Katajamaa, M., Miettinen, J., Oresic, M. MZmine: toolbox for processing and visualization of mass spectrometry based molecular profile data. Bioinformatics. 22 (5), 634-636 (2006).
  13. Tsugawa, H., et al. Hydrogen rearrangement rules: computational MS/MS fragmentation and structure elucidation using MS-FINDER software. Analytical chemistry. 88 (16), 7946-7958 (2016).
  14. Wang, F., et al. CFM-ID 4.0: More accurate ESI-MS/MS spectral prediction and compound identification. Analytical Chemistry. 93 (34), 11692-11700 (2021).
  15. Ruttkies, C., Schymanski, E. L., Wolf, S., Hollender, J., Neumann, S. MetFrag relaunched: incorporating strategies beyond in silico fragmentation. Journal of Cheminformatics. 8, 3 (2016).
  16. Delabriere, A., Warmer, P., Brennsteiner, V., Zamboni, N. SLAW: A scalable and self-optimizing processing workflow for untargeted LC-MS. Analytical chemistry. 93 (45), 15024-15032 (2021).
  17. Wang, X., et al. Target-decoy-based false discovery rate estimation for large-scale metabolite identification. Journal of Proteome Research. 17 (7), 2328-2334 (2018).
  18. Li, D., et al. XY-Meta: a high-efficiency search engine for large-scale metabolome annotation with accurate FDR estimation. Analytical Chemistry. 92 (8), 5701-5707 (2020).
  19. Wen, B., Mei, Z., Zeng, C., Liu, S. metaX: a flexible and comprehensive software for processing metabolomics data. BMC Bioinformatics. 18 (1), 183 (2017).
  20. Aberg, K. M., Torgrip, R. J. O., Kolmert, J., Schuppe-Koistinen, I., Lindberg, J. Feature detection and alignment of hyphenated chromatographic-mass spectrometric data. Extraction of pure ion chromatograms using Kalman tracking. Journal of Chromatography. A. 1192 (1), 139-146 (2008).
  21. Liu, Q., et al. Addressing the batch effect issue for LC/MS metabolomics data in data preprocessing. Scientific Reports. 10 (1), 13856 (2020).
  22. Han, W., Li, L. Evaluating and minimizing batch effects in metabolomics. Mass Spectrometry Reviews. 41 (3), 421-442 (2022).
  23. Fei, F., Bowdish, D. M. E., McCarry, B. E. Comprehensive and simultaneous coverage of lipid and polar metabolites for endogenous cellular metabolomics using HILIC-TOF-MS. Analytical and Bioanalytical Chemistry. 406 (15), 3723-3733 (2014).
  24. Smith, C. A., Want, E. J., O’Maille, G., Abagyan, R., Siuzdak, G. XCMS: processing mass spectrometry data for metabolite profiling using nonlinear peak alignment, matching, and identification. Analytical Chemistry. 78 (3), 779-787 (2006).
  25. Giacomoni, F., et al. Workflow4Metabolomics: a collaborative research infrastructure for computational metabolomics. Bioinformatics. 31 (9), 1493-1495 (2015).
  26. Chang, H. -. Y., et al. iMet-Q: A user-friendly tool for label-free metabolomics quantitation using dynamic peak-width determination. PloS One. 11 (1), 0146112 (2016).
  27. Wang, M., et al. Sharing and community curation of mass spectrometry data with Global Natural Products Social Molecular Networking. Nature Biotechnology. 34 (8), 828-837 (2016).
  28. Schmid, R., et al. Ion identity molecular networking for mass spectrometry-based metabolomics in the GNPS environment. Nature Communications. 12 (1), 3832 (2021).
  29. Kessner, D., Chambers, M., Burke, R., Agus, D., Mallick, P. ProteoWizard: open source software for rapid proteomics tools development. Bioinformatics. 24 (21), 2534-2536 (2008).
  30. Johnson, S. R., Lange, B. M. Open-access metabolomics databases for natural product research: present capabilities and future potential. Frontiers in Bioengineering and Biotechnology. 3, 22 (2015).
  31. Horai, H., et al. MassBank: a public repository for sharing mass spectral data for life sciences. Journal of Mass Spectrometry: JMS. 45 (7), 703-714 (2010).
  32. Rawlinson, C., et al. Hierarchical clustering of MS/MS spectra from the firefly metabolome identifies new lucibufagin compounds. Scientific Reports. 10 (1), 6043 (2020).
check_url/pt/63625?article_type=t

Play Video

Citar este artigo
Li, D., Liang, J., Zhang, Y., Zhang, G. An Integrated Workflow of Identification and Quantification on FDR Control-Based Untargeted Metabolome. J. Vis. Exp. (187), e63625, doi:10.3791/63625 (2022).

View Video