Summary

एफडीआर नियंत्रण-आधारित अलक्षित चयापचय पर पहचान और मात्रा का ठहराव का एक एकीकृत वर्कफ़्लो

Published: September 20, 2022
doi:

Summary

हमने एक अनटार्गेटेड मेटाबोलोमिक वर्कफ़्लो का निर्माण किया जो एक्सवाई-मेटा और मेटाएक्स को एक साथ एकीकृत करता है। इस प्रोटोकॉल में, हमने प्रदर्शित किया कि ओपन एक्सेस स्पेक्ट्रा संदर्भ से एक डिकॉय स्पेक्ट्रल लाइब्रेरी उत्पन्न करने के लिए एक्सवाई-मेटा का उपयोग कैसे किया जाए, और फिर एफडीआर नियंत्रण किया और मेटाबोलॉमिक्स स्पेक्ट्रा की पहचान करने के बाद मेटाबोलाइट्स को मापने के लिए मेटाएक्स का उपयोग किया।

Abstract

हाल के वर्षों में अनियंत्रित चयापचय तकनीकों का व्यापक रूप से उपयोग किया जा रहा है। हालांकि, तेजी से बढ़ते थ्रूपुट और नमूनों की संख्या स्पेक्ट्रा की एक बड़ी मात्रा बनाती है, मास स्पेक्ट्रोमेट्री स्पेक्ट्रा के गुणवत्ता नियंत्रण के लिए चुनौतियां निर्धारित करती है। झूठी सकारात्मकता को कम करने के लिए, झूठी खोज दर (एफडीआर) गुणवत्ता नियंत्रण आवश्यक है। हाल ही में, हमने अनटारगेटेड मेटाबोलोम पहचान के एफडीआर नियंत्रण के लिए एक सॉफ्टवेयर विकसित किया है जो एक्सवाई-मेटा नामक लक्ष्य-डिकॉय रणनीति पर आधारित है। यहां, हमने एक पूर्ण विश्लेषण पाइपलाइन का प्रदर्शन किया जो एक्सवाई-मेटा और मेटाएक्स को एक साथ एकीकृत करता है। यह प्रोटोकॉल दिखाता है कि मौजूदा संदर्भ डेटाबेस से एक डिकॉय डेटाबेस उत्पन्न करने और ओपन-एक्सेस डेटासेट पर बड़े पैमाने पर मेटाबोलोम पहचान के लिए लक्ष्य-डिकॉय रणनीति का उपयोग करके एफडीआर नियंत्रण करने के लिए XY-मेटा का उपयोग कैसे करें। चयापचयों का पता लगाने और मात्रा के लिए मेटाएक्स चलाने के बाद अंतर विश्लेषण और चयापचयों एनोटेशन का प्रदर्शन किया गया था। अधिक शोधकर्ताओं की मदद करने के लिए, हमने जैव सूचना विज्ञान कौशल या किसी भी कंप्यूटर भाषाओं की आवश्यकता के बिना, इन विश्लेषणों के लिए एक उपयोगकर्ता के अनुकूल क्लाउड-आधारित विश्लेषण मंच भी विकसित किया।

Introduction

चयापचय जैविक प्रक्रियाओं में महत्वपूर्ण भूमिका निभाते हैं। मेटाबोलाइट्स अक्सर विभिन्न प्रक्रियाओं जैसे ऊर्जा हस्तांतरण, हार्मोन नियमों, न्यूरोट्रांसमीटर के विनियमन, सेलुलर संचार और प्रोटीन पोस्ट-ट्रांसलेशनल संशोधनों आदिके नियामक होते हैं। अनटार्गेटेड मेटाबोलॉमिक्स कई चयापचयों 5,6 का वैश्विक दृष्टिकोण प्रदान करता है। मास स्पेक्ट्रोमेट्री और क्रोमैटोग्राफी प्रौद्योगिकियों में प्रगति के साथ, मेटाबोलोम एमएस / एमएस स्पेक्ट्रा का थ्रूपुट हाल के वर्षों मेंतेजी से बढ़ रहा है 7,8,9,10,11। इन विशाल डेटासेट से चयापचयों की पहचान करने के लिए, विभिन्न एनोटेशन सॉफ़्टवेयर11 विकसित किए गए थे, जैसे कि एमजेडमाइन12, एमएस-फाइंडर13, सीएफएम-आईडी14, मेटफ्रैग15 और एसएलएलएडब्ल्यू16। हालांकि, इन पहचानों में अक्सर कई झूठी सकारात्मकताएं होती हैं। कारणों में शामिल हैं: (1) एमएस /एमएस स्पेक्ट्रा में यादृच्छिक शोर होता है, जो शिखर मिलान को गुमराह कर सकता है। (2) आइसोमर्स और विखंडन ऊर्जा में अंतर कई स्पेक्ट्रा उंगलियों के निशान का कारण बनता है और इस प्रकार संदर्भ पुस्तकालय की मात्रा में वृद्धि करता है। (3) संदर्भ पुस्तकालयों की गुणवत्ता भिन्न होती है। एक अच्छा संदर्भ वर्णक्रमीय पुस्तकालय बनाने के लिए एक उचित मानक की आवश्यकता है। इसलिए, कार्यात्मक चयापचय अनुसंधान 7,8,9,17 के लिए असंतुलित चयापचय विज्ञान के लिए एक व्यवस्थित झूठी खोज दर (एफडीआर) नियंत्रण आवश्यक है।

अनुभवजन्य बेयस दृष्टिकोण और लक्ष्य-डिकॉय रणनीति दोनों ने आम तौर पर एफडीआर नियंत्रण समस्या से निपटा। केर्स्टिन श्यूबर्ट एट अल ने दिखाया कि विखंडन पेड़-आधारित विधि से उत्पन्न डिकॉय डेटाबेस पर लक्ष्य-डिकॉय रणनीति एफडीआर नियंत्रण9 के लिए सबसे अच्छी विधि है। ज़ुशेंग वांग एट अल ने रसायन विज्ञान में ऑक्टेट नियम के आधार पर डिकॉय पीढ़ी के लिए एक विधि तैयार की और एफडीआर अनुमान17 की सटीकता में सुधार किया। डिकॉय डेटाबेस उत्पन्न करने के लिए वर्णक्रमीय पुस्तकालय बेहतर प्रदर्शन18 के लिए प्रदर्शित किया गया था। यहां, हमने वर्णक्रमीय पुस्तकालय-आधारित विधि में सुधार किया और एक्सवाई-मेटा19 नामक एक सॉफ्टवेयर विकसित किया जो एफडीआर अनुमान की सटीकता में और सुधार कर सकता है। यह लक्ष्य-डिकॉय योजना के तहत एफडीआर नियंत्रण के लिए एक डिकॉय लाइब्रेरी उत्पन्न करने के लिए मौजूदा संदर्भ वर्णक्रमीय लाइब्रेरी का उपयोग करता है। एक्सवाई-मेटा अपने स्वयं के स्पेक्ट्रा मिलान और कोसाइन समानता एल्गोरिदम का समर्थन करता है। यह पारंपरिक खोज और पुनरावृत्ति खोज मोड की अनुमति देता है। एफडीआर मूल्यांकन के चरण में, यह लक्ष्य-डिकॉय संकुचित मोड और अलग मोड का समर्थन करता है। बेहतर लचीलेपन के लिए, एक्सवाई-मेटा बाहरी डिकॉय पुस्तकालयों को स्वीकार करता है।

चयापचयों का पीक डिटेक्शन और परिमाणीकरण भी अनियंत्रित चयापचय विश्लेषण का एक महत्वपूर्ण कदम है। पीक डिटेक्शन मेटाबोलोम पहचान के लिए मुख्य विधि है। सामान्य तौर पर, चयापचयों के शिखर का पता लगाने की सटीकता कई कारकों से प्रभावित थी, जैसे कि मास स्पेक्ट्रोमेट्री के शोर संकेत, चयापचयों की कम बहुतायत, दूषित पदार्थ, और चयापचयों के क्षरण उत्पाद20. जब नमूनों की संख्या बहुत बड़ी होती है या तरल क्रोमैटोग्राफी कॉलम को अनियंत्रित चयापचय के प्रयोगों में बदल दिया जाता है, तो उल्लेखनीय बैच प्रभाव दिखाई दे सकते हैं, जो चयापचय परिमाणन21,22,23 के लिए एक बड़ी चुनौती है। वर्तमान में, एक्ससीएमएस24, वर्कफ़्लो 4 मेटाबोलोमिक25, आईमेट-क्यू26 और मेटाएक्स19 जैसे सॉफ़्टवेयर अनियंत्रित चयापचय की चोटी का पता लगाने और मात्रा निर्धारित कर सकते हैं, लेकिन हम सुझाव देते हैं कि मेटाएक्स की पाइपलाइन अधिक पूर्ण और उपयोग में आसान है। यहां, हम एक्सवाई-मेटा का उपयोग करके सार्वजनिक रूप से उपलब्ध डेटासेट एमएसवी000084112 के लिए पहचान और एफडीआर नियंत्रण की प्रक्रिया का प्रदर्शन करते हैं, और मेटाएक्स का उपयोग करके चयापचयों का चोटी का पता लगाने और मात्रा का ठहराव करते हैं। इस वर्कफ़्लो के लिए केवल दो समूहों की आवश्यकता होती है, और प्रत्येक समूह को कम से कम दो नमूनों की आवश्यकता होती है. एमएस स्पेक्ट्रा डेटा की आवश्यकता होती है, मास स्पेक्ट्रोमीटर प्लेटफॉर्म, आयनीकरण मोड, चार्ज मोड और नमूना प्रकार की परवाह किए बिना, और नमूना-आधारित सामान्यीकरण और शिखर-आधारित सामान्यीकरण का समर्थन कर सकता है। इस उदाहरण के बाद, शोधकर्ता चयापचय की पहचान और मात्रा का ठहराव आसान तरीके से कर सकते हैं। इस पाइपलाइन का उपयोग करने के लिए आर प्रोग्रामिंग क्षमता की आवश्यकता होती है। बिना किसी प्रोग्रामिंग ज्ञान के शोधकर्ता की मदद करने के लिए, हमने चयापचय विश्लेषण के लिए एक क्लाउड विश्लेषण मंच भी विकसित किया। हमने अनुपूरक सामग्री 5 में इस क्लाउड विश्लेषण मंच का प्रदर्शन किया।

Protocol

1. विश्लेषण के लिए मेटाबोलॉमिक्स डेटासेट तैयार करें नोट: इस प्रदर्शन में, हम क्यूसी नमूने के बिना चयापचय डेटासेट का उपयोग करते हैं। केस और नियंत्रण समूहों के लिए डेटा की आवश्यकता होती ह?…

Representative Results

एमएसवी000084112 के कच्चे डेटा को एमएस-कन्वर्ट.exe द्वारा परिवर्तित किया गया था और एमजीएफ फाइलों (पूरक सामग्री एस 6) को उत्पन्न किया गया था। एक्सवाई-मेटा ने जीएनपीएस-एनआईएसटी 14-MATCHES_Decoy.एमजीएफ फ़ाइ?…

Discussion

अनटारगेटेड मेटाबोलाइट्स का एफडीआर नियंत्रण एक बड़ी चुनौती रही है। यहां, हमने एफडीआर नियंत्रण के साथ बड़े पैमाने पर अलक्षित चयापचय विश्लेषण (गुणात्मक और मात्रात्मक) की एक पूरी पाइपलाइन का प्रदर्शन कि…

Divulgazioni

The authors have nothing to disclose.

Acknowledgements

यह काम राष्ट्रीय कुंजी अनुसंधान और विकास कार्यक्रम (2018वाईएफसी0910200/2017वाईएफए0505001) और गुआंग्डोंग कुंजी अनुसंधान एवं विकास कार्यक्रम (2019बी020226001) द्वारा समर्थित है।

Materials

GNPS open source n/a https://gnps.ucsd.edu/ProteoSAFe/static/gnps-splash.jsp
XY-Meta open source n/a https://github.com/DLI-ShenZhen/XY-Meta
metaX open source n/a https://github.com/wenbostar/metaX
ProteoWizard Free Download 3.0.22116.18c918b-x86_64 https://proteowizard.sourceforge.io/download.html
CHI.Client Free Download ndp48-x86-x64-allos-enu http://www.chi-biotech.com/technology.html?ty=ypt

Riferimenti

  1. Misra, B. B., Fahrmann, J. F., Grapov, D. Review of emerging metabolomic tools and resources: 2015-2016. Electrophoresis. 38 (18), 2257-2274 (2017).
  2. Idle, J. R., Gonzalez, F. J. Metabolomics. Cell Metabolism. 6 (5), 348-351 (2007).
  3. Fiehn, O., Town, C. Metabolomics — the link between genotypes and phenotypes. Functional Genomics. , 155-171 (2002).
  4. Town, C. . Functional Genomics. , (2002).
  5. Dettmer, K., Aronov, P. A., Hammock, B. D. Mass spectrometry-based metabolomics. Mass Spectrometry Reviews. 26 (1), 51-78 (2007).
  6. Vinayavekhin, N., Saghatelian, A. Untargeted metabolomics. Current Protocols in Molecular Biology. , 1-24 (2010).
  7. Chaleckis, R., Meister, I., Zhang, P., Wheelock, C. E. Challenges, progress and promises of metabolite annotation for LC-MS-based metabolomics. Current Opinion in Biotechnology. 55, 44-50 (2019).
  8. Palmer, A., et al. FDR-controlled metabolite annotation for high-resolution imaging mass spectrometry. Nature Methods. 14 (1), 57-60 (2017).
  9. Scheubert, K., et al. Significance estimation for large scale metabolomics annotations by spectral matching. Nature Communications. 8 (1), 1494 (2017).
  10. Schrimpe-Rutledge, A. C., Codreanu, S. G., Sherrod, S. D., McLean, J. A. Untargeted metabolomics strategies-challenges and emerging directions. Journal of the American Society for Mass Spectrometry. 27 (12), 1897-1905 (2016).
  11. Blaženović, I., Kind, T., Ji, J., Fiehn, O. Software tools and approaches for compound identification of LC-MS/MS data in metabolomics. Metabolites. 8 (2), (2018).
  12. Katajamaa, M., Miettinen, J., Oresic, M. MZmine: toolbox for processing and visualization of mass spectrometry based molecular profile data. Bioinformatics. 22 (5), 634-636 (2006).
  13. Tsugawa, H., et al. Hydrogen rearrangement rules: computational MS/MS fragmentation and structure elucidation using MS-FINDER software. Analytical chemistry. 88 (16), 7946-7958 (2016).
  14. Wang, F., et al. CFM-ID 4.0: More accurate ESI-MS/MS spectral prediction and compound identification. Analytical Chemistry. 93 (34), 11692-11700 (2021).
  15. Ruttkies, C., Schymanski, E. L., Wolf, S., Hollender, J., Neumann, S. MetFrag relaunched: incorporating strategies beyond in silico fragmentation. Journal of Cheminformatics. 8, 3 (2016).
  16. Delabriere, A., Warmer, P., Brennsteiner, V., Zamboni, N. SLAW: A scalable and self-optimizing processing workflow for untargeted LC-MS. Analytical chemistry. 93 (45), 15024-15032 (2021).
  17. Wang, X., et al. Target-decoy-based false discovery rate estimation for large-scale metabolite identification. Journal of Proteome Research. 17 (7), 2328-2334 (2018).
  18. Li, D., et al. XY-Meta: a high-efficiency search engine for large-scale metabolome annotation with accurate FDR estimation. Analytical Chemistry. 92 (8), 5701-5707 (2020).
  19. Wen, B., Mei, Z., Zeng, C., Liu, S. metaX: a flexible and comprehensive software for processing metabolomics data. BMC Bioinformatics. 18 (1), 183 (2017).
  20. Aberg, K. M., Torgrip, R. J. O., Kolmert, J., Schuppe-Koistinen, I., Lindberg, J. Feature detection and alignment of hyphenated chromatographic-mass spectrometric data. Extraction of pure ion chromatograms using Kalman tracking. Journal of Chromatography. A. 1192 (1), 139-146 (2008).
  21. Liu, Q., et al. Addressing the batch effect issue for LC/MS metabolomics data in data preprocessing. Scientific Reports. 10 (1), 13856 (2020).
  22. Han, W., Li, L. Evaluating and minimizing batch effects in metabolomics. Mass Spectrometry Reviews. 41 (3), 421-442 (2022).
  23. Fei, F., Bowdish, D. M. E., McCarry, B. E. Comprehensive and simultaneous coverage of lipid and polar metabolites for endogenous cellular metabolomics using HILIC-TOF-MS. Analytical and Bioanalytical Chemistry. 406 (15), 3723-3733 (2014).
  24. Smith, C. A., Want, E. J., O’Maille, G., Abagyan, R., Siuzdak, G. XCMS: processing mass spectrometry data for metabolite profiling using nonlinear peak alignment, matching, and identification. Analytical Chemistry. 78 (3), 779-787 (2006).
  25. Giacomoni, F., et al. Workflow4Metabolomics: a collaborative research infrastructure for computational metabolomics. Bioinformatics. 31 (9), 1493-1495 (2015).
  26. Chang, H. -. Y., et al. iMet-Q: A user-friendly tool for label-free metabolomics quantitation using dynamic peak-width determination. PloS One. 11 (1), 0146112 (2016).
  27. Wang, M., et al. Sharing and community curation of mass spectrometry data with Global Natural Products Social Molecular Networking. Nature Biotechnology. 34 (8), 828-837 (2016).
  28. Schmid, R., et al. Ion identity molecular networking for mass spectrometry-based metabolomics in the GNPS environment. Nature Communications. 12 (1), 3832 (2021).
  29. Kessner, D., Chambers, M., Burke, R., Agus, D., Mallick, P. ProteoWizard: open source software for rapid proteomics tools development. Bioinformatics. 24 (21), 2534-2536 (2008).
  30. Johnson, S. R., Lange, B. M. Open-access metabolomics databases for natural product research: present capabilities and future potential. Frontiers in Bioengineering and Biotechnology. 3, 22 (2015).
  31. Horai, H., et al. MassBank: a public repository for sharing mass spectral data for life sciences. Journal of Mass Spectrometry: JMS. 45 (7), 703-714 (2010).
  32. Rawlinson, C., et al. Hierarchical clustering of MS/MS spectra from the firefly metabolome identifies new lucibufagin compounds. Scientific Reports. 10 (1), 6043 (2020).
check_url/it/63625?article_type=t

Play Video

Citazione di questo articolo
Li, D., Liang, J., Zhang, Y., Zhang, G. An Integrated Workflow of Identification and Quantification on FDR Control-Based Untargeted Metabolome. J. Vis. Exp. (187), e63625, doi:10.3791/63625 (2022).

View Video