Summary

माइक्रोबायोम डेटा में रैखिक विभेदक विश्लेषण प्रभाव आकार (LEfSe) द्वारा बायोमार्कर का सहायक चयन

Published: May 16, 2022
doi:

Summary

LEfSe (LDA प्रभाव आकार) जीनोमिक विशेषताओं (जैसे जीन, मार्ग, और वर्गीकरण) की पहचान करने के लिए उच्च आयामी बायोमार्कर खनन के लिए एक उपकरण है जो माइक्रोबायोम डेटा में दो या दो से अधिक समूहों को महत्वपूर्ण रूप से चिह्नित करता है।

Abstract

पर्यावरण और स्वास्थ्य में बंद जैविक जीनोम की ओर ध्यान बढ़ रहा है। विभिन्न नमूनों या वातावरणों के बीच अंतर-समूह मतभेदों का पता लगाने और प्रकट करने के लिए, समूहों के बीच सांख्यिकीय मतभेदों के साथ बायोमार्कर की खोज करना महत्वपूर्ण है। रैखिक discriminant विश्लेषण प्रभाव आकार (LEfSe) के आवेदन अच्छे biomarkers खोजने में मदद कर सकते हैं. मूल जीनोम डेटा के आधार पर, टैक्सा या जीन के आधार पर गुणवत्ता नियंत्रण और विभिन्न अनुक्रमों का परिमाणीकरण किया जाता है। सबसे पहले, क्रुस्कल-वालिस रैंक परीक्षण का उपयोग सांख्यिकीय और जैविक समूहों के बीच विशिष्ट अंतर के बीच अंतर करने के लिए किया गया था। फिर, विलकॉक्सन रैंक परीक्षण पिछले चरण में प्राप्त दो समूहों के बीच किया गया था ताकि यह आकलन किया जा सके कि क्या अंतर सुसंगत थे। अंत में, एलडीए स्कोर के आधार पर काफी अलग-अलग समूहों पर बायोमाकर्स के प्रभाव का मूल्यांकन करने के लिए एक रैखिक भेदभावपूर्ण विश्लेषण (एलडीए) आयोजित किया गया था। संक्षेप में, LEfSe ने जीनोमिक बायोमाकर्स की पहचान करने के लिए सुविधा प्रदान की जो जैविक समूहों के बीच सांख्यिकीय मतभेदों की विशेषता है।

Introduction

बायोमार्कर जैविक विशेषताएं हैं जिन्हें मापा जा सकता है और संक्रमण, बीमारी या पर्यावरण जैसी कुछ घटनाओं को इंगित कर सकता है। उनमें से, कार्यात्मक बायोमार्कर एकल प्रजातियों के विशिष्ट जैविक कार्य या कुछ प्रजातियों के लिए आम हो सकते हैं, जैसे जीन, प्रोटीन, मेटाबोलाइट और मार्ग। इसके अलावा, टैक्सोनोमिक बायोमाकर्स एक असामान्य प्रजाति, जीवों के एक समूह (राज्य, फाइलम, वर्ग, आदेश, परिवार, जीनस, प्रजातियां), एम्प्लिकॉन अनुक्रम वैरिएंट (एएसवी)1, या परिचालन टैक्सोनोमिक यूनिट (ओटीयू) 2 का संकेत देते हैं। बायोमार्कर को अधिक तेज़ी से और सटीक रूप से खोजने के लिए, जैविक डेटा का विश्लेषण करने के लिए एक उपकरण आवश्यक है। कक्षाओं के बीच के अंतर को LEfSe द्वारा सांख्यिकीय महत्व के लिए मानक परीक्षणों के साथ युग्मित और जैविक स्थिरता और प्रभाव प्रासंगिकता 3 एन्कोडिंग अतिरिक्तपरीक्षणों द्वारा समझाया जा सकता है। LEfSe एक आकाशगंगा मॉड्यूल, एक कोंडा सूत्र, एक डॉकर छवि के रूप में उपलब्ध है, और bioBakery (VM और बादल) 4 में शामिल है। आम तौर पर, माइक्रोबियल विविधता का विश्लेषण अक्सर एक नमूना समुदाय के अनिश्चित वितरण के लिए एक गैर-पैरामीट्रिक परीक्षण का उपयोग करता है। रैंक योग परीक्षण एक गैर-पैरामीट्रिक परीक्षण विधि है, जो नमूनों के मूल्य को बदलने के लिए नमूनों के रैंक का उपयोग करता है। नमूना समूहों के अंतर के अनुसार, इसे विलकॉक्सन रैंक योग परीक्षण के साथ दो नमूनों में विभाजित किया जा सकता है और क्रुस्कल-वालिस परीक्षण 5,6 के साथ कई नमूनों में विभाजित किया जा सकता है। विशेष रूप से, जब नमूनों के कई समूहों के बीच महत्वपूर्ण अंतर होते हैं, तो कई नमूनों की जोड़ीवार तुलना का एक रैंक-योग परीक्षण किया जाना चाहिए। एलडीए (जो 1936 में रोनाल्ड फिशर द्वारा आविष्कार किया गया रैखिक विभेदक विश्लेषण के लिए खड़ा है), एक प्रकार का पर्यवेक्षित सीखने है, जिसे फिशर के रैखिक विभेदक7 के रूप में भी जाना जाता है। यह मशीन लर्निंग डेटा खनन के वर्तमान क्षेत्र में एक क्लासिक और लोकप्रिय एल्गोरिथ्म है।

यहाँ, LEfSe परख कोंडा और आकाशगंगा सर्वर द्वारा अनुकूलित किया गया है. 16S rRNA जीन अनुक्रमों के तीन समूहों का विश्लेषण माइक्रोबियल समुदायों और विज़ुअलाइज़ेशन परिणामों के एलडीए स्कोर के साथ विभिन्न समूहों के बीच महत्वपूर्ण अंतर प्रदर्शित करने के लिए किया जाता है।

Protocol

नोट: प्रोटोकॉल स्रोत और Segata et al.3 के अनुसंधान से संशोधित किया गया था। विधि https://bitbucket.org/biobakery/biobakery/wiki/lefse पर प्रदान की जाती है। 1. विश्लेषण के लिए इनपुट फ़ाइल की तैयारी LEfSe की इनपुट फ़ाइल (तालि?…

Representative Results

तीन नमूनों के 16S rRNA जीन अनुक्रमों का विश्लेषण करके प्रत्येक समूह में महत्वपूर्ण अंतर के साथ माइक्रोबियल समुदायों के LDA स्कोर को चित्र 8 में दिखाया गया है। हिस्टोग्राम का रंग विभिन्न समूहों का …

Discussion

यहां, विभिन्न समूहों के भीतर बायोमार्कर की पहचान और लक्षण वर्णन के लिए प्रोटोकॉल का वर्णन किया गया है। इस प्रोटोकॉल को आसानी से अन्य नमूना प्रकारों के लिए अनुकूलित किया जा सकता है, जैसे सूक्ष्मजीवों क?…

Declarações

The authors have nothing to disclose.

Acknowledgements

इस कार्य को केंद्रीय लोक कल्याण अनुसंधान संस्थानों (टीकेएस 170205) और विज्ञान और प्रौद्योगिकी के विकास के लिए फाउंडेशन, और जल परिवहन इंजीनियरिंग के लिए तियानजिन अनुसंधान संस्थान (टीआईडब्ल्यूटीई), एमओटी (केजेएफजेडजेजे170201) के लिए मौलिक अनुसंधान निधियों से अनुदान द्वारा समर्थित किया गया था।

Materials

No materials used

Referências

  1. Bolyen, E., et al. Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. Nature Biotechnology. 37 (8), 852-857 (2019).
  2. Knight, R., et al. Best practices for analysing microbiomes. Nature Reviews. Microbiology. 16 (7), 410-422 (2018).
  3. Segata, N., et al. Metagenomic biomarker discovery and explanation. Genome Biology. 12 (6), 60 (2011).
  4. . Biobakery / lefse [tool] Available from: https://bitbucket.org/biobakery/biobakery/wiki/lefse (2019)
  5. Kruskal, W. H. A nonparametric test for the several sample problem. The Annals of Mathematical Statistics. 23 (4), 525-540 (1952).
  6. Wilcoxon, F. Individual comparisons by ranking methods. Biometrics Bulletin. 1 (6), 80-83 (1945).
  7. Fisher, R. A. The use of multiple measurements in taxonomic problems. Annals of Eugenics. 7 (1), 179-188 (1936).
  8. Liu, Y. X., et al. A practical guide to amplicon and metagenomic analysis of microbiome data. Protein and Cell. 41 (7), 1-16 (2020).
  9. Shahi, S. K., Zarei, K., Guseva, N. V., Mangalam, A. K. Microbiota analysis using two-step PCR and next-generation 16S rRNA gene sequencing. Journal of Visualized Experiments: JoVE. (152), e59980 (2019).
  10. Grüning, B., et al. Bioconda: sustainable and comprehensive software distribution for the life sciences. Nature Methods. 15 (7), 475-476 (2018).
  11. Blankenberg, D., Chilton, J., Coraor, N. Galaxy external display applications: closing a dataflow interoperability loop. Nature Methods. 17 (2), 123-124 (2020).
  12. Langille, M. G. I., et al. Predictive functional profiling of microbial communities using 16S rRNA marker gene sequences. Nature Biotechnology. 31 (9), 814-821 (2013).
  13. Shilei, Z., et al. Reservoir water stratification and mixing affects microbial community structure and functional community composition in a stratified drinking reservoir. Journal of Environmental Management. 267, 110456 (2020).
check_url/pt/61715?article_type=t

Play Video

Citar este artigo
Chang, F., He, S., Dang, C. Assisted Selection of Biomarkers by Linear Discriminant Analysis Effect Size (LEfSe) in Microbiome Data. J. Vis. Exp. (183), e61715, doi:10.3791/61715 (2022).

View Video