LEfSe (LDA प्रभाव आकार) जीनोमिक विशेषताओं (जैसे जीन, मार्ग, और वर्गीकरण) की पहचान करने के लिए उच्च आयामी बायोमार्कर खनन के लिए एक उपकरण है जो माइक्रोबायोम डेटा में दो या दो से अधिक समूहों को महत्वपूर्ण रूप से चिह्नित करता है।
पर्यावरण और स्वास्थ्य में बंद जैविक जीनोम की ओर ध्यान बढ़ रहा है। विभिन्न नमूनों या वातावरणों के बीच अंतर-समूह मतभेदों का पता लगाने और प्रकट करने के लिए, समूहों के बीच सांख्यिकीय मतभेदों के साथ बायोमार्कर की खोज करना महत्वपूर्ण है। रैखिक discriminant विश्लेषण प्रभाव आकार (LEfSe) के आवेदन अच्छे biomarkers खोजने में मदद कर सकते हैं. मूल जीनोम डेटा के आधार पर, टैक्सा या जीन के आधार पर गुणवत्ता नियंत्रण और विभिन्न अनुक्रमों का परिमाणीकरण किया जाता है। सबसे पहले, क्रुस्कल-वालिस रैंक परीक्षण का उपयोग सांख्यिकीय और जैविक समूहों के बीच विशिष्ट अंतर के बीच अंतर करने के लिए किया गया था। फिर, विलकॉक्सन रैंक परीक्षण पिछले चरण में प्राप्त दो समूहों के बीच किया गया था ताकि यह आकलन किया जा सके कि क्या अंतर सुसंगत थे। अंत में, एलडीए स्कोर के आधार पर काफी अलग-अलग समूहों पर बायोमाकर्स के प्रभाव का मूल्यांकन करने के लिए एक रैखिक भेदभावपूर्ण विश्लेषण (एलडीए) आयोजित किया गया था। संक्षेप में, LEfSe ने जीनोमिक बायोमाकर्स की पहचान करने के लिए सुविधा प्रदान की जो जैविक समूहों के बीच सांख्यिकीय मतभेदों की विशेषता है।
बायोमार्कर जैविक विशेषताएं हैं जिन्हें मापा जा सकता है और संक्रमण, बीमारी या पर्यावरण जैसी कुछ घटनाओं को इंगित कर सकता है। उनमें से, कार्यात्मक बायोमार्कर एकल प्रजातियों के विशिष्ट जैविक कार्य या कुछ प्रजातियों के लिए आम हो सकते हैं, जैसे जीन, प्रोटीन, मेटाबोलाइट और मार्ग। इसके अलावा, टैक्सोनोमिक बायोमाकर्स एक असामान्य प्रजाति, जीवों के एक समूह (राज्य, फाइलम, वर्ग, आदेश, परिवार, जीनस, प्रजातियां), एम्प्लिकॉन अनुक्रम वैरिएंट (एएसवी)1, या परिचालन टैक्सोनोमिक यूनिट (ओटीयू) 2 का संकेत देते हैं। बायोमार्कर को अधिक तेज़ी से और सटीक रूप से खोजने के लिए, जैविक डेटा का विश्लेषण करने के लिए एक उपकरण आवश्यक है। कक्षाओं के बीच के अंतर को LEfSe द्वारा सांख्यिकीय महत्व के लिए मानक परीक्षणों के साथ युग्मित और जैविक स्थिरता और प्रभाव प्रासंगिकता 3 एन्कोडिंग अतिरिक्तपरीक्षणों द्वारा समझाया जा सकता है। LEfSe एक आकाशगंगा मॉड्यूल, एक कोंडा सूत्र, एक डॉकर छवि के रूप में उपलब्ध है, और bioBakery (VM और बादल) 4 में शामिल है। आम तौर पर, माइक्रोबियल विविधता का विश्लेषण अक्सर एक नमूना समुदाय के अनिश्चित वितरण के लिए एक गैर-पैरामीट्रिक परीक्षण का उपयोग करता है। रैंक योग परीक्षण एक गैर-पैरामीट्रिक परीक्षण विधि है, जो नमूनों के मूल्य को बदलने के लिए नमूनों के रैंक का उपयोग करता है। नमूना समूहों के अंतर के अनुसार, इसे विलकॉक्सन रैंक योग परीक्षण के साथ दो नमूनों में विभाजित किया जा सकता है और क्रुस्कल-वालिस परीक्षण 5,6 के साथ कई नमूनों में विभाजित किया जा सकता है। विशेष रूप से, जब नमूनों के कई समूहों के बीच महत्वपूर्ण अंतर होते हैं, तो कई नमूनों की जोड़ीवार तुलना का एक रैंक-योग परीक्षण किया जाना चाहिए। एलडीए (जो 1936 में रोनाल्ड फिशर द्वारा आविष्कार किया गया रैखिक विभेदक विश्लेषण के लिए खड़ा है), एक प्रकार का पर्यवेक्षित सीखने है, जिसे फिशर के रैखिक विभेदक7 के रूप में भी जाना जाता है। यह मशीन लर्निंग डेटा खनन के वर्तमान क्षेत्र में एक क्लासिक और लोकप्रिय एल्गोरिथ्म है।
यहाँ, LEfSe परख कोंडा और आकाशगंगा सर्वर द्वारा अनुकूलित किया गया है. 16S rRNA जीन अनुक्रमों के तीन समूहों का विश्लेषण माइक्रोबियल समुदायों और विज़ुअलाइज़ेशन परिणामों के एलडीए स्कोर के साथ विभिन्न समूहों के बीच महत्वपूर्ण अंतर प्रदर्शित करने के लिए किया जाता है।
यहां, विभिन्न समूहों के भीतर बायोमार्कर की पहचान और लक्षण वर्णन के लिए प्रोटोकॉल का वर्णन किया गया है। इस प्रोटोकॉल को आसानी से अन्य नमूना प्रकारों के लिए अनुकूलित किया जा सकता है, जैसे सूक्ष्मजीवों क?…
The authors have nothing to disclose.
इस कार्य को केंद्रीय लोक कल्याण अनुसंधान संस्थानों (टीकेएस 170205) और विज्ञान और प्रौद्योगिकी के विकास के लिए फाउंडेशन, और जल परिवहन इंजीनियरिंग के लिए तियानजिन अनुसंधान संस्थान (टीआईडब्ल्यूटीई), एमओटी (केजेएफजेडजेजे170201) के लिए मौलिक अनुसंधान निधियों से अनुदान द्वारा समर्थित किया गया था।