खमीर आबादी के गहरे अनुक्रमण सकारात्मक खमीर के लिए चयनित 2-संकर बातचीत संभावित भागीदार प्रोटीन बातचीत के बारे में जानकारी का खजाना पैदावार । यहां, हम विशिष्ट bioinformatics उपकरण और अनुकूलित अद्यतन सॉफ्टवेयर के संचालन का वर्णन करने के लिए ऐसी स्क्रीन से अनुक्रम डेटा का विश्लेषण ।
हम खमीर अनुकूलित किया है 2-संकर परख एक साथ उच्च प्रवाह कम-पढ़ें डीएनए अनुक्रमण का उपयोग एक ही स्क्रीन के भीतर क्षणिक और स्थिर प्रोटीन बातचीत के दर्जनों उजागर करने के लिए । परिणामी अनुक्रम डेटासेट केवल एक जनसंख्या है कि सकारात्मक खमीर 2-संकर बातचीत के लिए चयन के दौरान समृद्ध कर रहे हैं में क्या जीन ट्रैक नहीं कर सकते हैं, लेकिन यह भी संपर्क के लिए पर्याप्त प्रोटीन के प्रासंगिक उपडोमेन के बारे में विस्तृत जानकारी दे । यहां, हम खड़े अकेले सॉफ्टवेयर प्रोग्राम है कि गैर विशेषज्ञों की अनुमति के लिए सभी bioinformatics और सांख्यिकीय कदम प्रदर्शन करने की प्रक्रिया और एक बैच खमीर 2 से डीएनए अनुक्रम fastq फ़ाइलों का विश्लेषण-संकर परख की एक पूर्ण सुइट का वर्णन । इन सॉफ्टवेयर के द्वारा कवर प्रसंस्करण कदम शामिल हैं: 1) मानचित्रण और गिनती अनुक्रम एक खमीर 2-संकर शिकार पुस्तकालय के भीतर इनकोडिंग प्रत्येक उंमीदवार प्रोटीन के लिए इसी पढ़ता है; 2) एक सांख्यिकीय विश्लेषण प्रोग्राम है कि संवर्धन प्रोफाइल का मूल्यांकन करता है; और 3) उपकरण अनुवाद फ्रेम और प्रत्येक समृद्ध प्लाज्मिड है कि सांकेतिक शब्दों में बदलना हित के प्रोटीन की कोडिंग क्षेत्र के भीतर की स्थिति की जांच करने के लिए ।
एक दृष्टिकोण प्रोटीन बातचीत की खोज करने के लिए खमीर 2-संकर (Y2H) परख है, जो इंजीनियर खमीर कोशिकाओं है कि बढ़ती ही जब ब्याज की एक प्रोटीन एक बातचीत साथी1के एक टुकड़े को बांधने का कारनामा है । कई Y2H बातचीत का पता लगाने अब बड़े पैमाने पर समानांतर उच्च प्रवाह अनुक्रमण की मदद से किया जा सकता है । कई स्वरूपों का वर्णन किया गया है2,3,4,5 एक है कि हम विकसित सहित जहां आबादी बैच में शर्तों के तहत बड़े हो रहे है कि plasmids युक्त खमीर के लिए चुनें कि उत्पादन सकारात्मक Y2H इंटरेक्शन६. कार्यप्रवाह हम विकसित, DEEPN (प्रोटीन नेटवर्क के मूल्यांकन के लिए गतिशील संवर्धन) का कार्यकाल, एक ही शिकार पुस्तकालयों से अंतर interactomes की पहचान प्रोटीन है कि एक प्रोटीन के साथ बातचीत (या डोमेन) बनाम। एक और प्रोटीन या एक विशेष रूप से अलग उत्परिवर्ती डोमेन । इस कार्यप्रवाह में प्रमुख चरणों में से एक उचित प्रसंस्करण और डीएनए अनुक्रमण डेटा का विश्लेषण है । कुछ जानकारी बस से पहले और एक शाही सेना-seq प्रयोग के अनुरूप एक फैशन में Y2H बातचीत के चयन के बाद दोनों एक जीन के लिए पढ़ता की संख्या गिनती द्वारा बटोरा जा सकता है । हालांकि, बहुत अधिक गहराई में जानकारी इन डेटासेट से एक दिया प्रोटीन है कि एक Y2H बातचीत का उत्पादन करने में सक्षम है की उपडोमेन पर जानकारी सहित निकाला जा सकता है । इसके अलावा, जबकि DEEPN दृष्टिकोण मूल्यवान है, कई नमूने का विश्लेषण प्रतिकृति बोझिल और महंगा हो सकता है । यह समस्या विशेष रूप से जहाँ प्रतिकृतियों की संख्या सीमित है DEEPN datasets के लिए विकसित किया गया था एक सांख्यिकीय मॉडल का उपयोग करके समाप्त है6. bioinformatics विशेषज्ञता के बिना जांचकर्ताओं के लिए विश्वसनीय, पूर्ण, मजबूत और सुलभ डीएनए अनुक्रमण डेटासेट के प्रसंस्करण और विश्लेषण करने के लिए, हम सॉफ्टवेयर प्रोग्राम है कि विश्लेषण के सभी कदम कवर का एक सूट विकसित की है ।
अकेले खड़े सॉफ्टवेयर प्रोग्राम है कि डेस्कटॉप कंप्यूटर पर चलने के इस सुइट MAPster, DEEPN, और Stat_Maker शामिल हैं । MAPster एक ग्राफिक यूजर इंटरफेस है कि प्रत्येक fastq फ़ाइल HISAT27कार्यक्रम का उपयोग कर जीनोम के मानचित्रण के लिए पंक्तिबद्ध, बहाव अनुप्रयोगों में उपयोग के लिए एक मानक. sam फ़ाइल का निर्माण की अनुमति देता है । DEEPN कई मॉड्यूल है । यह प्रदान करता है और गिनती एक आरएनए-seq प्रकार ठहराव मॉड्यूल ‘ जीन गणना ‘ का उपयोग कर के समान विशेष जीन के लिए इसी पढ़ता है । यह भी Gal4 transcriptional डोमेन और शिकार अनुक्रम और उन जंक्शनों की स्थिति collates के बीच जंक्शन के लिए इसी अनुक्रम निष्कर्षों को तुलनात्मक तालिकाओं और रेखांकन द्वारा उनके निरीक्षण की अनुमति (‘ मॉड्यूल Junction_Make ‘ का उपयोग कर) मॉड्यूल ‘ Blast_Query ‘ आसान निरीक्षण, quantitation, और जंक्शन Gal4 जंक्शन दृश्यों की तुलना की अनुमति देता है । Stat_Maker मूल्यांकन की संभावना Y2H हिट को प्राथमिकता देने का एक तरीका के रूप में जीन संवर्धन डेटा सांख्यिकीय प्रति पढ़ता है । यहां, हम वर्णन कैसे इन सॉफ्टवेयर प्रोग्राम का उपयोग करने के लिए और पूरी तरह से एक DEEPN Y2H प्रयोग से डीएनए अनुक्रम डेटा का विश्लेषण । DEEPN के संस्करण पीसी, मैक, और लिनक्स सिस्टम पर चलाने के लिए उपलब्ध हैं । ऐसे मानचित्रण कार्यक्रम MAPster और DEEPN सांख्यिकी मॉड्यूल Stat_Maker के रूप में अंय कार्यक्रमों, उपदिनचर्या कि Unix के तहत चलाने पर निर्भर है और केवल मैक और लिनक्स सिस्टम पर उपलब्ध हैं ।
सॉफ्टवेयर सुइट यहाँ वर्णित एक पूरी तरह से प्रक्रिया और एक DEEPN प्रयोग से उच्च प्रवाह डीएनए अनुक्रमण डेटा का विश्लेषण करने के लिए अनुमति देता है. पहले इस्तेमाल किया कार्यक्रम MAPster है, जो लेता है डीएनए अनुक्?…
The authors have nothing to disclose.
इस काम के स्वास्थ्य के राष्ट्रीय संस्थानों द्वारा समर्थित किया गया था: NIH R21 EB021870-01A1 और द्वारा NSF अनुसंधान परियोजना अनुदान: १५१७११० ।
Mapster | https://github.com/emptyewer/MAPster/releases | ||
DEEPN software | https://github.com/emptyewer/DEEPN/releases | ||
Statmaker | https://github.com/emptyewer/DEEPN/releases | ||
Minimum computer system | Apple | Mac Intel Core i5 or better | |
– | 4 Gb RAM or better | ||
– | 500 Gb Disk spce or better | ||
– | OS 10.10 or higher | ||
Dell | Intel i5-7400 or better | ||
– | 4 Gb RAM or better | ||
– | 500 Gb Disk spce or better | ||
– | Windows 7 or higher |