Summary

बैच खमीर 2 से अनुक्रम डेटा का स्वरूप विश्लेषण-संकर स्क्रीन

Published: June 28, 2018
doi:

Summary

खमीर आबादी के गहरे अनुक्रमण सकारात्मक खमीर के लिए चयनित 2-संकर बातचीत संभावित भागीदार प्रोटीन बातचीत के बारे में जानकारी का खजाना पैदावार । यहां, हम विशिष्ट bioinformatics उपकरण और अनुकूलित अद्यतन सॉफ्टवेयर के संचालन का वर्णन करने के लिए ऐसी स्क्रीन से अनुक्रम डेटा का विश्लेषण ।

Abstract

हम खमीर अनुकूलित किया है 2-संकर परख एक साथ उच्च प्रवाह कम-पढ़ें डीएनए अनुक्रमण का उपयोग एक ही स्क्रीन के भीतर क्षणिक और स्थिर प्रोटीन बातचीत के दर्जनों उजागर करने के लिए । परिणामी अनुक्रम डेटासेट केवल एक जनसंख्या है कि सकारात्मक खमीर 2-संकर बातचीत के लिए चयन के दौरान समृद्ध कर रहे हैं में क्या जीन ट्रैक नहीं कर सकते हैं, लेकिन यह भी संपर्क के लिए पर्याप्त प्रोटीन के प्रासंगिक उपडोमेन के बारे में विस्तृत जानकारी दे । यहां, हम खड़े अकेले सॉफ्टवेयर प्रोग्राम है कि गैर विशेषज्ञों की अनुमति के लिए सभी bioinformatics और सांख्यिकीय कदम प्रदर्शन करने की प्रक्रिया और एक बैच खमीर 2 से डीएनए अनुक्रम fastq फ़ाइलों का विश्लेषण-संकर परख की एक पूर्ण सुइट का वर्णन । इन सॉफ्टवेयर के द्वारा कवर प्रसंस्करण कदम शामिल हैं: 1) मानचित्रण और गिनती अनुक्रम एक खमीर 2-संकर शिकार पुस्तकालय के भीतर इनकोडिंग प्रत्येक उंमीदवार प्रोटीन के लिए इसी पढ़ता है; 2) एक सांख्यिकीय विश्लेषण प्रोग्राम है कि संवर्धन प्रोफाइल का मूल्यांकन करता है; और 3) उपकरण अनुवाद फ्रेम और प्रत्येक समृद्ध प्लाज्मिड है कि सांकेतिक शब्दों में बदलना हित के प्रोटीन की कोडिंग क्षेत्र के भीतर की स्थिति की जांच करने के लिए ।

Introduction

एक दृष्टिकोण प्रोटीन बातचीत की खोज करने के लिए खमीर 2-संकर (Y2H) परख है, जो इंजीनियर खमीर कोशिकाओं है कि बढ़ती ही जब ब्याज की एक प्रोटीन एक बातचीत साथी1के एक टुकड़े को बांधने का कारनामा है । कई Y2H बातचीत का पता लगाने अब बड़े पैमाने पर समानांतर उच्च प्रवाह अनुक्रमण की मदद से किया जा सकता है । कई स्वरूपों का वर्णन किया गया है2,3,4,5 एक है कि हम विकसित सहित जहां आबादी बैच में शर्तों के तहत बड़े हो रहे है कि plasmids युक्त खमीर के लिए चुनें कि उत्पादन सकारात्मक Y2H इंटरेक्शन. कार्यप्रवाह हम विकसित, DEEPN (प्रोटीन नेटवर्क के मूल्यांकन के लिए गतिशील संवर्धन) का कार्यकाल, एक ही शिकार पुस्तकालयों से अंतर interactomes की पहचान प्रोटीन है कि एक प्रोटीन के साथ बातचीत (या डोमेन) बनाम। एक और प्रोटीन या एक विशेष रूप से अलग उत्परिवर्ती डोमेन । इस कार्यप्रवाह में प्रमुख चरणों में से एक उचित प्रसंस्करण और डीएनए अनुक्रमण डेटा का विश्लेषण है । कुछ जानकारी बस से पहले और एक शाही सेना-seq प्रयोग के अनुरूप एक फैशन में Y2H बातचीत के चयन के बाद दोनों एक जीन के लिए पढ़ता की संख्या गिनती द्वारा बटोरा जा सकता है । हालांकि, बहुत अधिक गहराई में जानकारी इन डेटासेट से एक दिया प्रोटीन है कि एक Y2H बातचीत का उत्पादन करने में सक्षम है की उपडोमेन पर जानकारी सहित निकाला जा सकता है । इसके अलावा, जबकि DEEPN दृष्टिकोण मूल्यवान है, कई नमूने का विश्लेषण प्रतिकृति बोझिल और महंगा हो सकता है । यह समस्या विशेष रूप से जहाँ प्रतिकृतियों की संख्या सीमित है DEEPN datasets के लिए विकसित किया गया था एक सांख्यिकीय मॉडल का उपयोग करके समाप्त है6. bioinformatics विशेषज्ञता के बिना जांचकर्ताओं के लिए विश्वसनीय, पूर्ण, मजबूत और सुलभ डीएनए अनुक्रमण डेटासेट के प्रसंस्करण और विश्लेषण करने के लिए, हम सॉफ्टवेयर प्रोग्राम है कि विश्लेषण के सभी कदम कवर का एक सूट विकसित की है ।

अकेले खड़े सॉफ्टवेयर प्रोग्राम है कि डेस्कटॉप कंप्यूटर पर चलने के इस सुइट MAPster, DEEPN, और Stat_Maker शामिल हैं । MAPster एक ग्राफिक यूजर इंटरफेस है कि प्रत्येक fastq फ़ाइल HISAT27कार्यक्रम का उपयोग कर जीनोम के मानचित्रण के लिए पंक्तिबद्ध, बहाव अनुप्रयोगों में उपयोग के लिए एक मानक. sam फ़ाइल का निर्माण की अनुमति देता है । DEEPN कई मॉड्यूल है । यह प्रदान करता है और गिनती एक आरएनए-seq प्रकार ठहराव मॉड्यूल ‘ जीन गणना ‘ का उपयोग कर के समान विशेष जीन के लिए इसी पढ़ता है । यह भी Gal4 transcriptional डोमेन और शिकार अनुक्रम और उन जंक्शनों की स्थिति collates के बीच जंक्शन के लिए इसी अनुक्रम निष्कर्षों को तुलनात्मक तालिकाओं और रेखांकन द्वारा उनके निरीक्षण की अनुमति (‘ मॉड्यूल Junction_Make ‘ का उपयोग कर) मॉड्यूल ‘ Blast_Query ‘ आसान निरीक्षण, quantitation, और जंक्शन Gal4 जंक्शन दृश्यों की तुलना की अनुमति देता है । Stat_Maker मूल्यांकन की संभावना Y2H हिट को प्राथमिकता देने का एक तरीका के रूप में जीन संवर्धन डेटा सांख्यिकीय प्रति पढ़ता है । यहां, हम वर्णन कैसे इन सॉफ्टवेयर प्रोग्राम का उपयोग करने के लिए और पूरी तरह से एक DEEPN Y2H प्रयोग से डीएनए अनुक्रम डेटा का विश्लेषण । DEEPN के संस्करण पीसी, मैक, और लिनक्स सिस्टम पर चलाने के लिए उपलब्ध हैं । ऐसे मानचित्रण कार्यक्रम MAPster और DEEPN सांख्यिकी मॉड्यूल Stat_Maker के रूप में अंय कार्यक्रमों, उपदिनचर्या कि Unix के तहत चलाने पर निर्भर है और केवल मैक और लिनक्स सिस्टम पर उपलब्ध हैं ।

Protocol

1. मानचित्रण Fastq फ़ाइलें नोट: DEEPN सॉफ्टवेयर के रूप में के रूप में अच्छी तरह से कई bioinformatics कार्यक्रमों डीएनए अनुक्रम डेटा जिसमें प्रत्येक अनुक्रम पढ़ें संदर्भ डीएनए में अपनी स्थिति के लिए मैप किया ग…

Representative Results

मैपिंग fastq डेटा: पहला चरणव्यावहारिक रूप में DEEPN सहित सभी NGS अनुप्रयोगों में प्रारंभिक आउटपुट लघु अनुक्रम की एक फ़ाइल है कि जीनोमिक, transcriptomic, या अंय संदर्भ डीएनए8के लिए संरेखण द्व…

Discussion

सॉफ्टवेयर सुइट यहाँ वर्णित एक पूरी तरह से प्रक्रिया और एक DEEPN प्रयोग से उच्च प्रवाह डीएनए अनुक्रमण डेटा का विश्लेषण करने के लिए अनुमति देता है. पहले इस्तेमाल किया कार्यक्रम MAPster है, जो लेता है डीएनए अनुक्?…

Disclosures

The authors have nothing to disclose.

Acknowledgements

इस काम के स्वास्थ्य के राष्ट्रीय संस्थानों द्वारा समर्थित किया गया था: NIH R21 EB021870-01A1 और द्वारा NSF अनुसंधान परियोजना अनुदान: १५१७११० ।

Materials

Mapster https://github.com/emptyewer/MAPster/releases
DEEPN software https://github.com/emptyewer/DEEPN/releases
Statmaker https://github.com/emptyewer/DEEPN/releases
Minimum computer system Apple Mac Intel Core i5 or better
4 Gb RAM or better
500 Gb Disk spce or better
OS 10.10 or higher
Dell Intel i5-7400 or better
4 Gb RAM or better
500 Gb Disk spce or better
Windows 7 or higher

References

  1. Fields, S., Song, O. A novel genetic system to detect protein-protein interactions. Nature. 340 (6230), 245-246 (1989).
  2. Rajagopala, S. V. Mapping the Protein-Protein Interactome Networks Using Yeast Two-Hybrid Screens. Advances in Experimental Medicine and Biology. 883, 187-214 (2015).
  3. Weimann, M., et al. A Y2H-seq approach defines the human protein methyltransferase interactome. Nature Methods. 10 (4), 339-342 (2013).
  4. Yachie, N., et al. Pooled-matrix protein interaction screens using Barcode Fusion Genetics. Molecular Systems Biology. 12 (4), 863 (2016).
  5. Trigg, S. A., et al. CrY2H-seq: a massively multiplexed assay for deep-coverage interactome mapping. Nature Methods. , (2017).
  6. Pashkova, N., et al. DEEPN as an Approach for Batch Processing of Yeast 2-Hybrid Interactions. Cell Reports. 17 (1), 303-315 (2016).
  7. Kim, D., Langmead, B., Salzberg, S. L. HISAT: a fast spliced aligner with low memory requirements. Nature Methods. 12 (4), 357-360 (2015).
  8. Reinert, K., Langmead, B., Weese, D., Evers, D. J. Alignment of Next-Generation Sequencing Reads. Annual Review of Genomics and Human Genetics. 16, 133-151 (2015).
  9. Pertea, M., Kim, D., Pertea, G. M., Leek, J. T., Salzberg, S. L. Transcript-level expression analysis of RNA-seq experiments with HISAT, StringTie and Ballgown. Nature Protocols. 11 (9), 1650-1667 (2016).
  10. Conesa, A., et al. A survey of best practices for RNA-seq data analysis. Genome Biology. 17, 13 (2016).
check_url/57802?article_type=t

Play Video

Cite This Article
Krishnamani, V., Peterson, T. A., Piper, R. C., Stamnes, M. A. Informatic Analysis of Sequence Data from Batch Yeast 2-Hybrid Screens. J. Vis. Exp. (136), e57802, doi:10.3791/57802 (2018).

View Video