Summary

जीनोमिक्स द्वारा उपंयास अनुक्रम डिस्कवरी

Published: January 25, 2019
doi:

Summary

इस प्रोटोकॉल के प्रयोजन के लिए अभिकलनी और बेंच अनुसंधान का एक संयोजन का उपयोग करने के लिए उपंयास दृश्यों कि आसानी से एक सह शुद्ध अनुक्रम, जो केवल आंशिक रूप से जाना जा सकता है से अलग नहीं किया जा सकता है खोजने के लिए है ।

Abstract

उपजीनोमिक्स किसी भी अनुसंधान में इस्तेमाल किया जा सकता है, जहां लक्ष्य एक जीन, प्रोटीन, या सामांय क्षेत्र है कि एक बड़ा जीनोमिक संदर्भ में एंबेडेड है के अनुक्रम की पहचान है । उपजीनोमिक्स एक शोधकर्ता व्यापक अनुक्रमण द्वारा ब्याज (टी) के एक लक्ष्य अनुक्रम को अलग करने के लिए सक्षम बनाता है और ज्ञात आनुवंशिक तत्वों (संदर्भ, आर) बाहर घटाकर । विधि mitochondria, chloroplasts, वायरस, या germline प्रतिबंधित गुणसूत्रों जैसे उपंयास दृश्यों की पहचान करने के लिए इस्तेमाल किया जा सकता है, और विशेष रूप से उपयोगी है जब टी आसानी से आर से अलग नहीं किया जा सकता है व्यापक जीनोमिक डेटा (आर + टी) के साथ शुरू, विधि एक संदर्भ अनुक्रम, या दृश्यों के खिलाफ बुनियादी स्थानीय संरेखण खोज उपकरण (ब्लास्ट) का उपयोग करता है, लक्ष्य (टी) पीछे छोड़कर मिलान ज्ञात दृश्यों (आर) को दूर करने के लिए । सबसे अच्छा काम करने के लिए घटाव के लिए, आर एक अपेक्षाकृत पूरा मसौदा है कि टी लापता है होना चाहिए । घटाव के बाद शेष अनुक्रम मात्रात्मक पोलीमरेज़ श्रृंखला प्रतिक्रिया (qPCR) के माध्यम से परीक्षण कर रहे हैं के बाद से, आर काम करने के लिए विधि के लिए पूरा होने की जरूरत नहीं है. यहां हम एक चक्र है कि जरूरत के रूप में दोहराया जा सकता है में प्रयोगात्मक कदम के साथ गणना कदम लिंक, क्रमिक रूप से कई संदर्भ दृश्यों को हटाने और टी के लिए खोज को परिष्कृत जीनोमिक्स का लाभ यह है कि एक पूरी तरह से उपंयास लक्ष्य अनुक्रम मामलों में भी पहचान की जा सकती है जिसमें शारीरिक शुद्धि मुश्किल, असंभव, या महंगा है । विधि की एक खामी घटाव और qPCR परीक्षण के लिए टी पॉजिटिव और नकारात्मक नमूने प्राप्त करने के लिए एक उपयुक्त संदर्भ पा रही है । हम ज़ेबरा फिंच के germline-प्रतिबंधित गुणसूत्र से पहले जीन की पहचान में विधि के हमारे कार्यांवयन का वर्णन । उस मामले में गणनात्मक फ़िल्टरिंग शामिल तीन संदर्भ (R), क्रमिक रूप से तीन चक्रों पर निकाल दिया: एक अपूर्ण जीनोमिक असेंबली, raw जीनोमिक डेटा, और transcriptomic डेटा ।

Introduction

इस विधि के प्रयोजन के लिए एक उपंयास लक्ष्य (टी) जीनोमिक अनुक्रम की पहचान है, या तो डीएनए या आरएनए, एक जीनोमिक संदर्भ से, या संदर्भ (R) (चित्रा 1) । अगर लक्ष्य को शारीरिक रूप से अलग नहीं किया जा सकता है, या ऐसा करना महंगा हो जाएगा तो विधि सबसे उपयोगी है । केवल कुछ जीवों घटाव के लिए पूरी तरह से जीनोम खत्म हो गया है, तो हमारे विधि का एक प्रमुख नवाचार गणना और बेंच तरीकों का संयोजन करने के लिए शोधकर्ताओं को सक्षम करने के लिए लक्ष्य अनुक्रम को अलग जब संदर्भ अपूर्ण है, या एक मसौदा एक गैर मॉडल जीव से जीनोम । एक चक्र के अंत में, qPCR परीक्षण और अधिक घटाव की जरूरत है कि क्या यह निर्धारित करने के लिए प्रयोग किया जाता है । एक सत्यापित उंमीदवार टी अनुक्रम qPCR द्वारा ज्ञात टी सकारात्मक नमूनों में सांख्यिकीय अधिक से अधिक पता लगाने दिखाएगा ।

विधि के अवतार नए जीवाणु दवा लक्ष्य है कि मेजबान homologs1,2,3,4 और संक्रमित मेजबान से उपंयास वायरस की पहचान नहीं है की खोज में लागू किया गया है 5,6. टी की पहचान के अलावा, विधि आर सुधार कर सकते हैं: हम हाल ही में ज़ेबरा फिंच संदर्भ जीनोम से ९३६ लापता जीन की पहचान और एक germline केवल गुणसूत्र (टी)7से एक नया जीन विधि का इस्तेमाल किया । उपजीनोमिक्स विशेष रूप से मूल्यवान है जब टी ज्ञात दृश्यों से अत्यंत अलग होने की संभावना है, या जब टी की पहचान मोटे तौर पर अपरिभाषित है, के रूप में ज़ेबरा फिंच germline-प्रतिबंधित गुणसूत्र7में ।

पहले टी के सकारात्मक पहचान की आवश्यकता नहीं द्वारा, जीनोमिक्स के एक महत्वपूर्ण लाभ यह है कि यह निष्पक्ष है । हाल ही में एक अध्ययन में, Readhead एट अल. चार मस्तिष्क क्षेत्रों में अल्जाइमर रोग और वायरल बहुतायत के बीच संबंधों की जांच की । वायरल पहचान के लिए, Readhead एट अल । ५१५ वायरस का एक डाटाबेस बनाया8, गंभीर रूप से वायरल एजेंटों सीमित है कि उनके अध्ययन की पहचान सकता है । उपजीनोमिक्स स्वस्थ और अल्जाइमर जीनोम की तुलना करने के लिए संभव उपंयास बीमारी से जुड़े वायरस को अलग करने के लिए इस्तेमाल किया जा सकता है, उनकी समानता के ज्ञात संक्रामक एजेंटों के लिए परवाह किए बिना । जबकि वहां रहे है २६३ मानव लक्ष्यीकरण वायरस, यह अनुमान लगाया गया है कि लगभग १,६७०,००० undiscover वायरल प्रजातियों में मौजूद है, 631000-827000 के साथ उनमें से एक क्षमता9मनुष्यों को संक्रमित करने के लिए ।

उपंयास वायरस का अलगाव एक क्षेत्र है जिसमें उपश्वसनी जीनोमिक्स विशेष रूप से प्रभावी है, लेकिन कुछ अध्ययनों से इस तरह के एक कड़े विधि की जरूरत नहीं हो सकती है । उदाहरण के लिए, उपंयास वायरस की पहचान अध्ययन निष्पक्ष उच्च प्रवाह अनुक्रमण रिवर्स प्रतिलेखन और वायरल अनुक्रम5 या वायरल न्यूक्लिक एसिड के संवर्धन के लिए BLASTx द्वारा पीछा करने के लिए निकालने और रिवर्स टाइप वायरल दृश्यों का इस्तेमाल किया है 6. इन अध्ययनों से नियोजित डी नोवो अनुक्रमण और विधानसभा, घटाव क्योंकि लक्ष्य अनुक्रम सकारात्मक विस्फोट के माध्यम से पहचाने गए थे नहीं किया गया था । यदि वायरस पूरी तरह से उपंयास और संबंधित नहीं थे (या दूर से संबंधित) अंय वायरस के लिए, असभ्य जीनोमिक्स एक उपयोगी तकनीक किया गया होता । जीनोमिक्स के लाभ यह है कि पूरी तरह से नए है कि अनुक्रम प्राप्त किया जा सकता है । अगर जीव के जीनोम का पता चल जाए तो वह किसी भी वायरल जुगाड़ को छोड़ने के लिए बाहर ही मुकर सकता है । उदाहरण के लिए, हमारे प्रकाशित अध्ययन में हम ज़ेबरा फिंच से एक उपंयास वायरल अनुक्रम पृथक जीनोमिक्स के माध्यम से अलग है, हालांकि यह हमारी मूल मंशा7नहीं था ।

जीनोमिक्स भी बैक्टीरियल वैक्सीन लक्ष्य की पहचान में उपयोगी साबित कर दिया है, एंटीबायोटिक प्रतिरोध में नाटकीय वृद्धि से प्रेरित1,2,3,4। को स्व-प्रतिरक्षित प्रतिक्रिया के जोखिम को कम करने के लिए, शोधकर्ताओं ने नीचे सीमित क्षमता वैक्सीन किसी भी प्रोटीन है कि मानव की मेजबानी में homologs है घटाकर द्वारा लक्ष्य । एक विशेष अध्ययन, Corynebacterium pseudotuberculosisको देख, कई जीवाणु जीनोम से हड्डीवाला मेजबान जीनोम के घटाव प्रदर्शन को सुनिश्चित करना है कि संभव दवा लक्ष्यों को प्रभावित नहीं होगा साइड इफेक्ट के लिए अग्रणी मेजबान में प्रोटीन 1. इन अध्ययनों के मूल कार्य प्रवाह को बैक्टीरियल proteome डाउनलोड करना, महत्वपूर्ण प्रोटीन का निर्धारण, निरर्थक प्रोटीन निकालना, BLASTp का उपयोग आवश्यक प्रोटीन को अलग करना, और मेजबान proteome के खिलाफ BLASTp मेजबान के साथ किसी भी प्रोटीन को दूर करने के लिए है homologs 1 , 2 , 3 , 4. इस मामले में, उपजीनोमिक्स सुनिश्चित करें कि टीके विकसित किसी भी बंद-लक्ष्य प्रभाव में मेजबान1,2,3,4नहीं होगा ।

हम एक germline-प्रतिबंधित गुणसूत्र (जीआरसी) (इस मामले में, टी), जो germlines में पाया जाता है लेकिन दोनों लिंगों के दैहिक ऊतक नहीं है पर पहले प्रोटीन कोडिंग जीन की पहचान करने के लिए जीनोमिक्स इस्तेमाल किया10। इस अध्ययन से पहले, केवल जीनोमिक जानकारी जीआरसी के बारे में जाना जाता था एक दोहराव क्षेत्र11था । डी नोवो विधानसभा अंडाशय से अनुक्रम आरएनए पर प्रदर्शन किया और वयस्क ज़ेबरा finches से ऊतकों (आर + टी) का परीक्षण किया गया. अनुक्रम की गणना उन्मूलन प्रकाशित दैहिक (स्नायु) जीनोम अनुक्रम (r1)12का उपयोग किया गया था, इसके रॉ (सैंज) डेटा (आर2) पढ़ें, और एक दैहिक (मस्तिष्क) transcriptome (r3)13. तीन संदर्भों के अनुक्रमिक उपयोग प्रत्येक चक्र के चरण 5 में qPCR परीक्षण द्वारा संचालित किया गया था (चित्रा 2), दिखा रहा है कि अतिरिक्त फ़िल्टरिंग की आवश्यकता थी । खोजा α-स्नैप जीन डीएनए और आरएनए से qPCR के माध्यम से पुष्टि की गई थी, और क्लोनिंग और अनुक्रमण । हम अपने उदाहरण में दिखाने के लिए कि इस विधि लचीला है: यह न्यूक्लिक एसिड (डीएनए बनाम आरएनए) मिलान पर निर्भर नहीं है और वह घटाव संदर्भ (आर) है कि विधानसभाओं या रॉ के शामिल है के साथ किया जा सकता है पढ़ता है ।

Protocol

1. De नोवो शुरू अनुक्रम इकट्ठा नोट: किसी भी अगली पीढ़ी के अनुक्रम (NGS) डेटा का उपयोग किया जा सकता है, जब तक एक असेंबली उन डेटा से निर्मित किया जा सकता है । उपयुक्त इनपुट डेटा Illumina, PacBio, या ऑक्सफोर्ड ट्…

Representative Results

ब्लास्ट चलाने के बाद, आउटपुट फ़ाइल डेटाबेस से मेल खाती क्वेरी से अनुक्रम की एक सूची होगा । पायथन घटाव के बाद, बेजोड़ दृश्यों की एक संख्या प्राप्त किया जाएगा, और qPCR द्वारा परीक्षण । इस के परिण?…

Discussion

जबकि असभ्य जीनोमिक्स शक्तिशाली है, यह एक कुकी कटर दृष्टिकोण नहीं है, कई महत्वपूर्ण कदम पर अनुकूलन की आवश्यकता है, और संदर्भ दृश्यों और परीक्षण नमूनों की सावधानी से चयन । यदि क्वेरी असेंबली खराब गुणवत्?…

Declarações

The authors have nothing to disclose.

Acknowledgements

लेखक विभिंन चरणों में ज़ेबरा फिंच जीनोमिक्स परियोजना के साथ उनकी सहायता के लिए मिशेल Biederman, एलिसा Pedersen, और कॉलिन जे Saldanha स्वीकार करते हैं । हम कंप्यूटिंग क्लस्टर सिस्टम एडमिनिस्ट्रेशन और NIH ग्रांट 1K22CA184297 (टू J.R.B.) और NIH एनएस ०४२७६७ (सी. जे. एस.) के लिए एवगेनी Bisk भी स्वीकार करते हैं ।

Materials

Accustart II Taq DNA Polymerase Quanta Bio 95141
Blasic Local Alignment Search Tool (BLAST) https://github.com/trinityrnaseq/trinityrnaseq/wiki/Transcriptome-Assembly-Quality-Assessment
Bowtie 2 https://www.python.org/download/releases/2.7/
BWA-MEM v. 0.7.12 https://github.com/BenLangmead/bowtie2
Geneious https://blast.ncbi.nlm.nih.gov/Blast.cgi
PEAR v. 0.9.6 http://www.mybiosoftware.com/reptile-1-1-short-read-error-correction.html
Personal Computer Biomatters http://www.geneious.com/
PowerSYBR qPCR mix ThermoFisher 4367659
Python v. 2.7 https://sco.h-its.org/exelixis/web/software/pear/
Reptile v.1.1 https://alurulab.cc.gatech.edu/reptile
Stratagene Mx3005P Agilent Technologies 401456
TransDecoder v. 3.0.1 https://sourceforge.net/projects/bio-bwa/files/
Trinity v. 2.4.0 https://github.com/TransDecoder/TransDecoder/wiki

Referências

  1. Barh, D., et al. A Novel Comparative Genomics Analysis for Common Drug and Vaccine Targets in Corynebacterium pseudotuberculosis and other CMN Group of Human Pathogens. Chemical Biology & Drug Design. 78 (1), 73-84 (2011).
  2. Sarangi, A. N., Aggarwal, R., Rahman, Q., Trivedi, N. Subtractive Genomics Approach for in Silico Identification and Characterization of Novel Drug Targets in Neisseria Meningitides Serogroup B. Journal of Computer Science & Systems Biology. 2 (5), (2009).
  3. Kaur, N., et al. Identification of Druggable Targets for Acinetobacter baumannii Via Subtractive Genomics and Plausible Inhibitors for MurA and MurB. Applied Biochemistry and Biotechnology. 171 (2), 417-436 (2013).
  4. Rathi, B., Sarangi, A. N., Trivedi, N. Genome subtraction for novel target definition in Salmonella typhi. Bioinformation. 4 (4), 143-150 (2009).
  5. Epstein, J. H., et al. Identification of GBV-D, a Novel GB-like Flavivirus from Old World Frugivorous Bats (Pteropus giganteus) in Bangladesh. PLoS Pathogens. 6 (7), (2010).
  6. Kapoor, A., et al. Identification of Rodent Homologs of Hepatitis C Virus and Pegiviruses. MBio. 4 (2), (2013).
  7. Biederman, M. K., et al. Discovery of the First Germline-Restricted Gene by Subtractive Transcriptomic Analysis in the Zebra Finch, Taeniopygia guttata. Current Biology. 28 (10), 1620-1627 (2018).
  8. Readhead, B., et al. Multiscale Analysis of Independent Alzheimer’s Cohorts Finds Disruption of Molecular, Genetic, and Clinical Networks by Human Herpesvirus. Neuron. 99, 1-19 (2018).
  9. Carroll, D., et al. The global virome project. Science. 359 (6378), 872-874 (2016).
  10. Pigozzi, M. I., Solari, A. J. Germ cell restriction and regular transmission of an accessory chromosome that mimics a sex body in the zebra finch. Taeniopygia guttata. Chromosome Research. 6, 105-113 (1998).
  11. Itoh, Y., Kampf, K., Pigozzi, M. I., Arnold, A. P. Molecular cloning and characterization of the germline-restricted chromosome sequence in the zebra finch. Chromosoma. 118, 527-536 (2009).
  12. Warren, W. C., et al. The genome of a songbird. Nature. 464, 757-762 (2010).
  13. Balakrishnan, C. N., Lin, Y. C., London, S. E., Clayton, D. F. RNAseq transcriptome analysis of male and female zebra finch cell lines. Genomics. 100, 363-369 (2012).
  14. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  15. Zhang, J., Kobert, K., Flouri, T., Stamatakis, A. PEAR: a fast and accurate Illumina Paired-End reAd mergeR. Bioinformatics. 30, 614-620 (2014).
  16. Yang, X., Dorman, K. S., Aluru, S. Reptile: representative tiling for short read error correction. Bioinformatics. 26, 2526-2533 (2010).
  17. MacManes, M. D., Eisen, M. B. Improving transcriptome assembly through error correction of high-throughput sequence reads. PeerJ. 1 (113), (2013).
  18. Grabherr, M. G., et al. Full-length transcriptome assembly from RNA-seq data without a reference genome. Nature Biotechnology. 29, 644-652 (2011).
  19. Li, H. Aligning sequence reads, clone sequences and assembly contigs with BWA-MEM. arXiv. , (2013).
  20. Langmead, B., Salzberg, S. Fast gapped-read alignment with Bowtie 2. Nature Methods. 9, 357-359 (2012).
  21. Kearse, M., et al. Geneious Basic: an integrated and extendable desktop software platform for the organization and analysis of sequence data. Bioinformatics. 28 (12), 1647-1649 (2012).
  22. Peirson, S. N., Butler, J. N. Quantitative polymerase chain reaction. Methods in Molecular Biology. 362, 349-362 (2007).
  23. Hunt, M., Kikuchi, T., Sanders, M., Newbold, C., Berriman, M., Otto, T. D. REAPR citation: REAPR: a universal tool for genome assembly evaluation. Genome Biology. 14 (5), (2013).
  24. Meyer, M., et al. A mitochondrial genome sequence of a hominin from Sima de los Huesos. Nature. 505 (7483), 403-406 (2013).
  25. Gunnarsdóttir, E. D., Li, M., Bauchet, M., Finstermeier, K., Stoneking, M. High-throughput sequencing of complete human mtDNA genomes from the Philippines. Genome Research. 21 (1), 1-11 (2010).
  26. King, J. L., et al. High-quality and high-throughput massively parallel sequencing of the human mitochondrial genome using the Illumina MiSeq. Forensic Science International: Genetics. 12, 128-135 (2014).
  27. Yao, X., et al. The First Complete Chloroplast Genome Sequences in Actinidiaceae: Genome Structure and Comparative Analysis. Plos One. 10 (6), (2015).
  28. Zhang, Y., et al. The Complete Chloroplast Genome Sequences of Five Epimedium Species: Lights into Phylogenetic and Taxonomic Analyses. Frontiers in Plant Science. 7, (2016).
  29. Swart, E. C., et al. The Oxytricha trifallax Mitochondrial Genome. Genome Biologyogy and Evolution. 4 (2), 136-154 (2011).
  30. Barth, D., Berendonk, T. U. The mitochondrial genome sequence of the ciliate Paramecium caudatum reveals a shift in nucleotide composition and codon usage within the genus Paramecium. BMC Genomics. 12 (1), (2011).
  31. Coombe, L., et al. Assembly of the Complete Sitka Spruce Chloroplast Genome Using 10X Genomics’ GemCode Sequencing Data. Plos One. 11 (9), (2016).
  32. Herschleb, J., Ananiev, G., Schwartz, D. C. Pulsed-field gel electrophoresis. Nature Protocols. 2 (3), 677-684 (2007).
check_url/pt/58877?article_type=t

Play Video

Citar este artigo
Asalone, K. C., Nelson, M. M., Bracht, J. R. Novel Sequence Discovery by Subtractive Genomics. J. Vis. Exp. (143), e58877, doi:10.3791/58877 (2019).

View Video