Summary

Eukaryotic जीन मूल की जांच करने के लिए वंशावली विश्लेषण का उपयोग

Published: August 14, 2018
doi:

Summary

prokaryotes से eukaryotes और SemiSWEETs से मिठाइयों के अनुक्रम समरूपता के आधार पर एक वंशावली वृक्ष के निर्माण की एक विधि बताई गई है. वंशावली विश्लेषण मुताबिक़ प्रोटीन या विभिंन जीव समूहों से जीन के बीच विकासवादी संबंधित समझाने के लिए एक उपयोगी उपकरण है ।

Abstract

वंशावली विश्लेषण न्यूक्लियोटाइड या एमिनो एसिड अनुक्रम या ऐसे डोमेन अनुक्रम और तीन आयामी संरचना के रूप में अंय मानकों, का उपयोग करता है, एक पेड़ का निर्माण करने के लिए विभिंन taxa (वर्गीकरण इकाइयों) के बीच में विकास के रिश्ते को दिखाने के लिए आणविक स्तर. वंशावली विश्लेषण भी एक व्यक्ति taxon के भीतर डोमेन संबंधों की जांच करने के लिए इस्तेमाल किया जा सकता है, विशेष रूप से जीव विज्ञान और शरीर विज्ञान में काफी बदलाव आया है के लिए, लेकिन जिसके लिए शोधकर्ताओं के कारण जीवाश्म सबूत कमी ‘ जीवों का लंबे समय से विकासवादी इतिहास या fossilization की किल्लत ।

इस पाठ में, एक विस्तृत प्रोटोकॉल वंशावली विधि का उपयोग कर के लिए वर्णित है, एमिनो एसिड अनुक्रम Clustal ओमेगा का उपयोग संरेखण सहित, और बाद में वंशावली पेड़ निर्माण आणविक विकासवादी आनुवंशिकी की दोनों अधिकतम संभावना (एमएल) का उपयोग विश्लेषण (मेगा) आणि Bayesian निष्कर्ष वाया MrBayes. eukaryotic शर्करा की उत्पत्ति की जांच के लिए अंततः ट्रांसपोर्टरों (मीठा) जीन, २२८ मिठाई सहित ३५ मीठा प्रोटीन से कोशिकीय eukaryotes और ५७ prokaryotes से SemiSWEET प्रोटीन का विश्लेषण किया गया होगा । मजे की बात तो यह है कि prokaryotes में SemiSWEETs पाए गए, लेकिन eukaryotes में मिठाइयां मिलीं । दो वंशावली के पेड़ सैद्धांतिक रूप से अलग तरीकों का उपयोग कर का निर्माण लगातार सुझाव दिया है कि पहली eukaryotic मिठाई जीन एक जीवाणु SemiSWEET जीन और एक archaeal SemiSWEET जीन के संलयन से स्टेम सकता है । यह ध्यान देने योग्य है कि एक वंशावली विश्लेषण पर ही आधारित एक निष्कर्ष आकर्षित सतर्क किया जाना चाहिए, हालांकि यह अलग taxa, जो मुश्किल है या यहां तक कि प्रयोगात्मक माध्यम से विचार असंभव है के बीच अंतर्निहित रिश्ते की व्याख्या उपयोगी है लायक है .

Introduction

डीएनए या आरएनए अनुक्रम अंतर्निहित phenotypes कि शारीरिक और जैव रासायनिक तरीकों के माध्यम से विश्लेषण किया जा सकता है या रूपात्मक और जीवाश्म सबूत के माध्यम से मनाया के लिए आनुवंशिक जानकारी ले । एक मायने में, आनुवंशिक जानकारी बाहरी phenotypes मूल्यांकन से अधिक विश्वसनीय है क्योंकि पूर्व के लिए बाद का आधार है । विकासवादी अध्ययन में, जीवाश्म सबूत बहुत प्रत्यक्ष और कायल है । हालांकि, सूक्ष्मजीवों के रूप में कई जीवों, छोटे लंबे समय से भूगर्भीय उंर के दौरान एक जीवाश्म फार्म का मौका है । इसलिए, संबंधित वद्यमान जीवों से न्यूक्लियोटाइड अनुक्रम और अमीनो अम्ल दृश्यों जैसे आणविक जानकारी, विकासवादी संबंधों की खोज के लिए मूल्य के हैं1. वर्तमान अध्ययन में, बुनियादी वंशावली ज्ञान का एक सरल परिचय और एक आसान प्रोटोकॉल जानने के लिए नए लोगों को जो अपने दम पर एक वंशावली पेड़ के निर्माण की जरूरत के लिए प्रदान किया गया था ।

दोनों डीएनए (न्यूक्लियोटाइड) और प्रोटीन (एमिनो एसिड) अनुक्रम मुताबिक़ जीन, organelles, या यहां तक कि जीवों के बीच वंशावली संबंधों का अनुमान करने के लिए इस्तेमाल किया जा सकता2. डीएनए अनुक्रम विकास के दौरान परिवर्तन से प्रभावित होने की संभावना अधिक हैं । इसके विपरीत, एमिनो एसिड अनुक्रम अधिक है कि न्यूक्लियोटाइड दृश्यों में पर्यायी उत्परिवर्तनों एमिनो एसिड दृश्यों में परिवर्तन का कारण नहीं दिया स्थिर रहे हैं । नतीजतन, डीएनए अनुक्रम बारीकी से संबंधित जीवों से मुताबिक़ जीन की तुलना के लिए उपयोगी होते हैं, जबकि एमिनो एसिड अनुक्रम दूर से संबंधित जीवों से मुताबिक़ जीन के लिए उपयुक्त हैं3.

एक वंशावली विश्लेषण एमिनो एसिड या न्यूक्लियोटाइड के संरेखण के साथ शुरू होता है4 एक व्याख्या जीनोम अनुक्रमण डाटाबेस5 फसता प्रारूप, यानी, ख्यात या व्यक्त प्रोटीन दृश्यों में सूचीबद्ध से प्राप्त की, आरएनए अनुक्रम , या डीएनए जुगाड़ । यह विश्लेषण के लिए उच्च गुणवत्ता वाले दृश्यों को इकट्ठा करने के लिए महत्वपूर्ण है कि ध्यान देने योग्य है, और केवल मुताबिक़ दृश्यों वंशावली रिश्तों का विश्लेषण करने के लिए इस्तेमाल किया जा सकता है । कई विभिंन प्लेटफार्मों जैसे Clustal डब्ल्यू, Clustal एक्स, मांसपेशी, टी कॉफी, MAFFT, अनुक्रम संरेखण के लिए इस्तेमाल किया जा सकता है । सबसे व्यापक रूप से इस्तेमाल किया Clustal ओमेगा6,7 (http://www.ebi.ac.uk/Tools/msa/clustalo/) है, जो ऑनलाइन इस्तेमाल किया जा सकता है या नि: शुल्क डाउनलोड किया जा सकता है । संरेखण उपकरण कई पैरामीटर है कि उपयोगकर्ता संरेखण प्रारंभ करने से पहले समायोजित कर सकते हैं, लेकिन डिफ़ॉल्ट पैरामीटर अधिकांश मामलों में अच्छी तरह से काम करते हैं । प्रक्रिया पूर्ण होने के बाद, संरेखित अनुक्रम अगले चरण के लिए सही स्वरूप में सहेजा जाना चाहिए । वे तो संपादित किया जाना चाहिए या इस तरह के रूप में एक संपादन सॉफ्टवेयर का उपयोग कर छंटनी, संपादित करें, क्योंकि मेगा द्वारा वंशावली पेड़ निर्माण क्रम की आवश्यकता के लिए बराबर लंबाई का होना (दोनों एमिनो एसिड संक्षिप्त और हायफ़न सहित । संरेखित अनुक्रम में, एमिनो एसिड या न्यूक्लियोटाइड के बिना किसी भी स्थिति को एक हायफ़न द्वारा दर्शाया जाता है “-“) । आम तौर पर, फैला हुआ अमीनो एसिड या संरेखण के या तो अंत में न्यूक्लियोटाइड के सभी हटाया जाना चाहिए । इसके अलावा, संरेखण में खराब संरेखित अनुक्रम वाले स्तंभों को हटाया जा सकता है क्योंकि वे कम मूल्यवान जानकारी देते हैं, और कभी-कभार भ्रमित या गलत जानकारी3दे सकते हैं. एक या अधिक हायफ़न वाले स्तंभ इस समय या बाद के ट्री निर्माण अवस्था में हटाए जा सकते हैं । वैकल्पिक रूप से, वे वंशावली अभिकलन के लिए इस्तेमाल किया जा सकता है । अनुक्रम संरेखण और ट्रिमिंग समाप्त होने पर, संरेखित अनुक्रम फसता स्वरूप, या इच्छित स्वरूप में, बाद में उपयोग के लिए सहेजा जाना चाहिए ।

कई सॉफ्टवेयर प्लेटफार्मों विभिन्न तरीकों या एल्गोरिदम का उपयोग पेड़ निर्माण कार्यों प्रदान करते हैं । सामांय में, तरीकों या तो दूरी मैट्रिक्स तरीकों या असतत डेटा तरीकों के रूप में वर्गीकृत किया जा सकता है । दूरी मैट्रिक्स तरीकों सरल और तेजी से गणना कर रहे हैं, जबकि असतत डेटा तरीकों जटिल और समय लेने वाली हैं । एमिनो एसिड या न्यूक्लियोटाइड अनुक्रम पहचान के बंटवारे के एक उच्च डिग्री के साथ बहुत बारीकी से संबंधित taxa के लिए, एक दूरी मैट्रिक्स विधि (पड़ोसी में शामिल होने: एनजे; भारित युग्म समूह विधि के साथ अंकगणित माध्य: UPGMA) उपयुक्त है; दूर से संबंधित taxa के लिए, एक असतत डेटा विधि (अधिकतम संभावना: एमएल; अधिकतम बचत: मप्र; Bayesian अनुमान) इष्टतम है3,8। इस अध्ययन में, मेगा (6.0.6) और Bayesian अनुमान (MrBayes ३.२) में एमएल तरीकों9वंशावली पेड़ के निर्माण के लिए लागू किया गया । आदर्श रूप में, जब उचित मॉडल और मापदंडों का उपयोग किया जाता है, विभिंन तरीकों से व्युत्पंन परिणाम सुसंगत हो सकता है, और वे इस प्रकार अधिक विश्वसनीय और कायल हैं ।

एक एमएल वंशावली पेड़ के लिए मेगा10का उपयोग कर निर्माण, फसता प्रारूप में संरेखित अनुक्रम फ़ाइल प्रोग्राम में अपलोड किया जाना चाहिए । पहला कदम तो अपलोड डेटा के लिए इष्टतम प्रतिस्थापन मॉडल का चयन करने के लिए है । सभी उपलब्ध प्रतिस्थापन मॉडल की तुलना अपलोड किए गए दृश्यों के आधार पर की जाती है, और उनका अंतिम स्कोर एक परिणाम तालिका में दिखाया जाएगा. सबसे छोटी Bayesian सूचना कसौटी (बीआईसी) स्कोर (तालिका में पहले सूचीबद्ध) के साथ मॉडल का चयन करें, सिफारिश की मॉडल के अनुसार एमएल मापदंडों सेट, और गणना शुरू करते हैं । गणना का समय कई मिनट से कई दिनों के लिए, लोड किए गए डेटा की जटिलता (अनुक्रम और taxa की संख्या की लंबाई) और कंप्यूटर जिस पर प्रोग्राम चलाया जाता है की कार्यक्षमता के आधार पर भिन्न होता है । जब गणना समाप्त हो गया है, एक वंशावली ट्री एक नई विंडो में दिखाया जाएगा । फ़ाइल को “नाम. mat” के रूप में सहेजें । पेड़ की उपस्थिति निर्दिष्ट करने के लिए पैरामीटर स्थापित करने के बाद, एक बार फिर से बचाने के लिए । इस विधि का उपयोग कर, मेगा प्रकाशन ग्रेड वंशावली पेड़ के आंकड़े उत्पंन कर सकते हैं ।

11MrBayes के साथ वृक्ष निर्माण के लिए, पहला कदम के लिए गठबंधन अनुक्रम, जो आम तौर पर फसता प्रारूप में सूचीबद्ध है बदलना है, नेक्सस प्रारूप में (. नेक्स फ़ाइल प्रकार के रूप में) । नेक्सस प्रारूप में फसता फ़ाइलों को बदलने मेगा में संसाधित किया जा सकता है. अगला, nexus स्वरूप में संरेखित अनुक्रम को MrBayes में अपलोड किया जा सकता है. फ़ाइल सफलतापूर्वक अपलोड किया गया है, जब ट्री परिकलन के लिए विस्तृत पैरामीटर निर्दिष्ट करें । इन मापदंडों जैसे एमिनो एसिड प्रतिस्थापन मॉडल, भिंनता दरों, मार्कोव चेन मोंटे कार्लो (एमसीएमसी) युग्मन, ngen संख्या, विभाजन आवृत्तियों की औसत मानक विचलन, और इतने पर के लिए श्रृंखला संख्या के रूप में विवरण शामिल हैं । इन पैरामीटर्स को निर्दिष्ट करने के बाद, परिकलन प्रारंभ करें । अंत में, ए एस सी द्वितीय कोड में दो पेड़ के आंकड़े, एक पहने हुए विश्वसनीयता और अंय दिखा शाखा लंबाई दिखा, स्क्रीन पर प्रदर्शित किया जाएगा ।

ट्री परिणाम “फ़ाइल नाम. नेक्स. con” के रूप में स्वचालित रूप से सहेजा जाएगा. इस पेड़ फ़ाइल खोला और FigTree द्वारा संपादित किया जा सकता है, और FigTree में प्रदर्शित आंकड़ा इसे और अधिक प्रकाशन के लिए उपयुक्त बनाने के लिए संशोधित किया जा सकता है ।

इस अध्ययन में prokaryotes से कोशिकीय eukaryotes और ५७ SemiSWEETs से ३५ मिठाइयों सहित २२८ मीठे प्रोटीन्स का उदाहरण के रूप में विश्लेषण किया गया । मिठाई और SemiSWEETs दोनों झिल्ली12,13भर में ग्लूकोज, फ्रुक्टोज, या सुक्रोज ट्रांसपोर्टरों के रूप में विशेषता थी । वंशावली विश्लेषण से पता चलता है कि दो MtN3/लार डोमेन मिठाई युक्त एक जीवाणु SemiSWEET के एक विकासवादी संलयन से प्राप्त किया जा सकता है और एक archaeon14की ।

Protocol

1. अनुक्रम संरेखण अलग दस्तावेजों में eukaryotic मिठाई और prokaryotic SemiSWEET के एमिनो एसिड दृश्यों को इकट्ठा करने और उन्हें फसता प्रारूप में सूची । जैव प्रौद्योगिकी सूचना (NCBI), यूरोपीय आणविक जीवविज्ञान प्रयोगशाला …

Representative Results

वंशावली पेड़ बताते है कि पहले MtN3 के सभी/३५ मीठा अनुक्रम के सभी एक पहने और दूसरी MtN3 के रूप में संकुल एक और पहने के रूप में संकुल मिठाई की लार डोमेन । इसके अलावा, मिठाई और SemiSWEETs शो के संरेखण परिणाम ह?…

Discussion

यह जैविक अनुसंधान में तेजी से लोकप्रिय होता जा रहा है न्यूक्लियोटाइड या एमिनो एसिड अनुक्रम8पर आधारित एक वंशावली पेड़ बनाने के लिए । आम तौर पर, वहां तीन महत्वपूर्ण चरणों का अभ्यास सहित अनुक्रम …

Disclosures

The authors have nothing to disclose.

Acknowledgements

इस काम के राष्ट्रीय प्राकृतिक विज्ञान फाउंडेशन द्वारा समर्थित किया गया था चीन (३१३७१५९६), जैव प्रौद्योगिकी अनुसंधान केंद्र, चीन तीन घाटियों विश्वविद्यालय (2016KBC04), और Jiangsu प्रांत के प्राकृतिक विज्ञान फाउंडेशन, चीन (BK20151424) ।

Materials

Adobe Illustration a graphical tool developed by Adobe Systems Software Ireland Ltd. Copyright © 2017
BioEdit a biological sequence alignment editor written for Windows 95/98/NT/2000/XP/7. Copyright © Tom Hall
Clustal Omega a package for making multiple sequence alignments of amino acid or nucleotide sequences.  http://www.clustal.org/
CorelDRAW a graphic design software. Copyright © 2017 Corel Corporation
FigTree a graphical viewer of phylogenetic trees designed by the University of Edinburgh
MEGA MolecularEvolutionary Genetics Analysis version6.0 http://www.megasoftware.net/home
MrBayes an Bayesian phylogenetic inference tool
NVIDIA a company designs graphics processing units (GPUs) for the gaming and professional markets. Corporation Copyright © 2017
PAUP Phylogenetic Analysis Using Parsimony. David Swofford's program implements the maximum likelihood method under a number of nucleotide models.
Photoshop a raster graphics editor developed and published by Adobe Systems Software Ireland Ltd. Copyright © 2017
RHYTHM a knowledge based prediction of hekix contacts. Charité Berlin – Protein Formatics Group – Copyright 2007-2009
TMHMM a tool for prediction of transmembrane helices in proteins. http://www.cbs.dtu.dk/services/TMHMM/
Compter 4GB memory, Core 2 or above CPU. Windows 7, Windows 10

References

  1. Nei, M., Kumar, S. . Molecular Evolution and Phylogenetics. , (2000).
  2. Foth, B. J. Phylogenetic analysis to uncover organellar origins of nuclear-encoded genes. Methods Mol Biol. 390, 467-488 (2007).
  3. Baldauf, S. L. Phylogeny for the faint of heart: a tutorial. Trends Genet. 19, 345-351 (2003).
  4. Feng, D. F., Doolittle, R. F. Progressive sequence alignment as a prerequisite to correct phylogenetic trees. J Mol Evol. 25, 351-360 (1987).
  5. Persson, B. Bioinformatics in protein analysis. EXS. 88, 215-231 (2000).
  6. Sievers, F., et al. Fast, scalable generation of high-quality protein multiple sequence alignments using Clustal Omega. Mol Syst Biol. 7, 539 (2011).
  7. Sievers, F., Higgins, D. G. Clustal omega. Curr Protoc Bioinformatics. 48, 1-16 (2014).
  8. Yang, Z., Rannala, B. Molecular phylogenetics: principles and practice. Nat Rev Genet. 13, 303-314 (2012).
  9. Hall, B. G. Comparison of the accuracies of several phylogenetic methods using protein and DNA sequences. Mol Biol Evol. 22, 792-802 (2005).
  10. Tamura, K., Stecher, G., Peterson, D., Filipski, A., Kumar, S. MEGA6: Molecular Evolutionary Genetics Analysis version 6.0. Mol Biol Evol. 30, 2725-2729 (2013).
  11. Ronquist, F., et al. MrBayes 3.2: efficient Bayesian phylogenetic inference and model choice across a large model space. Syst Biol. 61, 539-542 (2012).
  12. Chen, L. Q., et al. Sugar transporters for intercellular exchange and nutrition of pathogens. Nature. 468, 527-532 (2010).
  13. Xuan, Y., et al. Functional role of oligomerization for bacterial and plant SWEET sugar transporter family. Proc Natl Acad Sci USA. 110, 3685-3694 (2013).
  14. Hu, Y., et al. Phylogenetic evidence for a fusion of archaeal and bacterial SemiSWEETs to form eukaryotic SWEETs and identification of SWEET hexose transporters in the amphibian chytrid pathogen Batrachochytrium dendrobatidis. FASEB J. 30, 3644-3654 (2016).
  15. Holder, M. T., Zwickl, D. J., Dessimoz, C. Evaluating the robustness of phylogenetic methods to among-site variability in substitution processes. Philos Trans R Soc Lond B Biol Sci. 363, 4013-4021 (2008).
  16. Alfaro, M. E., Holder, M. T. The Posterior and the Prior in Bayesian Phylogenetics. Annu Rev Ecol Evol Syst. 37, 19-42 (2006).
  17. Suchard, M., Rambaut, A. Many-core algorithms for statistical phylogenetics. Bioinformatics. 25, 1370-1376 (2009).
  18. Zierke, S., Bakos, J. FPGA acceleration of the phylogenetic likelihood function for Bayesian MCMC inference methods. BMC Bioinformatics. 11, 184 (2010).
check_url/kr/56684?article_type=t

Play Video

Cite This Article
Zhang, D., Kan, X., Huss, S. E., Jiang, L., Chen, L., Hu, Y. Using Phylogenetic Analysis to Investigate Eukaryotic Gene Origin. J. Vis. Exp. (138), e56684, doi:10.3791/56684 (2018).

View Video