Summary

باستخدام تحليل النشوء والتطور للتحقيق التوكسينات الجينات الأصل

Published: August 14, 2018
doi:

Summary

يتم وصف أسلوب بناء شجرة النشوء والتطور استناداً إلى تسلسل التماثل من الحلويات من حقيقيات النوى وسيميسويتس من بدائيات النوى. تحليل النشوء والتطور أداة مفيدة لشرح شمولية التطورية بين البروتينات المتجانسة أو الجينات من مجموعات مختلفة من الكائنات الحية.

Abstract

يستخدم تحليل النشوء والتطور النوكليوتيدات أو سلاسل الأحماض الأمينية أو معايير أخرى، مثل تسلسل المجال وهيكل ثلاثي الأبعاد، لإنشاء شجرة لإظهار العلاقة التطورية بين الأنواع المختلفة (وحدات التصنيف) في الجزيئية المستوى. يمكن أيضا استخدام تحليل النشوء والتطور للتحقيق في مجال العلاقات داخل الأصناف فردية، لا سيما لتغيير الكائنات الحية التي خضعت لكبيرة في مورفولوجيا وفسيولوجيا، ولكن للباحثين التي تفتقر إلى الأدلة الأحفورية نظراً تاريخ طويل من تطور الكائنات الحية أو ندرة التحجر.

ويرد في هذا النص، بروتوكول مفصل لاستخدام أسلوب النشوء والتطور، بما في ذلك الأحماض الأمينية تسلسل المحاذاة باستخدام أوميغا كلوستال، وبناء شجرة النشوء والتطور اللاحق باستخدام كلا أقصى احتمال (ML) علم “الوراثة الجزيئية التطورية” تحليل (ميجا) واستدلال النظرية الافتراضية عن طريق مرباييس. للتحقيق في أصل الجينات السكريات ستقوم في نهاية المطاف أن “الناقلين المصدرة” (الحلو) حقيقية النواة، حللت 228 الحلويات بما في ذلك البروتينات حلوة 35 من حقيقيات النوى أحادي الخلية والبروتينات سيميسويت 57 من بدائيات النوى. من المثير للاهتمام، تم العثور على سيميسويتس في بدائيات النوى، ولكن تم العثور على الحلويات في حقيقيات النوى. واقترح اثنين من الأشجار النشوء والتطور التي شيدت باستخدام أساليب متميزة من الناحية النظرية دائماً أن الجينات الحلوة حقيقية النواة الأولى قد تنبع من الانصهار من جين سيميسويت بكتيرية وجين سيميسويت أرتشايال. تجدر الإشارة إلى أن أحد يجب أن تكون حذرة لاستخلاص النتائج استناداً فقط إلى تحليل النشوء والتطور، على الرغم من أنها مفيدة لتوضيح العلاقة الأساسية بين الأنواع المختلفة، التي من الصعب أو حتى من المستحيل نستشف من خلال الوسائل التجريبية .

Introduction

تسلسل الحمض النووي الريبي أو تحمل المعلومات الوراثية لتعمل الكامنة التي يمكن تحليلها من خلال الأساليب الفسيولوجية والبيوكيميائية أو لاحظت من خلال أدلة المورفولوجية والوقود الأحفوري. بمعنى، المعلومات الجينية أكثر موثوقية من تقييم خارجي تعمل لأن السابق هو الأساس لهذا الأخير. وفي دراسة تطورية، الأدلة الأحفورية مباشرة ومقنعة جداً. ومع ذلك، العديد من الكائنات الحية، مثل الكائنات المجهرية، لديهم فرصة ضئيلة لتشكيل الأحفوري خلال العصور الجيولوجية منذ فترة طويلة. ولذلك، المعلومات الجزيئية مثل تسلسل النوكليوتيدات وسلاسل الأحماض الأمينية من الكائنات الموجودة ذات الصلة ذات قيمة لاستكشاف العلاقات التطورية1. في هذه الدراسة، وقدمت مقدمة بسيطة من المعارف الأساسية في النشوء والتطور وبروتوكولا سهلة لتعلم للقادمين الجدد الذين هم بحاجة إلى بناء شجرة النشوء والارتقاء بأنفسهم.

يمكن استخدام الحمض النووي (النوكليوتيدات) وتسلسل البروتين (الأحماض الأمينية) استنتاج العلاقات النشوء والتطور بين الجينات مثلى أو العضيات، أو حتى الكائنات الحية2. تسلسل الحمض النووي من المرجح أن تتأثر بالتغييرات أثناء تطور. وفي المقابل، سلاسل الأحماض الأمينية أكثر استقرارا نظراً لأن الطفرات مترادفين في تسلسل النوكليوتيدات لا تسبب طفرات في سلاسل الأحماض الأمينية. نتيجة لذلك تسلسل الحمض النووي مفيدة لمقارنة الجينات مثلى من الكائنات ذات صلة وثيقة، في حين سلاسل الأحماض الأمينية المناسبة للجينات مثلى من الكائنات ذات الصلة بعيد3.

يبدأ تحليل النشوء والتطور مع المحاذاة للأحماض الأمينية أو النوكليوتيدات تسلسل4 تم استردادها من جينوم مشروح تسلسل قاعدة بيانات5 المدرجة في تنسيق فاستا، أي، البروتين المفترضة أو أعربت عن تسلسل، تسلسل الحمض النووي الريبي ، أو تسلسل الحمض النووي. تجدر الإشارة إلى أن من الأهمية بمكان لجمع متواليات عالية الجودة للتحليل، ويمكن استخدام تسلسل فقط مثلى لتحليل العلاقات النشوء والتطور. العديد من منصات مختلفة مثل W كلوستال، س كلوستال، العضلات، تي-القهوة، مفت، يمكن أن تستخدم لمحاذاة التسلسل. الأكثر استخداماً هو أوميغا كلوستال6،7 (http://www.ebi.ac.uk/Tools/msa/clustalo/)، التي يمكن استخدامها على الإنترنت أو يمكن تحميلها مجاناً من التهمة. أداة المحاذاة لها العديد من المعلمات التي يمكن للمستخدم ضبط قبل البدء المحاذاة، ولكن المعلمات الافتراضية تعمل جيدا في معظم الحالات. بعد الانتهاء من هذه العملية، يجب حفظ تسلسل تمت محاذاته بالشكل الصحيح للخطوة التالية. أنها ينبغي أن تكون ثم تحريرها أو قلصت استخدام برامج تحرير، مثل بيوديت، لأنه يتطلب بناء شجرة النشوء والتطور من ميجا في التسلسل تكون متساوية الطول (بما في ذلك الاختصارات من الأحماض الأمينية والواصلات. وفي التسلسل الذي تمت محاذاته، تمثل أي موقف دون الأحماض الأمينية أو النوكليوتيدات واصلة “-“). عموما، يجب إزالة كافة الأحماض الأمينية بارزة أو النيوكليوتيدات على حد سواء للمحاذاة. وبالإضافة إلى ذلك، يمكن حذف الأعمدة التي تحتوي على تسلسلات الانحياز سيئة في المحاذاة لأنها تنقل سوى القليل من المعلومات القيمة، ويمكن في بعض الأحيان إعطاء معلومات كاذبة أو الخلط بين3. يمكن حذف الأعمدة التي تحتوي على واصلات واحد أو أكثر في هذا الوقت أو في مرحلة لاحقة بناء شجرة. وبدلاً من ذلك، يمكن استخدامها لحساب النشوء والتطور. عند الانتهاء من تسلسل المحاذاة والتشذيب، يجب حفظ تسلسل المنحازة في شكل فاستا، أو بالشكل المرغوب فيه، لاستخدامها في وقت لاحق.

توفير منصات البرمجيات العديد من مهام بناء شجرة باستخدام أساليب مختلفة أو خوارزميات. وبصفة عامة، يمكن تصنيف الأساليب كأساليب مصفوفة المسافة أو أساليب البيانات المنفصلة. أساليب مصفوفة مسافة بسيطة وسريعة لحساب، بينما أساليب البيانات المنفصلة معقدة وتستغرق وقتاً طويلاً. للأصناف المتصلة بشكل وثيق جداً مع درجة عالية من تقاسم هوية تسلسل الأحماض الأمينية أو النوكليوتيدات، أسلوب مصفوفة مسافة (الانضمام إلى جاره: نيوجيرسي؛ أسلوب المجموعة زوج مرجحة مع الوسط الحسابي: أوبجما) هو مناسب؛ للأصناف ذات الصلة بعيد، أسلوب بيانات منفصلة (الحد الأقصى لاحتمال: مل؛ الحد الأقصى من التقتير: بروتوكول مونتريال؛ استدلال النظرية الافتراضية) هو الأمثل3،8. في هذه الدراسة، طبقت أساليب مل في ميجا (6.0.6) واستدلال النظرية الافتراضية (3.2 مرباييس) لبناء9من أشجار النشوء والتطور. ومن الناحية المثالية، عند استخدام النموذج المناسب والمعلمات، قد تكون النتائج المستمدة من الأساليب المختلفة متسقا، وهم لذلك أكثر موثوقة ومقنعة.

لشجرة مل النشوء والتطور التي شيدت باستخدام ميجا10، يجب تحميل الملف تسلسل تمت محاذاته بتنسيق فاستا في البرنامج. ثم الخطوة الأولى لتحديد النموذج البديل الأمثل للبيانات الذي تم تحميله. تتم مقارنة جميع النماذج البديلة المتاحة استناداً إلى التسلسل الذي تم تحميله، وسيظهر نتائجهم النهائية في جدول نتائج. حدد النموذج مع نقاط معيار المعلومات النظرية الافتراضية (BIC) أصغر (سرد أولاً في الجدول) وتعيين معلمات مل وفقا لنموذج الموصى بها وبدء العملية الحسابية. حساب الوقت يختلف من عدة دقائق إلى عدة أيام، اعتماداً على مدى تعقيد البيانات المحملة (طول تسلسل وعدد الأصناف) وأداء جهاز الكمبيوتر الذي يتم تشغيل البرامج. عند الانتهاء من العملية الحسابية، سيظهر شجرة النشوء والتطور في نافذة جديدة. احفظ الملف ك “FileName.mat”. بعد إعداد المعلمات تحديد مظهر الشجرة، حفظ مرة أخرى. باستخدام هذا الأسلوب، يمكن أن تولد ميجا المنشور الصف أرقام شجرة النشوء والتطور.

لبناء شجرة مع مرباييس11، هو الخطوة الأولى لتحويل التسلسل الذي تمت محاذاته، التي ترد عادة في شكل فاستا، في العلاقة بين (.nex كنوع الملف). تحويل ملفات فاستا إلى تنسيق العلاقة يمكن معالجتها في ميجا. المقبل، يمكن تحميل التسلسل الذي تمت محاذاته بتنسيق العلاقة بين إلى مرباييس. عندما يتم تحميل الملف بنجاح، تحديد معلمات مفصلة لحساب شجرة. هذه المعلمات تتضمن تفاصيل مثل نموذج استبدال حمض أميني، معدلات التغير، وعدد سلسلة لسلسلة ماركوف مونتي كارلو (MCMC) اقتران، عدد ngen، متوسط الانحراف المعياري لتقسيم الترددات، وهلم جرا. بعد أن تم تحديد هذه المعلمات، البدء في العملية الحسابية. وفي النهاية، سيتم عرض الرقمين شجرة في التعليمات البرمجية الثاني ASC ومصداقية طور عرض واحد وأطوال فرع أخرى تظهر، على الشاشة.

سيتم حفظ ثمرة شجرة تلقائياً ك “FileName.nex.con”. يمكن فتح هذا الملف شجرة وحرره التين، ويمكن تعديل هذا الرقم المعروض في التين كذلك لجعله أكثر ملاءمة للنشر.

في هذه الدراسة، تم تحليل البروتينات الحلو 228، بما في ذلك 35 من حقيقيات النوى أحادي الخلية وحلويات سيميسويتس 57 من بدائيات النوى، كمثال. الحلويات وسيميسويتس على السواء وصفت بأنها الغلوكوز أو سكر السكروز الناقلين عبر أغشية12،13. ويوحي تحليل النشوء والتطور أن المجالين MtN3/اللعاب الذي يحتوي على حلويات قد تكون مستمدة من انصهار تطوري سيميسويت البكتيرية، وأرتشايون14.

Protocol

1-تسلسل المحاذاة جمع سلاسل الأحماض الأمينية حلوة حقيقية النواة وبدائية النواة سيميسويت في وثائق منفصلة وقائمة لهم في شكل FASTA. تحميل تسلسل من المركز الوطني لمعلومات التكنولوجيا الحيوية (نكبي)، ومختبر علم الأحياء الجزيئي الأوروبي (EMBL)، و “مصرف بيانات الحمض النووي” لليابان (دبي) قوا?…

Representative Results

أشجار النشوء والتطور تظهر كافة المجالات MtN3/اللعاب أول تسلسل حلوة 35 متفاوت كطور واحد والمجالات MtN3/اللعاب الثانية تسلسل الحلو متفاوت المسافات كطور آخر. وبالإضافة إلى ذلك، المحاذاة الحلويات وسيميسويتس وتظهر النتائج أن بعض سيميسويتس من α-بروتيوباكتيريا تتماشى مع المجال MtN3…

Discussion

تزداد شعبية في البحوث البيولوجية لجعل شجرة النشوء والتطور على أساس النوكليوتيدات أو الأحماض الأمينية تسلسل8. عموما، هناك ثلاث مراحل حاسمة من هذه الممارسة، بما في ذلك تسلسل المحاذاة، تقييم تسلسل محاذاة مع الأسلوب السليم أو خوارزمية، والتصور للنتيجة الحسابية كشجرة النشوء وال…

Disclosures

The authors have nothing to disclose.

Acknowledgements

وكان يدعمها هذا العمل في مؤسسة العلوم الطبيعية الوطنية الصينية (31371596) ومركز بحوث التكنولوجيا الحيوية وجامعة الصين للخوانق الثلاثة (2016KBC04) ومؤسسة العلوم الطبيعية في مقاطعة جيانغسو، الصين (BK20151424).

Materials

Adobe Illustration a graphical tool developed by Adobe Systems Software Ireland Ltd. Copyright © 2017
BioEdit a biological sequence alignment editor written for Windows 95/98/NT/2000/XP/7. Copyright © Tom Hall
Clustal Omega a package for making multiple sequence alignments of amino acid or nucleotide sequences.  http://www.clustal.org/
CorelDRAW a graphic design software. Copyright © 2017 Corel Corporation
FigTree a graphical viewer of phylogenetic trees designed by the University of Edinburgh
MEGA MolecularEvolutionary Genetics Analysis version6.0 http://www.megasoftware.net/home
MrBayes an Bayesian phylogenetic inference tool
NVIDIA a company designs graphics processing units (GPUs) for the gaming and professional markets. Corporation Copyright © 2017
PAUP Phylogenetic Analysis Using Parsimony. David Swofford's program implements the maximum likelihood method under a number of nucleotide models.
Photoshop a raster graphics editor developed and published by Adobe Systems Software Ireland Ltd. Copyright © 2017
RHYTHM a knowledge based prediction of hekix contacts. Charité Berlin – Protein Formatics Group – Copyright 2007-2009
TMHMM a tool for prediction of transmembrane helices in proteins. http://www.cbs.dtu.dk/services/TMHMM/
Compter 4GB memory, Core 2 or above CPU. Windows 7, Windows 10

References

  1. Nei, M., Kumar, S. . Molecular Evolution and Phylogenetics. , (2000).
  2. Foth, B. J. Phylogenetic analysis to uncover organellar origins of nuclear-encoded genes. Methods Mol Biol. 390, 467-488 (2007).
  3. Baldauf, S. L. Phylogeny for the faint of heart: a tutorial. Trends Genet. 19, 345-351 (2003).
  4. Feng, D. F., Doolittle, R. F. Progressive sequence alignment as a prerequisite to correct phylogenetic trees. J Mol Evol. 25, 351-360 (1987).
  5. Persson, B. Bioinformatics in protein analysis. EXS. 88, 215-231 (2000).
  6. Sievers, F., et al. Fast, scalable generation of high-quality protein multiple sequence alignments using Clustal Omega. Mol Syst Biol. 7, 539 (2011).
  7. Sievers, F., Higgins, D. G. Clustal omega. Curr Protoc Bioinformatics. 48, 1-16 (2014).
  8. Yang, Z., Rannala, B. Molecular phylogenetics: principles and practice. Nat Rev Genet. 13, 303-314 (2012).
  9. Hall, B. G. Comparison of the accuracies of several phylogenetic methods using protein and DNA sequences. Mol Biol Evol. 22, 792-802 (2005).
  10. Tamura, K., Stecher, G., Peterson, D., Filipski, A., Kumar, S. MEGA6: Molecular Evolutionary Genetics Analysis version 6.0. Mol Biol Evol. 30, 2725-2729 (2013).
  11. Ronquist, F., et al. MrBayes 3.2: efficient Bayesian phylogenetic inference and model choice across a large model space. Syst Biol. 61, 539-542 (2012).
  12. Chen, L. Q., et al. Sugar transporters for intercellular exchange and nutrition of pathogens. Nature. 468, 527-532 (2010).
  13. Xuan, Y., et al. Functional role of oligomerization for bacterial and plant SWEET sugar transporter family. Proc Natl Acad Sci USA. 110, 3685-3694 (2013).
  14. Hu, Y., et al. Phylogenetic evidence for a fusion of archaeal and bacterial SemiSWEETs to form eukaryotic SWEETs and identification of SWEET hexose transporters in the amphibian chytrid pathogen Batrachochytrium dendrobatidis. FASEB J. 30, 3644-3654 (2016).
  15. Holder, M. T., Zwickl, D. J., Dessimoz, C. Evaluating the robustness of phylogenetic methods to among-site variability in substitution processes. Philos Trans R Soc Lond B Biol Sci. 363, 4013-4021 (2008).
  16. Alfaro, M. E., Holder, M. T. The Posterior and the Prior in Bayesian Phylogenetics. Annu Rev Ecol Evol Syst. 37, 19-42 (2006).
  17. Suchard, M., Rambaut, A. Many-core algorithms for statistical phylogenetics. Bioinformatics. 25, 1370-1376 (2009).
  18. Zierke, S., Bakos, J. FPGA acceleration of the phylogenetic likelihood function for Bayesian MCMC inference methods. BMC Bioinformatics. 11, 184 (2010).
check_url/56684?article_type=t

Play Video

Cite This Article
Zhang, D., Kan, X., Huss, S. E., Jiang, L., Chen, L., Hu, Y. Using Phylogenetic Analysis to Investigate Eukaryotic Gene Origin. J. Vis. Exp. (138), e56684, doi:10.3791/56684 (2018).

View Video