Summary

באמצעות ניתוח פילוגנטי לחקור האיקריוטים מקור גנטי

Published: August 14, 2018
doi:

Summary

מתוארת שיטה של בניית עץ פילוגנטי בהתבסס על הומולוגיה רצף של ממתקים פרוקריוטים, SemiSWEETs של אאוקריוטים. ניתוח פילוגנטי הוא כלי שימושי עבור המסביר את relatedness האבולוציוני בין חלבונים הומולוגיים או גנים מקבוצות אורגניזם שונים.

Abstract

ניתוח פילוגנטי משתמש נוקלאוטיד או רצפי חומצות אמינו או פרמטרים אחרים, כגון תחום רצפים ומבנה תלת מימדי, לבנות עץ כדי להראות את הקשר האבולוציוני בין taxa שונים (סיווג יחידות) מולקולרית רמה. ניתוח פילוגנטי יכול לשמש גם כדי לחקור תחום היחסים טקסון בודדים, במיוחד עבור אורגניזמים שעברו משמעותי לשנות מורפולוגיה ופיזיולוגיה, אך עבור חוקרים אשר חוסר ראייה פוסיליים בשל של אורגניזמים היסטוריה אבולוציונית זמן או מחסור של התאבנות.

בטקסט הזה, מתואר פרוטוקול מפורט עבור שימוש בשיטת פילוגנטי, כולל עימוד רצפים חומצת אמינו באמצעות אומגה Clustal ובניית עץ פילוגנטי עוקבות באמצעות שני המרבי הסבירות (ML) של גנטיקה מולקולרית אבולוציונית ניתוח (מגה), מסקנה בייסיאניות ויה MrBayes. כדי לחקור את המקור של גנים סוכרים יהיה בסופו של דבר להיות מובילי מיוצאים (מתוק) האיקריוטים, נותחו 228 סוויטס כולל 35 מתוק מהחלבונים פרוקריוטים חד־תאיות וחלבונים SemiSWEET 57 מ אאוקריוטים. מעניין, SemiSWEETs נמצאו אאוקריוטים, אך מתוקים נמצאו פרוקריוטים. שני העצים פילוגנטי נבנו תוך שימוש בשיטות שונות באופן תיאורטי הראו באופן עקבי כי הגן הראשון מתוק האיקריוטים שאולי נובעים הפיוז’ן של הגן SemiSWEET חיידקי וג’ין SemiSWEET archaeal. ראוי לציין שאת זה. צריך להיות זהיר כדי לצייר מסקנה בהתבסס רק על ניתוח פילוגנטי, למרות זה שימושי להסביר את הקשר הבסיסי בין taxa שונים, אשר קשה או אפילו בלתי אפשרי להבחין באמצעים ניסיוני .

Introduction

רצפי ה-DNA או RNA נושא מידע גנטי של פנוטיפים הבסיסי שניתן מנותח באמצעות שיטות פיזיולוגית ביוכימית או שנמדדו באמצעות ראייה פוסיליים מורפולוגיים. במובן מסוים, מידע גנטי אמינה יותר מאשר הערכת פנוטיפים חיצוני משום שהראשון הוא הבסיס האחרון. במחקר התפתחותי, המאובנים היא מאוד ישירה ומשכנע. אולם, אורגניזמים רבים, כגון מיקרואורגניזמים, יש סיכוי קטן כדי ליצור מאובן במהלך הדורות זמן גיאולוגית. לכן, מידע מולקולרי כגון רצפי חומצת אמינו רצפים של אורגניזמים הקיימים קשורים הם בעלי ערך עבור חקר יחסים אבולוציונית1. במחקר הנוכחי, הקדמה פשוטה של בסיסי ידע פילוגנטי, פרוטוקול קל-כדי-ללמוד סופקה עבור עולים חדשים אשר צריך לבנות עץ פילוגנטי בכוחות עצמם.

דנ א (נוקלאוטיד) והן רצפי חלבונים (חומצות אמינו) ניתן להסיק פילוגנטי קשרי הגומלין בין הגנים הומולוגיים, organelles או אפילו אורגניזמים2. רצפי DNA נוטים יותר להיות מושפע משינויים במהלך האבולוציה. לעומת זאת, רצפים של חומצות אמיניות הם הרבה יותר יציבה, בהתחשב בכך נרדף מוטציות ברצפים נוקלאוטיד אינם גורמים מוטציות ברצפים חומצת אמינו. כתוצאה מכך, רצפי DNA שימושיים השוואה של הגנים הומולוגי אורגניזמים הקשורים קשר הדוק, ואילו חומצת אמינו רצפים מתאימים עבור גנים הומולוגי אורגניזמים רחוקים קשורות3.

ניתוח פילוגנטי מתחיל עם היישור של חומצת אמינו או רצפי נוקלאוטיד4 שאוחזר מהגנום מוערת רצף מסד הנתונים5 המפורטים FASTA תבנית, קרי, חלבון בשם או ביטוי רצפים, רצפי RNA , או רצפי DNA. ראוי לציין כי זה קריטי כדי לאסוף רצפים באיכות גבוהה לניתוח, רצפים הומולוגיים רק יכול לשמש כדי לנתח קשרי גומלין פילוגנטי. פלטפורמות שונות רבות כגון Clustal W, Clustal X, שריר, T-קפה, MAFFT, יכול לשמש עבור עימוד רצפים. בשימוש נרחב ביותר הוא Clustal אומגה6,7 (http://www.ebi.ac.uk/Tools/msa/clustalo/), אשר יכול לשמש באינטרנט או ניתן להוריד ללא תשלום תשלום. הכלי יישור כולל פרמטרים רבים, המשתמש יכול לשנות לפני שמתחילים את היישור, אך הפרמטרים של ברירת המחדל פועלות היטב ברוב המקרים. לאחר השלמת התהליך, יש לשמור את רצפי מסודרים בתבנית הנכונה עבור השלב הבא. הם יש ואז לערוך או חיתוך באמצעות תוכנת עריכת, כגון BioEdit, כי עץ פילוגנטי בנייה על ידי מגה דורש את רצפי להיות באורך שווה (כולל קיצורים חומצת אמינו והן מקפים. ברצף מיושר, בכל תנוחה ללא חומצת אמינו או נוקלאוטיד מיוצג על ידי מקף “-“). באופן כללי, כל חומצות אמינו בולטות או נוקלאוטידים בשני צידי היישור יש להסיר. בנוסף, ניתן למחוק עמודות המכילות רצפי לקוי מיושר היישור כי הם מעבירים מידע בעל ערך קטן, לפעמים יכול לתת מידע מבלבל או שקר3. ניתן למחוק את העמודות המכילות מקפים אחד או יותר בשלב זה או עץ בנייה בשלב מאוחר יותר. לחלופין, הם יכולים לשמש לחישוביות פילוגנטי. עימוד רצפים של זמירה תסתיים, יש לשמור את רצפי מיושר FASTA בתבנית, או את התבנית הרצויה, לשימוש מאוחר יותר.

פלטפורמות תוכנה רבות המספקות פונקציות בניה עץ באמצעות שיטות שונות או אלגוריתמים. באופן כללי, ניתן לסווג את השיטות שיטות מטריצה מרחק או שיטות נתונים בדיד. שיטות מטריצה מרחק הן פשוטה ומהירה כדי לחשב, ואילו שיטות נתונים בדיד מורכב ולגזול. עבור taxa הקשורים קשר הדוק מאוד עם רמה גבוהה של שיתוף של חומצת אמינו או נוקלאוטיד רצף הזהות, שיטה מטריקס מרחק (שכן הצטרפות: NJ; Unweighted שיטת קבוצה זוג עם ממוצע אריתמטי: UPGMA) הוא המתאים; עבור קרובים רחוקים taxa, שיטה נתונים בדיד (נראות מקסימלית: ML; בהססנות מרבי: MP; מסקנה בייסיאניות) היא אופטימלית3,8. במחקר זה, השיטות ML מגה (6.0.6), מסקנה בייסיאני (MrBayes 3.2) הוחלו לבנות עצים פילוגנטי9. באופן אידיאלי, כאשר המודל הנכון לבין פרמטרים משמשים, התוצאות נגזר שיטות שונות עלולות להיות עקבי, והם לכן אמין ומשכנע יותר.

עבור עץ פילוגנטי ML נבנה באמצעות מגה10, יש אפשרות לטעון את הקובץ רצף מסודרים בתבנית FASTA לתוכנית. הצעד הראשון ואז היא לבחור דגם החלפת אופטימלית עבור הנתונים שהועלה. כל הדגמים זמינים החלפת מושווים בהתבסס על הרצף שהועלה, הציונים הסופי שלהם יוצג בטבלה התוצאות. בחר את הדגם עם הציון בקריטריון מידע בייסיאני (המזרחי) הקטן ביותר (מופיע תחילה בטבלה), לקבוע פרמטרים ML לפי הדגם המומלץ, ולהתחיל חישוב. חישוב הזמן משתנה בין מספר דקות עד מספר ימים, בהתאם למורכבות של הנתונים טעון (אורך של רצפים, מספר taxa) ואת הביצועים של המחשב שבו מופעלות התוכניות. חישוב תסתיים, עץ פילוגנטי יוצג בחלון חדש. שמור את הקובץ בשם “FileName.mat”. לאחר הגדרת פרמטרים כדי לציין את המראה של העץ, לשמור פעם נוספת. באמצעות שיטה זו, מגה ניתן להפיק הפרסום כיתה עץ פילוגנטי דמויות.

לבנייה בעץ עם MrBayes11, הצעד הראשון הוא לשנות את רצף מיושר, אשר בדרך כלל מופיע בתבנית FASTA, לפורמט נקסוס (.nex כסוג קובץ). הפיכת FASTA קבצים לפורמט nexus ניתן יהיה לעבד מגה. לאחר מכן, ניתן להעלות את רצף מסודרים בתבנית נקסוס לתוך MrBayes. כאשר הקובץ מועלה בהצלחה, ציין פרמטרים מפורטים עבור חישוב עץ. פרמטרים אלה יש לכלול פרטים כגון דגם החלפת חומצת אמינו, וריאציה המחירים, שרשרת מספר עבור שרשרת מרקוב מונטה קרלו mcmc (ב) מצמד, מספר ngen, הממוצע סטיית התקן של פיצול התדרים, וכן הלאה. לאחר פרמטרים אלה צוינו, מתחילים חישוב. בסופו של דבר, שתי דמויות עץ קוד ASC II, מראה קלייד אמינות, אחרים מראה סניף המרחק, יוצג על המסך.

התוצאה עץ יישמרו באופן אוטומטי כמו “FileName.nex.con”. קובץ זה עץ ניתן לפתוח ולערוך מאת FigTree, ניתן לשנות את הדמות המוצגת FigTree נוספת כדי להפוך אותו מתאים יותר לפרסום.

במחקר זה, 228 חלבונים מתוק, כולל 35 מ פרוקריוטים חד־תאיות וממתקים SemiSWEETs 57 מ אאוקריוטים, נותחו כדוגמה. ממתקים והן SemiSWEETs מאופיינים גלוקוז, פרוקטוז או סוכרוז מובילי מעבר ממברנות12,13. ניתוח פילוגנטי עולה כי שני התחומים MtN3/רוק המכיל ממתקים עשוי להיגזר פיוז ‘ ן אבולוציונית של חיידקי SemiSWEET ועורות של archaeon14.

Protocol

1. עימוד רצפים לאסוף את רצפי החומצות של מתוקים האיקריוטים SemiSWEET prokaryotic במסמכים נפרדים ולפרט אותם בתבנית FASTA. להוריד רצפים של המרכז הארצי ביוטכנולוגיה מידע (NCBI), המעבדה לביולוגיה מולקולרית האירופית (EMBL) של הבנק נתונים הדנ א של מסדי נתונים של יפן (DDBJ) על ידי דמיון חיפוש בעזרת הכלי הבסי…

Representative Results

עצים פילוגנטי להראות כי כל קבוצות MtN3/רוק הראשונה של הרצף מתוק 35 מקובצים באשכולות וגם קלייד אחד התחומים MtN3/רוק השני של הרצף מתוק מקובצים באשכולות כמו קלייד אחר. בנוסף, תוצאות היישור של ממתקים, SemiSWEETs להציג כמה SemiSWEETs של α-פרוטאובקטריה מיושר עם קבוצת המחשבים MtN3/רוק הראשונה של …

Discussion

זה הופך יותר ויותר פופולרי במחקר ביולוגי כדי להפוך עץ פילוגנטי בהתבסס על נוקלאוטיד או רצפי חומצות אמינו8. באופן כללי, ישנם שלושה שלבים קריטיים על המרפאה כולל עימוד רצפים, הערכה של הרצף מיושר עם השיטה הנכונה או אלגוריתם, והדמיה של תוצאה חישובית כמו עץ פילוגנטי. במסגרת המחקר הצי?…

Disclosures

The authors have nothing to disclose.

Acknowledgements

עבודה זו נתמכה על ידי נבחרת מדעי הטבע קרן של סין (31371596), המרכז לחקר ביו-טכנולוגיה, סין שלושת הערוצים האוניברסיטה (2016KBC04), יסודות מדעי הטבע במחוז ג’יאנגסו, סין (BK20151424).

Materials

Adobe Illustration a graphical tool developed by Adobe Systems Software Ireland Ltd. Copyright © 2017
BioEdit a biological sequence alignment editor written for Windows 95/98/NT/2000/XP/7. Copyright © Tom Hall
Clustal Omega a package for making multiple sequence alignments of amino acid or nucleotide sequences.  http://www.clustal.org/
CorelDRAW a graphic design software. Copyright © 2017 Corel Corporation
FigTree a graphical viewer of phylogenetic trees designed by the University of Edinburgh
MEGA MolecularEvolutionary Genetics Analysis version6.0 http://www.megasoftware.net/home
MrBayes an Bayesian phylogenetic inference tool
NVIDIA a company designs graphics processing units (GPUs) for the gaming and professional markets. Corporation Copyright © 2017
PAUP Phylogenetic Analysis Using Parsimony. David Swofford's program implements the maximum likelihood method under a number of nucleotide models.
Photoshop a raster graphics editor developed and published by Adobe Systems Software Ireland Ltd. Copyright © 2017
RHYTHM a knowledge based prediction of hekix contacts. Charité Berlin – Protein Formatics Group – Copyright 2007-2009
TMHMM a tool for prediction of transmembrane helices in proteins. http://www.cbs.dtu.dk/services/TMHMM/
Compter 4GB memory, Core 2 or above CPU. Windows 7, Windows 10

References

  1. Nei, M., Kumar, S. . Molecular Evolution and Phylogenetics. , (2000).
  2. Foth, B. J. Phylogenetic analysis to uncover organellar origins of nuclear-encoded genes. Methods Mol Biol. 390, 467-488 (2007).
  3. Baldauf, S. L. Phylogeny for the faint of heart: a tutorial. Trends Genet. 19, 345-351 (2003).
  4. Feng, D. F., Doolittle, R. F. Progressive sequence alignment as a prerequisite to correct phylogenetic trees. J Mol Evol. 25, 351-360 (1987).
  5. Persson, B. Bioinformatics in protein analysis. EXS. 88, 215-231 (2000).
  6. Sievers, F., et al. Fast, scalable generation of high-quality protein multiple sequence alignments using Clustal Omega. Mol Syst Biol. 7, 539 (2011).
  7. Sievers, F., Higgins, D. G. Clustal omega. Curr Protoc Bioinformatics. 48, 1-16 (2014).
  8. Yang, Z., Rannala, B. Molecular phylogenetics: principles and practice. Nat Rev Genet. 13, 303-314 (2012).
  9. Hall, B. G. Comparison of the accuracies of several phylogenetic methods using protein and DNA sequences. Mol Biol Evol. 22, 792-802 (2005).
  10. Tamura, K., Stecher, G., Peterson, D., Filipski, A., Kumar, S. MEGA6: Molecular Evolutionary Genetics Analysis version 6.0. Mol Biol Evol. 30, 2725-2729 (2013).
  11. Ronquist, F., et al. MrBayes 3.2: efficient Bayesian phylogenetic inference and model choice across a large model space. Syst Biol. 61, 539-542 (2012).
  12. Chen, L. Q., et al. Sugar transporters for intercellular exchange and nutrition of pathogens. Nature. 468, 527-532 (2010).
  13. Xuan, Y., et al. Functional role of oligomerization for bacterial and plant SWEET sugar transporter family. Proc Natl Acad Sci USA. 110, 3685-3694 (2013).
  14. Hu, Y., et al. Phylogenetic evidence for a fusion of archaeal and bacterial SemiSWEETs to form eukaryotic SWEETs and identification of SWEET hexose transporters in the amphibian chytrid pathogen Batrachochytrium dendrobatidis. FASEB J. 30, 3644-3654 (2016).
  15. Holder, M. T., Zwickl, D. J., Dessimoz, C. Evaluating the robustness of phylogenetic methods to among-site variability in substitution processes. Philos Trans R Soc Lond B Biol Sci. 363, 4013-4021 (2008).
  16. Alfaro, M. E., Holder, M. T. The Posterior and the Prior in Bayesian Phylogenetics. Annu Rev Ecol Evol Syst. 37, 19-42 (2006).
  17. Suchard, M., Rambaut, A. Many-core algorithms for statistical phylogenetics. Bioinformatics. 25, 1370-1376 (2009).
  18. Zierke, S., Bakos, J. FPGA acceleration of the phylogenetic likelihood function for Bayesian MCMC inference methods. BMC Bioinformatics. 11, 184 (2010).
check_url/56684?article_type=t

Play Video

Cite This Article
Zhang, D., Kan, X., Huss, S. E., Jiang, L., Chen, L., Hu, Y. Using Phylogenetic Analysis to Investigate Eukaryotic Gene Origin. J. Vis. Exp. (138), e56684, doi:10.3791/56684 (2018).

View Video