Summary

De novo זיהוי של מסגרות קריאה פתוחות בתרגום פעיל עם נתוני יצירת פרופילים של ריבוזום

Published: February 18, 2022
doi:

Summary

תרגום ריבוזומים מפענח שלושה נוקלאוטידים לכל קודון לפפטידים. תנועתם לאורך mRNA, שנתפסה על ידי פרופיל ריבוזום, מייצרת את העקבות המציגות תקופת שלישייה אופיינית. פרוטוקול זה מתאר כיצד להשתמש RiboCode כדי לפענח תכונה בולטת זו מנתוני פרופיל ריבוזום כדי לזהות מסגרות קריאה פתוחות בתרגום פעיל ברמת התמלול המלא.

Abstract

זיהוי של מסגרות קריאה פתוחות (ORFs), במיוחד אלה קידוד פפטידים קטנים ותרגום פעיל תחת הקשרים פיזיולוגיים ספציפיים, הוא קריטי לביאורים מקיפים של תרגומים תלויי הקשר. פרופיל ריבוזום, טכניקה לזיהוי מיקומים וצפיפות מחייבים של תרגום ריבוזומים ב- RNA, מציע שדרה לגלות במהירות היכן מתרחש תרגום בקנה מידה רחב של הגנום. עם זאת, זה לא משימה טריוויאלית בביואינפורמטיקה לזהות ביעילות ובאופן מקיף את ORFs תרגום עבור פרופיל ריבוזום. מתואר כאן היא חבילה קלה לשימוש, בשם RiboCode, שנועדה לחפש תרגום פעיל ORFs בכל גודל מאותות מעוותים ודו-משמעיים בנתוני פרופיל ריבוזום. אם ניקח את ערכת הנתונים שפורסמה בעבר כדוגמה, מאמר זה מספק הוראות שלב אחר שלב עבור צינור RiboCode כולו, מעיבוד מראש של הנתונים הגולמיים ועד לפרשנות של קבצי תוצאות הפלט הסופיים. יתר על כן, להערכת שיעורי התרגום של ORFs המובאים, הליכים להדמיה וכימות של צפיפות ריבוזום על כל ORF מתוארים גם בפירוט. לסיכום, המאמר הנוכחי הוא הוראה שימושית ומתוזמנת לתחומי המחקר הקשורים לתרגום, ORFs קטנים ופפטידים.

Introduction

לאחרונה, גוף גדל והולך של מחקרים חשף ייצור נרחב של פפטידים שתורגמו מ ORFs של גנים קידוד ואת הגנים ביאורים בעבר כמו noncoding, כגון ארוך noncoding RNAs (lncRNAs)1,2,2,3,4,5,6,7,8. ORFs מתורגמים אלה מוסדרים או מושרים על ידי תאים כדי להגיב לשינויים סביבתיים, מתח, ובידול תאים1,8,9,10,11,12,13. מוצרי התרגום של כמה ORFs הוכחו לשחק תפקידים רגולטוריים חשובים בתהליכים ביולוגיים מגוונים בפיתוח ופיזיולוגיה. לדוגמה, Chng et al.14 גילה הורמון פפטיד בשם Elabela (אלה, הידוע גם בשם Apela / Ende / פעוט), אשר קריטי להתפתחות הלב וכלי הדם. פאולי ואח ‘ הציע כי אלה פועלת גם כמיטוגן המקדם נדידת תאים בעובר הדגים המוקדם15. Magny et al. דיווח על שני micropeptides של פחות מ 30 חומצות אמינו ויסות הובלת סידן ומשפיע על התכווצות שרירים רגילה בלב Drosophila10.

עדיין לא ברור כמה פפטידים כאלה מקודדים על ידי הגנום והאם הם רלוונטיים ביולוגית. לכן, זיהוי שיטתי של ORFs אלה קידוד פוטנציאלי רצוי מאוד. עם זאת, קביעה ישירה של המוצרים של ORFs אלה (כלומר, חלבון או פפטיד) באמצעות גישות מסורתיות כגון שימור אבולוציוני16,17 וספקטרומטריית מסה18,19 היא מאתגרת מכיוון שיעילות הזיהוי של שתי הגישות תלויה באורך, בשפע ובהרכב חומצות האמינו של החלבונים או הפפטידים המיוצרים. הופעתו של פרופיל ריבוזום, טכניקה לזיהוי התפוסה ריבוזום על mRNAs ברזולוציה נוקלאוטיד, סיפקה דרך מדויקת להעריך את פוטנציאל הקידוד של תמלילים שונים3,20,21, ללא קשר לאורכם ולהרכבם. תכונה חשובה ומשמשת לעתים קרובות לזיהוי תרגום פעיל של ORFs באמצעות פרופיל ריבוזום היא תקופת שלושת הנוקלאוטידים (3-nt) של עקבות הריבוזום על mRNA מהקודון ההתחלה ועד קודון העצירה. עם זאת, נתוני פרופיל ריבוזום לעתים קרובות יש מספר בעיות, כולל קריאות רצף נמוכות ודלילות לאורך ORFs, רעש רצף גבוה, וזיהומי RNA ריבוזומי (rRNA). לפיכך, האותות המעוותים והדו-משמעיים הנוצרים על ידי נתונים כאלה מחלישים את דפוסי התקופתיות של 3-nt של עקבות הריבוזומים על mRNA, מה שבסופו של דבר מקשה על זיהוי ה- ORFs המתורגמים בביטחון גבוה.

חבילה בשם “RiboCode” התאימה מבחן כיתה חתום וילקוקסון שונה ואסטרטגיית אינטגרציה P-ערך כדי לבחון אם ORF יש באופן משמעותי יותר בתוך מסגרת שברים מוגנים ריבוזום (RPFs) מאשר מחוץ למסגרת RPFs22. הוא הוכח כיעיל ביותר, רגיש ומדויק לביאור דה נובו של התרגום בנתוני פרופיל ריבוזום מדומים ואמיתיים. כאן, אנו מתארים כיצד להשתמש בכלי זה כדי לזהות את ORFs התרגום הפוטנציאלי מתוך ערכות נתונים רצף פרופיל ריבוזום גלם שנוצר על ידי המחקר הקודם23. ערכות נתונים אלה שימשו כדי לחקור את הפונקציה של יחידת המשנה EIF3 “E” (EIF3E) בתרגום על ידי השוואת פרופילי תפוסת הריבוזום של תאי MCF-10A שהודבקו בבקרה (si-Ctrl) ו- EIF3E (si-eIF3e) RNAs קטנים מפריעים (siRNAs). על ידי החלת RiboCode על ערכות נתונים לדוגמה אלה, זיהינו 5,633 ORFs רומן פוטנציאל קידוד פפטידים קטנים או חלבונים. ORFs אלה סווגו לסוגים שונים בהתבסס על מיקומם ביחס לאזורי הקידוד, כולל ORFs במעלה הזרם (uORFs), ORFs במורד הזרם (dORFs), ORFs חופפים, ORFs מגנים חדשניים לקידוד חלבונים (PCGs חדשניים), ו- ORFs מ קידוד nonprotein חדשני (גנים חדשניים NonPCGs). צפיפות הקריאה של RPF על UORFs גדלה באופן משמעותי בתאים לקויי EIF3E בהשוואה לתאי בקרה, אשר עשויים להיגרם לפחות באופן חלקי על ידי העשרה של ריבוזומים תרגום פעיל. הצטברות ריבוזום מקומית באזור מן הקודון ה 25 עד ה 75 של תאים לקוי EIF3E הצביע על חסימה של התארכות התרגום בשלב המוקדם. פרוטוקול זה גם מראה כיצד לדמיין את צפיפות ה- RPF של האזור הרצוי לבחינת דפוסי המחזור של 3 nt של עקבות ריבוזום על ORFs מזוהים. ניתוחים אלה מדגימים את התפקיד החזק של RiboCode בזיהוי תרגום ORFs וללמוד את הרגולציה של תרגום.

Protocol

1. הגדרת סביבה והתקנת RiboCode פתח חלון מסוף לינוקס וצור סביבת קונדה:conda create -n RiboCode python=3.8 עבור לסביבה שנוצרה והתקן את RiboCode ואת יחסי התלות:קונדה להפעיל RiboCodeconda install -c bioconda ribocode ribominer sra-tools fastx_toolkit cutadapt עניבת פרפר כוכב samtools 2. הכנת נתונים</stro…

Representative Results

ערכות הנתונים לדוגמה של יצירת פרופיל ריבוזום הופקדו במסד הנתונים של GEO תחת מספר הגישה GSE131074. כל הקבצים והקודים המשמשים בפרוטוקול זה זמינים מקבצים משלימים 1-4. על ידי החלת RiboCode על קבוצה של ערכות נתונים פרופיל ריבוזום שפורסם23, זיהינו את הרומן ORFs בתרגום …

Discussion

פרופיל ריבוזום מציע הזדמנות חסרת תקדים ללמוד את פעולת הריבוזומים בתאים בקנה מידה של גנום. פענוח מדויק של המידע הנישאים על ידי נתוני פרופיל הריבוזום יכול לספק תובנה אילו אזורים של גנים או תמלילים מתורגמים באופן פעיל. פרוטוקול שלב אחר שלב זה מספק הדרכה כיצד להשתמש ב- RiboCode כדי לנתח נתוני פרופ…

Divulgations

The authors have nothing to disclose.

Acknowledgements

המחברים רוצים להכיר בתמיכת המשאבים החישוביים המסופקים על ידי פלטפורמת HPCC של אוניברסיטת שיאן ג’יאוטונג. Z.X. מודה תודה על תוכנית התמיכה בכישרונות טופנוץ’ הצעירה של אוניברסיטת שיאן ג’יאוטונג.

Materials

A computer/server running Linux Any
Anaconda or Miniconda Anaconda Anaconda: https://www.anaconda.com; Miniconda:https://docs.conda.io/en/latest/miniconda.html
R R Foundation https://www.r-project.org/
Rstudio Rstudio https://www.rstudio.com/

References

  1. Eisenberg, A. R., et al. Translation Initiation Site Profiling Reveals Widespread Synthesis of Non-AUG-Initiated Protein Isoforms in Yeast. Cell Systems. 11 (2), 145-160 (2020).
  2. Spealman, P., et al. Conserved non-AUG uORFs revealed by a novel regression analysis of ribosome profiling data. Genome Research. 28 (2), 214-222 (2018).
  3. Ingolia, N. T., Lareau, L. F., Weissman, J. S. Ribosome profiling of mouse embryonic stem cells reveals the complexity and dynamics of mammalian proteomes. Cell. 147 (4), 789-802 (2011).
  4. Bazzini, A. A., et al. Identification of small ORFs in vertebrates using ribosome footprinting and evolutionary conservation. The EMBO Journal. 33 (9), 981-993 (2014).
  5. Ingolia, N. T., et al. Ribosome profiling reveals pervasive translation outside of annotated protein-coding genes. Cell Reports. 8 (5), 1365-1379 (2014).
  6. Chew, G. L., Pauli, A., Schier, A. F. Conservation of uORF repressiveness and sequence features in mouse, human and zebrafish. Nature Communications. 7, 11663 (2016).
  7. Zhang, H., et al. Determinants of genome-wide distribution and evolution of uORFs in eukaryotes. Nature Communications. 12 (1), 1076 (2021).
  8. Guenther, U. P., et al. The helicase Ded1p controls use of near-cognate translation initiation codons in 5′ UTRs. Nature. 559 (7712), 130-134 (2018).
  9. Goldsmith, J., et al. Ribosome profiling reveals a functional role for autophagy in mRNA translational control. Communications Biology. 3 (1), 388 (2020).
  10. Magny, E. G., et al. Conserved regulation of cardiac calcium uptake by peptides encoded in small open reading frames. Science. 341 (6150), 1116-1120 (2013).
  11. Stumpf, C. R., Moreno, M. V., Olshen, A. B., Taylor, B. S., Ruggero, D. The translational landscape of the mammalian cell cycle. Molecular Cell. 52 (4), 574-582 (2013).
  12. Gerashchenko, M. V., Lobanov, A. V., Gladyshev, V. N. Genome-wide ribosome profiling reveals complex translational regulation in response to oxidative stress. Proceedings of the National Academy of Sciences of the United States of America. 109 (43), 17394-17399 (2012).
  13. Andreev, D. E., et al. Oxygen and glucose deprivation induces widespread alterations in mRNA translation within 20 minutes. Genome Biology. 16, 90 (2015).
  14. Chng, S. C., Ho, L., Tian, J., Reversade, B. ELABELA: a hormone essential for heart development signals via the apelin receptor. Developmental Cell. 27 (6), 672-680 (2013).
  15. Pauli, A., et al. Toddler: an embryonic signal that promotes cell movement via Apelin receptors. Science. 343 (6172), 1248636 (2014).
  16. Stark, A., et al. Discovery of functional elements in 12 Drosophila genomes using evolutionary signatures. Nature. 450 (7167), 219-232 (2007).
  17. Lin, M. F., Jungreis, I., Kellis, M. PhyloCSF: a comparative genomics method to distinguish protein coding and non-coding regions. Bioinformatics. 27 (13), 275-282 (2011).
  18. Slavoff, S. A., et al. Peptidomic discovery of short open reading frame-encoded peptides in human cells. Nature Chemical Biology. 9 (1), 59-64 (2013).
  19. Schwaid, A. G., et al. Chemoproteomic discovery of cysteine-containing human short open reading frames. Journal of the American Chemical Society. 135 (45), 16750-16753 (2013).
  20. Ingolia, N. T., Brar, G. A., Rouskin, S., McGeachy, A. M., Weissman, J. S. Genome-wide annotation and quantitation of translation by ribosome profiling. Current Protocols in Molecular Biology. , 1-19 (2013).
  21. Ingolia, N. T., Ghaemmaghami, S., Newman, J. R., Weissman, J. S. Genome-wide analysis in vivo of translation with nucleotide resolution using ribosome profiling. Science. 324 (5924), 218-223 (2009).
  22. Xiao, Z., et al. De novo annotation and characterization of the translatome with ribosome profiling data. Nucleic Acids Research. 46 (10), 61 (2018).
  23. Lin, Y., et al. eIF3 Associates with 80S Ribosomes to Promote Translation Elongation, Mitochondrial Homeostasis, and Muscle Health. Molecular Cell. 79 (4), 575-587 (2020).
  24. . AGAT: Another Gff Analysis Toolkit to handle annotations in any GTF/GFF format Available from: https://agat.readthedocs.io/en/latest/gff_to_gtf.html (2020)
  25. . Gene Expression Omnibus Available from: https://www.ncbi.nim.nih.gov/geo (2002)
  26. Ingolia, N. T., Brar, G. A., Rouskin, S., McGeachy, A. M., Weissman, J. S. The ribosome profiling strategy for monitoring translation in vivo by deep sequencing of ribosome-protected mRNA fragments. Nature Protocols. 7 (8), 1534-1550 (2012).
  27. . STAR manual Available from: https://github.com/alexdobin/STAR/blob/master/doc/STARmanual.pdf (2022)
  28. . The genetic codes Available from: https://www.ncbi.nlm.nih.gov/Taxonomy/Utils/wprintgc.cgi (2019)
  29. . RiboMiner Available from: https://github.com/xryanglab/RiboMiner (2020)
  30. Ingolia, N. T., Hussmann, J. A., Weissman, J. S. Ribosome profiling: global views of translation. Cold Spring Harbor Perspectives in Biology. 11 (5), 032698 (2018).
  31. Lee, S., et al. Global mapping of translation initiation sites in mammalian cells at single-nucleotide resolution. Proceedings of the National Academy of Sciences of the United States of America. 109 (37), 2424-2432 (2012).
  32. Gao, X., et al. Quantitative profiling of initiating ribosomes in vivo. Nature Methods. 12 (2), 147-153 (2015).
  33. Spealman, P., Naik, A., McManus, J. uORF-seqr: A Machine Learning-Based approach to the identification of upstream open reading frames in yeast. Methods in Molecular Biol. 2252, 313-329 (2021).
  34. . RiboCode Available from: https://github.com/xryanglab/RiboCode (2018)
  35. Sharma, P., Wu, J., Nilges, B. S., Leidel, S. A. Humans and other commonly used model organisms are resistant to cycloheximide-mediated biases in ribosome profiling experiments. Nature Communications. 12 (1), 5094 (2021).
check_url/fr/63366?article_type=t

Play Video

Citer Cet Article
Zhu, Y., Li, F., Yang, X., Xiao, Z. De novo Identification of Actively Translated Open Reading Frames with Ribosome Profiling Data. J. Vis. Exp. (180), e63366, doi:10.3791/63366 (2022).

View Video