Summary

De novo Identifiering av aktivt översatta öppna läsramar med ribosomprofileringsdata

Published: February 18, 2022
doi:

Summary

Översättning av ribosomer avkodar tre nukleotider per kodon till peptider. Deras rörelse längs mRNA, fångad av ribosomprofilering, producerar fotavtrycken som uppvisar karakteristisk triplettperiodicitet. Detta protokoll beskriver hur man använder RiboCode för att dechiffrera denna framträdande funktion från ribosomprofileringsdata för att identifiera aktivt översatta öppna läsramar på hela transkriptomnivån.

Abstract

Identifiering av öppna läsramar (ORF), särskilt de som kodar för små peptider och aktivt översätts under specifika fysiologiska sammanhang, är avgörande för omfattande anteckningar av kontextberoende translatomer. Ribosomprofilering, en teknik för att detektera bindningsplatser och densiteter för att översätta ribosomer på RNA, erbjuder en väg att snabbt upptäcka var översättning sker i genomomfattande skala. Det är emellertid inte en trivial uppgift inom bioinformatik att effektivt och omfattande identifiera de översättande ORF: erna för ribosomprofilering. Här beskrivs ett lättanvänt paket, med namnet RiboCode, som är utformat för att aktivt översätta ORF:er av alla storlekar från förvrängda och tvetydiga signaler i ribosomprofileringsdata. Med vår tidigare publicerade datauppsättning som exempel innehåller den här artikeln stegvisa instruktioner för hela RiboCode-pipelinen, från förbearbetning av rådata till tolkning av de slutliga utdataresultatfilerna. För att utvärdera översättningshastigheterna för de kommenterade ORF: erna beskrivs dessutom förfaranden för visualisering och kvantifiering av ribosomdensiteter på varje ORF också i detalj. Sammanfattningsvis är den här artikeln en användbar och aktuell instruktion för forskningsområdena relaterade till översättning, små ORF och peptider.

Introduction

Nyligen har en växande mängd studier avslöjat utbredd produktion av peptider översatta från ORF av kodande gener och de tidigare kommenterade generna som icke-kodande, såsom långa icke-kodande RNA (lncRNA) 1,2,3,4,5,6,7,8. Dessa översatta ORF regleras eller induceras av celler för att reagera på miljöförändringar, stress och celldifferentiering1,8,9,10,11,12,13. Översättningsprodukterna från vissa ORF har visat sig spela viktiga regulatoriska roller i olika biologiska processer inom utveckling och fysiologi. Till exempel upptäckte Chng et al.14 ett peptidhormon som heter Elabela (Ela, även känt som Apela / Ende / Toddler), vilket är avgörande för kardiovaskulär utveckling. Pauli et al. föreslog att Ela också fungerar som en mitogen som främjar cellmigration i det tidiga fiskembryot15. Magny et al. rapporterade två mikropeptider av mindre än 30 aminosyror som reglerar kalciumtransport och påverkar regelbunden muskelkontraktion i Drosophila-hjärtat10.

Det är fortfarande oklart hur många sådana peptider som kodas av genomet och om de är biologiskt relevanta. Därför är systematisk identifiering av dessa potentiellt kodande ORF mycket önskvärt. Att direkt bestämma produkterna från dessa ORF (dvs. protein eller peptid) med hjälp av traditionella metoder såsom evolutionär bevarande16,17 och masspektrometri18,19 är emellertid utmanande eftersom detektionseffektiviteten för båda metoderna är beroende av längden, överflödet och aminosyrasammansättningen hos de producerade proteinerna eller peptiderna. Tillkomsten av ribosomprofilering, en teknik för att identifiera ribosomens beläggning på mRNA vid nukleotidupplösning, har gett ett exakt sätt att utvärdera kodningspotentialen för olika transkript3,20,21, oavsett deras längd och sammansättning. En viktig och ofta använd funktion för att identifiera aktivt översätta ORF med ribosomprofilering är tre-nukleotid (3-nt) periodiciteten hos ribosomens fotavtryck på mRNA från startkodon till stoppkodonet. Ribosomprofileringsdata har emellertid ofta flera problem, inklusive låga och glesa sekvenseringsläsningar längs ORF, högt sekvenseringsbrus och ribosomala RNA (rRNA) -föroreningar. Således försvagar de förvrängda och tvetydiga signalerna som genereras av sådana data 3-nt periodicitetsmönstren för ribosomernas fotavtryck på mRNA, vilket i slutändan gör identifieringen av de högförtroendeöversatta ORF: erna svåra.

Ett paket med namnet “RiboCode” anpassade ett modifierat Wilcoxon-signerat rank-test och P-värdesintegrationsstrategi för att undersöka om ORF har betydligt fler ribosomskyddade fragment i ramen (RPF) än RPF:er utanför ramen22. Det visade sig vara mycket effektivt, känsligt och korrekt för de novo-anteckning av översättningen i simulerade och verkliga ribosomprofileringsdata. Här beskriver vi hur du använder det här verktyget för att upptäcka potentialen att översätta ORF:er från de råa ribosomprofileringssekvenseringsdataset som genererades av den tidigare studien23. Dessa dataset hade använts för att undersöka funktionen hos EIF3-underenheten “E” (EIF3E) i översättning genom att jämföra ribosombeläggningsprofilerna för MCF-10A-celler transfekterade med kontroll (si-Ctrl) och EIF3E (si-eIF3e) små interfererande RNA (siRNA). Genom att tillämpa RiboCode på dessa exempeldatauppsättningar upptäckte vi 5 633 nya ORF som potentiellt kodar för små peptider eller proteiner. Dessa ORF kategoriserades i olika typer baserat på deras platser i förhållande till de kodande regionerna, inklusive uppströms ORF (uORF), nedströms ORF (dORF), överlappade ORF, ORF från nya proteinkodande gener (nya PCG) och ORF från nya icke-proteinkodande gener (nya icke-PCPG). RPF-läsdensiteterna på uORF ökade signifikant i EIF3E-bristfälliga celler jämfört med kontrollceller, vilket åtminstone delvis kan orsakas av anrikningen av aktivt översättande ribosomer. Den lokaliserade ribosomackumuleringen i regionen från den 25: e till 75: e kodonen av EIF3E-bristfälliga celler indikerade en blockering av översättningsförlängning i det tidiga skedet. Detta protokoll visar också hur man visualiserar RPF-densiteten för den önskade regionen för att undersöka 3-nt periodicitetsmönstren för ribosomfotavtryck på identifierade ORF. Dessa analyser visar RiboCodes kraftfulla roll när det gäller att identifiera översättning av ORF och studera reglering av översättning.

Protocol

1. Miljöinställning och RiboCode-installation Öppna ett Linux-terminalfönster och skapa en conda-miljö:conda create -n RiboCode python=3.8 Växla till den skapade miljön och installera RiboCode och beroenden:conda aktivera RiboCodeconda install -c bioconda ribocode ribominer sra-tools fastx_toolkit cutadapt bowtie star samtools 2. Förberedelse av data Hämta genomreferensfiler. …

Representative Results

Exempeldatauppsättningarna för ribosomprofilering deponerades i GEO-databasen under anslutningsnumret GSE131074. Alla filer och koder som används i detta protokoll är tillgängliga från tilläggsfiler 1-4. Genom att tillämpa RiboCode på en uppsättning publicerade ribosomprofileringsdataset23 identifierade vi de nya ORF:er som aktivt översatts i MCF-10A-celler behandlade med kontroll och EIF3E-siRNA. För att välja de RPF-läsnin…

Discussion

Ribosomprofilering erbjuder en oöverträffad möjlighet att studera ribosomernas verkan i celler i genomskala. Exakt dechiffrering av informationen som bärs av ribosomprofileringsdata kan ge insikt i vilka regioner av gener eller transkript som aktivt översätts. Detta steg-för-steg-protokoll ger vägledning om hur du använder RiboCode för att analysera ribosomprofileringsdata i detalj, inklusive paketinstallation, förberedelse av data, kommandokörning, resultatförklaring och datavisualisering. Analysresultaten …

Divulgations

The authors have nothing to disclose.

Acknowledgements

Författarna vill erkänna stödet från de beräkningsresurser som tillhandahålls av HPCC-plattformen vid Xi’an Jiaotong University. Z.X. tackar tacksamt Young Topnotch Talent Support Plan från Xi’an Jiaotong University.

Materials

A computer/server running Linux Any
Anaconda or Miniconda Anaconda Anaconda: https://www.anaconda.com; Miniconda:https://docs.conda.io/en/latest/miniconda.html
R R Foundation https://www.r-project.org/
Rstudio Rstudio https://www.rstudio.com/

References

  1. Eisenberg, A. R., et al. Translation Initiation Site Profiling Reveals Widespread Synthesis of Non-AUG-Initiated Protein Isoforms in Yeast. Cell Systems. 11 (2), 145-160 (2020).
  2. Spealman, P., et al. Conserved non-AUG uORFs revealed by a novel regression analysis of ribosome profiling data. Genome Research. 28 (2), 214-222 (2018).
  3. Ingolia, N. T., Lareau, L. F., Weissman, J. S. Ribosome profiling of mouse embryonic stem cells reveals the complexity and dynamics of mammalian proteomes. Cell. 147 (4), 789-802 (2011).
  4. Bazzini, A. A., et al. Identification of small ORFs in vertebrates using ribosome footprinting and evolutionary conservation. The EMBO Journal. 33 (9), 981-993 (2014).
  5. Ingolia, N. T., et al. Ribosome profiling reveals pervasive translation outside of annotated protein-coding genes. Cell Reports. 8 (5), 1365-1379 (2014).
  6. Chew, G. L., Pauli, A., Schier, A. F. Conservation of uORF repressiveness and sequence features in mouse, human and zebrafish. Nature Communications. 7, 11663 (2016).
  7. Zhang, H., et al. Determinants of genome-wide distribution and evolution of uORFs in eukaryotes. Nature Communications. 12 (1), 1076 (2021).
  8. Guenther, U. P., et al. The helicase Ded1p controls use of near-cognate translation initiation codons in 5′ UTRs. Nature. 559 (7712), 130-134 (2018).
  9. Goldsmith, J., et al. Ribosome profiling reveals a functional role for autophagy in mRNA translational control. Communications Biology. 3 (1), 388 (2020).
  10. Magny, E. G., et al. Conserved regulation of cardiac calcium uptake by peptides encoded in small open reading frames. Science. 341 (6150), 1116-1120 (2013).
  11. Stumpf, C. R., Moreno, M. V., Olshen, A. B., Taylor, B. S., Ruggero, D. The translational landscape of the mammalian cell cycle. Molecular Cell. 52 (4), 574-582 (2013).
  12. Gerashchenko, M. V., Lobanov, A. V., Gladyshev, V. N. Genome-wide ribosome profiling reveals complex translational regulation in response to oxidative stress. Proceedings of the National Academy of Sciences of the United States of America. 109 (43), 17394-17399 (2012).
  13. Andreev, D. E., et al. Oxygen and glucose deprivation induces widespread alterations in mRNA translation within 20 minutes. Genome Biology. 16, 90 (2015).
  14. Chng, S. C., Ho, L., Tian, J., Reversade, B. ELABELA: a hormone essential for heart development signals via the apelin receptor. Developmental Cell. 27 (6), 672-680 (2013).
  15. Pauli, A., et al. Toddler: an embryonic signal that promotes cell movement via Apelin receptors. Science. 343 (6172), 1248636 (2014).
  16. Stark, A., et al. Discovery of functional elements in 12 Drosophila genomes using evolutionary signatures. Nature. 450 (7167), 219-232 (2007).
  17. Lin, M. F., Jungreis, I., Kellis, M. PhyloCSF: a comparative genomics method to distinguish protein coding and non-coding regions. Bioinformatics. 27 (13), 275-282 (2011).
  18. Slavoff, S. A., et al. Peptidomic discovery of short open reading frame-encoded peptides in human cells. Nature Chemical Biology. 9 (1), 59-64 (2013).
  19. Schwaid, A. G., et al. Chemoproteomic discovery of cysteine-containing human short open reading frames. Journal of the American Chemical Society. 135 (45), 16750-16753 (2013).
  20. Ingolia, N. T., Brar, G. A., Rouskin, S., McGeachy, A. M., Weissman, J. S. Genome-wide annotation and quantitation of translation by ribosome profiling. Current Protocols in Molecular Biology. , 1-19 (2013).
  21. Ingolia, N. T., Ghaemmaghami, S., Newman, J. R., Weissman, J. S. Genome-wide analysis in vivo of translation with nucleotide resolution using ribosome profiling. Science. 324 (5924), 218-223 (2009).
  22. Xiao, Z., et al. De novo annotation and characterization of the translatome with ribosome profiling data. Nucleic Acids Research. 46 (10), 61 (2018).
  23. Lin, Y., et al. eIF3 Associates with 80S Ribosomes to Promote Translation Elongation, Mitochondrial Homeostasis, and Muscle Health. Molecular Cell. 79 (4), 575-587 (2020).
  24. . AGAT: Another Gff Analysis Toolkit to handle annotations in any GTF/GFF format Available from: https://agat.readthedocs.io/en/latest/gff_to_gtf.html (2020)
  25. . Gene Expression Omnibus Available from: https://www.ncbi.nim.nih.gov/geo (2002)
  26. Ingolia, N. T., Brar, G. A., Rouskin, S., McGeachy, A. M., Weissman, J. S. The ribosome profiling strategy for monitoring translation in vivo by deep sequencing of ribosome-protected mRNA fragments. Nature Protocols. 7 (8), 1534-1550 (2012).
  27. . STAR manual Available from: https://github.com/alexdobin/STAR/blob/master/doc/STARmanual.pdf (2022)
  28. . The genetic codes Available from: https://www.ncbi.nlm.nih.gov/Taxonomy/Utils/wprintgc.cgi (2019)
  29. . RiboMiner Available from: https://github.com/xryanglab/RiboMiner (2020)
  30. Ingolia, N. T., Hussmann, J. A., Weissman, J. S. Ribosome profiling: global views of translation. Cold Spring Harbor Perspectives in Biology. 11 (5), 032698 (2018).
  31. Lee, S., et al. Global mapping of translation initiation sites in mammalian cells at single-nucleotide resolution. Proceedings of the National Academy of Sciences of the United States of America. 109 (37), 2424-2432 (2012).
  32. Gao, X., et al. Quantitative profiling of initiating ribosomes in vivo. Nature Methods. 12 (2), 147-153 (2015).
  33. Spealman, P., Naik, A., McManus, J. uORF-seqr: A Machine Learning-Based approach to the identification of upstream open reading frames in yeast. Methods in Molecular Biol. 2252, 313-329 (2021).
  34. . RiboCode Available from: https://github.com/xryanglab/RiboCode (2018)
  35. Sharma, P., Wu, J., Nilges, B. S., Leidel, S. A. Humans and other commonly used model organisms are resistant to cycloheximide-mediated biases in ribosome profiling experiments. Nature Communications. 12 (1), 5094 (2021).
check_url/fr/63366?article_type=t

Play Video

Citer Cet Article
Zhu, Y., Li, F., Yang, X., Xiao, Z. De novo Identification of Actively Translated Open Reading Frames with Ribosome Profiling Data. J. Vis. Exp. (180), e63366, doi:10.3791/63366 (2022).

View Video