Summary

De novo Identificatie van actief vertaalde open leesframes met ribosoomprofileringsgegevens

Published: February 18, 2022
doi:

Summary

Het vertalen van ribosomen decodeert drie nucleotiden per codon in peptiden. Hun beweging langs mRNA, vastgelegd door ribosoomprofilering, produceert de voetafdrukken die karakteristieke triplet periodiciteit vertonen. Dit protocol beschrijft hoe RiboCode te gebruiken om deze prominente functie te ontcijferen uit ribosoomprofileringsgegevens om actief vertaalde open leesframes op het niveau van het hele transcriptoom te identificeren.

Abstract

Identificatie van open leesframes (ORF’s), met name die welke coderen voor kleine peptiden en actief worden vertaald onder specifieke fysiologische contexten, is van cruciaal belang voor uitgebreide annotaties van contextafhankelijke translatomen. Ribosoomprofilering, een techniek voor het detecteren van de bindingslocaties en dichtheden van het vertalen van ribosomen op RNA, biedt een manier om snel te ontdekken waar translatie plaatsvindt op genoombrede schaal. Het is echter geen triviale taak in de bio-informatica om de vertalende ORF’s voor ribosoomprofilering efficiënt en uitgebreid te identificeren. Hier beschreven is een eenvoudig te gebruiken pakket, genaamd RiboCode, ontworpen om te zoeken naar actief vertalende ORF’s van elke grootte van vervormde en dubbelzinnige signalen in ribosoomprofileringsgegevens. Dit artikel neemt onze eerder gepubliceerde dataset als voorbeeld en biedt stapsgewijze instructies voor de gehele RiboCode-pijplijn, van het voorbewerken van de onbewerkte gegevens tot de interpretatie van de uiteindelijke uitvoerresultaatbestanden. Bovendien worden voor het evalueren van de omrekeningssnelheden van de geannoteerde ORF’s ook procedures voor visualisatie en kwantificering van ribosoomdichtheden op elke ORF in detail beschreven. Samenvattend is dit artikel een nuttige en tijdige instructie voor de onderzoeksgebieden met betrekking tot vertaling, kleine ORF’s en peptiden.

Introduction

Onlangs heeft een groeiend aantal studies een wijdverspreide productie van peptiden onthuld die zijn vertaald uit ORF’s van coderende genen en de eerder geannoteerde genen als niet-coderend, zoals lange niet-coderende RNA’s (lncRNA’s) 1,2,3,4,5,6,7,8. Deze vertaalde ORF’s worden gereguleerd of geïnduceerd door cellen om te reageren op omgevingsveranderingen, stress en celdifferentiatie1,8,9,10,11,12,13. Van de vertaalproducten van sommige ORF’s is aangetoond dat ze een belangrijke regulerende rol spelen in diverse biologische processen in ontwikkeling en fysiologie. Chng et al.14 ontdekten bijvoorbeeld een peptidehormoon genaamd Elabela (Ela, ook bekend als Apela / Ende / Toddler), dat van cruciaal belang is voor de cardiovasculaire ontwikkeling. Pauli et al. suggereerden dat Ela ook werkt als een mitogeen dat de celmigratie in het vroege visembryo bevordert15. Magny et al. rapporteerden twee micropeptiden van minder dan 30 aminozuren die het calciumtransport reguleren en de regelmatige spiercontractie in het Drosophila-hart beïnvloeden10.

Het blijft onduidelijk hoeveel van dergelijke peptiden door het genoom worden gecodeerd en of ze biologisch relevant zijn. Daarom is systematische identificatie van deze potentieel coderende ORF’s zeer wenselijk. Het direct bepalen van de producten van deze ORF’s (d.w.z. eiwit of peptide) met behulp van traditionele benaderingen zoals evolutionaire conservering16,17 en massaspectrometrie18,19 is echter een uitdaging omdat de detectie-efficiëntie van beide benaderingen afhankelijk is van de lengte, abundantie en aminozuursamenstelling van de geproduceerde eiwitten of peptiden. De komst van ribosoomprofilering, een techniek voor het identificeren van de ribosoombezetting op mRNA’s met nucleotideresolutie, heeft een precieze manier geboden om het coderingspotentieel van verschillende transcripten3,20,21 te evalueren, ongeacht hun lengte en samenstelling. Een belangrijk en vaak gebruikt kenmerk voor het identificeren van actief vertalende ORF’s met behulp van ribosoomprofilering is de drie-nucleotide (3-nt) periodiciteit van de voetafdrukken van het ribosoom op mRNA van het startcodon tot het stopcodon. Ribosoomprofileringsgegevens hebben echter vaak verschillende problemen, waaronder lage en schaarse sequencing-reads langs ORF’s, hoge sequencingruis en ribosomale RNA (rRNA) -verontreinigingen. De vervormde en dubbelzinnige signalen die door dergelijke gegevens worden gegenereerd, verzwakken dus de 3-nt periodiciteitspatronen van de voetafdrukken van ribosomen op mRNA, wat uiteindelijk de identificatie van de met hoge betrouwbaarheid vertaalde ORF’s moeilijk maakt.

Een pakket met de naam “RiboCode” paste een aangepaste Wilcoxon-signed-rank test en P-value integratiestrategie aan om te onderzoeken of de ORF significant meer in-frame ribosoom-beschermde fragmenten (RPF’s) heeft dan off-frame RPFs22. Het bleek zeer efficiënt, gevoelig en nauwkeurig te zijn voor de novo annotatie van het translatoom in gesimuleerde en echte ribosoomprofileringsgegevens. Hier beschrijven we hoe we deze tool kunnen gebruiken om de potentiële vertalende ORF’s te detecteren uit de ruwe ribosoomprofileringsequencingsets die door de vorige studie zijn gegenereerd23. Deze datasets werden gebruikt om de functie van EIF3-subeenheid “E” (EIF3E) in vertaling te onderzoeken door de ribosoombezettingsprofielen van MCF-10A-cellen getransfecteerd met controle (si-Ctrl) en EIF3E (si-eIF3e) kleine interfererende RNA’s (siRNA’s) te vergelijken. Door RiboCode toe te passen op deze voorbeelddatasets, ontdekten we 5.633 nieuwe ORF’s die mogelijk coderen voor kleine peptiden of eiwitten. Deze ORF’s werden gecategoriseerd in verschillende typen op basis van hun locaties ten opzichte van de coderende regio’s, waaronder upstream ORF’s (uORF’s), downstream ORF’s (dORFs), overlappende ORF’s, ORF’s van nieuwe eiwitcoderende genen (nieuwe PCG’s) en ORF’s van nieuwe niet-proteïnecoderende genen (nieuwe niet-PCPG’s). De RPF-leesdichtheden op uORF’s waren significant verhoogd in EIF3E-deficiënte cellen in vergelijking met controlecellen, wat ten minste gedeeltelijk kan worden veroorzaakt door de verrijking van actief translaterende ribosomen. De gelokaliseerde ribosoomaccumulatie in het gebied van het 25e tot 75e codon van EIF3E-deficiënte cellen duidde op een blokkering van translatie-elongatie in het vroege stadium. Dit protocol laat ook zien hoe de RPF-dichtheid van het gewenste gebied kan worden gevisualiseerd voor het onderzoeken van de 3-nt periodiciteitspatronen van ribosoomvoetafdrukken op geïdentificeerde ORF’s. Deze analyses tonen de krachtige rol van RiboCode bij het identificeren van vertalende ORF’s en het bestuderen van de regulatie van vertaling.

Protocol

1. Omgevingsinstellingen en RiboCode-installatie Open een Linux-terminalvenster en maak een conda-omgeving:conda create -n RiboCode python=3.8 Schakel over naar de gecreëerde omgeving en installeer RiboCode en afhankelijkheden:conda activeer RiboCodeconda install -c bioconda ribocode ribominer sra-tools fastx_toolkit cutadapt bowtie star samtools 2. Voorbereiding van de gegevens Krijg genoomr…

Representative Results

De voorbeelddatasets voor ribosoomprofilering werden in de GEO-database gedeponeerd onder het toetredingsnummer GSE131074. Alle bestanden en codes die in dit protocol worden gebruikt, zijn beschikbaar in aanvullende bestanden 1-4. Door RiboCode toe te passen op een reeks gepubliceerde ribosoomprofileringsdatasets23, identificeerden we de nieuwe ORF’s die actief werden vertaald in MCF-10A-cellen die werden behandeld met controle- en EIF3E siRNA’s.<sup class="xref…

Discussion

Ribosoomprofilering biedt een ongekende kans om de werking van de ribosomen in cellen op genoomschaal te bestuderen. Het nauwkeurig ontcijferen van de informatie die door de ribosoomprofileringsgegevens wordt gedragen, kan inzicht geven in welke regio’s van genen of transcripten actief worden vertaald. Dit stapsgewijze protocol biedt richtlijnen voor het gebruik van RiboCode om ribosoomprofileringsgegevens in detail te analyseren, inclusief pakketinstallatie, gegevensvoorbereiding, uitvoering van opdrachten, resultaatuit…

Divulgazioni

The authors have nothing to disclose.

Acknowledgements

De auteurs willen graag de ondersteuning erkennen van de computationele bronnen die worden geboden door het HPCC-platform van de Xi’an Jiaotong University. Z.X. bedankt dankbaar het Young Topnotch Talent Support Plan van Xi’an Jiaotong University.

Materials

A computer/server running Linux Any
Anaconda or Miniconda Anaconda Anaconda: https://www.anaconda.com; Miniconda:https://docs.conda.io/en/latest/miniconda.html
R R Foundation https://www.r-project.org/
Rstudio Rstudio https://www.rstudio.com/

Riferimenti

  1. Eisenberg, A. R., et al. Translation Initiation Site Profiling Reveals Widespread Synthesis of Non-AUG-Initiated Protein Isoforms in Yeast. Cell Systems. 11 (2), 145-160 (2020).
  2. Spealman, P., et al. Conserved non-AUG uORFs revealed by a novel regression analysis of ribosome profiling data. Genome Research. 28 (2), 214-222 (2018).
  3. Ingolia, N. T., Lareau, L. F., Weissman, J. S. Ribosome profiling of mouse embryonic stem cells reveals the complexity and dynamics of mammalian proteomes. Cell. 147 (4), 789-802 (2011).
  4. Bazzini, A. A., et al. Identification of small ORFs in vertebrates using ribosome footprinting and evolutionary conservation. The EMBO Journal. 33 (9), 981-993 (2014).
  5. Ingolia, N. T., et al. Ribosome profiling reveals pervasive translation outside of annotated protein-coding genes. Cell Reports. 8 (5), 1365-1379 (2014).
  6. Chew, G. L., Pauli, A., Schier, A. F. Conservation of uORF repressiveness and sequence features in mouse, human and zebrafish. Nature Communications. 7, 11663 (2016).
  7. Zhang, H., et al. Determinants of genome-wide distribution and evolution of uORFs in eukaryotes. Nature Communications. 12 (1), 1076 (2021).
  8. Guenther, U. P., et al. The helicase Ded1p controls use of near-cognate translation initiation codons in 5′ UTRs. Nature. 559 (7712), 130-134 (2018).
  9. Goldsmith, J., et al. Ribosome profiling reveals a functional role for autophagy in mRNA translational control. Communications Biology. 3 (1), 388 (2020).
  10. Magny, E. G., et al. Conserved regulation of cardiac calcium uptake by peptides encoded in small open reading frames. Science. 341 (6150), 1116-1120 (2013).
  11. Stumpf, C. R., Moreno, M. V., Olshen, A. B., Taylor, B. S., Ruggero, D. The translational landscape of the mammalian cell cycle. Molecular Cell. 52 (4), 574-582 (2013).
  12. Gerashchenko, M. V., Lobanov, A. V., Gladyshev, V. N. Genome-wide ribosome profiling reveals complex translational regulation in response to oxidative stress. Proceedings of the National Academy of Sciences of the United States of America. 109 (43), 17394-17399 (2012).
  13. Andreev, D. E., et al. Oxygen and glucose deprivation induces widespread alterations in mRNA translation within 20 minutes. Genome Biology. 16, 90 (2015).
  14. Chng, S. C., Ho, L., Tian, J., Reversade, B. ELABELA: a hormone essential for heart development signals via the apelin receptor. Developmental Cell. 27 (6), 672-680 (2013).
  15. Pauli, A., et al. Toddler: an embryonic signal that promotes cell movement via Apelin receptors. Science. 343 (6172), 1248636 (2014).
  16. Stark, A., et al. Discovery of functional elements in 12 Drosophila genomes using evolutionary signatures. Nature. 450 (7167), 219-232 (2007).
  17. Lin, M. F., Jungreis, I., Kellis, M. PhyloCSF: a comparative genomics method to distinguish protein coding and non-coding regions. Bioinformatics. 27 (13), 275-282 (2011).
  18. Slavoff, S. A., et al. Peptidomic discovery of short open reading frame-encoded peptides in human cells. Nature Chemical Biology. 9 (1), 59-64 (2013).
  19. Schwaid, A. G., et al. Chemoproteomic discovery of cysteine-containing human short open reading frames. Journal of the American Chemical Society. 135 (45), 16750-16753 (2013).
  20. Ingolia, N. T., Brar, G. A., Rouskin, S., McGeachy, A. M., Weissman, J. S. Genome-wide annotation and quantitation of translation by ribosome profiling. Current Protocols in Molecular Biology. , 1-19 (2013).
  21. Ingolia, N. T., Ghaemmaghami, S., Newman, J. R., Weissman, J. S. Genome-wide analysis in vivo of translation with nucleotide resolution using ribosome profiling. Science. 324 (5924), 218-223 (2009).
  22. Xiao, Z., et al. De novo annotation and characterization of the translatome with ribosome profiling data. Nucleic Acids Research. 46 (10), 61 (2018).
  23. Lin, Y., et al. eIF3 Associates with 80S Ribosomes to Promote Translation Elongation, Mitochondrial Homeostasis, and Muscle Health. Molecular Cell. 79 (4), 575-587 (2020).
  24. . AGAT: Another Gff Analysis Toolkit to handle annotations in any GTF/GFF format Available from: https://agat.readthedocs.io/en/latest/gff_to_gtf.html (2020)
  25. . Gene Expression Omnibus Available from: https://www.ncbi.nim.nih.gov/geo (2002)
  26. Ingolia, N. T., Brar, G. A., Rouskin, S., McGeachy, A. M., Weissman, J. S. The ribosome profiling strategy for monitoring translation in vivo by deep sequencing of ribosome-protected mRNA fragments. Nature Protocols. 7 (8), 1534-1550 (2012).
  27. . STAR manual Available from: https://github.com/alexdobin/STAR/blob/master/doc/STARmanual.pdf (2022)
  28. . The genetic codes Available from: https://www.ncbi.nlm.nih.gov/Taxonomy/Utils/wprintgc.cgi (2019)
  29. . RiboMiner Available from: https://github.com/xryanglab/RiboMiner (2020)
  30. Ingolia, N. T., Hussmann, J. A., Weissman, J. S. Ribosome profiling: global views of translation. Cold Spring Harbor Perspectives in Biology. 11 (5), 032698 (2018).
  31. Lee, S., et al. Global mapping of translation initiation sites in mammalian cells at single-nucleotide resolution. Proceedings of the National Academy of Sciences of the United States of America. 109 (37), 2424-2432 (2012).
  32. Gao, X., et al. Quantitative profiling of initiating ribosomes in vivo. Nature Methods. 12 (2), 147-153 (2015).
  33. Spealman, P., Naik, A., McManus, J. uORF-seqr: A Machine Learning-Based approach to the identification of upstream open reading frames in yeast. Methods in Molecular Biol. 2252, 313-329 (2021).
  34. . RiboCode Available from: https://github.com/xryanglab/RiboCode (2018)
  35. Sharma, P., Wu, J., Nilges, B. S., Leidel, S. A. Humans and other commonly used model organisms are resistant to cycloheximide-mediated biases in ribosome profiling experiments. Nature Communications. 12 (1), 5094 (2021).
check_url/it/63366?article_type=t

Play Video

Citazione di questo articolo
Zhu, Y., Li, F., Yang, X., Xiao, Z. De novo Identification of Actively Translated Open Reading Frames with Ribosome Profiling Data. J. Vis. Exp. (180), e63366, doi:10.3791/63366 (2022).

View Video