Summary

De novo Identificação de quadros de leitura abertos traduzidos ativamente com dados de perfil ribossomo

Published: February 18, 2022
doi:

Summary

Traduzindo ribossomos decodificam três nucleotídeos por codon em peptídeos. Seu movimento ao longo do mRNA, capturado pelo perfil ribossomo, produz as pegadas exibindo periodicidade trigêmea característica. Este protocolo descreve como usar o RiboCode para decifrar esse recurso proeminente de dados de criação de perfil ribossomos para identificar quadros de leitura abertos traduzidos ativamente no nível de transcriptome inteiro.

Abstract

A identificação de quadros de leitura aberto (ORFs), especialmente aqueles que codificam pequenos peptídeos e sendo ativamente traduzidos em contextos fisiológicos específicos, é fundamental para anotações abrangentes de translatomes dependentes do contexto. O perfil ribossomo, uma técnica para detectar os locais de ligação e densidades de tradução de ribossomos no RNA, oferece uma avenida para descobrir rapidamente onde a tradução está ocorrendo na escala de todo o genoma. No entanto, não é uma tarefa trivial na bioinformática identificar de forma eficiente e abrangente os ORFs de tradução para o perfil ribossomo. Descrito aqui é um pacote fácil de usar, chamado RiboCode, projetado para procurar traduzir ativamente ORFs de qualquer tamanho a partir de sinais distorcidos e ambíguos em dados de perfil ribossomos. Tomando nosso conjunto de dados publicado anteriormente como exemplo, este artigo fornece instruções passo a passo para todo o pipeline RiboCode, desde o pré-processamento dos dados brutos até a interpretação dos arquivos finais de resultado de saída. Além disso, para avaliar as taxas de tradução dos ORFs anotados, procedimentos de visualização e quantificação de densidades ribossósas em cada ORF também são descritos em detalhes. Em resumo, o presente artigo é uma instrução útil e oportuna para os campos de pesquisa relacionados à tradução, pequenos ORFs e peptídeos.

Introduction

Recentemente, um corpo crescente de estudos revelou a produção generalizada de peptídeos traduzidos de ORFs de genes codificadores e os genes anteriormente anotados como não codificação, como RNAs de não codificação longa (lncRNAs)1,2,3,4,5,6,7,8. Esses ORFs traduzidos são regulados ou induzidos por células a responder a mudanças ambientais, estresse e diferenciação celular1,8,9,10,11,12,13. Os produtos de tradução de alguns ORFs têm sido demonstrados para desempenhar importantes papéis regulatórios em diversos processos biológicos no desenvolvimento e fisiologia. Por exemplo, Chng et al.14 descobriram um hormônio peptídeo chamado Elabela (Ela, também conhecido como Apela/Ende/Toddler), que é fundamental para o desenvolvimento cardiovascular. Pauli et al. sugeriram que Ela também age como um mitogênio que promove a migração celular no embrião de peixes iniciais15. Magny et al. relataram dois micropeptídeos de menos de 30 aminoácidos regulando o transporte de cálcio e afetando a contração muscular regular no coração de Drosophila10.

Ainda não está claro quantos peptídeos desse tipo são codificados pelo genoma e se são biologicamente relevantes. Portanto, a identificação sistemática desses ORFs potencialmente codificadores é altamente desejável. No entanto, determinar diretamente os produtos desses ORFs (ou seja, proteína ou peptídeo) utilizando abordagens tradicionais como conservação evolutiva16,17 e espectrometria de massa18,19 é desafiador porque a eficiência de detecção de ambas as abordagens depende do comprimento, abundância e composição de aminoácidos das proteínas ou peptídeos produzidos. O advento do perfil ribossomo, uma técnica para identificar a ocupação ribossômica em mRNAs na resolução nucleotídea, forneceu uma maneira precisa de avaliar o potencial de codificação de diferentes transcrições3,20,21, independentemente de seu comprimento e composição. Um recurso importante e frequentemente utilizado para identificar ORFs ativamente traduzindo usando perfil ribossomo é a periodicidade de três nucleotídeos (3-nt) das pegadas do ribossomo no mRNA desde o códon inicial até o códon stop. No entanto, os dados de perfil ribossomo geralmente têm vários problemas, incluindo leituras de sequenciamento baixo e esparso ao longo de ORFs, alto ruído de sequenciamento e contaminações de RNA ribossômicos (rRNA). Assim, os sinais distorcidos e ambíguos gerados por tais dados enfraquecem os padrões de periodicidade de 3-nt das pegadas de ribossomos no mRNA, o que, em última análise, dificulta a identificação dos ORFs traduzidos de alta confiança.

Um pacote chamado “RiboCode” adaptou uma estratégia modificada de integração de classificação assinada por Wilcoxon e P-value para examinar se o ORF tem fragmentos proteis ribossomos (RPFs) mais in-frame do que rpfs22 off-frame. Demonstrou-se ser altamente eficiente, sensível e preciso para a anotação de novo do translatome em dados simulados e reais de perfil ribossomo. Aqui, descrevemos como usar esta ferramenta para detectar os ORFs de tradução potencial dos conjuntos de dados de sequenciamento de perfil ribossorosos crus gerados pelo estudo anterior23. Esses conjuntos de dados foram usados para explorar a função da subunidade EIF3 (EIF3E) em tradução comparando os perfis de ocupação ribossosome das células MCF-10A transfeminadas com controle (si-Ctrl) e EIF3E (si-eIF3e) RNAs de pequena interferência (siRNAs). Ao aplicar o RiboCode a esses conjuntos de dados de exemplo, detectamos 5.633 novos ORFs potencialmente codificando pequenos peptídeos ou proteínas. Esses ORFs foram categorizados em vários tipos com base em suas localizações em relação às regiões de codificação, incluindo ORFs upstream (uORFs), ORFs a jusante (dORFs), ORFs sobrepostos, ORFs de novos genes de codificação de proteínas (novos PCGs) e ORFs de novos genes de codificação não-proteína (novos NonPCGs). As densidades de leitura de RPF em uORFs foram significativamente aumentadas em células deficientes de EIF3E em comparação com células de controle, o que pode ser pelo menos parcialmente causado pelo enriquecimento de ribossomos ativamente traduzindo. O acúmulo localizado de ribossomos na região entre o 25º e o 75º codon de células deficientes do EIF3E indicaram um bloqueio do alongamento da tradução no estágio inicial. Este protocolo também mostra como visualizar a densidade de RPF da região desejada para examinar os padrões de periodicidade de 3 nt de pegadas ribossósas em ORFs identificados. Essas análises demonstram o poderoso papel do RiboCode na identificação de ORFs traduzindo e estudando a regulação da tradução.

Protocol

1. Configuração do ambiente e instalação do RiboCode Abra uma janela de terminal Linux e crie um ambiente conda:conda criar -n RiboCode python=3.8 Mude para o ambiente criado e instale o RiboCode e as dependências:conda ativar RiboCodeconda instalar -c bioconda ribocode ribominer sra-tools fastx_toolkit cutadapt bowtie star samtools 2. Preparação de dados Pegue arquivos de referência d…

Representative Results

Os conjuntos de dados de perfil ribossosome foram depositados no banco de dados GEO sob o número de adesão GSE131074. Todos os arquivos e códigos usados neste protocolo estão disponíveis nos arquivos suplementares 1-4. Aplicando o RiboCode a um conjunto de conjuntos de dados de perfil ribossosome publicado23, identificamos os novos ORFs traduzidos ativamente em células MCF-10A tratadas com controle e siRNAs EIF3E. Para selecionar as…

Discussion

O perfil ribossomo oferece uma oportunidade sem precedentes para estudar a ação dos ribossomos nas células em uma escala de genoma. Decifrar precisamente as informações transportadas pelos dados de criação de perfil ribossomos poderia fornecer informações sobre quais regiões de genes ou transcrições estão traduzindo ativamente. Este protocolo passo a passo fornece orientações sobre como usar o RiboCode para analisar os dados de perfil ribossomo em detalhes, incluindo instalação de pacotes, preparação d…

Divulgazioni

The authors have nothing to disclose.

Acknowledgements

Os autores gostariam de reconhecer o apoio dos recursos computacionais fornecidos pela plataforma HPCC da Universidade Xi’an Jiaotong. Z.X. agradece com gratidão ao Plano de Apoio ao Talento Jovem Topnotch da Universidade Xi’an Jiaotong.

Materials

A computer/server running Linux Any
Anaconda or Miniconda Anaconda Anaconda: https://www.anaconda.com; Miniconda:https://docs.conda.io/en/latest/miniconda.html
R R Foundation https://www.r-project.org/
Rstudio Rstudio https://www.rstudio.com/

Riferimenti

  1. Eisenberg, A. R., et al. Translation Initiation Site Profiling Reveals Widespread Synthesis of Non-AUG-Initiated Protein Isoforms in Yeast. Cell Systems. 11 (2), 145-160 (2020).
  2. Spealman, P., et al. Conserved non-AUG uORFs revealed by a novel regression analysis of ribosome profiling data. Genome Research. 28 (2), 214-222 (2018).
  3. Ingolia, N. T., Lareau, L. F., Weissman, J. S. Ribosome profiling of mouse embryonic stem cells reveals the complexity and dynamics of mammalian proteomes. Cell. 147 (4), 789-802 (2011).
  4. Bazzini, A. A., et al. Identification of small ORFs in vertebrates using ribosome footprinting and evolutionary conservation. The EMBO Journal. 33 (9), 981-993 (2014).
  5. Ingolia, N. T., et al. Ribosome profiling reveals pervasive translation outside of annotated protein-coding genes. Cell Reports. 8 (5), 1365-1379 (2014).
  6. Chew, G. L., Pauli, A., Schier, A. F. Conservation of uORF repressiveness and sequence features in mouse, human and zebrafish. Nature Communications. 7, 11663 (2016).
  7. Zhang, H., et al. Determinants of genome-wide distribution and evolution of uORFs in eukaryotes. Nature Communications. 12 (1), 1076 (2021).
  8. Guenther, U. P., et al. The helicase Ded1p controls use of near-cognate translation initiation codons in 5′ UTRs. Nature. 559 (7712), 130-134 (2018).
  9. Goldsmith, J., et al. Ribosome profiling reveals a functional role for autophagy in mRNA translational control. Communications Biology. 3 (1), 388 (2020).
  10. Magny, E. G., et al. Conserved regulation of cardiac calcium uptake by peptides encoded in small open reading frames. Science. 341 (6150), 1116-1120 (2013).
  11. Stumpf, C. R., Moreno, M. V., Olshen, A. B., Taylor, B. S., Ruggero, D. The translational landscape of the mammalian cell cycle. Molecular Cell. 52 (4), 574-582 (2013).
  12. Gerashchenko, M. V., Lobanov, A. V., Gladyshev, V. N. Genome-wide ribosome profiling reveals complex translational regulation in response to oxidative stress. Proceedings of the National Academy of Sciences of the United States of America. 109 (43), 17394-17399 (2012).
  13. Andreev, D. E., et al. Oxygen and glucose deprivation induces widespread alterations in mRNA translation within 20 minutes. Genome Biology. 16, 90 (2015).
  14. Chng, S. C., Ho, L., Tian, J., Reversade, B. ELABELA: a hormone essential for heart development signals via the apelin receptor. Developmental Cell. 27 (6), 672-680 (2013).
  15. Pauli, A., et al. Toddler: an embryonic signal that promotes cell movement via Apelin receptors. Science. 343 (6172), 1248636 (2014).
  16. Stark, A., et al. Discovery of functional elements in 12 Drosophila genomes using evolutionary signatures. Nature. 450 (7167), 219-232 (2007).
  17. Lin, M. F., Jungreis, I., Kellis, M. PhyloCSF: a comparative genomics method to distinguish protein coding and non-coding regions. Bioinformatics. 27 (13), 275-282 (2011).
  18. Slavoff, S. A., et al. Peptidomic discovery of short open reading frame-encoded peptides in human cells. Nature Chemical Biology. 9 (1), 59-64 (2013).
  19. Schwaid, A. G., et al. Chemoproteomic discovery of cysteine-containing human short open reading frames. Journal of the American Chemical Society. 135 (45), 16750-16753 (2013).
  20. Ingolia, N. T., Brar, G. A., Rouskin, S., McGeachy, A. M., Weissman, J. S. Genome-wide annotation and quantitation of translation by ribosome profiling. Current Protocols in Molecular Biology. , 1-19 (2013).
  21. Ingolia, N. T., Ghaemmaghami, S., Newman, J. R., Weissman, J. S. Genome-wide analysis in vivo of translation with nucleotide resolution using ribosome profiling. Science. 324 (5924), 218-223 (2009).
  22. Xiao, Z., et al. De novo annotation and characterization of the translatome with ribosome profiling data. Nucleic Acids Research. 46 (10), 61 (2018).
  23. Lin, Y., et al. eIF3 Associates with 80S Ribosomes to Promote Translation Elongation, Mitochondrial Homeostasis, and Muscle Health. Molecular Cell. 79 (4), 575-587 (2020).
  24. . AGAT: Another Gff Analysis Toolkit to handle annotations in any GTF/GFF format Available from: https://agat.readthedocs.io/en/latest/gff_to_gtf.html (2020)
  25. . Gene Expression Omnibus Available from: https://www.ncbi.nim.nih.gov/geo (2002)
  26. Ingolia, N. T., Brar, G. A., Rouskin, S., McGeachy, A. M., Weissman, J. S. The ribosome profiling strategy for monitoring translation in vivo by deep sequencing of ribosome-protected mRNA fragments. Nature Protocols. 7 (8), 1534-1550 (2012).
  27. . STAR manual Available from: https://github.com/alexdobin/STAR/blob/master/doc/STARmanual.pdf (2022)
  28. . The genetic codes Available from: https://www.ncbi.nlm.nih.gov/Taxonomy/Utils/wprintgc.cgi (2019)
  29. . RiboMiner Available from: https://github.com/xryanglab/RiboMiner (2020)
  30. Ingolia, N. T., Hussmann, J. A., Weissman, J. S. Ribosome profiling: global views of translation. Cold Spring Harbor Perspectives in Biology. 11 (5), 032698 (2018).
  31. Lee, S., et al. Global mapping of translation initiation sites in mammalian cells at single-nucleotide resolution. Proceedings of the National Academy of Sciences of the United States of America. 109 (37), 2424-2432 (2012).
  32. Gao, X., et al. Quantitative profiling of initiating ribosomes in vivo. Nature Methods. 12 (2), 147-153 (2015).
  33. Spealman, P., Naik, A., McManus, J. uORF-seqr: A Machine Learning-Based approach to the identification of upstream open reading frames in yeast. Methods in Molecular Biol. 2252, 313-329 (2021).
  34. . RiboCode Available from: https://github.com/xryanglab/RiboCode (2018)
  35. Sharma, P., Wu, J., Nilges, B. S., Leidel, S. A. Humans and other commonly used model organisms are resistant to cycloheximide-mediated biases in ribosome profiling experiments. Nature Communications. 12 (1), 5094 (2021).
check_url/it/63366?article_type=t

Play Video

Citazione di questo articolo
Zhu, Y., Li, F., Yang, X., Xiao, Z. De novo Identification of Actively Translated Open Reading Frames with Ribosome Profiling Data. J. Vis. Exp. (180), e63366, doi:10.3791/63366 (2022).

View Video