Summary

De novo リボソームプロファイリングデータによるアクティブに翻訳されたオープンリーディングフレームの同定

Published: February 18, 2022
doi:

Summary

リボソームを翻訳すると、コドンあたり3つのヌクレオチドがペプチドに解読される。リボソームプロファイリングによって捕捉されたmRNAに沿ったそれらの動きは、特徴的な三重項周期性を示すフットプリントを生成する。このプロトコルでは、RiboCodeを使用してリボソームプロファイリングデータからこの顕著な特徴を解読し、トランスクリプトーム全体でアクティブに翻訳されたオープンリーディングフレームを特定する方法について説明します。

Abstract

オープンリーディングフレーム(ORF)、特に小さなペプチドをコードし、特定の生理学的文脈の下で積極的に翻訳されるフレームの同定は、文脈依存性翻訳体の包括的な注釈付けにとって重要である。RNA上の翻訳リボソームの結合位置と密度を検出する技術であるリボソームプロファイリングは、翻訳がゲノムワイドスケールでどこで起こっているかを迅速に発見する手段を提供します。しかし、リボソームプロファイリングのために翻訳ORFを効率的かつ包括的に同定することは、バイオインフォマティクスにおいて些細な作業ではありません。ここでは、RiboCodeという名前の使いやすいパッケージで、リボソームプロファイリングデータ内の歪んだあいまいな信号から任意のサイズのORFを積極的に変換するように設計されています。この記事では、以前に公開したデータセットを例にとり、生データの前処理から最終的な出力結果ファイルの解釈まで、RiboCodeパイプライン全体について段階的な手順を説明します。さらに、注釈付きORFの翻訳速度を評価するための、各ORF上のリボソーム密度の可視化および定量化のための手順も詳細に説明される。要約すると、本稿は、翻訳、小型ORF、およびペプチドに関連する研究分野のための有用かつタイムリーな指示である。

Introduction

最近、ますます多くの研究により、コード遺伝子のORFおよび以前に注釈が付けられた遺伝子から翻訳されたペプチドが、長い非コードRNA(lncRNA)12345678などの非コードとして広く産生されることが明らかになりました。これらの翻訳ORFは、環境変化、ストレス、および細胞分化に応答するように細胞によって調節または誘導される189、10111213いくつかのORFの翻訳産物は、発生および生理学における多様な生物学的プロセスにおいて重要な調節的役割を果たすことが実証されている。例えば、Chngら14は、心血管の発達に重要なエラベラ(Ela、Apela/Ende/Toddlerとしても知られている)という名前のペプチドホルモンを発見しました。Pauliらは、エラが初期魚の胚における細胞移動を促進するマイトジェンとしても作用することを示唆した15。Magnyらは、カルシウム輸送を調節し、ショウジョウバエの心臓における規則的な筋肉収縮に影響を及ぼす30アミノ酸未満の2つのマイクロペプチドを報告した10

そのようなペプチドがゲノムによってコードされている数と、それらが生物学的に関連性があるかどうかは不明のままである。したがって、これらの潜在的にコードORFの系統的同定は非常に望ましい。しかしながら、進化的保存16,17および質量分析18,19などの伝統的なアプローチを用いて、これらのORFの産物(すなわち、タンパク質またはペプチド)を直接決定することは、両方のアプローチの検出効率が産生されたタンパク質またはペプチドの長さ、存在量、およびアミノ酸組成に依存するため、困難である。ヌクレオチド分解能でmRNA上のリボソーム占有率を同定する技術であるリボソームプロファイリングの出現は、その長さおよび組成に関係なく、異なる転写産物のコードポテンシャルを評価する正確な方法を提供しました32021リボソームプロファイリングを用いて能動的に翻訳するORFを同定するために重要かつ頻繁に使用される特徴は、開始コドンから終止コドンまでのmRNA上のリボソームのフットプリントの3ヌクレオチド(3-nt)周期性である。しかし、リボソームプロファイリングデータには、ORFに沿った低シーケンシングリードとスパースシーケンシングリード、高いシーケンシングノイズ、リボソームRNA(rRNA)汚染など、いくつかの問題があることがよくあります。したがって、このようなデータによって生成される歪んだ曖昧なシグナルは、mRNA上のリボソームのフットプリントの3-nt周期性パターンを弱め、最終的に高信頼の翻訳ORFの同定を困難にする。

「RiboCode」という名前のパッケージは、修正されたウィルコクソン符号化検定とP値統合戦略を適応させ、ORFがオフフレームRPFよりも有意に多くのインフレームリボソーム保護フラグメント(RPF)を有するかどうかを調べた22。これは、シミュレートされた実際のリボソームプロファイリングデータにおける翻訳体のde novo注釈に対して、非常に効率的で、敏感で、正確であることが実証された。ここでは、このツールを使用して、前の研究によって生成された生のリボソームプロファイリングシーケンシングデータセットから潜在的な翻訳ORFを検出する方法について説明します23。これらのデータセットは、コントロール(si-Ctrl)およびEIF3E(si-eIF3e)小干渉RNA(siRNA)を導入したMCF-10A細胞のリボソーム占有プロファイルを比較することによって、翻訳におけるEIF3サブユニット「E」(EIF3E)の機能を探索するために使用されていた。これらのサンプルデータセットにRiboCodeを適用することにより、小さなペプチドまたはタンパク質をコードする可能性のある5,633の新規ORFを検出しました。これらのORFは、上流ORF(uORF)、下流ORF(dORF)、重複ORF、新規タンパク質コード遺伝子由来のORF(新規PCG)、新規非タンパク質コード遺伝子由来のORF(新規NonPCG)など、コード領域に対する位置に基づいて様々なタイプに分類された。uORFのRPF読み取り密度は、対照細胞と比較してEIF3E欠損細胞において有意に増加し、これは少なくとも部分的には、能動的に翻訳されるリボソームの濃縮によって引き起こされる可能性がある。EIF3E欠損細胞のコドン25番目から75番目までの領域に局在するリボソーム蓄積は、初期段階における翻訳伸長の閉塞を示した。このプロトコルはまた、同定されたORF上のリボソームフットプリントの3-nt周期性パターンを調べるために、所望の領域のRPF密度を視覚化する方法も示している。これらの分析は、翻訳ORFを特定し、翻訳の規制を研究する上でのRiboCodeの強力な役割を示しています。

Protocol

1. 環境設定とリボコードのインストール Linux 端末ウィンドウを開き、conda 環境を作成します。conda create -n RiboCode python=3.8 作成した環境に切り替えて、RiboCode と依存関係をインストールします。コンダはリボコードをアクティブにするconda install -c bioconda ribocode ribominer sra-tools fastx_toolkit cutadapt bowtie star samtools 2. ?…

Representative Results

リボソームプロファイリングデータセットの例は、アクセッション番号GSE131074でGEOデータベースに寄託されました。このプロトコルで使用されるすべてのファイルとコードは、補足ファイル 1 ~ 4 から入手できます。リボソームプロファイリングデータセット23の公開セットにRiboCodeを適用することにより、コントロールおよびEIF3E…

Discussion

リボソームプロファイリングは、細胞におけるリボソームの作用をゲノムスケールで研究する前例のない機会を提供します。リボソームプロファイリングデータによって運ばれる情報を正確に解読することで、遺伝子または転写産物のどの領域が積極的に翻訳されているかについての洞察が得られる可能性があります。このステップバイステップのプロトコルは、パッケージのインストール?…

Divulgations

The authors have nothing to disclose.

Acknowledgements

著者らは、西安交通大学のHPCCプラットフォームによって提供される計算リソースからの支援に感謝したい。Z.X.は、西安交通大学のヤング・トップ・ノッチ・タレント・サポート・プランに感謝の意を表します。

Materials

A computer/server running Linux Any
Anaconda or Miniconda Anaconda Anaconda: https://www.anaconda.com; Miniconda:https://docs.conda.io/en/latest/miniconda.html
R R Foundation https://www.r-project.org/
Rstudio Rstudio https://www.rstudio.com/

References

  1. Eisenberg, A. R., et al. Translation Initiation Site Profiling Reveals Widespread Synthesis of Non-AUG-Initiated Protein Isoforms in Yeast. Cell Systems. 11 (2), 145-160 (2020).
  2. Spealman, P., et al. Conserved non-AUG uORFs revealed by a novel regression analysis of ribosome profiling data. Genome Research. 28 (2), 214-222 (2018).
  3. Ingolia, N. T., Lareau, L. F., Weissman, J. S. Ribosome profiling of mouse embryonic stem cells reveals the complexity and dynamics of mammalian proteomes. Cell. 147 (4), 789-802 (2011).
  4. Bazzini, A. A., et al. Identification of small ORFs in vertebrates using ribosome footprinting and evolutionary conservation. The EMBO Journal. 33 (9), 981-993 (2014).
  5. Ingolia, N. T., et al. Ribosome profiling reveals pervasive translation outside of annotated protein-coding genes. Cell Reports. 8 (5), 1365-1379 (2014).
  6. Chew, G. L., Pauli, A., Schier, A. F. Conservation of uORF repressiveness and sequence features in mouse, human and zebrafish. Nature Communications. 7, 11663 (2016).
  7. Zhang, H., et al. Determinants of genome-wide distribution and evolution of uORFs in eukaryotes. Nature Communications. 12 (1), 1076 (2021).
  8. Guenther, U. P., et al. The helicase Ded1p controls use of near-cognate translation initiation codons in 5′ UTRs. Nature. 559 (7712), 130-134 (2018).
  9. Goldsmith, J., et al. Ribosome profiling reveals a functional role for autophagy in mRNA translational control. Communications Biology. 3 (1), 388 (2020).
  10. Magny, E. G., et al. Conserved regulation of cardiac calcium uptake by peptides encoded in small open reading frames. Science. 341 (6150), 1116-1120 (2013).
  11. Stumpf, C. R., Moreno, M. V., Olshen, A. B., Taylor, B. S., Ruggero, D. The translational landscape of the mammalian cell cycle. Molecular Cell. 52 (4), 574-582 (2013).
  12. Gerashchenko, M. V., Lobanov, A. V., Gladyshev, V. N. Genome-wide ribosome profiling reveals complex translational regulation in response to oxidative stress. Proceedings of the National Academy of Sciences of the United States of America. 109 (43), 17394-17399 (2012).
  13. Andreev, D. E., et al. Oxygen and glucose deprivation induces widespread alterations in mRNA translation within 20 minutes. Genome Biology. 16, 90 (2015).
  14. Chng, S. C., Ho, L., Tian, J., Reversade, B. ELABELA: a hormone essential for heart development signals via the apelin receptor. Developmental Cell. 27 (6), 672-680 (2013).
  15. Pauli, A., et al. Toddler: an embryonic signal that promotes cell movement via Apelin receptors. Science. 343 (6172), 1248636 (2014).
  16. Stark, A., et al. Discovery of functional elements in 12 Drosophila genomes using evolutionary signatures. Nature. 450 (7167), 219-232 (2007).
  17. Lin, M. F., Jungreis, I., Kellis, M. PhyloCSF: a comparative genomics method to distinguish protein coding and non-coding regions. Bioinformatics. 27 (13), 275-282 (2011).
  18. Slavoff, S. A., et al. Peptidomic discovery of short open reading frame-encoded peptides in human cells. Nature Chemical Biology. 9 (1), 59-64 (2013).
  19. Schwaid, A. G., et al. Chemoproteomic discovery of cysteine-containing human short open reading frames. Journal of the American Chemical Society. 135 (45), 16750-16753 (2013).
  20. Ingolia, N. T., Brar, G. A., Rouskin, S., McGeachy, A. M., Weissman, J. S. Genome-wide annotation and quantitation of translation by ribosome profiling. Current Protocols in Molecular Biology. , 1-19 (2013).
  21. Ingolia, N. T., Ghaemmaghami, S., Newman, J. R., Weissman, J. S. Genome-wide analysis in vivo of translation with nucleotide resolution using ribosome profiling. Science. 324 (5924), 218-223 (2009).
  22. Xiao, Z., et al. De novo annotation and characterization of the translatome with ribosome profiling data. Nucleic Acids Research. 46 (10), 61 (2018).
  23. Lin, Y., et al. eIF3 Associates with 80S Ribosomes to Promote Translation Elongation, Mitochondrial Homeostasis, and Muscle Health. Molecular Cell. 79 (4), 575-587 (2020).
  24. . AGAT: Another Gff Analysis Toolkit to handle annotations in any GTF/GFF format Available from: https://agat.readthedocs.io/en/latest/gff_to_gtf.html (2020)
  25. . Gene Expression Omnibus Available from: https://www.ncbi.nim.nih.gov/geo (2002)
  26. Ingolia, N. T., Brar, G. A., Rouskin, S., McGeachy, A. M., Weissman, J. S. The ribosome profiling strategy for monitoring translation in vivo by deep sequencing of ribosome-protected mRNA fragments. Nature Protocols. 7 (8), 1534-1550 (2012).
  27. . STAR manual Available from: https://github.com/alexdobin/STAR/blob/master/doc/STARmanual.pdf (2022)
  28. . The genetic codes Available from: https://www.ncbi.nlm.nih.gov/Taxonomy/Utils/wprintgc.cgi (2019)
  29. . RiboMiner Available from: https://github.com/xryanglab/RiboMiner (2020)
  30. Ingolia, N. T., Hussmann, J. A., Weissman, J. S. Ribosome profiling: global views of translation. Cold Spring Harbor Perspectives in Biology. 11 (5), 032698 (2018).
  31. Lee, S., et al. Global mapping of translation initiation sites in mammalian cells at single-nucleotide resolution. Proceedings of the National Academy of Sciences of the United States of America. 109 (37), 2424-2432 (2012).
  32. Gao, X., et al. Quantitative profiling of initiating ribosomes in vivo. Nature Methods. 12 (2), 147-153 (2015).
  33. Spealman, P., Naik, A., McManus, J. uORF-seqr: A Machine Learning-Based approach to the identification of upstream open reading frames in yeast. Methods in Molecular Biol. 2252, 313-329 (2021).
  34. . RiboCode Available from: https://github.com/xryanglab/RiboCode (2018)
  35. Sharma, P., Wu, J., Nilges, B. S., Leidel, S. A. Humans and other commonly used model organisms are resistant to cycloheximide-mediated biases in ribosome profiling experiments. Nature Communications. 12 (1), 5094 (2021).
check_url/fr/63366?article_type=t

Play Video

Citer Cet Article
Zhu, Y., Li, F., Yang, X., Xiao, Z. De novo Identification of Actively Translated Open Reading Frames with Ribosome Profiling Data. J. Vis. Exp. (180), e63366, doi:10.3791/63366 (2022).

View Video