Summary

데 노보 리보솜 프로파일링 데이터를 사용하여 능동적으로 번역된 오픈 리딩 프레임 식별

Published: February 18, 2022
doi:

Summary

리보솜을 번역하면 코돈 당 세 개의 뉴클레오티드를 펩티드로 해독합니다. 리보솜 프로파일링에 의해 포착된 mRNA를 따른 그들의 움직임은 특징적인 삼중항 주기성을 나타내는 발자국을 생성한다. 이 프로토콜은 RiboCode를 사용하여 리보솜 프로파일링 데이터에서 이 두드러진 기능을 해독하여 전체 전사체 수준에서 활발하게 번역된 열린 판독 프레임을 식별하는 방법을 설명합니다.

Abstract

개방 판독 프레임(ORF), 특히 작은 펩티드를 인코딩하고 특정 생리학적 맥락 하에서 활발히 번역되는 프레임의 확인은 문맥-의존적 경쇄의 포괄적인 주석에 매우 중요하다. 리보솜 프로파일링은 RNA에서 리보솜을 번역하는 결합 위치와 밀도를 검출하는 기술로, 게놈 전체 규모에서 번역이 일어나는 곳을 신속하게 발견할 수 있는 방법을 제공합니다. 그러나 생물 정보학에서 리보솜 프로파일 링을위한 번역 ORF를 효율적이고 포괄적으로 식별하는 것은 사소한 작업이 아닙니다. 여기에 설명된 RiboCode라는 사용하기 쉬운 패키지는 리보솜 프로파일링 데이터의 왜곡되고 모호한 신호로부터 모든 크기의 ORF를 능동적으로 번역하도록 설계되었습니다. 이전에 게시된 데이터 세트를 예로 들어 이 문서에서는 원시 데이터의 전처리부터 최종 출력 결과 파일의 해석에 이르기까지 전체 RiboCode 파이프라인에 대한 단계별 지침을 제공합니다. 또한, 주석이 달린 ORF의 번역률을 평가하기 위해, 각 ORF에 대한 리보솜 밀도의 시각화 및 정량화를 위한 절차도 상세히 설명된다. 요약하면, 본 기사는 번역, 작은 ORF 및 펩티드와 관련된 연구 분야에 유용하고시기 적절한 지침입니다.

Introduction

최근에, 연구의 증가는 긴 비 코딩 RNA (lncRNAs) 1,2,3,4,5,6,7,8과 같은 비 코딩 유전자와 이전에 주석이 달린 유전자의 ORFs에서 번역 된 펩티드의 광범위한 생산을 밝혀 냈습니다. 이들 번역된 ORF는 환경 변화, 스트레스 및 세포 분화에 반응하기 위해 세포에 의해 조절되거나 유도된다1,8,9,10,11,12,13. 일부 ORF의 번역 제품은 개발 및 생리학의 다양한 생물학적 과정에서 중요한 규제 역할을 수행하는 것으로 입증되었습니다. 예를 들어, Chng et al.14는 심혈관 발달에 중요한 Elabela (Ela, Apela / Ende / Toddler라고도 함)라는 펩티드 호르몬을 발견했습니다. Pauli et al.은 Ela가 초기 물고기 배아에서 세포 이동을 촉진하는 미토겐 역할을한다고 제안했습니다.15. Magny et al.은 칼슘 수송을 조절하고 초파리 심장의 규칙적인 근육 수축에 영향을 미치는 30 개 미만의 아미노산의 두 가지 마이크로 펩타이드를보고했습니다10.

얼마나 많은 그러한 펩티드가 게놈에 의해 암호화되는지, 그리고 그것들이 생물학적으로 관련이 있는지는 불분명하다. 따라서, 이러한 잠재적으로 코딩되는 ORF들의 체계적인 식별은 매우 바람직하다. 그러나, 진화적 보존16,17 및 질량 분광법18,19와 같은 전통적인 접근법을 사용하여 이들 ORFs(즉, 단백질 또는 펩티드)의 생성물을 직접 결정하는 것은 두 접근법의 검출 효율이 생산된 단백질 또는 펩티드 길이, 풍부도, 및 아미노산 조성에 의존하기 때문에 도전적이다. 뉴클레오티드 분해능에서 mRNAs에 대한 리보솜 점유를 확인하기 위한 기술인 리보솜 프로파일링의 출현은 그들의 길이와 조성에 관계없이 상이한 전사체3,20,21 코딩 잠재력을 평가하는 정확한 방법을 제공하였다. 리보솜 프로파일링을 사용하여 능동적으로 ORF를 번역하는 것을 확인하기 위해 중요하고 빈번하게 사용되는 특징은 시작 코돈에서 정지 코돈까지 mRNA에 대한 리보솜의 발자국의 3-뉴클레오티드(3-nt) 주기성이다. 그러나 리보솜 프로파일링 데이터에는 ORF를 따른 낮은 시퀀싱 및 희소 시퀀싱 판독, 높은 시퀀싱 노이즈 및 리보솜 RNA(rRNA) 오염 등 몇 가지 문제가 있는 경우가 많습니다. 따라서, 이러한 데이터에 의해 생성된 왜곡되고 모호한 신호는 mRNA에 대한 리보솜의 발자국의 3-nt 주기성 패턴을 약화시키고, 이는 궁극적으로 고신뢰도 번역된 ORF의 식별을 어렵게 만든다.

“RiboCode”라는 패키지는 수정된 Wilcoxon 서명 순위 테스트 및 P-값 통합 전략을 채택하여 ORF가 오프 프레임 RPFs22보다 훨씬 더 많은 프레임 내 리보솜 보호 단편(RPF)을 가지고 있는지 여부를 조사했습니다. 시뮬레이션된 실제 리보솜 프로파일링 데이터에서 트랜스라톰의 de novo 주석에 대해 매우 효율적이고 민감하며 정확한 것으로 입증되었습니다. 여기에서는 이 도구를 사용하여 이전 연구23에서 생성된 원시 리보솜 프로파일링 시퀀싱 데이터 세트에서 잠재적인 번역 ORF를 탐지하는 방법을 설명합니다. 이들 데이터세트는 대조군(si-Ctrl) 및 EIF3E(si-eIF3e) 소형 간섭 RNA(siRNAs)로 형질감염된 MCF-10A 세포의 리보솜 점유 프로파일을 비교함으로써 번역에서 EIF3 서브유닛 “E”( EIF3E )의 기능을 탐색하는데 사용되었다. 이러한 예제 데이터 세트에 RiboCode를 적용함으로써 잠재적으로 작은 펩티드 또는 단백질을 인코딩하는 5,633개의 새로운 ORF를 발견했습니다. 이들 ORF는 업스트림 ORF(uORF), 다운스트림 ORF(dORF), 중첩된 ORF, 신규한 단백질 코딩 유전자(신규한 PCGs)로부터의 ORF, 및 신규한 비단백질 코딩 유전자(신규한 NonPCGs)로부터의 ORF를 포함하는 코딩 영역에 대한 그들의 위치에 기초하여 다양한 유형으로 분류되었다. uORFs에 대한 RPF 판독 밀도는 대조군 세포에 비해 EIF3E 결핍 세포에서 유의하게 증가하였으며, 이는 적어도 부분적으로 능동적으로 번역하는 리보솜의 농축에 의해 야기될 수 있다. EIF3E 결핍 세포의 25번째 코돈으로부터 75번째 코돈까지의 영역에서의 국소화된 리보솜 축적은 초기 단계에서 번역 신장의 막힘을 나타내었다. 이 프로토콜은 또한 식별된 ORF에서 리보솜 발자국의 3-nt 주기성 패턴을 조사하기 위해 원하는 영역의 RPF 밀도를 시각화하는 방법을 보여줍니다. 이러한 분석은 ORF를 번역하고 번역 규정을 연구하는 RiboCode의 강력한 역할을 보여줍니다.

Protocol

1. 환경 설정 및 리보코드 설치 Linux 터미널 창을 열고 conda 환경을 만듭니다.conda create -n RiboCode python=3.8 생성 된 환경으로 전환하고 RiboCode 및 종속성을 설치하십시오.콘다 리보 코드 활성화conda install -c bioconda ribocode ribominer sra-tools fastx_toolkit cutadapt bowtie star samtools 2. 데이터 준비 게놈 참조 파일을 가?…

Representative Results

예시적인 리보솜 프로파일링 데이터세트는 수탁 번호 GSE131074 하에 GEO 데이터베이스에 기탁되었다. 이 프로토콜에 사용 된 모든 파일과 코드는 보충 파일 1-4에서 사용할 수 있습니다. 공개된 리보솜 프로파일링 세트23의 세트에 리보코드를 적용함으로써, 우리는 대조군 및 EIF3E siRNA로 처리된 MCF-10A 세포에서 활발히 번역된 신규한 ORF를…

Discussion

리보솜 프로파일링은 게놈 규모로 세포에서 리보솜의 작용을 연구할 수 있는 전례 없는 기회를 제공합니다. 리보솜 프로파일링 데이터에 의해 전달된 정보를 정확하게 해독하면 유전자 또는 전사체의 어느 영역이 활발히 번역되고 있는지에 대한 통찰력을 얻을 수 있다. 이 단계별 프로토콜은 RiboCode를 사용하여 패키지 설치, 데이터 준비, 명령 실행, 결과 설명 및 데이터 시각화를 포함하여 리보?…

Disclosures

The authors have nothing to disclose.

Acknowledgements

저자는 Xi’an Jiaotong University의 HPCC 플랫폼이 제공하는 컴퓨팅 리소스의 지원을 인정하고 싶습니다. Z.X.는 Xi’an Jiaotong University의 Young Topnotch Talent Support Plan에 감사드립니다.

Materials

A computer/server running Linux Any
Anaconda or Miniconda Anaconda Anaconda: https://www.anaconda.com; Miniconda:https://docs.conda.io/en/latest/miniconda.html
R R Foundation https://www.r-project.org/
Rstudio Rstudio https://www.rstudio.com/

References

  1. Eisenberg, A. R., et al. Translation Initiation Site Profiling Reveals Widespread Synthesis of Non-AUG-Initiated Protein Isoforms in Yeast. Cell Systems. 11 (2), 145-160 (2020).
  2. Spealman, P., et al. Conserved non-AUG uORFs revealed by a novel regression analysis of ribosome profiling data. Genome Research. 28 (2), 214-222 (2018).
  3. Ingolia, N. T., Lareau, L. F., Weissman, J. S. Ribosome profiling of mouse embryonic stem cells reveals the complexity and dynamics of mammalian proteomes. Cell. 147 (4), 789-802 (2011).
  4. Bazzini, A. A., et al. Identification of small ORFs in vertebrates using ribosome footprinting and evolutionary conservation. The EMBO Journal. 33 (9), 981-993 (2014).
  5. Ingolia, N. T., et al. Ribosome profiling reveals pervasive translation outside of annotated protein-coding genes. Cell Reports. 8 (5), 1365-1379 (2014).
  6. Chew, G. L., Pauli, A., Schier, A. F. Conservation of uORF repressiveness and sequence features in mouse, human and zebrafish. Nature Communications. 7, 11663 (2016).
  7. Zhang, H., et al. Determinants of genome-wide distribution and evolution of uORFs in eukaryotes. Nature Communications. 12 (1), 1076 (2021).
  8. Guenther, U. P., et al. The helicase Ded1p controls use of near-cognate translation initiation codons in 5′ UTRs. Nature. 559 (7712), 130-134 (2018).
  9. Goldsmith, J., et al. Ribosome profiling reveals a functional role for autophagy in mRNA translational control. Communications Biology. 3 (1), 388 (2020).
  10. Magny, E. G., et al. Conserved regulation of cardiac calcium uptake by peptides encoded in small open reading frames. Science. 341 (6150), 1116-1120 (2013).
  11. Stumpf, C. R., Moreno, M. V., Olshen, A. B., Taylor, B. S., Ruggero, D. The translational landscape of the mammalian cell cycle. Molecular Cell. 52 (4), 574-582 (2013).
  12. Gerashchenko, M. V., Lobanov, A. V., Gladyshev, V. N. Genome-wide ribosome profiling reveals complex translational regulation in response to oxidative stress. Proceedings of the National Academy of Sciences of the United States of America. 109 (43), 17394-17399 (2012).
  13. Andreev, D. E., et al. Oxygen and glucose deprivation induces widespread alterations in mRNA translation within 20 minutes. Genome Biology. 16, 90 (2015).
  14. Chng, S. C., Ho, L., Tian, J., Reversade, B. ELABELA: a hormone essential for heart development signals via the apelin receptor. Developmental Cell. 27 (6), 672-680 (2013).
  15. Pauli, A., et al. Toddler: an embryonic signal that promotes cell movement via Apelin receptors. Science. 343 (6172), 1248636 (2014).
  16. Stark, A., et al. Discovery of functional elements in 12 Drosophila genomes using evolutionary signatures. Nature. 450 (7167), 219-232 (2007).
  17. Lin, M. F., Jungreis, I., Kellis, M. PhyloCSF: a comparative genomics method to distinguish protein coding and non-coding regions. Bioinformatics. 27 (13), 275-282 (2011).
  18. Slavoff, S. A., et al. Peptidomic discovery of short open reading frame-encoded peptides in human cells. Nature Chemical Biology. 9 (1), 59-64 (2013).
  19. Schwaid, A. G., et al. Chemoproteomic discovery of cysteine-containing human short open reading frames. Journal of the American Chemical Society. 135 (45), 16750-16753 (2013).
  20. Ingolia, N. T., Brar, G. A., Rouskin, S., McGeachy, A. M., Weissman, J. S. Genome-wide annotation and quantitation of translation by ribosome profiling. Current Protocols in Molecular Biology. , 1-19 (2013).
  21. Ingolia, N. T., Ghaemmaghami, S., Newman, J. R., Weissman, J. S. Genome-wide analysis in vivo of translation with nucleotide resolution using ribosome profiling. Science. 324 (5924), 218-223 (2009).
  22. Xiao, Z., et al. De novo annotation and characterization of the translatome with ribosome profiling data. Nucleic Acids Research. 46 (10), 61 (2018).
  23. Lin, Y., et al. eIF3 Associates with 80S Ribosomes to Promote Translation Elongation, Mitochondrial Homeostasis, and Muscle Health. Molecular Cell. 79 (4), 575-587 (2020).
  24. . AGAT: Another Gff Analysis Toolkit to handle annotations in any GTF/GFF format Available from: https://agat.readthedocs.io/en/latest/gff_to_gtf.html (2020)
  25. . Gene Expression Omnibus Available from: https://www.ncbi.nim.nih.gov/geo (2002)
  26. Ingolia, N. T., Brar, G. A., Rouskin, S., McGeachy, A. M., Weissman, J. S. The ribosome profiling strategy for monitoring translation in vivo by deep sequencing of ribosome-protected mRNA fragments. Nature Protocols. 7 (8), 1534-1550 (2012).
  27. . STAR manual Available from: https://github.com/alexdobin/STAR/blob/master/doc/STARmanual.pdf (2022)
  28. . The genetic codes Available from: https://www.ncbi.nlm.nih.gov/Taxonomy/Utils/wprintgc.cgi (2019)
  29. . RiboMiner Available from: https://github.com/xryanglab/RiboMiner (2020)
  30. Ingolia, N. T., Hussmann, J. A., Weissman, J. S. Ribosome profiling: global views of translation. Cold Spring Harbor Perspectives in Biology. 11 (5), 032698 (2018).
  31. Lee, S., et al. Global mapping of translation initiation sites in mammalian cells at single-nucleotide resolution. Proceedings of the National Academy of Sciences of the United States of America. 109 (37), 2424-2432 (2012).
  32. Gao, X., et al. Quantitative profiling of initiating ribosomes in vivo. Nature Methods. 12 (2), 147-153 (2015).
  33. Spealman, P., Naik, A., McManus, J. uORF-seqr: A Machine Learning-Based approach to the identification of upstream open reading frames in yeast. Methods in Molecular Biol. 2252, 313-329 (2021).
  34. . RiboCode Available from: https://github.com/xryanglab/RiboCode (2018)
  35. Sharma, P., Wu, J., Nilges, B. S., Leidel, S. A. Humans and other commonly used model organisms are resistant to cycloheximide-mediated biases in ribosome profiling experiments. Nature Communications. 12 (1), 5094 (2021).
check_url/63366?article_type=t

Play Video

Cite This Article
Zhu, Y., Li, F., Yang, X., Xiao, Z. De novo Identification of Actively Translated Open Reading Frames with Ribosome Profiling Data. J. Vis. Exp. (180), e63366, doi:10.3791/63366 (2022).

View Video