Summary

De novo Aktif Olarak Çevrilmiş Açık Okuma Çerçevelerinin Ribozom Profil Oluşturma Verileri ile Tanımlanması

Published: February 18, 2022
doi:

Summary

Ribozomların çevrilmesi, kodon başına üç nükleotidin peptitlere şifresini çözer. Ribozom profillemesi ile yakalanan mRNA boyunca hareketleri, karakteristik üçlü periyodiklik sergileyen ayak izlerini üretir. Bu protokol, tüm transkriptom düzeyinde aktif olarak çevrilmiş açık okuma çerçevelerini tanımlamak için ribozom profil oluşturma verilerinden bu belirgin özelliği deşifre etmek için RiboCode’un nasıl kullanılacağını açıklar.

Abstract

Açık okuma çerçevelerinin (ORF’ler), özellikle küçük peptitleri kodlayan ve belirli fizyolojik bağlamlar altında aktif olarak çevrilenlerin tanımlanması, bağlama bağlı translatomların kapsamlı ek açıklamaları için kritik öneme sahiptir. RNA üzerindeki ribozomları çevirmenin bağlanma yerlerini ve yoğunluklarını tespit etmek için kullanılan bir teknik olan ribozom profilleme, genom çapında çevirinin nerede gerçekleştiğini hızlı bir şekilde keşfetmek için bir yol sunar. Bununla birlikte, biyoinformatikte, ribozom profillemesi için çeviri yapan ORF’leri verimli ve kapsamlı bir şekilde tanımlamak önemsiz bir görev değildir. Burada, ribozom profil oluşturma verilerindeki bozuk ve belirsiz sinyallerden herhangi bir boyuttaki ORF’leri aktif olarak çevirmek için tasarlanmış RiboCode adlı kullanımı kolay bir paket açıklanmaktadır. Daha önce yayımlanmış veri kümemizi örnek alan bu makalede, ham verilerin önceden işlenmesinden nihai çıktı sonucu dosyalarının yorumlanmasına kadar tüm RiboCode işlem hattı için adım adım yönergeler sağlanmaktadır. Ayrıca, açıklamalı ORF’lerin çeviri oranlarını değerlendirmek için, her bir ORF’deki ribozom yoğunluklarının görselleştirilmesi ve ölçülmesi için prosedürler de ayrıntılı olarak açıklanmaktadır. Özetle, bu makale çeviri, küçük ORF’ler ve peptitlerle ilgili araştırma alanları için yararlı ve zamanında bir talimattır.

Introduction

Son zamanlarda, giderek artan bir çalışma grubu, kodlayan genlerin ORF’lerinden ve daha önce açıklanmış genlerden kodlanmamış olarak çevrilmiş peptitlerin yaygın bir şekilde üretildiğini ortaya koymuştur, örneğin uzun kodlamayan RNA’lar (lncRNA’lar)1,2,3,4,5,6,7,8. Bu çevrilmiş ORF’ler, çevresel değişikliklere, strese ve hücre farklılaşmasına yanıt vermek için hücreler tarafından düzenlenir veya uyarılır1,8,9,10,11,12,13. Bazı ORF’lerin çeviri ürünlerinin, gelişim ve fizyolojideki çeşitli biyolojik süreçlerde önemli düzenleyici roller oynadığı gösterilmiştir. Örneğin, Chng ve ark.14, kardiyovasküler gelişim için kritik olan Elabela (Ela, Apela / Ende / Toddler olarak da bilinir) adlı bir peptid hormonu keşfetti. Pauli ve ark., Ela’nın ayrıca erken balık embriyosunda hücre göçünü teşvik eden bir mitojen görevi gördüğünü öne sürdü15. Magny ve ark., kalsiyum taşınımını düzenleyen ve Drosophila kalbindeki düzenli kas kasılmasını etkileyen 30’dan az amino asitten oluşan iki mikropeptit bildirmiştir10.

Bu tür peptitlerin genom tarafından kaç tane kodlandığı ve biyolojik olarak alakalı olup olmadıkları belirsizliğini korumaktadır. Bu nedenle, bu potansiyel olarak kodlayan ORF’lerin sistematik olarak tanımlanması oldukça arzu edilir. Bununla birlikte, evrimsel koruma16,17 ve kütle spektrometrisi18,19 gibi geleneksel yaklaşımları kullanarak bu ORF’lerin (yani protein veya peptit) ürünlerini doğrudan belirlemek zordur, çünkü her iki yaklaşımın da tespit verimliliği, üretilen proteinlerin veya peptitlerin uzunluğuna, bolluğuna ve amino asit bileşimine bağlıdır. Nükleotid çözünürlüğünde mRNA’lar üzerindeki ribozom doluluğunu tanımlamak için bir teknik olan ribozom profillemesinin ortaya çıkışı, uzunluklarına ve bileşimlerine bakılmaksızın farklı transkriptlerin kodlama potansiyelini değerlendirmek için kesin bir yol sağlamıştır3,20,21. Ribozom profillemesini kullanarak aktif olarak çevrilen ORF’leri tanımlamak için önemli ve sık kullanılan bir özellik, ribozomun mRNA üzerindeki ayak izlerinin başlangıç kodonundan durdurma kodonuna kadar üç nükleotid (3-nt) periyodikliğidir. Bununla birlikte, ribozom profilleme verileri genellikle ORF’ler boyunca düşük ve seyrek dizileme okumaları, yüksek dizileme gürültüsü ve ribozomal RNA (rRNA) kontaminasyonları dahil olmak üzere çeşitli sorunlara sahiptir. Bu nedenle, bu tür veriler tarafından üretilen çarpık ve belirsiz sinyaller, ribozomların mRNA üzerindeki ayak izlerinin 3-nt periyodiklik kalıplarını zayıflatır ve bu da sonuçta yüksek güvenilirliğe sahip çevrilmiş ORF’lerin tanımlanmasını zorlaştırır.

“RiboCode” adlı bir paket, ORF’nin çerçeve dışı RPF’lerden önemli ölçüde daha fazla kare içi ribozom korumalı parçaya (RPF) sahip olup olmadığını incelemek için değiştirilmiş bir Wilcoxon imzalı sıralama testi ve P değeri entegrasyon stratejisini uyarladı22. Simüle edilmiş ve gerçek ribozom profil oluşturma verilerinde translatomun de novo ek açıklaması için son derece verimli, hassas ve doğru olduğu gösterilmiştir. Burada, önceki çalışma tarafından oluşturulan ham ribozom profil oluşturma sıralama veri kümelerinden potansiyel çeviri ORF’lerini tespit etmek için bu aracın nasıl kullanılacağını açıklıyoruz23. Bu veri kümeleri, kontrol (si-Ctrl) ve EIF3E (si-eIF3e) küçük müdahale eden RNA’lar (siRNA’lar) ile transfekte edilen MCF-10A hücrelerinin ribozom doluluk profillerini karşılaştırarak çeviride EIF3 alt birimi “E” nin (EIF3E) işlevini araştırmak için kullanılmıştır. RiboCode’u bu örnek veri kümelerine uygulayarak, potansiyel olarak küçük peptitleri veya proteinleri kodlayan 5.633 yeni ORF tespit ettik. Bu ORF’ler, yukarı akış ORF’leri (uORF’ler), aşağı akış ORF’leri (dORF’ler), üst üste binen ORF’ler, yeni protein kodlayan genlerden (yeni PCG’ler) ORF’ler ve yeni protein kodlamayan genlerden (yeni NonPCG’ler) ORF’ler dahil olmak üzere kodlama bölgelerine göre konumlarına göre çeşitli tiplerde kategorize edildi. uORF’ler üzerindeki RPF okuma yoğunlukları, kontrol hücrelerine kıyasla EIF3E eksikliği olan hücrelerde önemli ölçüde artmıştır, bu da en azından kısmen aktif olarak çevrilen ribozomların zenginleşmesinden kaynaklanabilir. EIF3E eksikliği olan hücrelerin 25. ila 75. kodonu arasındaki bölgede lokalize ribozom birikimi, erken evrede translasyon uzamasının tıkandığını göstermiştir. Bu protokol ayrıca, tanımlanan ORF’ler üzerindeki ribozom ayak izlerinin 3-nt periyodiklik modellerini incelemek için istenen bölgenin RPF yoğunluğunun nasıl görselleştirileceğini de göstermektedir. Bu analizler, RiboCode’un ORF’lerin çevirisini tanımlamadaki ve çevirinin düzenlenmesini incelemedeki güçlü rolünü göstermektedir.

Protocol

1. Ortam kurulumu ve RiboCode kurulumu Bir Linux terminal penceresi açın ve bir conda ortamı oluşturun:conda create -n RiboCode python=3.8 Oluşturulan ortama geçin ve RiboCode ve bağımlılıklarını yükleyin:conda RiboCode’u etkinleştirconda yüklemek -c bioconda ribocode ribominer sra-tools fastx_toolkit cutadapt papyon yıldız samtools 2. Veri hazırlama Genom referans dosyaları…

Representative Results

Örnek ribozom profil oluşturma veri kümeleri, GEO veritabanında GSE131074 katılım numarası altında depolanmıştır. Bu protokolde kullanılan tüm dosyalar ve kodlar Ek dosyalar 1-4’ten edinilebilir. RiboCode’u bir dizi yayınlanmış ribozom profilleme veri kümesine23 uygulayarak, kontrol ve EIF3E siRNA’ları ile tedavi edilen MCF-10A hücrelerinde aktif olarak çevrilen yeni ORF’leri tanımladık. Büyük olasılıkla çeviri …

Discussion

Ribozom profilleme, ribozomların hücrelerdeki etkisini genom ölçeğinde incelemek için benzeri görülmemiş bir fırsat sunar. Ribozom profilleme verileri tarafından taşınan bilgilerin tam olarak deşifre edilmesi, hangi gen bölgelerinin veya transkriptlerin aktif olarak çevrildiğine dair fikir verebilir. Bu adım adım protokol, ribozom profil oluşturma verilerini paket yükleme, veri hazırlama, komut yürütme, sonuç açıklaması ve veri görselleştirme dahil olmak üzere ayrıntılı olarak analiz etm…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Yazarlar, Xi’an Jiaotong Üniversitesi’nin HPCC platformu tarafından sağlanan hesaplama kaynaklarından gelen desteği kabul etmek istiyor. Z.X., Xi’an Jiaotong Üniversitesi’nin Genç Topnotch Yetenek Destek Planı’na minnetle teşekkür eder.

Materials

A computer/server running Linux Any
Anaconda or Miniconda Anaconda Anaconda: https://www.anaconda.com; Miniconda:https://docs.conda.io/en/latest/miniconda.html
R R Foundation https://www.r-project.org/
Rstudio Rstudio https://www.rstudio.com/

References

  1. Eisenberg, A. R., et al. Translation Initiation Site Profiling Reveals Widespread Synthesis of Non-AUG-Initiated Protein Isoforms in Yeast. Cell Systems. 11 (2), 145-160 (2020).
  2. Spealman, P., et al. Conserved non-AUG uORFs revealed by a novel regression analysis of ribosome profiling data. Genome Research. 28 (2), 214-222 (2018).
  3. Ingolia, N. T., Lareau, L. F., Weissman, J. S. Ribosome profiling of mouse embryonic stem cells reveals the complexity and dynamics of mammalian proteomes. Cell. 147 (4), 789-802 (2011).
  4. Bazzini, A. A., et al. Identification of small ORFs in vertebrates using ribosome footprinting and evolutionary conservation. The EMBO Journal. 33 (9), 981-993 (2014).
  5. Ingolia, N. T., et al. Ribosome profiling reveals pervasive translation outside of annotated protein-coding genes. Cell Reports. 8 (5), 1365-1379 (2014).
  6. Chew, G. L., Pauli, A., Schier, A. F. Conservation of uORF repressiveness and sequence features in mouse, human and zebrafish. Nature Communications. 7, 11663 (2016).
  7. Zhang, H., et al. Determinants of genome-wide distribution and evolution of uORFs in eukaryotes. Nature Communications. 12 (1), 1076 (2021).
  8. Guenther, U. P., et al. The helicase Ded1p controls use of near-cognate translation initiation codons in 5′ UTRs. Nature. 559 (7712), 130-134 (2018).
  9. Goldsmith, J., et al. Ribosome profiling reveals a functional role for autophagy in mRNA translational control. Communications Biology. 3 (1), 388 (2020).
  10. Magny, E. G., et al. Conserved regulation of cardiac calcium uptake by peptides encoded in small open reading frames. Science. 341 (6150), 1116-1120 (2013).
  11. Stumpf, C. R., Moreno, M. V., Olshen, A. B., Taylor, B. S., Ruggero, D. The translational landscape of the mammalian cell cycle. Molecular Cell. 52 (4), 574-582 (2013).
  12. Gerashchenko, M. V., Lobanov, A. V., Gladyshev, V. N. Genome-wide ribosome profiling reveals complex translational regulation in response to oxidative stress. Proceedings of the National Academy of Sciences of the United States of America. 109 (43), 17394-17399 (2012).
  13. Andreev, D. E., et al. Oxygen and glucose deprivation induces widespread alterations in mRNA translation within 20 minutes. Genome Biology. 16, 90 (2015).
  14. Chng, S. C., Ho, L., Tian, J., Reversade, B. ELABELA: a hormone essential for heart development signals via the apelin receptor. Developmental Cell. 27 (6), 672-680 (2013).
  15. Pauli, A., et al. Toddler: an embryonic signal that promotes cell movement via Apelin receptors. Science. 343 (6172), 1248636 (2014).
  16. Stark, A., et al. Discovery of functional elements in 12 Drosophila genomes using evolutionary signatures. Nature. 450 (7167), 219-232 (2007).
  17. Lin, M. F., Jungreis, I., Kellis, M. PhyloCSF: a comparative genomics method to distinguish protein coding and non-coding regions. Bioinformatics. 27 (13), 275-282 (2011).
  18. Slavoff, S. A., et al. Peptidomic discovery of short open reading frame-encoded peptides in human cells. Nature Chemical Biology. 9 (1), 59-64 (2013).
  19. Schwaid, A. G., et al. Chemoproteomic discovery of cysteine-containing human short open reading frames. Journal of the American Chemical Society. 135 (45), 16750-16753 (2013).
  20. Ingolia, N. T., Brar, G. A., Rouskin, S., McGeachy, A. M., Weissman, J. S. Genome-wide annotation and quantitation of translation by ribosome profiling. Current Protocols in Molecular Biology. , 1-19 (2013).
  21. Ingolia, N. T., Ghaemmaghami, S., Newman, J. R., Weissman, J. S. Genome-wide analysis in vivo of translation with nucleotide resolution using ribosome profiling. Science. 324 (5924), 218-223 (2009).
  22. Xiao, Z., et al. De novo annotation and characterization of the translatome with ribosome profiling data. Nucleic Acids Research. 46 (10), 61 (2018).
  23. Lin, Y., et al. eIF3 Associates with 80S Ribosomes to Promote Translation Elongation, Mitochondrial Homeostasis, and Muscle Health. Molecular Cell. 79 (4), 575-587 (2020).
  24. . AGAT: Another Gff Analysis Toolkit to handle annotations in any GTF/GFF format Available from: https://agat.readthedocs.io/en/latest/gff_to_gtf.html (2020)
  25. . Gene Expression Omnibus Available from: https://www.ncbi.nim.nih.gov/geo (2002)
  26. Ingolia, N. T., Brar, G. A., Rouskin, S., McGeachy, A. M., Weissman, J. S. The ribosome profiling strategy for monitoring translation in vivo by deep sequencing of ribosome-protected mRNA fragments. Nature Protocols. 7 (8), 1534-1550 (2012).
  27. . STAR manual Available from: https://github.com/alexdobin/STAR/blob/master/doc/STARmanual.pdf (2022)
  28. . The genetic codes Available from: https://www.ncbi.nlm.nih.gov/Taxonomy/Utils/wprintgc.cgi (2019)
  29. . RiboMiner Available from: https://github.com/xryanglab/RiboMiner (2020)
  30. Ingolia, N. T., Hussmann, J. A., Weissman, J. S. Ribosome profiling: global views of translation. Cold Spring Harbor Perspectives in Biology. 11 (5), 032698 (2018).
  31. Lee, S., et al. Global mapping of translation initiation sites in mammalian cells at single-nucleotide resolution. Proceedings of the National Academy of Sciences of the United States of America. 109 (37), 2424-2432 (2012).
  32. Gao, X., et al. Quantitative profiling of initiating ribosomes in vivo. Nature Methods. 12 (2), 147-153 (2015).
  33. Spealman, P., Naik, A., McManus, J. uORF-seqr: A Machine Learning-Based approach to the identification of upstream open reading frames in yeast. Methods in Molecular Biol. 2252, 313-329 (2021).
  34. . RiboCode Available from: https://github.com/xryanglab/RiboCode (2018)
  35. Sharma, P., Wu, J., Nilges, B. S., Leidel, S. A. Humans and other commonly used model organisms are resistant to cycloheximide-mediated biases in ribosome profiling experiments. Nature Communications. 12 (1), 5094 (2021).
check_url/kr/63366?article_type=t

Play Video

Cite This Article
Zhu, Y., Li, F., Yang, X., Xiao, Z. De novo Identification of Actively Translated Open Reading Frames with Ribosome Profiling Data. J. Vis. Exp. (180), e63366, doi:10.3791/63366 (2022).

View Video