Summary

डे नोवो राइबोसोम प्रोफाइलिंग डेटा के साथ सक्रिय रूप से अनुवादित ओपन रीडिंग फ्रेम्स की पहचान

Published: February 18, 2022
doi:

Summary

राइबोसोम का अनुवाद पेप्टाइड्स में प्रति कोडोन तीन न्यूक्लियोटाइड्स को डिकोड करता है। एमआरएनए के साथ उनका आंदोलन, राइबोसोम प्रोफाइलिंग द्वारा कब्जा कर लिया गया है, विशेषता ट्रिपल आवधिकता को प्रदर्शित करने वाले पैरों के निशान पैदा करता है। यह प्रोटोकॉल वर्णन करता है कि राइबोसोम प्रोफाइलिंग डेटा से इस प्रमुख विशेषता को समझने के लिए राइबोकोड का उपयोग कैसे करें ताकि पूरे-ट्रांसक्रिप्टोम स्तर पर सक्रिय रूप से अनुवादित खुले रीडिंग फ्रेम की पहचान की जा सके।

Abstract

खुले पढ़ने के फ्रेम (ओआरएफ) की पहचान, विशेष रूप से छोटे पेप्टाइड्स को एन्कोडिंग करने वाले और विशिष्ट शारीरिक संदर्भों के तहत सक्रिय रूप से अनुवादित होने वाले, संदर्भ-निर्भर अनुवादों के व्यापक एनोटेशन के लिए महत्वपूर्ण है। राइबोसोम प्रोफाइलिंग, आरएनए पर राइबोसोम का अनुवाद करने के बाध्यकारी स्थानों और घनत्व का पता लगाने के लिए एक तकनीक, तेजी से यह पता लगाने के लिए एक एवेन्यू प्रदान करती है कि जीनोम-वाइड पैमाने पर अनुवाद कहां हो रहा है। हालांकि, यह बायोइन्फॉर्मेटिक्स में एक तुच्छ कार्य नहीं है कि राइबोसोम प्रोफाइलिंग के लिए ओआरएफ का अनुवाद कुशलतापूर्वक और व्यापक रूप से पहचान किया जाए। यहां वर्णित एक आसान-से-उपयोग पैकेज है, जिसका नाम राइबोकोड है, जिसे राइबोसोम प्रोफाइलिंग डेटा में विकृत और अस्पष्ट संकेतों से किसी भी आकार के ओआरएफ का सक्रिय रूप से अनुवाद करने के लिए खोज करने के लिए डिज़ाइन किया गया है। एक उदाहरण के रूप में हमारे पहले प्रकाशित डेटासेट को लेते हुए, यह लेख पूरे राइबोकोड पाइपलाइन के लिए चरण-दर-चरण निर्देश प्रदान करता है, कच्चे डेटा के प्रीप्रोसेसिंग से लेकर अंतिम आउटपुट परिणाम फ़ाइलों की व्याख्या तक। इसके अलावा, एनोटेट किए गए ओआरएफ की अनुवाद दरों का मूल्यांकन करने के लिए, प्रत्येक ओआरएफ पर राइबोसोम घनत्व के विज़ुअलाइज़ेशन और परिमाणीकरण के लिए प्रक्रियाओं का भी विस्तार से वर्णन किया गया है। संक्षेप में, वर्तमान लेख अनुवाद, छोटे ओआरएफ और पेप्टाइड्स से संबंधित अनुसंधान क्षेत्रों के लिए एक उपयोगी और समय पर निर्देश है।

Introduction

हाल ही में, अध्ययनों के एक बढ़ते शरीर ने कोडिंग जीन के ओआरएफ से अनुवादित पेप्टाइड्स के व्यापक उत्पादन का खुलासा किया है और पहले एनोटेट किए गए जीनों को नॉनकोडिंग के रूप में, जैसे कि लंबे समय तक नॉनकोडिंग आरएनए (एलएनसीआरएनए) 1,2,3,4,5,6,7,8 इन अनुवादित ओआरएफ को पर्यावरणीय परिवर्तनों, तनाव और सेल भेदभाव 1,8,9,10,11,12,13 का जवाब देने के लिए कोशिकाओं द्वारा विनियमित या प्रेरित किया जाता है कुछ ओआरएफ के अनुवाद उत्पादों को विकास और शरीर विज्ञान में विविध जैविक प्रक्रियाओं में महत्वपूर्ण नियामक भूमिका निभाने के लिए प्रदर्शित किया गया है। उदाहरण के लिए, Chng et al.14 ने Elabela (Ela, जिसे Apela / Ende / Toddler के रूप में भी जाना जाता है) नामक एक पेप्टाइड हार्मोन की खोज की, जो हृदय विकास के लिए महत्वपूर्ण है। पाउली एट अल ने सुझाव दिया कि इला एक माइटोजेन के रूप में भी कार्य करता है जो प्रारंभिक मछली भ्रूण में सेल माइग्रेशन को बढ़ावा देता है15। मैग्नी एट अल ने कैल्शियम परिवहन को विनियमित करने और ड्रोसोफिला हार्ट 10 में नियमित मांसपेशियों के संकुचन को प्रभावित करने वाले 30 से कम अमीनो एसिड के दो माइक्रोपेप्टाइड्स की सूचना दी।

यह स्पष्ट नहीं है कि ऐसे कितने पेप्टाइड्स जीनोम द्वारा एन्कोड किए गए हैं और क्या वे जैविक रूप से प्रासंगिक हैं। इसलिए, इन संभावित कोडिंग ओआरएफ की व्यवस्थित पहचान अत्यधिक वांछनीय है। हालांकि, विकासवादी संरक्षण 16,17 और मास स्पेक्ट्रोमेट्री 18,19 जैसे पारंपरिक दृष्टिकोणों का उपयोग करके इन ओआरएफ (यानी, प्रोटीन या पेप्टाइड) के उत्पादों का सीधे निर्धारण करना चुनौतीपूर्ण है क्योंकि दोनों दृष्टिकोणों की पहचान दक्षता उत्पादित प्रोटीन या पेप्टाइड्स की लंबाई, बहुतायत और अमीनो एसिड संरचना पर निर्भर करती है। राइबोसोम प्रोफाइलिंग के आगमन, न्यूक्लियोटाइड रिज़ॉल्यूशन पर एमआरएनए पर राइबोसोम अधिभोग की पहचान करने के लिए एक तकनीक, ने विभिन्न टेपों 3,20,21 की कोडिंग क्षमता का मूल्यांकन करने का एक सटीक तरीका प्रदान किया है, भले ही उनकी लंबाई और संरचना की परवाह किए बिना। राइबोसोम प्रोफाइलिंग का उपयोग करके सक्रिय रूप से ओआरएफ का अनुवाद करने की पहचान करने के लिए एक महत्वपूर्ण और अक्सर उपयोग की जाने वाली विशेषता तीन-न्यूक्लियोटाइड (3-एनटी) है जो एमआरएनए पर राइबोसोम के पैरों के निशान की आवधिकता है, जो शुरुआती कोडोन से स्टॉप कोडोन तक है। हालांकि, राइबोसोम प्रोफाइलिंग डेटा में अक्सर कई मुद्दे होते हैं, जिनमें ओआरएफ, उच्च अनुक्रमण शोर और राइबोसोमल आरएनए (आरआरएनए) संदूषणों के साथ कम और विरल अनुक्रमण पढ़ता है। इस प्रकार, इस तरह के डेटा द्वारा उत्पन्न विकृत और अस्पष्ट संकेत एमआरएनए पर राइबोसोम के पैरों के निशान के 3-एनटी आवधिकता पैटर्न को कमजोर करते हैं, जो अंततः उच्च-आत्मविश्वास वाले अनुवादित ओआरएफ की पहचान को मुश्किल बनाता है।

“राइबोकोड” नामक एक पैकेज ने एक संशोधित विलकॉक्सन-हस्ताक्षरित-रैंक परीक्षण और पी-मूल्य एकीकरण रणनीति को अनुकूलित किया ताकि यह जांच की जा सके कि ओआरएफ में ऑफ-फ्रेम आरपीएफ 22 की तुलना में काफी अधिक इन-फ्रेम राइबोसोम-संरक्षित टुकड़े (आरपीएफ) हैं या नहीं। यह अत्यधिक कुशल, संवेदनशील, और नकली और वास्तविक राइबोसोम प्रोफाइलिंग डेटा में अनुवाद के डे नोवो एनोटेशन के लिए सटीक होने का प्रदर्शन किया गया था। यहां, हम वर्णन करते हैं कि पिछले अध्ययन 23 द्वारा उत्पन्न कच्चे राइबोसोम प्रोफाइलिंग अनुक्रमण डेटासेट से संभावित अनुवाद ओआरएफ का पता लगाने के लिए इस उपकरण का उपयोग कैसे करें। इन डेटासेट का उपयोग अनुवाद में EIF3 सबयूनिट “E” (EIF3E) के कार्य का पता लगाने के लिए किया गया था, जिसमें MCF-10A कोशिकाओं के राइबोसोम अधिभोग प्रोफाइल की तुलना की गई थी, जो नियंत्रण (si-Ctrl) और EIF3E (si-eIF3e ) छोटे-हस्तक्षेप वाले आरएनए (siRNAs) के साथ transfected थे। इन उदाहरण डेटासेट पर राइबोकोड लागू करके, हमने 5,633 उपन्यास ओआरएफ का पता लगाया जो संभावित रूप से छोटे पेप्टाइड्स या प्रोटीन को एन्कोडिंग करते हैं। इन ओआरएफ को कोडिंग क्षेत्रों के सापेक्ष उनके स्थानों के आधार पर विभिन्न प्रकारों में वर्गीकृत किया गया था, जिसमें अपस्ट्रीम ओआरएफ (यूओआरएफ), डाउनस्ट्रीम ओआरएफ (डीओआरएफ), ओवरलैप किए गए ओआरएफ, उपन्यास प्रोटीन-कोडिंग जीन (उपन्यास पीसीजी) से ओआरएफ, और उपन्यास नॉनप्रोटीन-कोडिंग जीन (उपन्यास नॉनपीसीजी) से ओआरएफ शामिल थे। नियंत्रण कोशिकाओं की तुलना में EIF3E-कमी वाली कोशिकाओं में यूओआरएफ पर आरपीएफ पठन घनत्व में काफी वृद्धि हुई थी, जो कम से कम आंशिक रूप से राइबोसोम का सक्रिय रूप से अनुवाद करने के संवर्धन के कारण हो सकता है। EIF3E-कमी वाली कोशिकाओं के 25 वें से 75 वें कोडोन तक क्षेत्र में स्थानीयकृत राइबोसोम संचय ने प्रारंभिक चरण में अनुवाद बढ़ाव की रुकावट का संकेत दिया। यह प्रोटोकॉल यह भी दिखाता है कि पहचाने गए ओआरएफ पर राइबोसोम पैरों के निशान के 3-एनटी आवधिकता पैटर्न की जांच करने के लिए वांछित क्षेत्र के आरपीएफ घनत्व की कल्पना कैसे की जाए। ये विश्लेषण ओआरएफ के अनुवाद की पहचान करने और अनुवाद के विनियमन का अध्ययन करने में राइबोकोड की शक्तिशाली भूमिका को प्रदर्शित करते हैं।

Protocol

1. पर्यावरण सेटअप और RiboCode स्थापना एक लिनक्स टर्मिनल विंडो खोलें और एक कोंडा वातावरण बनाएँ:कोंडा बनाएँ -n राइबोकोड पायथन = 3.8 बनाए गए वातावरण पर स्विच करें और RiboCode और निर्भरताएँ स्थापित करे…

Representative Results

उदाहरण राइबोसोम प्रोफाइलिंग डेटासेट को परिग्रहण संख्या GSE131074 के तहत GEO डेटाबेस में जमा किया गया था। इस प्रोटोकॉल में उपयोग की जाने वाली सभी फ़ाइलें और कोड पूरक फ़ाइलों से 1-4 तक उपलब्ध ह…

Discussion

राइबोसोम प्रोफाइलिंग जीनोम पैमाने पर कोशिकाओं में राइबोसोम की कार्रवाई का अध्ययन करने का एक अभूतपूर्व अवसर प्रदान करता है। राइबोसोम प्रोफाइलिंग डेटा द्वारा की गई जानकारी को ठीक से समझने से अंतर्दृ?…

Declarações

The authors have nothing to disclose.

Acknowledgements

लेखक Xi’an Jiaotong University के HPCC प्लेटफ़ॉर्म द्वारा प्रदान किए गए कम्प्यूटेशनल संसाधनों से समर्थन को स्वीकार करना चाहते हैं। Z.X. कृतज्ञतापूर्वक Xi’an Jiaotong University के यंग टॉपनॉच टैलेंट सपोर्ट प्लान को धन्यवाद देता है।

Materials

A computer/server running Linux Any
Anaconda or Miniconda Anaconda Anaconda: https://www.anaconda.com; Miniconda:https://docs.conda.io/en/latest/miniconda.html
R R Foundation https://www.r-project.org/
Rstudio Rstudio https://www.rstudio.com/

Referências

  1. Eisenberg, A. R., et al. Translation Initiation Site Profiling Reveals Widespread Synthesis of Non-AUG-Initiated Protein Isoforms in Yeast. Cell Systems. 11 (2), 145-160 (2020).
  2. Spealman, P., et al. Conserved non-AUG uORFs revealed by a novel regression analysis of ribosome profiling data. Genome Research. 28 (2), 214-222 (2018).
  3. Ingolia, N. T., Lareau, L. F., Weissman, J. S. Ribosome profiling of mouse embryonic stem cells reveals the complexity and dynamics of mammalian proteomes. Cell. 147 (4), 789-802 (2011).
  4. Bazzini, A. A., et al. Identification of small ORFs in vertebrates using ribosome footprinting and evolutionary conservation. The EMBO Journal. 33 (9), 981-993 (2014).
  5. Ingolia, N. T., et al. Ribosome profiling reveals pervasive translation outside of annotated protein-coding genes. Cell Reports. 8 (5), 1365-1379 (2014).
  6. Chew, G. L., Pauli, A., Schier, A. F. Conservation of uORF repressiveness and sequence features in mouse, human and zebrafish. Nature Communications. 7, 11663 (2016).
  7. Zhang, H., et al. Determinants of genome-wide distribution and evolution of uORFs in eukaryotes. Nature Communications. 12 (1), 1076 (2021).
  8. Guenther, U. P., et al. The helicase Ded1p controls use of near-cognate translation initiation codons in 5′ UTRs. Nature. 559 (7712), 130-134 (2018).
  9. Goldsmith, J., et al. Ribosome profiling reveals a functional role for autophagy in mRNA translational control. Communications Biology. 3 (1), 388 (2020).
  10. Magny, E. G., et al. Conserved regulation of cardiac calcium uptake by peptides encoded in small open reading frames. Science. 341 (6150), 1116-1120 (2013).
  11. Stumpf, C. R., Moreno, M. V., Olshen, A. B., Taylor, B. S., Ruggero, D. The translational landscape of the mammalian cell cycle. Molecular Cell. 52 (4), 574-582 (2013).
  12. Gerashchenko, M. V., Lobanov, A. V., Gladyshev, V. N. Genome-wide ribosome profiling reveals complex translational regulation in response to oxidative stress. Proceedings of the National Academy of Sciences of the United States of America. 109 (43), 17394-17399 (2012).
  13. Andreev, D. E., et al. Oxygen and glucose deprivation induces widespread alterations in mRNA translation within 20 minutes. Genome Biology. 16, 90 (2015).
  14. Chng, S. C., Ho, L., Tian, J., Reversade, B. ELABELA: a hormone essential for heart development signals via the apelin receptor. Developmental Cell. 27 (6), 672-680 (2013).
  15. Pauli, A., et al. Toddler: an embryonic signal that promotes cell movement via Apelin receptors. Science. 343 (6172), 1248636 (2014).
  16. Stark, A., et al. Discovery of functional elements in 12 Drosophila genomes using evolutionary signatures. Nature. 450 (7167), 219-232 (2007).
  17. Lin, M. F., Jungreis, I., Kellis, M. PhyloCSF: a comparative genomics method to distinguish protein coding and non-coding regions. Bioinformatics. 27 (13), 275-282 (2011).
  18. Slavoff, S. A., et al. Peptidomic discovery of short open reading frame-encoded peptides in human cells. Nature Chemical Biology. 9 (1), 59-64 (2013).
  19. Schwaid, A. G., et al. Chemoproteomic discovery of cysteine-containing human short open reading frames. Journal of the American Chemical Society. 135 (45), 16750-16753 (2013).
  20. Ingolia, N. T., Brar, G. A., Rouskin, S., McGeachy, A. M., Weissman, J. S. Genome-wide annotation and quantitation of translation by ribosome profiling. Current Protocols in Molecular Biology. , 1-19 (2013).
  21. Ingolia, N. T., Ghaemmaghami, S., Newman, J. R., Weissman, J. S. Genome-wide analysis in vivo of translation with nucleotide resolution using ribosome profiling. Science. 324 (5924), 218-223 (2009).
  22. Xiao, Z., et al. De novo annotation and characterization of the translatome with ribosome profiling data. Nucleic Acids Research. 46 (10), 61 (2018).
  23. Lin, Y., et al. eIF3 Associates with 80S Ribosomes to Promote Translation Elongation, Mitochondrial Homeostasis, and Muscle Health. Molecular Cell. 79 (4), 575-587 (2020).
  24. . AGAT: Another Gff Analysis Toolkit to handle annotations in any GTF/GFF format Available from: https://agat.readthedocs.io/en/latest/gff_to_gtf.html (2020)
  25. . Gene Expression Omnibus Available from: https://www.ncbi.nim.nih.gov/geo (2002)
  26. Ingolia, N. T., Brar, G. A., Rouskin, S., McGeachy, A. M., Weissman, J. S. The ribosome profiling strategy for monitoring translation in vivo by deep sequencing of ribosome-protected mRNA fragments. Nature Protocols. 7 (8), 1534-1550 (2012).
  27. . STAR manual Available from: https://github.com/alexdobin/STAR/blob/master/doc/STARmanual.pdf (2022)
  28. . The genetic codes Available from: https://www.ncbi.nlm.nih.gov/Taxonomy/Utils/wprintgc.cgi (2019)
  29. . RiboMiner Available from: https://github.com/xryanglab/RiboMiner (2020)
  30. Ingolia, N. T., Hussmann, J. A., Weissman, J. S. Ribosome profiling: global views of translation. Cold Spring Harbor Perspectives in Biology. 11 (5), 032698 (2018).
  31. Lee, S., et al. Global mapping of translation initiation sites in mammalian cells at single-nucleotide resolution. Proceedings of the National Academy of Sciences of the United States of America. 109 (37), 2424-2432 (2012).
  32. Gao, X., et al. Quantitative profiling of initiating ribosomes in vivo. Nature Methods. 12 (2), 147-153 (2015).
  33. Spealman, P., Naik, A., McManus, J. uORF-seqr: A Machine Learning-Based approach to the identification of upstream open reading frames in yeast. Methods in Molecular Biol. 2252, 313-329 (2021).
  34. . RiboCode Available from: https://github.com/xryanglab/RiboCode (2018)
  35. Sharma, P., Wu, J., Nilges, B. S., Leidel, S. A. Humans and other commonly used model organisms are resistant to cycloheximide-mediated biases in ribosome profiling experiments. Nature Communications. 12 (1), 5094 (2021).
check_url/pt/63366?article_type=t

Play Video

Citar este artigo
Zhu, Y., Li, F., Yang, X., Xiao, Z. De novo Identification of Actively Translated Open Reading Frames with Ribosome Profiling Data. J. Vis. Exp. (180), e63366, doi:10.3791/63366 (2022).

View Video