राइबोसोम का अनुवाद पेप्टाइड्स में प्रति कोडोन तीन न्यूक्लियोटाइड्स को डिकोड करता है। एमआरएनए के साथ उनका आंदोलन, राइबोसोम प्रोफाइलिंग द्वारा कब्जा कर लिया गया है, विशेषता ट्रिपल आवधिकता को प्रदर्शित करने वाले पैरों के निशान पैदा करता है। यह प्रोटोकॉल वर्णन करता है कि राइबोसोम प्रोफाइलिंग डेटा से इस प्रमुख विशेषता को समझने के लिए राइबोकोड का उपयोग कैसे करें ताकि पूरे-ट्रांसक्रिप्टोम स्तर पर सक्रिय रूप से अनुवादित खुले रीडिंग फ्रेम की पहचान की जा सके।
खुले पढ़ने के फ्रेम (ओआरएफ) की पहचान, विशेष रूप से छोटे पेप्टाइड्स को एन्कोडिंग करने वाले और विशिष्ट शारीरिक संदर्भों के तहत सक्रिय रूप से अनुवादित होने वाले, संदर्भ-निर्भर अनुवादों के व्यापक एनोटेशन के लिए महत्वपूर्ण है। राइबोसोम प्रोफाइलिंग, आरएनए पर राइबोसोम का अनुवाद करने के बाध्यकारी स्थानों और घनत्व का पता लगाने के लिए एक तकनीक, तेजी से यह पता लगाने के लिए एक एवेन्यू प्रदान करती है कि जीनोम-वाइड पैमाने पर अनुवाद कहां हो रहा है। हालांकि, यह बायोइन्फॉर्मेटिक्स में एक तुच्छ कार्य नहीं है कि राइबोसोम प्रोफाइलिंग के लिए ओआरएफ का अनुवाद कुशलतापूर्वक और व्यापक रूप से पहचान किया जाए। यहां वर्णित एक आसान-से-उपयोग पैकेज है, जिसका नाम राइबोकोड है, जिसे राइबोसोम प्रोफाइलिंग डेटा में विकृत और अस्पष्ट संकेतों से किसी भी आकार के ओआरएफ का सक्रिय रूप से अनुवाद करने के लिए खोज करने के लिए डिज़ाइन किया गया है। एक उदाहरण के रूप में हमारे पहले प्रकाशित डेटासेट को लेते हुए, यह लेख पूरे राइबोकोड पाइपलाइन के लिए चरण-दर-चरण निर्देश प्रदान करता है, कच्चे डेटा के प्रीप्रोसेसिंग से लेकर अंतिम आउटपुट परिणाम फ़ाइलों की व्याख्या तक। इसके अलावा, एनोटेट किए गए ओआरएफ की अनुवाद दरों का मूल्यांकन करने के लिए, प्रत्येक ओआरएफ पर राइबोसोम घनत्व के विज़ुअलाइज़ेशन और परिमाणीकरण के लिए प्रक्रियाओं का भी विस्तार से वर्णन किया गया है। संक्षेप में, वर्तमान लेख अनुवाद, छोटे ओआरएफ और पेप्टाइड्स से संबंधित अनुसंधान क्षेत्रों के लिए एक उपयोगी और समय पर निर्देश है।
हाल ही में, अध्ययनों के एक बढ़ते शरीर ने कोडिंग जीन के ओआरएफ से अनुवादित पेप्टाइड्स के व्यापक उत्पादन का खुलासा किया है और पहले एनोटेट किए गए जीनों को नॉनकोडिंग के रूप में, जैसे कि लंबे समय तक नॉनकोडिंग आरएनए (एलएनसीआरएनए) 1,2,3,4,5,6,7,8। इन अनुवादित ओआरएफ को पर्यावरणीय परिवर्तनों, तनाव और सेल भेदभाव 1,8,9,10,11,12,13 का जवाब देने के लिए कोशिकाओं द्वारा विनियमित या प्रेरित किया जाता है। कुछ ओआरएफ के अनुवाद उत्पादों को विकास और शरीर विज्ञान में विविध जैविक प्रक्रियाओं में महत्वपूर्ण नियामक भूमिका निभाने के लिए प्रदर्शित किया गया है। उदाहरण के लिए, Chng et al.14 ने Elabela (Ela, जिसे Apela / Ende / Toddler के रूप में भी जाना जाता है) नामक एक पेप्टाइड हार्मोन की खोज की, जो हृदय विकास के लिए महत्वपूर्ण है। पाउली एट अल ने सुझाव दिया कि इला एक माइटोजेन के रूप में भी कार्य करता है जो प्रारंभिक मछली भ्रूण में सेल माइग्रेशन को बढ़ावा देता है15। मैग्नी एट अल ने कैल्शियम परिवहन को विनियमित करने और ड्रोसोफिला हार्ट 10 में नियमित मांसपेशियों के संकुचन को प्रभावित करने वाले 30 से कम अमीनो एसिड के दो माइक्रोपेप्टाइड्स की सूचना दी।
यह स्पष्ट नहीं है कि ऐसे कितने पेप्टाइड्स जीनोम द्वारा एन्कोड किए गए हैं और क्या वे जैविक रूप से प्रासंगिक हैं। इसलिए, इन संभावित कोडिंग ओआरएफ की व्यवस्थित पहचान अत्यधिक वांछनीय है। हालांकि, विकासवादी संरक्षण 16,17 और मास स्पेक्ट्रोमेट्री 18,19 जैसे पारंपरिक दृष्टिकोणों का उपयोग करके इन ओआरएफ (यानी, प्रोटीन या पेप्टाइड) के उत्पादों का सीधे निर्धारण करना चुनौतीपूर्ण है क्योंकि दोनों दृष्टिकोणों की पहचान दक्षता उत्पादित प्रोटीन या पेप्टाइड्स की लंबाई, बहुतायत और अमीनो एसिड संरचना पर निर्भर करती है। राइबोसोम प्रोफाइलिंग के आगमन, न्यूक्लियोटाइड रिज़ॉल्यूशन पर एमआरएनए पर राइबोसोम अधिभोग की पहचान करने के लिए एक तकनीक, ने विभिन्न टेपों 3,20,21 की कोडिंग क्षमता का मूल्यांकन करने का एक सटीक तरीका प्रदान किया है, भले ही उनकी लंबाई और संरचना की परवाह किए बिना। राइबोसोम प्रोफाइलिंग का उपयोग करके सक्रिय रूप से ओआरएफ का अनुवाद करने की पहचान करने के लिए एक महत्वपूर्ण और अक्सर उपयोग की जाने वाली विशेषता तीन-न्यूक्लियोटाइड (3-एनटी) है जो एमआरएनए पर राइबोसोम के पैरों के निशान की आवधिकता है, जो शुरुआती कोडोन से स्टॉप कोडोन तक है। हालांकि, राइबोसोम प्रोफाइलिंग डेटा में अक्सर कई मुद्दे होते हैं, जिनमें ओआरएफ, उच्च अनुक्रमण शोर और राइबोसोमल आरएनए (आरआरएनए) संदूषणों के साथ कम और विरल अनुक्रमण पढ़ता है। इस प्रकार, इस तरह के डेटा द्वारा उत्पन्न विकृत और अस्पष्ट संकेत एमआरएनए पर राइबोसोम के पैरों के निशान के 3-एनटी आवधिकता पैटर्न को कमजोर करते हैं, जो अंततः उच्च-आत्मविश्वास वाले अनुवादित ओआरएफ की पहचान को मुश्किल बनाता है।
“राइबोकोड” नामक एक पैकेज ने एक संशोधित विलकॉक्सन-हस्ताक्षरित-रैंक परीक्षण और पी-मूल्य एकीकरण रणनीति को अनुकूलित किया ताकि यह जांच की जा सके कि ओआरएफ में ऑफ-फ्रेम आरपीएफ 22 की तुलना में काफी अधिक इन-फ्रेम राइबोसोम-संरक्षित टुकड़े (आरपीएफ) हैं या नहीं। यह अत्यधिक कुशल, संवेदनशील, और नकली और वास्तविक राइबोसोम प्रोफाइलिंग डेटा में अनुवाद के डे नोवो एनोटेशन के लिए सटीक होने का प्रदर्शन किया गया था। यहां, हम वर्णन करते हैं कि पिछले अध्ययन 23 द्वारा उत्पन्न कच्चे राइबोसोम प्रोफाइलिंग अनुक्रमण डेटासेट से संभावित अनुवाद ओआरएफ का पता लगाने के लिए इस उपकरण का उपयोग कैसे करें। इन डेटासेट का उपयोग अनुवाद में EIF3 सबयूनिट “E” (EIF3E) के कार्य का पता लगाने के लिए किया गया था, जिसमें MCF-10A कोशिकाओं के राइबोसोम अधिभोग प्रोफाइल की तुलना की गई थी, जो नियंत्रण (si-Ctrl) और EIF3E (si-eIF3e ) छोटे-हस्तक्षेप वाले आरएनए (siRNAs) के साथ transfected थे। इन उदाहरण डेटासेट पर राइबोकोड लागू करके, हमने 5,633 उपन्यास ओआरएफ का पता लगाया जो संभावित रूप से छोटे पेप्टाइड्स या प्रोटीन को एन्कोडिंग करते हैं। इन ओआरएफ को कोडिंग क्षेत्रों के सापेक्ष उनके स्थानों के आधार पर विभिन्न प्रकारों में वर्गीकृत किया गया था, जिसमें अपस्ट्रीम ओआरएफ (यूओआरएफ), डाउनस्ट्रीम ओआरएफ (डीओआरएफ), ओवरलैप किए गए ओआरएफ, उपन्यास प्रोटीन-कोडिंग जीन (उपन्यास पीसीजी) से ओआरएफ, और उपन्यास नॉनप्रोटीन-कोडिंग जीन (उपन्यास नॉनपीसीजी) से ओआरएफ शामिल थे। नियंत्रण कोशिकाओं की तुलना में EIF3E-कमी वाली कोशिकाओं में यूओआरएफ पर आरपीएफ पठन घनत्व में काफी वृद्धि हुई थी, जो कम से कम आंशिक रूप से राइबोसोम का सक्रिय रूप से अनुवाद करने के संवर्धन के कारण हो सकता है। EIF3E-कमी वाली कोशिकाओं के 25 वें से 75 वें कोडोन तक क्षेत्र में स्थानीयकृत राइबोसोम संचय ने प्रारंभिक चरण में अनुवाद बढ़ाव की रुकावट का संकेत दिया। यह प्रोटोकॉल यह भी दिखाता है कि पहचाने गए ओआरएफ पर राइबोसोम पैरों के निशान के 3-एनटी आवधिकता पैटर्न की जांच करने के लिए वांछित क्षेत्र के आरपीएफ घनत्व की कल्पना कैसे की जाए। ये विश्लेषण ओआरएफ के अनुवाद की पहचान करने और अनुवाद के विनियमन का अध्ययन करने में राइबोकोड की शक्तिशाली भूमिका को प्रदर्शित करते हैं।
राइबोसोम प्रोफाइलिंग जीनोम पैमाने पर कोशिकाओं में राइबोसोम की कार्रवाई का अध्ययन करने का एक अभूतपूर्व अवसर प्रदान करता है। राइबोसोम प्रोफाइलिंग डेटा द्वारा की गई जानकारी को ठीक से समझने से अंतर्दृ?…
The authors have nothing to disclose.
लेखक Xi’an Jiaotong University के HPCC प्लेटफ़ॉर्म द्वारा प्रदान किए गए कम्प्यूटेशनल संसाधनों से समर्थन को स्वीकार करना चाहते हैं। Z.X. कृतज्ञतापूर्वक Xi’an Jiaotong University के यंग टॉपनॉच टैलेंट सपोर्ट प्लान को धन्यवाद देता है।
A computer/server running Linux | Any | – | – |
Anaconda or Miniconda | Anaconda | – | Anaconda: https://www.anaconda.com; Miniconda:https://docs.conda.io/en/latest/miniconda.html |
R | R Foundation | – | https://www.r-project.org/ |
Rstudio | Rstudio | – | https://www.rstudio.com/ |