यहां प्रस्तुत प्रोटोकॉल मेजबान-रोगज़नक़ इंटरैक्शन का अध्ययन करने वाले आरएनए-अनुक्रमण ट्रांसस्क्रिप्टम डेटा से लगभग आरएनए की भविष्यवाणी करने और कार्यात्मक रूप से चिह्नित करने के लिए आवश्यक सिलिको पाइपलाइन में पूर्ण की व्याख्या करता है।
सर्कुलर आरएनए (सीआईआरआरएनए) गैर-कोडिंग आरएनए का एक वर्ग है जो बैक-स्प्लिसिंग के माध्यम से बनता है। इन सीआईआरएनए का मुख्य रूप से विभिन्न जैविक प्रक्रियाओं के नियामकों के रूप में उनकी भूमिकाओं के लिए अध्ययन किया जाता है। विशेष रूप से, उभरते सबूत दर्शाते हैं कि रोगजनकों (जैसे, इन्फ्लूएंजा और कोरोनावायरस) के संक्रमण पर मेजबान सर्आरएनए को अलग-अलग व्यक्त (डीई) किया जा सकता है, जो मेजबान जन्मजात प्रतिरक्षा प्रतिक्रियाओं को विनियमित करने में सीआईआरएनए की भूमिका का सुझाव देता है। हालांकि, रोगजनक संक्रमण ों के दौरान सीआईआरएनए की भूमिका पर जांच आरएनए अनुक्रमण (आरएनए-सेक) डेटा से डीई सर्कोआरएनए की पहचान करने के लिए आवश्यक जैव सूचना विज्ञान विश्लेषण करने के लिए आवश्यक ज्ञान और कौशल द्वारा सीमित है। जैव सूचना विज्ञान की भविष्यवाणी और सीआईआरएनए की पहचान किसी भी सत्यापन से पहले महत्वपूर्ण है, और महंगी और समय लेने वाली गीली-प्रयोगशाला तकनीकों का उपयोग करके कार्यात्मक अध्ययन। इस मुद्दे को हल करने के लिए, इस पांडुलिपि में आरएनए-सेक डेटा का उपयोग करके सिलिको भविष्यवाणी और सीआईआरएनए के लक्षण वर्णन का एक चरण-दर-चरण प्रोटोकॉल प्रदान किया गया है। प्रोटोकॉल को चार चरणों में विभाजित किया जा सकता है: 1) सीआईआरआईक्वांट पाइपलाइन के माध्यम से डीई सर्काआरएनए की भविष्यवाणी और परिमाणीकरण; 2) सीआईआरसीबेस के माध्यम से एनोटेशन और डीई सर्आरएनए के लक्षण वर्णन; 3) सीआईआरसी पाइपलाइन के माध्यम से सीआईआरआरएनए-एमआरएनए इंटरैक्शन भविष्यवाणी; 4) जीन ऑन्कोलॉजी (जीओ) और क्योटो एनसाइक्लोपीडिया ऑफ जीन एंड जीनोम (केईजीजी) का उपयोग करके लगभग आरएनए माता-पिता के जीन का कार्यात्मक संवर्धन विश्लेषण। यह पाइपलाइन भविष्य में इन विट्रो और विवो अनुसंधान में उपयोगी होगी ताकि मेजबान-रोगज़नक़ इंटरैक्शन में सीआईआरएनए की भूमिका को और उजागर किया जा सके।
मेजबान-रोगज़नक़ इंटरैक्शन रोगजनकों और मेजबान जीवों के बीच एक जटिल अंतःक्रिया का प्रतिनिधित्व करते हैं, जो मेजबानों की जन्मजात प्रतिरक्षा प्रतिक्रियाओं को ट्रिगर करता है जिसके परिणामस्वरूप अंततः हमलावर रोगजनकोंको हटा दिया जाता है1,2. रोगजनक संक्रमण के दौरान, रोगजनकों की प्रतिकृति और रिहाई को रोकने के लिए मेजबान प्रतिरक्षा जीन की एक भीड़ को विनियमित किया जाता है। उदाहरण के लिए, रोगजनक संक्रमणों पर विनियमित सामान्य इंटरफेरॉन-उत्तेजित जीन (आईएसजी) में एडीएआर 1, आईएफआईटी 1, आईएफआईटी 2, आईएफआईटी 3, आईएसजी 20, आरआईजी-आई और ओएएसएल 3,4 शामिल हैं। प्रोटीन-कोडिंग जीन के अलावा, अध्ययनों से यह भी पता चला है कि गैर-कोडिंग आरएनए जैसे कि लंबे समय तक गैर-कोडिंग आरएनए (एलएनसीआरएनए), माइक्रोआरएनए (एमआईआरएनए), और परिपत्र आरएनए (सीआईआरआरएनए) भी एक भूमिका निभाते हैं और रोगजनक संक्रमण 5,6,7 के दौरान समवर्ती रूप से विनियमित होते हैं। प्रोटीन-कोडिंग जीन के विपरीत जो मुख्य रूप से प्रोटीन को कार्यात्मक अणुओं के रूप में एन्कोड करते हैं, गैर-कोडिंग आरएनए (एनसीआरएनए) को ट्रांसक्रिप्शनल और पोस्ट-ट्रांसक्रिप्शनल स्तरों पर जीन के नियामकों के रूप में कार्य करने के लिए जाना जाता है। हालांकि, मेजबान ों के प्रतिरक्षा जीन को विनियमित करने में गैर-कोडिंग आरएनए, विशेष रूप से सीआईआरएनए की भागीदारी से जुड़े अध्ययन प्रोटीन-कोडिंग जीन की तुलना में अच्छी तरह से रिपोर्ट नहीं किए गए हैं।
सीआईआरएनए को व्यापक रूप से उनके सहसंयोजक बंद निरंतर लूप संरचना की विशेषता है, जो बैक-स्प्लिसिंग8 नामक एक गैर-कैननिकल स्प्लिसिंग प्रक्रिया के माध्यम से उत्पन्न होती है। बैक-स्प्लिसिंग की प्रक्रिया, आत्मीय रैखिक आरएनए की स्प्लिसिंग प्रक्रिया के विपरीत, डाउनस्ट्रीम डोनर साइट को अपस्ट्रीम स्वीकर्ता साइट तक ले जाना शामिल है, जो एक गोलाकार आकार की संरचना बनाता है। वर्तमान में, सीआईआरएनए के बायोजेनेसिस के लिए तीन अलग-अलग बैक-स्प्लिसिंग तंत्र प्रस्तावित किए गए हैं। ये आरएनए बाइंडिंग प्रोटीन (आरबीपी) मध्यस्थता परिपत्रीकरण9,10, इंट्रोन-पेयरिंग-संचालित परिपत्रीकरण 11, और लारियाट-संचालित परिपत्रीकरण12,13,14 हैं। यह देखते हुए कि सीआईआरएनए एक गोलाकार संरचना में एंड-टू-एंड जुड़े होते हैं, वे स्वाभाविक रूप से सामान्य एक्सोन्यूक्लिज़ पाचन के लिए प्रतिरोधी होते हैं और इस प्रकार, उनके रैखिक समकक्षोंकी तुलना में अधिक स्थिर माना जाता है। सीआईआरएनए द्वारा प्रदर्शित एक अन्य सामान्य विशेषता में मेजबान16 में कोशिका या ऊतक प्रकार-विशिष्ट अभिव्यक्ति शामिल है।
जैसा कि उनकी अनूठी संरचना और सेल या ऊतक-विशिष्ट अभिव्यक्ति से निहित है, कोशिकाओं में महत्वपूर्ण जैविक कार्य करने के लिए सीआईआरएनए की खोज की गई है। आज तक, सीआईआरएनए के प्रमुख कार्यों में से एक माइक्रोआरएनए (एमआईआरएनए) स्पंज17,18 के रूप में उनकी भूमिका है। सीआईआरएनए की यह नियामक भूमिका एमआईआरएनए के बीज क्षेत्र के साथ सीआईआरएनए न्यूक्लियोटाइड के पूरक बंधन के माध्यम से होती है। इस तरह की एक सीआईआरआरएनए-एमआरएनए इंटरैक्शन लक्ष्य एमआरएनए पर एमआईआरएनए के सामान्य नियामक कार्यों को रोकता है, इस प्रकार जीन19,20 की अभिव्यक्ति को विनियमित करता है। इसके अतिरिक्त, आरएनए को आरएनए बाइंडिंग प्रोटीन (आरबीपी) के साथ बातचीत करके और आरएनए-प्रोटीन कॉम्प्लेक्स21 बनाकर जीन अभिव्यक्ति को विनियमित करने के लिए भी जाना जाता है। यद्यपि सीआईआरएनए को गैर-कोडिंग आरएनए के रूप में वर्गीकृत किया गया है, लेकिन इस बात के भी प्रमाण हैं कि सीआईआरएनए प्रोटीन अनुवाद22,23,24 के लिए टेम्पलेट के रूप में कार्य कर सकते हैं।
हाल ही में, विशेष रूप से मेजबानों और वायरस के बीच मेजबान-रोगज़नक़ इंटरैक्शन को विनियमित करने में महत्वपूर्ण भूमिका निभाने के लिए सीआईआरएनए का प्रदर्शन किया गया है। आम तौर पर, मेजबान सीआईआरएनए को हमलावर रोगजनकों को खत्म करने के लिए मेजबान की प्रतिरक्षा प्रतिक्रियाओं को विनियमित करने में सहायता करने के लिए माना जाता है। मेजबान प्रतिरक्षा प्रतिक्रियाओं को बढ़ावा देने वाले सर्आरएनए का एक उदाहरण circRNA_0082633 है, जो गुओ एट अल .25 द्वारा रिपोर्ट किया गया है। यह सर्आरएनए ए 549 कोशिकाओं के भीतर टाइप 1 इंटरफेरॉन (आईएफएन) सिग्नलिंग को बढ़ाता है, जो इन्फ्लूएंजा वायरस प्रतिकृति25 को दबाने में मदद करता है। इसके अलावा, क्यू एट अल ने एक मानव इनट्रोनिक सर्आरएनए की भी सूचना दी, जिसे सीआईआरएनए एआईवीआर कहा जाता है, जो सीआरईबी-बाइंडिंग प्रोटीन (सीआरईबीबीपी) की अभिव्यक्ति को विनियमित करके प्रतिरक्षा को बढ़ावा देता है, जो आईएफएन -β26,27 का सिग्नल ट्रांसड्यूसर है। हालांकि, संक्रमण पर रोग के रोगजनन को बढ़ावा देने के लिए जाने जाने वाले सीआईआरएनए भी मौजूद हैं। उदाहरण के लिए, यू एट अल ने हाल ही में मेजबान सेल ऑटोफैगी28 के निषेध के माध्यम से एच 1 एन 1 वायरस प्रतिकृति को बढ़ावा देने में 2 ए जीन (सीआईआरसीएटीएडी 2 ए) युक्त गाटा जिंक फिंगर डोमेन से अलग किए गए एक सर्आरएनए द्वारा निभाई गई भूमिका की सूचना दी।
लगभग आरएनए का प्रभावी ढंग से अध्ययन करने के लिए, आमतौर पर एक जीनोम-वाइड सर्आरएनए भविष्यवाणी एल्गोरिथ्म लागू किया जाता है, इसके बाद किसी भी कार्यात्मक अध्ययन को करने से पहले अनुमानित सर्आरएनए उम्मीदवारों का इनसिलिको लक्षण वर्णन किया जाता है। इस तरह के जैव सूचना विज्ञान दृष्टिकोण की भविष्यवाणी करने और उसे चिह्नित करने के लिए कम खर्चीला और अधिक समय कुशल है। यह कार्यात्मक रूप से अध्ययन किए जाने वाले उम्मीदवारों की संख्या को परिष्कृत करने में मदद करता है और संभावित रूप से नए निष्कर्षों को जन्म दे सकता है। यहां, हम मेजबान-रोगज़नक़ इंटरैक्शन के दौरान सिलिको पहचान, लक्षण वर्णन और सीआईआरएनए के कार्यात्मक एनोटेशन के लिए एक विस्तृत जैव सूचना विज्ञान-आधारित प्रोटोकॉल प्रदान करते हैं। प्रोटोकॉल में आरएनए-अनुक्रमण डेटासेट से सीआईआरएनए की पहचान और परिमाणीकरण, सर्कबेस के माध्यम से एनोटेशन, और सर्आरएनए प्रकार, अतिव्यापी जीन की संख्या और अनुमानित सर्आरएनए-एमआरएनए इंटरैक्शन के संदर्भ में सर्आरएनए उम्मीदवारों के लक्षण वर्णन शामिल हैं। यह अध्ययन जीन ऑन्कोलॉजी (जीओ) और क्योटो एनसाइक्लोपीडिया ऑफ जीन एंड जीनोम (केईजीजी) संवर्धन विश्लेषण के माध्यम से लगभग आरएनए माता-पिता के जीन का कार्यात्मक एनोटेशन भी प्रदान करता है।
इस प्रोटोकॉल की उपयोगिता को स्पष्ट करने के लिए, इन्फ्लूएंजा ए वायरस से संक्रमित मानव मैक्रोफेज कोशिकाओं से आरएनए-सेक का उपयोग एक उदाहरण के रूप में किया गया था। मेजबान-रोगज़नक़ इंटरैक्शन में संभावित ए?…
The authors have nothing to disclose.
लेखक इस पांडुलिपि की आलोचनात्मक समीक्षा के लिए टैन के एन और डॉ कैमरन ब्रैकेन को धन्यवाद देना चाहते हैं। इस काम को मौलिक अनुसंधान अनुदान योजना (एफआरजीएस/1/2020/एसकेके0/यूएम/02/15) और मलाया विश्वविद्यालय उच्च प्रभाव अनुसंधान अनुदान (यूएम) से अनुदान द्वारा समर्थित किया गया था। सी/625/1/एचआईआर/एमओई/चान/02/07)।
Bedtools | GitHub | https://github.com/arq5x/bedtools2/ | Referring to section 4.1.2. Needed for Circr. |
BWA | Burrows-Wheeler Aligner | http://bio-bwa.sourceforge.net/ | Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome |
Circr | GitHub | https://github.com/bicciatolab/Circr | Referring to section 4. Use to predict the miRNA binding sites |
CIRIquant | GitHub | https://github.com/bioinfo-biols/CIRIquant | Referring to section 2.1.3. To predict circRNAs |
Clusterprofiler | GitHub | https://github.com/YuLab-SMU/clusterProfiler | Referring to section 7. For GO and KEGG functional enrichment |
CPU | Intel | Intel(R) Xeon(R) CPU E5-2620 V2 @ 2.10 GHz Cores: 6-core CPU Memory: 65 GB Graphics card: NVIDIA GK107GL (QUADRO K2000) | Specifications used to run this entire protocol. |
Cytoscape | Cytoscape | https://cytoscape.org/download.html | Referring to section 5.2. Needed to plot ceRNA network |
FastQC | Babraham Bioinformatics | https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ | Referring to section 1.2.1. Quality checking on Fastq files |
HISAT2 | http://daehwankimlab.github.io/hisat2/ | Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome | |
Linux | Ubuntu 20.04.5 LTS (Focal Fossa) | https://releases.ubuntu.com/focal/ | Needed to run the entire protocol. Other Ubuntu versions may still be valid to carry out the protocol. |
miRanda | http://www.microrna.org/microrna/getDownloads.do | Referring to section 4.1.2. Needed for Circr | |
Pybedtools | pybedtools 0.8.2 | https://pypi.org/project/pybedtools/ | Needed for BED file genomic manipulation |
Python | Python 2.7 and 3.6 or abover | https://www.python.org/downloads/ | To run necessary library modules |
R | The Comprehensive R Archive Network | https://cran.r-project.org/ | To manipulate dataframes |
RNAhybrid | BiBiServ | https://bibiserv.cebitec.uni-bielefeld.de/rnahybrid | Referring to section 4.1.2. Needed for Circr |
RStudio | RStudio | https://www.rstudio.com/ | A workspace to run R |
samtools | SAMtools | http://www.htslib.org/ | Referring to section 2.1.2. Needed to run CIRIquant |
StringTie | Johns Hopkins University: Center for Computational Biology | http://ccb.jhu.edu/software/stringtie/index.shtml | Referring to section 2.1.2. Needed to run CIRIquant |
TargetScan | GitHub | https://github.com/nsoranzo/targetscan | Referring to section 4.1.2. Needed for Circr |