Summary

आरएनए अनुक्रमण के लिए तीन अंतर अभिव्यक्ति विश्लेषण विधियां: लिम्मा, एजर, डीसेक्यू2

Published: September 18, 2021
doi:

Summary

आरएनए अनुक्रमण के लिए अंतर अभिव्यक्ति विश्लेषण विधियों का एक विस्तृत प्रोटोकॉल प्रदान किया गया था: लिम्मा, एजर, डीसेक्यू 2।

Abstract

आरएनए अनुक्रमण (आरएनए-एसईक्यू) ट्रांसक्रिप्टोमिक्स में सबसे व्यापक रूप से उपयोग की जाने वाली प्रौद्योगिकियों में से एक है क्योंकि यह आनुवंशिक परिवर्तन और जटिल जैविक प्रक्रियाओं के बीच संबंध प्रकट कर सकता है और ट्यूमर के निदान, शकुन और चिकित्सीय में महान मूल्य है। आरएनए-एसईक्यू डेटा का अंतर विश्लेषण गुमराह प्रतिलेखन की पहचान करने के लिए महत्वपूर्ण है, और लिम्मा, एजर और डीसेक्यू 2 अंतर विश्लेषण के लिए कुशल उपकरण हैं। हालांकि, आरएनए-एसईक्यू अंतर विश्लेषण के लिए आर भाषा के साथ कुछ कौशल और एक उपयुक्त विधि चुनने की क्षमता की आवश्यकता होती है, जो चिकित्सा शिक्षा के पाठ्यक्रम में कमी है।

इसके साथ ही, हम क्रमशः लिम्मा, डीसेक्यू2 और एजर के माध्यम से कोलंगियोकार्सिनोमा (चोल) और सामान्य ऊतकों के बीच अंतर व्यक्त जीन (डीईजी) की पहचान करने के लिए विस्तृत प्रोटोकॉल प्रदान करते हैं, और परिणाम ज्वालामुखी भूखंडों और वेन आरेखों में दिखाए जाते हैं। लिम्मा, DESeq2 और EdgeR के तीन प्रोटोकॉल समान हैं, लेकिन विश्लेषण की प्रक्रियाओं के बीच अलग-अलग कदम हैं। उदाहरण के लिए, लिम्मा में आंकड़ों के लिए एक रैखिक मॉडल का उपयोग किया जाता है, जबकि नकारात्मक बिनोमियल वितरण का उपयोग एजर और डीसेक्यू 2 में किया जाता है। इसके अतिरिक्त, एडजर और लिम्मा के लिए सामान्यीकृत आरएनए-सेक्यू काउंट डेटा आवश्यक है लेकिन डीसेक्यू2 के लिए आवश्यक नहीं है।

यहां, हम तीन अंतर विश्लेषण विधियों के लिए एक विस्तृत प्रोटोकॉल प्रदान करते हैं: लिम्मा, एजर और डीसेक्यू 2। तीन तरीकों के परिणाम आंशिक रूप से ओवरलैपिंग हैं। सभी तीन तरीकों के अपने फायदे हैं, और विधि का चुनाव केवल डेटा पर निर्भर करता है।

Introduction

आरएनए-अनुक्रमण (आरएनए-एसईक्यू) कई फायदों (जैसे, उच्च डेटा प्रजनन क्षमता) के साथ ट्रांसक्रिप्टोमिक्स में सबसे व्यापक रूप से उपयोग की जाने वाली प्रौद्योगिकियों में से एक है, और नाटकीय रूप से जटिल जैविक प्रक्रियाओं की कार्यों और गतिशीलता के बारे में हमारी समझ में वृद्धि हुई है1,2। विभिन्न जैविक संदर्भ के तहत एबररेट ट्रांसक्रिप्ट की पहचान, जिसे अंतर रूप से व्यक्त जीन (डीईजी) के रूप में भी जाना जाता है, आरएनए-एसईक्यू विश्लेषण में एक महत्वपूर्ण कदम है। आरएनए-एसईक्यू रोगजनन से संबंधित आणविक तंत्र और जैविक कार्यों की गहरी समझ प्राप्त करना संभव बनाता है। इसलिए, अंतर विश्लेषण को ट्यूमर3,4,5के निदान, शकुन और चिकित्सीय के लिए मूल्यवान माना गया है। वर्तमान में, आरएनए-सेक्यू अंतर अभिव्यक्ति विश्लेषण, विशेष रूप से लिम्मा, डीसेक्यू2 और एजआर1,6,7के लिए अधिक ओपन-सोर्स आर/बायोकंडक्टर पैकेज विकसित किए गए हैं। हालांकि, अंतर विश्लेषण आर भाषा और उचित विधि है, जो चिकित्सा शिक्षा के पाठ्यक्रम में कमी है चुनने की क्षमता के साथ कुछ कौशल की आवश्यकता है ।

इस प्रोटोकॉल में, कैंसर जीनोम एटलस (टीसीजीए) से निकाले गए कोलंगियोकार्सिनोमा (चोल) आरएनए-सेक्यू काउंट डेटा के आधार पर, तीन सबसे ज्ञात तरीकों (लिम्मा8,एजर9 और डीईईक्यू10)क्रमशः आर प्रोग्राम11 द्वारा कोल और सामान्य ऊतकों के बीच डीईजी की पहचान करने के लिए किए गए थे। लिम्मा, एजर और डीसेक्यू2 के तीन प्रोटोकॉल समान हैं लेकिन विश्लेषण की प्रक्रियाओं के बीच अलग-अलग कदम हैं। उदाहरण के लिए, एडगर और लिम्मा8,9के लिए सामान्यीकृत आरएनए-सेक्यू काउंट डेटा आवश्यक है, जबकि डीईईक्यू2सामान्यीकरण 10के बजाय डेटा को सही करने के लिए अपनी लाइब्रेरी विसंगतियों का उपयोग करता है। इसके अलावा, एजर आरएनए-सेक्यू डेटा के लिए विशेष रूप से उपयुक्त है, जबकि लिम्मा का उपयोग माइक्रोएरास और आरएनए-सेक्यू के लिए किया जाता है। डीईजी12का आकलन करने के लिए लिम्मा द्वारा एक रैखिक मॉडल अपनाया जाता है, जबकि एजर में आंकड़े नकारात्मक द्विमौमिक वितरण पर आधारित होते हैं, जिसमें अनुभवजन्य बायस अनुमान, सटीक परीक्षण, सामान्यीकृत रैखिक मॉडल और अर्ध-संभावना परीक्षण9शामिल हैं।

संक्षेप में, हम क्रमशः लिम्मा, डीसेक्यू2 और एजर का उपयोग करके आरएनए-सेक्यू अंतर अभिव्यक्ति विश्लेषण के विस्तृत प्रोटोकॉल प्रदान करते हैं। इस लेख का हवाला देकर, उपयोगकर्ता आसानी से आरएनए-सेक्यू अंतर विश्लेषण कर सकते हैं और अपने डेटा के लिए उपयुक्त अंतर विश्लेषण विधियों का चयन कर सकते हैं।

Protocol

नोट: आर स्टूडियो कार्यक्रम खोलें और आर फ़ाइल “DEGs.R” लोड, फ़ाइल अनुपूरक फ़ाइलों से प्राप्त किया जा सकता है/ 1. डेटा को डाउनलोड करना और प्री-प्रोसेसिंग करना कैंसर जीनोम एटलस (टीसीजीए) से कोलंगिय?…

Representative Results

अंतर अभिव्यक्ति विश्लेषण के परिणाम की कल्पना करने के लिए विभिन्न दृष्टिकोण हैं, जिनमें से ज्वालामुखी साजिश और वेन आरेख का विशेष रूप से उपयोग किया जाता है। लिम्मा ने |लॉगएफसी|≥2 और एडीजे के साथ चोल और सा?…

Discussion

कैंसर में प्रचुर मात्रा में एबररेट ट्रांसक्रिप्ट को आरएनए-सेक्यू अंतर विश्लेषण5द्वारा आसानी से पहचाना जा सकता है। हालांकि, आरएनए-एसईक्यू अंतर अभिव्यक्ति विश्लेषण का आवेदन अक्सर प्रतिबंधि?…

Disclosures

The authors have nothing to disclose.

Acknowledgements

इस काम को नेशनल नेचुरल साइंस फाउंडेशन ऑफ चाइना (ग्रांट नंबर 81860276) और नेशनल की आरएंडडी प्रोग्राम (ग्रांट नंबर 2018YFC1003200) की प्रमुख स्पेशल फंड प्रोजेक्ट्स ने सपोर्ट किया ।

Materials

R version 3.6.2 free software
Rstudio free software

References

  1. Tambonis, T., Boareto, M., Leite, V. B. P. Differential Expression Analysis in RNA-seq Data Using a Geometric Approach. Journal of Computational Biology. 25, 1257-1265 (2018).
  2. Wang, Z., Gerstein, M., Snyder, M. RNA-Seq: a revolutionary tool for transcriptomics. Nature Reviews. Genetics. 10, 57-63 (2009).
  3. Anders, S., et al. Count-based differential expression analysis of RNA sequencing data using R and Bioconductor. Nature Protocols. 8, 1765-1786 (2013).
  4. McDermaid, A., Monier, B., Zhao, J., Liu, B., Ma, Q. Interpretation of differential gene expression results of RNA-seq data: review and integration. Briefings in Bioinformatics. 20, 2044-2054 (2019).
  5. Costa-Silva, J., Domingues, D., Lopes, F. M. RNA-Seq differential expression analysis: An extended review and a software tool. PloS One. 12, 0190152 (2017).
  6. Law, C. W., et al. RNA-seq analysis is easy as 1-2-3 with limma, Glimma and edgeR. F1000Research. 5, (2016).
  7. Varet, H., Brillet-Guéguen, L., Coppée, J. Y., Dillies, M. A. SARTools: A DESeq2- and EdgeR-Based R Pipeline for Comprehensive Differential Analysis of RNA-Seq Data. PloS One. 11, 0157022 (2016).
  8. Ritchie, M. E., et al. limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Research. 43, 47 (2015).
  9. Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: a Bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26, 139-140 (2010).
  10. Love, M. I., Huber, W., Anders, S. Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2. Genome Biology. 15, 550 (2014).
  11. Gentleman, R. C., et al. Bioconductor: open software development for computational biology and bioinformatics. Genome Biology. 5, 80 (2004).
  12. Law, C. W., Chen, Y., Shi, W., Smyth, G. K. voom: Precision weights unlock linear model analysis tools for RNA-seq read counts. Genome Biology. 15, 29 (2014).
  13. Smyth, G. K. Linear models and empirical bayes methods for assessing differential expression in microarray experiments. Statistical Applications in Genetics and Molecular Biology. 3, (2004).
  14. Lund, S. P., Nettleton, D., McCarthy, D. J., Smyth, G. K. Detecting differential expression in RNA-sequence data using quasi-likelihood with shrunken dispersion estimates. Statistical Applications in Genetics and Molecular Biology. 11, (2012).
  15. Reeb, P. D., Steibel, J. P. Evaluating statistical analysis models for RNA sequencing experiments. Frontiers in Genetics. 4, 178 (2013).
  16. Rocke, D. M., et al. Excess False Positive Rates in Methods for Differential Gene Expression Analysis using RNA-Seq Data. bioRxiv. , (2015).
  17. Agarwal, A., et al. Comparison and calibration of transcriptome data from RNA-Seq and tiling arrays. BMC genomics. 11, 383 (2010).
  18. Leng, N., et al. EBSeq: an empirical Bayes hierarchical model for inference in RNA-seq experiments. Bioinformatics. 29, 1035-1043 (2013).
check_url/62528?article_type=t

Play Video

Cite This Article
Liu, S., Wang, Z., Zhu, R., Wang, F., Cheng, Y., Liu, Y. Three Differential Expression Analysis Methods for RNA Sequencing: limma, EdgeR, DESeq2. J. Vis. Exp. (175), e62528, doi:10.3791/62528 (2021).

View Video