Summary

RNA Dizilimi için Üç Diferansiyel İfade Analizi Yöntemi: limma, EdgeR, DESeq2

Published: September 18, 2021
doi:

Summary

RNA dizilimi için diferansiyel ekspresyon analiz yöntemlerinin ayrıntılı bir protokolü sağlanmıştır: limma, EdgeR, DESeq2.

Abstract

RNA dizilimi (RNA-seq), genetik değişim ve karmaşık biyolojik süreçler arasındaki ilişkiyi ortaya çıkarabildiği ve tümörlerin tanı, prognostik ve terapötiklerinde büyük değere sahip olduğu için transkriptomikte en yaygın kullanılan teknolojilerden biridir. RNA-seq verilerinin diferansiyel analizi anormal transkripsiyonları tanımlamak için çok önemlidir ve limma, EdgeR ve DESeq2 diferansiyel analiz için etkili araçlardır. Bununla birlikte, RNA-seq diferansiyel analizi, tıp eğitimi müfredatında eksik olan R dili ve uygun bir yöntem seçme yeteneği ile belirli beceriler gerektirir.

Burada, sırasıyla limma, DESeq2 ve EdgeR aracılığıyla kolanjiokarsinom (CHOL) ve normal dokular arasında farklı olarak ifade edilen genleri (DEG’ ler) tanımlamak için ayrıntılı protokol sunuyoruz ve sonuçlar volkan arazilerinde ve Venn diyagramlarında gösteriliyor. Limma, DESeq2 ve EdgeR’ın üç protokolü benzerdir, ancak analiz süreçleri arasında farklı adımlara sahiptir. Örneğin, doğrusal bir model limma istatistikleri için kullanılırken, negatif binom dağılımı edgeR ve DESeq2’de kullanılır. Ayrıca, normalleştirilmiş RNA-seq sayısı verileri EdgeR ve limma için gereklidir, ancak DESeq2 için gerekli değildir.

Burada, üç diferansiyel analiz yöntemi için ayrıntılı bir protokol sunuyoruz: limma, EdgeR ve DESeq2. Üç yöntemin sonuçları kısmen çakışıyor. Her üç yöntemin de kendi avantajları vardır ve yöntem seçimi yalnızca verilere bağlıdır.

Introduction

RNA dizilimi (RNA-seq), transkriptomikte birçok avantajla (örneğin, yüksek veri tekrarlanabilirliği) en yaygın kullanılan teknolojilerden biridir ve karmaşık biyolojik süreçlerin işlevleri ve dinamikleri hakkında anlayışımızı önemli ölçüde artırmıştır1,2. Farklı olarak ifade edilen genler (DEG’ ler) olarak da bilinen farklı biyolojik bağlam altında sapma transkriptlerinin tanımlanması, RNA-seq analizinde önemli bir adımdır. RNA-seq, patogenezle ilgili moleküler mekanizmaların ve biyolojik fonksiyonların derinlemesine anlaşılmasını mümkün kılar. Bu nedenle, ayırıcı analiz tümörlerin tanı, prognostik ve terapötikleri için değerli olarak kabul edilmiştir3,4,5. Şu anda, RNA-seq diferansiyel ekspresyon analizi için daha açık kaynaklı R / Biyoiletken paketleri geliştirilmiştir, özellikle limma, DESeq2 ve EdgeR1,6,7. Bununla birlikte, diferansiyel analizi, R dili ile belirli beceriler ve tıp eğitimi müfredatında eksik olan uygun yöntemi seçme yeteneğini gerektirir.

Bu protokolde, Kanser Genom Atlası’ndan (TCGA) çıkarılan kolanjiokarsinom (CHOL) RNA-seq sayım verilerine dayanarak, CHOL ve normal dokular arasındaki DEG’leri tanımlamak için R programı11tarafından en bilinen yöntemlerden üçü (sırasıyla limma8, EdgeR9 ve DESeq210) gerçekleştirilmiştir. Limma, EdgeR ve DESeq2’nin üç protokolü benzerdir, ancak analiz süreçleri arasında farklı adımlara sahiptir. Örneğin, normalleştirilmiş RNA-seq sayısı verileri EdgeR ve limma8,9için gereklidir, DESeq2 ise normalleştirme10yerine verileri düzeltmek için kendi kitaplık tutarsızlıklarını kullanır. Ayrıca, edgeR RNA-seq verileri için özel olarak uygundur, limma ise mikroarraylar ve RNA-seq için kullanılır. Doğrusal bir model limma tarafından DEG’leri değerlendirmek için benimsenmiştir12, edgeR’daki istatistikler ampirik Bayes tahmini, kesin testler, genelleştirilmiş doğrusal modeller ve yarı olasılık testleri9dahil olmak üzere negatif binom dağılımlarına dayanmaktadır.

Özetle, sırasıyla limma, DESeq2 ve EdgeR kullanarak RNA-seq diferansiyel ekspresyon analizinin ayrıntılı protokollerini sağlıyoruz. Bu makaleye atıfta bulunarak, kullanıcılar RNA-seq diferansiyel analizini kolayca gerçekleştirebilir ve verileri için uygun diferansiyel analiz yöntemlerini seçebilirler.

Protocol

NOT: R-studio programını açın ve R dosyası “DEGs.R” yükleyin, dosya Ek dosyalardan / Komut Dosyalarından edinilebilir. 1. Verilerin indirilmesi ve önceden işlenmesi Kanser Genom Atlası’ndan (TCGA) kolanjiokarsinom (CHOL) yüksek verimli dizileme (HTSeq) sayısı verilerini indirin. Bu adım aşağıdaki R kodu ile kolayca elde edilebilir. R paketlerini yüklemek için Çalıştır’ı tıklatın. R paketlerini yüklemek için Çal?…

Representative Results

Volkan arsası ve Venn diyagramının özellikle kullanıldığı diferansiyel ifade analizinin sonucunu görselleştirmek için çeşitli yaklaşımlar vardır. limma, CHOL ve normal dokular arasında |logFC|≥2 ve adj ile 3323 DEG tespit etti. P.Val <0.05 eşik olarak, aralarında 1880'inIN CHOL dokularında aşağı regüle edildiği ve 1443'ü yukarı regüle edildiği (Şekil 1a). Bu arada edgeR, 1578 aşağı düzenlenmiş DEG’leri ve 3121 yukarı düzenlenmiş DEG’leri tanımladı (<…

Discussion

Kanserlerde bol miktarda sapma transkriptleri RNA-seq diferansiyel analizi ile kolayca tanımlanabilir5. Bununla birlikte, R dili ile belirli beceriler ve uygun yöntemleri seçme kapasitesi gerektirdiğinden, RNA-seq diferansiyel ifade analizinin uygulanması genellikle kısıtlanır. Bu sorunu gidermek için, en bilinen üç yönteme (limma, EdgeR ve DESeq2) ve RNA-seq diferansiyel ifade çözümlemesi uygulamak için öğreticilere ayrıntılı bir giriş sağlıyoruz. Bu, her üç yöntemdeki …

Disclosures

The authors have nothing to disclose.

Acknowledgements

Bu çalışma, Çin Ulusal Doğa Bilimleri Vakfı (Grant No. 81860276) ve Ulusal Anahtar Ar-Ge Programının Anahtar Özel Fon Projeleri (Grant No. 2018YFC1003200) tarafından desteklendi.

Materials

R version 3.6.2 free software
Rstudio free software

References

  1. Tambonis, T., Boareto, M., Leite, V. B. P. Differential Expression Analysis in RNA-seq Data Using a Geometric Approach. Journal of Computational Biology. 25, 1257-1265 (2018).
  2. Wang, Z., Gerstein, M., Snyder, M. RNA-Seq: a revolutionary tool for transcriptomics. Nature Reviews. Genetics. 10, 57-63 (2009).
  3. Anders, S., et al. Count-based differential expression analysis of RNA sequencing data using R and Bioconductor. Nature Protocols. 8, 1765-1786 (2013).
  4. McDermaid, A., Monier, B., Zhao, J., Liu, B., Ma, Q. Interpretation of differential gene expression results of RNA-seq data: review and integration. Briefings in Bioinformatics. 20, 2044-2054 (2019).
  5. Costa-Silva, J., Domingues, D., Lopes, F. M. RNA-Seq differential expression analysis: An extended review and a software tool. PloS One. 12, 0190152 (2017).
  6. Law, C. W., et al. RNA-seq analysis is easy as 1-2-3 with limma, Glimma and edgeR. F1000Research. 5, (2016).
  7. Varet, H., Brillet-Guéguen, L., Coppée, J. Y., Dillies, M. A. SARTools: A DESeq2- and EdgeR-Based R Pipeline for Comprehensive Differential Analysis of RNA-Seq Data. PloS One. 11, 0157022 (2016).
  8. Ritchie, M. E., et al. limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Research. 43, 47 (2015).
  9. Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: a Bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26, 139-140 (2010).
  10. Love, M. I., Huber, W., Anders, S. Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2. Genome Biology. 15, 550 (2014).
  11. Gentleman, R. C., et al. Bioconductor: open software development for computational biology and bioinformatics. Genome Biology. 5, 80 (2004).
  12. Law, C. W., Chen, Y., Shi, W., Smyth, G. K. voom: Precision weights unlock linear model analysis tools for RNA-seq read counts. Genome Biology. 15, 29 (2014).
  13. Smyth, G. K. Linear models and empirical bayes methods for assessing differential expression in microarray experiments. Statistical Applications in Genetics and Molecular Biology. 3, (2004).
  14. Lund, S. P., Nettleton, D., McCarthy, D. J., Smyth, G. K. Detecting differential expression in RNA-sequence data using quasi-likelihood with shrunken dispersion estimates. Statistical Applications in Genetics and Molecular Biology. 11, (2012).
  15. Reeb, P. D., Steibel, J. P. Evaluating statistical analysis models for RNA sequencing experiments. Frontiers in Genetics. 4, 178 (2013).
  16. Rocke, D. M., et al. Excess False Positive Rates in Methods for Differential Gene Expression Analysis using RNA-Seq Data. bioRxiv. , (2015).
  17. Agarwal, A., et al. Comparison and calibration of transcriptome data from RNA-Seq and tiling arrays. BMC genomics. 11, 383 (2010).
  18. Leng, N., et al. EBSeq: an empirical Bayes hierarchical model for inference in RNA-seq experiments. Bioinformatics. 29, 1035-1043 (2013).

Play Video

Cite This Article
Liu, S., Wang, Z., Zhu, R., Wang, F., Cheng, Y., Liu, Y. Three Differential Expression Analysis Methods for RNA Sequencing: limma, EdgeR, DESeq2. J. Vis. Exp. (175), e62528, doi:10.3791/62528 (2021).

View Video