Summary

RNAシーケンシング用の3つの微分発現解析方法:リンマ、エッジャー、DESeq2

Published: September 18, 2021
doi:

Summary

RNAシーケンシングの微分発現解析方法の詳細なプロトコルが提供されました: リンマ, エッジ, DESeq2.

Abstract

RNAシーケンシング(RNA-seq)は、遺伝子改変と複雑な生物学的プロセスとの関係を明らかにし、腫瘍の診断、予後、および治療に大きな価値を持つため、トランスクリプトミクスで最も広く使用されている技術の1つです。RNA-seqデータの微分分析は異常転写を同定するために非常に重要であり、リンマ、EdgeRおよびDESeq2は微分分析のための効率的なツールである。しかし、RNA-seq微分解析には、R言語を持つ特定のスキルと、医学教育のカリキュラムに欠けている適切な方法を選択する能力が必要です。

本明細書において、リンマ、DESeq2およびEdgeRを介して、脈管癌(CHOL)と正常組織の間で、それぞれ微分発現遺伝子(DEG)を同定するための詳細なプロトコルを提供し、その結果は火山プロットおよびベン図に示される。リンマ、DESeq2およびEdgeRの3つのプロトコルは類似しているが、分析のプロセス間で異なったステップを有する。たとえば、線形モデルは limma の統計に使用され、負の二項分布は edgeR および DESeq2 で使用されます。さらに、正規化された RNA-seq カウント データは、EdgeR と limma に必要ですが、DESeq2 には必要ありません。

ここでは、リンマ、EdgeR、DESeq2の3つの差分解析方法の詳細なプロトコルを提供します。3つの方法の結果は部分的に重なっています。3 つのメソッドには独自の利点があり、メソッドの選択はデータのみに依存します。

Introduction

RNA-シーケンシング(RNA-seq)は、多くの利点(例えば、高いデータ再現性)を有するトランスクリプトミクスで最も広く使用されている技術の1つであり、複雑な生物学的プロセス1,2の機能とダイナミクスについての理解を劇的に高めています。異なる生物学的文脈下での異常転写物の同定は、RNA-seq分析の重要なステップである。RNA-seqは、病因と関連する分子機構と生物学的機能を深く理解することを可能にします。したがって、微分分析は、腫瘍3、4、5の診断、予後および治療に対して価値があると考えられてきた。現在、RNA-seqの微分発現解析、特にリンマ、DESeq2およびEdgeR1、6、7のために、よりオープンソースのR/バイオ伝導体パッケージが開発されている。しかし、差分分析には、R言語を持つ特定のスキルと、医学教育のカリキュラムに欠けている適切な方法を選択する能力が必要です。

このプロトコルでは、がんゲノムアトラス(TCGA)から抽出された胆管癌(CHOL)RNA-seqカウントデータに基づいて、最も知られた方法の3つ(リンマ8、EdgeR9およびDESeq210)を、それぞれRプログラム11によって実施し、CHOLと正常組織との間のDEGsを同定した。リンマ、EdgeR、DESeq2の3つのプロトコルは似ていますが、分析のプロセス間で異なるステップがあります。例えば、正規化された RNA-seq カウントデータは、EdgeR および limma8,9に必要ですが、DESeq2 は独自のライブラリーの不一致を使用して、正規化10ではなくデータを修正します。さらに、edgeRはRNA-seqデータに特に適しており、リムマはマイクロアレイおよびRNA-seqに使用されます。線形モデルは、DEG12を評価するためにlimmaによって採用され、edgeRの統計は経験的ベイズ推定、正確なテスト、一般化線形モデルおよび準尤度検定を含む負の二項分布に基づいている

要約すると、それぞれリンマ、DESeq2、EdgeRを用いたRNA-seq微分発現解析の詳細なプロトコルを提供します。この記事を参照することにより、ユーザーは簡単にRNA-seqの微分分析を行い、データに適切な微分分析方法を選択することができます。

Protocol

注:R-studioプログラムを開き、Rファイル”DEGs.R”をロードし、ファイルは補助ファイル/スクリプトから取得することができます。 1. データのダウンロードと前処理 がんゲノムアトラス(TCGA)からコリンジオカルシノーマ(CHOL)のハイスループットシーケンシング(HTSeq)カウントデータをダウンロードしてください。このステップは、次の R コードで簡単に実現できます。<…

Representative Results

火山プロットとベン図が特に使用されている微分表現解析の結果を可視化するための様々なアプローチがあります。リンマは、cholと正常組織の間の3323 AGを|logFC|≥2およびadjで同定した。P.Val <0.05 しきい値として、その中で1880はCHOL組織でダウンレギュレートされ、1443 はアップレギュレートされた (図 1a)。一方、edgeR は 1578 のダウンレギュレーション DEG と 3121 のアップ…

Discussion

癌における豊富な異常性転写物は、RNA-seq差動分析5によって容易に同定することができる。しかし、RNA-seq微分発現解析の適用は、R言語と適切な方法を選択する能力を持つ特定のスキルを必要とするため、しばしば制限されています。この問題に対処するために、我々は、3つの最も知られている方法(リンマ、EdgeRおよびDESeq2)とRNA-seqの微分発現解析を適用するためのチュート…

Declarações

The authors have nothing to disclose.

Acknowledgements

この研究は、中国国立自然科学財団(グラント第81860276)と国家主要研究開発プログラム(グラント2018YFC1003200)の主要特別基金プロジェクトによって支援されました。

Materials

R version 3.6.2 free software
Rstudio free software

Referências

  1. Tambonis, T., Boareto, M., Leite, V. B. P. Differential Expression Analysis in RNA-seq Data Using a Geometric Approach. Journal of Computational Biology. 25, 1257-1265 (2018).
  2. Wang, Z., Gerstein, M., Snyder, M. RNA-Seq: a revolutionary tool for transcriptomics. Nature Reviews. Genetics. 10, 57-63 (2009).
  3. Anders, S., et al. Count-based differential expression analysis of RNA sequencing data using R and Bioconductor. Nature Protocols. 8, 1765-1786 (2013).
  4. McDermaid, A., Monier, B., Zhao, J., Liu, B., Ma, Q. Interpretation of differential gene expression results of RNA-seq data: review and integration. Briefings in Bioinformatics. 20, 2044-2054 (2019).
  5. Costa-Silva, J., Domingues, D., Lopes, F. M. RNA-Seq differential expression analysis: An extended review and a software tool. PloS One. 12, 0190152 (2017).
  6. Law, C. W., et al. RNA-seq analysis is easy as 1-2-3 with limma, Glimma and edgeR. F1000Research. 5, (2016).
  7. Varet, H., Brillet-Guéguen, L., Coppée, J. Y., Dillies, M. A. SARTools: A DESeq2- and EdgeR-Based R Pipeline for Comprehensive Differential Analysis of RNA-Seq Data. PloS One. 11, 0157022 (2016).
  8. Ritchie, M. E., et al. limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Research. 43, 47 (2015).
  9. Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: a Bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26, 139-140 (2010).
  10. Love, M. I., Huber, W., Anders, S. Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2. Genome Biology. 15, 550 (2014).
  11. Gentleman, R. C., et al. Bioconductor: open software development for computational biology and bioinformatics. Genome Biology. 5, 80 (2004).
  12. Law, C. W., Chen, Y., Shi, W., Smyth, G. K. voom: Precision weights unlock linear model analysis tools for RNA-seq read counts. Genome Biology. 15, 29 (2014).
  13. Smyth, G. K. Linear models and empirical bayes methods for assessing differential expression in microarray experiments. Statistical Applications in Genetics and Molecular Biology. 3, (2004).
  14. Lund, S. P., Nettleton, D., McCarthy, D. J., Smyth, G. K. Detecting differential expression in RNA-sequence data using quasi-likelihood with shrunken dispersion estimates. Statistical Applications in Genetics and Molecular Biology. 11, (2012).
  15. Reeb, P. D., Steibel, J. P. Evaluating statistical analysis models for RNA sequencing experiments. Frontiers in Genetics. 4, 178 (2013).
  16. Rocke, D. M., et al. Excess False Positive Rates in Methods for Differential Gene Expression Analysis using RNA-Seq Data. bioRxiv. , (2015).
  17. Agarwal, A., et al. Comparison and calibration of transcriptome data from RNA-Seq and tiling arrays. BMC genomics. 11, 383 (2010).
  18. Leng, N., et al. EBSeq: an empirical Bayes hierarchical model for inference in RNA-seq experiments. Bioinformatics. 29, 1035-1043 (2013).

Play Video

Citar este artigo
Liu, S., Wang, Z., Zhu, R., Wang, F., Cheng, Y., Liu, Y. Three Differential Expression Analysis Methods for RNA Sequencing: limma, EdgeR, DESeq2. J. Vis. Exp. (175), e62528, doi:10.3791/62528 (2021).

View Video