Summary

RNA 시퀀싱을 위한 3개의 차동 발현 분석 방법: 림마, EdgeR, DESeq2

Published: September 18, 2021
doi:

Summary

RNA 시퀀싱을 위한 차동 발현 분석 방법의 상세한 프로토콜이 제공되었다: 림마, EdgeR, DESeq2.

Abstract

RNA 시퀀싱 (RNA-seq)은 유전 적 변경과 복잡한 생물학적 과정 사이의 관계를 밝힐 수 있으며 종양의 진단, 예후 및 치료에서 큰 가치를 가지고 있기 때문에 전사학에서 가장 널리 사용되는 기술 중 하나입니다. RNA-seq 데이터의 차동 분석은 비정상적인 전사를 식별하는 데 매우 중요하며 림마, EdgeR 및 DESeq2는 차동 분석을 위한 효율적인 도구입니다. 그러나, RNA-seq 차동 분석은 R 언어를 가진 특정 기술과 의학 교육의 교과 과정에서 부족한 적당한 방법을 선택하는 기능이 필요합니다.

본 명세서에서는, 당사는 각각 림마, DESeq2 및 EdgeR을 통해 담랑고아르시노마(CHOL) 및 정상 조직 간의 분화유전자(DEGs)를 식별하고, 그 결과는 화산 플롯및 벤 다이어그램에 도시된다. limma, DESeq2 및 EdgeR의 세 가지 프로토콜은 유사하지만 분석 프로세스 마다 다른 단계가 있습니다. 예를 들어 선형 모델은 림마의 통계에 사용되는 반면 음수 이비알 분포는 edgeR 및 DESeq2에서 사용됩니다. 또한, 정규화된 RNA-seq 카운트 데이터는 EdgeR 및 림마에 필요하지만 DESeq2에는 필요하지 않습니다.

여기서는 림마, EdgeR 및 DESeq2의 세 가지 차동 분석 방법에 대한 자세한 프로토콜을 제공합니다. 세 가지 방법의 결과는 부분적으로 겹칩니다. 세 가지 방법 모두 고유한 장점이 있으며 메서드 선택은 데이터에만 따라 다릅니다.

Introduction

RNA-시퀀싱(RNA-seq)은 많은 장점(예를 들어, 높은 데이터 재현성)을 가진 전사학에서 가장 널리 사용되는 기술 중 하나이며, 복잡한 생물학적 과정의 기능 및 역학에 대한 이해를 크게증가시켰습니다 1,2. 다른 생물학적 맥락에서 비정상적인 전사체의 식별은 또한 분화 유전자 (DEGs)로 알려져 있으며, RNA-seq 분석에서 중요한 단계입니다. RNA-seq는 병인과 관련된 분자 메커니즘 및 생물학적 기능에 대한 깊은 이해를 얻을 수 있게 합니다. 따라서, 차동 분석은종양의진단, 예후 및 치료에 귀중한 것으로 간주되어 왔다3,4,5. 현재, RNA-seq 차동 발현 분석, 특히 림마, DESeq2 및 EdgeR1,6,7을위해 더 많은 오픈 소스 R/바이오 컨덕터 패키지가 개발되었다. 그러나, 차등 분석은 R 언어와 특정 기술과 의료 교육의 교육 과정에서 부족한 적절한 방법을 선택하는 능력이 필요합니다.

본 프로토콜에서, 암 게놈 아틀라스(TCGA)로부터 추출된 담랑고카르시노마(CHOL) RNA-seq 카운트 데이터를 기반으로, 가장 공지된 방법 중 3개(림마8,EdgeR9 및 DESeq210)가각각 R프로그램에 의해 CHOL과 정상 조직 간의 DEGs를 식별하였다. limma, EdgeR 및 DESeq2의 세 가지 프로토콜은 유사하지만 분석 프로세스 마다 다른 단계가 있습니다. 예를 들어, 정규화된 RNA-seq 카운트 데이터는 EdgeR 및 limma8,9에필요하며, DESeq2는 자체 라이브러리 불일치를 사용하여정규화(10)가아닌 데이터를 수정한다. 더욱이, edgeR은 RNA-seq 데이터에 특히 적합하며, 림마는 마이크로어레이 및 RNA-seq에 사용된다. 선형 모델은 LIMma에 의해 채택되어DEGs(12)를평가하고, edgeR의 통계는 경험적 베이추정, 정확한 테스트, 일반화선형 모델 및 준가능성 시험9을포함한 음수 이난 분포를 기반으로 한다.

요약하자면, 우리는 각각 림마, DESeq2 및 EdgeR을 사용하여 RNA-seq 차동 발현 분석의 상세한 프로토콜을 제공합니다. 이 문서를 참조함으로써 사용자는 RNA-seq 차동 분석을 쉽게 수행하고 데이터에 적합한 차동 분석 방법을 선택할 수 있습니다.

Protocol

참고: R-스튜디오 프로그램을 열고 R 파일 “DEGs.R”을 로드하면 추가 파일/스크립트에서 파일을 얻을 수 있습니다. 1. 데이터 다운로드 및 사전 처리 암 게놈 아틀라스(TCGA)에서 콜린고이오사르키노마(CHOL)의 고처리량 시퀀싱(HTSeq) 카운트 데이터를 다운로드한다. 이 단계는 다음 R 코드로 쉽게 수행할 수 있습니다. R 패키지를 설치하려면 실행을 클릭합니?…

Representative Results

화산 플롯과 Venn 다이어그램이 특히 사용되는 차동 식 분석의 결과를 시각화하는 다양한 접근 방식이 있습니다. 림마는 |로그FC|≥2와 adj를 가진 CHOL과 정상 조직 사이 3323개의 DEG를 확인했습니다. P.Val<0.05는 임계값으로, 그 중 1880은 CHOL 조직에서 하향 조절되었고 1443은 업규제(그림 1a)였다. 한편, EdgeR은 1578개의 다운 규제 DEGs와 3121개의 업 규제 DEGs(그림1b);를 ?…

Discussion

암에 있는 풍부한 수차성 전사체는 RNA-seq 차동 분석에 의해 쉽게 확인할 수 있습니다5. 그러나, RNA-seq 차동 발현 분석의 적용은 R 언어와 적절한 방법을 선택할 수 있는 특정 능력을 필요로 하기 때문에 종종 제한됩니다. 이 문제를 해결하기 위해, 우리는 RNA-seq 차동 발현 분석을 적용하기위한 세 가지 가장 잘 알려진 방법 (limma, EdgeR 및 DESeq2)에 대한 자세한 소개및 자습서를 제공합…

Disclosures

The authors have nothing to disclose.

Acknowledgements

이 작품은 중국 국립 자연과학 재단(81860276 보조금)과 국가 핵심 R&D 프로그램의 주요 특별 기금 프로젝트(보조금 2018YFC1003200)의 지원을 받았습니다.

Materials

R version 3.6.2 free software
Rstudio free software

References

  1. Tambonis, T., Boareto, M., Leite, V. B. P. Differential Expression Analysis in RNA-seq Data Using a Geometric Approach. Journal of Computational Biology. 25, 1257-1265 (2018).
  2. Wang, Z., Gerstein, M., Snyder, M. RNA-Seq: a revolutionary tool for transcriptomics. Nature Reviews. Genetics. 10, 57-63 (2009).
  3. Anders, S., et al. Count-based differential expression analysis of RNA sequencing data using R and Bioconductor. Nature Protocols. 8, 1765-1786 (2013).
  4. McDermaid, A., Monier, B., Zhao, J., Liu, B., Ma, Q. Interpretation of differential gene expression results of RNA-seq data: review and integration. Briefings in Bioinformatics. 20, 2044-2054 (2019).
  5. Costa-Silva, J., Domingues, D., Lopes, F. M. RNA-Seq differential expression analysis: An extended review and a software tool. PloS One. 12, 0190152 (2017).
  6. Law, C. W., et al. RNA-seq analysis is easy as 1-2-3 with limma, Glimma and edgeR. F1000Research. 5, (2016).
  7. Varet, H., Brillet-Guéguen, L., Coppée, J. Y., Dillies, M. A. SARTools: A DESeq2- and EdgeR-Based R Pipeline for Comprehensive Differential Analysis of RNA-Seq Data. PloS One. 11, 0157022 (2016).
  8. Ritchie, M. E., et al. limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Research. 43, 47 (2015).
  9. Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: a Bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26, 139-140 (2010).
  10. Love, M. I., Huber, W., Anders, S. Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2. Genome Biology. 15, 550 (2014).
  11. Gentleman, R. C., et al. Bioconductor: open software development for computational biology and bioinformatics. Genome Biology. 5, 80 (2004).
  12. Law, C. W., Chen, Y., Shi, W., Smyth, G. K. voom: Precision weights unlock linear model analysis tools for RNA-seq read counts. Genome Biology. 15, 29 (2014).
  13. Smyth, G. K. Linear models and empirical bayes methods for assessing differential expression in microarray experiments. Statistical Applications in Genetics and Molecular Biology. 3, (2004).
  14. Lund, S. P., Nettleton, D., McCarthy, D. J., Smyth, G. K. Detecting differential expression in RNA-sequence data using quasi-likelihood with shrunken dispersion estimates. Statistical Applications in Genetics and Molecular Biology. 11, (2012).
  15. Reeb, P. D., Steibel, J. P. Evaluating statistical analysis models for RNA sequencing experiments. Frontiers in Genetics. 4, 178 (2013).
  16. Rocke, D. M., et al. Excess False Positive Rates in Methods for Differential Gene Expression Analysis using RNA-Seq Data. bioRxiv. , (2015).
  17. Agarwal, A., et al. Comparison and calibration of transcriptome data from RNA-Seq and tiling arrays. BMC genomics. 11, 383 (2010).
  18. Leng, N., et al. EBSeq: an empirical Bayes hierarchical model for inference in RNA-seq experiments. Bioinformatics. 29, 1035-1043 (2013).
check_url/62528?article_type=t

Play Video

Cite This Article
Liu, S., Wang, Z., Zhu, R., Wang, F., Cheng, Y., Liu, Y. Three Differential Expression Analysis Methods for RNA Sequencing: limma, EdgeR, DESeq2. J. Vis. Exp. (175), e62528, doi:10.3791/62528 (2021).

View Video