Summary

Tre metoder til differentialudtryksanalyse til RNA-sekventering: limma, EdgeR, DESeq2

Published: September 18, 2021
doi:

Summary

Der blev leveret en detaljeret protokol over differentialudtryksanalysemetoder til RNA-sekventering: limma, EdgeR, DESeq2.

Abstract

RNA sekventering (RNA-seq) er en af de mest anvendte teknologier i transcriptomics, da det kan afsløre forholdet mellem den genetiske ændring og komplekse biologiske processer og har stor værdi i diagnostik, prognostikere og terapi af tumorer. Differentieret analyse af RNA-seq-data er afgørende for at identificere afvigende transskriptioner, og limma, EdgeR og DESeq2 er effektive værktøjer til differentialanalyse. RNA-seq differentialanalyse kræver dog visse færdigheder med R-sprog og evnen til at vælge en passende metode, som mangler i læseplanen for medicinsk uddannelse.

Heri leverer vi den detaljerede protokol til at identificere differentierede udtrykte gener (DEGs) mellem cholangiocarcinoma (CHOL) og normale væv gennem limma, DESeq2 og EdgeR, og resultaterne er vist i vulkanplot og Venn-diagrammer. De tre protokoller af limma, DESeq2 og EdgeR er ens, men har forskellige trin blandt analyseprocesserne. En lineær model bruges f.eks. Derudover er de normaliserede RNA-seq count data nødvendige for EdgeR og limma, men er ikke nødvendige for DESeq2.

Her leverer vi en detaljeret protokol for tre differentialanalysemetoder: limma, EdgeR og DESeq2. Resultaterne af de tre metoder overlapper delvis hinanden. Alle tre metoder har deres egne fordele, og valget af metode afhænger kun af dataene.

Introduction

RNA-sekventering (RNA-seq) er en af de mest anvendte teknologier i transcriptomics med mange fordele (f.eks. høj datagen reproducerbarhed) og har dramatisk øget vores forståelse af funktionerne og dynamikken i komplekse biologiske processer1,2. Identifikation af aberrate udskrifter under forskellige biologiske sammenhænge, som også er kendt som differentieret udtrykte gener (DEGs), er et vigtigt skridt i RNA-seq analyse. RNA-seq gør det muligt at få en dyb forståelse af patogeneserelaterede molekylære mekanismer og biologiske funktioner. Derfor er differentialanalyse blevet betragtet som værdifuld for diagnostik, prognostik og terapi af tumorer3,4,5. I øjeblikket er der udviklet flere open source R/Bioconductor-pakker til RNA-seq differentialudtryksanalyse, især limma, DESeq2 og EdgeR1,6,7. Differentialanalyse kræver imidlertid visse færdigheder med R-sprog og evnen til at vælge den rigtige metode, som mangler i læseplanen for medicinsk uddannelse.

I denne protokol, baseret på cholangiocarcinoma (CHOL) RNA-seq tælle data udvundet fra The Cancer Genome Atlas (TCGA), tre af de mest kendte metoder (limma8, EdgeR9 og DESeq210) blev udført, henholdsvis af R-program11 til at identificere DEGs mellem CHOL og normale væv. De tre protokoller af limma, EdgeR og DESeq2 er ens, men har forskellige trin blandt analyseprocesserne. De normaliserede RNA-seq-optællingsdata erf.eks. Desuden er edgeR specielt velegnet til RNA-seq data, mens limmaen bruges til mikroarrays og RNA-seq. En lineær model vedtages af limma for at vurdere DEGs12, mens statistikkerne i edgeR er baseret på de negative binomialfordelinger, herunder empirisk Bayes-skøn, nøjagtige tests, generaliserede lineære modeller og kvasi-sandsynlighedstest9.

Sammenfattende leverer vi de detaljerede protokoller for RNA-seq differentialudtryksanalyse ved hjælp af henholdsvis limma, DESeq2 og EdgeR. Ved at henvise til denne artikel kan brugerne nemt udføre RNA-seq differentialanalysen og vælge passende differentialanalysemetoder til deres data.

Protocol

BEMÆRK: Åbn R-studiet program og indlæse R-fil “DEGs.R”, kan filen hentes fra supplerende filer / scripts. 1. Download og forbehandling af data Download de høje gennemløb sekventering (HTSeq) tælle data af cholangiocarcinoma (CHOL) fra The Cancer Genome Atlas (TCGA). Dette trin kan nemt opnås ved hjælp af følgende R-kode. Klik på Kør for at installere R-pakker. Klik på Kør for at indlæse R-pakker.if(!requireNamesp…

Representative Results

Der er forskellige tilgange til at visualisere resultatet af differentialudtryksanalyse, blandt hvilke vulkanplottet og Venn-diagrammet bruges særligt. limma identificeret 3323 DEGs mellem CHOL og normale væv med |logFC|≥2 og adj. P.Val <0,05 som tærskler, hvoraf 1880 var nedreguleret i CHOL-væv, og 1443 var up-regulerede (Figur 1a). I mellemtiden identificerede EdgeR de 1578 nedregulerede DEG’er og 3121 up-regulerede DEG ‘er(figur 1b); DESeq2 identificere…

Discussion

Rigelige aberrate udskrifter i kræft kan let identificeres ved RNA-seq differentialanalyse5. Anvendelsen af RNA-seq differentialudtryksanalyse er imidlertid ofte begrænset, da det kræver visse færdigheder med R-sprog og evnen til at vælge passende metoder. For at løse dette problem giver vi en detaljeret introduktion til de tre mest kendte metoder (limma, EdgeR og DESeq2) og tutorials til anvendelse af RNA-seq differentialudtryksanalysen. Dette vil lette forståelsen af ligheder og forskelle…

Divulgazioni

The authors have nothing to disclose.

Acknowledgements

Dette arbejde blev støttet af National Natural Science Foundation of China (Grant No. 81860276) og Key Special Fund Projects of National Key R&D Program (Grant No. 2018YFC1003200).

Materials

R version 3.6.2 free software
Rstudio free software

Riferimenti

  1. Tambonis, T., Boareto, M., Leite, V. B. P. Differential Expression Analysis in RNA-seq Data Using a Geometric Approach. Journal of Computational Biology. 25, 1257-1265 (2018).
  2. Wang, Z., Gerstein, M., Snyder, M. RNA-Seq: a revolutionary tool for transcriptomics. Nature Reviews. Genetics. 10, 57-63 (2009).
  3. Anders, S., et al. Count-based differential expression analysis of RNA sequencing data using R and Bioconductor. Nature Protocols. 8, 1765-1786 (2013).
  4. McDermaid, A., Monier, B., Zhao, J., Liu, B., Ma, Q. Interpretation of differential gene expression results of RNA-seq data: review and integration. Briefings in Bioinformatics. 20, 2044-2054 (2019).
  5. Costa-Silva, J., Domingues, D., Lopes, F. M. RNA-Seq differential expression analysis: An extended review and a software tool. PloS One. 12, 0190152 (2017).
  6. Law, C. W., et al. RNA-seq analysis is easy as 1-2-3 with limma, Glimma and edgeR. F1000Research. 5, (2016).
  7. Varet, H., Brillet-Guéguen, L., Coppée, J. Y., Dillies, M. A. SARTools: A DESeq2- and EdgeR-Based R Pipeline for Comprehensive Differential Analysis of RNA-Seq Data. PloS One. 11, 0157022 (2016).
  8. Ritchie, M. E., et al. limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Research. 43, 47 (2015).
  9. Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: a Bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26, 139-140 (2010).
  10. Love, M. I., Huber, W., Anders, S. Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2. Genome Biology. 15, 550 (2014).
  11. Gentleman, R. C., et al. Bioconductor: open software development for computational biology and bioinformatics. Genome Biology. 5, 80 (2004).
  12. Law, C. W., Chen, Y., Shi, W., Smyth, G. K. voom: Precision weights unlock linear model analysis tools for RNA-seq read counts. Genome Biology. 15, 29 (2014).
  13. Smyth, G. K. Linear models and empirical bayes methods for assessing differential expression in microarray experiments. Statistical Applications in Genetics and Molecular Biology. 3, (2004).
  14. Lund, S. P., Nettleton, D., McCarthy, D. J., Smyth, G. K. Detecting differential expression in RNA-sequence data using quasi-likelihood with shrunken dispersion estimates. Statistical Applications in Genetics and Molecular Biology. 11, (2012).
  15. Reeb, P. D., Steibel, J. P. Evaluating statistical analysis models for RNA sequencing experiments. Frontiers in Genetics. 4, 178 (2013).
  16. Rocke, D. M., et al. Excess False Positive Rates in Methods for Differential Gene Expression Analysis using RNA-Seq Data. bioRxiv. , (2015).
  17. Agarwal, A., et al. Comparison and calibration of transcriptome data from RNA-Seq and tiling arrays. BMC genomics. 11, 383 (2010).
  18. Leng, N., et al. EBSeq: an empirical Bayes hierarchical model for inference in RNA-seq experiments. Bioinformatics. 29, 1035-1043 (2013).
check_url/it/62528?article_type=t

Play Video

Citazione di questo articolo
Liu, S., Wang, Z., Zhu, R., Wang, F., Cheng, Y., Liu, Y. Three Differential Expression Analysis Methods for RNA Sequencing: limma, EdgeR, DESeq2. J. Vis. Exp. (175), e62528, doi:10.3791/62528 (2021).

View Video