Der blev leveret en detaljeret protokol over differentialudtryksanalysemetoder til RNA-sekventering: limma, EdgeR, DESeq2.
RNA sekventering (RNA-seq) er en af de mest anvendte teknologier i transcriptomics, da det kan afsløre forholdet mellem den genetiske ændring og komplekse biologiske processer og har stor værdi i diagnostik, prognostikere og terapi af tumorer. Differentieret analyse af RNA-seq-data er afgørende for at identificere afvigende transskriptioner, og limma, EdgeR og DESeq2 er effektive værktøjer til differentialanalyse. RNA-seq differentialanalyse kræver dog visse færdigheder med R-sprog og evnen til at vælge en passende metode, som mangler i læseplanen for medicinsk uddannelse.
Heri leverer vi den detaljerede protokol til at identificere differentierede udtrykte gener (DEGs) mellem cholangiocarcinoma (CHOL) og normale væv gennem limma, DESeq2 og EdgeR, og resultaterne er vist i vulkanplot og Venn-diagrammer. De tre protokoller af limma, DESeq2 og EdgeR er ens, men har forskellige trin blandt analyseprocesserne. En lineær model bruges f.eks. Derudover er de normaliserede RNA-seq count data nødvendige for EdgeR og limma, men er ikke nødvendige for DESeq2.
Her leverer vi en detaljeret protokol for tre differentialanalysemetoder: limma, EdgeR og DESeq2. Resultaterne af de tre metoder overlapper delvis hinanden. Alle tre metoder har deres egne fordele, og valget af metode afhænger kun af dataene.
RNA-sekventering (RNA-seq) er en af de mest anvendte teknologier i transcriptomics med mange fordele (f.eks. høj datagen reproducerbarhed) og har dramatisk øget vores forståelse af funktionerne og dynamikken i komplekse biologiske processer1,2. Identifikation af aberrate udskrifter under forskellige biologiske sammenhænge, som også er kendt som differentieret udtrykte gener (DEGs), er et vigtigt skridt i RNA-seq analyse. RNA-seq gør det muligt at få en dyb forståelse af patogeneserelaterede molekylære mekanismer og biologiske funktioner. Derfor er differentialanalyse blevet betragtet som værdifuld for diagnostik, prognostik og terapi af tumorer3,4,5. I øjeblikket er der udviklet flere open source R/Bioconductor-pakker til RNA-seq differentialudtryksanalyse, især limma, DESeq2 og EdgeR1,6,7. Differentialanalyse kræver imidlertid visse færdigheder med R-sprog og evnen til at vælge den rigtige metode, som mangler i læseplanen for medicinsk uddannelse.
I denne protokol, baseret på cholangiocarcinoma (CHOL) RNA-seq tælle data udvundet fra The Cancer Genome Atlas (TCGA), tre af de mest kendte metoder (limma8, EdgeR9 og DESeq210) blev udført, henholdsvis af R-program11 til at identificere DEGs mellem CHOL og normale væv. De tre protokoller af limma, EdgeR og DESeq2 er ens, men har forskellige trin blandt analyseprocesserne. De normaliserede RNA-seq-optællingsdata erf.eks. Desuden er edgeR specielt velegnet til RNA-seq data, mens limmaen bruges til mikroarrays og RNA-seq. En lineær model vedtages af limma for at vurdere DEGs12, mens statistikkerne i edgeR er baseret på de negative binomialfordelinger, herunder empirisk Bayes-skøn, nøjagtige tests, generaliserede lineære modeller og kvasi-sandsynlighedstest9.
Sammenfattende leverer vi de detaljerede protokoller for RNA-seq differentialudtryksanalyse ved hjælp af henholdsvis limma, DESeq2 og EdgeR. Ved at henvise til denne artikel kan brugerne nemt udføre RNA-seq differentialanalysen og vælge passende differentialanalysemetoder til deres data.
Rigelige aberrate udskrifter i kræft kan let identificeres ved RNA-seq differentialanalyse5. Anvendelsen af RNA-seq differentialudtryksanalyse er imidlertid ofte begrænset, da det kræver visse færdigheder med R-sprog og evnen til at vælge passende metoder. For at løse dette problem giver vi en detaljeret introduktion til de tre mest kendte metoder (limma, EdgeR og DESeq2) og tutorials til anvendelse af RNA-seq differentialudtryksanalysen. Dette vil lette forståelsen af ligheder og forskelle…
The authors have nothing to disclose.
Dette arbejde blev støttet af National Natural Science Foundation of China (Grant No. 81860276) og Key Special Fund Projects of National Key R&D Program (Grant No. 2018YFC1003200).