Summary

Un protocollo per l'utilizzo di Gene imposta analisi di arricchimento per identificare il modello animale adeguato per la ricerca traslazionale

Published: August 16, 2017
doi:

Summary

Forniamo un protocollo standardizzato per l’utilizzo di analisi del gene arricchimento set di dati di trascrittomica per identificare un modello di mouse ideale per la ricerca traslazionale.
Questo protocollo può essere utilizzato con DNA microarray e dati di sequenziamento di RNA e ulteriore può essere esteso ad altri dati di omics se sono disponibili dati.

Abstract

Recenti studi che hanno confrontato Transcrittomica DataSet delle malattie umane con set di dati da modelli murini utilizzando tecniche tradizionali gene per gene confronto ha provocato conclusioni contraddittorie riguardo la rilevanza dei modelli animali per traslazionale ricerca. Delle ragioni principali per le discrepanze tra analisi di espressione genica diversa è il filtraggio arbitraria dei geni differenzialmente espressi. Inoltre, il confronto di singoli geni tra specie diverse e piattaforme spesso è limitato dalla varianza tecnico, che conduce all’interpretazione errata di con/discordanza tra dati provenienti da modelli umani e animali. Così, sono necessari approcci standardizzati per l’analisi sistematica dei dati. Per superare il filtro soggettivo gene e inefficaci gene per gene confronti, noi abbiamo recentemente dimostrato che l’analisi del gene arricchimento set (GSEA) ha il potenziale per evitare questi problemi. Di conseguenza, abbiamo sviluppato un protocollo standardizzato per l’uso di GSEA per distinguere tra modelli animali appropriati e inappropriati per ricerca traslazionale. Questo protocollo non è adatto per predire come progettare nuovi sistemi di modello a priori, in quanto richiede dati sperimentali omics esistenti. Tuttavia, il protocollo viene descritto come interpretare i dati esistenti in un modo standardizzato per poter selezionare il modello animale più idoneo, evitando inutili esperimenti sugli animali e fuorviante studi traslazionali.

Introduction

Modelli animali sono ampiamente usati per studiare le malattie umane, a causa della loro presunta somiglianza agli esseri umani in termini di genetica, anatomia e fisiologia. Inoltre, modelli animali spesso servono come portieri per terapie cliniche e possono avere un enorme impatto sul successo della ricerca traslazionale. Un’attenta selezione del modello animale ottima può ridurre il numero di studi sugli animali fuorvianti. Recentemente, la rilevanza dei modelli animali per ricerca traslazionale è stata discutibile discussa, specialmente perché analizzando gli stesso set di dati ottenuti da malattie infiammatorie umane e modelli murini correlate ha portato a conclusioni contraddittorie 1,2. Questa discussione ha rivelato un problema fondamentale durante l’analisi dei dati omiche: sono necessari approcci standardizzati per l’analisi sistematica dei dati al fine di ridurre la selezione genetica prevenuto e per aumentare la robustezza di confronti interspecie 3.

Tradizionalmente, l’analisi dei dati di trascrittomica (e altri dati di omics) avviene a livello di singolo gene e include un passaggio iniziale della selezione genetica sulla base di parametri rigorosi cut-off (ad es., fold change > 2.0, valore di p < 0.05). Tuttavia, l’impostazione dei parametri di taglio iniziale spesso è soggettiva, arbitraria e non biologicamente giustificati e può anche portare a conclusioni opposte1,2. Inoltre, la selezione genetica iniziale generalmente limita l’analisi a pochi altamente – up e downregulated geni e così non è abbastanza sensibile per includere la maggior parte dei geni differenzialmente espressi in misura minore.

Con l’ascesa dell’era genomica nel 2000s iniziale e la crescente conoscenza delle vie biologiche e contesti, approcci statistici alternativi sono stati sviluppati che hanno permesso di aggirare le limitazioni di analisi livello singolo gene. Gene impostata arricchimento analisi (GSEA)4, che è uno dei metodi ampiamente accettati per l’analisi dei dati di trascrittomica, fa uso di gruppi definiti a priori dei geni (ad es., segnalazione di percorsi, posizione prossimale del cromosoma ecc.). GSEA mappe prima tutti i geni non filtrati rilevati ai set di gene desiderato (ad esempio, percorsi), indipendentemente dal loro cambiamento individuale nell’espressione. Questo approccio comprende così anche moderatamente geni che altrimenti andrebbe perse con analisi livello singolo gene. L’additivo modifica nell’espressione genica rientranti successivamente viene eseguita utilizzando le statistiche di somma in esecuzione.

Nonostante il suo ampio uso nella ricerca medica, GSEA e arricchimento set relativi approcci non sono evidentemente tenuti conto per l’analisi di dati complessi omiche. Qui, descriviamo un protocollo per il confronto di dati omics dai campioni umani con quelli provenienti da modelli murini al fine di individuare il modello ideale per studi traslazionali. Dimostriamo l’applicabilità del protocollo basato su una raccolta di modelli di mouse che vengono utilizzati per mimare umani disordini infiammatori. Tuttavia, questa pipeline di analisi non è limitata ai confronti umani-mouse e ricerca emendabile ad ulteriori domande.

Protocol

1. download del Software GSEA e il Molecular Signatures Database Vai al sito ufficiale GSEA Broad Institute (http://software.broadinstitute.org/gsea/index.jsp) e registrati per avere accesso al software GSEA strumento e il Molecular Signatures Database (MSigDB). Scarica l’applicazione desktop javaGSEA o un’opzione di software alternativo (ad esempio, script di R). Nota: Tutte le opzioni di implementano esattamente lo stesso algoritmo. Il software GSEA è liberamente disponibile agli i…

Representative Results

Il flusso di lavoro GSEA e screenshot per dati esemplari sono dimostrati. La figura 1 Mostra il file di dati di espressione genica che contiene i dati di trascrittomica di interesse. Per ogni studio un file descrittivo fenotipo è richiesto che è illustrato nella Figura 2. Set di gene con annotazioni (ad es., vie) sono definiti nel file di database set gene (Figura 3). …

Discussion

Modelli animali sono state applicate lungo per lo studio dei meccanismi di malattia e lo sviluppo di nuove strategie terapeutiche. Tuttavia, scetticismo per quanto riguarda la predittività di modelli animali ha cominciato a diffondersi a seguito di errori di test clinici12. Inoltre, controverse discussioni sulle strategie adeguate per analizzare ed interpretare dati di grande omics dagli studi preclinici sono state sollevate da opposte conclusioni tracciate dagli stessi dati dopo l’applicazione d…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Questo lavoro è stato finanziato dall’Istituto federale tedesco per la valutazione del rischio (BfR).

Materials

Excel Microsoft Corporation

References

  1. Seok, J., et al. Genomic responses in mouse models poorly mimic human inflammatory diseases. Proc Natl Acad Sci U S A. 110 (9), 3507-3512 (2013).
  2. Takao, K., Miyakawa, T. Genomic responses in mouse models greatly mimic human inflammatory diseases. Proc Natl Acad Sci U S A. 112 (4), 1167-1172 (2015).
  3. Weidner, C., Steinfath, M., Opitz, E., Oelgeschläger, M., Schönfelder, G. Defining the optimal animal model for translational research using gene set enrichment analysis. EMBO Mol Med. 8 (8), 831-838 (2016).
  4. Subramanian, A., et al. Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles. Proc Natl Acad Sci U S A. 102 (43), 15545-15550 (2005).
  5. Kanehisa, M., Sato, Y., Kawashima, M., Furumichi, M., Tanabe, M. KEGG as a reference resource for gene and protein annotation. Nucleic Acids Res. 44 (D1), D457-D462 (2016).
  6. Kanehisa, M., Goto, S. KEGG: kyoto encyclopedia of genes and genomes. Nucleic Acids Res. 28 (1), 27-30 (2000).
  7. Fabregat, A., et al. The Reactome pathway Knowledgebase. Nucleic Acids Res. 44 (D1), D481-D487 (2016).
  8. Croft, D., et al. The Reactome pathway knowledgebase. Nucleic Acids Res. 42 (Database issue), D472-D477 (2014).
  9. Nishimura, D. BioCarta. Biotech Software & Internet Report. 2 (3), 117-120 (2001).
  10. Edgar, R., Domrachev, M., Lash, A. E. Gene Expression Omnibus: NCBI gene expression and hybridization array data repository. Nucleic Acids Res. 30 (1), 207-210 (2002).
  11. Kolesnikov, N., et al. ArrayExpress update–simplifying data submissions. Nucleic Acids Res. 43 (Database issue), D1113-D1116 (2015).
  12. Cohen, J., et al. Sepsis: a roadmap for future research. Lancet Infect Dis. 15 (5), 581-614 (2015).
  13. Spinelli, L., Carpentier, S., Montanana Sanchis, F., Dalod, M., Vu Manh, T. P. BubbleGUM: automatic extraction of phenotype molecular signatures and comprehensive visualization of multiple Gene Set Enrichment Analyses. BMC Genomics. 16 (1), 814 (2015).

Play Video

Cite This Article
Weidner, C., Steinfath, M., Wistorf, E., Oelgeschläger, M., Schneider, M. R., Schönfelder, G. A Protocol for Using Gene Set Enrichment Analysis to Identify the Appropriate Animal Model for Translational Research. J. Vis. Exp. (126), e55768, doi:10.3791/55768 (2017).

View Video