Summary

Een Protocol voor het gebruik van Gene ingesteld verrijking analyse om te identificeren van de juiste diermodel voor translationeel onderzoek

Published: August 16, 2017
doi:

Summary

Wij bieden een gestandaardiseerd protocol voor het gebruik van gene instellen verrijking analyse van transcriptomic gegevens aan het identificeren van een ideale muismodel voor translationeel onderzoek.
Dit protocol kan worden gebruikt met microarray DNA en RNA sequencing gegevens en kan worden uitgebreid tot andere omics-gegevens indien gegevens beschikbaar zijn.

Abstract

Recente studies die ten opzichte van transcriptomic datasets van ziekten bij de mens met datasets van Muismodellen met behulp van traditionele gen-te-gen vergelijking technieken resulteerde in tegenstrijdige conclusies met betrekking tot de relevantie van diermodellen voor translationeel onderzoek. Een belangrijke reden voor de verschillen tussen verschillende gen expressie analyses is het willekeurige filteren van differentially uitgedrukte genen. Anderzijds is de vergelijking van enkele genen tussen verschillende soorten en platformen vaak beperkt door technische variantie, leidt tot een verkeerde interpretatie van de con/verschil tussen gegevens uit menselijke en dierlijke modellen. Dus, gestandaardiseerde benaderingen voor systematische data-analyse zijn nodig. Om te overwinnen subjectieve gene filteren en ineffectief gen-te-gen vergelijkingen, we onlangs aangetoond dat gene instellen verrijking analyse (GSEA) het potentieel heeft om deze problemen te voorkomen. Daarom ontwikkelden we een gestandaardiseerd protocol voor het gebruik van GSEA om te onderscheiden tussen geschikte en ongeschikte diermodellen voor translationeel onderzoek. Dit protocol is niet geschikt om te voorspellen hoe ontwerpt nieuwe modelsystemen een priori, aangezien het bestaande experimentele omics gegevens vereist. Echter wordt het protocol beschreven hoe bestaande gegevens op een gestandaardiseerde manier interpreteert om te selecteren van de meest geschikte diermodel, dus het vermijden van geen onnodige dierproeven en misleidende translationeel onderzoek.

Introduction

Dierlijke modellen worden veel gebruikt om te studeren ziekten bij de mens, vanwege hun veronderstelde gelijkenis met mensen op het gebied van genetica, anatomie en fysiologie. Bovendien dierlijke modellen vaak dienen als poortwachters aan klinische therapieën en kunnen een enorme impact hebben op het succes van translationeel onderzoek. Zorgvuldige selectie van de optimale diermodel kan verminderen het aantal misleidende dierstudies. Onlangs, de relevantie van diermodellen voor translationeel onderzoek is controversieel besproken, met name omdat het analyseren van de dezelfde datasets verkregen menselijke ontstekingsziekten en verwante Muismodellen tot tegenstrijdige conclusies leidde 1,2. Deze discussie bleek een fundamenteel probleem tijdens het analyseren van omics gegevens: gestandaardiseerde benaderingen voor systematische data-analyse nodig zijn vooringenomen gene selectie verkleinen en ter verhoging van de robuustheid van interspecies-vergelijkingen 3.

Traditioneel, de analyse van transcriptomics (en andere omics-gegevens) wordt gedaan op het niveau van de single-gen en een eerste stap van gen-selectie op basis van strenge cut-off parameters bevat (bijvoorbeeld, vouw verandering > 2.0, p-waarde < 0,05). Echter de vaststelling van de licht-donkerscheiding initiële parameters vaak subjectief, arbitrair en niet biologisch gerechtvaardigd, en kan zelfs leiden tot tegengestelde conclusies1,2. Bovendien, eerste gen selectie in het algemeen wordt de analyse beperkt tot een paar zeer up- en werden genen en is dus niet gevoelig genoeg om de meeste genen die differentieel in mindere mate uitgedrukt werden.

Met de opkomst van de genomica-tijdperk in de vroege 2000s en de toenemende kennis van de biologische afbraak en contexten, werden statistische alternatieven ontwikkeld die kunnen omzeilen van de beperkingen van single-gen niveau analyses. Gene instellen verrijking analyse (GSEA)4, dat een van de algemeen aanvaarde methoden voor de analyse van transcriptomics gegevens is, maakt gebruik van a-priori omschreven groepen genen (bijvoorbeeldsignaling pathways, proximale locatie op een chromosoom enz.). GSEA kaarten eerst alle gedetecteerde ongefilterde genen tot de beoogde gen sets (b.v., trajecten), ongeacht hun individuele verandering in expressie. Deze aanpak bevat dus ook matig gereglementeerde genen die anders verloren zou gaan met single-gen niveau analyses. De additieve verandering in expressie binnen gene sets wordt vervolgens uitgevoerd met behulp van lopende som statistieken.

Ondanks haar brede gebruik in medisch onderzoek, zijn GSEA en verwante instellen verrijking benaderingen geen vanzelfsprekend rekening gehouden voor de analyse van complexe omics gegevens. Hier beschrijven we een protocol voor het vergelijken van omics gegevens van menselijke steekproeven met die uit Muismodellen teneinde het ideale model voor translationeel onderzoek. We tonen de toepasselijkheid van het protocol op basis van een verzameling van Muismodellen die worden gebruikt voor het nabootsen van menselijke inflammatoire aandoeningen. Echter, deze pijpleiding analyse beperkt zich niet tot mens-muis vergelijkingen en is geamendeerd verder onderzoeksvragen.

Protocol

1. downloaden van de Software van de GSEA en de moleculaire handtekening Database Ga naar de officiële website van de GSEA brede Institute (http://software.broadinstitute.org/gsea/index.jsp) en te registreren om toegang tot de GSEA-software gereedschap en de moleculaire handtekening Database (MSigDB). Downloaden de javaGSEA desktop-applicatie of een alternatieve software-optie (bijvoorbeeld, R script). Opmerking: Alle opties implementeren precies hetzelfde algoritme. De GSEA-software…

Representative Results

De GSEA workflow en screenshots van voorbeeldige gegevens worden gedemonstreerd. Figuur 1 toont het gen expressie-gegevensbestand met de gegevens van de transcriptomic van belang. Voor elke studie een beschrijvende fenotype-bestand vereist is die is afgebeeld in Figuur 2. Geannoteerde gene sets (b.v., trajecten) worden gedefinieerd in het gen instellen databasebestand (Figuur 3). <strong cla…

Discussion

Dierlijke modellen hebben lang toegepast voor het onderzoek naar de ziekte mechanismen en de ontwikkeling van nieuwe therapeutische strategieën. Echter begon scepticisme ten aanzien van de predictief van diermodellen te verspreiden na de mislukkingen van klinische proeven12. Bovendien, de controversiële discussies over passende strategieën voor het analyseren en interpreteren van grote omics gegevens van preklinische proeven werden opgevoed door tegenovergestelde conclusies uit dezelfde gegeven…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Dit werk werd gefinancierd door het Duitse Federale Instituut voor risicobeoordeling (BfR).

Materials

Excel Microsoft Corporation

References

  1. Seok, J., et al. Genomic responses in mouse models poorly mimic human inflammatory diseases. Proc Natl Acad Sci U S A. 110 (9), 3507-3512 (2013).
  2. Takao, K., Miyakawa, T. Genomic responses in mouse models greatly mimic human inflammatory diseases. Proc Natl Acad Sci U S A. 112 (4), 1167-1172 (2015).
  3. Weidner, C., Steinfath, M., Opitz, E., Oelgeschläger, M., Schönfelder, G. Defining the optimal animal model for translational research using gene set enrichment analysis. EMBO Mol Med. 8 (8), 831-838 (2016).
  4. Subramanian, A., et al. Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles. Proc Natl Acad Sci U S A. 102 (43), 15545-15550 (2005).
  5. Kanehisa, M., Sato, Y., Kawashima, M., Furumichi, M., Tanabe, M. KEGG as a reference resource for gene and protein annotation. Nucleic Acids Res. 44 (D1), D457-D462 (2016).
  6. Kanehisa, M., Goto, S. KEGG: kyoto encyclopedia of genes and genomes. Nucleic Acids Res. 28 (1), 27-30 (2000).
  7. Fabregat, A., et al. The Reactome pathway Knowledgebase. Nucleic Acids Res. 44 (D1), D481-D487 (2016).
  8. Croft, D., et al. The Reactome pathway knowledgebase. Nucleic Acids Res. 42 (Database issue), D472-D477 (2014).
  9. Nishimura, D. BioCarta. Biotech Software & Internet Report. 2 (3), 117-120 (2001).
  10. Edgar, R., Domrachev, M., Lash, A. E. Gene Expression Omnibus: NCBI gene expression and hybridization array data repository. Nucleic Acids Res. 30 (1), 207-210 (2002).
  11. Kolesnikov, N., et al. ArrayExpress update–simplifying data submissions. Nucleic Acids Res. 43 (Database issue), D1113-D1116 (2015).
  12. Cohen, J., et al. Sepsis: a roadmap for future research. Lancet Infect Dis. 15 (5), 581-614 (2015).
  13. Spinelli, L., Carpentier, S., Montanana Sanchis, F., Dalod, M., Vu Manh, T. P. BubbleGUM: automatic extraction of phenotype molecular signatures and comprehensive visualization of multiple Gene Set Enrichment Analyses. BMC Genomics. 16 (1), 814 (2015).

Play Video

Cite This Article
Weidner, C., Steinfath, M., Wistorf, E., Oelgeschläger, M., Schneider, M. R., Schönfelder, G. A Protocol for Using Gene Set Enrichment Analysis to Identify the Appropriate Animal Model for Translational Research. J. Vis. Exp. (126), e55768, doi:10.3791/55768 (2017).

View Video