Summary

Ein Protokoll für die Verwendung von Gen Set Anreicherung Analyse zur Ermittlung von geeigneten Tiermodell für die translationale Forschung

Published: August 16, 2017
doi:

Summary

Wir bieten ein standardisiertes Protokoll für die Nutzung der Genanalyse Set Anreicherung von transkriptomischen Daten, um eine ideale Maus-Modell für die translationale Forschung zu identifizieren.
Dieses Protokoll kann mit DNA-Microarray und RNA Sequenzierungsdaten verwendet werden und kann weiter mit anderen Daten der Omics verlängert werden, wenn Daten vorhanden sind.

Abstract

Neuere Studien, die transkriptomischen-Datasets von menschlichen Krankheiten mit Datensätzen von Mausmodellen mit traditionellen gen-gen-Vergleich Techniken verglichen führten zu widersprüchlichen Schlussfolgerungen bezüglich der Relevanz von Tiermodellen für Translationale Forschung. Ein wesentlicher Grund für die Unterschiede zwischen den verschiedenen Genexpressionsanalysen ist die willkürliche Filterung differentiell exprimierten Gene. Außerdem ist der Vergleich einzelner Gene zwischen verschiedenen Arten und Plattformen oft durch technische Varianz, was zu Fehlinterpretationen der Con/Discordance zwischen Daten aus menschlichen und tierischen Modelle beschränkt. Daher sind standardisierte Ansätze zur systematischen Analyse erforderlich. Um subjektive gen filtern und unwirksam gen-gen-Vergleiche zu überwinden, wir kürzlich gezeigt, dass Set Bereicherung Genanalyse (GSEA) das Potenzial hat, diese Probleme zu vermeiden. Daher entwickelten wir ein standardisiertes Protokoll für die Verwendung von GSEA zu passenden und unpassenden Tiermodelle für die translationale Forschung unterscheiden. Dieses Protokoll eignet sich nicht, wie neue Modellsystemevon vornherein, design vorherzusagen, da es bestehende experimentelle Omics Daten erfordert. Jedoch beschreibt das Protokoll die vorhandene Daten in einer standardisierten Weise zu interpretieren, um die am besten geeigneten Tiermodell, damit unnötige Tierversuche zu vermeiden und irreführende translationale Studien zu wählen.

Introduction

Tiermodelle sind am meisten benutzt, um menschliche Krankheiten wegen ihrer vermeintlichen Ähnlichkeit zu den Menschen in Bezug auf die Genetik, Anatomie und Physiologie zu studieren. Darüber hinaus Tiermodellen oft dienen als Pförtner, Therapien und haben einen großen Einfluss auf den Erfolg der translationalen Forschung. Sorgfältige Auswahl der optimalen Tiermodell reduzieren die Zahl der Tierversuche irreführend. Vor kurzem hat die Relevanz von Tiermodellen für die translationale Forschung kontrovers diskutiert, vor allem, weil die Analyse der gleichen Datasets gewonnenen menschlichen entzündliche Erkrankungen und damit verbundene Mausmodellen zu widersprüchlichen Schlussfolgerungen geführt, 1,2. Diese Diskussion zeigte ein grundlegendes Problem während der Omics Datenanalyse: standardisierte Ansätze zur systematischen Datenanalyse sind erforderlich, um einseitige Genselektion zu senken und die Robustheit der Interspezies Vergleiche 3erhöhen.

Traditionell, die Analyse der Transkriptom (und andere Omics-Daten) erfolgt auf der Single-gen-Ebene und enthält einen ersten Schritt der Genselektion basierend auf strengen Cut-off-Parametern (z.B., Falte Änderung > 2.0, p-Wert < 0,05). Allerdings die Einstellung der ersten Cut-off Parameter oft ist subjektiv, willkürlich und nicht biologisch begründete, und sogar zu anderen Schlussfolgerungen1,2führen kann. Darüber hinaus erste Genselektion in der Regel schränkt die Analyse auf ein paar sehr up- und herunterreguliert Gene und ist somit nicht empfindlich genug, um die Mehrzahl der Gene enthalten, die differentiell in geringerem Maße zum Ausdruck gebracht wurden.

Mit dem Aufstieg der Genomik-Ära in den frühen 2000er Jahren und die zunehmende Kenntnis der biologischer Signalwege und Kontexte wurden alternative statistische Ansätze entwickelt, die erlaubt, die Grenzen der einzelnen Level Genanalysen zu umgehen. Gen gesetzt Bereicherung Analyse (GSEA)4, das ist eine der weithin akzeptierten Methoden für die Analyse von Transkriptom Daten, nutzt a Priori definierte Gruppen von Genen (z. B.Signalwege, proximalen Ort auf einem Chromosom etc..). GSEA Karten zuerst alle erkannten ungefilterte Gene auf die beabsichtigte Gen-Sets (z.B. Wege), unabhängig von ihren individuellen Ausdruck. Dieser Ansatz beinhaltet somit auch mäßig regulierten Gene, die sonst mit Single-Level-Genanalysen verloren wären. Die additive Veränderung Ausdruck in Gen-Sets erfolgt anschließend über laufende Summe Statistiken.

Trotz seiner breite Verwendung in der medizinischen Forschung sind GSEA und verwandte Set Bereicherung Ansätze nicht selbstverständlich für die Analyse von komplexen Omics Daten berücksichtigt. Hier beschreiben wir ein Protokoll für den Vergleich von Omics Daten aus humanen Proben mit denen von Mausmodellen um das ideale Modell für Translationale Studien zu identifizieren. Wir zeigen die Anwendbarkeit des Protokolls basiert auf einer Sammlung von Maus-Modellen, die für die Nachahmung menschlicher entzündlicher Erkrankungen verwendet werden. Allerdings diese Pipeline Analyse beschränkt sich nicht auf Mensch-Maus-Vergleiche und ist amendable zur weiteren Forschungsfragen.

Protocol

1. GSEA-Software und die molekulare Signaturen-Datenbank herunterladen auf der offiziellen Website der GSEA breite Institute (http://software.broadinstitute.org/gsea/index.jsp) gehen und registrieren, um Zugriff auf die GSEA Software erhalten Werkzeug und die molekulare Signaturen-Datenbank (MSigDB). Herunterladen, die JavaGSEA desktop-Applikation oder eine alternative Softwareoption (z. B. R-Skript). Hinweis: Alle Optionen setzen genau den gleichen Algorithmus. Die GSEA Software ist …

Representative Results

Die GSEA Workflow und Screenshots von beispielhaften Daten werden vorgeführt. Abbildung 1 zeigt die gen-Ausdruck-Datendatei, die die transkriptomischen relevanten Daten enthält. Für jede Studie eine beschreibende Phänotyp-Datei erforderlich ist, die in Abbildung 2dargestellt. Kommentierte Gen-Sets (z.B. Wege) sind in der gen-Set Datenbank-Datei (Abbildung 3) definiert. <strong class="xfi…

Discussion

Tiermodelle wurden lange für die Erforschung von Krankheitsmechanismen und die Entwicklung neuer therapeutischer Strategien angewendet. Skepsis gegenüber der Prädiktivität von Tiermodellen begann jedoch nach Versagen der klinischen Studien12zu verbreiten. Darüber hinaus wurden Kontroverse Diskussionen über geeignete Strategien zur Analyse und Interpretation der großen Omics Daten aus präklinischen Studien von entgegengesetzten Schlussfolgerungen aus den gleichen Daten nach Anwendung von un…

Declarações

The authors have nothing to disclose.

Acknowledgements

Diese Arbeit wurde durch das deutsche Bundesinstitut für Risikobewertung (BfR) finanziert.

Materials

Excel Microsoft Corporation

Referências

  1. Seok, J., et al. Genomic responses in mouse models poorly mimic human inflammatory diseases. Proc Natl Acad Sci U S A. 110 (9), 3507-3512 (2013).
  2. Takao, K., Miyakawa, T. Genomic responses in mouse models greatly mimic human inflammatory diseases. Proc Natl Acad Sci U S A. 112 (4), 1167-1172 (2015).
  3. Weidner, C., Steinfath, M., Opitz, E., Oelgeschläger, M., Schönfelder, G. Defining the optimal animal model for translational research using gene set enrichment analysis. EMBO Mol Med. 8 (8), 831-838 (2016).
  4. Subramanian, A., et al. Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles. Proc Natl Acad Sci U S A. 102 (43), 15545-15550 (2005).
  5. Kanehisa, M., Sato, Y., Kawashima, M., Furumichi, M., Tanabe, M. KEGG as a reference resource for gene and protein annotation. Nucleic Acids Res. 44 (D1), D457-D462 (2016).
  6. Kanehisa, M., Goto, S. KEGG: kyoto encyclopedia of genes and genomes. Nucleic Acids Res. 28 (1), 27-30 (2000).
  7. Fabregat, A., et al. The Reactome pathway Knowledgebase. Nucleic Acids Res. 44 (D1), D481-D487 (2016).
  8. Croft, D., et al. The Reactome pathway knowledgebase. Nucleic Acids Res. 42 (Database issue), D472-D477 (2014).
  9. Nishimura, D. BioCarta. Biotech Software & Internet Report. 2 (3), 117-120 (2001).
  10. Edgar, R., Domrachev, M., Lash, A. E. Gene Expression Omnibus: NCBI gene expression and hybridization array data repository. Nucleic Acids Res. 30 (1), 207-210 (2002).
  11. Kolesnikov, N., et al. ArrayExpress update–simplifying data submissions. Nucleic Acids Res. 43 (Database issue), D1113-D1116 (2015).
  12. Cohen, J., et al. Sepsis: a roadmap for future research. Lancet Infect Dis. 15 (5), 581-614 (2015).
  13. Spinelli, L., Carpentier, S., Montanana Sanchis, F., Dalod, M., Vu Manh, T. P. BubbleGUM: automatic extraction of phenotype molecular signatures and comprehensive visualization of multiple Gene Set Enrichment Analyses. BMC Genomics. 16 (1), 814 (2015).
check_url/pt/55768?article_type=t

Play Video

Citar este artigo
Weidner, C., Steinfath, M., Wistorf, E., Oelgeschläger, M., Schneider, M. R., Schönfelder, G. A Protocol for Using Gene Set Enrichment Analysis to Identify the Appropriate Animal Model for Translational Research. J. Vis. Exp. (126), e55768, doi:10.3791/55768 (2017).

View Video