Summary

Un protocole pour l’utilisation de gènes série d’analyses d’enrichissement pour identifier le modèle Animal approprié de recherche translationnelle

Published: August 16, 2017
doi:

Summary

Nous fournissons un protocole normalisé pour l’utilisation du gène enrichissement set analyse des données transcriptomiques pour identifier un modèle souris idéal pour la recherche translationnelle.
Ce protocole peut être utilisé avec les puces à ADN et des données de séquençage de l’ARN et encore peut être étendu à d’autres données omics si des données sont disponibles.

Abstract

Récentes études comparant les ensembles de données transcriptomique des maladies humaines avec les ensembles de données de modèles de souris en utilisant des techniques traditionnelles de gènes comparaison a abouti à des conclusions contradictoires au sujet de la pertinence de modèles animaux pour translationnelle recherche. Des principales raisons des écarts entre les analyses d’expression de gène différent sont le filtrage arbitraire de gènes différentiellement exprimés. En outre, la comparaison d’un simple gène entre espèces différentes et souvent les plates-formes est limitée par la technique variance, conduisant à une interprétation erronée de la con/discordance entre les données provenant de modèles humains et animaux. Ainsi, les méthodes normalisées d’analyse des données systématiques sont nécessaires. Pour surmonter le gène subjective de filtrage et les comparaisons de gène à gène inefficaces, nous a récemment démontré que le gène enrichissement set analyse (GSEA) a le potentiel pour éviter ces problèmes. Par conséquent, nous avons développé un protocole normalisé pour l’utilisation de GSEA pour distinguer les modèles animaux appropriés et inappropriés pour la recherche translationnelle. Ce protocole ne convient pas à prédire comment concevoir de nouveaux systèmes de modèle a priori, puisqu’elle requiert des données expérimentales omics existantes. Toutefois, le protocole décrit comment interpréter les données existantes d’une manière standardisée afin de sélectionner le modèle animal plus adapté, ainsi évitant les expérimentations animales inutiles et trompeuses études translationnelles.

Introduction

Modèles animaux sont largement utilisés pour l’étude des maladies humaines, en raison de leur ressemblance supposée à l’homme sur le plan génétique, l’anatomie et la physiologie. En outre, des modèles animaux souvent servent portiers aux thérapies cliniques et peuvent avoir un impact énorme sur le succès de la recherche translationnelle. Une sélection rigoureuse du modèle animal optimale peut réduire le nombre d’études animales trompeuses. Récemment, la pertinence de modèles animaux pour la recherche translationnelle a été controversée, notamment parce que l’analysant les ensembles de données même obtenus à partir des maladies inflammatoires humaines et modèles murins connexes ont conduit à des conclusions contradictoires 1,2. Cette discussion a révélé un problème fondamental au cours de l’analyse des données omique : des approches normalisées pour l’analyse de données systématiques sont nécessaires afin de réduire la sélection de gènes partiale et d’augmenter la robustesse des comparaisons interspécifiques 3.

Traditionnellement, l’analyse des données transcriptomique (et autres données omics) se fait au niveau monogéniques et comprend une première étape de sélection génétique basée sur les paramètres de seuil strictes (par exemple, les changements de pli > 2.0, la valeur p < 0,05). Cependant, le réglage des paramètres de seuil initial souvent est subjectif, arbitraire et pas biologiquement justifiée et peut même conduire à des conclusions opposées1,2. En outre, sélection de gènes initial généralement restreint l’analyse aux quelques très en amont et réprimés gènes et n’est donc pas suffisamment sensible pour inclure la plupart des gènes qui sont exprimés dans une moindre mesure.

Avec la montée de l’ère de la génomique dans les années 2000 et la connaissance croissante des voies biologiques et des contextes, des approches statistiques ont été développés qui permettait de contourner les limites des analyses de niveau monogéniques. Gène set enrichissement analyse (GSEA)4, qui est l’une des méthodes largement acceptées pour l’analyse des données transcriptomique, fait appel à des groupes définis a priori des gènes (par exemple, signalisation, localisation proximale sur un chromosome etc..). GSEA mappe tout d’abord tous les gènes non filtrées détectés pour les ensembles de gènes prévue (p. ex., voies), quel que soit leur changement individuel dans l’expression. Ainsi, cette approche comprend aussi modérément réglementé de gènes qui seraient autrement perdus avec analyses de niveau monogéniques. Le changement d’additif dans l’expression à l’intérieur des ensembles de gènes s’effectue par la suite en utilisant les statistiques de somme en cours d’exécution.

Malgré sa large utilisation dans la recherche médicale, GSEA et approches connexes enrichissement set ne sont pas évidemment pris en compte pour l’analyse des données complexes omics. Nous décrivons ici un protocole pour comparer les omiques données provenant d’échantillons humains avec ceux des modèles de souris afin d’identifier le modèle idéal pour les études translationnelles. Nous démontrons l’applicabilité du protocole basé sur une collection de modèles de souris utilisées pour imiter les troubles inflammatoires humaines. Toutefois, ce pipeline d’analyse ne se limite pas à l’homme-souris comparaisons et recherche modifiable en plus d’autres questions.

Protocol

1. téléchargement du logiciel GSEA et la base de données de Signatures moléculaires aller sur le site officiel de l’Institut large GSEA (http://software.broadinstitute.org/gsea/index.jsp) et s’inscrire pour avoir accès au logiciel GSEA outil et la base de données de Signatures moléculaires (MSigDB). Télécharger l’application de bureau javaGSEA ou une option de logiciel alternatif (par exemple, le script de R). Remarque : Toutes les options appliquer exactement le même…

Representative Results

GSEA workflow et des captures d’écran de données exemplaires sont démontrés. La figure 1 montre le fichier de données d’expression de gène qui contient les données transcriptomiques d’intérêt. Pour chaque étude, un fichier descriptif de phénotype est nécessaire qui est illustré à la Figure 2. Jeux de gènes annotés (p. ex., voies) sont définis dans le fichier de base de données set de gène (<stron…

Discussion

Des modèles animaux ont longtemps été appliquées pour l’étude des mécanismes des maladies et le développement de nouvelles stratégies thérapeutiques. Cependant, le scepticisme au sujet de la valeur prédictive des modèles animaux commencé à se répandre après les échecs des essais cliniques,12. En outre, des discussions controversées sur les stratégies appropriées pour analyser et interpréter les omiques grandes données issues des essais précliniques ont été soulevées par …

Disclosures

The authors have nothing to disclose.

Acknowledgements

Ce travail a été financé par l’Institut fédéral allemand pour l’évaluation des risques (BfR).

Materials

Excel Microsoft Corporation

References

  1. Seok, J., et al. Genomic responses in mouse models poorly mimic human inflammatory diseases. Proc Natl Acad Sci U S A. 110 (9), 3507-3512 (2013).
  2. Takao, K., Miyakawa, T. Genomic responses in mouse models greatly mimic human inflammatory diseases. Proc Natl Acad Sci U S A. 112 (4), 1167-1172 (2015).
  3. Weidner, C., Steinfath, M., Opitz, E., Oelgeschläger, M., Schönfelder, G. Defining the optimal animal model for translational research using gene set enrichment analysis. EMBO Mol Med. 8 (8), 831-838 (2016).
  4. Subramanian, A., et al. Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles. Proc Natl Acad Sci U S A. 102 (43), 15545-15550 (2005).
  5. Kanehisa, M., Sato, Y., Kawashima, M., Furumichi, M., Tanabe, M. KEGG as a reference resource for gene and protein annotation. Nucleic Acids Res. 44 (D1), D457-D462 (2016).
  6. Kanehisa, M., Goto, S. KEGG: kyoto encyclopedia of genes and genomes. Nucleic Acids Res. 28 (1), 27-30 (2000).
  7. Fabregat, A., et al. The Reactome pathway Knowledgebase. Nucleic Acids Res. 44 (D1), D481-D487 (2016).
  8. Croft, D., et al. The Reactome pathway knowledgebase. Nucleic Acids Res. 42 (Database issue), D472-D477 (2014).
  9. Nishimura, D. BioCarta. Biotech Software & Internet Report. 2 (3), 117-120 (2001).
  10. Edgar, R., Domrachev, M., Lash, A. E. Gene Expression Omnibus: NCBI gene expression and hybridization array data repository. Nucleic Acids Res. 30 (1), 207-210 (2002).
  11. Kolesnikov, N., et al. ArrayExpress update–simplifying data submissions. Nucleic Acids Res. 43 (Database issue), D1113-D1116 (2015).
  12. Cohen, J., et al. Sepsis: a roadmap for future research. Lancet Infect Dis. 15 (5), 581-614 (2015).
  13. Spinelli, L., Carpentier, S., Montanana Sanchis, F., Dalod, M., Vu Manh, T. P. BubbleGUM: automatic extraction of phenotype molecular signatures and comprehensive visualization of multiple Gene Set Enrichment Analyses. BMC Genomics. 16 (1), 814 (2015).

Play Video

Cite This Article
Weidner, C., Steinfath, M., Wistorf, E., Oelgeschläger, M., Schneider, M. R., Schönfelder, G. A Protocol for Using Gene Set Enrichment Analysis to Identify the Appropriate Animal Model for Translational Research. J. Vis. Exp. (126), e55768, doi:10.3791/55768 (2017).

View Video