Summary

Un protocolo para el uso de gen Set enriquecimiento análisis para identificar el modelo Animal adecuado para la investigación traslacional

Published: August 16, 2017
doi:

Summary

Proporcionamos un protocolo estandarizado para el uso del gen enriquecimiento conjunto análisis transcriptómico datos para identificar un modelo de ratón ideal para la investigación traslacional.
Este protocolo se puede utilizar con microarrays de ADN y datos de la secuencia de RNA y puede ampliarse aún más a otros datos ómicos si se dispone de datos.

Abstract

Estudios recientes que compararon datos transcriptómicos de enfermedades humanas con conjuntos de datos de modelos de ratón mediante técnicas de comparación de gen a gen tradicional dio lugar a conclusiones contradictorias con respecto a la pertinencia de modelos animales para traslacional investigación. Una de las principales razones para las diferencias entre análisis de expresión de genes diferentes es la arbitraria filtrado de genes diferencialmente expresados. Además, la comparación de solo genes entre diferentes especies y plataformas a menudo está limitada por variación técnica, llevando a interpretaciones erróneas de la con/discordancia entre los datos de modelos animales y humanos. Por lo tanto, se necesitan métodos estandarizados de análisis sistemático de datos. Para superar el gen subjetivo filtrado y comparaciones ineficaces de gen a gen, hemos demostrado recientemente que el análisis del enriquecimiento conjunto gene (GSEA) tiene el potencial para evitar estos problemas. Por lo tanto, hemos desarrollado un protocolo estandardizado para el uso de GSEA distinguir entre modelos animales apropiados e inapropiados para la investigación traslacional. Este protocolo no es adecuado para predecir cómo diseñar nuevos sistemas de modelo a priori, ya que requiere de datos experimental de ómicas. Sin embargo, el protocolo describe cómo interpretar los datos existentes de manera estandarizada con el fin de seleccionar el modelo animal más conveniente, evitando innecesarios experimentos con animales y engañosa estudios traslacionales.

Introduction

Se utilizan modelos animales para estudiar enfermedades humanas, debido a su supuesta semejanza a los seres humanos en términos de genética, anatomía y fisiología. Por otra parte, los modelos animales a menudo sirven como guardianes a los tratamientos clínicos y pueden tener un impacto enorme en el éxito de la investigación traslacional. Una cuidadosa selección del modelo animal óptima puede reducir el número de estudios animales engañosos. Recientemente, la pertinencia de modelos animales para investigación traslacional ha sido discutida polémico, particularmente porque analizando el mismo conjuntos de datos obtenidos de enfermedades inflamatorias humanas y modelos relacionados con ratón condujo a conclusiones contradictorias 1,2. Esta discusión revela un problema fundamental en análisis de datos ómicos: métodos estandarizados para el análisis de datos sistemáticos son necesarios para reducir la selección del gene parcial y aumentar la robustez de las comparaciones entre las especies 3.

Tradicionalmente, el análisis de los datos de la transcriptómica (y otras ómicas) se realiza a nivel de gen único e incluye un primer paso de selección genética basado en parámetros estrictos de corte (por ejemplo, cambio de doblez > 2.0, valor de p < 0.05). Sin embargo, el ajuste de parámetros de corte inicial a menudo es subjetiva, arbitraria y no biológicamente justificada y puede llevar a conclusiones opuestas1,2. Además, selección génica inicial generalmente restringe el análisis a unos cuantos muy arriba y o genes y por lo tanto no es sensible a la mayoría de los genes que se expresan diferencialmente en menor medida.

Con el surgimiento de la era de la genómica en el 2000s temprano y el conocimiento creciente de caminos biológicos y contextos, enfoques estadísticos alternativos fueron desarrollados permite eludir las limitaciones de análisis nivel de gen único. Gen set enriquecimiento análisis (GSEA)4, que es uno de los métodos ampliamente aceptados para el análisis de los datos de la transcriptómica, hace uso de los grupos definido a priori de genes (por ejemplo, señalización de vías, de localización proximal en un cromosoma etcetera.). GSEA primero mapas de todos los genes detectados sin filtrar a los conjuntos gen prevista (p.ej., caminos), independientemente de su cambio individual de expresión. Así, este enfoque incluye también moderadamente regulados genes que de otra manera se perderían con análisis nivel del solo-gene. El cambio aditivo de expresión dentro de conjuntos de genes se realiza posteriormente utilizando corriente suma estadística.

A pesar de su amplio uso en la investigación médica, GSEA y enriquecimiento conjunto relacionados con enfoques no evidentemente toman en cuenta para el análisis de datos complejos ómicas. Aquí, describimos un protocolo para comparar datos de omics de muestras humanas con las de modelos de ratón con el fin de identificar el modelo ideal para los estudios traslacionales. Se demuestra la aplicabilidad del protocolo basado en una colección de modelos de ratón que se utilizan para la mímica humanos trastornos inflamatorios. Sin embargo, este gasoducto de análisis no se limita a humanos-ratón comparaciones y preguntas de investigación modificable a otros.

Protocol

1. descargar el Software de GSEA y la base de datos de firmas moleculares ir a la página oficial del Instituto amplio GSEA (http://software.broadinstitute.org/gsea/index.jsp) y registrarte para tener acceso al software de GSEA herramienta y la base de datos de firmas moleculares (MSigDB). Descargar la aplicación de escritorio de javaGSEA o una opción de software alternativo (por ejemplo, escritura de R). Nota: Todas las opciones de aplicación exactamente el mismo algoritmo. El sof…

Representative Results

El flujo de trabajo GSEA y capturas de pantalla de datos de ejemplares se demuestran. La figura 1 muestra el archivo de datos de expresión de genes que contiene los datos transcriptómicos de interés. Cada estudio un archivo descriptivo del fenotipo se requieren se muestra en la figura 2. Conjuntos de genes anotado (p.ej., caminos) se definen en el archivo de base de datos conjunto de gene (figura …

Discussion

Durante mucho tiempo se han aplicado modelos animales para la investigación de los mecanismos de la enfermedad y el desarrollo de nuevas estrategias terapéuticas. Sin embargo, escepticismo con respecto a la predecibilidad de los modelos animales empieza a difundirse después de fracasos de ensayos12. Además, polémicas discusiones sobre estrategias apropiadas para el análisis e interpretación de datos ómicos grande de ensayos preclínicos fueron levantadas por opuestas conclusiones extraída…

Declarações

The authors have nothing to disclose.

Acknowledgements

Este trabajo fue financiado por el Instituto Federal alemán para la evaluación del riesgo (BfR).

Materials

Excel Microsoft Corporation

Referências

  1. Seok, J., et al. Genomic responses in mouse models poorly mimic human inflammatory diseases. Proc Natl Acad Sci U S A. 110 (9), 3507-3512 (2013).
  2. Takao, K., Miyakawa, T. Genomic responses in mouse models greatly mimic human inflammatory diseases. Proc Natl Acad Sci U S A. 112 (4), 1167-1172 (2015).
  3. Weidner, C., Steinfath, M., Opitz, E., Oelgeschläger, M., Schönfelder, G. Defining the optimal animal model for translational research using gene set enrichment analysis. EMBO Mol Med. 8 (8), 831-838 (2016).
  4. Subramanian, A., et al. Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles. Proc Natl Acad Sci U S A. 102 (43), 15545-15550 (2005).
  5. Kanehisa, M., Sato, Y., Kawashima, M., Furumichi, M., Tanabe, M. KEGG as a reference resource for gene and protein annotation. Nucleic Acids Res. 44 (D1), D457-D462 (2016).
  6. Kanehisa, M., Goto, S. KEGG: kyoto encyclopedia of genes and genomes. Nucleic Acids Res. 28 (1), 27-30 (2000).
  7. Fabregat, A., et al. The Reactome pathway Knowledgebase. Nucleic Acids Res. 44 (D1), D481-D487 (2016).
  8. Croft, D., et al. The Reactome pathway knowledgebase. Nucleic Acids Res. 42 (Database issue), D472-D477 (2014).
  9. Nishimura, D. BioCarta. Biotech Software & Internet Report. 2 (3), 117-120 (2001).
  10. Edgar, R., Domrachev, M., Lash, A. E. Gene Expression Omnibus: NCBI gene expression and hybridization array data repository. Nucleic Acids Res. 30 (1), 207-210 (2002).
  11. Kolesnikov, N., et al. ArrayExpress update–simplifying data submissions. Nucleic Acids Res. 43 (Database issue), D1113-D1116 (2015).
  12. Cohen, J., et al. Sepsis: a roadmap for future research. Lancet Infect Dis. 15 (5), 581-614 (2015).
  13. Spinelli, L., Carpentier, S., Montanana Sanchis, F., Dalod, M., Vu Manh, T. P. BubbleGUM: automatic extraction of phenotype molecular signatures and comprehensive visualization of multiple Gene Set Enrichment Analyses. BMC Genomics. 16 (1), 814 (2015).

Play Video

Citar este artigo
Weidner, C., Steinfath, M., Wistorf, E., Oelgeschläger, M., Schneider, M. R., Schönfelder, G. A Protocol for Using Gene Set Enrichment Analysis to Identify the Appropriate Animal Model for Translational Research. J. Vis. Exp. (126), e55768, doi:10.3791/55768 (2017).

View Video