Summary

Um protocolo para o uso de Gene definir análise de enriquecimento para identificar o modelo Animal adequado para investigação de translação

Published: August 16, 2017
doi:

Summary

Nós fornecemos um protocolo padronizado para a utilização da análise de enriquecimento conjunto do gene do transcriptomic de dados para identificar um modelo de mouse ideal para investigação de translação.
Este protocolo pode ser usado com DNA microarray e dados de sequenciamento de RNA e mais pode ser estendido a outros dados omics se dados estão disponíveis.

Abstract

Estudos recentes que comparado transcriptomic conjuntos de dados de doenças humanas com conjuntos de dados de modelos de rato usando técnicas tradicionais de gene-a-gene de comparação resultaram em conclusões contraditórias sobre a relevância de modelos animais para translação pesquisa. Das principais razões para as discrepâncias entre as análises de expressão de gene diferente é a filtragem arbitrário de genes diferencialmente expressos. Além disso, a comparação do único genes entre espécies diferentes e plataformas muitas vezes é limitada pela variância técnica, levando a interpretações erradas da con/discordância entre dados de modelos humanos e animais. Assim, são necessárias abordagens padronizadas para análise sistemática dos dados. Para superar gene subjetiva filtragem e comparações de gene-a-gene ineficazes, demonstramos recentemente que a análise de enriquecimento conjunto do gene (GSEA) tem o potencial para evitar estes problemas. Portanto, nós desenvolvemos um protocolo padronizado para o uso de GSEA para distinguir entre adequado e inadequados de modelos animais para pesquisa translacional. Este protocolo não é adequado para prever como projetar sistemas de modelo novo uma priori, que requer dados experimentais omics existentes. No entanto, o protocolo descreve como interpretar dados existentes de forma padronizada, a fim de selecionar o modelo animal mais adequado, evitando desnecessárias as experiências com animais e enganosa estudos translacionais.

Introduction

Modelos animais são amplamente utilizados para estudar doenças humanas, por causa de sua suposta semelhança com os humanos em termos de genética, anatomia e fisiologia. Além disso, modelos animais, muitas vezes servem como guardiões para terapias clínicas e podem ter um enorme impacto sobre o sucesso da investigação de translação. A seleção cuidadosa do modelo animal ideal pode reduzir o número de estudos com animais enganosos. Recentemente, a relevância de modelos animais para investigação de translação foi controversamente discutida, particularmente porque analisar os mesmos conjuntos de dados obtidos de doenças inflamatórias humanas e modelos de mouse relacionados levou a conclusões contraditórias 1,2. Esta discussão revelou um problema fundamental durante a análise de dados omics: padronizadas para a análise sistemática dos dados são necessárias abordagens para reduzir a seleção de gene tendenciosa e aumentar a robustez de comparações entre espécies 3.

Tradicionalmente, a análise de dados transcriptomics (e outros dados de omics) é feita a nível de single-gene e inclui uma etapa inicial de seleção de gene com base em parâmetros rigorosos de corte (por exemplo, mudança de dobra > 2.0, valor de p < 0,05). No entanto, a configuração dos parâmetros de corte inicial muitas vezes é subjetiva, arbitrária e não biologicamente justificado e pode mesmo levar à oposta conclusões1,2. Além disso, a seleção de gene inicial geralmente restringe a análise de alguns altamente – up e ativador genes e, portanto, não é sensível o suficiente para incluir a maioria dos genes diferencialmente expressas em menor grau.

Com o surgimento da era genômica no início de 2000 e o conhecimento crescente das vias biológicas e contextos, métodos estatísticos alternativos foram desenvolvidos que permitiu contornar as limitações das análises de nível único-gene. Gene conjunto enriquecimento análise (GSEA)4, que é um dos métodos amplamente aceitos para a análise dos dados transcriptomics, faz uso de grupos definido a priori de genes (por exemplo, sinalização de vias, localização proximal em um cromossomo, etc.). GSEA primeiro mapeia todos detectados genes não filtrados para os conjuntos de gene pretendido (por exemplo, caminhos), independentemente da sua mudança individual de expressão. Assim, essa abordagem inclui também moderadamente regulamentados genes que seriam perdidos com análises de nível único-gene. A aditiva mudança na expressão dentro de conjuntos de genes é realizada posteriormente utilizando estatísticas de execução soma.

Apesar de sua ampla utilização na investigação médica, GSEA e abordagens de enriquecimento conjunto relacionados não são evidentemente tidos em conta para a análise de dados complexos omics. Aqui, descrevemos um protocolo para comparar dados omics de amostras humanas com as dos modelos do rato para identificar o modelo ideal para estudos de translação. Vamos demonstrar a aplicabilidade do protocolo baseado em uma coleção de modelos de rato que são usadas para imitar humanos disorders inflammatory. No entanto, este gasoduto de análise não está restrito a comparações de humanos-mouse e pesquisa alteráveis para mais perguntas.

Protocol

1. download do Software GSEA e o banco de dados de assinaturas moleculares acesse o site oficial do Instituto amplo GSEA (http://software.broadinstitute.org/gsea/index.jsp) e se registrar para ter acesso ao software de GSEA ferramenta e o banco de dados de assinaturas moleculares (MSigDB). Baixar o aplicativo de desktop javaGSEA ou uma opção alternativa de software (por exemplo, o script de R). Nota: Todas as opções aplicar exatamente o mesmo algoritmo. O software GSEA está dispo…

Representative Results

O fluxo de trabalho GSEA e screenshots do exemplares dados são demonstrados. A Figura 1 mostra o arquivo de dados de expressão do gene que contém os dados de transcriptomic de interesse. Para cada estudo um arquivo descritivo fenótipo é necessário, que é mostrado na Figura 2. Conjuntos de genes anotados (por exemplo, caminhos) são definidos no arquivo de banco de dados conjunto de gene (Figur…

Discussion

Modelos animais há muito tempo tem sido aplicados para a investigação dos mecanismos da doença e o desenvolvimento de novas estratégias terapêuticas. Entretanto, o ceticismo sobre a previsibilidade de modelos animais começou a espalhar após fracasso de ensaios clínicos de12. Além disso, controversas discussões sobre estratégias apropriadas para análise e interpretação de dados de grande omics de ensaios pré-clínicos foram levantadas pelo oposto as conclusões a partir dos dados me…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Este trabalho foi financiado pelo Instituto Federal alemão de avaliação de riscos (BfR).

Materials

Excel Microsoft Corporation

References

  1. Seok, J., et al. Genomic responses in mouse models poorly mimic human inflammatory diseases. Proc Natl Acad Sci U S A. 110 (9), 3507-3512 (2013).
  2. Takao, K., Miyakawa, T. Genomic responses in mouse models greatly mimic human inflammatory diseases. Proc Natl Acad Sci U S A. 112 (4), 1167-1172 (2015).
  3. Weidner, C., Steinfath, M., Opitz, E., Oelgeschläger, M., Schönfelder, G. Defining the optimal animal model for translational research using gene set enrichment analysis. EMBO Mol Med. 8 (8), 831-838 (2016).
  4. Subramanian, A., et al. Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles. Proc Natl Acad Sci U S A. 102 (43), 15545-15550 (2005).
  5. Kanehisa, M., Sato, Y., Kawashima, M., Furumichi, M., Tanabe, M. KEGG as a reference resource for gene and protein annotation. Nucleic Acids Res. 44 (D1), D457-D462 (2016).
  6. Kanehisa, M., Goto, S. KEGG: kyoto encyclopedia of genes and genomes. Nucleic Acids Res. 28 (1), 27-30 (2000).
  7. Fabregat, A., et al. The Reactome pathway Knowledgebase. Nucleic Acids Res. 44 (D1), D481-D487 (2016).
  8. Croft, D., et al. The Reactome pathway knowledgebase. Nucleic Acids Res. 42 (Database issue), D472-D477 (2014).
  9. Nishimura, D. BioCarta. Biotech Software & Internet Report. 2 (3), 117-120 (2001).
  10. Edgar, R., Domrachev, M., Lash, A. E. Gene Expression Omnibus: NCBI gene expression and hybridization array data repository. Nucleic Acids Res. 30 (1), 207-210 (2002).
  11. Kolesnikov, N., et al. ArrayExpress update–simplifying data submissions. Nucleic Acids Res. 43 (Database issue), D1113-D1116 (2015).
  12. Cohen, J., et al. Sepsis: a roadmap for future research. Lancet Infect Dis. 15 (5), 581-614 (2015).
  13. Spinelli, L., Carpentier, S., Montanana Sanchis, F., Dalod, M., Vu Manh, T. P. BubbleGUM: automatic extraction of phenotype molecular signatures and comprehensive visualization of multiple Gene Set Enrichment Analyses. BMC Genomics. 16 (1), 814 (2015).

Play Video

Cite This Article
Weidner, C., Steinfath, M., Wistorf, E., Oelgeschläger, M., Schneider, M. R., Schönfelder, G. A Protocol for Using Gene Set Enrichment Analysis to Identify the Appropriate Animal Model for Translational Research. J. Vis. Exp. (126), e55768, doi:10.3791/55768 (2017).

View Video