Summary

Протокол для использования гена набор обогащения анализ для выявления соответствующих животных модель для трансляционного исследования

Published: August 16, 2017
doi:

Summary

Мы предоставляем стандартизированный протокол для использования анализа набора обогащения гена транскриптомики данных для определения идеальной мыши модель для трансляционного исследования.
Этот протокол может использоваться с microarray ДНК и РНК последовательности данных и далее может быть распространено на другие данные омику, если доступны данные.

Abstract

Недавние исследования, которые сравнивали транскриптомики наборов данных заболеваний человека с наборами данных из моделей мышей с использованием традиционных гена в геном Сравнение методов привело к противоречивым выводам относительно актуальности животных моделей для поступательного исследования. Основная причина расхождений между различными ген выражение анализа является произвольным фильтрация дифференциально выраженной генов. Кроме того сравнение единичных генов между видами и платформ часто ограничивается техническим дисперсия, ведущих к неправильному толкованию кон/несоответствие между данными от человека и животных моделей. Таким образом необходимы стандартизированные подходы для анализа систематических данных. Для преодоления субъективного гена фильтрации и неэффективной гена в геном сравнений, мы недавно продемонстрировали, что ген анализ набора обогащения (GSEA) имеет потенциал, чтобы избежать этих проблем. Поэтому мы разработали стандартный протокол для использования GSEA проводить различие между соответствующими и неуместные животных моделей для трансляционного исследования. Этот протокол не подходит предсказать как разработать новые модели систем априори, как это требует существующих экспериментальных омику данных. Однако протокол описывает, как интерпретировать существующих данных в стандартной форме для того, чтобы выбрать наиболее подходящую модель животных, таким образом избегая ненужных экспериментов на животных и заблуждение трансляционного исследования.

Introduction

Животные модели широко используются для изучения болезней человека, из-за их предполагаемого сходства для людей с точки зрения генетики, анатомии и физиологии. Кроме того Животные модели часто служат в качестве привратников по клинической терапии и может иметь огромное влияние на успех трансляционного исследования. Тщательный подбор оптимальной модели на животных может уменьшить количество заблуждение исследований на животных. Недавно актуальность животных моделей для трансляционного исследования состязательно обсуждался, особенно потому, что Анализируя же наборы данных, полученные из воспалительных заболеваний человека и связанных с ними мыши модели привело к противоречивым выводам 1,2. Эта дискуссия показала фундаментальной проблемой во время анализа данных омику: стандартизированные подходы для анализа систематических данных необходимы для того, чтобы уменьшить предвзятым гена выбор и увеличить надежность межвидовые сравнения 3.

Традиционно, анализ данных transcriptomics (и другие данные омику) делается на уровне одного гена и включает в себя первый шаг гена отбора на основе строгих отключения параметров (например, изменение раза > 2.0, значение p < 0,05). Однако настройка параметров первоначального производства часто является субъективной, произвольным и не биологически оправданной и может даже привести к противоположным выводам1,2. Кроме того первоначальный гена выбор обычно ограничивает анализ несколько высоко вверх – и downregulated генов и таким образом не достаточно чувствительны, чтобы включать большинство генов, которые высказывались дифференцировано в меньшей степени.

С ростом эпоху геномики в начале 2000-х и увеличение знания биологических путей и контексты были разработаны альтернативных статистических подходов, которые позволили обойти ограничения уровня анализа одного гена. Джин набор обогащения анализа (GSEA)4, который является одним из широко признанных методов для анализа данных, transcriptomics, делает использование групп a-priori определенных генов (например, сигнальные пути, проксимальной расположение на хромосоме и т.д.). GSEA сначала карты всех обнаруженных нефильтрованное генов в предполагаемой гена наборы (например, пути), независимо от их отдельных изменений в выражении. Таким образом этот подход также включает умеренно регулируется генов, которые в противном случае будут потеряны с уровня анализа одного гена. Аддитивные изменения выражения внутри ген наборы впоследствии выполняется с помощью работает сумма статистики.

Несмотря на его широкое применение в медицинских исследованиях GSEA и соответствующий набор обогащения подходы не учитываются само собой разумеется для анализа сложных омику данных. Здесь мы описываем протокол для сравнения данных омику из человеческих образцов с теми, от моделей мышей с целью выявления идеальная модель для трансляционного исследования. Мы демонстрируем применимости Протокола, основанный на коллекцию моделей мышей, которые используются для изображая человека воспалительных заболеваний. Однако этот анализ трубопровод не ограничивается сравнений человека мыши и допускающем дальнейшего исследования вопросов.

Protocol

1. Скачать молекулярных подписей базы данных и программного обеспечения GSEA перейдите на официальный сайт широкий институт GSEA (http://software.broadinstitute.org/gsea/index.jsp) и зарегистрируйтесь, чтобы получить доступ к программному обеспечению GSEA инструмент и молекулярных подписи базы данных (MSigDB).<…

Representative Results

GSEA рабочего процесса и скриншотов подражания данных демонстрируются. Рисунок 1 показывает файл данных выражение гена, содержащий данные транскриптомики интерес. Для каждого исследования описательного фенотип файл требуется показан на рис…

Discussion

Животные модели давно были применены для расследования заболевания механизмов и разработки новых терапевтических стратегий. Однако скептицизм относительно predictivity животных моделей начал распространяться после неудачи12клинических испытаний. Кроме того были подняты спо?…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Эта работа финансировалась Германского федерального института оценки риска (BfR).

Materials

Excel Microsoft Corporation

References

  1. Seok, J., et al. Genomic responses in mouse models poorly mimic human inflammatory diseases. Proc Natl Acad Sci U S A. 110 (9), 3507-3512 (2013).
  2. Takao, K., Miyakawa, T. Genomic responses in mouse models greatly mimic human inflammatory diseases. Proc Natl Acad Sci U S A. 112 (4), 1167-1172 (2015).
  3. Weidner, C., Steinfath, M., Opitz, E., Oelgeschläger, M., Schönfelder, G. Defining the optimal animal model for translational research using gene set enrichment analysis. EMBO Mol Med. 8 (8), 831-838 (2016).
  4. Subramanian, A., et al. Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles. Proc Natl Acad Sci U S A. 102 (43), 15545-15550 (2005).
  5. Kanehisa, M., Sato, Y., Kawashima, M., Furumichi, M., Tanabe, M. KEGG as a reference resource for gene and protein annotation. Nucleic Acids Res. 44 (D1), D457-D462 (2016).
  6. Kanehisa, M., Goto, S. KEGG: kyoto encyclopedia of genes and genomes. Nucleic Acids Res. 28 (1), 27-30 (2000).
  7. Fabregat, A., et al. The Reactome pathway Knowledgebase. Nucleic Acids Res. 44 (D1), D481-D487 (2016).
  8. Croft, D., et al. The Reactome pathway knowledgebase. Nucleic Acids Res. 42 (Database issue), D472-D477 (2014).
  9. Nishimura, D. BioCarta. Biotech Software & Internet Report. 2 (3), 117-120 (2001).
  10. Edgar, R., Domrachev, M., Lash, A. E. Gene Expression Omnibus: NCBI gene expression and hybridization array data repository. Nucleic Acids Res. 30 (1), 207-210 (2002).
  11. Kolesnikov, N., et al. ArrayExpress update–simplifying data submissions. Nucleic Acids Res. 43 (Database issue), D1113-D1116 (2015).
  12. Cohen, J., et al. Sepsis: a roadmap for future research. Lancet Infect Dis. 15 (5), 581-614 (2015).
  13. Spinelli, L., Carpentier, S., Montanana Sanchis, F., Dalod, M., Vu Manh, T. P. BubbleGUM: automatic extraction of phenotype molecular signatures and comprehensive visualization of multiple Gene Set Enrichment Analyses. BMC Genomics. 16 (1), 814 (2015).

Play Video

Cite This Article
Weidner, C., Steinfath, M., Wistorf, E., Oelgeschläger, M., Schneider, M. R., Schönfelder, G. A Protocol for Using Gene Set Enrichment Analysis to Identify the Appropriate Animal Model for Translational Research. J. Vis. Exp. (126), e55768, doi:10.3791/55768 (2017).

View Video