Summary

Визуализатор присущей динамики, интерактивное приложение для оценки и визуализации выходных данных из конвейера вывода генной регуляторной сети

Published: December 07, 2021
doi:

Summary

Визуализатор Inherent Dynamics — это интерактивный пакет визуализации, который подключается к инструменту вывода регуляторной сети генов для расширенной, оптимизированной генерации функциональных сетевых моделей. Визуализатор может использоваться для принятия более обоснованных решений по параметризации инструмента вывода, тем самым повышая уверенность в полученных моделях.

Abstract

Разработка моделей генных регуляторных сетей является серьезной проблемой в системной биологии. Для решения этой проблемы было разработано несколько вычислительных инструментов и конвейеров, в том числе недавно разработанный конвейер Inherent Dynamics. Конвейер внутренней динамики состоит из нескольких ранее опубликованных инструментов, которые работают синергетически и связаны линейным образом, где выходные данные одного инструмента затем используются в качестве входных данных для следующего инструмента. Как и в случае с большинством вычислительных методов, каждый шаг конвейера Inherent Dynamics требует, чтобы пользователь делал выбор параметров, которые не имеют точного биологического определения. Этот выбор может существенно повлиять на модели генных регуляторных сетей, полученные в результате анализа. По этой причине способность визуализировать и исследовать последствия выбора различных параметров на каждом этапе может помочь повысить уверенность в выборе и результатах. Визуализатор Inherent Dynamics — это комплексный пакет визуализации, который упрощает процесс оценки выбора параметров с помощью интерактивного интерфейса в веб-браузере. Пользователь может отдельно изучить выходные данные каждого шага конвейера, внести интуитивно понятные изменения на основе визуальной информации и воспользоваться автоматическим созданием необходимых входных файлов для конвейера Inherent Dynamics. Визуализатор Inherent Dynamics обеспечивает беспрецедентный уровень доступа к очень сложному инструменту для обнаружения генных регуляторных сетей из транскриптомных данных временных рядов.

Introduction

Многие важные биологические процессы, такие как дифференцировка клеток и реакция окружающей среды, управляются наборами генов, которые взаимодействуют друг с другом в генной регуляторной сети (GRN). Эти GRN производят транскрипционную динамику, необходимую для активации и поддержания фенотипа, который они контролируют, поэтому идентификация компонентов и топологической структуры GRN является ключом к пониманию многих биологических процессов и функций. GRN может быть смоделирован как набор взаимодействующих генов и/или генных продуктов, описанных сетью, узлами которой являются гены, а края которой описывают направление и форму взаимодействия (например, активация/подавление транскрипции, посттрансляционная модификация и т.д.). 1. Затем взаимодействия могут быть выражены в виде параметризованных математических моделей, описывающих влияние регулирующего гена на выработку его цели (целей) 2,3,4. Вывод модели GRN требует как вывода структуры сети взаимодействия, так и оценки базовых параметров взаимодействия. Были разработаны различные методы вычислительного вывода, которые принимают данные экспрессии генов временных рядов и выводят модели GRN5. Недавно был разработан новый метод вывода GRN, называемый Inherent Dynamics Pipeline (IDP), который использует данные экспрессии генов временных рядов для получения моделей GRN с мечеными регуляторно-целевыми взаимодействиями, которые способны производить динамику, соответствующую наблюдаемой динамике в данных экспрессии генов6. IDP представляет собой набор инструментов, линейно связанных в конвейер и может быть разбит на три этапа: шаг Node Finding, который ранжирует гены на основе характеристик экспрессии генов, известных или подозреваемых в связи с функцией GRN7,8, шаг Edge Finding, который ранжирует попарные регуляторные отношения8, 9, и этап обнаружения сети, на котором получены модели GRN, способные производить наблюдаемую динамику10,11,12,13,14,15.

Как и большинство вычислительных методов, IDP требует набора заданных пользователем аргументов, которые определяют, как анализируются входные данные, и разные наборы аргументов могут давать разные результаты для одних и тех же данных. Например, несколько методов, включая IDP, содержат аргументы, которые применяют некоторое пороговое значение к данным, и увеличение/уменьшение этого порога между последовательными прогонами конкретного метода может привести к неодинаковым результатам между прогонами (см. Примечание 10: Методы сетевого вывода 5). Понимание того, как каждый аргумент может повлиять на анализ и последующие результаты, важно для достижения высокой уверенности в результатах. В отличие от большинства методов вывода GRN, IDP состоит из нескольких вычислительных инструментов, каждый из которых имеет свой собственный набор аргументов, которые пользователь должен указать, и каждый из которых имеет свои собственные результаты. В то время как IDP предоставляет обширную документацию о том, как параметризовать каждый инструмент, взаимозависимость каждого инструмента от результатов предыдущего шага затрудняет параметризацию всего конвейера без промежуточного анализа. Например, аргументы в шагах Edge и Network Finding, вероятно, будут основаны на предыдущих биологических знаниях, и поэтому будут зависеть от набора данных и / или организма. Для опрашивания промежуточных результатов потребуется базовое понимание программирования, а также глубокое понимание всех файлов результатов и их содержимого от ВПЛ.

Визуализатор внутренней динамики (IDV) — это интерактивный пакет визуализации, который запускается в окне браузера пользователя и предоставляет пользователям IDP возможность оценить влияние их выбора аргументов на результаты любого шага в IDP. IDV перемещается по сложной структуре каталогов, созданной IDP, и собирает необходимые данные для каждого шага и представляет данные в виде интуитивно понятных и интерактивных рисунков и таблиц для изучения пользователем. После изучения этих интерактивных дисплеев пользователь может создавать новые данные из шага IDP, которые могут быть основаны на более обоснованных решениях. Затем эти новые данные могут быть немедленно использованы на следующем соответствующем этапе ВПЛ. Кроме того, изучение данных может помочь определить, следует ли повторно запускать шаг IDP с скорректированными параметрами. IDV может улучшить использование IDP, а также сделать использование IDP более интуитивно понятным и доступным, что было продемонстрировано исследованием основного осциллятора GRN дрожжевого клеточного цикла. Следующий протокол включает результаты IDP от полностью параметризованного запуска IDP по сравнению с подходом, который включает IDV после выполнения каждого шага IDP, т. е. Node, Edge и Network Finding.

Protocol

1. Установите IDP и IDV ПРИМЕЧАНИЕ: В этом разделе предполагается, что docker, conda, pip и git уже установлены (Таблица материалов). В терминале введите команду: git clone https://gitlab.com/biochron/inherent_dynamics_pipeline.git. Следуйте инструкциям по установке в файле README IDP. …

Representative Results

Этапы, описанные текстуально выше и графически на рисунке 1, были применены к основному колеблющемуся GRN дрожжевого клеточного цикла, чтобы увидеть, возможно ли обнаружить функциональные модели GRN, которые способны производить динамику, наблюдаемую в данных экспрессии ?…

Discussion

Вывод GRN является важной проблемой в системной биологии. IDP генерирует модельные GRN из данных экспрессии генов с использованием последовательности инструментов, которые используют данные все более сложными способами. Каждый шаг требует принятия решений о том, как обрабатывать данные и…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Эта работа финансировалась грантом NIH R01 GM126555-01 и грантом NSF DMS-1839299.

Materials

Docker https://docs.docker.com/get-docker/
Git https://git-scm.com/
Inherent Dynamics Pipeline https://gitlab.com/biochron/inherent_dynamics_pipeline
Inherent Dynamics Visualizer https://gitlab.com/bertfordley/inherent_dynamics_visualizer
Miniconda https://docs.conda.io/en/latest/miniconda.html
Pip https://pip.pypa.io/en/stable/

References

  1. Karlebach, G., Shamir, R. Modelling and analysis of gene regulatory networks. Nature Reviews Molecular Cell Biology. 9 (10), 770-780 (2008).
  2. Aijö, T., Lähdesmäki, H. Learning gene regulatory networks from gene expression measurements using non-parametric molecular kinetics. Bioinformatics. 25 (22), 2937-2944 (2009).
  3. Huynh-Thu, V. A., Sanguinetti, G. Combining tree-based and dynamical systems for the inference of gene regulatory networks. Bioinformatics. 31 (10), 1614-1622 (2015).
  4. Oates, C. J., et al. Causal network inference using biochemical kinetics. Bioinformatics. 30 (17), 468-474 (2014).
  5. Marbach, D., et al. Wisdom of crowds for robust gene network inference. Nature Methods. 9 (8), 796-804 (2012).
  6. . Inherent Dynamics Pipeline Available from: https://gitlab.com/biochron/inherent_dynamics_pipeline (2021)
  7. Motta, F. C., Moseley, R. C., Cummins, B., Deckard, A., Haase, S. B. Conservation of dynamic characteristics of transcriptional regulatory elements in periodic biological processes. bioRxiv. , (2020).
  8. . LEMpy Available from: https://gitlab.com/biochron/lempy (2021)
  9. McGoff, K. A., et al. The local edge machine: inference of dynamic models of gene regulation. Genome Biology. 17, 214 (2016).
  10. Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. Model rejection and parameter reduction via time series. SIAM Journal on Applied Dynamical Systems. 17 (2), 1589-1616 (2018).
  11. Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. Database of Dynamic Signatures Generated by Regulatory Networks (DSGRN). Lecture Notes in Computer Science. (including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). , 300-308 (2017).
  12. Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. DSGRN: Examining the dynamics of families of logical models. Frontiers in Physiology. 9. 9, 549 (2018).
  13. . DSGRN Available from: https://github.com/marciogameiro/DSGRN (2021)
  14. . Dsgm_Net_Gen Available from: https://github.com/breecummins/dsgrn_net_gen (2021)
  15. . Dsgrn_Net_Query Available from: https://github.com/breecummins/dsgrn_net_query (2021)
  16. Orlando, D. A., et al. Global control of cell-cycle transcription by coupled CDK and network oscillators. Nature. 453 (7197), 944-947 (2008).
  17. Monteiro, P. T., et al. YEASTRACT+: a portal for cross-species comparative genomics of transcription regulation in yeasts. Nucleic Acids Research. 48 (1), 642-649 (2020).
  18. de Bruin, R. A. M., et al. Constraining G1-specific transcription to late G1 phase: The MBF-associated corepressor Nrm1 acts via negative feedback. Molecular Cell. 23 (4), 483-496 (2006).
  19. Horak, C. E., et al. Complex transcriptional circuitry at the G1/S transition in Saccharomyces cerevisiae. Genes & Development. 16 (23), 3017-3033 (2002).
  20. Cherry, J. M., et al. Saccharomyces genome database: The genomics resource of budding yeast. Nucleic Acids Research. 40, 700-705 (2012).
  21. Zhu, G., et al. Two yeast forkhead genes regulate the cell cycle and pseudohyphal growth. Nature. 406 (6791), 90-94 (2000).
  22. Loy, C. J., Lydall, D., Surana, U. NDD1, a high-dosage suppressor of cdc28-1N, is essential for expression of a subset of late-S-phase-specific genes in saccharomyces cerevisiae. Molecular and Cellular Biology. 19 (5), 3312-3327 (1999).
  23. Cho, C. Y., Kelliher, C. M., Hasse, S. B. The cell-cycle transcriptional network generates and transmits a pulse of transcription once each cell cycle. Cell Cycle. 18 (4), 363-378 (2019).
  24. Smith, L. M., et al. An intrinsic oscillator drives the blood stage cycle of the malaria parasite Plasmodium falciparum. Science. 368 (6492), 754-759 (2020).
check_url/63084?article_type=t

Play Video

Cite This Article
Moseley, R. C., Campione, S., Cummins, B., Motta, F., Haase, S. B. Inherent Dynamics Visualizer, an Interactive Application for Evaluating and Visualizing Outputs from a Gene Regulatory Network Inference Pipeline. J. Vis. Exp. (178), e63084, doi:10.3791/63084 (2021).

View Video