Inherent Dynamics Visualizer, an Interactive Application for Evaluating and Visualizing Outputs from a Gene Regulatory Network Inference Pipeline

Robert C. Moseley; Sophia Campione; Bree Cummins; Francis Motta; Steven B. Haase

doi:10.3791/63084

JoVE Journal > Biology

Biology

Visualizador de dinâmica inerente, um aplicativo interativo para avaliar e visualizar saídas de um pipeline de inferência de rede de regulação genética

Published: December 07, 2021

doi:

10.3791/63084

Robert C. Moseley, Sophia Campione, Bree Cummins, Francis Motta, Steven B. Haase

¹Department of Biology,Duke University, ²Department of Mathematical Sciences,Montana State University, ³Department of Mathematical Sciences,Florida Atlantic University

Summary

O Inerente Dynamics Visualizer é um pacote de visualização interativo que se conecta a uma ferramenta de inferência de rede de regulação genética para uma geração aprimorada e simplificada de modelos de rede funcionais. O visualizador pode ser usado para tomar decisões mais informadas para a parametrização da ferramenta de inferência, aumentando assim a confiança nos modelos resultantes.

Abstract

Desenvolver modelos de rede de regulação genética é um grande desafio na biologia de sistemas. Várias ferramentas computacionais e pipelines foram desenvolvidos para enfrentar esse desafio, incluindo o recém-desenvolvido Inerente Dynamics Pipeline. O Inerente Dynamics Pipeline consiste em várias ferramentas publicadas anteriormente que funcionam sinergicamente e estão conectadas de forma linear, onde a saída de uma ferramenta é então usada como entrada para a seguinte ferramenta. Como na maioria das técnicas computacionais, cada passo do Pipeline de Dinâmica Inerente exige que o usuário faça escolhas sobre parâmetros que não têm uma definição biológica precisa. Essas escolhas podem impactar substancialmente os modelos de rede de regulação genética produzidos pela análise. Por essa razão, a capacidade de visualizar e explorar as consequências de várias escolhas de parâmetros a cada passo pode ajudar a aumentar a confiança nas escolhas e nos resultados. O Inerente Dynamics Visualizer é um pacote de visualização abrangente que agiliza o processo de avaliação de opções de parâmetros através de uma interface interativa dentro de um navegador da Web. O usuário pode examinar separadamente a saída de cada etapa do pipeline, fazer alterações intuitivas com base em informações visuais e se beneficiar da produção automática de arquivos de entrada necessários para o Pipeline Dinâmico Inerente. O Visualizador de Dinâmica Inerente fornece um nível incomparável de acesso a uma ferramenta altamente complexa para a descoberta de redes de regulação genética a partir de dados transcriômicos de séries temporais.

Introduction

Muitos processos biológicos importantes, como diferenciação celular e resposta ambiental, são regidos por conjuntos de genes que interagem entre si em uma rede de regulação genética (GRN). Essas GRNs produzem a dinâmica transcricional necessária para ativar e manter o fenótipo que controlam, por isso identificar os componentes e a estrutura topológica do GRN é fundamental para entender muitos processos e funções biológicas. Um GRN pode ser modelado como um conjunto de genes e/ou produtos genéticos interativos descritos por uma rede cujos nós são os genes e cujas bordas descrevem a direção e a forma de interação (por exemplo, ativação/repressão da transcrição, modificação pós-translacional, etc.) ¹. As interações podem então ser expressas como modelos matemáticos parametrizados descrevendo o impacto que um gene regulador tem na produção de seu alvo(s)^2,3,4. A inferência de um modelo GRN requer tanto uma inferência da estrutura da rede de interação quanto a estimativa dos parâmetros de interação subjacentes. Uma variedade de métodos de inferência computacional foram desenvolvidos que ingerem dados de expressão genética de séries temporândias e modelos GRN de ^saída5. Recentemente, foi desenvolvido um novo método de inferência GRN, chamado Desindo o Inerente Dynamics Pipeline (IDP), que utiliza dados de expressão genética de séries temporâneas para produzir modelos GRN com interações rotuladas de alvo de regulador capazes de produzir dinâmicas que correspondam à dinâmica observada nos dados de expressão ^genética6. O IDP é um conjunto de ferramentas conectadas linearmente em um pipeline e pode ser dividido em três etapas: um passo de busca de nó que classifica genes com base em características de expressão genética conhecidas ou suspeitas de estarem relacionadas à função do ^GRN7,8, uma etapa de Edge Finding que classifica relacionamentos regulatórios em ^pares8^,⁹, e uma etapa de Busca de Rede que produz modelos GRN capazes de produzir a dinâmica observada10,11,12,13,14,15.

Como a maioria dos métodos computacionais, o IDP requer um conjunto de argumentos especificados pelo usuário que ditam a forma como os dados de entrada são analisados, e diferentes conjuntos de argumentos podem produzir resultados diferentes nos mesmos dados. Por exemplo, vários métodos, incluindo o IDP, contêm argumentos que aplicam algum limite nos dados, e aumentar/diminuir esse limiar entre sucessivas corridas do método específico pode resultar em resultados diferentes entre as corridas (ver Suplemento Nota 10: Métodos de inferência de rede ^de5). Entender como cada argumento pode impactar a análise e os resultados subsequentes é importante para alcançar alta confiança nos resultados. Ao contrário da maioria dos métodos de inferência GRN, o IDP consiste em múltiplas ferramentas computacionais, cada uma tendo seu próprio conjunto de argumentos que um usuário deve especificar e cada um tendo seus próprios resultados. Embora o IDP forneça uma extensa documentação sobre como parametrizar cada ferramenta, a interdependência de cada ferramenta na saída da etapa anterior torna a parametrização de todo o gasoduto sem análises intermediárias desafiadoras. Por exemplo, os argumentos nas etapas de Edge e Network Finding provavelmente serão informados por conhecimento biológico prévio, e por isso dependerão do conjunto de dados e/ou do organismo. Para interrogar resultados intermediários, seria necessário uma compreensão básica da programação, bem como uma compreensão profunda de todos os arquivos de resultados e seus conteúdos do IDP.

O Inerente Dynamics Visualizer (IDV) é um pacote de visualização interativo que é executado na janela do navegador do usuário e fornece uma maneira de os usuários do IDP avaliarem o impacto de suas escolhas de argumento nos resultados de qualquer etapa do IDP. O IDV navega por uma estrutura de diretório complicada produzida pelo IDP e reúne os dados necessários para cada etapa e apresenta os dados em figuras e tabelas intuitivas e interativas para o usuário explorar. Depois de explorar esses displays interativos, o usuário pode produzir novos dados a partir de uma etapa do IDP que pode ser baseada em decisões mais informadas. Esses novos dados podem então ser imediatamente utilizados na próxima etapa do IDP. Além disso, a exploração dos dados pode ajudar a determinar se uma etapa do IDP deve ser reexecutada com parâmetros ajustados. O IDV pode melhorar o uso do IDP, bem como tornar o uso do IDP mais intuitivo e acessível, como demonstrado pela investigação do oscilador principal GRN do ciclo celular de levedura. O protocolo a seguir inclui os resultados do IDP de uma corrida IDP totalmente parametrizada versus uma abordagem que incorpora o IDV após execuções de cada etapa do IDP, ou seja, Node, Edge e Network Finding.

Protocol

1. Instale o IDP e o IDV NOTA: Esta seção pressupõe que docker, conda, pip e git já estão instalados (Tabela de materiais). Em um terminal, entre no comando: o clone git https://gitlab.com/biochron/inherent_dynamics_pipeline.git. Siga as instruções de instalação no arquivo README do IDP. Em um terminal, entre no comando: https://gitlab.com/bertfordley/inherent_dynamics_visualizer.git do clone git.NO…

Representative Results

As etapas descritas textuicamente acima e graficamente na Figura 1 foram aplicadas ao GRN oscilante central do ciclo celular de levedura para ver se é possível descobrir modelos GRN funcionais capazes de produzir a dinâmica observada em dados de expressão genética de séries tempoarânses coletados em um estudo de ciclo de células de levedura16. Para ilustrar como o IDV pode esclarecer e melhorar a saída do IDP, os resultados, após a realização desta anális…

Discussion

A inferência das GRNs é um desafio importante na biologia dos sistemas. O IDP gera GRNs modelo a partir de dados de expressão genética usando uma sequência de ferramentas que utilizam os dados de maneiras cada vez mais complexas. Cada etapa requer decisões sobre como processar os dados e quais elementos (genes, interações funcionais) serão passados para a próxima camada do IDP. Os impactos dessas decisões sobre os resultados do IDP não são tão óbvios. Para ajudar nesse sentido, o IDV fornece visualizaçõe…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Este trabalho foi financiado pela concessão do NIH R01 GM126555-01 e subvenção NSF DMS-1839299.

Materials

Docker			https://docs.docker.com/get-docker/
Git			https://git-scm.com/
Inherent Dynamics Pipeline			https://gitlab.com/biochron/inherent_dynamics_pipeline
Inherent Dynamics Visualizer			https://gitlab.com/bertfordley/inherent_dynamics_visualizer
Miniconda			https://docs.conda.io/en/latest/miniconda.html
Pip			https://pip.pypa.io/en/stable/

References

Karlebach, G., Shamir, R. Modelling and analysis of gene regulatory networks. Nature Reviews Molecular Cell Biology. 9 (10), 770-780 (2008).
Aijö, T., Lähdesmäki, H. Learning gene regulatory networks from gene expression measurements using non-parametric molecular kinetics. Bioinformatics. 25 (22), 2937-2944 (2009).
Huynh-Thu, V. A., Sanguinetti, G. Combining tree-based and dynamical systems for the inference of gene regulatory networks. Bioinformatics. 31 (10), 1614-1622 (2015).
Oates, C. J., et al. Causal network inference using biochemical kinetics. Bioinformatics. 30 (17), 468-474 (2014).
Marbach, D., et al. Wisdom of crowds for robust gene network inference. Nature Methods. 9 (8), 796-804 (2012).
. Inherent Dynamics Pipeline Available from: https://gitlab.com/biochron/inherent_dynamics_pipeline (2021)
Motta, F. C., Moseley, R. C., Cummins, B., Deckard, A., Haase, S. B. Conservation of dynamic characteristics of transcriptional regulatory elements in periodic biological processes. bioRxiv. , (2020).
. LEMpy Available from: https://gitlab.com/biochron/lempy (2021)
McGoff, K. A., et al. The local edge machine: inference of dynamic models of gene regulation. Genome Biology. 17, 214 (2016).
Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. Model rejection and parameter reduction via time series. SIAM Journal on Applied Dynamical Systems. 17 (2), 1589-1616 (2018).
Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. Database of Dynamic Signatures Generated by Regulatory Networks (DSGRN). Lecture Notes in Computer Science. (including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). , 300-308 (2017).
Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. DSGRN: Examining the dynamics of families of logical models. Frontiers in Physiology. 9. 9, 549 (2018).
. DSGRN Available from: https://github.com/marciogameiro/DSGRN (2021)
. Dsgm_Net_Gen Available from: https://github.com/breecummins/dsgrn_net_gen (2021)
. Dsgrn_Net_Query Available from: https://github.com/breecummins/dsgrn_net_query (2021)
Orlando, D. A., et al. Global control of cell-cycle transcription by coupled CDK and network oscillators. Nature. 453 (7197), 944-947 (2008).
Monteiro, P. T., et al. YEASTRACT+: a portal for cross-species comparative genomics of transcription regulation in yeasts. Nucleic Acids Research. 48 (1), 642-649 (2020).
de Bruin, R. A. M., et al. Constraining G1-specific transcription to late G1 phase: The MBF-associated corepressor Nrm1 acts via negative feedback. Molecular Cell. 23 (4), 483-496 (2006).
Horak, C. E., et al. Complex transcriptional circuitry at the G1/S transition in Saccharomyces cerevisiae. Genes & Development. 16 (23), 3017-3033 (2002).
Cherry, J. M., et al. Saccharomyces genome database: The genomics resource of budding yeast. Nucleic Acids Research. 40, 700-705 (2012).
Zhu, G., et al. Two yeast forkhead genes regulate the cell cycle and pseudohyphal growth. Nature. 406 (6791), 90-94 (2000).
Loy, C. J., Lydall, D., Surana, U. NDD1, a high-dosage suppressor of cdc28-1N, is essential for expression of a subset of late-S-phase-specific genes in saccharomyces cerevisiae. Molecular and Cellular Biology. 19 (5), 3312-3327 (1999).
Cho, C. Y., Kelliher, C. M., Hasse, S. B. The cell-cycle transcriptional network generates and transmits a pulse of transcription once each cell cycle. Cell Cycle. 18 (4), 363-378 (2019).
Smith, L. M., et al. An intrinsic oscillator drives the blood stage cycle of the malaria parasite Plasmodium falciparum. Science. 368 (6492), 754-759 (2020).

Play Video

PDF

DOI

DOWNLOAD MATERIALS LIST

Cite This Article

Moseley, R. C., Campione, S., Cummins, B., Motta, F., Haase, S. B. Inherent Dynamics Visualizer, an Interactive Application for Evaluating and Visualizing Outputs from a Gene Regulatory Network Inference Pipeline. J. Vis. Exp. (178), e63084, doi:10.3791/63084 (2021).

Visualizador de dinâmica inerente, um aplicativo interativo para avaliar e visualizar saídas de um pipeline de inferência de rede de regulação genética

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgements

Materials

References

Tags

Play Video

Cite This Article

View Video

Visualizador de dinâmica inerente, um aplicativo interativo para avaliar e visualizar saídas de um pipeline de inferência de rede de regulação genética

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgements

Materials

References

Tags

Play Video

Cite This Article

View Video

✖

To prove you're not a robot, please enter the text in the image below