Summary

Visualizador de dinâmica inerente, um aplicativo interativo para avaliar e visualizar saídas de um pipeline de inferência de rede de regulação genética

Published: December 07, 2021
doi:

Summary

O Inerente Dynamics Visualizer é um pacote de visualização interativo que se conecta a uma ferramenta de inferência de rede de regulação genética para uma geração aprimorada e simplificada de modelos de rede funcionais. O visualizador pode ser usado para tomar decisões mais informadas para a parametrização da ferramenta de inferência, aumentando assim a confiança nos modelos resultantes.

Abstract

Desenvolver modelos de rede de regulação genética é um grande desafio na biologia de sistemas. Várias ferramentas computacionais e pipelines foram desenvolvidos para enfrentar esse desafio, incluindo o recém-desenvolvido Inerente Dynamics Pipeline. O Inerente Dynamics Pipeline consiste em várias ferramentas publicadas anteriormente que funcionam sinergicamente e estão conectadas de forma linear, onde a saída de uma ferramenta é então usada como entrada para a seguinte ferramenta. Como na maioria das técnicas computacionais, cada passo do Pipeline de Dinâmica Inerente exige que o usuário faça escolhas sobre parâmetros que não têm uma definição biológica precisa. Essas escolhas podem impactar substancialmente os modelos de rede de regulação genética produzidos pela análise. Por essa razão, a capacidade de visualizar e explorar as consequências de várias escolhas de parâmetros a cada passo pode ajudar a aumentar a confiança nas escolhas e nos resultados. O Inerente Dynamics Visualizer é um pacote de visualização abrangente que agiliza o processo de avaliação de opções de parâmetros através de uma interface interativa dentro de um navegador da Web. O usuário pode examinar separadamente a saída de cada etapa do pipeline, fazer alterações intuitivas com base em informações visuais e se beneficiar da produção automática de arquivos de entrada necessários para o Pipeline Dinâmico Inerente. O Visualizador de Dinâmica Inerente fornece um nível incomparável de acesso a uma ferramenta altamente complexa para a descoberta de redes de regulação genética a partir de dados transcriômicos de séries temporais.

Introduction

Muitos processos biológicos importantes, como diferenciação celular e resposta ambiental, são regidos por conjuntos de genes que interagem entre si em uma rede de regulação genética (GRN). Essas GRNs produzem a dinâmica transcricional necessária para ativar e manter o fenótipo que controlam, por isso identificar os componentes e a estrutura topológica do GRN é fundamental para entender muitos processos e funções biológicas. Um GRN pode ser modelado como um conjunto de genes e/ou produtos genéticos interativos descritos por uma rede cujos nós são os genes e cujas bordas descrevem a direção e a forma de interação (por exemplo, ativação/repressão da transcrição, modificação pós-translacional, etc.) 1. As interações podem então ser expressas como modelos matemáticos parametrizados descrevendo o impacto que um gene regulador tem na produção de seu alvo(s)2,3,4. A inferência de um modelo GRN requer tanto uma inferência da estrutura da rede de interação quanto a estimativa dos parâmetros de interação subjacentes. Uma variedade de métodos de inferência computacional foram desenvolvidos que ingerem dados de expressão genética de séries temporândias e modelos GRN de saída5. Recentemente, foi desenvolvido um novo método de inferência GRN, chamado Desindo o Inerente Dynamics Pipeline (IDP), que utiliza dados de expressão genética de séries temporâneas para produzir modelos GRN com interações rotuladas de alvo de regulador capazes de produzir dinâmicas que correspondam à dinâmica observada nos dados de expressão genética6. O IDP é um conjunto de ferramentas conectadas linearmente em um pipeline e pode ser dividido em três etapas: um passo de busca de nó que classifica genes com base em características de expressão genética conhecidas ou suspeitas de estarem relacionadas à função do GRN7,8, uma etapa de Edge Finding que classifica relacionamentos regulatórios em pares8, 9, e uma etapa de Busca de Rede que produz modelos GRN capazes de produzir a dinâmica observada10,11,12,13,14,15.

Como a maioria dos métodos computacionais, o IDP requer um conjunto de argumentos especificados pelo usuário que ditam a forma como os dados de entrada são analisados, e diferentes conjuntos de argumentos podem produzir resultados diferentes nos mesmos dados. Por exemplo, vários métodos, incluindo o IDP, contêm argumentos que aplicam algum limite nos dados, e aumentar/diminuir esse limiar entre sucessivas corridas do método específico pode resultar em resultados diferentes entre as corridas (ver Suplemento Nota 10: Métodos de inferência de rede de5). Entender como cada argumento pode impactar a análise e os resultados subsequentes é importante para alcançar alta confiança nos resultados. Ao contrário da maioria dos métodos de inferência GRN, o IDP consiste em múltiplas ferramentas computacionais, cada uma tendo seu próprio conjunto de argumentos que um usuário deve especificar e cada um tendo seus próprios resultados. Embora o IDP forneça uma extensa documentação sobre como parametrizar cada ferramenta, a interdependência de cada ferramenta na saída da etapa anterior torna a parametrização de todo o gasoduto sem análises intermediárias desafiadoras. Por exemplo, os argumentos nas etapas de Edge e Network Finding provavelmente serão informados por conhecimento biológico prévio, e por isso dependerão do conjunto de dados e/ou do organismo. Para interrogar resultados intermediários, seria necessário uma compreensão básica da programação, bem como uma compreensão profunda de todos os arquivos de resultados e seus conteúdos do IDP.

O Inerente Dynamics Visualizer (IDV) é um pacote de visualização interativo que é executado na janela do navegador do usuário e fornece uma maneira de os usuários do IDP avaliarem o impacto de suas escolhas de argumento nos resultados de qualquer etapa do IDP. O IDV navega por uma estrutura de diretório complicada produzida pelo IDP e reúne os dados necessários para cada etapa e apresenta os dados em figuras e tabelas intuitivas e interativas para o usuário explorar. Depois de explorar esses displays interativos, o usuário pode produzir novos dados a partir de uma etapa do IDP que pode ser baseada em decisões mais informadas. Esses novos dados podem então ser imediatamente utilizados na próxima etapa do IDP. Além disso, a exploração dos dados pode ajudar a determinar se uma etapa do IDP deve ser reexecutada com parâmetros ajustados. O IDV pode melhorar o uso do IDP, bem como tornar o uso do IDP mais intuitivo e acessível, como demonstrado pela investigação do oscilador principal GRN do ciclo celular de levedura. O protocolo a seguir inclui os resultados do IDP de uma corrida IDP totalmente parametrizada versus uma abordagem que incorpora o IDV após execuções de cada etapa do IDP, ou seja, Node, Edge e Network Finding.

Protocol

1. Instale o IDP e o IDV NOTA: Esta seção pressupõe que docker, conda, pip e git já estão instalados (Tabela de materiais). Em um terminal, entre no comando: o clone git https://gitlab.com/biochron/inherent_dynamics_pipeline.git. Siga as instruções de instalação no arquivo README do IDP. Em um terminal, entre no comando: https://gitlab.com/bertfordley/inherent_dynamics_visualizer.git do clone git.NO…

Representative Results

As etapas descritas textuicamente acima e graficamente na Figura 1 foram aplicadas ao GRN oscilante central do ciclo celular de levedura para ver se é possível descobrir modelos GRN funcionais capazes de produzir a dinâmica observada em dados de expressão genética de séries tempoarânses coletados em um estudo de ciclo de células de levedura16. Para ilustrar como o IDV pode esclarecer e melhorar a saída do IDP, os resultados, após a realização desta anális…

Discussion

A inferência das GRNs é um desafio importante na biologia dos sistemas. O IDP gera GRNs modelo a partir de dados de expressão genética usando uma sequência de ferramentas que utilizam os dados de maneiras cada vez mais complexas. Cada etapa requer decisões sobre como processar os dados e quais elementos (genes, interações funcionais) serão passados para a próxima camada do IDP. Os impactos dessas decisões sobre os resultados do IDP não são tão óbvios. Para ajudar nesse sentido, o IDV fornece visualizaçõe…

Declarações

The authors have nothing to disclose.

Acknowledgements

Este trabalho foi financiado pela concessão do NIH R01 GM126555-01 e subvenção NSF DMS-1839299.

Materials

Docker https://docs.docker.com/get-docker/
Git https://git-scm.com/
Inherent Dynamics Pipeline https://gitlab.com/biochron/inherent_dynamics_pipeline
Inherent Dynamics Visualizer https://gitlab.com/bertfordley/inherent_dynamics_visualizer
Miniconda https://docs.conda.io/en/latest/miniconda.html
Pip https://pip.pypa.io/en/stable/

Referências

  1. Karlebach, G., Shamir, R. Modelling and analysis of gene regulatory networks. Nature Reviews Molecular Cell Biology. 9 (10), 770-780 (2008).
  2. Aijö, T., Lähdesmäki, H. Learning gene regulatory networks from gene expression measurements using non-parametric molecular kinetics. Bioinformatics. 25 (22), 2937-2944 (2009).
  3. Huynh-Thu, V. A., Sanguinetti, G. Combining tree-based and dynamical systems for the inference of gene regulatory networks. Bioinformatics. 31 (10), 1614-1622 (2015).
  4. Oates, C. J., et al. Causal network inference using biochemical kinetics. Bioinformatics. 30 (17), 468-474 (2014).
  5. Marbach, D., et al. Wisdom of crowds for robust gene network inference. Nature Methods. 9 (8), 796-804 (2012).
  6. . Inherent Dynamics Pipeline Available from: https://gitlab.com/biochron/inherent_dynamics_pipeline (2021)
  7. Motta, F. C., Moseley, R. C., Cummins, B., Deckard, A., Haase, S. B. Conservation of dynamic characteristics of transcriptional regulatory elements in periodic biological processes. bioRxiv. , (2020).
  8. . LEMpy Available from: https://gitlab.com/biochron/lempy (2021)
  9. McGoff, K. A., et al. The local edge machine: inference of dynamic models of gene regulation. Genome Biology. 17, 214 (2016).
  10. Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. Model rejection and parameter reduction via time series. SIAM Journal on Applied Dynamical Systems. 17 (2), 1589-1616 (2018).
  11. Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. Database of Dynamic Signatures Generated by Regulatory Networks (DSGRN). Lecture Notes in Computer Science. (including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). , 300-308 (2017).
  12. Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. DSGRN: Examining the dynamics of families of logical models. Frontiers in Physiology. 9. 9, 549 (2018).
  13. . DSGRN Available from: https://github.com/marciogameiro/DSGRN (2021)
  14. . Dsgm_Net_Gen Available from: https://github.com/breecummins/dsgrn_net_gen (2021)
  15. . Dsgrn_Net_Query Available from: https://github.com/breecummins/dsgrn_net_query (2021)
  16. Orlando, D. A., et al. Global control of cell-cycle transcription by coupled CDK and network oscillators. Nature. 453 (7197), 944-947 (2008).
  17. Monteiro, P. T., et al. YEASTRACT+: a portal for cross-species comparative genomics of transcription regulation in yeasts. Nucleic Acids Research. 48 (1), 642-649 (2020).
  18. de Bruin, R. A. M., et al. Constraining G1-specific transcription to late G1 phase: The MBF-associated corepressor Nrm1 acts via negative feedback. Molecular Cell. 23 (4), 483-496 (2006).
  19. Horak, C. E., et al. Complex transcriptional circuitry at the G1/S transition in Saccharomyces cerevisiae. Genes & Development. 16 (23), 3017-3033 (2002).
  20. Cherry, J. M., et al. Saccharomyces genome database: The genomics resource of budding yeast. Nucleic Acids Research. 40, 700-705 (2012).
  21. Zhu, G., et al. Two yeast forkhead genes regulate the cell cycle and pseudohyphal growth. Nature. 406 (6791), 90-94 (2000).
  22. Loy, C. J., Lydall, D., Surana, U. NDD1, a high-dosage suppressor of cdc28-1N, is essential for expression of a subset of late-S-phase-specific genes in saccharomyces cerevisiae. Molecular and Cellular Biology. 19 (5), 3312-3327 (1999).
  23. Cho, C. Y., Kelliher, C. M., Hasse, S. B. The cell-cycle transcriptional network generates and transmits a pulse of transcription once each cell cycle. Cell Cycle. 18 (4), 363-378 (2019).
  24. Smith, L. M., et al. An intrinsic oscillator drives the blood stage cycle of the malaria parasite Plasmodium falciparum. Science. 368 (6492), 754-759 (2020).
check_url/pt/63084?article_type=t

Play Video

Citar este artigo
Moseley, R. C., Campione, S., Cummins, B., Motta, F., Haase, S. B. Inherent Dynamics Visualizer, an Interactive Application for Evaluating and Visualizing Outputs from a Gene Regulatory Network Inference Pipeline. J. Vis. Exp. (178), e63084, doi:10.3791/63084 (2021).

View Video