O Inerente Dynamics Visualizer é um pacote de visualização interativo que se conecta a uma ferramenta de inferência de rede de regulação genética para uma geração aprimorada e simplificada de modelos de rede funcionais. O visualizador pode ser usado para tomar decisões mais informadas para a parametrização da ferramenta de inferência, aumentando assim a confiança nos modelos resultantes.
Desenvolver modelos de rede de regulação genética é um grande desafio na biologia de sistemas. Várias ferramentas computacionais e pipelines foram desenvolvidos para enfrentar esse desafio, incluindo o recém-desenvolvido Inerente Dynamics Pipeline. O Inerente Dynamics Pipeline consiste em várias ferramentas publicadas anteriormente que funcionam sinergicamente e estão conectadas de forma linear, onde a saída de uma ferramenta é então usada como entrada para a seguinte ferramenta. Como na maioria das técnicas computacionais, cada passo do Pipeline de Dinâmica Inerente exige que o usuário faça escolhas sobre parâmetros que não têm uma definição biológica precisa. Essas escolhas podem impactar substancialmente os modelos de rede de regulação genética produzidos pela análise. Por essa razão, a capacidade de visualizar e explorar as consequências de várias escolhas de parâmetros a cada passo pode ajudar a aumentar a confiança nas escolhas e nos resultados. O Inerente Dynamics Visualizer é um pacote de visualização abrangente que agiliza o processo de avaliação de opções de parâmetros através de uma interface interativa dentro de um navegador da Web. O usuário pode examinar separadamente a saída de cada etapa do pipeline, fazer alterações intuitivas com base em informações visuais e se beneficiar da produção automática de arquivos de entrada necessários para o Pipeline Dinâmico Inerente. O Visualizador de Dinâmica Inerente fornece um nível incomparável de acesso a uma ferramenta altamente complexa para a descoberta de redes de regulação genética a partir de dados transcriômicos de séries temporais.
Muitos processos biológicos importantes, como diferenciação celular e resposta ambiental, são regidos por conjuntos de genes que interagem entre si em uma rede de regulação genética (GRN). Essas GRNs produzem a dinâmica transcricional necessária para ativar e manter o fenótipo que controlam, por isso identificar os componentes e a estrutura topológica do GRN é fundamental para entender muitos processos e funções biológicas. Um GRN pode ser modelado como um conjunto de genes e/ou produtos genéticos interativos descritos por uma rede cujos nós são os genes e cujas bordas descrevem a direção e a forma de interação (por exemplo, ativação/repressão da transcrição, modificação pós-translacional, etc.) 1. As interações podem então ser expressas como modelos matemáticos parametrizados descrevendo o impacto que um gene regulador tem na produção de seu alvo(s)2,3,4. A inferência de um modelo GRN requer tanto uma inferência da estrutura da rede de interação quanto a estimativa dos parâmetros de interação subjacentes. Uma variedade de métodos de inferência computacional foram desenvolvidos que ingerem dados de expressão genética de séries temporândias e modelos GRN de saída5. Recentemente, foi desenvolvido um novo método de inferência GRN, chamado Desindo o Inerente Dynamics Pipeline (IDP), que utiliza dados de expressão genética de séries temporâneas para produzir modelos GRN com interações rotuladas de alvo de regulador capazes de produzir dinâmicas que correspondam à dinâmica observada nos dados de expressão genética6. O IDP é um conjunto de ferramentas conectadas linearmente em um pipeline e pode ser dividido em três etapas: um passo de busca de nó que classifica genes com base em características de expressão genética conhecidas ou suspeitas de estarem relacionadas à função do GRN7,8, uma etapa de Edge Finding que classifica relacionamentos regulatórios em pares8, 9, e uma etapa de Busca de Rede que produz modelos GRN capazes de produzir a dinâmica observada10,11,12,13,14,15.
Como a maioria dos métodos computacionais, o IDP requer um conjunto de argumentos especificados pelo usuário que ditam a forma como os dados de entrada são analisados, e diferentes conjuntos de argumentos podem produzir resultados diferentes nos mesmos dados. Por exemplo, vários métodos, incluindo o IDP, contêm argumentos que aplicam algum limite nos dados, e aumentar/diminuir esse limiar entre sucessivas corridas do método específico pode resultar em resultados diferentes entre as corridas (ver Suplemento Nota 10: Métodos de inferência de rede de5). Entender como cada argumento pode impactar a análise e os resultados subsequentes é importante para alcançar alta confiança nos resultados. Ao contrário da maioria dos métodos de inferência GRN, o IDP consiste em múltiplas ferramentas computacionais, cada uma tendo seu próprio conjunto de argumentos que um usuário deve especificar e cada um tendo seus próprios resultados. Embora o IDP forneça uma extensa documentação sobre como parametrizar cada ferramenta, a interdependência de cada ferramenta na saída da etapa anterior torna a parametrização de todo o gasoduto sem análises intermediárias desafiadoras. Por exemplo, os argumentos nas etapas de Edge e Network Finding provavelmente serão informados por conhecimento biológico prévio, e por isso dependerão do conjunto de dados e/ou do organismo. Para interrogar resultados intermediários, seria necessário uma compreensão básica da programação, bem como uma compreensão profunda de todos os arquivos de resultados e seus conteúdos do IDP.
O Inerente Dynamics Visualizer (IDV) é um pacote de visualização interativo que é executado na janela do navegador do usuário e fornece uma maneira de os usuários do IDP avaliarem o impacto de suas escolhas de argumento nos resultados de qualquer etapa do IDP. O IDV navega por uma estrutura de diretório complicada produzida pelo IDP e reúne os dados necessários para cada etapa e apresenta os dados em figuras e tabelas intuitivas e interativas para o usuário explorar. Depois de explorar esses displays interativos, o usuário pode produzir novos dados a partir de uma etapa do IDP que pode ser baseada em decisões mais informadas. Esses novos dados podem então ser imediatamente utilizados na próxima etapa do IDP. Além disso, a exploração dos dados pode ajudar a determinar se uma etapa do IDP deve ser reexecutada com parâmetros ajustados. O IDV pode melhorar o uso do IDP, bem como tornar o uso do IDP mais intuitivo e acessível, como demonstrado pela investigação do oscilador principal GRN do ciclo celular de levedura. O protocolo a seguir inclui os resultados do IDP de uma corrida IDP totalmente parametrizada versus uma abordagem que incorpora o IDV após execuções de cada etapa do IDP, ou seja, Node, Edge e Network Finding.
A inferência das GRNs é um desafio importante na biologia dos sistemas. O IDP gera GRNs modelo a partir de dados de expressão genética usando uma sequência de ferramentas que utilizam os dados de maneiras cada vez mais complexas. Cada etapa requer decisões sobre como processar os dados e quais elementos (genes, interações funcionais) serão passados para a próxima camada do IDP. Os impactos dessas decisões sobre os resultados do IDP não são tão óbvios. Para ajudar nesse sentido, o IDV fornece visualizaçõe…
The authors have nothing to disclose.
Este trabalho foi financiado pela concessão do NIH R01 GM126555-01 e subvenção NSF DMS-1839299.
Docker | https://docs.docker.com/get-docker/ | ||
Git | https://git-scm.com/ | ||
Inherent Dynamics Pipeline | https://gitlab.com/biochron/inherent_dynamics_pipeline | ||
Inherent Dynamics Visualizer | https://gitlab.com/bertfordley/inherent_dynamics_visualizer | ||
Miniconda | https://docs.conda.io/en/latest/miniconda.html | ||
Pip | https://pip.pypa.io/en/stable/ |