Summary

Inherent Dynamics Visualizer, une application interactive pour évaluer et visualiser les résultats d’un pipeline d’inférence de réseau de régulation de gènes

Published: December 07, 2021
doi:

Summary

Inherent Dynamics Visualizer est un ensemble de visualisation interactif qui se connecte à un outil d’inférence de réseau de régulation génique pour une génération améliorée et rationalisée de modèles de réseau fonctionnels. Le visualiseur peut être utilisé pour prendre des décisions plus éclairées pour paramétrer l’outil d’inférence, augmentant ainsi la confiance dans les modèles résultants.

Abstract

Le développement de modèles de réseaux de régulation génique est un défi majeur en biologie des systèmes. Plusieurs outils de calcul et pipelines ont été développés pour relever ce défi, y compris le nouveau pipeline Inherent Dynamics. Le pipeline Inherent Dynamics se compose de plusieurs outils précédemment publiés qui fonctionnent en synergie et sont connectés de manière linéaire, où la sortie d’un outil est ensuite utilisée comme entrée pour l’outil suivant. Comme pour la plupart des techniques de calcul, chaque étape du pipeline Inherent Dynamics nécessite que l’utilisateur fasse des choix sur des paramètres qui n’ont pas de définition biologique précise. Ces choix peuvent avoir un impact considérable sur les modèles de réseaux de régulation des gènes produits par l’analyse. Pour cette raison, la capacité de visualiser et d’explorer les conséquences de divers choix de paramètres à chaque étape peut aider à accroître la confiance dans les choix et les résultats. Inherent Dynamics Visualizer est un package de visualisation complet qui rationalise le processus d’évaluation des choix de paramètres via une interface interactive dans un navigateur Web. L’utilisateur peut examiner séparément la sortie de chaque étape du pipeline, apporter des modifications intuitives en fonction d’informations visuelles et bénéficier de la production automatique des fichiers d’entrée nécessaires pour le pipeline Inherent Dynamics. Le visualiseur Inherent Dynamics offre un niveau d’accès inégalé à un outil très complexe pour la découverte de réseaux de régulation génique à partir de données transcriptomiques de séries chronologiques.

Introduction

De nombreux processus biologiques importants, tels que la différenciation cellulaire et la réponse environnementale, sont régis par des ensembles de gènes qui interagissent les uns avec les autres dans un réseau de régulation des gènes (GRN). Ces GRN produisent la dynamique transcriptionnelle nécessaire à l’activation et au maintien du phénotype qu’ils contrôlent, de sorte que l’identification des composants et de la structure topologique du GRN est essentielle pour comprendre de nombreux processus et fonctions biologiques. Un GRN peut être modélisé comme un ensemble de gènes en interaction et/ou de produits géniques décrits par un réseau dont les nœuds sont les gènes et dont les bords décrivent la direction et la forme de l’interaction (par exemple, activation/répression de la transcription, modification post-traductionnelle, etc.) 1. Les interactions peuvent ensuite être exprimées sous forme de modèles mathématiques paramétrés décrivant l’impact d’un gène régulateur sur la production de sa ou ses cibles 2,3,4. L’inférence d’un modèle GRN nécessite à la fois une inférence de la structure du réseau d’interaction et une estimation des paramètres d’interaction sous-jacents. Diverses méthodes d’inférence computationnelle ont été mises au point pour ingérer des données d’expression génique de séries chronologiques et produire des modèles GRN5. Récemment, une nouvelle méthode d’inférence GRN a été développée, appelée Inherent Dynamics Pipeline (IDP), qui utilise des données d’expression génique de séries chronologiques pour produire des modèles GRN avec des interactions régulateur-cible marquées capables de produire une dynamique qui correspond à la dynamique observée dans les données d’expression génique6. L’IDP est une suite d’outils connectés linéairement dans un pipeline et peut être décomposé en trois étapes : une étape de recherche de nœud qui classe les gènes en fonction des caractéristiques d’expression génique connues ou soupçonnées d’être liées à la fonction du GRN7,8, une étape de recherche de périphérie qui classe les relations réglementaires par paires8, 9, et une étape de recherche de réseau qui produit des modèles GRN capables de produire la dynamique observée10,11,12,13,14,15.

Comme la plupart des méthodes de calcul, l’IDP nécessite un ensemble d’arguments spécifiés par l’utilisateur qui dictent la façon dont les données d’entrée sont analysées, et différents ensembles d’arguments peuvent produire des résultats différents sur les mêmes données. Par exemple, plusieurs méthodes, y compris l’IDP, contiennent des arguments qui appliquent un certain seuil sur les données, et l’augmentation/diminution de ce seuil entre les exécutions successives de la méthode particulière peut entraîner des résultats différents entre les exécutions (voir la note supplémentaire 10 : Méthodes d’inférence réseau de5). Comprendre comment chaque argument peut avoir une incidence sur l’analyse et les résultats ultérieurs est important pour obtenir une grande confiance dans les résultats. Contrairement à la plupart des méthodes d’inférence GRN, l’IDP se compose de plusieurs outils de calcul, chacun ayant son propre ensemble d’arguments qu’un utilisateur doit spécifier et chacun ayant ses propres résultats. Bien que l’IDP fournisse une documentation complète sur la façon de paramétrer chaque outil, l’interdépendance de chaque outil sur la sortie de l’étape précédente rend difficile le paramétrage de l’ensemble du pipeline sans analyses intermédiaires. Par exemple, les arguments dans les étapes Edge et Network Finding sont susceptibles d’être éclairés par des connaissances biologiques antérieures, et dépendront donc de l’ensemble de données et / ou de l’organisme. Pour interroger les résultats intermédiaires, une compréhension de base de la programmation, ainsi qu’une compréhension approfondie de tous les fichiers de résultats et de leur contenu de l’IDP, seraient nécessaires.

L’Inherent Dynamics Visualizer (IDV) est un package de visualisation interactif qui s’exécute dans la fenêtre du navigateur d’un utilisateur et permet aux utilisateurs de l’IDP d’évaluer l’impact de leurs choix d’arguments sur les résultats de n’importe quelle étape de l’IDP. L’IDV navigue dans une structure de répertoires complexe produite par l’IDP et recueille les données nécessaires pour chaque étape et présente les données dans des figures et des tableaux intuitifs et interactifs que l’utilisateur peut explorer. Après avoir exploré ces écrans interactifs, l’utilisateur peut produire de nouvelles données à partir d’une étape IDP qui peuvent être basées sur des décisions plus éclairées. Ces nouvelles données peuvent ensuite être immédiatement utilisées à l’étape suivante de l’IDP. En outre, l’exploration des données peut aider à déterminer si une étape IDP doit être réexécutée avec des paramètres ajustés. L’IDV peut améliorer l’utilisation de l’IDP, ainsi que rendre l’utilisation de l’IDP plus intuitive et accessible, comme l’a démontré l’étude de l’oscillateur central GRN du cycle cellulaire de la levure. Le protocole suivant inclut les résultats IDP d’une exécution IDP entièrement paramétrée par rapport à une approche qui incorpore l’IDV après les exécutions de chaque étape IDP, c’est-à-dire Node, Edge et Network Finding.

Protocol

1. Installez l’IDP et l’IDV REMARQUE : cette section suppose que docker, conda, pip et git sont déjà installés (Tableau des matériaux). Dans un terminal, entrez la commande : git clone https://gitlab.com/biochron/inherent_dynamics_pipeline.git. Suivez les instructions d’installation dans le fichier README du fournisseur d’identité. Dans un terminal, entrez la commande : git clone https://gitlab.com/bertf…

Representative Results

Les étapes décrites textuellement ci-dessus et graphiquement à la figure 1 ont été appliquées au GRN oscillant du noyau du cycle cellulaire de la levure pour voir s’il est possible de découvrir des modèles DE GRN fonctionnels capables de produire la dynamique observée dans les données d’expression génique de séries chronologiques recueillies dans une étude du cycle cellulaire de la levure16. Pour illustrer comment l’IDV peut clarifier et améliorer …

Discussion

L’inférence des GRN est un défi important en biologie des systèmes. L’IDP génère des GRN modèles à partir de données d’expression génique à l’aide d’une séquence d’outils qui utilisent les données de manière de plus en plus complexe. Chaque étape nécessite des décisions sur la façon de traiter les données et quels éléments (gènes, interactions fonctionnelles) seront transmis à la couche suivante de l’IDP. Les répercussions de ces décisions sur les résultats des PDI ne sont pas aussi…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Ce travail a été financé par la subvention NIH R01 GM126555-01 et la subvention NSF DMS-1839299.

Materials

Docker https://docs.docker.com/get-docker/
Git https://git-scm.com/
Inherent Dynamics Pipeline https://gitlab.com/biochron/inherent_dynamics_pipeline
Inherent Dynamics Visualizer https://gitlab.com/bertfordley/inherent_dynamics_visualizer
Miniconda https://docs.conda.io/en/latest/miniconda.html
Pip https://pip.pypa.io/en/stable/

References

  1. Karlebach, G., Shamir, R. Modelling and analysis of gene regulatory networks. Nature Reviews Molecular Cell Biology. 9 (10), 770-780 (2008).
  2. Aijö, T., Lähdesmäki, H. Learning gene regulatory networks from gene expression measurements using non-parametric molecular kinetics. Bioinformatics. 25 (22), 2937-2944 (2009).
  3. Huynh-Thu, V. A., Sanguinetti, G. Combining tree-based and dynamical systems for the inference of gene regulatory networks. Bioinformatics. 31 (10), 1614-1622 (2015).
  4. Oates, C. J., et al. Causal network inference using biochemical kinetics. Bioinformatics. 30 (17), 468-474 (2014).
  5. Marbach, D., et al. Wisdom of crowds for robust gene network inference. Nature Methods. 9 (8), 796-804 (2012).
  6. . Inherent Dynamics Pipeline Available from: https://gitlab.com/biochron/inherent_dynamics_pipeline (2021)
  7. Motta, F. C., Moseley, R. C., Cummins, B., Deckard, A., Haase, S. B. Conservation of dynamic characteristics of transcriptional regulatory elements in periodic biological processes. bioRxiv. , (2020).
  8. . LEMpy Available from: https://gitlab.com/biochron/lempy (2021)
  9. McGoff, K. A., et al. The local edge machine: inference of dynamic models of gene regulation. Genome Biology. 17, 214 (2016).
  10. Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. Model rejection and parameter reduction via time series. SIAM Journal on Applied Dynamical Systems. 17 (2), 1589-1616 (2018).
  11. Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. Database of Dynamic Signatures Generated by Regulatory Networks (DSGRN). Lecture Notes in Computer Science. (including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). , 300-308 (2017).
  12. Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. DSGRN: Examining the dynamics of families of logical models. Frontiers in Physiology. 9. 9, 549 (2018).
  13. . DSGRN Available from: https://github.com/marciogameiro/DSGRN (2021)
  14. . Dsgm_Net_Gen Available from: https://github.com/breecummins/dsgrn_net_gen (2021)
  15. . Dsgrn_Net_Query Available from: https://github.com/breecummins/dsgrn_net_query (2021)
  16. Orlando, D. A., et al. Global control of cell-cycle transcription by coupled CDK and network oscillators. Nature. 453 (7197), 944-947 (2008).
  17. Monteiro, P. T., et al. YEASTRACT+: a portal for cross-species comparative genomics of transcription regulation in yeasts. Nucleic Acids Research. 48 (1), 642-649 (2020).
  18. de Bruin, R. A. M., et al. Constraining G1-specific transcription to late G1 phase: The MBF-associated corepressor Nrm1 acts via negative feedback. Molecular Cell. 23 (4), 483-496 (2006).
  19. Horak, C. E., et al. Complex transcriptional circuitry at the G1/S transition in Saccharomyces cerevisiae. Genes & Development. 16 (23), 3017-3033 (2002).
  20. Cherry, J. M., et al. Saccharomyces genome database: The genomics resource of budding yeast. Nucleic Acids Research. 40, 700-705 (2012).
  21. Zhu, G., et al. Two yeast forkhead genes regulate the cell cycle and pseudohyphal growth. Nature. 406 (6791), 90-94 (2000).
  22. Loy, C. J., Lydall, D., Surana, U. NDD1, a high-dosage suppressor of cdc28-1N, is essential for expression of a subset of late-S-phase-specific genes in saccharomyces cerevisiae. Molecular and Cellular Biology. 19 (5), 3312-3327 (1999).
  23. Cho, C. Y., Kelliher, C. M., Hasse, S. B. The cell-cycle transcriptional network generates and transmits a pulse of transcription once each cell cycle. Cell Cycle. 18 (4), 363-378 (2019).
  24. Smith, L. M., et al. An intrinsic oscillator drives the blood stage cycle of the malaria parasite Plasmodium falciparum. Science. 368 (6492), 754-759 (2020).
check_url/kr/63084?article_type=t

Play Video

Cite This Article
Moseley, R. C., Campione, S., Cummins, B., Motta, F., Haase, S. B. Inherent Dynamics Visualizer, an Interactive Application for Evaluating and Visualizing Outputs from a Gene Regulatory Network Inference Pipeline. J. Vis. Exp. (178), e63084, doi:10.3791/63084 (2021).

View Video