Inherent Dynamics Visualizer est un ensemble de visualisation interactif qui se connecte à un outil d’inférence de réseau de régulation génique pour une génération améliorée et rationalisée de modèles de réseau fonctionnels. Le visualiseur peut être utilisé pour prendre des décisions plus éclairées pour paramétrer l’outil d’inférence, augmentant ainsi la confiance dans les modèles résultants.
Le développement de modèles de réseaux de régulation génique est un défi majeur en biologie des systèmes. Plusieurs outils de calcul et pipelines ont été développés pour relever ce défi, y compris le nouveau pipeline Inherent Dynamics. Le pipeline Inherent Dynamics se compose de plusieurs outils précédemment publiés qui fonctionnent en synergie et sont connectés de manière linéaire, où la sortie d’un outil est ensuite utilisée comme entrée pour l’outil suivant. Comme pour la plupart des techniques de calcul, chaque étape du pipeline Inherent Dynamics nécessite que l’utilisateur fasse des choix sur des paramètres qui n’ont pas de définition biologique précise. Ces choix peuvent avoir un impact considérable sur les modèles de réseaux de régulation des gènes produits par l’analyse. Pour cette raison, la capacité de visualiser et d’explorer les conséquences de divers choix de paramètres à chaque étape peut aider à accroître la confiance dans les choix et les résultats. Inherent Dynamics Visualizer est un package de visualisation complet qui rationalise le processus d’évaluation des choix de paramètres via une interface interactive dans un navigateur Web. L’utilisateur peut examiner séparément la sortie de chaque étape du pipeline, apporter des modifications intuitives en fonction d’informations visuelles et bénéficier de la production automatique des fichiers d’entrée nécessaires pour le pipeline Inherent Dynamics. Le visualiseur Inherent Dynamics offre un niveau d’accès inégalé à un outil très complexe pour la découverte de réseaux de régulation génique à partir de données transcriptomiques de séries chronologiques.
De nombreux processus biologiques importants, tels que la différenciation cellulaire et la réponse environnementale, sont régis par des ensembles de gènes qui interagissent les uns avec les autres dans un réseau de régulation des gènes (GRN). Ces GRN produisent la dynamique transcriptionnelle nécessaire à l’activation et au maintien du phénotype qu’ils contrôlent, de sorte que l’identification des composants et de la structure topologique du GRN est essentielle pour comprendre de nombreux processus et fonctions biologiques. Un GRN peut être modélisé comme un ensemble de gènes en interaction et/ou de produits géniques décrits par un réseau dont les nœuds sont les gènes et dont les bords décrivent la direction et la forme de l’interaction (par exemple, activation/répression de la transcription, modification post-traductionnelle, etc.) 1. Les interactions peuvent ensuite être exprimées sous forme de modèles mathématiques paramétrés décrivant l’impact d’un gène régulateur sur la production de sa ou ses cibles 2,3,4. L’inférence d’un modèle GRN nécessite à la fois une inférence de la structure du réseau d’interaction et une estimation des paramètres d’interaction sous-jacents. Diverses méthodes d’inférence computationnelle ont été mises au point pour ingérer des données d’expression génique de séries chronologiques et produire des modèles GRN5. Récemment, une nouvelle méthode d’inférence GRN a été développée, appelée Inherent Dynamics Pipeline (IDP), qui utilise des données d’expression génique de séries chronologiques pour produire des modèles GRN avec des interactions régulateur-cible marquées capables de produire une dynamique qui correspond à la dynamique observée dans les données d’expression génique6. L’IDP est une suite d’outils connectés linéairement dans un pipeline et peut être décomposé en trois étapes : une étape de recherche de nœud qui classe les gènes en fonction des caractéristiques d’expression génique connues ou soupçonnées d’être liées à la fonction du GRN7,8, une étape de recherche de périphérie qui classe les relations réglementaires par paires8, 9, et une étape de recherche de réseau qui produit des modèles GRN capables de produire la dynamique observée10,11,12,13,14,15.
Comme la plupart des méthodes de calcul, l’IDP nécessite un ensemble d’arguments spécifiés par l’utilisateur qui dictent la façon dont les données d’entrée sont analysées, et différents ensembles d’arguments peuvent produire des résultats différents sur les mêmes données. Par exemple, plusieurs méthodes, y compris l’IDP, contiennent des arguments qui appliquent un certain seuil sur les données, et l’augmentation/diminution de ce seuil entre les exécutions successives de la méthode particulière peut entraîner des résultats différents entre les exécutions (voir la note supplémentaire 10 : Méthodes d’inférence réseau de5). Comprendre comment chaque argument peut avoir une incidence sur l’analyse et les résultats ultérieurs est important pour obtenir une grande confiance dans les résultats. Contrairement à la plupart des méthodes d’inférence GRN, l’IDP se compose de plusieurs outils de calcul, chacun ayant son propre ensemble d’arguments qu’un utilisateur doit spécifier et chacun ayant ses propres résultats. Bien que l’IDP fournisse une documentation complète sur la façon de paramétrer chaque outil, l’interdépendance de chaque outil sur la sortie de l’étape précédente rend difficile le paramétrage de l’ensemble du pipeline sans analyses intermédiaires. Par exemple, les arguments dans les étapes Edge et Network Finding sont susceptibles d’être éclairés par des connaissances biologiques antérieures, et dépendront donc de l’ensemble de données et / ou de l’organisme. Pour interroger les résultats intermédiaires, une compréhension de base de la programmation, ainsi qu’une compréhension approfondie de tous les fichiers de résultats et de leur contenu de l’IDP, seraient nécessaires.
L’Inherent Dynamics Visualizer (IDV) est un package de visualisation interactif qui s’exécute dans la fenêtre du navigateur d’un utilisateur et permet aux utilisateurs de l’IDP d’évaluer l’impact de leurs choix d’arguments sur les résultats de n’importe quelle étape de l’IDP. L’IDV navigue dans une structure de répertoires complexe produite par l’IDP et recueille les données nécessaires pour chaque étape et présente les données dans des figures et des tableaux intuitifs et interactifs que l’utilisateur peut explorer. Après avoir exploré ces écrans interactifs, l’utilisateur peut produire de nouvelles données à partir d’une étape IDP qui peuvent être basées sur des décisions plus éclairées. Ces nouvelles données peuvent ensuite être immédiatement utilisées à l’étape suivante de l’IDP. En outre, l’exploration des données peut aider à déterminer si une étape IDP doit être réexécutée avec des paramètres ajustés. L’IDV peut améliorer l’utilisation de l’IDP, ainsi que rendre l’utilisation de l’IDP plus intuitive et accessible, comme l’a démontré l’étude de l’oscillateur central GRN du cycle cellulaire de la levure. Le protocole suivant inclut les résultats IDP d’une exécution IDP entièrement paramétrée par rapport à une approche qui incorpore l’IDV après les exécutions de chaque étape IDP, c’est-à-dire Node, Edge et Network Finding.
L’inférence des GRN est un défi important en biologie des systèmes. L’IDP génère des GRN modèles à partir de données d’expression génique à l’aide d’une séquence d’outils qui utilisent les données de manière de plus en plus complexe. Chaque étape nécessite des décisions sur la façon de traiter les données et quels éléments (gènes, interactions fonctionnelles) seront transmis à la couche suivante de l’IDP. Les répercussions de ces décisions sur les résultats des PDI ne sont pas aussi…
The authors have nothing to disclose.
Ce travail a été financé par la subvention NIH R01 GM126555-01 et la subvention NSF DMS-1839299.
Docker | https://docs.docker.com/get-docker/ | ||
Git | https://git-scm.com/ | ||
Inherent Dynamics Pipeline | https://gitlab.com/biochron/inherent_dynamics_pipeline | ||
Inherent Dynamics Visualizer | https://gitlab.com/bertfordley/inherent_dynamics_visualizer | ||
Miniconda | https://docs.conda.io/en/latest/miniconda.html | ||
Pip | https://pip.pypa.io/en/stable/ |