Summary

Inherent Dynamics Visualizer, eine interaktive Anwendung zur Bewertung und Visualisierung von Ergebnissen aus einer Gene Regulatory Network Inference Pipeline

Published: December 07, 2021
doi:

Summary

Der Inherent Dynamics Visualizer ist ein interaktives Visualisierungspaket, das mit einem Genregulationsnetzwerk-Inferenzwerkzeug verbunden ist, um eine verbesserte, optimierte Generierung funktionaler Netzwerkmodelle zu ermöglichen. Der Visualizer kann verwendet werden, um fundiertere Entscheidungen für die Parametrisierung des Inferenzwerkzeugs zu treffen und so das Vertrauen in die resultierenden Modelle zu erhöhen.

Abstract

Die Entwicklung von genregulatorischen Netzwerkmodellen ist eine große Herausforderung in der Systembiologie. Mehrere Rechenwerkzeuge und Pipelines wurden entwickelt, um diese Herausforderung zu bewältigen, einschließlich der neu entwickelten Inherent Dynamics Pipeline. Die Inherent Dynamics Pipeline besteht aus mehreren zuvor veröffentlichten Tools, die synergistisch arbeiten und linear miteinander verbunden sind, wobei die Ausgabe eines Tools dann als Eingabe für das folgende Tool verwendet wird. Wie bei den meisten Berechnungstechniken erfordert jeder Schritt der Inherent Dynamics Pipeline, dass der Benutzer Entscheidungen über Parameter trifft, die keine genaue biologische Definition haben. Diese Entscheidungen können sich wesentlich auf die durch die Analyse erzeugten modelle des genregulatorischen Netzwerks auswirken. Aus diesem Grund kann die Fähigkeit, die Konsequenzen verschiedener Parameterauswahlen bei jedem Schritt zu visualisieren und zu untersuchen, dazu beitragen, das Vertrauen in die Entscheidungen und die Ergebnisse zu erhöhen. Der Inherent Dynamics Visualizer ist ein umfassendes Visualisierungspaket, das den Prozess der Bewertung der Parameterauswahl über eine interaktive Schnittstelle in einem Webbrowser rationalisiert. Der Benutzer kann die Ausgabe jedes Schritts der Pipeline separat untersuchen, intuitive Änderungen basierend auf visuellen Informationen vornehmen und von der automatischen Erstellung der erforderlichen Eingabedateien für die Inherent Dynamics Pipeline profitieren. Der Inherent Dynamics Visualizer bietet einen beispiellosen Zugang zu einem hochkomplizierten Werkzeug zur Entdeckung von genregulatorischen Netzwerken aus transkriptomischen Zeitreihendaten.

Introduction

Viele wichtige biologische Prozesse, wie Zelldifferenzierung und Umweltreaktion, werden von Gensätzen gesteuert, die in einem genregulatorischen Netzwerk (GRN) miteinander interagieren. Diese GRNs erzeugen die Transkriptionsdynamik, die für die Aktivierung und Aufrechterhaltung des von ihnen kontrollierten Phänotyps erforderlich ist, so dass die Identifizierung der Komponenten und der topologischen Struktur der GRN der Schlüssel zum Verständnis vieler biologischer Prozesse und Funktionen ist. Eine GRN kann als eine Reihe von interagierenden Genen und/oder Genprodukten modelliert werden, die durch ein Netzwerk beschrieben werden, dessen Knoten die Gene sind und dessen Kanten die Richtung und Form der Interaktion beschreiben (z. B. Aktivierung/Unterdrückung der Transkription, posttranslationale Modifikation usw.). 1. Interaktionen können dann als parametrisierte mathematische Modelle ausgedrückt werden, die den Einfluss beschreiben, den ein regulierendes Gen auf die Produktion seiner Ziele hat2,3,4. Die Inferenz eines GRN-Modells erfordert sowohl eine Inferenz der Struktur des Interaktionsnetzwerks als auch eine Schätzung der zugrunde liegenden Interaktionsparameter. Es wurde eine Vielzahl von computergestützten Inferenzmethoden entwickelt, die Zeitreihen-Genexpressionsdaten aufnehmen und GRN-Modelle ausgeben5. Vor kurzem wurde eine neue GRN-Inferenzmethode namens Inherent Dynamics Pipeline (IDP) entwickelt, die Zeitreihen-Genexpressionsdaten verwendet, um GRN-Modelle mit markierten Regulator-Ziel-Interaktionen zu erzeugen, die in der Lage sind, Dynamiken zu erzeugen, die der beobachteten Dynamik in den Genexpressionsdaten entsprechen6. Der IDP ist eine Suite von Werkzeugen, die linear in eine Pipeline eingebunden sind und in drei Schritte unterteilt werden können: ein Node-Finding-Schritt, der Gene basierend auf Genexpressionsmerkmalen einstuft, von denen bekannt ist oder vermutet wird, dass sie mit der Funktion des GRN7,8 zusammenhängen, ein Edge Finding-Schritt, der paarweise regulatorische Beziehungen bewertet8, 9 und ein Netzwerkfindungsschritt, der GRN-Modelle erzeugt, die in der Lage sind, die beobachtete Dynamik zu erzeugen10,11,12,13,14,15.

Wie die meisten Berechnungsmethoden erfordert der IDP eine Reihe von benutzerdefinierten Argumenten, die bestimmen, wie die Eingabedaten analysiert werden, und verschiedene Satz von Argumenten können unterschiedliche Ergebnisse für dieselben Daten liefern. Beispielsweise enthalten mehrere Methoden, einschließlich des IDP, Argumente, die einen Schwellenwert auf die Daten anwenden, und das Erhöhen/Verringern dieses Schwellenwerts zwischen aufeinanderfolgenden Ausführungen der jeweiligen Methode kann zu unterschiedlichen Ergebnissen zwischen den Durchläufen führen (siehe Ergänzungshinweis 10: Netzwerkinferenzmethoden von5). Zu verstehen, wie sich jedes Argument auf die Analyse und die nachfolgenden Ergebnisse auswirken kann, ist wichtig, um ein hohes Vertrauen in die Ergebnisse zu erreichen. Im Gegensatz zu den meisten GRN-Inferenzmethoden besteht der IDP aus mehreren Rechenwerkzeugen, von denen jedes seinen eigenen Satz von Argumenten hat, die ein Benutzer angeben muss, und jedes hat seine eigenen Ergebnisse. Während der IDP eine umfangreiche Dokumentation zur Parametrisierung der einzelnen Werkzeuge bereitstellt, macht die gegenseitige Abhängigkeit jedes Werkzeugs von der Ausgabe des vorherigen Schritts die Parametrierung der gesamten Pipeline ohne Zwischenanalysen zu einer Herausforderung. Beispielsweise basieren Argumente in den Schritten Edge und Network Finding wahrscheinlich auf biologischem Vorwissen und hängen daher vom Datensatz und/oder Organismus ab. Um Zwischenergebnisse abzufragen, wäre ein grundlegendes Verständnis der Programmierung sowie ein tiefes Verständnis aller Ergebnisdateien und ihrer Inhalte aus dem IDP erforderlich.

Der Inherent Dynamics Visualizer (IDV) ist ein interaktives Visualisierungspaket, das im Browserfenster eines Benutzers ausgeführt wird und Benutzern des IDP die Möglichkeit bietet, die Auswirkungen ihrer Argumentauswahl auf die Ergebnisse eines beliebigen Schritts im IDP zu bewerten. Der IDV navigiert durch eine komplizierte Verzeichnisstruktur, die vom IDP erzeugt wird, sammelt die notwendigen Daten für jeden Schritt und präsentiert die Daten in intuitiven und interaktiven Abbildungen und Tabellen, die der Benutzer erkunden kann. Nach dem Erkunden dieser interaktiven Displays kann der Benutzer neue Daten aus einem IDP-Schritt erstellen, die auf fundierteren Entscheidungen basieren können. Diese neuen Daten können dann sofort im nächsten entsprechenden Schritt des IDP verwendet werden. Darüber hinaus kann die Untersuchung der Daten helfen zu bestimmen, ob ein IDP-Schritt mit angepassten Parametern erneut ausgeführt werden sollte. Das IDV kann die Verwendung des IDP verbessern sowie die Verwendung des IDP intuitiver und zugänglicher machen, wie die Untersuchung des Kernoszillators GRN des Hefezellzyklus zeigt. Das folgende Protokoll enthält IDP-Ergebnisse aus einer vollständig parametrisierten IDP-Ausführung im Gegensatz zu einem Ansatz, der den IDV nach Den Ausführungen jedes IDP-Schritts, d. h. Knoten-, Edge- und Netzwerksuche, enthält.

Protocol

1. Installieren Sie den IDP und IDV HINWEIS: In diesem Abschnitt wird davon ausgegangen, dass docker, conda, pip und git bereits installiert sind (Tabelle der Materialien). Geben Sie in einem Terminal den folgenden Befehl ein: git clone https://gitlab.com/biochron/inherent_dynamics_pipeline.git. Befolgen Sie die Installationsanweisungen in der README-Datei des IDP. Geben Sie in einem Terminal den Folgenden ein: git c…

Representative Results

Die oben und grafisch in Abbildung 1 beschriebenen Schritte wurden auf den oszillierenden Kern-GRN des Hefezellzyklus angewendet, um zu sehen, ob es möglich ist, funktionelle GRN-Modelle zu entdecken, die in der Lage sind, die Dynamik zu erzeugen, die in Zeitreihen-Genexpressionsdaten beobachtet wurde, die in einer Hefezellzyklusstudie gesammelt wurden16. Um zu veranschaulichen, wie der IDV den IDP-Output klären und verbessern kann, wurden die Ergebnisse nach der Du…

Discussion

Die Inferenz von GRNs ist eine wichtige Herausforderung in der Systembiologie. Der IDP generiert Modell-GRNs aus Genexpressionsdaten mit einer Abfolge von Werkzeugen, die die Daten auf immer komplexere Weise nutzen. Jeder Schritt erfordert Entscheidungen darüber, wie die Daten verarbeitet werden sollen und welche Elemente (Gene, funktionelle Interaktionen) an die nächste Schicht des IDP übergeben werden. Die Auswirkungen dieser Entscheidungen auf die Ergebnisse von Binnenvertriebenen sind nicht so offensichtlich. Um d…

Divulgations

The authors have nothing to disclose.

Acknowledgements

Diese Arbeit wurde durch den NIH-Zuschuss R01 GM126555-01 und den NSF-Zuschuss DMS-1839299 finanziert.

Materials

Docker https://docs.docker.com/get-docker/
Git https://git-scm.com/
Inherent Dynamics Pipeline https://gitlab.com/biochron/inherent_dynamics_pipeline
Inherent Dynamics Visualizer https://gitlab.com/bertfordley/inherent_dynamics_visualizer
Miniconda https://docs.conda.io/en/latest/miniconda.html
Pip https://pip.pypa.io/en/stable/

References

  1. Karlebach, G., Shamir, R. Modelling and analysis of gene regulatory networks. Nature Reviews Molecular Cell Biology. 9 (10), 770-780 (2008).
  2. Aijö, T., Lähdesmäki, H. Learning gene regulatory networks from gene expression measurements using non-parametric molecular kinetics. Bioinformatics. 25 (22), 2937-2944 (2009).
  3. Huynh-Thu, V. A., Sanguinetti, G. Combining tree-based and dynamical systems for the inference of gene regulatory networks. Bioinformatics. 31 (10), 1614-1622 (2015).
  4. Oates, C. J., et al. Causal network inference using biochemical kinetics. Bioinformatics. 30 (17), 468-474 (2014).
  5. Marbach, D., et al. Wisdom of crowds for robust gene network inference. Nature Methods. 9 (8), 796-804 (2012).
  6. . Inherent Dynamics Pipeline Available from: https://gitlab.com/biochron/inherent_dynamics_pipeline (2021)
  7. Motta, F. C., Moseley, R. C., Cummins, B., Deckard, A., Haase, S. B. Conservation of dynamic characteristics of transcriptional regulatory elements in periodic biological processes. bioRxiv. , (2020).
  8. . LEMpy Available from: https://gitlab.com/biochron/lempy (2021)
  9. McGoff, K. A., et al. The local edge machine: inference of dynamic models of gene regulation. Genome Biology. 17, 214 (2016).
  10. Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. Model rejection and parameter reduction via time series. SIAM Journal on Applied Dynamical Systems. 17 (2), 1589-1616 (2018).
  11. Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. Database of Dynamic Signatures Generated by Regulatory Networks (DSGRN). Lecture Notes in Computer Science. (including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). , 300-308 (2017).
  12. Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. DSGRN: Examining the dynamics of families of logical models. Frontiers in Physiology. 9. 9, 549 (2018).
  13. . DSGRN Available from: https://github.com/marciogameiro/DSGRN (2021)
  14. . Dsgm_Net_Gen Available from: https://github.com/breecummins/dsgrn_net_gen (2021)
  15. . Dsgrn_Net_Query Available from: https://github.com/breecummins/dsgrn_net_query (2021)
  16. Orlando, D. A., et al. Global control of cell-cycle transcription by coupled CDK and network oscillators. Nature. 453 (7197), 944-947 (2008).
  17. Monteiro, P. T., et al. YEASTRACT+: a portal for cross-species comparative genomics of transcription regulation in yeasts. Nucleic Acids Research. 48 (1), 642-649 (2020).
  18. de Bruin, R. A. M., et al. Constraining G1-specific transcription to late G1 phase: The MBF-associated corepressor Nrm1 acts via negative feedback. Molecular Cell. 23 (4), 483-496 (2006).
  19. Horak, C. E., et al. Complex transcriptional circuitry at the G1/S transition in Saccharomyces cerevisiae. Genes & Development. 16 (23), 3017-3033 (2002).
  20. Cherry, J. M., et al. Saccharomyces genome database: The genomics resource of budding yeast. Nucleic Acids Research. 40, 700-705 (2012).
  21. Zhu, G., et al. Two yeast forkhead genes regulate the cell cycle and pseudohyphal growth. Nature. 406 (6791), 90-94 (2000).
  22. Loy, C. J., Lydall, D., Surana, U. NDD1, a high-dosage suppressor of cdc28-1N, is essential for expression of a subset of late-S-phase-specific genes in saccharomyces cerevisiae. Molecular and Cellular Biology. 19 (5), 3312-3327 (1999).
  23. Cho, C. Y., Kelliher, C. M., Hasse, S. B. The cell-cycle transcriptional network generates and transmits a pulse of transcription once each cell cycle. Cell Cycle. 18 (4), 363-378 (2019).
  24. Smith, L. M., et al. An intrinsic oscillator drives the blood stage cycle of the malaria parasite Plasmodium falciparum. Science. 368 (6492), 754-759 (2020).
check_url/fr/63084?article_type=t

Play Video

Citer Cet Article
Moseley, R. C., Campione, S., Cummins, B., Motta, F., Haase, S. B. Inherent Dynamics Visualizer, an Interactive Application for Evaluating and Visualizing Outputs from a Gene Regulatory Network Inference Pipeline. J. Vis. Exp. (178), e63084, doi:10.3791/63084 (2021).

View Video