Summary

Inherent Dynamics Visualizer, een interactieve toepassing voor het evalueren en visualiseren van outputs van een gene regulatory network inference pipeline

Published: December 07, 2021
doi:

Summary

De Inherent Dynamics Visualizer is een interactief visualisatiepakket dat verbinding maakt met een genregulerende netwerkinferentietool voor verbeterde, gestroomlijnde generatie van functionele netwerkmodellen. De visualizer kan worden gebruikt om beter geïnformeerde beslissingen te nemen voor het parametriseren van de inferentietool, waardoor het vertrouwen in de resulterende modellen toeneemt.

Abstract

Het ontwikkelen van genregulerende netwerkmodellen is een grote uitdaging in de systeembiologie. Er zijn verschillende computationele tools en pijplijnen ontwikkeld om deze uitdaging aan te gaan, waaronder de nieuw ontwikkelde Inherent Dynamics Pipeline. De Inherent Dynamics Pipeline bestaat uit verschillende eerder gepubliceerde tools die synergetisch werken en op een lineaire manier met elkaar verbonden zijn, waarbij de output van één tool vervolgens wordt gebruikt als input voor het volgende gereedschap. Zoals met de meeste computationele technieken, vereist elke stap van de Inherent Dynamics Pipeline dat de gebruiker keuzes maakt over parameters die geen precieze biologische definitie hebben. Deze keuzes kunnen een aanzienlijke invloed hebben op genregulerende netwerkmodellen die door de analyse worden geproduceerd. Om deze reden kan het vermogen om de gevolgen van verschillende parameterkeuzes bij elke stap te visualiseren en te verkennen, helpen het vertrouwen in de keuzes en de resultaten te vergroten. De Inherent Dynamics Visualizer is een uitgebreid visualisatiepakket dat het proces van het evalueren van parameterkeuzes stroomlijnt via een interactieve interface in een webbrowser. De gebruiker kan de uitvoer van elke stap van de pijplijn afzonderlijk onderzoeken, intuïtieve wijzigingen aanbrengen op basis van visuele informatie en profiteren van de automatische productie van benodigde invoerbestanden voor de Inherent Dynamics Pipeline. De Inherent Dynamics Visualizer biedt een ongeëvenaard niveau van toegang tot een zeer ingewikkelde tool voor de ontdekking van genregulerende netwerken uit tijdreekstranscriptomische gegevens.

Introduction

Veel belangrijke biologische processen, zoals celdifferentiatie en omgevingsrespons, worden beheerst door sets genen die met elkaar interageren in een genregulerend netwerk (GRN). Deze GRN’s produceren de transcriptionele dynamiek die nodig is voor het activeren en onderhouden van het fenotype dat ze beheersen, dus het identificeren van de componenten en de topologische structuur van de GRN is de sleutel tot het begrijpen van vele biologische processen en functies. Een GRN kan worden gemodelleerd als een set van interagerende genen en/of genproducten beschreven door een netwerk waarvan de knooppunten de genen zijn en waarvan de randen de richting en vorm van interactie beschrijven (bijv. Activering/onderdrukking van transcriptie, posttranslationele modificatie, enz.) 1. Interacties kunnen dan worden uitgedrukt als geparametriseerde wiskundige modellen die de impact beschrijven die een regulerend gen heeft op de productie van zijn doel(en)2,3,4. Inferentie van een GRN-model vereist zowel een gevolgtrekking van de structuur van het interactienetwerk als een schatting van de onderliggende interactieparameters. Er zijn verschillende computationele inferentiemethoden ontwikkeld die tijdreeksgenexpressiegegevens opnemen en GRN-modellen uitvoeren5. Onlangs werd een nieuwe GRN-inferentiemethode ontwikkeld, de Inherent Dynamics Pipeline (IDP), die tijdreeksgenexpressiegegevens gebruikt om GRN-modellen te produceren met gelabelde regulator-doelinteracties die in staat zijn om dynamieken te produceren die overeenkomen met de waargenomen dynamiek in de genexpressiegegevens6. De IDP is een reeks tools die lineair in een pijplijn zijn verbonden en kunnen worden onderverdeeld in drie stappen: een Node Finding-stap die genen rangschikt op basis van genexpressiekenmerken waarvan bekend is of vermoed wordt dat ze verband houden met de functie van de GRN7,8, een Edge Finding-stap die paarsgewijze regulerende relaties rangschikt8, 9, en een netwerkzoekstap die GRN-modellen produceert die in staat zijn om de waargenomen dynamiek10,11,12,13,14,15 te produceren.

Zoals de meeste computationele methoden vereist de IDP een reeks door de gebruiker opgegeven argumenten die bepalen hoe de invoergegevens worden geanalyseerd, en verschillende sets argumenten kunnen verschillende resultaten opleveren voor dezelfde gegevens. Verschillende methoden, waaronder de IDP, bevatten bijvoorbeeld argumenten die een bepaalde drempel op de gegevens toepassen, en het verhogen/verlagen van deze drempel tussen opeenvolgende uitvoeringen van de specifieke methode kan leiden tot ongelijke resultaten tussen uitvoeringen (zie Supplement Note 10: Netwerkinferentiemethoden van 5). Begrijpen hoe elk argument de analyse en de daaropvolgende resultaten kan beïnvloeden, is belangrijk voor het bereiken van een hoog vertrouwen in de resultaten. In tegenstelling tot de meeste GRN-inferentiemethoden bestaat de IDP uit meerdere rekenhulpmiddelen, elk met een eigen set argumenten die een gebruiker moet opgeven en elk met zijn eigen resultaten. Hoewel de IDP uitgebreide documentatie biedt over het parametriseren van elke tool, maakt de onderlinge afhankelijkheid van elke tool op de uitvoer van de vorige stap het parametriseren van de hele pijplijn zonder tussentijdse analyses een uitdaging. Argumenten in de edge- en netwerkzoekstappen zijn bijvoorbeeld waarschijnlijk gebaseerd op biologische voorkennis en zijn dus afhankelijk van de dataset en / of het organisme. Om tussentijdse resultaten te ondervragen, zou een basiskennis van programmeren nodig zijn, evenals een diep begrip van alle resultaatbestanden en hun inhoud van de IDP.

De Inherent Dynamics Visualizer (IDV) is een interactief visualisatiepakket dat wordt uitgevoerd in het browservenster van een gebruiker en een manier biedt voor gebruikers van de IDP om de impact van hun argumentkeuzes op resultaten van elke stap in de IDP te beoordelen. De IDV navigeert door een gecompliceerde directorystructuur geproduceerd door de IDP en verzamelt de nodige gegevens voor elke stap en presenteert de gegevens in intuïtieve en interactieve figuren en tabellen die de gebruiker kan verkennen. Na het verkennen van deze interactieve displays kan de gebruiker nieuwe gegevens produceren uit een IDP-stap die kan worden gebaseerd op beter geïnformeerde beslissingen. Deze nieuwe gegevens kunnen vervolgens onmiddellijk worden gebruikt in de volgende stap van het IDP. Bovendien kan verkenning van de gegevens helpen bepalen of een IDP-stap opnieuw moet worden uitgevoerd met aangepaste parameters. De IDV kan het gebruik van de IDP verbeteren en het gebruik van de IDP intuïtiever en toegankelijker maken, zoals aangetoond door de kernoscillator GRN van de gistcelcyclus te onderzoeken. Het volgende protocol bevat IDP-resultaten van een volledig geparametriseerde IDP-run versus een aanpak die de IDV na uitvoeringen van elke IDP-stap bevat, d.w.z. Node, Edge en Network Finding.

Protocol

1. Installeer de IDP en IDV OPMERKING: In deze sectie wordt ervan uitgegaan dat docker, conda, pip en git al zijn geïnstalleerd (Tabel met materialen). Voer in een terminal het commando in: git clone https://gitlab.com/biochron/inherent_dynamics_pipeline.git. Volg de installatie-instructies in het README-bestand van de IDP. Voer in een terminal het commando in: git clone https://gitlab.com/bertfordley/inherent_dynam…

Representative Results

De hierboven en grafisch beschreven stappen in figuur 1 werden toegepast op de kern oscillerende GRN van de gistcelcyclus om te zien of het mogelijk is om functionele GRN-modellen te ontdekken die in staat zijn om de dynamiek te produceren die is waargenomen in tijdreeksgenexpressiegegevens verzameld in een gistcelcyclusstudie16. Om te illustreren hoe de IDV de IDP-output kan verduidelijken en verbeteren, werden de resultaten, na het uitvoeren van deze analyse op twee…

Discussion

De gevolgtrekking van GRN’s is een belangrijke uitdaging in de systeembiologie. De IDP genereert model-GRN’s op basis van genexpressiegegevens met behulp van een reeks hulpmiddelen die de gegevens op steeds complexere manieren gebruiken. Elke stap vereist beslissingen over hoe de gegevens te verwerken en welke elementen (genen, functionele interacties) zullen worden doorgegeven aan de volgende laag van de IDP. De gevolgen van deze beslissingen voor de resultaten van het IDP zijn niet zo duidelijk. Om hierbij te helpen, b…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Dit werk werd gefinancierd door de NIH-subsidie R01 GM126555-01 en NSF-subsidie DMS-1839299.

Materials

Docker https://docs.docker.com/get-docker/
Git https://git-scm.com/
Inherent Dynamics Pipeline https://gitlab.com/biochron/inherent_dynamics_pipeline
Inherent Dynamics Visualizer https://gitlab.com/bertfordley/inherent_dynamics_visualizer
Miniconda https://docs.conda.io/en/latest/miniconda.html
Pip https://pip.pypa.io/en/stable/

References

  1. Karlebach, G., Shamir, R. Modelling and analysis of gene regulatory networks. Nature Reviews Molecular Cell Biology. 9 (10), 770-780 (2008).
  2. Aijö, T., Lähdesmäki, H. Learning gene regulatory networks from gene expression measurements using non-parametric molecular kinetics. Bioinformatics. 25 (22), 2937-2944 (2009).
  3. Huynh-Thu, V. A., Sanguinetti, G. Combining tree-based and dynamical systems for the inference of gene regulatory networks. Bioinformatics. 31 (10), 1614-1622 (2015).
  4. Oates, C. J., et al. Causal network inference using biochemical kinetics. Bioinformatics. 30 (17), 468-474 (2014).
  5. Marbach, D., et al. Wisdom of crowds for robust gene network inference. Nature Methods. 9 (8), 796-804 (2012).
  6. . Inherent Dynamics Pipeline Available from: https://gitlab.com/biochron/inherent_dynamics_pipeline (2021)
  7. Motta, F. C., Moseley, R. C., Cummins, B., Deckard, A., Haase, S. B. Conservation of dynamic characteristics of transcriptional regulatory elements in periodic biological processes. bioRxiv. , (2020).
  8. . LEMpy Available from: https://gitlab.com/biochron/lempy (2021)
  9. McGoff, K. A., et al. The local edge machine: inference of dynamic models of gene regulation. Genome Biology. 17, 214 (2016).
  10. Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. Model rejection and parameter reduction via time series. SIAM Journal on Applied Dynamical Systems. 17 (2), 1589-1616 (2018).
  11. Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. Database of Dynamic Signatures Generated by Regulatory Networks (DSGRN). Lecture Notes in Computer Science. (including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). , 300-308 (2017).
  12. Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. DSGRN: Examining the dynamics of families of logical models. Frontiers in Physiology. 9. 9, 549 (2018).
  13. . DSGRN Available from: https://github.com/marciogameiro/DSGRN (2021)
  14. . Dsgm_Net_Gen Available from: https://github.com/breecummins/dsgrn_net_gen (2021)
  15. . Dsgrn_Net_Query Available from: https://github.com/breecummins/dsgrn_net_query (2021)
  16. Orlando, D. A., et al. Global control of cell-cycle transcription by coupled CDK and network oscillators. Nature. 453 (7197), 944-947 (2008).
  17. Monteiro, P. T., et al. YEASTRACT+: a portal for cross-species comparative genomics of transcription regulation in yeasts. Nucleic Acids Research. 48 (1), 642-649 (2020).
  18. de Bruin, R. A. M., et al. Constraining G1-specific transcription to late G1 phase: The MBF-associated corepressor Nrm1 acts via negative feedback. Molecular Cell. 23 (4), 483-496 (2006).
  19. Horak, C. E., et al. Complex transcriptional circuitry at the G1/S transition in Saccharomyces cerevisiae. Genes & Development. 16 (23), 3017-3033 (2002).
  20. Cherry, J. M., et al. Saccharomyces genome database: The genomics resource of budding yeast. Nucleic Acids Research. 40, 700-705 (2012).
  21. Zhu, G., et al. Two yeast forkhead genes regulate the cell cycle and pseudohyphal growth. Nature. 406 (6791), 90-94 (2000).
  22. Loy, C. J., Lydall, D., Surana, U. NDD1, a high-dosage suppressor of cdc28-1N, is essential for expression of a subset of late-S-phase-specific genes in saccharomyces cerevisiae. Molecular and Cellular Biology. 19 (5), 3312-3327 (1999).
  23. Cho, C. Y., Kelliher, C. M., Hasse, S. B. The cell-cycle transcriptional network generates and transmits a pulse of transcription once each cell cycle. Cell Cycle. 18 (4), 363-378 (2019).
  24. Smith, L. M., et al. An intrinsic oscillator drives the blood stage cycle of the malaria parasite Plasmodium falciparum. Science. 368 (6492), 754-759 (2020).
check_url/kr/63084?article_type=t

Play Video

Cite This Article
Moseley, R. C., Campione, S., Cummins, B., Motta, F., Haase, S. B. Inherent Dynamics Visualizer, an Interactive Application for Evaluating and Visualizing Outputs from a Gene Regulatory Network Inference Pipeline. J. Vis. Exp. (178), e63084, doi:10.3791/63084 (2021).

View Video