Summary

Inherent Dynamics Visualizer, et interaktivt program til evaluering og visualisering af output fra en Genregulerende Netværksslutningspipeline

Published: December 07, 2021
doi:

Summary

Inherent Dynamics Visualizer er en interaktiv visualiseringspakke, der opretter forbindelse til et genregulerende netværksslutningsværktøj til forbedret, strømlinet generation af funktionelle netværksmodeller. Visualizeren kan bruges til at træffe mere informerede beslutninger om parameterisering af slutningsværktøjet og dermed øge tilliden til de resulterende modeller.

Abstract

Udvikling af genregulerende netværksmodeller er en stor udfordring inden for systembiologi. Flere beregningsværktøjer og pipelines er blevet udviklet til at tackle denne udfordring, herunder den nyudviklede Inherent Dynamics Pipeline. Inherent Dynamics Pipeline består af flere tidligere publicerede værktøjer, der arbejder synergistisk og er forbundet lineært, hvor output fra ét værktøj så bruges som input til følgende værktøj. Som med de fleste beregningsteknikker kræver hvert trin i Inherent Dynamics Pipeline, at brugeren træffer valg om parametre, der ikke har en præcis biologisk definition. Disse valg kan i væsentlig grad påvirke genregulerende netværksmodeller, der produceres af analysen. Af denne grund kan evnen til at visualisere og udforske konsekvenserne af forskellige parametervalg på hvert trin hjælpe med at øge tilliden til valgene og resultaterne. Inherent Dynamics Visualizer er en omfattende visualiseringspakke, der strømliner processen med at evaluere parametervalg via en interaktiv grænseflade i en webbrowser. Brugeren kan separat undersøge outputtet fra hvert trin i pipelinen, foretage intuitive ændringer baseret på visuel information og drage fordel af den automatiske produktion af nødvendige inputfiler til Inherent Dynamics Pipeline. Inherent Dynamics Visualizer giver et uovertruffen niveau af adgang til et meget indviklet værktøj til opdagelse af genregulerende netværk fra tidsserie transkriptomiske data.

Introduction

Mange vigtige biologiske processer, såsom celledifferentiering og miljørespons, styres af sæt gener, der interagerer med hinanden i et genregulerende netværk (GRN). Disse GRN’er producerer den transkriptionelle dynamik, der er nødvendig for at aktivere og vedligeholde den fænotype, de kontrollerer, så identifikation af KOMPONENTERNE og den topologiske struktur i GRN er nøglen til at forstå mange biologiske processer og funktioner. Et GRN kan modelleres som et sæt interagerende gener og/eller genprodukter beskrevet af et netværk, hvis noder er generne, og hvis kanter beskriver retningen og formen for interaktion (f.eks. aktivering/undertrykkelse af transkription, posttranslationel modifikation osv.) 1. Interaktioner kan derefter udtrykkes som parameteriserede matematiske modeller, der beskriver den indvirkning, et regulerende gen har på produktionen af dets mål (er) 2,3,4. Slutning af en GRN-model kræver både en slutning af interaktionsnetværkets struktur og estimering af de underliggende interaktionsparametre. Der er udviklet en række beregningsmæssige slutningsmetoder, der indtager tidsserie-genekspressionsdata og output GRN-modeller5. For nylig blev der udviklet en ny GRN-slutningsmetode, kaldet Inherent Dynamics Pipeline (IDP), der bruger tidsserie-genekspressionsdata til at producere GRN-modeller med mærkede regulator-mål-interaktioner, der er i stand til at producere dynamik, der matcher den observerede dynamik i genekspressionsdataene6. IDP er en række værktøjer, der er forbundet lineært i en pipeline og kan opdeles i tre trin: et Node Finding-trin, der rangerer gener baseret på genekspressionsegenskaber, der er kendt eller mistænkt for at være relateret til funktionen af GRN7,8, et Edge Finding-trin, der rangerer parvise reguleringsforhold8, 9, og et Network Finding-trin, der producerer GRN-modeller, der er i stand til at producere den observerede dynamik10,11,12,13,14,15.

Som de fleste beregningsmetoder kræver IDP et sæt brugerspecificerede argumenter, der dikterer, hvordan inputdataene analyseres, og forskellige sæt argumenter kan producere forskellige resultater på de samme data. For eksempel indeholder flere metoder, herunder IDP, argumenter, der anvender en vis tærskel på dataene, og forøgelse/nedsættelse af denne tærskel mellem successive kørsler af den pågældende metode kan resultere i forskellige resultater mellem kørsler (se supplerende note 10: Netværksslutningsmetoder af5). At forstå, hvordan hvert argument kan påvirke analysen og efterfølgende resultater, er vigtigt for at opnå stor tillid til resultaterne. I modsætning til de fleste GRN-slutningsmetoder består IDP af flere beregningsværktøjer, der hver har sit eget sæt argumenter, som en bruger skal specificere, og hver har sine egne resultater. Mens IDP giver omfattende dokumentation for, hvordan man parameteriserer hvert værktøj, gør hvert værktøjs indbyrdes afhængighed af output fra det foregående trin parameterisering af hele rørledningen uden mellemliggende analyser udfordrende. For eksempel vil argumenter i Trinnene Edge og Network Finding sandsynligvis blive informeret af forudgående biologisk viden og vil derfor afhænge af datasættet og/eller organismen. For at forhøre mellemliggende resultater ville der være behov for en grundlæggende forståelse af programmering samt en dyb forståelse af alle resultatfilerne og deres indhold fra IDP.

IDV (Inherent Dynamics Visualizer) er en interaktiv visualiseringspakke, der kører i en brugers browservindue og giver brugere af IDP mulighed for at vurdere virkningen af deres argumentvalg på resultater fra ethvert trin i IDP’en. IDV navigerer i en kompliceret mappestruktur produceret af IDP og samler de nødvendige data for hvert trin og præsenterer dataene i intuitive og interaktive figurer og tabeller, som brugeren kan udforske. Efter at have udforsket disse interaktive skærme kan brugeren producere nye data fra et IDP-trin, der kan baseres på mere informerede beslutninger. Disse nye data kan derefter straks bruges i det næste respektive trin i IDP. Derudover kan udforskning af dataene hjælpe med at afgøre, om et IDP-trin skal køres igen med justerede parametre. IDV kan forbedre brugen af IDP samt gøre brugen af IDP mere intuitiv og tilgængelig, som det fremgår af at undersøge kerneoscillatoren GRN i gærcellecyklussen. Følgende protokol indeholder IDP-resultater fra en fuldt parameteriseret IDP-kørsel versus en tilgang, der inkorporerer IDV efter kørsler af hvert IDP-trin, dvs. Node, Edge og Network Finding.

Protocol

1. Installer IDP og IDV BEMÆRK: Dette afsnit forudsætter, at docker, conda, pip og git allerede er installeret (Tabel over materialer). Indtast kommandoen i en terminal: git-klon https://gitlab.com/biochron/inherent_dynamics_pipeline.git. Følg installationsvejledningen i IDP’s README-fil. Indtast kommandoen i en terminal: git-klon https://gitlab.com/bertfordley/inherent_dynamics_visualizer.git.BEMÆRK: Kl…

Representative Results

De trin, der er beskrevet tekstmæssigt ovenfor og grafisk i figur 1, blev anvendt på gærcellecyklussens kerneoscillerende GRN for at se, om det er muligt at opdage funktionelle GRN-modeller, der er i stand til at producere den dynamik, der er observeret i tidsserie-genekspressionsdata indsamlet i et gærcellecyklusstudie16. For at illustrere, hvordan IDV kan afklare og forbedre IDP-output, blev resultaterne efter at have udført denne analyse på to måder sammenli…

Discussion

Konklusionen af GRN’er er en vigtig udfordring i systembiologi. IDP genererer model GRN’er fra genekspressionsdata ved hjælp af en række værktøjer, der udnytter dataene på stadig mere komplekse måder. Hvert trin kræver beslutninger om, hvordan dataene skal behandles, og hvilke elementer (gener, funktionelle interaktioner) der overføres til det næste lag af IDP. Virkningerne af disse beslutninger på IDP-resultater er ikke så indlysende. For at hjælpe i denne henseende giver IDV nyttige interaktive visualiserin…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Dette arbejde blev finansieret af NIH-bevillingen R01 GM126555-01 og NSF-bevillingen DMS-1839299.

Materials

Docker https://docs.docker.com/get-docker/
Git https://git-scm.com/
Inherent Dynamics Pipeline https://gitlab.com/biochron/inherent_dynamics_pipeline
Inherent Dynamics Visualizer https://gitlab.com/bertfordley/inherent_dynamics_visualizer
Miniconda https://docs.conda.io/en/latest/miniconda.html
Pip https://pip.pypa.io/en/stable/

References

  1. Karlebach, G., Shamir, R. Modelling and analysis of gene regulatory networks. Nature Reviews Molecular Cell Biology. 9 (10), 770-780 (2008).
  2. Aijö, T., Lähdesmäki, H. Learning gene regulatory networks from gene expression measurements using non-parametric molecular kinetics. Bioinformatics. 25 (22), 2937-2944 (2009).
  3. Huynh-Thu, V. A., Sanguinetti, G. Combining tree-based and dynamical systems for the inference of gene regulatory networks. Bioinformatics. 31 (10), 1614-1622 (2015).
  4. Oates, C. J., et al. Causal network inference using biochemical kinetics. Bioinformatics. 30 (17), 468-474 (2014).
  5. Marbach, D., et al. Wisdom of crowds for robust gene network inference. Nature Methods. 9 (8), 796-804 (2012).
  6. . Inherent Dynamics Pipeline Available from: https://gitlab.com/biochron/inherent_dynamics_pipeline (2021)
  7. Motta, F. C., Moseley, R. C., Cummins, B., Deckard, A., Haase, S. B. Conservation of dynamic characteristics of transcriptional regulatory elements in periodic biological processes. bioRxiv. , (2020).
  8. . LEMpy Available from: https://gitlab.com/biochron/lempy (2021)
  9. McGoff, K. A., et al. The local edge machine: inference of dynamic models of gene regulation. Genome Biology. 17, 214 (2016).
  10. Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. Model rejection and parameter reduction via time series. SIAM Journal on Applied Dynamical Systems. 17 (2), 1589-1616 (2018).
  11. Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. Database of Dynamic Signatures Generated by Regulatory Networks (DSGRN). Lecture Notes in Computer Science. (including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). , 300-308 (2017).
  12. Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. DSGRN: Examining the dynamics of families of logical models. Frontiers in Physiology. 9. 9, 549 (2018).
  13. . DSGRN Available from: https://github.com/marciogameiro/DSGRN (2021)
  14. . Dsgm_Net_Gen Available from: https://github.com/breecummins/dsgrn_net_gen (2021)
  15. . Dsgrn_Net_Query Available from: https://github.com/breecummins/dsgrn_net_query (2021)
  16. Orlando, D. A., et al. Global control of cell-cycle transcription by coupled CDK and network oscillators. Nature. 453 (7197), 944-947 (2008).
  17. Monteiro, P. T., et al. YEASTRACT+: a portal for cross-species comparative genomics of transcription regulation in yeasts. Nucleic Acids Research. 48 (1), 642-649 (2020).
  18. de Bruin, R. A. M., et al. Constraining G1-specific transcription to late G1 phase: The MBF-associated corepressor Nrm1 acts via negative feedback. Molecular Cell. 23 (4), 483-496 (2006).
  19. Horak, C. E., et al. Complex transcriptional circuitry at the G1/S transition in Saccharomyces cerevisiae. Genes & Development. 16 (23), 3017-3033 (2002).
  20. Cherry, J. M., et al. Saccharomyces genome database: The genomics resource of budding yeast. Nucleic Acids Research. 40, 700-705 (2012).
  21. Zhu, G., et al. Two yeast forkhead genes regulate the cell cycle and pseudohyphal growth. Nature. 406 (6791), 90-94 (2000).
  22. Loy, C. J., Lydall, D., Surana, U. NDD1, a high-dosage suppressor of cdc28-1N, is essential for expression of a subset of late-S-phase-specific genes in saccharomyces cerevisiae. Molecular and Cellular Biology. 19 (5), 3312-3327 (1999).
  23. Cho, C. Y., Kelliher, C. M., Hasse, S. B. The cell-cycle transcriptional network generates and transmits a pulse of transcription once each cell cycle. Cell Cycle. 18 (4), 363-378 (2019).
  24. Smith, L. M., et al. An intrinsic oscillator drives the blood stage cycle of the malaria parasite Plasmodium falciparum. Science. 368 (6492), 754-759 (2020).

Play Video

Cite This Article
Moseley, R. C., Campione, S., Cummins, B., Motta, F., Haase, S. B. Inherent Dynamics Visualizer, an Interactive Application for Evaluating and Visualizing Outputs from a Gene Regulatory Network Inference Pipeline. J. Vis. Exp. (178), e63084, doi:10.3791/63084 (2021).

View Video