Summary

Iboende Dynamics Visualizer, et interaktivt program for evaluering og visualisering av utdata fra en datasamlebånd for genregulatoriske nettverk

Published: December 07, 2021
doi:

Summary

Inherent Dynamics Visualizer er en interaktiv visualiseringspakke som kobles til et genregulatoriske nettverksinnledningsverktøy for forbedret, strømlinjeformet generering av funksjonelle nettverksmodeller. Visualisatoren kan brukes til å ta mer informerte beslutninger for å parameterisere inferensverktøyet, og dermed øke tilliten til de resulterende modellene.

Abstract

Utvikling av genregulatoriske nettverksmodeller er en stor utfordring i systembiologi. Flere beregningsverktøy og rørledninger er utviklet for å takle denne utfordringen, inkludert den nyutviklede Inherent Dynamics Pipeline. Inherent Dynamics Pipeline består av flere tidligere publiserte verktøy som fungerer synergistisk og er koblet sammen på en lineær måte, der utdataene for ett verktøy deretter brukes som inndata for følgende verktøy. På samme måte som med de fleste beregningsteknikker, krever hvert trinn i Inherent Dynamics Pipeline at brukeren tar valg om parametere som ikke har en nøyaktig biologisk definisjon. Disse valgene kan ha stor innvirkning på genregulatoriske nettverksmodeller produsert av analysen. Av denne grunn kan evnen til å visualisere og utforske konsekvensene av ulike parametervalg på hvert trinn bidra til å øke tilliten til valgene og resultatene. Inherent Dynamics Visualizer er en omfattende visualiseringspakke som effektiviserer prosessen med å evaluere parametervalg gjennom et interaktivt grensesnitt i en nettleser. Brukeren kan undersøke utdataene for hvert trinn i datasamlebåndet separat, gjøre intuitive endringer basert på visuell informasjon og dra nytte av automatisk produksjon av nødvendige inndatafiler for Inherent Dynamics Pipeline. Inherent Dynamics Visualizer gir et enestående tilgangsnivå til et svært intrikat verktøy for oppdagelsen av genregulatoriske nettverk fra tidsserietranskrimiske data.

Introduction

Mange viktige biologiske prosesser, som celledifferensiering og miljørespons, styres av sett med gener som samhandler med hverandre i et genregulatorisk nettverk (GRN). Disse GRN-ene produserer transkripsjonsdynamikken som trengs for å aktivere og vedlikeholde fenotypen de kontrollerer, så identifisering av komponentene og topologisk struktur av GRN er nøkkelen til å forstå mange biologiske prosesser og funksjoner. Et GRN kan modelleres som et sett med interagerende gener og/eller genprodukter beskrevet av et nettverk hvis noder er genene, og hvis kanter beskriver retningen og formen for interaksjon (f.eks. aktivering/undertrykkelse av transkripsjon, postoversettelsesendring osv.) 1. Interaksjoner kan deretter uttrykkes som parameteriserte matematiske modeller som beskriver hvilken innvirkning et regulerende gen har på produksjonen av målet (e) 2,3,4. Slutning av en GRN-modell krever både en slutning av strukturen i samhandlingsnettverket og estimering av de underliggende samhandlingsparametrene. Det er utviklet en rekke beregningsmetoder for inferens som inntar tidsserier med genuttrykksdata og utdata fra GRN-modeller5. Nylig ble det utviklet en ny GRN-inferensmetode, kalt Inherent Dynamics Pipeline (IDP), som bruker genuttrykksdata for tidsserier til å produsere GRN-modeller med merkede regulatoriske målinteraksjoner som er i stand til å produsere dynamikk som samsvarer med den observerte dynamikken i genuttrykksdataene6. IDP er en pakke med verktøy koblet lineært inn i en rørledning og kan deles inn i tre trinn: et Node Finding-trinn som rangerer gener basert på genuttrykkskarakteristikker kjent eller mistenkt for å være relatert til funksjonen til GRN7,8, et Edge Finding-trinn som rangerer parvis regulatoriske relasjoner8, 9, og et trinn for nettverksfunn som produserer GRN-modeller som er i stand til å produsere den observerte dynamikken10,11,12,13,14,15.

På samme måte som de fleste beregningsmetoder krever IDP et sett med brukerangitte argumenter som dikterer hvordan inndata analyseres, og forskjellige sett med argumenter kan gi forskjellige resultater på de samme dataene. Flere metoder, inkludert IDP, inneholder for eksempel argumenter som bruker en viss terskel på dataene, og hvis du øker/reduserer denne terskelen mellom etterfølgende kjøringer av den bestemte metoden, kan det føre til ulike resultater mellom kjøringer (se Supplement Note 10: Network inference methods of5). Å forstå hvordan hvert argument kan påvirke analysen og påfølgende resultater er viktig for å oppnå høy tillit til resultatene. I motsetning til de fleste GRN-slutningsmetoder består IDP av flere beregningsverktøy, som hver har sitt eget sett med argumenter som en bruker må angi, og som hver har sine egne resultater. Mens IDP gir omfattende dokumentasjon om hvordan man parameteriserer hvert verktøy, gjør gjensidig avhengighet av hvert verktøy på utgangen av forrige trinn parameterisering av hele rørledningen uten mellomliggende analyser utfordrende. For eksempel vil argumenter i Edge- og Network Finding-trinnene sannsynligvis bli informert av tidligere biologisk kunnskap, og det vil også avhenge av datasettet og / eller organismen. For å forhøre mellomliggende resultater, ville det være nødvendig med en grunnleggende forståelse av programmering, samt en dyp forståelse av alle resultatfilene og innholdet fra IDP.

Idv (Inherent Dynamics Visualizer) er en interaktiv visualiseringspakke som kjører i en brukers nettleservindu, og som gjør det mulig for brukere av IDP å vurdere virkningen av argumentvalgene på resultater fra et hvilket som helst trinn i IDP. IDV navigerer i en komplisert katalogstruktur produsert av IDP og samler de nødvendige dataene for hvert trinn og presenterer dataene i intuitive og interaktive figurer og tabeller som brukeren kan utforske. Etter å ha utforsket disse interaktive skjermene, kan brukeren produsere nye data fra et IDP-trinn som kan baseres på mer informerte beslutninger. Disse nye dataene kan deretter umiddelbart brukes i neste respektive trinn i IDP. I tillegg kan utforskning av dataene bidra til å avgjøre om et IDP-trinn skal kjøres på nytt med justerte parametere. IDV kan forbedre bruken av IDP, samt gjøre bruken av IDP mer intuitiv og tilgjengelig, som demonstrert ved å undersøke kjerneoscillatoren GRN i gjærcellesyklusen. Følgende protokoll inkluderer IDP-resultater fra en fullstendig parameterisert IDP-kjøring kontra en tilnærming som inkorporerer IDV etter kjøringer av hvert IDP-trinn, det vil si Node, Edge og Network Finding.

Protocol

1. Installer IDP og IDV MERK: Denne delen forutsetter at docker, conda, pip og git allerede er installert (Tabell over materialer). I en terminal skriver du inn kommandoen: git klone https://gitlab.com/biochron/inherent_dynamics_pipeline.git. Følg installasjonsinstruksjonene i IDP-viktig-filen. I en terminal skriver du inn kommandoen: git klone https://gitlab.com/bertfordley/inherent_dynamics_visualizer.git.<br…

Representative Results

Trinnene beskrevet tekstlig over og grafisk i figur 1 ble brukt på kjernen oscillerende GRN av gjærcellesyklusen for å se om det er mulig å oppdage funksjonelle GRN-modeller som er i stand til å produsere dynamikken observert i tidsserie genuttrykksdata samlet inn i en gjærcellesyklusstudie16. For å illustrere hvordan IDV kan avklare og forbedre IDP-produksjonen, ble resultatene, etter å ha utført denne analysen på to måter, sammenlignet: 1) som kjører all…

Discussion

Slutningen av GRN-er er en viktig utfordring i systembiologi. IDP genererer modell-GRNer fra genuttrykksdata ved hjelp av en sekvens av verktøy som bruker dataene på stadig mer komplekse måter. Hvert trinn krever beslutninger om hvordan dataene skal behandles og hvilke elementer (gener, funksjonelle interaksjoner) som skal sendes til neste lag i IDP. Virkningene av disse beslutningene på IDP-resultater er ikke like åpenbare. For å hjelpe i denne forbindelse gir IDV nyttige interaktive visualiseringer av utgangene f…

Divulgazioni

The authors have nothing to disclose.

Acknowledgements

Dette arbeidet ble finansiert av NIH grant R01 GM126555-01 og NSF grant DMS-1839299.

Materials

Docker https://docs.docker.com/get-docker/
Git https://git-scm.com/
Inherent Dynamics Pipeline https://gitlab.com/biochron/inherent_dynamics_pipeline
Inherent Dynamics Visualizer https://gitlab.com/bertfordley/inherent_dynamics_visualizer
Miniconda https://docs.conda.io/en/latest/miniconda.html
Pip https://pip.pypa.io/en/stable/

Riferimenti

  1. Karlebach, G., Shamir, R. Modelling and analysis of gene regulatory networks. Nature Reviews Molecular Cell Biology. 9 (10), 770-780 (2008).
  2. Aijö, T., Lähdesmäki, H. Learning gene regulatory networks from gene expression measurements using non-parametric molecular kinetics. Bioinformatics. 25 (22), 2937-2944 (2009).
  3. Huynh-Thu, V. A., Sanguinetti, G. Combining tree-based and dynamical systems for the inference of gene regulatory networks. Bioinformatics. 31 (10), 1614-1622 (2015).
  4. Oates, C. J., et al. Causal network inference using biochemical kinetics. Bioinformatics. 30 (17), 468-474 (2014).
  5. Marbach, D., et al. Wisdom of crowds for robust gene network inference. Nature Methods. 9 (8), 796-804 (2012).
  6. . Inherent Dynamics Pipeline Available from: https://gitlab.com/biochron/inherent_dynamics_pipeline (2021)
  7. Motta, F. C., Moseley, R. C., Cummins, B., Deckard, A., Haase, S. B. Conservation of dynamic characteristics of transcriptional regulatory elements in periodic biological processes. bioRxiv. , (2020).
  8. . LEMpy Available from: https://gitlab.com/biochron/lempy (2021)
  9. McGoff, K. A., et al. The local edge machine: inference of dynamic models of gene regulation. Genome Biology. 17, 214 (2016).
  10. Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. Model rejection and parameter reduction via time series. SIAM Journal on Applied Dynamical Systems. 17 (2), 1589-1616 (2018).
  11. Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. Database of Dynamic Signatures Generated by Regulatory Networks (DSGRN). Lecture Notes in Computer Science. (including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). , 300-308 (2017).
  12. Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. DSGRN: Examining the dynamics of families of logical models. Frontiers in Physiology. 9. 9, 549 (2018).
  13. . DSGRN Available from: https://github.com/marciogameiro/DSGRN (2021)
  14. . Dsgm_Net_Gen Available from: https://github.com/breecummins/dsgrn_net_gen (2021)
  15. . Dsgrn_Net_Query Available from: https://github.com/breecummins/dsgrn_net_query (2021)
  16. Orlando, D. A., et al. Global control of cell-cycle transcription by coupled CDK and network oscillators. Nature. 453 (7197), 944-947 (2008).
  17. Monteiro, P. T., et al. YEASTRACT+: a portal for cross-species comparative genomics of transcription regulation in yeasts. Nucleic Acids Research. 48 (1), 642-649 (2020).
  18. de Bruin, R. A. M., et al. Constraining G1-specific transcription to late G1 phase: The MBF-associated corepressor Nrm1 acts via negative feedback. Molecular Cell. 23 (4), 483-496 (2006).
  19. Horak, C. E., et al. Complex transcriptional circuitry at the G1/S transition in Saccharomyces cerevisiae. Genes & Development. 16 (23), 3017-3033 (2002).
  20. Cherry, J. M., et al. Saccharomyces genome database: The genomics resource of budding yeast. Nucleic Acids Research. 40, 700-705 (2012).
  21. Zhu, G., et al. Two yeast forkhead genes regulate the cell cycle and pseudohyphal growth. Nature. 406 (6791), 90-94 (2000).
  22. Loy, C. J., Lydall, D., Surana, U. NDD1, a high-dosage suppressor of cdc28-1N, is essential for expression of a subset of late-S-phase-specific genes in saccharomyces cerevisiae. Molecular and Cellular Biology. 19 (5), 3312-3327 (1999).
  23. Cho, C. Y., Kelliher, C. M., Hasse, S. B. The cell-cycle transcriptional network generates and transmits a pulse of transcription once each cell cycle. Cell Cycle. 18 (4), 363-378 (2019).
  24. Smith, L. M., et al. An intrinsic oscillator drives the blood stage cycle of the malaria parasite Plasmodium falciparum. Science. 368 (6492), 754-759 (2020).
check_url/it/63084?article_type=t

Play Video

Citazione di questo articolo
Moseley, R. C., Campione, S., Cummins, B., Motta, F., Haase, S. B. Inherent Dynamics Visualizer, an Interactive Application for Evaluating and Visualizing Outputs from a Gene Regulatory Network Inference Pipeline. J. Vis. Exp. (178), e63084, doi:10.3791/63084 (2021).

View Video