Inherent Dynamics Visualizer er en interaktiv visualiseringspakke, der opretter forbindelse til et genregulerende netværksslutningsværktøj til forbedret, strømlinet generation af funktionelle netværksmodeller. Visualizeren kan bruges til at træffe mere informerede beslutninger om parameterisering af slutningsværktøjet og dermed øge tilliden til de resulterende modeller.
Udvikling af genregulerende netværksmodeller er en stor udfordring inden for systembiologi. Flere beregningsværktøjer og pipelines er blevet udviklet til at tackle denne udfordring, herunder den nyudviklede Inherent Dynamics Pipeline. Inherent Dynamics Pipeline består af flere tidligere publicerede værktøjer, der arbejder synergistisk og er forbundet lineært, hvor output fra ét værktøj så bruges som input til følgende værktøj. Som med de fleste beregningsteknikker kræver hvert trin i Inherent Dynamics Pipeline, at brugeren træffer valg om parametre, der ikke har en præcis biologisk definition. Disse valg kan i væsentlig grad påvirke genregulerende netværksmodeller, der produceres af analysen. Af denne grund kan evnen til at visualisere og udforske konsekvenserne af forskellige parametervalg på hvert trin hjælpe med at øge tilliden til valgene og resultaterne. Inherent Dynamics Visualizer er en omfattende visualiseringspakke, der strømliner processen med at evaluere parametervalg via en interaktiv grænseflade i en webbrowser. Brugeren kan separat undersøge outputtet fra hvert trin i pipelinen, foretage intuitive ændringer baseret på visuel information og drage fordel af den automatiske produktion af nødvendige inputfiler til Inherent Dynamics Pipeline. Inherent Dynamics Visualizer giver et uovertruffen niveau af adgang til et meget indviklet værktøj til opdagelse af genregulerende netværk fra tidsserie transkriptomiske data.
Mange vigtige biologiske processer, såsom celledifferentiering og miljørespons, styres af sæt gener, der interagerer med hinanden i et genregulerende netværk (GRN). Disse GRN’er producerer den transkriptionelle dynamik, der er nødvendig for at aktivere og vedligeholde den fænotype, de kontrollerer, så identifikation af KOMPONENTERNE og den topologiske struktur i GRN er nøglen til at forstå mange biologiske processer og funktioner. Et GRN kan modelleres som et sæt interagerende gener og/eller genprodukter beskrevet af et netværk, hvis noder er generne, og hvis kanter beskriver retningen og formen for interaktion (f.eks. aktivering/undertrykkelse af transkription, posttranslationel modifikation osv.) 1. Interaktioner kan derefter udtrykkes som parameteriserede matematiske modeller, der beskriver den indvirkning, et regulerende gen har på produktionen af dets mål (er) 2,3,4. Slutning af en GRN-model kræver både en slutning af interaktionsnetværkets struktur og estimering af de underliggende interaktionsparametre. Der er udviklet en række beregningsmæssige slutningsmetoder, der indtager tidsserie-genekspressionsdata og output GRN-modeller5. For nylig blev der udviklet en ny GRN-slutningsmetode, kaldet Inherent Dynamics Pipeline (IDP), der bruger tidsserie-genekspressionsdata til at producere GRN-modeller med mærkede regulator-mål-interaktioner, der er i stand til at producere dynamik, der matcher den observerede dynamik i genekspressionsdataene6. IDP er en række værktøjer, der er forbundet lineært i en pipeline og kan opdeles i tre trin: et Node Finding-trin, der rangerer gener baseret på genekspressionsegenskaber, der er kendt eller mistænkt for at være relateret til funktionen af GRN7,8, et Edge Finding-trin, der rangerer parvise reguleringsforhold8, 9, og et Network Finding-trin, der producerer GRN-modeller, der er i stand til at producere den observerede dynamik10,11,12,13,14,15.
Som de fleste beregningsmetoder kræver IDP et sæt brugerspecificerede argumenter, der dikterer, hvordan inputdataene analyseres, og forskellige sæt argumenter kan producere forskellige resultater på de samme data. For eksempel indeholder flere metoder, herunder IDP, argumenter, der anvender en vis tærskel på dataene, og forøgelse/nedsættelse af denne tærskel mellem successive kørsler af den pågældende metode kan resultere i forskellige resultater mellem kørsler (se supplerende note 10: Netværksslutningsmetoder af5). At forstå, hvordan hvert argument kan påvirke analysen og efterfølgende resultater, er vigtigt for at opnå stor tillid til resultaterne. I modsætning til de fleste GRN-slutningsmetoder består IDP af flere beregningsværktøjer, der hver har sit eget sæt argumenter, som en bruger skal specificere, og hver har sine egne resultater. Mens IDP giver omfattende dokumentation for, hvordan man parameteriserer hvert værktøj, gør hvert værktøjs indbyrdes afhængighed af output fra det foregående trin parameterisering af hele rørledningen uden mellemliggende analyser udfordrende. For eksempel vil argumenter i Trinnene Edge og Network Finding sandsynligvis blive informeret af forudgående biologisk viden og vil derfor afhænge af datasættet og/eller organismen. For at forhøre mellemliggende resultater ville der være behov for en grundlæggende forståelse af programmering samt en dyb forståelse af alle resultatfilerne og deres indhold fra IDP.
IDV (Inherent Dynamics Visualizer) er en interaktiv visualiseringspakke, der kører i en brugers browservindue og giver brugere af IDP mulighed for at vurdere virkningen af deres argumentvalg på resultater fra ethvert trin i IDP’en. IDV navigerer i en kompliceret mappestruktur produceret af IDP og samler de nødvendige data for hvert trin og præsenterer dataene i intuitive og interaktive figurer og tabeller, som brugeren kan udforske. Efter at have udforsket disse interaktive skærme kan brugeren producere nye data fra et IDP-trin, der kan baseres på mere informerede beslutninger. Disse nye data kan derefter straks bruges i det næste respektive trin i IDP. Derudover kan udforskning af dataene hjælpe med at afgøre, om et IDP-trin skal køres igen med justerede parametre. IDV kan forbedre brugen af IDP samt gøre brugen af IDP mere intuitiv og tilgængelig, som det fremgår af at undersøge kerneoscillatoren GRN i gærcellecyklussen. Følgende protokol indeholder IDP-resultater fra en fuldt parameteriseret IDP-kørsel versus en tilgang, der inkorporerer IDV efter kørsler af hvert IDP-trin, dvs. Node, Edge og Network Finding.
Konklusionen af GRN’er er en vigtig udfordring i systembiologi. IDP genererer model GRN’er fra genekspressionsdata ved hjælp af en række værktøjer, der udnytter dataene på stadig mere komplekse måder. Hvert trin kræver beslutninger om, hvordan dataene skal behandles, og hvilke elementer (gener, funktionelle interaktioner) der overføres til det næste lag af IDP. Virkningerne af disse beslutninger på IDP-resultater er ikke så indlysende. For at hjælpe i denne henseende giver IDV nyttige interaktive visualiserin…
The authors have nothing to disclose.
Dette arbejde blev finansieret af NIH-bevillingen R01 GM126555-01 og NSF-bevillingen DMS-1839299.
Docker | https://docs.docker.com/get-docker/ | ||
Git | https://git-scm.com/ | ||
Inherent Dynamics Pipeline | https://gitlab.com/biochron/inherent_dynamics_pipeline | ||
Inherent Dynamics Visualizer | https://gitlab.com/bertfordley/inherent_dynamics_visualizer | ||
Miniconda | https://docs.conda.io/en/latest/miniconda.html | ||
Pip | https://pip.pypa.io/en/stable/ |