De Inherent Dynamics Visualizer is een interactief visualisatiepakket dat verbinding maakt met een genregulerende netwerkinferentietool voor verbeterde, gestroomlijnde generatie van functionele netwerkmodellen. De visualizer kan worden gebruikt om beter geïnformeerde beslissingen te nemen voor het parametriseren van de inferentietool, waardoor het vertrouwen in de resulterende modellen toeneemt.
Het ontwikkelen van genregulerende netwerkmodellen is een grote uitdaging in de systeembiologie. Er zijn verschillende computationele tools en pijplijnen ontwikkeld om deze uitdaging aan te gaan, waaronder de nieuw ontwikkelde Inherent Dynamics Pipeline. De Inherent Dynamics Pipeline bestaat uit verschillende eerder gepubliceerde tools die synergetisch werken en op een lineaire manier met elkaar verbonden zijn, waarbij de output van één tool vervolgens wordt gebruikt als input voor het volgende gereedschap. Zoals met de meeste computationele technieken, vereist elke stap van de Inherent Dynamics Pipeline dat de gebruiker keuzes maakt over parameters die geen precieze biologische definitie hebben. Deze keuzes kunnen een aanzienlijke invloed hebben op genregulerende netwerkmodellen die door de analyse worden geproduceerd. Om deze reden kan het vermogen om de gevolgen van verschillende parameterkeuzes bij elke stap te visualiseren en te verkennen, helpen het vertrouwen in de keuzes en de resultaten te vergroten. De Inherent Dynamics Visualizer is een uitgebreid visualisatiepakket dat het proces van het evalueren van parameterkeuzes stroomlijnt via een interactieve interface in een webbrowser. De gebruiker kan de uitvoer van elke stap van de pijplijn afzonderlijk onderzoeken, intuïtieve wijzigingen aanbrengen op basis van visuele informatie en profiteren van de automatische productie van benodigde invoerbestanden voor de Inherent Dynamics Pipeline. De Inherent Dynamics Visualizer biedt een ongeëvenaard niveau van toegang tot een zeer ingewikkelde tool voor de ontdekking van genregulerende netwerken uit tijdreekstranscriptomische gegevens.
Veel belangrijke biologische processen, zoals celdifferentiatie en omgevingsrespons, worden beheerst door sets genen die met elkaar interageren in een genregulerend netwerk (GRN). Deze GRN’s produceren de transcriptionele dynamiek die nodig is voor het activeren en onderhouden van het fenotype dat ze beheersen, dus het identificeren van de componenten en de topologische structuur van de GRN is de sleutel tot het begrijpen van vele biologische processen en functies. Een GRN kan worden gemodelleerd als een set van interagerende genen en/of genproducten beschreven door een netwerk waarvan de knooppunten de genen zijn en waarvan de randen de richting en vorm van interactie beschrijven (bijv. Activering/onderdrukking van transcriptie, posttranslationele modificatie, enz.) 1. Interacties kunnen dan worden uitgedrukt als geparametriseerde wiskundige modellen die de impact beschrijven die een regulerend gen heeft op de productie van zijn doel(en)2,3,4. Inferentie van een GRN-model vereist zowel een gevolgtrekking van de structuur van het interactienetwerk als een schatting van de onderliggende interactieparameters. Er zijn verschillende computationele inferentiemethoden ontwikkeld die tijdreeksgenexpressiegegevens opnemen en GRN-modellen uitvoeren5. Onlangs werd een nieuwe GRN-inferentiemethode ontwikkeld, de Inherent Dynamics Pipeline (IDP), die tijdreeksgenexpressiegegevens gebruikt om GRN-modellen te produceren met gelabelde regulator-doelinteracties die in staat zijn om dynamieken te produceren die overeenkomen met de waargenomen dynamiek in de genexpressiegegevens6. De IDP is een reeks tools die lineair in een pijplijn zijn verbonden en kunnen worden onderverdeeld in drie stappen: een Node Finding-stap die genen rangschikt op basis van genexpressiekenmerken waarvan bekend is of vermoed wordt dat ze verband houden met de functie van de GRN7,8, een Edge Finding-stap die paarsgewijze regulerende relaties rangschikt8, 9, en een netwerkzoekstap die GRN-modellen produceert die in staat zijn om de waargenomen dynamiek10,11,12,13,14,15 te produceren.
Zoals de meeste computationele methoden vereist de IDP een reeks door de gebruiker opgegeven argumenten die bepalen hoe de invoergegevens worden geanalyseerd, en verschillende sets argumenten kunnen verschillende resultaten opleveren voor dezelfde gegevens. Verschillende methoden, waaronder de IDP, bevatten bijvoorbeeld argumenten die een bepaalde drempel op de gegevens toepassen, en het verhogen/verlagen van deze drempel tussen opeenvolgende uitvoeringen van de specifieke methode kan leiden tot ongelijke resultaten tussen uitvoeringen (zie Supplement Note 10: Netwerkinferentiemethoden van 5). Begrijpen hoe elk argument de analyse en de daaropvolgende resultaten kan beïnvloeden, is belangrijk voor het bereiken van een hoog vertrouwen in de resultaten. In tegenstelling tot de meeste GRN-inferentiemethoden bestaat de IDP uit meerdere rekenhulpmiddelen, elk met een eigen set argumenten die een gebruiker moet opgeven en elk met zijn eigen resultaten. Hoewel de IDP uitgebreide documentatie biedt over het parametriseren van elke tool, maakt de onderlinge afhankelijkheid van elke tool op de uitvoer van de vorige stap het parametriseren van de hele pijplijn zonder tussentijdse analyses een uitdaging. Argumenten in de edge- en netwerkzoekstappen zijn bijvoorbeeld waarschijnlijk gebaseerd op biologische voorkennis en zijn dus afhankelijk van de dataset en / of het organisme. Om tussentijdse resultaten te ondervragen, zou een basiskennis van programmeren nodig zijn, evenals een diep begrip van alle resultaatbestanden en hun inhoud van de IDP.
De Inherent Dynamics Visualizer (IDV) is een interactief visualisatiepakket dat wordt uitgevoerd in het browservenster van een gebruiker en een manier biedt voor gebruikers van de IDP om de impact van hun argumentkeuzes op resultaten van elke stap in de IDP te beoordelen. De IDV navigeert door een gecompliceerde directorystructuur geproduceerd door de IDP en verzamelt de nodige gegevens voor elke stap en presenteert de gegevens in intuïtieve en interactieve figuren en tabellen die de gebruiker kan verkennen. Na het verkennen van deze interactieve displays kan de gebruiker nieuwe gegevens produceren uit een IDP-stap die kan worden gebaseerd op beter geïnformeerde beslissingen. Deze nieuwe gegevens kunnen vervolgens onmiddellijk worden gebruikt in de volgende stap van het IDP. Bovendien kan verkenning van de gegevens helpen bepalen of een IDP-stap opnieuw moet worden uitgevoerd met aangepaste parameters. De IDV kan het gebruik van de IDP verbeteren en het gebruik van de IDP intuïtiever en toegankelijker maken, zoals aangetoond door de kernoscillator GRN van de gistcelcyclus te onderzoeken. Het volgende protocol bevat IDP-resultaten van een volledig geparametriseerde IDP-run versus een aanpak die de IDV na uitvoeringen van elke IDP-stap bevat, d.w.z. Node, Edge en Network Finding.
De gevolgtrekking van GRN’s is een belangrijke uitdaging in de systeembiologie. De IDP genereert model-GRN’s op basis van genexpressiegegevens met behulp van een reeks hulpmiddelen die de gegevens op steeds complexere manieren gebruiken. Elke stap vereist beslissingen over hoe de gegevens te verwerken en welke elementen (genen, functionele interacties) zullen worden doorgegeven aan de volgende laag van de IDP. De gevolgen van deze beslissingen voor de resultaten van het IDP zijn niet zo duidelijk. Om hierbij te helpen, b…
The authors have nothing to disclose.
Dit werk werd gefinancierd door de NIH-subsidie R01 GM126555-01 en NSF-subsidie DMS-1839299.
Docker | https://docs.docker.com/get-docker/ | ||
Git | https://git-scm.com/ | ||
Inherent Dynamics Pipeline | https://gitlab.com/biochron/inherent_dynamics_pipeline | ||
Inherent Dynamics Visualizer | https://gitlab.com/bertfordley/inherent_dynamics_visualizer | ||
Miniconda | https://docs.conda.io/en/latest/miniconda.html | ||
Pip | https://pip.pypa.io/en/stable/ |