Summary

Inherent Dynamics Visualizer, un'applicazione interattiva per la valutazione e la visualizzazione di output da una pipeline di inferenza di rete di regolazione genica

Published: December 07, 2021
doi:

Summary

Inherent Dynamics Visualizer è un pacchetto di visualizzazione interattivo che si collega a uno strumento di inferenza della rete di regolazione genica per una generazione migliorata e semplificata di modelli di rete funzionali. Il visualizzatore può essere utilizzato per prendere decisioni più informate per la parametrizzazione dello strumento di inferenza, aumentando così la fiducia nei modelli risultanti.

Abstract

Lo sviluppo di modelli di reti di regolazione genica è una sfida importante nella biologia dei sistemi. Diversi strumenti computazionali e pipeline sono stati sviluppati per affrontare questa sfida, tra cui la nuova Inherent Dynamics Pipeline. La pipeline di Dinamica intrinseca è costituita da diversi strumenti pubblicati in precedenza che funzionano sinergicamente e sono collegati in modo lineare, in cui l’output di uno strumento viene quindi utilizzato come input per lo strumento seguente. Come con la maggior parte delle tecniche computazionali, ogni passaggio della Inherent Dynamics Pipeline richiede all’utente di fare scelte su parametri che non hanno una definizione biologica precisa. Queste scelte possono avere un impatto sostanziale sui modelli di rete di regolazione genica prodotti dall’analisi. Per questo motivo, la capacità di visualizzare ed esplorare le conseguenze delle varie scelte di parametri in ogni fase può aiutare ad aumentare la fiducia nelle scelte e nei risultati. Inherent Dynamics Visualizer è un pacchetto di visualizzazione completo che semplifica il processo di valutazione delle scelte dei parametri attraverso un’interfaccia interattiva all’interno di un browser Web. L’utente può esaminare separatamente l’output di ogni passaggio della pipeline, apportare modifiche intuitive basate su informazioni visive e trarre vantaggio dalla produzione automatica dei file di input necessari per Inherent Dynamics Pipeline. L’Inherent Dynamics Visualizer fornisce un livello di accesso senza precedenti a uno strumento altamente complesso per la scoperta di reti di regolazione genica da dati trascrittomici di serie temporali.

Introduction

Molti importanti processi biologici, come la differenziazione cellulare e la risposta ambientale, sono governati da insiemi di geni che interagiscono tra loro in una rete di regolazione genica (GRN). Questi GRN producono le dinamiche trascrizionali necessarie per attivare e mantenere il fenotipo che controllano, quindi identificare i componenti e la struttura topologica del GRN è la chiave per comprendere molti processi e funzioni biologiche. Un GRN può essere modellato come un insieme di geni interagenti e/o prodotti genici descritti da una rete i cui nodi sono i geni e i cui bordi descrivono la direzione e la forma di interazione (ad esempio, attivazione/repressione della trascrizione, modifica post-traduzionale, ecc.) 1. Le interazioni possono quindi essere espresse come modelli matematici parametrizzati che descrivono l’impatto che un gene regolatore ha sulla produzione dei suoi bersagli 2,3,4. L’inferenza di un modello GRN richiede sia un’inferenza della struttura della rete di interazione che una stima dei parametri di interazione sottostanti. Sono stati sviluppati una varietà di metodi di inferenza computazionale che acquisiscono dati di espressione genica di serie temporali e modelli GRN di output5. Recentemente, è stato sviluppato un nuovo metodo di inferenza GRN, chiamato Inherent Dynamics Pipeline (IDP), che utilizza i dati di espressione genica di serie temporali per produrre modelli GRN con interazioni regolatore-bersaglio etichettate che sono in grado di produrre dinamiche che corrispondono alle dinamiche osservate nei dati di espressione genica6. L’IDP è una suite di strumenti collegati linearmente in una pipeline e può essere suddiviso in tre passaggi: un passaggio node finding che classifica i geni in base alle caratteristiche di espressione genica note o sospettate di essere correlate alla funzione del GRN7,8, un passaggio edge finding che classifica le relazioni regolatorie a coppie8, 9, e un passaggio di ricerca della rete che produce modelli GRN in grado di produrre le dinamiche osservate10,11,12,13,14,15.

Come la maggior parte dei metodi computazionali, l’IDP richiede un insieme di argomenti specificati dall’utente che dettano il modo in cui vengono analizzati i dati di input e diversi insiemi di argomenti possono produrre risultati diversi sugli stessi dati. Ad esempio, diversi metodi, incluso l’IDP, contengono argomenti che applicano una certa soglia ai dati e l’aumento/diminuzione di questa soglia tra le esecuzioni successive del particolare metodo può comportare risultati dissimili tra le esecuzioni (vedere La nota supplementare 10: Metodi di inferenza di rete di5). Capire come ogni argomento può influire sull’analisi e sui risultati successivi è importante per ottenere un’elevata fiducia nei risultati. A differenza della maggior parte dei metodi di inferenza GRN, l’IDP è costituito da più strumenti computazionali, ognuno con il proprio set di argomenti che un utente deve specificare e ognuno con i propri risultati. Mentre l’IDP fornisce un’ampia documentazione su come parametrizzare ogni utensile, l’interdipendenza di ciascun utensile dall’output del passaggio precedente rende difficile la parametrizzazione dell’intera pipeline senza analisi intermedie. Ad esempio, gli argomenti nelle fasi di Edge e Network Finding sono probabilmente informati da precedenti conoscenze biologiche e quindi dipenderanno dal set di dati e / o dall’organismo. Per interrogare i risultati intermedi, sarebbe necessaria una conoscenza di base della programmazione, nonché una profonda comprensione di tutti i file dei risultati e del loro contenuto dall’IDP.

Inherent Dynamics Visualizer (IDV) è un pacchetto di visualizzazione interattivo che viene eseguito nella finestra del browser di un utente e fornisce agli utenti dell’IDP un modo per valutare l’impatto delle loro scelte di argomento sui risultati di qualsiasi passaggio dell’IDP. L’IDV naviga in una complicata struttura di directory prodotta dall’IDP e raccoglie i dati necessari per ogni passaggio e presenta i dati in figure e tabelle intuitive e interattive che l’utente può esplorare. Dopo aver esplorato questi display interattivi, l’utente può produrre nuovi dati da un passaggio IDP che può essere basato su decisioni più informate. Questi nuovi dati possono quindi essere immediatamente utilizzati nella successiva fase rispettiva dell’IDP. Inoltre, l’esplorazione dei dati può aiutare a determinare se un passaggio IDP deve essere eseguito con parametri regolati. L’IDV può migliorare l’uso dell’IDP, oltre a rendere l’uso dell’IDP più intuitivo e accessibile, come dimostrato studiando l’oscillatore centrale GRN del ciclo cellulare del lievito. Il protocollo seguente include i risultati IDP di un’esecuzione IDP completamente parametrizzata rispetto a un approccio che incorpora l’IDV dopo l’esecuzione di ogni passaggio IDP, ovvero Node, Edge e Network Finding.

Protocol

1. Installare L’IDP e l’IDV Nota : questa sezione presuppone che docker, conda, pip e git siano già installati (Tabella dei materiali). In un terminale, inserisci il comando: git clone https://gitlab.com/biochron/inherent_dynamics_pipeline.git. Seguire le istruzioni di installazione nel file README dell’IDP. In un terminale, inserisci il comando: git clone https://gitlab.com/bertfordley/inherent_dynamics_visualizer….

Representative Results

I passaggi descritti testualmente sopra e graficamente nella Figura 1 sono stati applicati al GRN oscillante centrale del ciclo cellulare del lievito per vedere se è possibile scoprire modelli GRN funzionali in grado di produrre le dinamiche osservate nei dati di espressione genica delle serie temporali raccolti in uno studio sul ciclo cellulare del lievito16. Per illustrare come l’IDV può chiarire e migliorare l’output dell’IDP, i risultati, dopo aver eseguito ques…

Discussion

L’inferenza dei GRN è una sfida importante nella biologia dei sistemi. L’IDP genera GRN modello da dati di espressione genica utilizzando una sequenza di strumenti che utilizzano i dati in modi sempre più complessi. Ogni passaggio richiede decisioni su come elaborare i dati e quali elementi (geni, interazioni funzionali) verranno passati al livello successivo dell’IDP. Gli impatti di queste decisioni sui risultati degli sfollati interni non sono così evidenti. Per aiutare in questo senso, l’IDV fornisce utili visualiz…

Divulgazioni

The authors have nothing to disclose.

Acknowledgements

Questo lavoro è stato finanziato dalla sovvenzione NIH R01 GM126555-01 e dalla sovvenzione NSF DMS-1839299.

Materials

Docker https://docs.docker.com/get-docker/
Git https://git-scm.com/
Inherent Dynamics Pipeline https://gitlab.com/biochron/inherent_dynamics_pipeline
Inherent Dynamics Visualizer https://gitlab.com/bertfordley/inherent_dynamics_visualizer
Miniconda https://docs.conda.io/en/latest/miniconda.html
Pip https://pip.pypa.io/en/stable/

Riferimenti

  1. Karlebach, G., Shamir, R. Modelling and analysis of gene regulatory networks. Nature Reviews Molecular Cell Biology. 9 (10), 770-780 (2008).
  2. Aijö, T., Lähdesmäki, H. Learning gene regulatory networks from gene expression measurements using non-parametric molecular kinetics. Bioinformatics. 25 (22), 2937-2944 (2009).
  3. Huynh-Thu, V. A., Sanguinetti, G. Combining tree-based and dynamical systems for the inference of gene regulatory networks. Bioinformatics. 31 (10), 1614-1622 (2015).
  4. Oates, C. J., et al. Causal network inference using biochemical kinetics. Bioinformatics. 30 (17), 468-474 (2014).
  5. Marbach, D., et al. Wisdom of crowds for robust gene network inference. Nature Methods. 9 (8), 796-804 (2012).
  6. . Inherent Dynamics Pipeline Available from: https://gitlab.com/biochron/inherent_dynamics_pipeline (2021)
  7. Motta, F. C., Moseley, R. C., Cummins, B., Deckard, A., Haase, S. B. Conservation of dynamic characteristics of transcriptional regulatory elements in periodic biological processes. bioRxiv. , (2020).
  8. . LEMpy Available from: https://gitlab.com/biochron/lempy (2021)
  9. McGoff, K. A., et al. The local edge machine: inference of dynamic models of gene regulation. Genome Biology. 17, 214 (2016).
  10. Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. Model rejection and parameter reduction via time series. SIAM Journal on Applied Dynamical Systems. 17 (2), 1589-1616 (2018).
  11. Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. Database of Dynamic Signatures Generated by Regulatory Networks (DSGRN). Lecture Notes in Computer Science. (including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). , 300-308 (2017).
  12. Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. DSGRN: Examining the dynamics of families of logical models. Frontiers in Physiology. 9. 9, 549 (2018).
  13. . DSGRN Available from: https://github.com/marciogameiro/DSGRN (2021)
  14. . Dsgm_Net_Gen Available from: https://github.com/breecummins/dsgrn_net_gen (2021)
  15. . Dsgrn_Net_Query Available from: https://github.com/breecummins/dsgrn_net_query (2021)
  16. Orlando, D. A., et al. Global control of cell-cycle transcription by coupled CDK and network oscillators. Nature. 453 (7197), 944-947 (2008).
  17. Monteiro, P. T., et al. YEASTRACT+: a portal for cross-species comparative genomics of transcription regulation in yeasts. Nucleic Acids Research. 48 (1), 642-649 (2020).
  18. de Bruin, R. A. M., et al. Constraining G1-specific transcription to late G1 phase: The MBF-associated corepressor Nrm1 acts via negative feedback. Molecular Cell. 23 (4), 483-496 (2006).
  19. Horak, C. E., et al. Complex transcriptional circuitry at the G1/S transition in Saccharomyces cerevisiae. Genes & Development. 16 (23), 3017-3033 (2002).
  20. Cherry, J. M., et al. Saccharomyces genome database: The genomics resource of budding yeast. Nucleic Acids Research. 40, 700-705 (2012).
  21. Zhu, G., et al. Two yeast forkhead genes regulate the cell cycle and pseudohyphal growth. Nature. 406 (6791), 90-94 (2000).
  22. Loy, C. J., Lydall, D., Surana, U. NDD1, a high-dosage suppressor of cdc28-1N, is essential for expression of a subset of late-S-phase-specific genes in saccharomyces cerevisiae. Molecular and Cellular Biology. 19 (5), 3312-3327 (1999).
  23. Cho, C. Y., Kelliher, C. M., Hasse, S. B. The cell-cycle transcriptional network generates and transmits a pulse of transcription once each cell cycle. Cell Cycle. 18 (4), 363-378 (2019).
  24. Smith, L. M., et al. An intrinsic oscillator drives the blood stage cycle of the malaria parasite Plasmodium falciparum. Science. 368 (6492), 754-759 (2020).

Play Video

Citazione di questo articolo
Moseley, R. C., Campione, S., Cummins, B., Motta, F., Haase, S. B. Inherent Dynamics Visualizer, an Interactive Application for Evaluating and Visualizing Outputs from a Gene Regulatory Network Inference Pipeline. J. Vis. Exp. (178), e63084, doi:10.3791/63084 (2021).

View Video