Inherent Dynamics Visualizer è un pacchetto di visualizzazione interattivo che si collega a uno strumento di inferenza della rete di regolazione genica per una generazione migliorata e semplificata di modelli di rete funzionali. Il visualizzatore può essere utilizzato per prendere decisioni più informate per la parametrizzazione dello strumento di inferenza, aumentando così la fiducia nei modelli risultanti.
Lo sviluppo di modelli di reti di regolazione genica è una sfida importante nella biologia dei sistemi. Diversi strumenti computazionali e pipeline sono stati sviluppati per affrontare questa sfida, tra cui la nuova Inherent Dynamics Pipeline. La pipeline di Dinamica intrinseca è costituita da diversi strumenti pubblicati in precedenza che funzionano sinergicamente e sono collegati in modo lineare, in cui l’output di uno strumento viene quindi utilizzato come input per lo strumento seguente. Come con la maggior parte delle tecniche computazionali, ogni passaggio della Inherent Dynamics Pipeline richiede all’utente di fare scelte su parametri che non hanno una definizione biologica precisa. Queste scelte possono avere un impatto sostanziale sui modelli di rete di regolazione genica prodotti dall’analisi. Per questo motivo, la capacità di visualizzare ed esplorare le conseguenze delle varie scelte di parametri in ogni fase può aiutare ad aumentare la fiducia nelle scelte e nei risultati. Inherent Dynamics Visualizer è un pacchetto di visualizzazione completo che semplifica il processo di valutazione delle scelte dei parametri attraverso un’interfaccia interattiva all’interno di un browser Web. L’utente può esaminare separatamente l’output di ogni passaggio della pipeline, apportare modifiche intuitive basate su informazioni visive e trarre vantaggio dalla produzione automatica dei file di input necessari per Inherent Dynamics Pipeline. L’Inherent Dynamics Visualizer fornisce un livello di accesso senza precedenti a uno strumento altamente complesso per la scoperta di reti di regolazione genica da dati trascrittomici di serie temporali.
Molti importanti processi biologici, come la differenziazione cellulare e la risposta ambientale, sono governati da insiemi di geni che interagiscono tra loro in una rete di regolazione genica (GRN). Questi GRN producono le dinamiche trascrizionali necessarie per attivare e mantenere il fenotipo che controllano, quindi identificare i componenti e la struttura topologica del GRN è la chiave per comprendere molti processi e funzioni biologiche. Un GRN può essere modellato come un insieme di geni interagenti e/o prodotti genici descritti da una rete i cui nodi sono i geni e i cui bordi descrivono la direzione e la forma di interazione (ad esempio, attivazione/repressione della trascrizione, modifica post-traduzionale, ecc.) 1. Le interazioni possono quindi essere espresse come modelli matematici parametrizzati che descrivono l’impatto che un gene regolatore ha sulla produzione dei suoi bersagli 2,3,4. L’inferenza di un modello GRN richiede sia un’inferenza della struttura della rete di interazione che una stima dei parametri di interazione sottostanti. Sono stati sviluppati una varietà di metodi di inferenza computazionale che acquisiscono dati di espressione genica di serie temporali e modelli GRN di output5. Recentemente, è stato sviluppato un nuovo metodo di inferenza GRN, chiamato Inherent Dynamics Pipeline (IDP), che utilizza i dati di espressione genica di serie temporali per produrre modelli GRN con interazioni regolatore-bersaglio etichettate che sono in grado di produrre dinamiche che corrispondono alle dinamiche osservate nei dati di espressione genica6. L’IDP è una suite di strumenti collegati linearmente in una pipeline e può essere suddiviso in tre passaggi: un passaggio node finding che classifica i geni in base alle caratteristiche di espressione genica note o sospettate di essere correlate alla funzione del GRN7,8, un passaggio edge finding che classifica le relazioni regolatorie a coppie8, 9, e un passaggio di ricerca della rete che produce modelli GRN in grado di produrre le dinamiche osservate10,11,12,13,14,15.
Come la maggior parte dei metodi computazionali, l’IDP richiede un insieme di argomenti specificati dall’utente che dettano il modo in cui vengono analizzati i dati di input e diversi insiemi di argomenti possono produrre risultati diversi sugli stessi dati. Ad esempio, diversi metodi, incluso l’IDP, contengono argomenti che applicano una certa soglia ai dati e l’aumento/diminuzione di questa soglia tra le esecuzioni successive del particolare metodo può comportare risultati dissimili tra le esecuzioni (vedere La nota supplementare 10: Metodi di inferenza di rete di5). Capire come ogni argomento può influire sull’analisi e sui risultati successivi è importante per ottenere un’elevata fiducia nei risultati. A differenza della maggior parte dei metodi di inferenza GRN, l’IDP è costituito da più strumenti computazionali, ognuno con il proprio set di argomenti che un utente deve specificare e ognuno con i propri risultati. Mentre l’IDP fornisce un’ampia documentazione su come parametrizzare ogni utensile, l’interdipendenza di ciascun utensile dall’output del passaggio precedente rende difficile la parametrizzazione dell’intera pipeline senza analisi intermedie. Ad esempio, gli argomenti nelle fasi di Edge e Network Finding sono probabilmente informati da precedenti conoscenze biologiche e quindi dipenderanno dal set di dati e / o dall’organismo. Per interrogare i risultati intermedi, sarebbe necessaria una conoscenza di base della programmazione, nonché una profonda comprensione di tutti i file dei risultati e del loro contenuto dall’IDP.
Inherent Dynamics Visualizer (IDV) è un pacchetto di visualizzazione interattivo che viene eseguito nella finestra del browser di un utente e fornisce agli utenti dell’IDP un modo per valutare l’impatto delle loro scelte di argomento sui risultati di qualsiasi passaggio dell’IDP. L’IDV naviga in una complicata struttura di directory prodotta dall’IDP e raccoglie i dati necessari per ogni passaggio e presenta i dati in figure e tabelle intuitive e interattive che l’utente può esplorare. Dopo aver esplorato questi display interattivi, l’utente può produrre nuovi dati da un passaggio IDP che può essere basato su decisioni più informate. Questi nuovi dati possono quindi essere immediatamente utilizzati nella successiva fase rispettiva dell’IDP. Inoltre, l’esplorazione dei dati può aiutare a determinare se un passaggio IDP deve essere eseguito con parametri regolati. L’IDV può migliorare l’uso dell’IDP, oltre a rendere l’uso dell’IDP più intuitivo e accessibile, come dimostrato studiando l’oscillatore centrale GRN del ciclo cellulare del lievito. Il protocollo seguente include i risultati IDP di un’esecuzione IDP completamente parametrizzata rispetto a un approccio che incorpora l’IDV dopo l’esecuzione di ogni passaggio IDP, ovvero Node, Edge e Network Finding.
L’inferenza dei GRN è una sfida importante nella biologia dei sistemi. L’IDP genera GRN modello da dati di espressione genica utilizzando una sequenza di strumenti che utilizzano i dati in modi sempre più complessi. Ogni passaggio richiede decisioni su come elaborare i dati e quali elementi (geni, interazioni funzionali) verranno passati al livello successivo dell’IDP. Gli impatti di queste decisioni sui risultati degli sfollati interni non sono così evidenti. Per aiutare in questo senso, l’IDV fornisce utili visualiz…
The authors have nothing to disclose.
Questo lavoro è stato finanziato dalla sovvenzione NIH R01 GM126555-01 e dalla sovvenzione NSF DMS-1839299.
Docker | https://docs.docker.com/get-docker/ | ||
Git | https://git-scm.com/ | ||
Inherent Dynamics Pipeline | https://gitlab.com/biochron/inherent_dynamics_pipeline | ||
Inherent Dynamics Visualizer | https://gitlab.com/bertfordley/inherent_dynamics_visualizer | ||
Miniconda | https://docs.conda.io/en/latest/miniconda.html | ||
Pip | https://pip.pypa.io/en/stable/ |