Summary

Inherent Dynamics Visualizer, una aplicación interactiva para evaluar y visualizar los resultados de una canalización de inferencia de red reguladora de genes

Published: December 07, 2021
doi:

Summary

Inherent Dynamics Visualizer es un paquete de visualización interactiva que se conecta a una herramienta de inferencia de red reguladora de genes para una generación mejorada y optimizada de modelos de red funcionales. El visualizador se puede utilizar para tomar decisiones más informadas para parametrizar la herramienta de inferencia, aumentando así la confianza en los modelos resultantes.

Abstract

El desarrollo de modelos de redes reguladoras de genes es un desafío importante en la biología de sistemas. Se han desarrollado varias herramientas computacionales y canalizaciones para abordar este desafío, incluida la recientemente desarrollada Inherent Dynamics Pipeline. Inherent Dynamics Pipeline consta de varias herramientas publicadas anteriormente que funcionan sinérgicamente y están conectadas de manera lineal, donde la salida de una herramienta se utiliza como entrada para la siguiente herramienta. Al igual que con la mayoría de las técnicas computacionales, cada paso de Inherent Dynamics Pipeline requiere que el usuario tome decisiones sobre parámetros que no tienen una definición biológica precisa. Estas opciones pueden afectar sustancialmente los modelos de red reguladora de genes producidos por el análisis. Por esta razón, la capacidad de visualizar y explorar las consecuencias de varias elecciones de parámetros en cada paso puede ayudar a aumentar la confianza en las elecciones y los resultados. Inherent Dynamics Visualizer es un paquete de visualización integral que agiliza el proceso de evaluación de opciones de parámetros a través de una interfaz interactiva dentro de un navegador web. El usuario puede examinar por separado la salida de cada paso de la canalización, realizar cambios intuitivos basados en información visual y beneficiarse de la producción automática de los archivos de entrada necesarios para la canalización de Inherent Dynamics. El Visualizador de Dinámica Inherente proporciona un nivel incomparable de acceso a una herramienta altamente intrincada para el descubrimiento de redes reguladoras de genes a partir de datos transcriptómicos de series temporales.

Introduction

Muchos procesos biológicos importantes, como la diferenciación celular y la respuesta ambiental, se rigen por conjuntos de genes que interactúan entre sí en una red reguladora de genes (GRN). Estos GRN producen la dinámica transcripcional necesaria para activar y mantener el fenotipo que controlan, por lo que identificar los componentes y la estructura topológica del GRN es clave para comprender muchos procesos y funciones biológicas. Un GRN puede ser modelado como un conjunto de genes que interactúan y/o productos genéticos descritos por una red cuyos nodos son los genes y cuyos bordes describen la dirección y la forma de interacción (por ejemplo, activación/represión de la transcripción, modificación post-traduccional, etc.) 1. Las interacciones pueden expresarse entonces como modelos matemáticos parametrizados que describen el impacto que un gen regulador tiene en la producción de su(s) objetivo(s)2,3,4. La inferencia de un modelo GRN requiere tanto una inferencia de la estructura de la red de interacción como la estimación de los parámetros de interacción subyacentes. Se han desarrollado una variedad de métodos de inferencia computacional que ingieren datos de expresión génica de series temporales y producen modelos GRN5. Recientemente, se desarrolló un nuevo método de inferencia GRN, llamado Inherent Dynamics Pipeline (IDP), que utiliza datos de expresión génica de series temporales para producir modelos GRN con interacciones regulador-objetivo etiquetadas que son capaces de producir dinámicas que coinciden con la dinámica observada en los datos de expresión génica6. El IDP es un conjunto de herramientas conectadas linealmente en una tubería y se puede dividir en tres pasos: un paso de búsqueda de nodos que clasifica los genes en función de las características de expresión génica conocidas o sospechadas que están relacionadas con la función del GRN7,8, un paso de búsqueda de bordes que clasifica las relaciones regulatorias por pares8, 9, y un paso de búsqueda de redes que produce modelos GRN que son capaces de producir la dinámica observada10,11,12,13,14,15.

Como la mayoría de los métodos computacionales, el IDP requiere un conjunto de argumentos especificados por el usuario que dictan cómo se analizan los datos de entrada, y diferentes conjuntos de argumentos pueden producir diferentes resultados en los mismos datos. Por ejemplo, varios métodos, incluido el IDP, contienen argumentos que aplican algún umbral a los datos, y aumentar/disminuir este umbral entre ejecuciones sucesivas del método en particular puede dar lugar a resultados disímiles entre ejecuciones (véase nota complementaria 10: Métodos de inferencia de red de5). Comprender cómo cada argumento puede afectar el análisis y los resultados posteriores es importante para lograr una alta confianza en los resultados. A diferencia de la mayoría de los métodos de inferencia GRN, el IDP consiste en múltiples herramientas computacionales, cada una con su propio conjunto de argumentos que un usuario debe especificar y cada una con sus propios resultados. Si bien el IDP proporciona una amplia documentación sobre cómo parametrizar cada herramienta, la interdependencia de cada herramienta en la salida del paso anterior hace que la parametrización de toda la tubería sin análisis intermedios sea un desafío. Por ejemplo, es probable que los argumentos en los pasos Edge y Network Finding estén informados por conocimientos biológicos previos, por lo que dependerán del conjunto de datos y / o del organismo. Para interrogar los resultados intermedios, se necesitaría una comprensión básica de la programación, así como una comprensión profunda de todos los archivos de resultados y su contenido del IDP.

Inherent Dynamics Visualizer (IDV) es un paquete de visualización interactiva que se ejecuta en la ventana del explorador de un usuario y proporciona una forma para que los usuarios del IDP evalúen el impacto de sus elecciones de argumentos en los resultados de cualquier paso del IDP. El IDV navega por una complicada estructura de directorios producida por el IDP y recopila los datos necesarios para cada paso y presenta los datos en figuras y tablas intuitivas e interactivas para que el usuario las explore. Después de explorar estas pantallas interactivas, el usuario puede producir nuevos datos a partir de un paso de IDP que puede basarse en decisiones más informadas. Estos nuevos datos se pueden utilizar inmediatamente en el siguiente paso respectivo del IDP. Además, la exploración de los datos puede ayudar a determinar si un paso de IDP debe volver a ejecutarse con parámetros ajustados. El IDV puede mejorar el uso del IDP, así como hacer que el uso del IDP sea más intuitivo y accesible, como se demuestra al investigar el oscilador central GRN del ciclo celular de la levadura. El siguiente protocolo incluye los resultados de IDP de una ejecución de IDP totalmente parametrizada frente a un enfoque que incorpora el IDV después de las ejecuciones de cada paso de IDP, es decir, Node, Edge y Network Finding.

Protocol

1. Instale el IDP y el IDV NOTA: En esta sección se supone que docker, conda, pip y git ya están instalados (Tabla de materiales). En un terminal, ingrese el comando: git clone https://gitlab.com/biochron/inherent_dynamics_pipeline.git. Siga las instrucciones de instalación del archivo README del IDP. En un terminal, ingrese el comando: git clone https://gitlab.com/bertfordley/inherent_dynamics_visualizer.git.</em…

Representative Results

Los pasos descritos textualmente anteriormente y gráficamente en la Figura 1 se aplicaron al NÚCLEO oscilante GRN del ciclo celular de la levadura para ver si es posible descubrir modelos funcionales de GRN que sean capaces de producir la dinámica observada en los datos de expresión génica de series temporales recopilados en un estudio del ciclo celular de la levadura16. Para ilustrar cómo el IDV puede aclarar y mejorar la producción de IDP, los resultados, des…

Discussion

La inferencia de GRN es un desafío importante en biología de sistemas. El IDP genera GRN modelo a partir de datos de expresión génica utilizando una secuencia de herramientas que utilizan los datos de maneras cada vez más complejas. Cada paso requiere decisiones sobre cómo procesar los datos y qué elementos (genes, interacciones funcionales) se pasarán a la siguiente capa del IDP. Los impactos de estas decisiones en los resultados de los desplazados internos no son tan obvios. Para ayudar en este sentido, el IDV …

Disclosures

The authors have nothing to disclose.

Acknowledgements

Este trabajo fue financiado por la subvención R01 GM126555-01 de los NIH y la subvención DMS-1839299 de la NSF.

Materials

Docker https://docs.docker.com/get-docker/
Git https://git-scm.com/
Inherent Dynamics Pipeline https://gitlab.com/biochron/inherent_dynamics_pipeline
Inherent Dynamics Visualizer https://gitlab.com/bertfordley/inherent_dynamics_visualizer
Miniconda https://docs.conda.io/en/latest/miniconda.html
Pip https://pip.pypa.io/en/stable/

References

  1. Karlebach, G., Shamir, R. Modelling and analysis of gene regulatory networks. Nature Reviews Molecular Cell Biology. 9 (10), 770-780 (2008).
  2. Aijö, T., Lähdesmäki, H. Learning gene regulatory networks from gene expression measurements using non-parametric molecular kinetics. Bioinformatics. 25 (22), 2937-2944 (2009).
  3. Huynh-Thu, V. A., Sanguinetti, G. Combining tree-based and dynamical systems for the inference of gene regulatory networks. Bioinformatics. 31 (10), 1614-1622 (2015).
  4. Oates, C. J., et al. Causal network inference using biochemical kinetics. Bioinformatics. 30 (17), 468-474 (2014).
  5. Marbach, D., et al. Wisdom of crowds for robust gene network inference. Nature Methods. 9 (8), 796-804 (2012).
  6. . Inherent Dynamics Pipeline Available from: https://gitlab.com/biochron/inherent_dynamics_pipeline (2021)
  7. Motta, F. C., Moseley, R. C., Cummins, B., Deckard, A., Haase, S. B. Conservation of dynamic characteristics of transcriptional regulatory elements in periodic biological processes. bioRxiv. , (2020).
  8. . LEMpy Available from: https://gitlab.com/biochron/lempy (2021)
  9. McGoff, K. A., et al. The local edge machine: inference of dynamic models of gene regulation. Genome Biology. 17, 214 (2016).
  10. Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. Model rejection and parameter reduction via time series. SIAM Journal on Applied Dynamical Systems. 17 (2), 1589-1616 (2018).
  11. Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. Database of Dynamic Signatures Generated by Regulatory Networks (DSGRN). Lecture Notes in Computer Science. (including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). , 300-308 (2017).
  12. Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. DSGRN: Examining the dynamics of families of logical models. Frontiers in Physiology. 9. 9, 549 (2018).
  13. . DSGRN Available from: https://github.com/marciogameiro/DSGRN (2021)
  14. . Dsgm_Net_Gen Available from: https://github.com/breecummins/dsgrn_net_gen (2021)
  15. . Dsgrn_Net_Query Available from: https://github.com/breecummins/dsgrn_net_query (2021)
  16. Orlando, D. A., et al. Global control of cell-cycle transcription by coupled CDK and network oscillators. Nature. 453 (7197), 944-947 (2008).
  17. Monteiro, P. T., et al. YEASTRACT+: a portal for cross-species comparative genomics of transcription regulation in yeasts. Nucleic Acids Research. 48 (1), 642-649 (2020).
  18. de Bruin, R. A. M., et al. Constraining G1-specific transcription to late G1 phase: The MBF-associated corepressor Nrm1 acts via negative feedback. Molecular Cell. 23 (4), 483-496 (2006).
  19. Horak, C. E., et al. Complex transcriptional circuitry at the G1/S transition in Saccharomyces cerevisiae. Genes & Development. 16 (23), 3017-3033 (2002).
  20. Cherry, J. M., et al. Saccharomyces genome database: The genomics resource of budding yeast. Nucleic Acids Research. 40, 700-705 (2012).
  21. Zhu, G., et al. Two yeast forkhead genes regulate the cell cycle and pseudohyphal growth. Nature. 406 (6791), 90-94 (2000).
  22. Loy, C. J., Lydall, D., Surana, U. NDD1, a high-dosage suppressor of cdc28-1N, is essential for expression of a subset of late-S-phase-specific genes in saccharomyces cerevisiae. Molecular and Cellular Biology. 19 (5), 3312-3327 (1999).
  23. Cho, C. Y., Kelliher, C. M., Hasse, S. B. The cell-cycle transcriptional network generates and transmits a pulse of transcription once each cell cycle. Cell Cycle. 18 (4), 363-378 (2019).
  24. Smith, L. M., et al. An intrinsic oscillator drives the blood stage cycle of the malaria parasite Plasmodium falciparum. Science. 368 (6492), 754-759 (2020).
check_url/63084?article_type=t

Play Video

Cite This Article
Moseley, R. C., Campione, S., Cummins, B., Motta, F., Haase, S. B. Inherent Dynamics Visualizer, an Interactive Application for Evaluating and Visualizing Outputs from a Gene Regulatory Network Inference Pipeline. J. Vis. Exp. (178), e63084, doi:10.3791/63084 (2021).

View Video