Summary

अंतर्निहित Dynamics Visualizer, एक जीन विनियामक नेटवर्क अनुमान पाइपलाइन से आउटपुट का मूल्यांकन और विज़ुअलाइज़िंग के लिए एक इंटरैक्टिव अनुप्रयोग

Published: December 07, 2021
doi:

Summary

अंतर्निहित Dynamics Visualizer एक इंटरैक्टिव विज़ुअलाइज़ेशन पैकेज है जो कार्यात्मक नेटवर्क मॉडल की बढ़ी हुई, सुव्यवस्थित पीढ़ी के लिए एक जीन नियामक नेटवर्क अनुमान उपकरण से जुड़ता है। विज़ुअलाइज़र का उपयोग अनुमान उपकरण को पैरामीटर करने के लिए अधिक सूचित निर्णय लेने के लिए किया जा सकता है, इस प्रकार परिणामी मॉडल में आत्मविश्वास बढ़ जाता है।

Abstract

जीन नियामक नेटवर्क मॉडल विकसित करना सिस्टम जीव विज्ञान में एक बड़ी चुनौती है। इस चुनौती से निपटने के लिए कई कम्प्यूटेशनल उपकरण और पाइपलाइनों को विकसित किया गया है, जिसमें नव विकसित अंतर्निहित गतिशीलता पाइपलाइन भी शामिल है। अंतर्निहित Dynamics पाइपलाइन में कई पहले प्रकाशित उपकरण होते हैं जो synergistically काम करते हैं और एक रैखिक फैशन में जुड़े होते हैं, जहां एक उपकरण के आउटपुट का उपयोग निम्न उपकरण के लिए इनपुट के रूप में किया जाता है। अधिकांश कम्प्यूटेशनल तकनीकों के साथ, अंतर्निहित Dynamics पाइपलाइन के प्रत्येक चरण के लिए उपयोगकर्ता को उन मापदंडों के बारे में विकल्प बनाने की आवश्यकता होती है जिनके पास सटीक जैविक परिभाषा नहीं है। ये विकल्प विश्लेषण द्वारा उत्पादित जीन नियामक नेटवर्क मॉडल को काफी हद तक प्रभावित कर सकते हैं। इस कारण से, प्रत्येक चरण में विभिन्न पैरामीटर विकल्पों के परिणामों की कल्पना करने और उनका पता लगाने की क्षमता विकल्पों और परिणामों में विश्वास बढ़ाने में मदद कर सकती है। अंतर्निहित Dynamics Visualizer एक व्यापक विज़ुअलाइज़ेशन पैकेज है जो वेब ब्राउज़र के भीतर एक इंटरैक्टिव इंटरफ़ेस के माध्यम से पैरामीटर विकल्पों का मूल्यांकन करने की प्रक्रिया को सुव्यवस्थित करता है। उपयोगकर्ता अलग से पाइपलाइन के प्रत्येक चरण के आउटपुट की जांच कर सकते हैं, दृश्य जानकारी के आधार पर सहज ज्ञान युक्त परिवर्तन कर सकते हैं, और अंतर्निहित Dynamics पाइपलाइन के लिए आवश्यक इनपुट फ़ाइलों के स्वचालित उत्पादन से लाभ उठा सकते हैं। अंतर्निहित Dynamics Visualizer समय श्रृंखला transcriptomic डेटा से जीन नियामक नेटवर्क की खोज के लिए एक अत्यधिक जटिल उपकरण के लिए उपयोग का एक अद्वितीय स्तर प्रदान करता है।

Introduction

कई महत्वपूर्ण जैविक प्रक्रियाएं, जैसे कि सेल भेदभाव और पर्यावरणीय प्रतिक्रिया, जीन के सेट द्वारा नियंत्रित की जाती हैं जो जीन नियामक नेटवर्क (जीआरएन) में एक दूसरे के साथ बातचीत करती हैं। ये जीआरएन उन फेनोटाइप को सक्रिय करने और बनाए रखने के लिए आवश्यक ट्रांसक्रिप्शनल गतिशीलता का उत्पादन करते हैं जिन्हें वे नियंत्रित करते हैं, इसलिए जीआरएन के घटकों और टोपोलॉजिकल संरचना की पहचान करना कई जैविक प्रक्रियाओं और कार्यों को समझने के लिए महत्वपूर्ण है। एक जीआरएन को एक नेटवर्क द्वारा वर्णित इंटरैक्शन जीन और / या जीन उत्पादों के एक सेट के रूप में मॉडलकिया जा सकता है, जिनके नोड्स जीन हैं और जिनके किनारे इंटरैक्शन की दिशा और रूप का वर्णन करते हैं (उदाहरण के लिए, प्रतिलेखन के सक्रियण / दमन, पोस्ट-ट्रांसलेशनल संशोधन, आदि) 1. इंटरैक्शन तो पैरामीटर गणितीय मॉडल के रूप में व्यक्त किया जा सकता है प्रभाव एक विनियमन जीन अपने लक्ष्य (ओं) 2,3,4 के उत्पादन पर है का वर्णन. एक जीआरएन मॉडल के अनुमान के लिए इंटरैक्शन नेटवर्क की संरचना और अंतर्निहित इंटरैक्शन पैरामीटर के अनुमान दोनों का अनुमान लगाने की आवश्यकता होती है। कम्प्यूटेशनल अनुमान विधियों की एक किस्म विकसित की गई है जो समय श्रृंखला जीन अभिव्यक्ति डेटा और आउटपुट जीआरएन मॉडल 5 को निगलती है। हाल ही में, एक नई जीआरएन अनुमान विधि विकसित की गई थी, जिसे अंतर्निहित गतिशीलता पाइपलाइन (आईडीपी) कहा जाता है, जो लेबल किए गए नियामक-लक्ष्य इंटरैक्शन के साथ जीआरएन मॉडल का उत्पादन करने के लिए समय श्रृंखला जीन अभिव्यक्ति डेटा का उपयोग करता है जो जीन अभिव्यक्ति डेटा 6 में देखी गई गतिशीलता से मेल खाने वाली गतिशीलता का उत्पादन करने में सक्षम हैं। आईडीपी एक पाइपलाइन में रैखिक रूप से जुड़े उपकरणों का एक सूट है और इसे तीन चरणों में विभाजित किया जा सकता है: एक नोड खोज चरण जो जीन अभिव्यक्ति विशेषताओं के आधार पर जीन को रैंक करता है जो जीआरएन 7, 8 के कार्य से संबंधित होने के लिए जाना जाता है या संदेह करता है, एक एज फाइंडिंग चरण जो युग्मवार नियामक संबंधों को रैंक करता है8, 9, और एक नेटवर्क ढूँढना चरण जो GRN मॉडल का उत्पादन करता है जो मनाया dynamics10,11,12,13,14,15 का उत्पादन करने में सक्षम हैं।

अधिकांश कम्प्यूटेशनल विधियों की तरह, आईडीपी को उपयोगकर्ता-निर्दिष्ट तर्कों के एक सेट की आवश्यकता होती है जो यह निर्धारित करते हैं कि इनपुट डेटा का विश्लेषण कैसे किया जाता है, और तर्कों के विभिन्न सेट एक ही डेटा पर अलग-अलग परिणाम उत्पन्न कर सकते हैं। उदाहरण के लिए, IDP सहित कई विधियों में ऐसे तर्क होते हैं जो डेटा पर कुछ थ्रेशोल्ड लागू करते हैं, और विशेष विधि के क्रमिक रनों के बीच इस थ्रेशोल्ड को बढ़ाने/घटाने के परिणामस्वरूप रन के बीच असमान परिणाम हो सकते हैं (पूरक नोट 10: नेटवर्क अनुमान विधियाँ of5)। यह समझना कि प्रत्येक तर्क विश्लेषण और बाद के परिणामों को कैसे प्रभावित कर सकता है, परिणामों में उच्च आत्मविश्वास प्राप्त करने के लिए महत्वपूर्ण है। अधिकांश जीआरएन अनुमान विधियों के विपरीत, आईडीपी में कई कम्प्यूटेशनल उपकरण होते हैं, जिनमें से प्रत्येक के पास तर्कों का अपना सेट होता है जो उपयोगकर्ता को निर्दिष्ट करना चाहिए और प्रत्येक के अपने स्वयं के परिणाम होते हैं। जबकि आईडीपी प्रत्येक उपकरण को पैरामीटर करने के तरीके पर व्यापक प्रलेखन प्रदान करता है, पिछले चरण के आउटपुट पर प्रत्येक उपकरण की अंतर-निर्भरता मध्यवर्ती विश्लेषण के बिना पूरी पाइपलाइन को पैरामीटर करने को चुनौतीपूर्ण बनाती है। उदाहरण के लिए, एज और नेटवर्क फाइंडिंग चरणों में तर्कों को पूर्व जैविक ज्ञान द्वारा सूचित किए जाने की संभावना है, और इसलिए डेटासेट और / या जीव पर निर्भर करेगा। मध्यवर्ती परिणामों से पूछताछ करने के लिए, प्रोग्रामिंग की एक बुनियादी समझ, साथ ही साथ आईडीपी से सभी परिणाम फ़ाइलों और उनकी सामग्री की गहरी समझ की आवश्यकता होगी।

अंतर्निहित Dynamics Visualizer (IDV) एक इंटरैक्टिव विज़ुअलाइज़ेशन पैकेज है जो उपयोगकर्ता की ब्राउज़र विंडो में चलता है और IDP के उपयोगकर्ताओं को IDP में किसी भी चरण से परिणामों पर उनके तर्क विकल्पों के प्रभाव का आकलन करने का एक तरीका प्रदान करता है। आईडीवी आईडीपी द्वारा उत्पादित एक जटिल निर्देशिका संरचना को नेविगेट करता है और प्रत्येक चरण के लिए आवश्यक डेटा एकत्र करता है और उपयोगकर्ता का पता लगाने के लिए सहज और इंटरैक्टिव आंकड़ों और तालिकाओं में डेटा प्रस्तुत करता है। इन इंटरैक्टिव डिस्प्ले की खोज करने के बाद, उपयोगकर्ता एक आईडीपी चरण से नए डेटा का उत्पादन कर सकता है जो अधिक सूचित निर्णयों पर आधारित हो सकता है। इन नए डेटा को तुरंत आईडीपी के अगले संबंधित चरण में उपयोग किया जा सकता है। साथ ही, डेटा की खोज यह निर्धारित करने में मदद कर सकती है कि क्या कोई IDP चरण समायोजित पैरामीटर के साथ पुन: चलाएँ। आईडीवी आईडीपी के उपयोग को बढ़ा सकता है, साथ ही आईडीपी के उपयोग को अधिक सहज और पहुंच योग्य बना सकता है, जैसा कि खमीर सेल-चक्र के कोर थरथरानवाला जीआरएन की जांच करके प्रदर्शित किया गया है। निम्न प्रोटोकॉल में एक पूरी तरह से पैरामीटर किए गए IDP रन बनाम एक दृष्टिकोण से IDP परिणाम शामिल हैं जो प्रत्येक IDP चरण के रन के बाद IDV को शामिल करता है, यानी, नोड, एज और नेटवर्क ढूँढना।

Protocol

1. IDP और IDV स्थापित करें नोट:: यह अनुभाग मानता है कि डॉकर, कोंडा, पाइप, और गिट पहले से ही स्थापित हैं (सामग्री की तालिका)। एक टर्मिनल में, कमांड दर्ज करें: गिट क्लोन https://gitlab.com/biochron/inherent_dynamics_…

Representative Results

चित्रा 1 में ऊपर और ग्राफिक रूप से वर्णित चरणों को खमीर सेल-चक्र के कोर दोलन जीआरएन पर लागू किया गया था, यह देखने के लिए कि क्या कार्यात्मक जीआरएन मॉडल की खोज करना संभव है जो खमीर सेल-चक्र अध्यय…

Discussion

जीआरएन का अनुमान सिस्टम जीव विज्ञान में एक महत्वपूर्ण चुनौती है। आईडीपी जीन अभिव्यक्ति डेटा से मॉडल जीआरएन उत्पन्न करता है जो उपकरणों के अनुक्रम का उपयोग करता है जो डेटा का उपयोग तेजी से जटिल तरीकों स…

Disclosures

The authors have nothing to disclose.

Acknowledgements

इस काम को एनआईएच अनुदान R01 GM126555-01 और NSF अनुदान DMS-1839299 द्वारा वित्त पोषित किया गया था।

Materials

Docker https://docs.docker.com/get-docker/
Git https://git-scm.com/
Inherent Dynamics Pipeline https://gitlab.com/biochron/inherent_dynamics_pipeline
Inherent Dynamics Visualizer https://gitlab.com/bertfordley/inherent_dynamics_visualizer
Miniconda https://docs.conda.io/en/latest/miniconda.html
Pip https://pip.pypa.io/en/stable/

References

  1. Karlebach, G., Shamir, R. Modelling and analysis of gene regulatory networks. Nature Reviews Molecular Cell Biology. 9 (10), 770-780 (2008).
  2. Aijö, T., Lähdesmäki, H. Learning gene regulatory networks from gene expression measurements using non-parametric molecular kinetics. Bioinformatics. 25 (22), 2937-2944 (2009).
  3. Huynh-Thu, V. A., Sanguinetti, G. Combining tree-based and dynamical systems for the inference of gene regulatory networks. Bioinformatics. 31 (10), 1614-1622 (2015).
  4. Oates, C. J., et al. Causal network inference using biochemical kinetics. Bioinformatics. 30 (17), 468-474 (2014).
  5. Marbach, D., et al. Wisdom of crowds for robust gene network inference. Nature Methods. 9 (8), 796-804 (2012).
  6. . Inherent Dynamics Pipeline Available from: https://gitlab.com/biochron/inherent_dynamics_pipeline (2021)
  7. Motta, F. C., Moseley, R. C., Cummins, B., Deckard, A., Haase, S. B. Conservation of dynamic characteristics of transcriptional regulatory elements in periodic biological processes. bioRxiv. , (2020).
  8. . LEMpy Available from: https://gitlab.com/biochron/lempy (2021)
  9. McGoff, K. A., et al. The local edge machine: inference of dynamic models of gene regulation. Genome Biology. 17, 214 (2016).
  10. Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. Model rejection and parameter reduction via time series. SIAM Journal on Applied Dynamical Systems. 17 (2), 1589-1616 (2018).
  11. Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. Database of Dynamic Signatures Generated by Regulatory Networks (DSGRN). Lecture Notes in Computer Science. (including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). , 300-308 (2017).
  12. Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. DSGRN: Examining the dynamics of families of logical models. Frontiers in Physiology. 9. 9, 549 (2018).
  13. . DSGRN Available from: https://github.com/marciogameiro/DSGRN (2021)
  14. . Dsgm_Net_Gen Available from: https://github.com/breecummins/dsgrn_net_gen (2021)
  15. . Dsgrn_Net_Query Available from: https://github.com/breecummins/dsgrn_net_query (2021)
  16. Orlando, D. A., et al. Global control of cell-cycle transcription by coupled CDK and network oscillators. Nature. 453 (7197), 944-947 (2008).
  17. Monteiro, P. T., et al. YEASTRACT+: a portal for cross-species comparative genomics of transcription regulation in yeasts. Nucleic Acids Research. 48 (1), 642-649 (2020).
  18. de Bruin, R. A. M., et al. Constraining G1-specific transcription to late G1 phase: The MBF-associated corepressor Nrm1 acts via negative feedback. Molecular Cell. 23 (4), 483-496 (2006).
  19. Horak, C. E., et al. Complex transcriptional circuitry at the G1/S transition in Saccharomyces cerevisiae. Genes & Development. 16 (23), 3017-3033 (2002).
  20. Cherry, J. M., et al. Saccharomyces genome database: The genomics resource of budding yeast. Nucleic Acids Research. 40, 700-705 (2012).
  21. Zhu, G., et al. Two yeast forkhead genes regulate the cell cycle and pseudohyphal growth. Nature. 406 (6791), 90-94 (2000).
  22. Loy, C. J., Lydall, D., Surana, U. NDD1, a high-dosage suppressor of cdc28-1N, is essential for expression of a subset of late-S-phase-specific genes in saccharomyces cerevisiae. Molecular and Cellular Biology. 19 (5), 3312-3327 (1999).
  23. Cho, C. Y., Kelliher, C. M., Hasse, S. B. The cell-cycle transcriptional network generates and transmits a pulse of transcription once each cell cycle. Cell Cycle. 18 (4), 363-378 (2019).
  24. Smith, L. M., et al. An intrinsic oscillator drives the blood stage cycle of the malaria parasite Plasmodium falciparum. Science. 368 (6492), 754-759 (2020).
check_url/63084?article_type=t

Play Video

Cite This Article
Moseley, R. C., Campione, S., Cummins, B., Motta, F., Haase, S. B. Inherent Dynamics Visualizer, an Interactive Application for Evaluating and Visualizing Outputs from a Gene Regulatory Network Inference Pipeline. J. Vis. Exp. (178), e63084, doi:10.3791/63084 (2021).

View Video