Summary

Inherent Dynamics Visualizer ، تطبيق تفاعلي لتقييم وتصور المخرجات من خط أنابيب الاستدلال على شبكة تنظيم الجينات

Published: December 07, 2021
doi:

Summary

إن Inherent Dynamics Visualizer عبارة عن حزمة تصور تفاعلية تتصل بأداة استدلال شبكة تنظيمية جينية لتوليد محسن ومبسط لنماذج الشبكات الوظيفية. يمكن استخدام المتخيل لاتخاذ قرارات أكثر استنارة لوضع معلمات أداة الاستدلال ، وبالتالي زيادة الثقة في النماذج الناتجة.

Abstract

يعد تطوير نماذج الشبكات التنظيمية الجينية تحديا كبيرا في بيولوجيا النظم. وقد تم تطوير العديد من الأدوات الحسابية وخطوط الأنابيب لمواجهة هذا التحدي، بما في ذلك خط أنابيب الديناميكيات المتأصلة الذي تم تطويره حديثا. يتكون خط أنابيب الديناميكيات المتأصلة من العديد من الأدوات المنشورة سابقا والتي تعمل بشكل تآزري ومتصلة بطريقة خطية ، حيث يتم استخدام مخرجات أداة واحدة كمدخلات للأداة التالية. كما هو الحال مع معظم التقنيات الحسابية ، تتطلب كل خطوة من خطوات Inherent Dynamics Pipeline من المستخدم اتخاذ خيارات حول المعلمات التي ليس لها تعريف بيولوجي دقيق. يمكن أن تؤثر هذه الخيارات بشكل كبير على نماذج الشبكات التنظيمية الجينية التي ينتجها التحليل. لهذا السبب ، يمكن أن تساعد القدرة على تصور واستكشاف عواقب خيارات المعلمات المختلفة في كل خطوة على زيادة الثقة في الخيارات والنتائج. Inherent Dynamics Visualizer هي حزمة تصور شاملة تعمل على تبسيط عملية تقييم خيارات المعلمات من خلال واجهة تفاعلية داخل متصفح الويب. يمكن للمستخدم فحص مخرجات كل خطوة من خطوات خط الأنابيب بشكل منفصل ، وإجراء تغييرات بديهية استنادا إلى المعلومات المرئية ، والاستفادة من الإنتاج التلقائي لملفات الإدخال الضرورية لخط أنابيب الديناميكيات المتأصلة. يوفر Inherent Dynamics Visualizer مستوى لا مثيل له من الوصول إلى أداة معقدة للغاية لاكتشاف الشبكات التنظيمية الجينية من بيانات النسخ ذات السلاسل الزمنية.

Introduction

العديد من العمليات البيولوجية الهامة، مثل تمايز الخلايا والاستجابة البيئية، تحكمها مجموعات من الجينات التي تتفاعل مع بعضها البعض في شبكة تنظيم الجينات (GRN). تنتج GRNs هذه ديناميكيات النسخ اللازمة لتنشيط النمط الظاهري الذي تتحكم فيه والحفاظ عليه ، لذا فإن تحديد المكونات والبنية الطوبولوجية ل GRN هو المفتاح لفهم العديد من العمليات والوظائف البيولوجية. يمكن نمذجة GRN كمجموعة من الجينات المتفاعلة و / أو المنتجات الجينية التي تصفها شبكة تكون عقدها هي الجينات والتي تصف حوافها اتجاه وشكل التفاعل (على سبيل المثال ، تنشيط / قمع النسخ ، والتعديل بعد الترجمة ، وما إلى ذلك) 1. يمكن بعد ذلك التعبير عن التفاعلات كنماذج رياضية معلمة تصف تأثير الجين المنظم على إنتاج هدفه (أهدافه) 2،3،4. يتطلب الاستدلال على نموذج GRN كلا من الاستدلال على بنية شبكة التفاعل وتقدير معلمات التفاعل الأساسية. تم تطوير مجموعة متنوعة من طرق الاستدلال الحسابي التي تستوعب بيانات التعبير الجيني للسلاسل الزمنية ونماذج GRN الناتجة 5. في الآونة الأخيرة، تم تطوير طريقة استدلال GRN جديدة، تسمى خط أنابيب الديناميكيات المتأصلة (IDP)، والتي تستخدم بيانات التعبير الجيني للسلاسل الزمنية لإنتاج نماذج GRN مع تفاعلات مستهدفة من قبل المنظم قادرة على إنتاج ديناميكيات تتوافق مع الديناميكيات المرصودة في بيانات التعبير الجيني6. IDP عبارة عن مجموعة من الأدوات المتصلة خطيا بخط أنابيب ويمكن تقسيمها إلى ثلاث خطوات: خطوة العثور على العقدة التي تصنف الجينات بناء على خصائص التعبير الجيني المعروفة أو المشتبه في ارتباطها بوظيفة GRN7,8 ، وهي خطوة Edge Finding التي تصنف العلاقات التنظيمية الزوجية 8 ، 9 ، وخطوة العثور على الشبكة التي تنتج نماذج GRN القادرة على إنتاج الديناميكيات المرصودة10،11،12،13،14،15.

مثل معظم الطرق الحسابية ، يتطلب IDP مجموعة من الوسيطات المحددة من قبل المستخدم والتي تملي كيفية تحليل بيانات الإدخال ، ويمكن أن تؤدي مجموعات مختلفة من الوسيطات إلى نتائج مختلفة على نفس البيانات. على سبيل المثال، تحتوي عدة طرق، بما في ذلك IDP، على وسيطات تطبق بعض العتبة على البيانات، ويمكن أن تؤدي زيادة/تقليل هذه العتبة بين عمليات التشغيل المتتالية للطريقة المعينة إلى نتائج مختلفة بين عمليات التشغيل (انظر الملاحظة الملحق 10: طرق استدلال الشبكة من5). إن فهم كيفية تأثير كل حجة على التحليل والنتائج اللاحقة أمر مهم لتحقيق ثقة عالية في النتائج. على عكس معظم طرق الاستدلال GRN ، يتكون IDP من أدوات حسابية متعددة ، لكل منها مجموعة خاصة بها من الحجج التي يجب على المستخدم تحديدها ولكل منها نتائجها الخاصة. في حين أن IDP توفر وثائق شاملة حول كيفية وضع معلمات لكل أداة ، فإن الاعتماد المتبادل لكل أداة على مخرجات الخطوة السابقة يجعل تحديد معلمات خط الأنابيب بأكمله دون تحليلات وسيطة أمرا صعبا. على سبيل المثال ، من المرجح أن تكون الحجج في خطوات Edge و Network Finding مستنيرة بالمعرفة البيولوجية السابقة ، وبالتالي ستعتمد على مجموعة البيانات و / أو الكائن الحي. ولاستجواب النتائج الوسيطة، ستكون هناك حاجة إلى فهم أساسي للبرمجة، فضلا عن فهم عميق لجميع ملفات النتائج ومحتوياتها من IDP.

مصور الديناميكيات المتأصلة (IDV) هو حزمة تصور تفاعلية يتم تشغيلها في نافذة مستعرض المستخدم وتوفر طريقة لمستخدمي IDP لتقييم تأثير خيارات الوسيطة الخاصة بهم على النتائج من أي خطوة في IDP. يتنقل IDV في بنية دليل معقدة تنتجها IDP ويجمع البيانات اللازمة لكل خطوة ويقدم البيانات في أشكال وجداول بديهية وتفاعلية للمستخدم لاستكشافها. بعد استكشاف هذه الشاشات التفاعلية ، يمكن للمستخدم إنتاج بيانات جديدة من خطوة IDP التي يمكن أن تستند إلى قرارات أكثر استنارة. ويمكن بعد ذلك استخدام هذه البيانات الجديدة على الفور في الخطوة التالية ذات الصلة من IDP. بالإضافة إلى ذلك، يمكن أن يساعد استكشاف البيانات في تحديد ما إذا كان يجب إعادة تشغيل خطوة IDP باستخدام معلمات معدلة. يمكن ل IDV تعزيز استخدام IDP ، وكذلك جعل استخدام IDP أكثر سهولة وسهولة ، كما يتضح من خلال التحقيق في المذبذب الأساسي GRN لدورة خلية الخميرة. يتضمن البروتوكول التالي نتائج IDP من تشغيل IDP كامل المعلمات مقابل نهج يتضمن IDV بعد تشغيل كل خطوة IDP ، أي العقدة والحافة والعثور على الشبكة.

Protocol

1. تثبيت IDP و IDV ملاحظة: يفترض هذا القسم أن docker و conda و pip و git مثبتة بالفعل (جدول المواد). في المحطة الطرفية، أدخل الأمر: git clone https://gitlab.com/biochron/inherent_dynamics_pipeline.git. اتبع إرشادات التثبيت في الملف التمهيدي الخاص بموفر الهوية. في المحطة الطرفية، أ?…

Representative Results

تم تطبيق الخطوات الموصوفة نصيا أعلاه وبيانيا في الشكل 1 على GRN المتذبذب الأساسي لدورة خلية الخميرة لمعرفة ما إذا كان من الممكن اكتشاف نماذج GRN الوظيفية القادرة على إنتاج الديناميكيات التي لوحظت في بيانات التعبير الجيني للسلسلة الزمنية التي تم جمعها في دراسة دورة خلية الخم?…

Discussion

الاستدلال على GRNs هو تحد مهم في بيولوجيا النظم. يقوم IDP بإنشاء نماذج GRNs من بيانات التعبير الجيني باستخدام سلسلة من الأدوات التي تستخدم البيانات بطرق متزايدة التعقيد. تتطلب كل خطوة قرارات حول كيفية معالجة البيانات وما هي العناصر (الجينات والتفاعلات الوظيفية) التي سيتم تمريرها إلى الطبقة الت…

Divulgazioni

The authors have nothing to disclose.

Acknowledgements

تم تمويل هذا العمل من خلال منحة المعاهد الوطنية للصحة R01 GM126555-01 ومنحة NSF DMS-1839299.

Materials

Docker https://docs.docker.com/get-docker/
Git https://git-scm.com/
Inherent Dynamics Pipeline https://gitlab.com/biochron/inherent_dynamics_pipeline
Inherent Dynamics Visualizer https://gitlab.com/bertfordley/inherent_dynamics_visualizer
Miniconda https://docs.conda.io/en/latest/miniconda.html
Pip https://pip.pypa.io/en/stable/

Riferimenti

  1. Karlebach, G., Shamir, R. Modelling and analysis of gene regulatory networks. Nature Reviews Molecular Cell Biology. 9 (10), 770-780 (2008).
  2. Aijö, T., Lähdesmäki, H. Learning gene regulatory networks from gene expression measurements using non-parametric molecular kinetics. Bioinformatics. 25 (22), 2937-2944 (2009).
  3. Huynh-Thu, V. A., Sanguinetti, G. Combining tree-based and dynamical systems for the inference of gene regulatory networks. Bioinformatics. 31 (10), 1614-1622 (2015).
  4. Oates, C. J., et al. Causal network inference using biochemical kinetics. Bioinformatics. 30 (17), 468-474 (2014).
  5. Marbach, D., et al. Wisdom of crowds for robust gene network inference. Nature Methods. 9 (8), 796-804 (2012).
  6. . Inherent Dynamics Pipeline Available from: https://gitlab.com/biochron/inherent_dynamics_pipeline (2021)
  7. Motta, F. C., Moseley, R. C., Cummins, B., Deckard, A., Haase, S. B. Conservation of dynamic characteristics of transcriptional regulatory elements in periodic biological processes. bioRxiv. , (2020).
  8. . LEMpy Available from: https://gitlab.com/biochron/lempy (2021)
  9. McGoff, K. A., et al. The local edge machine: inference of dynamic models of gene regulation. Genome Biology. 17, 214 (2016).
  10. Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. Model rejection and parameter reduction via time series. SIAM Journal on Applied Dynamical Systems. 17 (2), 1589-1616 (2018).
  11. Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. Database of Dynamic Signatures Generated by Regulatory Networks (DSGRN). Lecture Notes in Computer Science. (including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). , 300-308 (2017).
  12. Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. DSGRN: Examining the dynamics of families of logical models. Frontiers in Physiology. 9. 9, 549 (2018).
  13. . DSGRN Available from: https://github.com/marciogameiro/DSGRN (2021)
  14. . Dsgm_Net_Gen Available from: https://github.com/breecummins/dsgrn_net_gen (2021)
  15. . Dsgrn_Net_Query Available from: https://github.com/breecummins/dsgrn_net_query (2021)
  16. Orlando, D. A., et al. Global control of cell-cycle transcription by coupled CDK and network oscillators. Nature. 453 (7197), 944-947 (2008).
  17. Monteiro, P. T., et al. YEASTRACT+: a portal for cross-species comparative genomics of transcription regulation in yeasts. Nucleic Acids Research. 48 (1), 642-649 (2020).
  18. de Bruin, R. A. M., et al. Constraining G1-specific transcription to late G1 phase: The MBF-associated corepressor Nrm1 acts via negative feedback. Molecular Cell. 23 (4), 483-496 (2006).
  19. Horak, C. E., et al. Complex transcriptional circuitry at the G1/S transition in Saccharomyces cerevisiae. Genes & Development. 16 (23), 3017-3033 (2002).
  20. Cherry, J. M., et al. Saccharomyces genome database: The genomics resource of budding yeast. Nucleic Acids Research. 40, 700-705 (2012).
  21. Zhu, G., et al. Two yeast forkhead genes regulate the cell cycle and pseudohyphal growth. Nature. 406 (6791), 90-94 (2000).
  22. Loy, C. J., Lydall, D., Surana, U. NDD1, a high-dosage suppressor of cdc28-1N, is essential for expression of a subset of late-S-phase-specific genes in saccharomyces cerevisiae. Molecular and Cellular Biology. 19 (5), 3312-3327 (1999).
  23. Cho, C. Y., Kelliher, C. M., Hasse, S. B. The cell-cycle transcriptional network generates and transmits a pulse of transcription once each cell cycle. Cell Cycle. 18 (4), 363-378 (2019).
  24. Smith, L. M., et al. An intrinsic oscillator drives the blood stage cycle of the malaria parasite Plasmodium falciparum. Science. 368 (6492), 754-759 (2020).
check_url/it/63084?article_type=t

Play Video

Citazione di questo articolo
Moseley, R. C., Campione, S., Cummins, B., Motta, F., Haase, S. B. Inherent Dynamics Visualizer, an Interactive Application for Evaluating and Visualizing Outputs from a Gene Regulatory Network Inference Pipeline. J. Vis. Exp. (178), e63084, doi:10.3791/63084 (2021).

View Video