Summary

تحليل بيانات تسلسل من دفعة الخميرة 2-الهجين شاشات المعلوماتي

Published: June 28, 2018
doi:

Summary

التسلسل بالغ السكان الخميرة المختارة للتفاعلات الإيجابية الخميرة 2-الهجين يحتمل أن تكون غلة ثروة معلومات حول التفاعل شريك البروتينات. هنا، يمكننا وصف تشغيل أدوات المعلوماتية الحيوية المحددة والبرامج المحدثة المخصصة لتحليل بيانات تسلسل من هذه الشاشات.

Abstract

ونحن قد تكيفت المقايسة 2-الهجين الخميرة في الوقت نفسه كشف العشرات من تفاعلات البروتين عابرة وثابتة ضمن شاشة واحدة تستخدم الفائق قصيرة-قراءة تسلسل الحمض النووي. مجموعات البيانات الناتجة عن تسلسل يمكن أن تتبع ما الجينات في عدد سكان التي هي إثراء من خلال التحديد للتفاعلات الإيجابية الخميرة 2-الهجين، بل أيضا إعطاء معلومات مفصلة حول المجالات الفرعية ذات الصلة من البروتينات كافية للتفاعل. وهنا يصف لنا مجموعة كاملة من البرامج القائمة بذاتها التي تسمح لغير الخبراء لأداء جميع المعلوماتية الحيوية والخطوات الإحصائية لمعالجة وتحليل ملفات فستق تسلسل الحمض النووي من تحليل 2-هجين خميرة دفعة. خطوات المعالجة المشمولة بهذه البرامج وتشمل: ما يلي تسلسل 1) رسم الخرائط والعد المقابلة لكل مرشح البروتين المشفرة داخل مكتبة فريسة 2-الهجين خميرة؛ 2) برنامج تحليل الإحصائي الذي يقيم في التشكيلات الجانبية للإثراء؛ و 3) أدوات لدراسة الإطار متعدية الجنسيات والموقف داخل منطقة الترميز لكل بلازميد المخصب الذي يشفر البروتينات المتفاعلة للفائدة.

Introduction

نهج واحد لاكتشاف تفاعلات البروتين هو الإنزيم (Y2H) 2-الهجين الخميرة، الذي يستغل هندسيا خلايا الخميرة التي تنمو فقط عندما وتين اهتمام بربط جزء من شريك المتفاعلة1. الآن يمكن أن يتم الكشف عن عدة Y2H التفاعلات مع مساعدة ضخمة يسلسل الفائق موازية. العديد من الأشكال وقد تم وصف2،3،،من45 بما في ذلك وضعنا وتزرع فيها السكان دفعة واحدة في ظل الظروف التي حدد للخميرة التي تحتوي على البلازميدات التي تنتج إيجابية التفاعل Y2H6. سير العمل نحن البلدان المتقدمة النمو، يسمى ديبن (التخصيب الحيوي لشبكات التقييم من البروتين)، ويحدد إينتيراكتوميس التفاضلية من نفس مكتبات فريسة لتحديد البروتينات التي تتفاعل مع واحد من البروتين (أو المجال) مقابل. بروتين آخر أو مجال المسخ كونفورماتيونالي متميزة. إحدى الخطوات الرئيسية في سير العمل هذا هو التجهيز السليم وتحليل بيانات تسلسل الحمض النووي. يمكن أن تكون بعض المعلومات المستقاة بمجرد إحصاء عدد القراءات لكل الجينات سواء قبل أو بعد التحديد التفاعلات Y2H بطريقة مشابهة لتجربة تسلسل الحمض النووي الريبي. ومع ذلك، يمكن استخراج معلومات متعمقة أكثر بكثير من مجموعات البيانات هذه بما في ذلك المعلومات المتعلقة بالمجال الفرعي بروتين معين التي قادرة على إنتاج تفاعل Y2H. وباﻹضافة إلى ذلك، بينما النهج ديبن الذي قيمة، تحليل العديد من عينة replicates يمكن أن تكون مرهقة ومكلفة. هو التخفيف من حدة هذه المشكلة باستخدام نموذج إحصائي تم تطويره خصيصا لمجموعات البيانات ديبن حيث هو عدد replicates محدودة6. لجعل معالجة وتحليل مجموعات البيانات تسلسل الحمض النووي موثوق بها وكاملة وقوية وموجودا للمحققين دون الخبرة المعلوماتية الحيوية، قمنا بتطوير مجموعة من البرامج التي تغطي كافة الخطوات للتحليل.

ويشمل هذا الجناح من البرامج القائمة بذاتها التي يتم تشغيلها على أجهزة كمبيوتر سطح المكتب MAPster وديبن و Stat_Maker. MAPster هو واجهة مستخدم الرسومية التي يسمح كل ملف فستق في قائمة الانتظار لرسم خرائط الجينوم استخدام برنامج HISAT27، إنتاج ملف.sam قياسية للاستخدام في تطبيقات المتلقين للمعلومات. وقد ديبن عدة وحدات. وهو يعين والتهم ما يلي المقابلة للجينات خاصة مماثلة للقياس الكمي نوع تسلسل الحمض النووي الريبي استخدام الوحدة النمطية ‘العد الجينات’. كما تستخرج في تسلسل المقابلة على مفترق الطرق بين المجال النسخي Gal4 وتسلسل فريسة وجمع موقف تلك الوصلات للسماح بعمليات التفتيش بمقارنة الجداول والرسوم البيانية (باستخدام الوحدة النمطية ‘Junction_Make’) يسمح الوحدة النمطية ‘Blast_Query’ التفتيش سهلة، كوانتيتيشن، ومقارنة التسلسلات تقاطع مفرق Gal4. تقييم Stat_Maker على ما يلي كل الجينات إثراء البيانات إحصائيا كوسيلة لتحديد أولويات المحتمل Y2H مرات. وهنا، نحن تصف كيفية استخدام هذه البرامج لتحليل تسلسل الحمض النووي تجربة البيانات من Y2H ديبن الكامل. تتوفر إصدارات ديبن لتشغيلها على أنظمة الكمبيوتر، ماك و لينكس. برامج أخرى مثل برنامج رسم الخرائط MAPster ووحدة الإحصاء ديبن Stat_Maker تعتمد على subroutines التي تعمل تحت Unix وتتوفر فقط على أنظمة Mac و linux.

Protocol

1-تعيين الملفات فستق ملاحظة: ديبن البرمجيات، فضلا عن العديد من البرامج المعلوماتية الحيوية استخدام بيانات تسلسل الحمض النووي حيث تم تعيين تسلسل كل قراءة لموقفها في مرجع الحمض النووي. يمكن استخدام مجموعة متنوعة من برامج رسم الخرائط لهذا بما في ذلك واجهة MAPster هنا أن يستخدم الب?…

Representative Results

تعيين البيانات فستق: الخطوة الأولىفي عمليا جميع خ ع تطبيقاته ديبن الإخراج الأولى هو ملف من ما يلي تسلسل قصيرة التي يجب تعيينها بالمحاذاة للجينوم، ترانسكريبتوميك، أو أخرى مرجعية الحمض النووي8. في الآونة الأخيرة، تم تطوير هذا البرنامج المحاذاة HISAT2…

Discussion

جناح البرامج المشروحة هنا يسمح أحد لمعالجة وتحليل بيانات تسلسل الحمض النووي الإنتاجية العالية من تجربة ديبن تماما. البرنامج الأول الذي استخدم هو MAPster، الذي يأخذ على ما يلي تسلسل الحمض النووي في الملفات القياسية فستق وخرائط موقفهم على مرجع الحمض النووي للتجهيز النهائي بمجموعة كاملة من ال?…

Disclosures

The authors have nothing to disclose.

Acknowledgements

هذا العمل كان يدعمها في “المعاهد الوطنية للصحة”: R21 المعاهد الوطنية للصحة EB021870-01A1 و “منحة مشروع بحوث جبهة الخلاص الوطني”: 1517110.

Materials

Mapster https://github.com/emptyewer/MAPster/releases
DEEPN software https://github.com/emptyewer/DEEPN/releases
Statmaker https://github.com/emptyewer/DEEPN/releases
Minimum computer system Apple Mac Intel Core i5 or better
4 Gb RAM or better
500 Gb Disk spce or better
OS 10.10 or higher
Dell Intel i5-7400 or better
4 Gb RAM or better
500 Gb Disk spce or better
Windows 7 or higher

References

  1. Fields, S., Song, O. A novel genetic system to detect protein-protein interactions. Nature. 340 (6230), 245-246 (1989).
  2. Rajagopala, S. V. Mapping the Protein-Protein Interactome Networks Using Yeast Two-Hybrid Screens. Advances in Experimental Medicine and Biology. 883, 187-214 (2015).
  3. Weimann, M., et al. A Y2H-seq approach defines the human protein methyltransferase interactome. Nature Methods. 10 (4), 339-342 (2013).
  4. Yachie, N., et al. Pooled-matrix protein interaction screens using Barcode Fusion Genetics. Molecular Systems Biology. 12 (4), 863 (2016).
  5. Trigg, S. A., et al. CrY2H-seq: a massively multiplexed assay for deep-coverage interactome mapping. Nature Methods. , (2017).
  6. Pashkova, N., et al. DEEPN as an Approach for Batch Processing of Yeast 2-Hybrid Interactions. Cell Reports. 17 (1), 303-315 (2016).
  7. Kim, D., Langmead, B., Salzberg, S. L. HISAT: a fast spliced aligner with low memory requirements. Nature Methods. 12 (4), 357-360 (2015).
  8. Reinert, K., Langmead, B., Weese, D., Evers, D. J. Alignment of Next-Generation Sequencing Reads. Annual Review of Genomics and Human Genetics. 16, 133-151 (2015).
  9. Pertea, M., Kim, D., Pertea, G. M., Leek, J. T., Salzberg, S. L. Transcript-level expression analysis of RNA-seq experiments with HISAT, StringTie and Ballgown. Nature Protocols. 11 (9), 1650-1667 (2016).
  10. Conesa, A., et al. A survey of best practices for RNA-seq data analysis. Genome Biology. 17, 13 (2016).

Play Video

Cite This Article
Krishnamani, V., Peterson, T. A., Piper, R. C., Stamnes, M. A. Informatic Analysis of Sequence Data from Batch Yeast 2-Hybrid Screens. J. Vis. Exp. (136), e57802, doi:10.3791/57802 (2018).

View Video