June 28th, 2018
التسلسل بالغ السكان الخميرة المختارة للتفاعلات الإيجابية الخميرة 2-الهجين يحتمل أن تكون غلة ثروة معلومات حول التفاعل شريك البروتينات. هنا، يمكننا وصف تشغيل أدوات المعلوماتية الحيوية المحددة والبرامج المحدثة المخصصة لتحليل بيانات تسلسل من هذه الشاشات.
يمكن أن تساعد هذه الطريقة في الإجابة على الأسئلة الرئيسية حول طبيعة تفاعلات البروتين. الميزة الرئيسية لهذه التقنية هي أن جميع عمليات معالجة المعلوماتية الحيوية يتم تشغيلها بواسطة واجهة سهلة الاستخدام. يستخدم هذا البرنامج واجهة مستخدم رسومية سهلة الاستخدام يمكن لعلماء الأحياء الجزيئية وعلماء الأحياء الخلوية وعلماء الكيمياء الحيوية الذين ليس لديهم الكثير من الخبرة في المعلوماتية الحيوية استخدامها لإكمال تحليلهم بسهولة.
بشكل عام ، يكافح الأفراد الجدد في معالجة بيانات التسلسل لأن برامج الكمبيوتر مربكة ومرهقة. اعتقدنا أن جعل المعلوماتية سهلة سيجعل التقنية بأكملها أكثر سهولة وفائدة. تتمثل الخطوة الأولى في هذا الإجراء في تنزيل برنامج MAPster وتثبيته كما هو موضح في بروتوكول النص.
بعد ذلك ، أدخل الملفات والمعلمات المطلوبة من خلال علامة التبويب الرئيسية. حدد الزر الزوجي المناسب لإدخال الملفات لتحليل DEEPN. قم بتشغيل خيار Pairwise إلى Off للتشغيل بتنسيق قراءة واحدة.
قم بتحميل الملفات في MAPster عن طريق السحب والإفلات في النافذة المناسبة. من الجينومات المفهرسة المدرجة في مربع الجينوم ، حدد مصدر جينوم DNA مرجعي يتوافق مع مصدر إدخالات مكتبة فريسة Y2H. نظرا لأن HISAT2 يدعم الخيوط المتعددة، ضمن مربع مؤشرات الترابط، حدد عدد عمليات الكمبيوتر التي سيتم تخصيصها لبرنامج الخرائط.
حدد اسم ملف الإخراج ، يوصى باستخدام اسم قصير ولكنه وصفي بدون مسافة أو أحرف خاصة حيث سيتم استخدام اسم الملف هذا طوال عملية DEEPN. باستخدام الزر فتح دليل الإخراج ، حدد مجلدا لإخراج الملفات المعينة. بمجرد تحديد الملفات والمعلمات المناسبة، استخدم الزر إضافة إلى قائمة الانتظار لإضافة مهمة التعيين إلى قائمة انتظار المهام.
بمجرد إدخال جميع المهام في قائمة انتظار الوظائف، انقر فوق الزر تشغيل قائمة الانتظار. ابدأ هذا التحليل بفتح برنامج DEEPN. من النافذة الرئيسية ، حدد معلومات مكتبة الفريسة المقابلة من مربع التحديد العلوي.
حدد مجلدا يمكن أن تنتقل إليه الملفات التي تمت معالجتها بالنقر فوق الزر مجلد العمل والانتقال إلى دليل المجلدات. بمجرد تحديد مجلد العمل ، سيقوم DEEPN بإنشاء ثلاثة مجلدات فرعية بالأسماء المشار إليها. للتحليل الناجح، تأكد من وضع ملفات SAM الصحيحة في المجلدات الصحيحة ومعرفة الملفات التي تم تعيينها وقراءتها غير المعينة.
إذا كنت تستخدم ملفات sam التي تحتوي على قراءات معينة وغير معينة، مثل تلك التي تم إنتاجها باستخدام الإعدادات الافتراضية لبرنامج MAPster، ضعها في مجلد sam_files. ابدأ المعالجة بالنقر فوق الزر Gene Count plus Junction Make. يعتمد وقت المعالجة على حجم وعدد ملفات بيانات التسلسل وسرعة معالجة الكمبيوتر المستخدم.
بمجرد معالجة DEEPN للبيانات ، سيتم إنشاء مجموعة كاملة من المجلدات. الخطوة التالية هي إجراء التحليل في Stat Maker. افتح Stat_Maker ، وانقر فوق الزر التحقق من التثبيت.
في حالة التشغيل لأول مرة ، سيقوم Stat_Maker تلقائيا بتثبيت R و JAGS و Bioconductor عن طريق سحب هذه الموارد من الإنترنت. بمجرد اكتشاف R و JAGS و Bioconductor ، ستصبح Stat_Maker نشطة وتسمح بمزيد من إدخال المستخدم. انقر فوق الزر "اختيار مجلد" للانتقال إلى مجلد العمل الذي عالجته DEEPN.
سيقوم Stat_Maker تلقائيا بالعثور على الملفات وإدراجها للتحليل الإحصائي في النافذة. قم بسحب وإسقاط الملفات المناسبة من نافذة قائمة الملفات أعلاه في نوافذ الملفات أدناه لكل مجموعة بيانات متجهة وطعم ولكل ظروف نمو ، غير محددة ومحددة. الأهم من ذلك ، Stat_Maker يتطلب مجموعات بيانات مكررة للمتجهات الفارغة وحدها ، وعينتين من السكان غير المختارين ، وعينتين من المختارين.
هذا يعطي تقديرا للتباين داخل التجربة. انقر فوق الزر "تشغيل". اعتمادا على سرعة الكمبيوتر ، سيستغرق الحساب ما بين خمس إلى 15 دقيقة.
يتم وضع النتائج من إخراج Stat_Maker في مجلد فرعي جديد داخل مجلد العمل الرئيسي المسمى Stat_Maker النتائج. راجع النتائج. لمراجعة البيانات الخاصة بكل مرشح محتمل، افتح برنامج DEEPN، وحدد معلومات مكتبة الفريسة المقابلة، ثم حدد مجلد العمل الصحيح باستخدام مجلد العمل.
انقر فوق الزر Blast Query لتحميل نافذة جديدة. في مربع النص العلوي ، اكتب اسم الجين أو رقم GenBank NM لتحديد الجين المرشح محل الاهتمام. يتوافق اسم الجين مع الاسم المدرج في ملف إخراج Stat Maker.
اكتب Enter أو Return ، والذي يبدأ في استرجاع الجين محل الاهتمام. حدد مجموعات البيانات التي سيتم استخدامها للتحليل باستخدام قوائم تحديد مجموعة البيانات. عادة ما تشمل هذه الناقل فقط وعينات الطعم المزروعة في ظل ظروف غير انتقائية وعينة الطعم المزروعة في ظل ظروف الاختيار.
في البداية ، قد يستغرق تحميل البيانات واسم الجين بعض الوقت باستخدام برنامج Blast Query ، ولكن بمجرد تحميل مجموعة البيانات ، ستسير بشكل أسرع. سيعرض Blast_Query نقاط الاندماج على طول تسلسل الاهتمام ومدى وفرة كل نقطة اندماج. يمكن عرض هذا بتنسيق جدول باستخدام علامة التبويب النتائج أو تنسيق رسومي باستخدام علامة التبويب المخطط.
لتصدير هذه النتائج إلى ملف csv ، انقر فوق الزر Save csv في أعلى اليمين. من نافذة DEEPN، انقر فوق الزر قراءة العمق ضمن تحليل البيانات. بمجرد فتح نافذة عمق القراءة ، اكتب رقم NM في مربع النص العلوي.
استخدم القائمة المنسدلة لتحديد مجموعة البيانات ذات الصلة التي تحتوي على الجين المخصب محل الاهتمام. استخدم الجدول الموجود على اليسار وعرض الرسومات على اليمين لتحديد عدد القراءات التي تم العثور عليها في البيانات التي تتوافق مع الجين محل الاهتمام. ينتج برنامج Stat Maker ملفا قابلا للعرض عبر Excel يلخص المعلومات ذات الصلة اللازمة لتحديد البروتينات المتفاعلة المرشحة.
يظهر أيضا التحليل المقابل لما إذا كانت البلازميدات المقابلة لمرشح الفريسة تحتوي على إطار القراءة المفتوح المناسب. يقوم استعلام الانفجار بتقييم كل جين وترتيب المواضع المختلفة وفقا لوفرتها في مجموعة البيانات المحددة كميا بواسطة جزء في المليون من إجمالي عدد التقاطعات الموجودة في قاعدة البيانات. في هذا المثال ، فإن الموضع الأكثر وفرة في ORF و In Frame هو الموضع 867 ، مما يشير إلى أن النيوكليوتيدات 867 من GenBank NCBI Reference Sequence NM_019648 هي بداية جزء الفريسة.
يوضح هذا الرسم تسلسلا افتراضيا وكيفية تصميم oligo خماسي الأعداد الأولية لالتقاط الإطار الصحيح ونقطة الاندماج بين مجال تنشيط Gal4 وتسلسل الفريسة ذي الاهتمام. توضح نافذة عمق القراءة هذه عدد التسلسلات التي تم العثور عليها في البيانات التي تتوافق مع مواضع النيوكليوتيدات لتسلسل الاهتمام. بمجرد إتقان البيانات ، يمكن إجراء معالجة البيانات في غضون 10 إلى 20 ساعة ، في معظم الأحيان دون رقابة.
ستمهد شاشات DEEPN وتحليل المعلوماتية المقابل الطريق للمحققين في مجموعة واسعة من المجالات لاستكشاف شبكات التفاعل مع البروتين الذي يهتهم. تم تصميم برنامج MAPster لتسهيل تعيين ملفات التسلسل من تجارب DEEPN. كما يوفر طريقة سهلة الاستخدام لتعيين ملفات التسلسل للإشارة إلى الحمض النووي لمجموعة متنوعة من التطبيقات ، مثل RNA-Seq أو ChIP-Seq.
على الرغم من أن برنامج DEEPN مصمم خصيصا لمعالجة البيانات الهجينة ثنائية الخميرة الدفعية ، إلا أنه يمكن استخدامه أيضا لمعالجة بيانات RNA-Seq. لا يتنبأ برنامج Stat Maker بالجينات التي تعطي تفاعلا هجينا أصليا للخميرة فحسب ، بل يجمع أيضا عددا من المعلمات الأخرى ، مثل قراءة معلومات الإطار ، مما يسمح للمحققين بتصفية نجاحاتهم المرشحة بسرعة. بمجرد تحديد البروتينات المتفاعلة المرشحة ، من المهم التحقق من صحة التفاعلات باستخدام فحوصات الخميرة القياسية ثنائية الهجين ، أو فحوصات السحب الكيميائية الحيوية ، أو الطرق ذات الصلة.
View the full transcript and gain access to thousands of scientific videos
This article discusses a method for analyzing protein interactomes through deep sequencing of yeast populations selected for positive yeast 2-hybrid interactions. It emphasizes the use of user-friendly bioinformatics tools that simplify the analysis process for researchers without extensive bioinformatics expertise.