Summary

Informatic ניתוח של נתוני רצף אצווה שמרים 2-היברידית המסכים

Published: June 28, 2018
doi:

Summary

רצף עמוק של אוכלוסיות השמרים שנבחר עבור אינטראקציות חיוביות שמרים 2-היברידית פוטנציאל התשואות שפע של מידע אודות אינטראקציה שותף חלבונים. כאן, אנו מתארים את הפעולה של ביואינפורמטיקה ספציפי כלים ותוכנות מעודכן המותאם אישית כדי לנתח נתונים רצף כזה המסכים.

Abstract

אנחנו הסתגלו שמרים 2-היברידית וזמינותו לחשוף בו זמנית עשרות אינטראקציות חלבון ארעי וסטטיים בתוך מסך אחד ניצול רצפי DNA קצר-קריאה תפוקה גבוהה. Datasets רצף וכתוצאה מכך יכול לא רק לעקוב אחרי איזה גנים באוכלוסיה כי הם מועשרים במהלך הבחירה עבור אינטראקציות חיוביות שמרים 2-היברידית, אלא גם לתת מידע מפורט אודות תחומי משנה רלוונטיים של חלבונים מספיק עבור אינטראקציה. כאן, אנו מתארים חבילה מלאה של תוכניות עצמאיות המאפשרות שאינם מומחים לביצוע כל ביואינפורמטיקה, צעדים סטטיסטיים כדי לעבד ולנתח DNA רצף fastq קבצים אצווה שמרים 2-היברידית וזמינותו. השלבים בעיבוד מכוסה על ידי תוכנות אלה כוללים: קריאות רצף 1) מיפוי והספירה המתאים לכל חלבון המועמד מקודד בתוך ספרייה 2-היברידית טרף שמרים; 2) תוכנית ניתוח סטטיסטי המעריכה את הפרופילים העשרה; ו 3) כלים לבחון את המסגרת translational והמיקום בתוך אזור קידוד של כל מועשר פלסמיד מקודד חלבונים שמעצבת את עניין.

Introduction

גישה אחת לגלות אינטראקציות חלבון הוא שמרים 2-היברידית (Y2H) וזמינותו, אילו תוכנות המנצלות לרעה את מהונדסים תאי שמרים לגדול רק כאשר חלבון עניין נקשר שבר של אינטראקציה שותפים1. זיהוי של אינטראקציות מרובות Y2H יכול להיעשות עכשיו עם העזרה של רצף תפוקה גבוהה מקבילים מסיבית. מספר תבניות כבר תיאר2,3,4,5 כולל אחד פיתחנו שבו אוכלוסיות מגודלים באצוות בתנאים בחר עבור שמרים המכיל פלסמידים לייצר אינטראקציה חיובית Y2H6. זרימת העבודה אנחנו פיתח, הנקרא DEEPN (דינמי העשרה עבור הערכה של חלבונים רשתות), מזהה interactomes דיפרנציאלית מספריות טרף אותו לזהות חלבונים המקיימים אינטראקציה עם חלבון (או קבוצת המחשבים) אחד vs. חלבון אחר או תחום mutant conformationally נפרדים. אחד הצעדים העיקריים בתהליך זה הוא ראוי עיבוד וניתוח של הנתונים רצף ה-DNA. מידע שאפשר לקרוא על ידי רק ספירת מספר קריאות עבור כל ג’ין גם לפני וגם אחרי הבחירה של Y2H אינטראקציות באופן מקביל ניסוי ה-RNA-seq. עם זאת, מידע מעמיק הרבה יותר יכול להיות מופק אלה נתונים (datasets) כולל מידע על תחום המשנה של חלבון נתון זה הוא מסוגל לייצר אינטראקציה עם Y2H. בנוסף, ואילו הגישה DEEPN היא ערך, ניתוח רבים דוגמת משכפל יכול להיות מסורבל ויקר. בעיה זו הביאו להקלה באמצעות מודל סטטיסטי שפותחה במיוחד עבור DEEPN datasets איפה המספר של משכפל מוגבל6. כדי להפוך עיבוד וניתוח של ה-DNA רצף נתונים (datasets) מהימן, מלא, עמיד, או נגיש לחוקרים ללא מומחיות ביואינפורמטיקה, פיתחנו חבילת תוכניות שיכולות לכסות את כל השלבים של ניתוח.

הסוויטה לעמוד לבד תוכנות הפועלות במחשבים שולחניים כולל MAPster, DEEPN Stat_Maker. MAPster הוא ממשק משתמש גרפי המאפשר שכל קובץ fastq בתור עבור מיפוי הגנום באמצעות תוכנית ‘ HISAT2 ‘7, הפקת קובץ .sam תקן לשימוש ביישומים במורד הזרם. DEEPN יש כמה מודולים. זה מקצה וסופרת קריאות המתאים גן מסוים דומה כימות סוג RNA-seq בעזרת המודול “ספירת ג’ין”. אותה גם מחלצת את רצפי המתאים בצומת שבין התחום תעתיק Gal4 ואת הרצף טרף, collates את המיקום של צמתים אלה כדי לאפשר בדיקה שלהם על ידי השוואתי טבלאות וגרפים (באמצעות המודול ‘Junction_Make’) המודול ‘Blast_Query’ מאפשר בדיקה קלה, כימות, השוואה של הרצף צומת Gal4 לצומת. Stat_Maker מעריך את הקריאות לפי ג’ין העשרת נתונים סטטיסטית כדרך של סדר עדיפויות להיטים Y2H סביר. כאן, אנו נתאר כיצד להשתמש מהתוכנות הללו, לנתח באופן מלא את רצף ה-DNA נתונים Y2H DEEPN הניסוי. גירסאות של DEEPN זמינים לפעול במערכות PC, Mac, ו- Linux. בתוכניות אחרות, כגון התוכנית מיפוי MAPster, מודול הסטטיסטיקה DEEPN Stat_Maker להסתמך על subroutines המופיעה תחת Unix, הינם זמינים רק במערכות Mac ו- linux.

Protocol

1. מיפוי Fastq קבצים הערה: התוכנה DEEPN, כמו גם תוכניות רבות ביואינפורמטיקה להשתמש DNA רצף נתונים שבו כל רצף לקרוא מופה עבור המיקום בהפניה הדנ א. מגוון רחב של תוכניות מיפוי יכול לשמש עבור זה כולל MAPster הממשק כאן העושה את התוכנית HISTAT2 כדי לייצר .sam קבצים המשמשים בצעדים העוקבים. למפ?…

Representative Results

מיפוי נתונים fastq: הצעד הראשוןלמעשה כל הגדרות היישומים כולל DEEPN הפלט הראשוני הוא קובץ של רצף קצר קורא את למפותם על ידי יישור כדי גנומית, transcriptomic, או אחר מפנה דנ א8. לאחרונה, התוכנית יישור HISAT2 פותחה המשתמשת באלגוריתמים אינדקס המדינה-of-the-art כדי להגדיל ב?…

Discussion

חבילת התוכנות המתוארים כאן מאפשרת לעבד ולנתח תפוקה גבוהה DNA רצף נתונים ניסוי DEEPN לחלוטין. בתוכנית הראשונה בשימוש הוא MAPster, אשר לוקח את קריאות רצף ה-DNA בקבצים רגילים fastq וממפה את עמדתם על הפניה דנ א לעיבוד הזרם על ידי שורה שלמה של אינפורמטיקה תוכניות כולל את התוכנה DEEPN. השירות של הממשק MAPster ואת ?…

Disclosures

The authors have nothing to disclose.

Acknowledgements

עבודה זו נתמכה על ידי מכוני הבריאות הלאומיים: NIH R21 EB021870-01A1, על ידי ה-NSF מחקר פרויקט מענק: 1517110.

Materials

Mapster https://github.com/emptyewer/MAPster/releases
DEEPN software https://github.com/emptyewer/DEEPN/releases
Statmaker https://github.com/emptyewer/DEEPN/releases
Minimum computer system Apple Mac Intel Core i5 or better
4 Gb RAM or better
500 Gb Disk spce or better
OS 10.10 or higher
Dell Intel i5-7400 or better
4 Gb RAM or better
500 Gb Disk spce or better
Windows 7 or higher

References

  1. Fields, S., Song, O. A novel genetic system to detect protein-protein interactions. Nature. 340 (6230), 245-246 (1989).
  2. Rajagopala, S. V. Mapping the Protein-Protein Interactome Networks Using Yeast Two-Hybrid Screens. Advances in Experimental Medicine and Biology. 883, 187-214 (2015).
  3. Weimann, M., et al. A Y2H-seq approach defines the human protein methyltransferase interactome. Nature Methods. 10 (4), 339-342 (2013).
  4. Yachie, N., et al. Pooled-matrix protein interaction screens using Barcode Fusion Genetics. Molecular Systems Biology. 12 (4), 863 (2016).
  5. Trigg, S. A., et al. CrY2H-seq: a massively multiplexed assay for deep-coverage interactome mapping. Nature Methods. , (2017).
  6. Pashkova, N., et al. DEEPN as an Approach for Batch Processing of Yeast 2-Hybrid Interactions. Cell Reports. 17 (1), 303-315 (2016).
  7. Kim, D., Langmead, B., Salzberg, S. L. HISAT: a fast spliced aligner with low memory requirements. Nature Methods. 12 (4), 357-360 (2015).
  8. Reinert, K., Langmead, B., Weese, D., Evers, D. J. Alignment of Next-Generation Sequencing Reads. Annual Review of Genomics and Human Genetics. 16, 133-151 (2015).
  9. Pertea, M., Kim, D., Pertea, G. M., Leek, J. T., Salzberg, S. L. Transcript-level expression analysis of RNA-seq experiments with HISAT, StringTie and Ballgown. Nature Protocols. 11 (9), 1650-1667 (2016).
  10. Conesa, A., et al. A survey of best practices for RNA-seq data analysis. Genome Biology. 17, 13 (2016).

Play Video

Cite This Article
Krishnamani, V., Peterson, T. A., Piper, R. C., Stamnes, M. A. Informatic Analysis of Sequence Data from Batch Yeast 2-Hybrid Screens. J. Vis. Exp. (136), e57802, doi:10.3791/57802 (2018).

View Video