Summary

שימוש היקף זהה מוטיבים רגולטוריות פוטנציאלים גנים Coregulated

Published: May 31, 2011
doi:

Summary

שיטה ישר קדימה ויציב לזהות מוטיבים רגולטוריים פוטנציאל שיתוף מוסדר גנים מוצג. היקף אינה דורשת כל הפרמטרים המשתמש מחזיר מוטיבים המייצגים מועמדים מצוינים עבור אותות הרגולציה. הזיהוי של אותות רגולטוריים כאלה עוזר להבין את הביולוגיה הבסיסית.

Abstract

היקף מהווה מוטיב אנסמבל מוצא כי משתמשת בשלושה אלגוריתמים מרכיב במקביל לזהות מוטיבים רגולטוריים פוטנציאל ידי ייצוג יתר ואת המיקום מוטיב העדפה 1. אלגוריתם כל רכיב מותאם למצוא סוג אחר של מוטיב. על ידי לקיחת הטוב ביותר של שלוש גישות אלה, היקף מבצעת טוב יותר מאשר אלגוריתם כל אחד, אפילו בנוכחות של נתונים רועש 1. במאמר זה, אנו מנצלים גירסת האינטרנט של היקף 2 לבחון גנים מעורבים תחזוקה הטלומרים. היקף כבר שולבו מוטיב לפחות שתי תוכניות אחרות למצוא 3,4 נעשה שימוש במחקרים אחרים 5-8.

שלושת האלגוריתמים שמרכיבים היקף הן הקורה 9, אשר מוצא את הלא מנוונת מוטיבים (ACCGGT), PRISM 10, אשר מגלה מוטיבים מנוונת (ASCGWT), ו spacer 11, אשר מגלה מוטיבים bipartite יותר (ACCnnnnnnnnGGT). אלה הם שלושה אלגוריתמים מוטבו למצוא סוג של מוטיב המתאימים. ביחד, הם מאפשרים לבצע היקף טוב מאוד.

לאחר סדרה גן כבר ניתחו ומוטיבים מועמד מזוהה, היקף יכולים לחפש גנים אחרים המכילים את מוטיב אשר, כאשר הוסיף להגדיר המקורי, ישפרו את הציון מוטיב. זה יכול להתרחש באמצעות ייצוג יתר או העדפת מוטיב. עבודה עם קבוצות גנים חלקיים אימתת ביולוגית גורם שעתוק אתרי הקישור, היקף הצליח לזהות את רוב שאר הגנים מוסדר גם על ידי גורם שעתוק נתון.

פלט מתוך היקף מראה מוטיבים המועמד, את משמעותם, וכל מידע אחר הן השולחן כמפה מוטיב גרפי. שאלות נפוצות ומדריכים וידאו זמינים באתר האינטרנט היקף, אשר כולל גם "חיפוש מדגם" כפתור המאפשר למשתמש לבצע לרוץ למשפט.

היקף בעל ממשק משתמש ידידותי מאוד, המאפשר למשתמשים לגשת טירון מלוא העוצמה של אלגוריתם מבלי להיות מומחה ביואינפורמטיקה של מוטיב למצוא. כפי קלט, היקף יכול לקחת רשימה של גנים, או רצפי FASTA. אלה יכולים להיות מוזנים שדות טקסט הדפדפן, או לקרוא מקובץ. פלט היקף מכיל רשימה של כל המוטיבים המזוהים עם ציוניהם, מספר המופעים, שבריר של גנים המכילים את מוטיב, ואת האלגוריתם משמש לזיהוי מוטיב. עבור כל מוטיב, פרטים תוצאה כוללים ייצוג הקונצנזוס של מוטיב, לוגו רצף, מטריצה ​​משקל עמדה, וכן רשימה של מקרים להתרחשות כל מוטיב (עם עמדות המדויק "גדיל" המצוין). תוצאות מוחזרות בחלון דפדפן וגם אופציונלי באמצעות הדוא"ל. מאמרים קודמים לתאר את האלגוריתמים היקף בפירוט 1,2,9-11.

Protocol

<p class="jove_title"> 1. הכינו רשימה של שמות של גנים אתם מאמינים הם שיתוף מוסדר לניתוח על ידי היקף.</p><p class="jove_content"> שמור את הרשימה כקובץ טקסט או להעתיק אותו אל הלוח להדביק היקף בשלב 3. הקובץ אמור להכיל שם אחד הגנים בכל שורה ללא מידע נוסף. לחלופין, ניתן להכין את הרשימה כקובץ FASTA המכיל את רצפי בפועל להיות מנותח.</p><p class="jove_title"> 2. הפעל את דפדפן האינטרנט שלך ולהתחבר כתובת האתר:<a href="http://genie.dartmouth.edu/SCOPE/"> Http://genie.dartmouth.edu/SCOPE/</a</p><p class="jove_title"> 3. הזן את המידע כי היקף צריך לבצע את הניתוח.</p><p class="jove_content"> הדף היקף הראשוני מוצג באיור 1. קטעים שונים מופנים בשלב זה.</p><ol><li> השתמש תפריט קופץ של המינים "כדי לבחור את מין תהיה בחינה. חשוב לבחור את המין הנכון, כי היקף מתייחס הגנום לחשב תדרים הרקע להתרחשות על מוטיב כל מועמד היא בוחנת.</li><li> השתמש "במעלה הזרם" רצף בלחצני הבחירה כדי לבחור intergenic או באורך קבוע. Intergenic תנתח את כל רצף בין הגן אתה מסתכל ואת הגן הקודם (upstream). זאת אומרת כי באורכים שונים במעלה הזרם ישמש כל הגן. בחירת באורך קבוע יסתכלו המספר בדיוק של נוקלאוטידים upstream מההתחלה של הגן הנוכחי. במקרה זה, היקף יבחן באותו אורך של רצף הזרם עבור כל גן, גם אם זה משתרע לתוך הגן הקודם (או לא). בדרך כלל, 800 לילות הוא אורך הטובה ביותר לבחור, אבל זה יכול להשתנות עם מינים.</li><li> הבא לומר מה היקף גן להגדיר לנתח או על ידי הדבקת ברשימה הגן שלך לתוך תיבת הרשימה גן הטקסט, או על ידי לחיצה על כפתור "בחר קובץ" כדי לבחור את הקובץ שמכיל את רשימת הגנים שיצרת קודם לכן. ייתכן, לחילופין, להדביק בקובץ רצף FASTA לתוך תיבת הטקסט אותו.</li><li> החלק הבא של הדף מכיל תיבת סימון עבור 'בדוק הגנום של גנים אחרים המכילים מוטיב מצאו (ים)? " אפשרות זו ניתן להוסיף זמן ניכר מאז היקף הניתוח יש להעריך כל גן אחר בגנום. עם זאת, זה יכול להיות מאוד שימושי בזיהוי גנים אחרים כי הם מועמדים טובים להיות שותף מוסדר עם הגנים להגדיר את הגן החל. מאז הניתוחים היקף הם מהירים יחסית, הוא הציע להשאיר את זה בניתוח הראשוני שלך. זה תמיד יכול להיות מופעל מתוך דף התוצאות להפעיל מחדש את הניתוח, כפי שהוסבר בסעיף התוצאות.</li><liבסעיף> "תוצאות חייבת לכלול" ניתן להשתמש כדי להזין מוטיב שברצונך היקף לכלול ניתוח שלה. ייתכן שתרצה לעשות זאת אם אתה מחפש מוטיב מסוים.</li><li> הקטע האחרון בדף ניתן להשתמש כדי להזין את כתובת הדוא"ל שלך תגובה להינצל עם ניתוח. אם זה מילא, היקף ישלח מייל עם קישור אל דף האינטרנט המכיל תוצאות, וזה יהיה גם לכלול שני קבצים מצורפים. אחד מהם הוא קובץ טקסט רגיל כי יש לו את כל תוצאות הניתוח בפורמט קריא האדם. מצורף השני מכיל קובץ XML אשר כל תוצאה היקף מצא בפורמט המחשב קריא. אם אתה רוצה לעשות ניתוח נוסף על התוצאות, קובץ ה-XML הוא מאוד שימושי. קבצים שניהם "מכווצת" לפני שנשלח עם הדוא"ל.</li><li> עבור הדגמה זו, נתחיל עם אותו מידע. זו יכולה להיות מושגת בקלות על ידי לחיצה על "חיפוש מדגם" כפתור אשר ימלא את הפרטים הנחוצים. לחץ על לחצן זה עכשיו. שלושה גנים יהיה נכנס לך אפשרויות המתאימות עשה עבור השדות האחרים. השאר אלה כפי שהם מוגדרים. שלושת הגנים מעורבים תחזוקה הטלומרים ב<em> Saccharomyces cerevisiae</em>. מילא את הטופס מוצג באיור 2. לחצו על הכפתור "היקף הפעל" בתחתית העמוד כדי להתחיל את הניתוח.</li></ol><p class="jove_title"> 4. נציג תוצאות:</p><p class="jove_content"> התוצאות העיקריות של הניתוח מוצגים באיור 3. חלקו העליון של הדף מכיל טבלה של מידע על המוטיבים שנמצאו על ידי היקף. העמודה הראשונה מכילה רשימה של מוטיבים כי נמצאו ריבועים צבעוניים קטנים לשמש אגדה על המפה המוטיב הגרפי שמוצג להלן. התצוגה של מוטיב נתון ניתן toggled או לבטל על ידי לחיצה בתיבה בצבע (או איפה את תיבת בצבע יהיה). זה יכול להיות שימושי מאוד כדי להסתיר את התצוגה של מוטיבים חוזרים ונשנים מאוד שעשוי להקשות לראות את דפוסי מוטיב נפוץ פחות.</p><p class="jove_content"> טורים אחרים של נתונים Count (את מספר המופעים של מוטיב זה בקבוצת הגן כולו), ערך Sig (אינדיקציה המשמעות של מוטיב זה), כיסוי (אחוז הגנים שהוגשו המכילים לפחות מופע אחד של כי מוטיב), ו אלגוריתם (אשר משלושת האלגוריתמים מרכיב שימש לזהות את מוטיב).</p><p class="jove_content"> לחיצה על כל המוטיבים המופיעים ייקח את המשתמש לדף המכיל מידע מפורט על מוטיב זה. פרטים התוצאות מוצגות על מוטיב ציאן (atgnnnnttg) באיור 4. בדף זה מוטיב מיוצג בשלוש דרכים: לוגו רצף, מטריצה ​​משקל עמדה, וכן רשימה של כל המופעים מוטיב עם עמדותיהם, גדילי וגנים.</p><p class="jove_content"> קצת יותר למטה בעמוד כמה פרטים נוספים על תוצאות לחפש גנים אחרים המכילים מוטיב. כפי שניתן לראות, במקרה זה היו 1,344 גנים אחרים המכילים את מוטיב, אשר כולם למעשה שיפר את ערך Sig כאשר הוסיף להגדיר את הגן המקורי. לחיצה על "הוסף גנים בדק לחפש" יהיה לחזור לדף ההתקנה היקף עם הגנים האלה הוסיף להגדיר את הגן המקורי הפרמטרים להגדיר כפי שהיו בעבר. במקרה זה, 10 גנים נוספים מתווספים שלושה המקורי.</p><p class="jove_content"> איור 5 מציג את תוצאות הניתוח המכיל את הגנים נוסף מוטיב זה. המקורי שלושה גנים נמצאים בתחתית התוצאות (באותיות קטנות). כאשר מסתכלים על דפוס של מוטיבים באזור במעלה הזרם של הגנים האלה תוספת עולה בבירור כי הם דומים. למעשה, רבים של הגנים האלה מעורבים תחזוקה הטלומרים כפי שהיו במקור שלושה גנים. שים לב גם כי מוטיב המקורי הוא כיום המוטיב הניקוד הגבוה ביותר להגדיר את זה.</p><p class="jove_content"> סט נוסף של תוצאות היקף מוצג באיור 6. במקרה זה, אוסף של גנים הם אלה המעורבים biogenesis הריבוזום cerevisiae Saccharomyces. גנים אלו אינם למעשה חלק של הריבוזום אבל אחראים להרכבת ריבוזומים וכוללים מספר אנזימים שינוי. מה שברור באיור היא כי מוטיבים אדום וירוק ליצור דפוס אמין אשר צפוי להיות מעורב בוויסות הגנים להגדיר את זה. אנחנו חוקרים את הדפוס הזה של "מודולים" ביתר פירוט וידווח על כך בפרסום מאוחר יותר.</p><p class="jove_content"<img src="/files/ftp_upload/2703/2703fig1.jpg" alt="Figure 1"/<br /><strong> איור 1</strong>. היקף הראשי קלט הדף. דף זה משמש כדי להזין את הגנים שיש לנתח ולהגדיר את המינים ואת אורך האזור במעלה הזרם כדי להיבחן. לחלופין, המשתמש יכול לבקש את התוצאות בדואר או להגביל את החיפוש מוטיב כל שצוין. לסייע וידאו הוא גם זמין.</p><p class="jove_content"<img src="/files/ftp_upload/2703/2703fig2.jpg" alt="Figure 2"/<br /><strong> איור 2</strong>. היקף הראשי קלט עמוד עם ערכים מילא לביצוע החיפוש. פרמטרים אלה הם תוצאה של לחיצה על כפתור "חיפוש לדוגמה". במקרה זה, תיבת הסימון כדי למצוא גנים אחרים המכילים את המוטיבים שנמצאו על ידי היקף מסומנת. אפשרות זו לוקח יותר זמן לחשב (בכל גן בגנום יש להיבדק), אך יכול לספק תובנות מעניינות.</p><p class="jove_content"<img src="/files/ftp_upload/2703/2703fig3.jpg" alt="Figure 3"/<br /><strong> תמונה 3</strong>. היקף התוצאות בדף הראשי. דף זה מסכם את תוצאות החיפוש היקף. רשימה של כל המוטיבים ניקוד גבוה מסופק וצבע מקודד מוטיב המפה מראה את המיקום של המוטיבים המזוהים סט של גנים מנותח. לחיצה על התיבה בצבע לצד מוטיב יהיה להחליף את התצוגה של מוטיב זה או לבטל במפה מוטיב. בנוסף ציון משמעות (ערך Sig), את החלק היחסי של גנים המכילים את מוטיב (כיסוי), ואת האלגוריתם משמש לגלות כי מוטיב ניתנים גם.</p><p class="jove_content"<img src="/files/ftp_upload/2703/2703fig4_1.jpg" alt="Figure 4 top"/<br /><img src="/files/ftp_upload/2703/2703fig4_2.jpg" alt="Figure 4 bottom"/<br /<strong> איור 4</strong>. בדף זה מובא פירוט התוצאות כאשר מוטיב מסוים לוחצים בדף התוצאות הראשי. הוא מציג פרטים על מוטיב הפרט. לוגו רצף, מטריצת משקל העמדה, ואת רצף קונצנזוס לייצג כל סוג אחר של סיכום של רשימת המקרים מוטיב גם בדף. מאז "למצוא גנים נוספים" נבדקה בהגדרת החיפוש המקורית, יש גם מידע בעמוד זה על כל שאר הגנים בגנום המכילים מוטיב זה. מדף זה אפשר גם להתחיל לרוץ אחר היקף כולל גנים נוספים מזוהה בדף זה.</p><p class="jove_content"<img src="/files/ftp_upload/2703/2703fig5.jpg" alt="Figure 5"/<br /<strong> איור 5</strong>. נתון זה מראה את התוצאות של מחפש גנים נוספת "atgnnnnttg" מוטיב שמוצג באיור 4. המקורי שלושה גנים הם באותיות קטנות בתחתית המפה מוטיב. גנים נוספים מוצגים במקרה העליון. יש דפוס ברור המוטיבים באזורים במעלה הזרם של גנים אלה. שימו לב גם כי מוטיב שצוין מראה אלגוריתם כ 'LOOKUP "כי ככה זה היה מזוהה. זה ממש תואם את 5<sup> ה</supמוטיב> שמצא spacer בניתוח זה.</p><p class="jove_content"<img src="/files/ftp_upload/2703/2703fig6.jpg" alt="Figure 6"/<br /<strong> איור 6</strong>. היקף התפוקה של גנים המעורבים biogenesis הריבוזום cerevisiae Saccharomyces. הערה דפוס שימור של מודולים המורכב "aaawtttbh" המוטיבים (אדום) ו 'abctcatcd "(ירוק) מופרדים על 10-30 לילות ו – 100-200 נוקלאוטידים נוכח הזרם של תחילת שעתוק של הגן.</p

Discussion

היקף מספק את החוקר עם כלי רב עוצמה להשתמש לצורך זיהוי של מוטיבים רגולטוריים פוטנציאל סטים של גנים מוסדרים מתואמת. המשתמש אינו נדרש לנחש בגודל של מוטיב או את מספר המופעים של מוטיב כמוטיב למצוא אתרים רבים אחרים דורשים. פרמטרים אלה הם בעצם לידיעה עד מוטיב מזוהה. הממשק הוא מאוד פשוט הן להזנת או רצפי גנים שמות ועבור הצגת הפלט.

היקף התפוקה מספק מידע מפורט אודות כל המוטיבים המזוהות, באמצעות שלוש דרכים שונות של ייצוג מוטיב. כל מופע של מוטיב בכל הגנים מופיע עם עמדת מידע "גדיל". תוצאות גרפי בצורה של מפות מוטיב לספק תצוגה ויזואלית, כי קל להבין ומספק דרך אינטואיטיבית לראות דפוסים המוטיבים שנמצאים.

היקף הוא מאוד חזקים לנוכחות של רעש הנתונים. בדרך כלל, זה לובש צורה של גנים נוספים להיות נוכחים בקבוצת המוצא כי לא עשויה למעשה להיות שותף מוסדר עם שאר הגנים. זה קורה לעתים קרובות כאשר מתחילים עם גנים שיתוף לידי ביטוי בניסויים microarray. לפעמים הניסוי היא רועשת, או ייתכנו גורמי תעתוק מספר מופעל על תנאי הניסוי השתמשו לצורך הניסוי microarray. אלה גורמי שעתוק שונים סביר להניח שיש אתרי יעד שונים על ה-DNA. אפילו בנוכחות של פי 4 גנים זרים (רעש: יחס אות 04:01), הוא עדיין שומר על היקף של 50% הדיוק בניבוי אתרים 1.

למרות היקף מכיל מעל 2 מיליון מילים נרדפות לשמות גן, זה לפעמים לא מצליח לזהות כמה שמות הגנים. אנחנו כל הזמן לעדכן את רשימות נרדף שלנו, אבל לפעמים מוצאים מילים נרדפות שונים מתייחסים אותו גן. במקרים אלה, אנו לא כוללים את המילים הנרדפות בשל העמימות. אם יש לך שם הגן לא נמצא על ידי היקף, מומלץ שתפנה לאתר מסוים בגנום למצוא שם הגן חלופה לשימוש בהיקפה. דוגמאות של שמות הגן מתאים לכל מין ניתנים על ידי היקף.

היקף כיום מכיל 72 זנים עם זנים חדשים מתווספים כל הזמן. האתר מכיל וידאו לעזור, כמו גם שאלות נפוצות. קוד המקור שלה זמין בחינם למשתמשים אקדמי על ידי כתיבה RHG.

Disclosures

The authors have nothing to disclose.

Acknowledgements

מחקר זה מומן על ידי מענק כדי RHG מן הקרן הלאומית למדע, DBI-0445967.

References

  1. Chakravarty, A., Carlson, J. M., Khetani, R. S., Gross, R. H. A novel ensemble learning method for de novo computational identification of DNA binding sites. BMC Bioinformatics. 8, 249-249 (2007).
  2. Carlson, J. M., Chakravarty, A., DeZiel, C. E., Gross, R. H. SCOPE: a web server for practical de novo motif discovery. Nucleic Acids Res. 35, 259-264 (2007).
  3. Blom, E. J., Roerdink, J. B., Kuipers, O. P., Hijum, S. A. v. a. n. MOTIFATOR: detection and characterization of regulatory motifs using prokaryote transcriptome data. Bioinformatics. 25, 550-551 (2009).
  4. Blom, E. J. DISCLOSE : DISsection of CLusters Obtained by SEries of transcriptome data using functional annotations and putative transcription factor binding sites. BMC Bioinformatics. 9, 535-535 (2008).
  5. Bushey, A. M., Ramos, E., Corces, V. G. Three subclasses of a Drosophila insulator show distinct and cell type-specific genomic distributions. Genes Dev. 23, 1338-1350 (2009).
  6. Znaidi, S. Identification of the Candida albicans Cap1p regulon. Eukaryot Cell. 8, 806-820 (2009).
  7. Sharma, D., Mohanty, D., Surolia, A. RegAnalyst: a web interface for the analysis of regulatory motifs, networks and pathways. Nucleic Acids Res. 37, W193-W201 (2009).
  8. Znaidi, S. Genomewide location analysis of Candida albicans Upc2p, a regulator of sterol metabolism and azole drug resistance. Eukaryot Cell. 7, 836-847 (2008).
  9. Carlson, J., Chakravarty, A., Gross, R. B. E. A. M. A beam search algorithm for the identification of cis-regulatory elements in groups of genes. J Comput Biol. 13, 686-701 (2006).
  10. Carlson, J., Chakravarty, A., Khetani, R., Gross, R. Bounded search for de novo identification of degenerate cis-regulatory elements. BMC Bioinformatics. 7, 254-254 (2006).
  11. Chakravarty, A., Carlson, J. M., Khetani, R. S., DeZiel, C. E., Gross, R. H. SPACER: identification of cis-regulatory elements with non-contiguous critical residues. Bioinformatics. 23, 1029-1031 (2007).

Play Video

Cite This Article
Martyanov, V., Gross, R. H. Using SCOPE to Identify Potential Regulatory Motifs in Coregulated Genes. J. Vis. Exp. (51), e2703, doi:10.3791/2703 (2011).

View Video