Summary

פרוטוקול להצפנה באמצעות גנים להגדיר העשרה ניתוח כדי לזהות את המודל החייתי המתאים עבור המחקר Translational

Published: August 16, 2017
doi:

Summary

אנו מספקים פרוטוקול מתוקננת לשימוש של העשרה קבע מפענוח transcriptomic נתונים כדי לזהות מודל העכבר אידיאלי עבור המחקר translational.
פרוטוקול זה ניתן להשתמש עם DNA microarray ו- RNA רצף נתונים, עוד יותר ניתן להאריך לנתונים אחרים טכנולוגיות אם נתונים זמינים.

Abstract

מחקרים שנעשו לאחרונה כי בהשוואה datasets transcriptomic של מחלות האדם עם datasets דגמים העכבר באמצעות טכניקות מסורתיות ג’ין-כדי-גן השוואה הביא למסקנות סותרות בדבר הרלוונטיות של מודלים בבעלי חיים עבור translational מחקר. הסיבה הראשית עבור אי-ההתאמות בין ניתוחים ביטוי גנים שונים הוא שרירותי הסינון של גנים ביטוי באופן שונה. יתר על כן, ההשוואה של גנים יחיד בין מינים שונים ופלטפורמות לעתים קרובות הוא מוגבל על ידי סטיה טכני, שמוביל פירוש מוטעה קון/הכתבים בין נתונים של מודלים האדם ושל בעלי החיים. לפיכך, נדרשים מתוקננת גישות לניתוח נתונים שיטתי. כדי להתגבר על יעילות השוואות ג’ין-כדי-גן וסינון ג’ין סובייקטיבית, אנו לאחרונה הפגינו כי מפענוח העשרה set (GSEA) יש פוטנציאל כדי להימנע מבעיות אלה. לכן, פיתחנו פרוטוקול מתוקננת לשימוש של GSEA להבדיל בין מודלים בעלי חיים המתאימים ולא הולמים עבור המחקר translational. פרוטוקול זה אינה מתאימה כדי לחזות כיצד לתכנן מערכות מודל חדש א-פריורי, כפי שהוא דורש נתונים ניסיוני טכנולוגיות קיימים. עם זאת, הפרוטוקול מתאר כיצד לפרש את הנתונים הקיימים בצורה סטנדרטית לשם בחירת המודל בעלי חיים המתאימים ביותר, ובכך להימנע לניסויים בבעלי חיים מיותרים ומטעה translational מחקרים.

Introduction

מודלים בעלי חיים נמצאים בשימוש נרחב לחקר מחלות אנושיות, בגלל הדמיון המשוערת שלהם לבני במונחים של גנטיקה, אנטומיה, פיזיולוגיה. יתר על כן, חייתיים לעיתים קרובות לשמש שומרי טיפולים קליניים, יכול להיות בעל השפעה עצומה על ההצלחה של המחקר translational. בחירה זהירה של המודל בעלי חיים מיטביים יכולה להפחית את מספר מחקרים שנעשו בבעלי חיים מטעה. לאחרונה, הרלוונטיות של מודלים בעלי חיים למחקר translational משווקי נדון, בעיקר בגלל ניתוח datasets באותו המתקבל מחלות דלקתיות האדם ומודלים העכבר קשורים הובילה למסקנות סותרות 1,2. הדיון הזה חשף בעיה יסודית במהלך ניתוח נתונים טכנולוגיות: גישות סטנדרטיים לניתוח נתונים שיטתי נדרשים כדי לצמצם את הבחירה ג’ין משוחד וכדי להגדיל את היציבות של השוואות בין זנים 3.

באופן מסורתי, הניתוח של נתונים transcriptomics (ונתונים אחרים טכנולוגיות) נעשית ברמת יחיד-ג’ין, כולל צעד ראשוני של הגן הנבחר בהתבסס על פרמטרים ניתוק מחמירים (למשל, שינוי קיפול > 2.0, ערך p < 0.05). עם זאת, ההגדרה של ניתוק ראשונית פרמטרים לעיתים קרובות הוא סובייקטיבי, שרירותי, לא מוצדק מבחינה ביולוגית, יכול אף לגרום מסקנות מול1,2. יתר על כן, הבחירה הראשונית ג’ין בדרך כלל מגבילה את הניתוח כמה מאוד ואת downregulated גנים, ובכך אינו רגיש מספיק כדי לכלול את רוב גנים שבאו לידי ביטוי באופן שונה במידה פחותה.

עם עליית עידן גנומיקה בתחילת שנות האלפיים, הידע הגובר של מסלולים ביולוגיים והקשרים, פותחו גישות סטטיסטיות חלופי מותר לעקוף את המגבלות של ניתוחים ברמת יחיד-גן. ג’ין להגדיר העשרה ניתוח (GSEA)4, שהיא אחת של שיטות מקובלות הניתוח של נתונים transcriptomics, עושה שימוש האפריורית מוגדרת על ידי קבוצות של גנים (למשל, איתות מסלולים, מיקום proximal על כרומוזום וכו.). GSEA ממפה קודם כל הגנים לא מסונן שזוהו לסטים ג’ין המיועד (למשל, מסלולים), ללא כל קשר שלהם שינוי בודדות בביטוי. גישה זו ולכן כולל גם גנים בינוני מוסדר שאחרת היה אבוד עם ניתוחים ברמת יחיד-גן. השינוי מוספים בביטוי בתוך הגן ערכות לאחר מכן מתבצעת באמצעות סטטיסטיקה סכום המצטבר.

למרות השימוש רחב במחקר רפואי, GSEA וגישות העשרה קבע קשורים לא שהאקסיומה נלקחים בחשבון לניתוח של טכנולוגיות מורכבות נתונים. כאן, אנו מתארים את פרוטוקול לצורך השוואת נתונים טכנולוגיות מדגימות האנושי עם אלה של מודלים בעכבר כדי לזהות את מודל אידיאלי ללימודי translational. נדגים את הישימות של פרוטוקול מבוסס על אוסף של העכבר מודלים המשמשים עבור מחקה מחלות דלקתיות אנושי. עם זאת, צינור ניתוח זו אינה מוגבלת האדם-עכבר השוואות והוא שאלות המחקר amendable נוספות.

Protocol

1. הורדה של התוכנה GSEA, המאגר חתימות מולקולרית לעבור לאתר האינטרנט הרשמי של מכון רחב GSEA (http://software.broadinstitute.org/gsea/index.jsp), להירשם כדי לקבל גישה אל התוכנה GSEA הכלי, מסד הנתונים חתימות מולקולרית (MSigDB). להוריד את היישום בשולחן העבודה של javaGSEA או אופציה חלופית תוכנה (למשל, R script). הערה: ?…

Representative Results

מודגמות את זרימת העבודה GSEA ואת צילומי מסך של נתונים למופת. איור 1 מציג את קובץ הנתונים של ג’ין ביטוי המכיל את הנתונים transcriptomic של עניין. על כל מחקר קובץ תיאורי פנוטיפ נדרש זה מוצג באיור2. ג’ין המבואר סטים (למשל, מסלולים) מוגדרים בקובץ הגדר?…

Discussion

מודלים בעלי חיים זמן הוחלו על החקירה של מנגנוני המחלה ועל הפיתוח של אסטרטגיות טיפוליות מקוריות. עם זאת, ספקנות לגבי predictivity בבעלי חיים כמודלים החלה להתפשט בעקבות הכישלונות של ניסויים קליניים12. יתר על כן, דיונים במחלוקת אודות אסטרטגיות המתאימות עבור ניתוח ופרשנות של נתונים טכנ…

Disclosures

The authors have nothing to disclose.

Acknowledgements

עבודה זו מומן על ידי המכון הפדרלי הגרמני לשם הערכת סיכונים (BfR).

Materials

Excel Microsoft Corporation

References

  1. Seok, J., et al. Genomic responses in mouse models poorly mimic human inflammatory diseases. Proc Natl Acad Sci U S A. 110 (9), 3507-3512 (2013).
  2. Takao, K., Miyakawa, T. Genomic responses in mouse models greatly mimic human inflammatory diseases. Proc Natl Acad Sci U S A. 112 (4), 1167-1172 (2015).
  3. Weidner, C., Steinfath, M., Opitz, E., Oelgeschläger, M., Schönfelder, G. Defining the optimal animal model for translational research using gene set enrichment analysis. EMBO Mol Med. 8 (8), 831-838 (2016).
  4. Subramanian, A., et al. Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles. Proc Natl Acad Sci U S A. 102 (43), 15545-15550 (2005).
  5. Kanehisa, M., Sato, Y., Kawashima, M., Furumichi, M., Tanabe, M. KEGG as a reference resource for gene and protein annotation. Nucleic Acids Res. 44 (D1), D457-D462 (2016).
  6. Kanehisa, M., Goto, S. KEGG: kyoto encyclopedia of genes and genomes. Nucleic Acids Res. 28 (1), 27-30 (2000).
  7. Fabregat, A., et al. The Reactome pathway Knowledgebase. Nucleic Acids Res. 44 (D1), D481-D487 (2016).
  8. Croft, D., et al. The Reactome pathway knowledgebase. Nucleic Acids Res. 42 (Database issue), D472-D477 (2014).
  9. Nishimura, D. BioCarta. Biotech Software & Internet Report. 2 (3), 117-120 (2001).
  10. Edgar, R., Domrachev, M., Lash, A. E. Gene Expression Omnibus: NCBI gene expression and hybridization array data repository. Nucleic Acids Res. 30 (1), 207-210 (2002).
  11. Kolesnikov, N., et al. ArrayExpress update–simplifying data submissions. Nucleic Acids Res. 43 (Database issue), D1113-D1116 (2015).
  12. Cohen, J., et al. Sepsis: a roadmap for future research. Lancet Infect Dis. 15 (5), 581-614 (2015).
  13. Spinelli, L., Carpentier, S., Montanana Sanchis, F., Dalod, M., Vu Manh, T. P. BubbleGUM: automatic extraction of phenotype molecular signatures and comprehensive visualization of multiple Gene Set Enrichment Analyses. BMC Genomics. 16 (1), 814 (2015).

Play Video

Cite This Article
Weidner, C., Steinfath, M., Wistorf, E., Oelgeschläger, M., Schneider, M. R., Schönfelder, G. A Protocol for Using Gene Set Enrichment Analysis to Identify the Appropriate Animal Model for Translational Research. J. Vis. Exp. (126), e55768, doi:10.3791/55768 (2017).

View Video