Summary

משאבי ביואינפורמטיקה לחקר אינטראקציות חלבון בתיווך גליקן

Published: January 20, 2022
doi:

Summary

פרוטוקול זה ממחיש כיצד לחקור, להשוות ולפרש גלייקום חלבון אנושי באמצעות משאבים מקוונים.

Abstract

היוזמה Glyco@Expasy הושקה כאוסף של מסדי נתונים וכלים תלויים זה בזה המשתרעים על פני מספר היבטים של ידע בגליקוביולוגיה. בפרט, הוא שואף להדגיש אינטראקציות בין גליקופרוטאין (כגון קולטני פני התא) וחלבונים מחייבי פחמימות בתיווך הגליקנים. כאן, משאבים עיקריים של האוסף מוצגים באמצעות שתי דוגמאות להמחשה שבמרכזן N-גליקום של האנטיגן הספציפי לערמונית האנושית (PSA) וה- O-גליקום של חלבוני סרום אנושיים. באמצעות שאילתות מסד נתונים שונות ובעזרת כלי תצוגה חזותית, מאמר זה מראה כיצד לחקור ולהשוות תוכן ברצף כדי לאסוף ולתאם פיסות מידע מפוזרות אחרת. נתונים שנאספו נועדו להאכיל תרחישים משוכללים יותר של פונקציית הגליקאן. גליקוינפורמטיקה שהוצגה כאן מוצעת, אם כן, כאמצעי לחזק, לעצב או להפריך הנחות על הספציפיות של גליקום חלבון בהקשר נתון.

Introduction

גליקנים, חלבונים שאליהם הם מחוברים (גליקופרוטאין) וחלבונים שאליהם הם נקשרים (לקטינים או חלבונים מחייבי פחמימות) הם השחקנים המולקולריים העיקריים במשטח התא1. למרות תפקיד מרכזי זה בתקשורת תאית, מחקרים בקנה מידה גדול, כולל גליקומיקה, גליקופרוטומיקה או נתוני גליקן-אינטראקציה עדיין נדירים בהשוואה למקבילם בגנומיקה ובפרוטאומיקה.

עד לאחרונה, לא פותחו שיטות לאפיון המבנים המסתעפים של פחמימות מורכבות ועדיין להיות מצומדים לחלבון המוביל. הביוסינתזה של הגליקופרוטאינים היא תהליך שאינו מונחה תבנית שבו התורמים המונו-סכרידים, מצע הגליקופרוטאין המקבל, והגליקוסילשילטרפרנספראזים והגליקוזידסים ממלאים תפקיד אינטראקטיבי. הגליקופרוטאינים המתקבלים יכולים לשאת מבנים מורכבים עם נקודות הסתעפות מרובות שבהן כל רכיב מונו-מכריד יכול להיות אחד הסוגים השונים הקיימים בטבע1. התהליך שאינו מונחה תבנית מטיל ניתוח ביוכימי כאפשרות היחידה ליצירת נתונים מבניים אוליגוסכרידים. התהליך האנליטי של מבני הגליקנים המחוברים לחלבון מקומי הוא לעתים קרובות מאתגר מכיוון שהוא דורש טכנולוגיות רגישות, כמותיות וחזקות כדי לקבוע הרכב מונוסכריד, הצמדות ורצפי הסתעפות2.

בהקשר זה, ספקטרומטריית מסה (MS) היא הטכניקה הנפוצה ביותר בניסויים בגליקומיקה ובגליקופרוטומיקה. ככל שהזמן עובר, אלה מתבצעים בהגדרות תפוקה גבוהות יותר ונתונים מצטברים כעת במסדי נתונים. מבני גליקן בפורמטים שונים3, מאכלסים את GlyTouCan4, מאגר נתוני הגליקאן האוניברסלי שבו כל מבנה משויך למזהה יציב ללא קשר לרמת הדיוק שבה מוגדר הגליקן (למשל, אולי סוג הצמדה חסר או הרכב מעורפל). מבנים דומים מאוד נאספים אך ההבדלים הקטנים ביניהם מדווחים בבירור. גליקופרוטאינים מתוארים ואוצרים ב- GlyConnect5 וב- GlyGen6, שני מסדי נתונים המצליבים זה את זה. נתוני טרשת נפוצה התומכים בפיסות מבניות של ראיות מאוחסנים יותר ויותר ב- GlycoPOST7. לכיסוי רחב יותר של משאבים מקוונים, פרק 52 של מדריך העיון, יסודות הגליקוביולוגיה, מוקדש לגליקוינפורמטיקה8. מעניין, תוכנת זיהוי גליקופפטיד התרבה בשנים האחרונות9,10 אם כי לא לטובת רבייה. הדאגה האחרונה גרמה למנהיגי יוזמת HUPO GlycoProteomics (HGI) להציב אתגר תוכנה בשנת 2019. נתוני הטרשת הנפוצה שהתקבלו מעיבוד תערובות מורכבות של חלבוני סרום אנושיים N-ו-O-גליקוסיליים במצבי פיצול CID, ETD ו- EThcD, היו זמינים למתחרים בין אם משתמשי תוכנה או מפתחים. הדו”ח המלא על תוצאות האתגר הזה11 מפורט רק כאן. ראשית, נצפתה התפשטות של זיהויים. זה התפרש בעיקר כנגרם על ידי מגוון השיטות המיושמות במנועי חיפוש, של ההגדרות שלהם, וכיצד תפוקות סוננו, ופפטיד “נספר”. העיצוב הניסיוני עשוי גם לשים כמה תוכנות וגישות ביתרון (dis).. חשוב לציין, המשתתפים שהשתמשו באותה תוכנה דיווחו על תוצאות לא עקביות, ובכך הדגישו בעיות רבייה חמורות. זה היה סיכם על ידי השוואת הגשות שונות כי פתרונות תוכנה מסוימים לבצע טוב יותר מאחרים וכמה אסטרטגיות חיפוש להניב תוצאות טובות יותר. משוב זה עשוי להנחות את השיפור של שיטות ניתוח נתונים אוטומטיות של גליקופפטיד וישפיע בתורו על תוכן מסד הנתונים.

התרחבות הגליקוינפורמטיקה הובילה ליצירת פורטלי אינטרנט המספקים מידע וגישה למספר משאבים דומים או משלימים. האחרונים והעדכניים ביותר מתוארים בפרק של סדרת הספרים המקיף Glycoscience12 ובאמצעות שיתוף פעולה, פתרון לשיתוף נתונים והחלפת מידע מוצע במצב גישה פתוחה. פורטל אחד כזה פותח אשר נקרא במקור Glycomics@ExPASy 13 ושמו שונה Glyco@Expasy, בעקבות השיפוץ הגדול של פלטפורמת Expasy14 שאירחה אוסף גדול של כלים ומאגרי מידע המשמשים על פני מספר – omics במשך עשרות שנים, הפריט הפופולרי ביותר הוא UniProt15 – מאגר הידע חלבון אוניברסלי. Glyco@Expasy מציעה גילוי דידקטי של המטרה והשימוש במסדי נתונים וכלים, המבוססים על סיווג חזותי ותצוגה של התלות ההדדית שלהם. הפרוטוקול הבא ממחיש נהלים לחקור נתוני גליקומיקה וגליקופרוטאומיקס עם מבחר משאבים מפורטל זה שהופך את החיבור בין גליקופרוטומיקה לאינטראקטיביות גליקנית מפורשת באמצעות גליקומוניקה. כפי שהוא, ניסויים גליקומוניקה לייצר מבנים שבהם monosaccharides מוגדרים באופן מלא וקישורים באופן חלקי או מלא נקבע, אבל הקובץ המצורף לאתר החלבון שלהם הוא מאופיין בצורה גרועה, אם בכלל, מאופיין. לעומת זאת, ניסויים בגליקופרוטאומיקה מייצרים מידע מדויק על קובץ מצורף לאתר, אך עם רזולוציה ירודה של מבני גליקאן, המוגבלים לעתים קרובות להרכבי מונוסכרידים. מידע זה מחובר יחד במסד הנתונים של GlyConnect. יתר על כן, כלי חיפוש ב- GlyConnect יכולים לשמש כדי לזהות ליגנדים גליקנים פוטנציאליים המתוארים יחד עם החלבונים המזהים אותם ב- UniLectin16, המקושרים ל- GlyConnect באמצעות גליקנים. הפרוטוקול המוצג כאן מחולק לשני חלקים כדי לכסות שאלות ספציפיות לגליקנים וגליקופרוטינים הקשורים ל- N ו- O הקשורים ל- O.

Protocol

הערה: נדרש התקן עם חיבור לאינטרנט (מסך גדול יותר מועדף) ודפדפן אינטרנט עדכני כגון Chrome או Firefox. ייתכן שהשימוש ב-Safari או ב-Edge אינו אמין באותה מידה. 1. מחלבון N-גליקום בגלי-קונקט ועד לציטין של UniLectin גישה למשאבים Glyco@Expasyהערה: ההליך המתואר כאן הוא לגשת ל- GlyConnect …

Representative Results

החלק הראשון של הפרוטוקול (סעיף 1) הראה כיצד לחקור את הספציפיות או את המשותף של N-glycans המצורפים על Asn-69 של האנטיגן הספציפי לערמונית האנושית (PSA) באמצעות פלטפורמת GlyConnect. שינויים תלויי רקמות (שתן ונוזל הזרע), כמו גם וריאציות תלויות איזופורם (נורמליות וגבוהות בביטוי גליקן), הודגשו באמצעות שני כלים ?…

Discussion

תמנון GlyConnect ככלי לחשיפת קורלציות בלתי צפויות
GlyConnect Octopus תוכנן במקור כדי לבצע שאילתה על מסד הנתונים עם הגדרה רופפת של גליקנים. ואכן, הספרות מדווחת לעתים קרובות על המאפיינים העיקריים של הגליקנים בגליקום כגון להיות fucosylated או sialylated, להיות עשוי שתי אנטנות או יותר, וכו ‘. יתר על כן, גליק…

Disclosures

The authors have nothing to disclose.

Acknowledgements

המחבר מכיר בחום בחברים בעבר ובהווה בקבוצת האינפורמטיקה של פרוטאום המעורבים בפיתוח המשאבים המשמשים במדריך זה, במיוחד, ז’וליאן מריתוז וקתרין הייז עבור GlyConnect, פרנסואה בונארדל עבור UniLectin, דוידה אלוצ’י, ופרדריק ניקיטין עבור התמנון, וטיבאולט רובין עבור קומפוזיטור ומגע אחרון על תמנון.

פיתוח פרויקט glyco@Expasy נתמך על ידי הממשלה הפדרלית השוויצרית באמצעות מזכירות המדינה לחינוך, מחקר וחדשנות (SERI) והוא משלים כיום על ידי הקרן הלאומית השוויצרית למדע (SNSF: 31003A_179249). ExPASy מתוחזקת על ידי המכון השוויצרי לביואינפורמטיקה ומתארחת במרכז כשירות Vital-IT. המחבר גם מכיר אן Imberty עבור שיתוף פעולה יוצא מן הכלל על פלטפורמת UniLectin נתמך במשותף על ידי ANR PIA Glyco@Alps (ANR-15-IDEX-02), אליאנס קמפוס רודניאן Co-funds (http://campusrhodanien.unige-cofunds.ch) Labex Arcane / CBH-EUR-GS (ANR-17-EURE-0003).

Materials

internet connection user's choice
recent version of web browser user's choice

References

  1. Spring Harbor Laboratory Press. . Essentials of Glycobiology. , (2015).
  2. Gray, C. J., et al. Advancing solutions to the carbohydrate sequencing challenge. Journal of the American Chemical Society. 141 (37), 14463-14479 (2019).
  3. Tsuchiya, S., Yamada, I., Aoki-Kinoshita, K. F. GlycanFormatConverter: a conversion tool for translating the complexities of glycans. Bioinformatics. 35 (14), 2434-2440 (2018).
  4. Fujita, A., et al. The international glycan repository GlyTouCan version 3.0. Nucleic Acids Research. 49, 1529-1533 (2021).
  5. Alocci, D., et al. GlyConnect: glycoproteomics goes visual, interactive, and analytical. Journal of Proteome Research. 18 (2), 664-677 (2019).
  6. York, W. S., et al. GlyGen: computational and informatics resources for glycoscience. Glycobiology. 30 (2), 72-73 (2020).
  7. Watanabe, Y., Aoki-Kinoshita, K. F., Ishihama, Y., Okuda, S. GlycoPOST realizes FAIR principles for glycomics mass spectrometry data. Nucleic Acids Research. 49, 1523-1528 (2020).
  8. Campbell, M. P., Aoki-Kinoshita, K. F., Lisacek, F., York, W. S., Packer, N. H. Glycoinformatics. Essentials of Glycobiology. , (2015).
  9. Cao, W., et al. Recent advances in software tools for more generic and precise intact glycopeptide analysis. Molecular & Cellular Proteomics. 20, 100060 (2021).
  10. Mariethoz, J., Hayes, C., Lisacek, F. Glycan compositions with Compozitor to enhance glycopeptide identification. Proteomics Data Analysis. 2361, 109-127 (2021).
  11. Kawahara, R., et al. Communityevaluation of glycoproteomics informatics solutions reveals high-performance search strategies of serum glycopeptide analysis. Nature Methods. 18, 1304-1316 (2021).
  12. Lisacek, F., Aoki-Kinoshita, K. F., Vora, J. K., Mazumder, R., Tiemeyer, M. Glycoinformatics resources integrated through the GlySpace Alliance. Comprehensive Glycoscience. 1, 507-521 (2021).
  13. Mariethoz, J., et al. Glycomics@ExPASy: bridging the gap. Molecular & Cellular Proteomics. 17 (11), 2164-2176 (2018).
  14. Duvaud, S., et al. Expasy, the swiss bioinformatics resource portal, as designed by its users. Nucleic Acids Research. 49, 216-227 (2021).
  15. The UniProt Consortium et al. UniProt: the universal protein knowledgebase in 2021. Nucleic Acids Research. 49, 480-489 (2021).
  16. Bonnardel, F., Perez, S., Lisacek, F., Imberty, A. Structural database for lectins and the UniLectin web platform. Lectin Purification and Analysis. 2132, 1-14 (2020).
  17. Neelamegham, S., et al. Updates to the symbol nomenclature for glycans guidelines. Glycobiology. 29 (9), 620-624 (2019).
  18. Sharon, N. IUPAC-IUB Joint Commission on Biochemical Nomenclature (JCBN). Nomenclature of glycoproteins, glycopeptides and peptidoglycans: JCBN recommendations 1985. Glycoconjugate Journal. 3 (2), 123-133 (1986).
  19. Harvey, D. J., et al. Proposal for a standard system for drawing structural diagrams of N- and O-linked carbohydrates and related compounds. Proteomics. 9 (15), 3796-3801 (2009).
  20. Song, E., Mayampurath, A., Yu, C. -. Y., Tang, H., Mechref, Y. Glycoproteomics: identifying the glycosylation of prostate specific antigen at normal and high isoelectric points by LC-MS/MS. Journal of Proteome Research. 13 (12), 5570-5580 (2014).
  21. Moran, A. B., et al. Profiling the proteoforms of urinary prostate-specific antigen by capillary electrophoresis – mass spectrometry. Journal of Proteomics. 238, 104148 (2021).
  22. Wang, W., et al. High-throughput glycopeptide profiling of prostate-specific antigen from seminal plasma by MALDI-MS. Talanta. 222, 121495 (2021).
  23. wwPDB consortium metal. Protein Data Bank: the single global archive for 3D macromolecular structure data. Nucleic Acids Research. 47, 520-528 (2019).
  24. Sehnal, D., Grant, O. C. Rapidly display glycan symbols in 3D structures: 3D-SNFG in LiteMol. Journal of Proteome Research. 18 (2), 770-774 (2019).
  25. Bonnardel, F., et al. UniLectin3D, a database of carbohydrate binding proteins with curated information on 3D structures and interacting ligands. Nucleic Acids Research. 47, 1236-1244 (2019).
  26. Sehnal, D., et al. LiteMol suite: interactive web-based visualization of large-scale macromolecular structure data. Nature Methods. 14 (12), 1121-1122 (2017).
  27. Salentin, S., Schreiber, S., Haupt, V. J., Adasme, M. F., Schroeder, M. PLIP: fully automated protein-ligand interaction profiler. Nucleic Acids Research. 43, 443-447 (2015).
  28. Robin, T., Mariethoz, J., Lisacek, F. Examining and fine-tuning the selection of glycan compositions with GlyConnect Compozitor. Molecular & Cellular Proteomics. 19 (10), 1602-1618 (2020).
  29. Compagno, D., et al. Glycans and galectins in prostate cancer biology, angiogenesis and metastasis. Glycobiology. 24 (10), 899-906 (2014).
  30. Gentilini, L. D., et al. Stable and high expression of Galectin-8 tightly controls metastatic progression of prostate cancer. Oncotarget. 8 (27), 44654-44668 (2017).
  31. Schwämmle, V., Verano-Braga, T., Roepstorff, P. Computational and statistical methods for high-throughput analysis of post-translational modifications of proteins. Journal of Proteomics. 129, 3-15 (2015).
  32. Khatri, K., Klein, J. A., Zaia, J. Use of an informed search space maximizes confidence of site-specific assignment of glycoprotein glycosylation. Analytical and Bioanalytical Chemistry. 409 (2), 607-618 (2017).
  33. Sztain, T., et al. A glycan gate controls opening of the SARS-CoV-2 spike protein. Nature Chemistry. 13, 963-968 (2021).
check_url/kr/63356?article_type=t

Play Video

Cite This Article
Lisacek, F. Bioinformatics Resources for the Study of Glycan-Mediated Protein Interactions. J. Vis. Exp. (179), e63356, doi:10.3791/63356 (2022).

View Video