Summary

موارد المعلوماتية الحيوية لدراسة تفاعلات البروتين بوساطة الجليكان

Published: January 20, 2022
doi:

Summary

يوضح هذا البروتوكول كيفية استكشاف ومقارنة وتفسير البروتين البشري glycome مع الموارد عبر الإنترنت.

Abstract

تم إطلاق مبادرة Glyco@Expasy كمجموعة من قواعد البيانات والأدوات المترابطة التي تغطي عدة جوانب من المعرفة في علم الأحياء السكري. على وجه الخصوص ، يهدف إلى تسليط الضوء على التفاعلات بين البروتينات السكرية (مثل مستقبلات سطح الخلية) والبروتينات المرتبطة بالكربوهيدرات بوساطة الجلايكان. هنا ، يتم تقديم الموارد الرئيسية للمجموعة من خلال مثالين توضيحيين يتمركزان على N-glycome لمستضد البروستاتا البشري المحدد (PSA) و O-glycome لبروتينات المصل البشري. من خلال استعلامات قاعدة البيانات المختلفة وبمساعدة أدوات التصور ، توضح هذه المقالة كيفية استكشاف المحتوى ومقارنته في سلسلة متصلة لجمع وربط أجزاء المعلومات المتناثرة بخلاف ذلك. البيانات التي تم جمعها موجهة لتغذية سيناريوهات أكثر تفصيلا لوظيفة الجليكان. لذلك ، يتم اقتراح المعلوماتية الجليكونية المقدمة هنا كوسيلة إما لتعزيز أو تشكيل أو دحض الافتراضات حول خصوصية غليكوم البروتين في سياق معين.

Introduction

الجليكان والبروتينات التي ترتبط بها (البروتينات السكرية) والبروتينات التي ترتبط بها (الليكتين أو البروتينات المرتبطة بالكربوهيدرات) هي الجهات الفاعلة الجزيئية الرئيسية على سطح الخلية1. على الرغم من هذا الدور المركزي في التواصل بين الخلايا الخلوية، إلا أن الدراسات واسعة النطاق، بما في ذلك الغليكوميكس، أو الجليكوبروتيوميك، أو بيانات الجليكوبروتينات البينية لا تزال نادرة مقارنة بنظيرتها في علم الجينوم والبروتيوميات.

حتى وقت قريب ، لم يتم تطوير طرق لتوصيف الهياكل المتفرعة للكربوهيدرات المعقدة بينما لا تزال مقترنة بالبروتين الناقل. التخليق الحيوي للبروتينات السكرية هو عملية غير مدفوعة بالقوالب يلعب فيها المتبرعون بالسكريات الأحادية ، وركائز البروتين السكري المقبولة ، والجليكوزيل ترانسفيراز والجليكوزيداز دورا تفاعليا. يمكن أن تحمل البروتينات السكرية الناتجة هياكل معقدة مع نقاط تفرع متعددة حيث يمكن أن يكون كل مكون من مكونات السكاريد الأحادي أحد الأنواع العديدة الموجودة في الطبيعة1. تفرض العملية غير القائمة على القوالب التحليل الكيميائي الحيوي كخيار وحيد لتوليد البيانات الهيكلية قليلة السكاريد. غالبا ما تكون العملية التحليلية لهياكل الجليكان المرتبطة بالبروتين الأصلي صعبة لأنها تتطلب تقنيات حساسة وكمية وقوية لتحديد تكوين السكاريد الأحادي والروابط والتسلسلات المتفرعة2.

في هذا السياق ، يعد قياس الطيف الكتلي (MS) هو التقنية الأكثر استخداما على نطاق واسع في تجارب glycomics و glycoproteomics. مع مرور الوقت ، يتم تنفيذ هذه في إعدادات إنتاجية أعلى وتتراكم البيانات الآن في قواعد البيانات. هياكل غليكان بتنسيقات مختلفة3 ، تملأ GlyTouCan4 ، مستودع بيانات غليكان العالمي حيث ترتبط كل بنية بمعرف مستقر بغض النظر عن مستوى الدقة الذي يتم به تعريف الجليكان (على سبيل المثال ، ربما نوع الارتباط المفقود أو التركيب الغامض). يتم جمع هياكل متشابهة جدا ولكن يتم الإبلاغ بوضوح عن اختلافاتها الطفيفة. يتم وصف البروتينات السكرية وتنسيقها في GlyConnect5 و GlyGen6 ، وهما قاعدتا بيانات مرجعيتان لبعضهما البعض. يتم تخزين بيانات MS التي تدعم الأجزاء الهيكلية من الأدلة بشكل متزايد في GlycoPOST7. وللحصول على تغطية أوسع للموارد على الإنترنت، فإن الفصل 52 من الدليل المرجعي، أساسيات علم الأحياء السكرية، مكرس للمعلوماتية السكرية8. ومن المثير للاهتمام ، أن برامج تحديد الجليكوببتيد قد انتشرت في السنوات الأخيرة9,10 ولكن ليس لصالح التكاثر. دفع القلق الأخير قادة مبادرة HUPO GlycoProteomics (HGI) إلى وضع تحد للبرمجيات في عام 2019. تم توفير بيانات MS التي تم الحصول عليها من معالجة المخاليط المعقدة من بروتينات المصل البشري N- و O-glycosylated في أوضاع تجزئة CID و ETD و EThcD للمنافسين سواء مستخدمي البرامج أو المطورين. ولا يرد هنا سوى التقرير الكامل عن نتائج هذا التحدي(11). بادئ ذي بدء ، لوحظ انتشار عمليات تحديد الهوية. تم تفسيره بشكل رئيسي على أنه ناجم عن تنوع الأساليب المنفذة في محركات البحث ، وإعداداتها ، وكيفية تصفية المخرجات ، و “حساب” الببتيد. قد يكون التصميم التجريبي قد وضع أيضا بعض البرامج والأساليب في ميزة (غير واضحة). والأهم من ذلك، أن المشاركين الذين يستخدمون نفس البرنامج أبلغوا عن نتائج غير متناسقة، مما يسلط الضوء على قضايا خطيرة تتعلق بقابلية التكرار. واختتم بمقارنة التقديمات المختلفة بأن بعض الحلول البرمجية تؤدي أداء أفضل من غيرها وأن بعض استراتيجيات البحث تسفر عن نتائج أفضل. ومن المرجح أن توجه هذه التغذية المرتدة تحسين أساليب تحليل بيانات غليكوببتيد الآلية، وستؤثر بدورها على محتوى قاعدة البيانات.

أدى التوسع في المعلوماتية السكرية إلى إنشاء بوابات ويب توفر المعلومات والوصول إلى العديد من الموارد المماثلة أو المكملة. ويرد وصف لأحدث وأحدث هذه الأحدث في فصل من سلسلة كتب علم الجليكوساينس الشاملة(12)، ومن خلال التعاون، يتم تقديم حل لتقاسم البيانات وتبادل المعلومات في وضع الوصول المفتوح. تم تطوير إحدى هذه البوابات التي كانت تسمى في الأصل Glycomics@ExPASy 13 وأعيدت تسميتها Glyco@Expasy ، بعد الإصلاح الرئيسي لمنصة Expasy 14 التي استضافت مجموعة كبيرة من الأدوات وقواعد البيانات المستخدمة عبر العديد من -omics لعقود ، العنصر الأكثر شعبية هو UniProt15 – قاعدة معارف البروتين العالمية. تقدم Glyco@Expasy اكتشافا تعليميا للغرض من قواعد البيانات والأدوات واستخدامها ، استنادا إلى تصنيف مرئي وعرض لأوجه ترابطها. يوضح البروتوكول التالي إجراءات استكشاف بيانات الجليكوميكس و glycoproteomics مع مجموعة مختارة من الموارد من هذه البوابة التي تجعل العلاقة بين glycoproteomics و glycan-interactomics واضحة عبر glycomics. كما هو الحال ، تنتج تجارب glycomics هياكل حيث يتم تعريف السكريات الأحادية بشكل كامل وتحديد الروابط جزئيا أو كليا ، ولكن ارتباطها بموقع البروتين يكون ضعيفا ، إن وجد. في المقابل ، تولد تجارب glycoproteomics معلومات دقيقة عن مرفق الموقع ولكن مع دقة ضعيفة لهياكل الجليكان ، وغالبا ما تقتصر على تركيبات السكاريد الأحادي. يتم تجميع هذه المعلومات معا في قاعدة بيانات GlyConnect. علاوة على ذلك ، يمكن استخدام أدوات البحث في GlyConnect للكشف عن روابط الجليكان المحتملة التي يتم وصفها جنبا إلى جنب مع البروتينات التي تتعرف عليها في UniLectin16 ، المرتبطة ب GlyConnect عبر glycans. ينقسم البروتوكول المعروض هنا إلى قسمين لتغطية الأسئلة الخاصة بالجليكان المرتبط ب N والمرتبط ب O والبروتينات السكرية.

Protocol

ملاحظة: يلزم وجود جهاز متصل بالإنترنت (يفضل شاشة أكبر) ومتصفح ويب محدث مثل Chrome أو Firefox. قد لا يكون استخدام Safari أو Edge موثوقا به. 1. من بروتين N-glycome في GlyConnect إلى ليكتين من UniLectin الوصول إلى الموارد من Glyco@Expasyملاحظة: الإجراء الموضح هنا هو الوصول إلى GlyConnect ولك…

Representative Results

أظهر الجزء الأول من البروتوكول (القسم 1) كيفية التحقيق في خصوصية أو شيوع N-glycans المرفقة على Asn-69 من مستضد البروستاتا البشري المحدد (PSA) باستخدام منصة GlyConnect. تم التأكيد على الاختلافات المعتمدة على الأنسجة (البول والسائل المنوي) ، وكذلك الاختلافات المعتمدة على الشكل المتماثل (الطبيعي والعالي pI) …

Discussion

GlyConnect الأخطبوط كأداة للكشف عن الارتباطات غير المتوقعة
تم تصميم GlyConnect Octopus في الأصل للاستعلام عن قاعدة البيانات مع تعريف فضفاض للجليكان. في الواقع ، غالبا ما تشير الأدبيات إلى الخصائص الرئيسية للجليكان في الغليكوم مثل كونها فوكوسيلات أو سياليل ، كونها مصنوعة من هوائين أو أكثر ، …

Disclosures

The authors have nothing to disclose.

Acknowledgements

يعترف المؤلف بحرارة بالأعضاء السابقين والحاليين في مجموعة Proteome Informatics Group المشاركين في تطوير الموارد المستخدمة في هذا البرنامج التعليمي ، وعلى وجه التحديد ، جوليان ماريثوز وكاثرين هايز ل GlyConnect ، وفرانسوا بونارديل ل UniLectin ، و Davide Alocci ، و Frederic Nikitin للأخطبوط ، و Thibault Robin ل Compozitor واللمسة الأخيرة على الأخطبوط.

وتدعم الحكومة الاتحادية السويسرية تطوير مشروع glyco@Expasy من خلال أمانة الدولة للتعليم والبحث والابتكار، وتكمله حاليا المؤسسة الوطنية السويسرية للعلوم (SNSF: 31003A_179249). يتم الحفاظ على ExPASy من قبل المعهد السويسري للمعلوماتية الحيوية واستضافته في مركز كفاءة تكنولوجيا المعلومات الحيوية. كما يعترف المؤلف بآن إمبرتي لتعاونها المتميز على منصة UniLectin المدعومة بشكل مشترك من قبل ANR PIA Glyco@Alps (ANR-15-IDEX-02) ، والصناديق المشتركة ل Alliance Campus Rhodanien (http://campusrhodanien.unige-cofunds.ch) Labex Arcane / CBH-EUR-GS (ANR-17-EURE-0003).

Materials

internet connection user's choice
recent version of web browser user's choice

References

  1. Spring Harbor Laboratory Press. . Essentials of Glycobiology. , (2015).
  2. Gray, C. J., et al. Advancing solutions to the carbohydrate sequencing challenge. Journal of the American Chemical Society. 141 (37), 14463-14479 (2019).
  3. Tsuchiya, S., Yamada, I., Aoki-Kinoshita, K. F. GlycanFormatConverter: a conversion tool for translating the complexities of glycans. Bioinformatics. 35 (14), 2434-2440 (2018).
  4. Fujita, A., et al. The international glycan repository GlyTouCan version 3.0. Nucleic Acids Research. 49, 1529-1533 (2021).
  5. Alocci, D., et al. GlyConnect: glycoproteomics goes visual, interactive, and analytical. Journal of Proteome Research. 18 (2), 664-677 (2019).
  6. York, W. S., et al. GlyGen: computational and informatics resources for glycoscience. Glycobiology. 30 (2), 72-73 (2020).
  7. Watanabe, Y., Aoki-Kinoshita, K. F., Ishihama, Y., Okuda, S. GlycoPOST realizes FAIR principles for glycomics mass spectrometry data. Nucleic Acids Research. 49, 1523-1528 (2020).
  8. Campbell, M. P., Aoki-Kinoshita, K. F., Lisacek, F., York, W. S., Packer, N. H. Glycoinformatics. Essentials of Glycobiology. , (2015).
  9. Cao, W., et al. Recent advances in software tools for more generic and precise intact glycopeptide analysis. Molecular & Cellular Proteomics. 20, 100060 (2021).
  10. Mariethoz, J., Hayes, C., Lisacek, F. Glycan compositions with Compozitor to enhance glycopeptide identification. Proteomics Data Analysis. 2361, 109-127 (2021).
  11. Kawahara, R., et al. Communityevaluation of glycoproteomics informatics solutions reveals high-performance search strategies of serum glycopeptide analysis. Nature Methods. 18, 1304-1316 (2021).
  12. Lisacek, F., Aoki-Kinoshita, K. F., Vora, J. K., Mazumder, R., Tiemeyer, M. Glycoinformatics resources integrated through the GlySpace Alliance. Comprehensive Glycoscience. 1, 507-521 (2021).
  13. Mariethoz, J., et al. Glycomics@ExPASy: bridging the gap. Molecular & Cellular Proteomics. 17 (11), 2164-2176 (2018).
  14. Duvaud, S., et al. Expasy, the swiss bioinformatics resource portal, as designed by its users. Nucleic Acids Research. 49, 216-227 (2021).
  15. The UniProt Consortium et al. UniProt: the universal protein knowledgebase in 2021. Nucleic Acids Research. 49, 480-489 (2021).
  16. Bonnardel, F., Perez, S., Lisacek, F., Imberty, A. Structural database for lectins and the UniLectin web platform. Lectin Purification and Analysis. 2132, 1-14 (2020).
  17. Neelamegham, S., et al. Updates to the symbol nomenclature for glycans guidelines. Glycobiology. 29 (9), 620-624 (2019).
  18. Sharon, N. IUPAC-IUB Joint Commission on Biochemical Nomenclature (JCBN). Nomenclature of glycoproteins, glycopeptides and peptidoglycans: JCBN recommendations 1985. Glycoconjugate Journal. 3 (2), 123-133 (1986).
  19. Harvey, D. J., et al. Proposal for a standard system for drawing structural diagrams of N- and O-linked carbohydrates and related compounds. Proteomics. 9 (15), 3796-3801 (2009).
  20. Song, E., Mayampurath, A., Yu, C. -. Y., Tang, H., Mechref, Y. Glycoproteomics: identifying the glycosylation of prostate specific antigen at normal and high isoelectric points by LC-MS/MS. Journal of Proteome Research. 13 (12), 5570-5580 (2014).
  21. Moran, A. B., et al. Profiling the proteoforms of urinary prostate-specific antigen by capillary electrophoresis – mass spectrometry. Journal of Proteomics. 238, 104148 (2021).
  22. Wang, W., et al. High-throughput glycopeptide profiling of prostate-specific antigen from seminal plasma by MALDI-MS. Talanta. 222, 121495 (2021).
  23. wwPDB consortium metal. Protein Data Bank: the single global archive for 3D macromolecular structure data. Nucleic Acids Research. 47, 520-528 (2019).
  24. Sehnal, D., Grant, O. C. Rapidly display glycan symbols in 3D structures: 3D-SNFG in LiteMol. Journal of Proteome Research. 18 (2), 770-774 (2019).
  25. Bonnardel, F., et al. UniLectin3D, a database of carbohydrate binding proteins with curated information on 3D structures and interacting ligands. Nucleic Acids Research. 47, 1236-1244 (2019).
  26. Sehnal, D., et al. LiteMol suite: interactive web-based visualization of large-scale macromolecular structure data. Nature Methods. 14 (12), 1121-1122 (2017).
  27. Salentin, S., Schreiber, S., Haupt, V. J., Adasme, M. F., Schroeder, M. PLIP: fully automated protein-ligand interaction profiler. Nucleic Acids Research. 43, 443-447 (2015).
  28. Robin, T., Mariethoz, J., Lisacek, F. Examining and fine-tuning the selection of glycan compositions with GlyConnect Compozitor. Molecular & Cellular Proteomics. 19 (10), 1602-1618 (2020).
  29. Compagno, D., et al. Glycans and galectins in prostate cancer biology, angiogenesis and metastasis. Glycobiology. 24 (10), 899-906 (2014).
  30. Gentilini, L. D., et al. Stable and high expression of Galectin-8 tightly controls metastatic progression of prostate cancer. Oncotarget. 8 (27), 44654-44668 (2017).
  31. Schwämmle, V., Verano-Braga, T., Roepstorff, P. Computational and statistical methods for high-throughput analysis of post-translational modifications of proteins. Journal of Proteomics. 129, 3-15 (2015).
  32. Khatri, K., Klein, J. A., Zaia, J. Use of an informed search space maximizes confidence of site-specific assignment of glycoprotein glycosylation. Analytical and Bioanalytical Chemistry. 409 (2), 607-618 (2017).
  33. Sztain, T., et al. A glycan gate controls opening of the SARS-CoV-2 spike protein. Nature Chemistry. 13, 963-968 (2021).
check_url/kr/63356?article_type=t

Play Video

Cite This Article
Lisacek, F. Bioinformatics Resources for the Study of Glycan-Mediated Protein Interactions. J. Vis. Exp. (179), e63356, doi:10.3791/63356 (2022).

View Video