Summary

Ресурсы биоинформатики для изучения гликано-опосредованных белковых взаимодействий

Published: January 20, 2022
doi:

Summary

Этот протокол иллюстрирует, как исследовать, сравнивать и интерпретировать гликомы белка человека с помощью онлайн-ресурсов.

Abstract

Инициатива Glyco@Expasy была выдвинута в виде набора взаимозависимых баз данных и инструментов, охватывающих несколько аспектов знаний в области гликобиологии. В частности, он направлен на выявление взаимодействий между гликопротеинами (такими как рецепторы клеточной поверхности) и углеводсвязывающими белками, опосредованными гликанами. Здесь основные ресурсы коллекции представлены на двух иллюстративных примерах, сосредоточенных на N-гликоме человеческого простат-специфического антигена (ПСА) и O-гликоме сывороточных белков человека. С помощью различных запросов к базе данных и с помощью инструментов визуализации в этой статье показано, как исследовать и сравнивать контент в континууме для сбора и корреляции разрозненных фрагментов информации. Собранные данные предназначены для подачи более сложных сценариев функции гликана. Таким образом, введенная здесь гликоинформатика предлагается в качестве средства для усиления, формирования или опровержения предположений о специфичности белкового гликома в данном контексте.

Introduction

Гликаны, белки, к которым они присоединены (гликопротеины) и белки, с которыми они связываются (лектины или углеводсвязывающие белки), являются основными молекулярными субъектами на поверхности клетки1. Несмотря на эту центральную роль в клеточно-клеточной коммуникации, крупномасштабные исследования, включая гликомику, гликопротеомику или гликан-интерактомику, по-прежнему скудны по сравнению с их аналогами в геномике и протеомике.

До недавнего времени не были разработаны методы характеристики ветвящихся структур сложных углеводов, еще конъюгированных с белком-носителем. Биосинтез гликопротеинов представляет собой процесс, не управляемый шаблонами, в котором доноры моносахаридов, принимающие гликопротеиновые субстраты, а также гликозилтрансферазы и гликозидазы играют интерактивную роль. Полученные гликопротеины могут иметь сложные структуры с несколькими точками ветвления, где каждый моносахаридный компонент может быть одним из нескольких типов, присутствующих в природе1. Процесс, не управляемый шаблонами, навязывает биохимический анализ в качестве единственного варианта для получения структурных данных олигосахаридов. Аналитический процесс гликовых структур, прикрепленных к нативному белку, часто является сложным, поскольку он требует чувствительных, количественных и надежных технологий для определения моносахаридного состава, связей и ветвящихся последовательностей2.

В этом контексте масс-спектрометрия (МС) является наиболее широко используемым методом в экспериментах по гликомике и гликопротеомике. Со временем они выполняются в более высоких настройках пропускной способности, и данные теперь накапливаются в базах данных. Гликанские структуры в различных форматах3 заполняют GlyTouCan4, универсальное хранилище данных гликана, где каждая структура связана со стабильным идентификатором независимо от уровня точности, с которой определен гликан (например, возможно, отсутствующий тип связи или неоднозначный состав). Собраны очень похожие структуры, но четко указаны их незначительные различия. Гликопротеины описаны и курируются в GlyConnect5 и GlyGen6, двух базах данных, перекрестно ссылающихся друг на друга. Данные о РС, подтверждающие структурные доказательства, все чаще хранятся в GlycoPOST7. Для более широкого охвата онлайн-ресурсов глава 52 справочного пособия «Основы гликобиологии» посвящена гликоинформатике8. Интересно, что программное обеспечение для идентификации гликопептидов распространилось в последние годы9,10, хотя и не в пользу воспроизводимости. Последняя проблема побудила лидеров HUPO GlycoProteomics Initiative (HGI) поставить перед собой задачу программного обеспечения в 2019 году. Данные MS, полученные при обработке сложных смесей N- и O-гликозилированных белков сыворотки крови человека в режимах фрагментации CID, ETD и EThcD, были доступны конкурентам, будь то пользователи программного обеспечения или разработчики. Полный отчет о результатах этой задачи11 изложен только здесь. Начнем с того, что наблюдалось распространение идентификаций. Это в основном интерпретировалось как вызванное разнообразием методов, реализованных в поисковых системах, их настроек и того, как выводы были отфильтрованы, а пептиды «подсчитаны». Экспериментальный дизайн, возможно, также поставил некоторое программное обеспечение и подходы в (не)преимущество. Важно отметить, что участники, использующие одно и то же программное обеспечение, сообщили о противоречивых результатах, тем самым подчеркнув серьезные проблемы с воспроизводимостью. Путем сравнения различных представлений был сделан вывод о том, что некоторые программные решения работают лучше, чем другие, а некоторые стратегии поиска дают лучшие результаты. Эта обратная связь, вероятно, будет способствовать совершенствованию автоматизированных методов анализа данных о гликопептидах и, в свою очередь, повлияет на содержание базы данных.

Расширение гликоинформатики привело к созданию веб-порталов, которые предоставляют информацию и доступ к множеству аналогичных или дополняющих ресурсов. Самые последние и актуальные из них описаны в главе серии книг Comprehensive Glycoscience12, и благодаря сотрудничеству предлагается решение для обмена данными и информацией в режиме открытого доступа. Был разработан один из таких порталов, который первоначально назывался Glycomics@ExPASy 13 и переименован Glyco@Expasy, после капитального ремонта платформы Expasy14, в которой в течение десятилетий размещалась большая коллекция инструментов и баз данных, используемых в нескольких -omics, самым популярным элементом является UniProt15 – универсальная база знаний о белках. Glyco@Expasy предлагает дидактическое обнаружение назначения и использования баз данных и инструментов на основе визуальной категоризации и отображения их взаимозависимостей. Следующий протокол иллюстрирует процедуры для изучения данных гликомики и гликопротеомики с выбором ресурсов из этого портала, который делает связь между гликопротеомикой и гликкан-интерактомикой явной через гликомику. Эксперименты с гликомикой создают структуры, в которых моносахариды полностью определены и связи частично или полностью определены, но их прикрепление к белковому участку плохо, если вообще характеризуется. Напротив, эксперименты по гликопротеомике генерируют точную информацию о прикреплении сайта, но с плохим разрешением гликановых структур, часто ограниченных моносахаридными композициями. Эта информация собрана в базу данных GlyConnect. Кроме того, инструменты поиска в GlyConnect могут быть использованы для обнаружения потенциальных гликановых лигандов, которые описаны вместе с белками, распознающими их в UniLectin16, связанными с GlyConnect через гликаны. Протокол, представленный здесь, разделен на два раздела, чтобы охватить вопросы, специфичные для N-связанных и O-связанных гликанов и гликопротеинов.

Protocol

ПРИМЕЧАНИЕ: Требуется устройство с подключением к Интернету (предпочтительно большой экран) и современным веб-браузером, таким как Chrome или Firefox. Использование Safari или Edge может быть не таким надежным. 1. От белка N-гликома в GlyConnect до лектина UniLectin Доступ к р…

Representative Results

Первая часть протокола (раздел 1) показала, как исследовать специфичность или общность N-гликанов, прикрепленных к Asn-69 человеческого простат-специфического антигена (ПСА) с помощью платформы GlyConnect. Тканезависимые (моча и семенная жидкость), а также изоформ-зависимые (нормальные и высоки?…

Discussion

GlyConnect Octopus как инструмент для выявления неожиданных корреляций
GlyConnect Octopus изначально был разработан для запроса базы данных со свободным определением гликанов. Действительно, в литературе часто сообщается об основных характеристиках гликанов в гликоме, таких как фукозилир?…

Divulgazioni

The authors have nothing to disclose.

Acknowledgements

Автор тепло приветствует прошлых и нынешних членов Proteome Informatics Group, участвующих в разработке ресурсов, используемых в этом учебнике, в частности, Жюльена Мариетоза и Кэтрин Хейс для GlyConnect, Франсуа Боннарделя для UniLectin, Давиде Алокчи и Фредерика Никитина для Octopus и Тибо Робина для Compozitor и последнего штриха к Octopus.

Разработка проекта glyco@Expasy поддерживается федеральным правительством Швейцарии через Государственный секретариат по вопросам образования, исследований и инноваций (SERI) и в настоящее время дополняется Швейцарским национальным научным фондом (SNSF: 31003A_179249). ExPASy поддерживается Швейцарским институтом биоинформатики и размещается в Центре компетенций Vital-IT. Автор также выражает признательность Энн Имберти за выдающееся сотрудничество на платформе UniLectin, совместно поддерживаемой ANR PIA Glyco@Alps (ANR-15-IDEX-02), Alliance Campus Rhodanien Co-funds (http://campusrhodanien.unige-cofunds.ch) Labex Arcane/CBH-EUR-GS (ANR-17-EURE-0003).

Materials

internet connection user's choice
recent version of web browser user's choice

Riferimenti

  1. Spring Harbor Laboratory Press. . Essentials of Glycobiology. , (2015).
  2. Gray, C. J., et al. Advancing solutions to the carbohydrate sequencing challenge. Journal of the American Chemical Society. 141 (37), 14463-14479 (2019).
  3. Tsuchiya, S., Yamada, I., Aoki-Kinoshita, K. F. GlycanFormatConverter: a conversion tool for translating the complexities of glycans. Bioinformatics. 35 (14), 2434-2440 (2018).
  4. Fujita, A., et al. The international glycan repository GlyTouCan version 3.0. Nucleic Acids Research. 49, 1529-1533 (2021).
  5. Alocci, D., et al. GlyConnect: glycoproteomics goes visual, interactive, and analytical. Journal of Proteome Research. 18 (2), 664-677 (2019).
  6. York, W. S., et al. GlyGen: computational and informatics resources for glycoscience. Glycobiology. 30 (2), 72-73 (2020).
  7. Watanabe, Y., Aoki-Kinoshita, K. F., Ishihama, Y., Okuda, S. GlycoPOST realizes FAIR principles for glycomics mass spectrometry data. Nucleic Acids Research. 49, 1523-1528 (2020).
  8. Campbell, M. P., Aoki-Kinoshita, K. F., Lisacek, F., York, W. S., Packer, N. H. Glycoinformatics. Essentials of Glycobiology. , (2015).
  9. Cao, W., et al. Recent advances in software tools for more generic and precise intact glycopeptide analysis. Molecular & Cellular Proteomics. 20, 100060 (2021).
  10. Mariethoz, J., Hayes, C., Lisacek, F. Glycan compositions with Compozitor to enhance glycopeptide identification. Proteomics Data Analysis. 2361, 109-127 (2021).
  11. Kawahara, R., et al. Communityevaluation of glycoproteomics informatics solutions reveals high-performance search strategies of serum glycopeptide analysis. Nature Methods. 18, 1304-1316 (2021).
  12. Lisacek, F., Aoki-Kinoshita, K. F., Vora, J. K., Mazumder, R., Tiemeyer, M. Glycoinformatics resources integrated through the GlySpace Alliance. Comprehensive Glycoscience. 1, 507-521 (2021).
  13. Mariethoz, J., et al. Glycomics@ExPASy: bridging the gap. Molecular & Cellular Proteomics. 17 (11), 2164-2176 (2018).
  14. Duvaud, S., et al. Expasy, the swiss bioinformatics resource portal, as designed by its users. Nucleic Acids Research. 49, 216-227 (2021).
  15. The UniProt Consortium et al. UniProt: the universal protein knowledgebase in 2021. Nucleic Acids Research. 49, 480-489 (2021).
  16. Bonnardel, F., Perez, S., Lisacek, F., Imberty, A. Structural database for lectins and the UniLectin web platform. Lectin Purification and Analysis. 2132, 1-14 (2020).
  17. Neelamegham, S., et al. Updates to the symbol nomenclature for glycans guidelines. Glycobiology. 29 (9), 620-624 (2019).
  18. Sharon, N. IUPAC-IUB Joint Commission on Biochemical Nomenclature (JCBN). Nomenclature of glycoproteins, glycopeptides and peptidoglycans: JCBN recommendations 1985. Glycoconjugate Journal. 3 (2), 123-133 (1986).
  19. Harvey, D. J., et al. Proposal for a standard system for drawing structural diagrams of N- and O-linked carbohydrates and related compounds. Proteomics. 9 (15), 3796-3801 (2009).
  20. Song, E., Mayampurath, A., Yu, C. -. Y., Tang, H., Mechref, Y. Glycoproteomics: identifying the glycosylation of prostate specific antigen at normal and high isoelectric points by LC-MS/MS. Journal of Proteome Research. 13 (12), 5570-5580 (2014).
  21. Moran, A. B., et al. Profiling the proteoforms of urinary prostate-specific antigen by capillary electrophoresis – mass spectrometry. Journal of Proteomics. 238, 104148 (2021).
  22. Wang, W., et al. High-throughput glycopeptide profiling of prostate-specific antigen from seminal plasma by MALDI-MS. Talanta. 222, 121495 (2021).
  23. wwPDB consortium metal. Protein Data Bank: the single global archive for 3D macromolecular structure data. Nucleic Acids Research. 47, 520-528 (2019).
  24. Sehnal, D., Grant, O. C. Rapidly display glycan symbols in 3D structures: 3D-SNFG in LiteMol. Journal of Proteome Research. 18 (2), 770-774 (2019).
  25. Bonnardel, F., et al. UniLectin3D, a database of carbohydrate binding proteins with curated information on 3D structures and interacting ligands. Nucleic Acids Research. 47, 1236-1244 (2019).
  26. Sehnal, D., et al. LiteMol suite: interactive web-based visualization of large-scale macromolecular structure data. Nature Methods. 14 (12), 1121-1122 (2017).
  27. Salentin, S., Schreiber, S., Haupt, V. J., Adasme, M. F., Schroeder, M. PLIP: fully automated protein-ligand interaction profiler. Nucleic Acids Research. 43, 443-447 (2015).
  28. Robin, T., Mariethoz, J., Lisacek, F. Examining and fine-tuning the selection of glycan compositions with GlyConnect Compozitor. Molecular & Cellular Proteomics. 19 (10), 1602-1618 (2020).
  29. Compagno, D., et al. Glycans and galectins in prostate cancer biology, angiogenesis and metastasis. Glycobiology. 24 (10), 899-906 (2014).
  30. Gentilini, L. D., et al. Stable and high expression of Galectin-8 tightly controls metastatic progression of prostate cancer. Oncotarget. 8 (27), 44654-44668 (2017).
  31. Schwämmle, V., Verano-Braga, T., Roepstorff, P. Computational and statistical methods for high-throughput analysis of post-translational modifications of proteins. Journal of Proteomics. 129, 3-15 (2015).
  32. Khatri, K., Klein, J. A., Zaia, J. Use of an informed search space maximizes confidence of site-specific assignment of glycoprotein glycosylation. Analytical and Bioanalytical Chemistry. 409 (2), 607-618 (2017).
  33. Sztain, T., et al. A glycan gate controls opening of the SARS-CoV-2 spike protein. Nature Chemistry. 13, 963-968 (2021).
check_url/it/63356?article_type=t

Play Video

Citazione di questo articolo
Lisacek, F. Bioinformatics Resources for the Study of Glycan-Mediated Protein Interactions. J. Vis. Exp. (179), e63356, doi:10.3791/63356 (2022).

View Video