Summary

Ressources bioinformatiques pour l’étude des interactions protéiques médiées par le glycane

Published: January 20, 2022
doi:

Summary

Ce protocole illustre comment explorer, comparer et interpréter les glycomes de protéines humaines avec des ressources en ligne.

Abstract

L’initiative Glyco@Expasy a été lancée en tant que collection de bases de données et d’outils interdépendants couvrant plusieurs aspects des connaissances en glycobiologie. En particulier, il vise à mettre en évidence les interactions entre les glycoprotéines (telles que les récepteurs de surface cellulaire) et les protéines de liaison aux glucides médiées par les glycanes. Ici, les principales ressources de la collection sont présentées à travers deux exemples illustratifs centrés sur le N-glycome de l’antigène spécifique de la prostate humaine (PSA) et l’O-glycome des protéines sériques humaines. À travers différentes requêtes de base de données et à l’aide d’outils de visualisation, cet article montre comment explorer et comparer le contenu dans un continuum pour recueillir et corréler des éléments d’information autrement dispersés. Les données collectées sont destinées à alimenter des scénarios plus élaborés de la fonction du glycane. La glycoinformatique introduite ici est donc proposée comme un moyen de renforcer, de façonner ou de réfuter les hypothèses sur la spécificité d’un glycome protéique dans un contexte donné.

Introduction

Les glycanes, protéines auxquelles ils sont attachés (glycoprotéines) et protéines auxquelles ils se lient (lectines ou protéines liant les glucides) sont les principaux acteurs moléculaires à la surface de la cellule1. Malgré ce rôle central dans la communication cellule-cellule, les études à grande échelle, y compris les données sur la glycomique, la glycoprotéomique ou l’interactomique des glycanes, sont encore rares par rapport à leur homologue en génomique et en protéomique.

Jusqu’à récemment, les méthodes permettant de caractériser les structures ramifiées des glucides complexes tout en étant conjuguées à la protéine porteuse n’avaient pas été développées. La biosynthèse des glycoprotéines est un processus non piloté par un modèle dans lequel les donneurs de monosaccharides, les substrats de glycoprotéines acceptants, les glycosyltransférases et les glycosidases jouent un rôle interactif. Les glycoprotéines résultantes peuvent porter des structures complexes avec de multiples points de ramification où chaque composant monosaccharidique peut être l’un des nombreux types présents dans la nature1. Le processus non piloté par modèle impose l’analyse biochimique comme seule option pour générer des données structurelles sur les oligosaccharides. Le processus analytique des structures glycanes attachées à une protéine native est souvent difficile car il nécessite des technologies sensibles, quantitatives et robustes pour déterminer la composition des monosaccharides, les liaisons et les séquences de ramification2.

Dans ce contexte, la spectrométrie de masse (SEP) est la technique la plus largement utilisée dans les expériences de glycomique et de glycoprotéomique. Au fil du temps, ceux-ci sont effectués dans des paramètres de débit plus élevé et les données s’accumulent maintenant dans les bases de données. Les structures de glycanes dans divers formats3, remplissent GlyTouCan4, le référentiel universel de données sur les glycanes où chaque structure est associée à un identificateur stable, quel que soit le niveau de précision avec lequel le glycane est défini (par exemple, le type de liaison manquant ou la composition ambiguë). Des structures très similaires sont collectées, mais leurs différences mineures sont clairement rapportées. Les glycoprotéines sont décrites et organisées dans GlyConnect5 et GlyGen6, deux bases de données qui se croisent. Les données sur la SEP à l’appui des éléments de preuve structurels sont de plus en plus stockées dans GlycoPOST7. Pour une couverture plus large des ressources en ligne, le chapitre 52 du manuel de référence, Essentials of Glycobiology, est consacré à la glycoinformatique8. Fait intéressant, les logiciels d’identification des glycopeptides ont proliféré ces dernières années9,10 mais pas au profit de la reproductibilité. Cette dernière préoccupation a incité les dirigeants de l’Initiative HUPO GlycoProteomics (HGI) à relever un défi logiciel en 2019. Les données sur la SEP obtenues à partir du traitement de mélanges complexes de protéines sériques humaines N- et O-glycosylées dans les modes de fragmentation CID, ETD et EThcD, ont été mises à la disposition des concurrents, qu’il s’agisse d’utilisateurs de logiciels ou de développeurs. Le rapport complet sur les résultats de ce défi11 n’est présenté qu’ici. Pour commencer, une propagation des identifications a été observée. Il a été principalement interprété comme étant causé par la diversité des méthodes mises en œuvre dans les moteurs de recherche, de leurs paramètres et de la façon dont les sorties étaient filtrées et les peptides « comptés ». La conception expérimentale peut également avoir mis certains logiciels et approches à un (dés)avantage. Il est important de noter que les participants utilisant le même logiciel ont signalé des résultats incohérents, mettant ainsi en évidence de graves problèmes de reproductibilité. Il a été conclu en comparant différentes soumissions que certaines solutions logicielles fonctionnent mieux que d’autres et que certaines stratégies de recherche donnent de meilleurs résultats. Cette rétroaction est susceptible de guider l’amélioration des méthodes automatisées d’analyse des données sur les glycopeptides et aura à son tour un impact sur le contenu de la base de données.

L’expansion de la glycoinformatique a conduit à la création de portails Web qui fournissent de l’information et un accès à de multiples ressources similaires ou complémentaires. Les plus récents et les plus à jour sont décrits dans un chapitre de la série de livres Comprehensive Glycoscience12 et, grâce à la coopération, une solution au partage de données et à l’échange d’informations est proposée en mode libre accès. L’un de ces portails a été développé, qui s’appelait à l’origine Glycomics@ExPASy 13 et a été rebaptisé Glyco@Expasy, à la suite de la refonte majeure de la plate-forme Expasy14 qui héberge une grande collection d’outils et de bases de données utilisés dans plusieurs -omiques pendant des décennies, l’élément le plus populaire étant UniProt15 – la base de connaissances universelle sur les protéines. Glyco@Expasy offre une découverte didactique de la finalité et de l’utilisation des bases de données et des outils, basée sur une catégorisation visuelle et un affichage de leurs interdépendances. Le protocole suivant illustre les procédures d’exploration des données glycomiques et glycoprotéomiques avec une sélection de ressources de ce portail qui rend le lien entre la glycoprotéomique et l’interactomique glycane explicite via la glycomique. En l’état, les expériences en glycomique produisent des structures où les monosaccharides sont entièrement définis et les liens partiellement ou entièrement déterminés, mais leur fixation au site protéique est mal, voire pas du tout, caractérisée. En revanche, les expériences de glycoprotéomique génèrent des informations précises sur la fixation du site, mais avec une mauvaise résolution des structures glycanes, souvent limitées aux compositions monosaccharidiques. Ces informations sont rassemblées dans la base de données GlyConnect. En outre, les outils de recherche de GlyConnect peuvent être utilisés pour détecter les ligands glycanes potentiels qui sont décrits avec les protéines les reconnaissant dans UniLectin16, liés à GlyConnect via des glycanes. Le protocole présenté ici est divisé en deux sections pour couvrir les questions spécifiques aux glycanes et glycoprotéines liés à l’azote et à l’O.

Protocol

REMARQUE: Un appareil avec une connexion Internet (écran plus grand de préférence) et un navigateur Web à jour tel que Chrome ou Firefox est requis. L’utilisation de Safari ou d’Edge peut ne pas être aussi fiable. 1. D’une protéine N-glycome dans GlyConnect à une lectine d’UniLectin Accès aux ressources à partir de Glyco@ExpasyREMARQUE: La procédure décrite ici consiste à accéder à GlyConnect, mais peut être appliquée à l…

Representative Results

La première partie du protocole (section 1) a montré comment étudier la spécificité ou la similitude des N-glycanes attachés à l’Asn-69 de l’antigène spécifique de la prostate (PSA) humain à l’aide de la plate-forme GlyConnect. Les variations tissulaires (urine et liquide séminal), ainsi que les variations isoformes (pI normale et élevée) dans l’expression du glycane, ont été soulignées à l’aide de deux outils de visualisation (figure 4 et <strong …

Discussion

GlyConnect Octopus comme outil pour révéler des corrélations inattendues
GlyConnect Octopus a été conçu à l’origine pour interroger la base de données avec une définition lâche des glycanes. En effet, la littérature rapporte souvent les principales caractéristiques des glycanes dans un glycome comme être fucosylé ou sialylé, être constitué de deux antennes ou plus, etc. En outre, les glycanes, qu’ils soient liés à N ou à O, sont classés en noyaux, comme détaillé dans<sup cla…

Divulgazioni

The authors have nothing to disclose.

Acknowledgements

L’auteur reconnaît chaleureusement les membres passés et présents du Proteome Informatics Group impliqués dans le développement des ressources utilisées dans ce tutoriel, en particulier Julien Mariethoz et Catherine Hayes pour GlyConnect, François Bonnardel pour UniLectin, Davide Alocci et Frederic Nikitin pour octopus, et Thibault Robin pour Compozitor et final touch on Octopus.

Le développement du projet glyco@Expasy est soutenu par la Confédération suisse par l’intermédiaire du Secrétariat d’Etat à la formation, à la recherche et à l’innovation (SEFRI) et est actuellement complété par le Fonds national suisse (FNS: 31003A_179249). ExPASy est géré par l’Institut suisse de bioinformatique et hébergé au Vital-IT Competency Center. L’auteur remercie également Anne Imberty pour sa coopération exceptionnelle sur la plateforme UniLectin soutenue conjointement par ANR PIA Glyco@Alps (ANR-15-IDEX-02), Alliance Campus Rhodanien Co-funds (http://campusrhodanien.unige-cofunds.ch) Labex Arcane/CBH-EUR-GS (ANR-17-EURE-0003).

Materials

internet connection user's choice
recent version of web browser user's choice

Riferimenti

  1. Spring Harbor Laboratory Press. . Essentials of Glycobiology. , (2015).
  2. Gray, C. J., et al. Advancing solutions to the carbohydrate sequencing challenge. Journal of the American Chemical Society. 141 (37), 14463-14479 (2019).
  3. Tsuchiya, S., Yamada, I., Aoki-Kinoshita, K. F. GlycanFormatConverter: a conversion tool for translating the complexities of glycans. Bioinformatics. 35 (14), 2434-2440 (2018).
  4. Fujita, A., et al. The international glycan repository GlyTouCan version 3.0. Nucleic Acids Research. 49, 1529-1533 (2021).
  5. Alocci, D., et al. GlyConnect: glycoproteomics goes visual, interactive, and analytical. Journal of Proteome Research. 18 (2), 664-677 (2019).
  6. York, W. S., et al. GlyGen: computational and informatics resources for glycoscience. Glycobiology. 30 (2), 72-73 (2020).
  7. Watanabe, Y., Aoki-Kinoshita, K. F., Ishihama, Y., Okuda, S. GlycoPOST realizes FAIR principles for glycomics mass spectrometry data. Nucleic Acids Research. 49, 1523-1528 (2020).
  8. Campbell, M. P., Aoki-Kinoshita, K. F., Lisacek, F., York, W. S., Packer, N. H. Glycoinformatics. Essentials of Glycobiology. , (2015).
  9. Cao, W., et al. Recent advances in software tools for more generic and precise intact glycopeptide analysis. Molecular & Cellular Proteomics. 20, 100060 (2021).
  10. Mariethoz, J., Hayes, C., Lisacek, F. Glycan compositions with Compozitor to enhance glycopeptide identification. Proteomics Data Analysis. 2361, 109-127 (2021).
  11. Kawahara, R., et al. Communityevaluation of glycoproteomics informatics solutions reveals high-performance search strategies of serum glycopeptide analysis. Nature Methods. 18, 1304-1316 (2021).
  12. Lisacek, F., Aoki-Kinoshita, K. F., Vora, J. K., Mazumder, R., Tiemeyer, M. Glycoinformatics resources integrated through the GlySpace Alliance. Comprehensive Glycoscience. 1, 507-521 (2021).
  13. Mariethoz, J., et al. Glycomics@ExPASy: bridging the gap. Molecular & Cellular Proteomics. 17 (11), 2164-2176 (2018).
  14. Duvaud, S., et al. Expasy, the swiss bioinformatics resource portal, as designed by its users. Nucleic Acids Research. 49, 216-227 (2021).
  15. The UniProt Consortium et al. UniProt: the universal protein knowledgebase in 2021. Nucleic Acids Research. 49, 480-489 (2021).
  16. Bonnardel, F., Perez, S., Lisacek, F., Imberty, A. Structural database for lectins and the UniLectin web platform. Lectin Purification and Analysis. 2132, 1-14 (2020).
  17. Neelamegham, S., et al. Updates to the symbol nomenclature for glycans guidelines. Glycobiology. 29 (9), 620-624 (2019).
  18. Sharon, N. IUPAC-IUB Joint Commission on Biochemical Nomenclature (JCBN). Nomenclature of glycoproteins, glycopeptides and peptidoglycans: JCBN recommendations 1985. Glycoconjugate Journal. 3 (2), 123-133 (1986).
  19. Harvey, D. J., et al. Proposal for a standard system for drawing structural diagrams of N- and O-linked carbohydrates and related compounds. Proteomics. 9 (15), 3796-3801 (2009).
  20. Song, E., Mayampurath, A., Yu, C. -. Y., Tang, H., Mechref, Y. Glycoproteomics: identifying the glycosylation of prostate specific antigen at normal and high isoelectric points by LC-MS/MS. Journal of Proteome Research. 13 (12), 5570-5580 (2014).
  21. Moran, A. B., et al. Profiling the proteoforms of urinary prostate-specific antigen by capillary electrophoresis – mass spectrometry. Journal of Proteomics. 238, 104148 (2021).
  22. Wang, W., et al. High-throughput glycopeptide profiling of prostate-specific antigen from seminal plasma by MALDI-MS. Talanta. 222, 121495 (2021).
  23. wwPDB consortium metal. Protein Data Bank: the single global archive for 3D macromolecular structure data. Nucleic Acids Research. 47, 520-528 (2019).
  24. Sehnal, D., Grant, O. C. Rapidly display glycan symbols in 3D structures: 3D-SNFG in LiteMol. Journal of Proteome Research. 18 (2), 770-774 (2019).
  25. Bonnardel, F., et al. UniLectin3D, a database of carbohydrate binding proteins with curated information on 3D structures and interacting ligands. Nucleic Acids Research. 47, 1236-1244 (2019).
  26. Sehnal, D., et al. LiteMol suite: interactive web-based visualization of large-scale macromolecular structure data. Nature Methods. 14 (12), 1121-1122 (2017).
  27. Salentin, S., Schreiber, S., Haupt, V. J., Adasme, M. F., Schroeder, M. PLIP: fully automated protein-ligand interaction profiler. Nucleic Acids Research. 43, 443-447 (2015).
  28. Robin, T., Mariethoz, J., Lisacek, F. Examining and fine-tuning the selection of glycan compositions with GlyConnect Compozitor. Molecular & Cellular Proteomics. 19 (10), 1602-1618 (2020).
  29. Compagno, D., et al. Glycans and galectins in prostate cancer biology, angiogenesis and metastasis. Glycobiology. 24 (10), 899-906 (2014).
  30. Gentilini, L. D., et al. Stable and high expression of Galectin-8 tightly controls metastatic progression of prostate cancer. Oncotarget. 8 (27), 44654-44668 (2017).
  31. Schwämmle, V., Verano-Braga, T., Roepstorff, P. Computational and statistical methods for high-throughput analysis of post-translational modifications of proteins. Journal of Proteomics. 129, 3-15 (2015).
  32. Khatri, K., Klein, J. A., Zaia, J. Use of an informed search space maximizes confidence of site-specific assignment of glycoprotein glycosylation. Analytical and Bioanalytical Chemistry. 409 (2), 607-618 (2017).
  33. Sztain, T., et al. A glycan gate controls opening of the SARS-CoV-2 spike protein. Nature Chemistry. 13, 963-968 (2021).
check_url/it/63356?article_type=t

Play Video

Citazione di questo articolo
Lisacek, F. Bioinformatics Resources for the Study of Glycan-Mediated Protein Interactions. J. Vis. Exp. (179), e63356, doi:10.3791/63356 (2022).

View Video