Summary

Bioinformatik-Ressourcen zur Untersuchung von Glykan-vermittelten Proteininteraktionen

Published: January 20, 2022
doi:

Summary

Dieses Protokoll veranschaulicht, wie man menschliche Proteinglycomes mit Online-Ressourcen erforscht, vergleicht und interpretiert.

Abstract

Die Glyco@Expasy Initiative wurde als eine Sammlung von voneinander abhängigen Datenbanken und Werkzeugen ins Leben gerufen, die verschiedene Aspekte des Wissens in der Glykobiologie abdecken. Insbesondere zielt es darauf ab, Wechselwirkungen zwischen Glykoproteinen (wie Zelloberflächenrezeptoren) und kohlenhydratbindenden Proteinen, die durch Glykane vermittelt werden, hervorzuheben. Hier werden die wichtigsten Ressourcen der Sammlung anhand von zwei illustrativen Beispielen vorgestellt, die sich auf das N-Glycome des menschlichen Prostata-spezifischen Antigens (PSA) und das O-Glycome menschlicher Serumproteine konzentrieren. Durch verschiedene Datenbankabfragen und mit Hilfe von Visualisierungswerkzeugen zeigt dieser Artikel, wie man Inhalte in einem Kontinuum erforscht und vergleicht, um ansonsten verstreute Informationen zu sammeln und zu korrelieren. Die gesammelten Daten sind dazu bestimmt, ausgefeiltere Szenarien der Glykanfunktion zu füttern. Die hier eingeführte Glycoinformatics wird daher als Mittel vorgeschlagen, um Annahmen über die Spezifität eines Proteinglykoms in einem bestimmten Kontext entweder zu stärken, zu formen oder zu widerlegen.

Introduction

Glykane, Proteine, an die sie gebunden sind (Glykoproteine) und Proteine, an die sie binden (Lektine oder kohlenhydratbindende Proteine), sind die wichtigsten molekularen Akteure an der Zelloberfläche1. Trotz dieser zentralen Rolle in der Zell-Zell-Kommunikation sind groß angelegte Studien, einschließlich Glykomik, Glykoproteomik oder Glykan-Interactomie-Daten, im Vergleich zu ihrem Gegenstück in der Genomik und Proteomik immer noch knapp.

Bis vor kurzem wurden keine Methoden entwickelt, um die Verzweigungsstrukturen komplexer Kohlenhydrate zu charakterisieren, während sie noch mit dem Trägerprotein konjugiert sind. Die Biosynthese von Glykoproteinen ist ein nicht vorlagengetriebener Prozess, bei dem die Monosaccharidspender, die akzeptierenden Glykoproteinsubstrate sowie die Glykosyltransferasen und Glykosidasen eine interaktive Rolle spielen. Die resultierenden Glykoproteine können komplexe Strukturen mit mehreren Verzweigungspunkten tragen, wobei jede Monosaccharidkomponente eine der verschiedenen in der Natur vorkommenden Typen sein kann1. Der nicht vorlagengesteuerte Prozess erzwingt die biochemische Analyse als einzige Möglichkeit zur Generierung von Oligosaccharid-Strukturdaten. Der analytische Prozess von Glykanstrukturen, die an ein natives Protein gebunden sind, ist oft eine Herausforderung, da er empfindliche, quantitative und robuste Technologien zur Bestimmung der Monosaccharidzusammensetzung, -verknüpfungen und -verzweigungssequenzen erfordert2.

In diesem Zusammenhang ist die Massenspektrometrie (MS) die am weitesten verbreitete Technik in Glykomik- und Glykoproteomik-Experimenten. Im Laufe der Zeit werden diese in höheren Durchsatzeinstellungen durchgeführt und Daten sammeln sich nun in Datenbanken an. Glykanstrukturen in verschiedenen Formaten3, füllen GlyTouCan4, das universelle Glykan-Datenrepository, in dem jede Struktur mit einem stabilen Identifikator verknüpft ist, unabhängig von der Genauigkeit, mit der das Glykan definiert ist (z. B. möglicherweise fehlender Verknüpfungstyp oder mehrdeutige Zusammensetzung). Sehr ähnliche Strukturen werden gesammelt, aber ihre geringfügigen Unterschiede werden deutlich berichtet. Glykoproteine werden in GlyConnect5 und GlyGen6 beschrieben und kuratiert, zwei Datenbanken, die sich gegenseitig referenzieren. MS-Daten, die strukturelle Beweismittel unterstützen, werden zunehmend in GlycoPOST7 gespeichert. Für eine breitere Abdeckung von Online-Ressourcen ist Kapitel 52 des Referenzhandbuchs Essentials of Glycobiology der Glykoinformatik8 gewidmet. Interessanterweise hat sich die Glykopeptid-Identifizierungssoftware in den letzten Jahren stark ausgebreitet9,10, wenn auch nicht zum Vorteil der Reproduzierbarkeit. Die letztgenannte Sorge veranlasste die Leiter der HUPO GlycoProteomics Initiative (HGI), 2019 eine Software-Herausforderung zu stellen. Die MS-Daten, die aus der Verarbeitung komplexer Mischungen von N- und O-glykosylierten humanen Serumproteinen in CID-, ETD- und EThcD-Fragmentierungsmodi gewonnen wurden, wurden Wettbewerbern, ob Softwareanwendern oder Entwicklern, zur Verfügung gestellt. Der vollständige Bericht über die Ergebnisse dieser Herausforderung11 wird hier nur skizziert. Zunächst wurde eine Ausbreitung von Identifikationen beobachtet. Es wurde hauptsächlich so interpretiert, dass es durch die Vielfalt der in Suchmaschinen implementierten Methoden, ihrer Einstellungen und der Art und Weise, wie Ausgaben gefiltert und Peptide “gezählt” wurden, verursacht wurde. Das experimentelle Design könnte auch einige Software und Ansätze in einen (Nachteil) gebracht haben. Wichtig ist, dass Teilnehmer, die dieselbe Software verwendeten, inkonsistente Ergebnisse meldeten und dadurch schwerwiegende Reproduzierbarkeitsprobleme hervorhoben. Durch den Vergleich verschiedener Einreichungen wurde festgestellt, dass einige Softwarelösungen besser abschneiden als andere und einige Suchstrategien bessere Ergebnisse liefern. Dieses Feedback wird wahrscheinlich zur Verbesserung automatisierter Glykopeptid-Datenanalysemethoden führen und sich wiederum auf den Datenbankinhalt auswirken.

Die Expansion der Glykoinformatik führte zur Schaffung von Webportalen, die Informationen und Zugang zu mehreren ähnlichen oder sich ergänzenden Ressourcen bieten. Die neuesten und aktuellsten werden in einem Kapitel der Comprehensive Glycoscience Buchreihe12 beschrieben und durch die Zusammenarbeit wird eine Lösung für den Datenaustausch und Informationsaustausch im Open-Access-Modus angeboten. Ein solches Portal wurde entwickelt, das ursprünglich Glycomics@ExPASy 13 hieß und in Glyco@Expasy umbenannt wurde, nach der Generalüberholung der Expasy-Plattform14, die seit Jahrzehnten eine große Sammlung von Tools und Datenbanken beherbergt, die in mehreren -omics verwendet werden, wobei das beliebteste Element UniProt15 ist – die universelle Protein-Wissensdatenbank. Glyco@Expasy bietet eine didaktische Entdeckung des Zwecks und der Nutzung von Datenbanken und Werkzeugen, basierend auf einer visuellen Kategorisierung und einer Darstellung ihrer Interdependenzen. Das folgende Protokoll veranschaulicht Verfahren zum Untersuchen von Glykomik- und Glykoproteomik-Daten mit einer Auswahl von Ressourcen aus diesem Portal, die die Verbindung zwischen Glykoproteomik und Glykan-Interactomics über Glykomik explizit machen. So wie es ist, erzeugen Glykomik-Experimente Strukturen, in denen Monosaccharide vollständig definiert und Verknüpfungen teilweise oder vollständig bestimmt sind, aber ihre Protein-Site-Bindung ist schlecht, wenn überhaupt, charakterisiert. Im Gegensatz dazu erzeugen Glykoproteomik-Experimente präzise Standortbindungsinformationen, jedoch mit einer schlechten Auflösung von Glykanstrukturen, die oft auf Monosaccharidzusammensetzungen beschränkt sind. Diese Informationen werden in der GlyConnect-Datenbank zusammengefasst. Darüber hinaus können Suchwerkzeuge in GlyConnect verwendet werden, um potenzielle Glykanliganden aufzuspüren, die zusammen mit den Proteinen, die sie in UniLectin16 erkennen, beschrieben werden, die über Glykane mit GlyConnect verbunden sind. Das hier vorgestellte Protokoll ist in zwei Abschnitte unterteilt, um spezifische Fragen zu N-verknüpften und O-verknüpften Glykanen und Glykoproteinen zu behandeln.

Protocol

HINWEIS: Ein Gerät mit einer Internetverbindung (größerer Bildschirm bevorzugt) und einem aktuellen Webbrowser wie Chrome oder Firefox ist erforderlich. Die Verwendung von Safari oder Edge ist möglicherweise nicht so zuverlässig. 1. Von einem Protein-N-Glycome in GlyConnect zu einem Lektin von UniLectin Zugreifen auf Ressourcen von Glyco@Expasy ausHINWEIS: Das hier beschriebene Verfahren ist der Zugriff auf GlyConnect, kann jedoch auf den Zu…

Representative Results

Der erste Teil des Protokolls (Abschnitt 1) zeigte, wie die Spezifität oder die Gemeinsamkeit von N-Glykanen, die an Asn-69 des humanen Prostata-spezifischen Antigens (PSA) gebunden sind, mithilfe der GlyConnect-Plattform untersucht werden kann. Gewebeabhängige (Urin und Samenflüssigkeit) sowie isoformabhängige (normale und hohe pI) Variationen in der Glykanexpression wurden mit zwei Visualisierungswerkzeugen hervorgehoben (Abbildung 4 und Abbildung …

Discussion

GlyConnect Octopus als Werkzeug zur Aufdeckung unerwarteter Korrelationen
GlyConnect Octopus wurde ursprünglich entwickelt, um die Datenbank mit einer losen Definition von Glykanen abzufragen. In der Tat berichtet die Literatur oft über die Hauptmerkmale von Glykanen in einem Glykom, wie z.B. fucosyliert oder sialyliert, aus zwei oder mehr Antennen bestehend usw. Darüber hinaus werden Glykane, ob N- oder O-verknüpft, in Kerne eingeteilt, wie im Referenzhandbuch Essentials of Glyc…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Der Autor dankt den ehemaligen und gegenwärtigen Mitgliedern der Proteome Informatics Group, die an der Entwicklung der in diesem Tutorial verwendeten Ressourcen beteiligt waren, insbesondere Julien Mariethoz und Catherine Hayes für GlyConnect, François Bonnardel für UniLectin, Davide Alocci und Frederic Nikitin für den Octopus und Thibault Robin für Compozitor und den letzten Schliff an Octopus.

Die Entwicklung des Projekts glyco@Expasy wird vom Bund über das Staatssekretariat für Bildung, Forschung und Innovation (SBFI) unterstützt und wird derzeit durch den Schweizerischen Nationalfonds (SNF: 31003A_179249) ergänzt. ExPASy wird vom Schweizerischen Institut für Bioinformatik betreut und im Kompetenzzentrum Vital-IT gehostet. Die Autorin würdigt Anne Imberty auch für die hervorragende Zusammenarbeit auf der UniLectin-Plattform, die gemeinsam von ANR PIA Glyco@Alps (ANR-15-IDEX-02), Alliance Campus Rhodanien Co-funds (http://campusrhodanien.unige-cofunds.ch) Labex Arcane/CBH-EUR-GS (ANR-17-EURE-0003) unterstützt wird.

Materials

internet connection user's choice
recent version of web browser user's choice

References

  1. Spring Harbor Laboratory Press. . Essentials of Glycobiology. , (2015).
  2. Gray, C. J., et al. Advancing solutions to the carbohydrate sequencing challenge. Journal of the American Chemical Society. 141 (37), 14463-14479 (2019).
  3. Tsuchiya, S., Yamada, I., Aoki-Kinoshita, K. F. GlycanFormatConverter: a conversion tool for translating the complexities of glycans. Bioinformatics. 35 (14), 2434-2440 (2018).
  4. Fujita, A., et al. The international glycan repository GlyTouCan version 3.0. Nucleic Acids Research. 49, 1529-1533 (2021).
  5. Alocci, D., et al. GlyConnect: glycoproteomics goes visual, interactive, and analytical. Journal of Proteome Research. 18 (2), 664-677 (2019).
  6. York, W. S., et al. GlyGen: computational and informatics resources for glycoscience. Glycobiology. 30 (2), 72-73 (2020).
  7. Watanabe, Y., Aoki-Kinoshita, K. F., Ishihama, Y., Okuda, S. GlycoPOST realizes FAIR principles for glycomics mass spectrometry data. Nucleic Acids Research. 49, 1523-1528 (2020).
  8. Campbell, M. P., Aoki-Kinoshita, K. F., Lisacek, F., York, W. S., Packer, N. H. Glycoinformatics. Essentials of Glycobiology. , (2015).
  9. Cao, W., et al. Recent advances in software tools for more generic and precise intact glycopeptide analysis. Molecular & Cellular Proteomics. 20, 100060 (2021).
  10. Mariethoz, J., Hayes, C., Lisacek, F. Glycan compositions with Compozitor to enhance glycopeptide identification. Proteomics Data Analysis. 2361, 109-127 (2021).
  11. Kawahara, R., et al. Communityevaluation of glycoproteomics informatics solutions reveals high-performance search strategies of serum glycopeptide analysis. Nature Methods. 18, 1304-1316 (2021).
  12. Lisacek, F., Aoki-Kinoshita, K. F., Vora, J. K., Mazumder, R., Tiemeyer, M. Glycoinformatics resources integrated through the GlySpace Alliance. Comprehensive Glycoscience. 1, 507-521 (2021).
  13. Mariethoz, J., et al. Glycomics@ExPASy: bridging the gap. Molecular & Cellular Proteomics. 17 (11), 2164-2176 (2018).
  14. Duvaud, S., et al. Expasy, the swiss bioinformatics resource portal, as designed by its users. Nucleic Acids Research. 49, 216-227 (2021).
  15. The UniProt Consortium et al. UniProt: the universal protein knowledgebase in 2021. Nucleic Acids Research. 49, 480-489 (2021).
  16. Bonnardel, F., Perez, S., Lisacek, F., Imberty, A. Structural database for lectins and the UniLectin web platform. Lectin Purification and Analysis. 2132, 1-14 (2020).
  17. Neelamegham, S., et al. Updates to the symbol nomenclature for glycans guidelines. Glycobiology. 29 (9), 620-624 (2019).
  18. Sharon, N. IUPAC-IUB Joint Commission on Biochemical Nomenclature (JCBN). Nomenclature of glycoproteins, glycopeptides and peptidoglycans: JCBN recommendations 1985. Glycoconjugate Journal. 3 (2), 123-133 (1986).
  19. Harvey, D. J., et al. Proposal for a standard system for drawing structural diagrams of N- and O-linked carbohydrates and related compounds. Proteomics. 9 (15), 3796-3801 (2009).
  20. Song, E., Mayampurath, A., Yu, C. -. Y., Tang, H., Mechref, Y. Glycoproteomics: identifying the glycosylation of prostate specific antigen at normal and high isoelectric points by LC-MS/MS. Journal of Proteome Research. 13 (12), 5570-5580 (2014).
  21. Moran, A. B., et al. Profiling the proteoforms of urinary prostate-specific antigen by capillary electrophoresis – mass spectrometry. Journal of Proteomics. 238, 104148 (2021).
  22. Wang, W., et al. High-throughput glycopeptide profiling of prostate-specific antigen from seminal plasma by MALDI-MS. Talanta. 222, 121495 (2021).
  23. wwPDB consortium metal. Protein Data Bank: the single global archive for 3D macromolecular structure data. Nucleic Acids Research. 47, 520-528 (2019).
  24. Sehnal, D., Grant, O. C. Rapidly display glycan symbols in 3D structures: 3D-SNFG in LiteMol. Journal of Proteome Research. 18 (2), 770-774 (2019).
  25. Bonnardel, F., et al. UniLectin3D, a database of carbohydrate binding proteins with curated information on 3D structures and interacting ligands. Nucleic Acids Research. 47, 1236-1244 (2019).
  26. Sehnal, D., et al. LiteMol suite: interactive web-based visualization of large-scale macromolecular structure data. Nature Methods. 14 (12), 1121-1122 (2017).
  27. Salentin, S., Schreiber, S., Haupt, V. J., Adasme, M. F., Schroeder, M. PLIP: fully automated protein-ligand interaction profiler. Nucleic Acids Research. 43, 443-447 (2015).
  28. Robin, T., Mariethoz, J., Lisacek, F. Examining and fine-tuning the selection of glycan compositions with GlyConnect Compozitor. Molecular & Cellular Proteomics. 19 (10), 1602-1618 (2020).
  29. Compagno, D., et al. Glycans and galectins in prostate cancer biology, angiogenesis and metastasis. Glycobiology. 24 (10), 899-906 (2014).
  30. Gentilini, L. D., et al. Stable and high expression of Galectin-8 tightly controls metastatic progression of prostate cancer. Oncotarget. 8 (27), 44654-44668 (2017).
  31. Schwämmle, V., Verano-Braga, T., Roepstorff, P. Computational and statistical methods for high-throughput analysis of post-translational modifications of proteins. Journal of Proteomics. 129, 3-15 (2015).
  32. Khatri, K., Klein, J. A., Zaia, J. Use of an informed search space maximizes confidence of site-specific assignment of glycoprotein glycosylation. Analytical and Bioanalytical Chemistry. 409 (2), 607-618 (2017).
  33. Sztain, T., et al. A glycan gate controls opening of the SARS-CoV-2 spike protein. Nature Chemistry. 13, 963-968 (2021).
check_url/kr/63356?article_type=t

Play Video

Cite This Article
Lisacek, F. Bioinformatics Resources for the Study of Glycan-Mediated Protein Interactions. J. Vis. Exp. (179), e63356, doi:10.3791/63356 (2022).

View Video