Summary

Bioinformatikressourcer til undersøgelse af glykanmedierede proteininteraktioner

Published: January 20, 2022
doi:

Summary

Denne protokol illustrerer, hvordan man udforsker, sammenligner og fortolker humane proteinglycomer med online ressourcer.

Abstract

Det Glyco@Expasy initiativ blev lanceret som en samling af indbyrdes afhængige databaser og værktøjer, der spænder over flere aspekter af viden inden for glykobiologi. Det sigter især mod at fremhæve interaktioner mellem glycoproteiner (såsom celleoverfladereceptorer) og kulhydratbindende proteiner medieret af glycaner. Her introduceres store ressourcer i samlingen gennem to illustrative eksempler centreret om N-glycom af det humane prostataspecifikke antigen (PSA) og O-glycom af humane serumproteiner. Gennem forskellige databaseforespørgsler og ved hjælp af visualiseringsværktøjer viser denne artikel, hvordan man udforsker og sammenligner indhold i et kontinuum for at indsamle og korrelere ellers spredte informationsstykker. Indsamlede data er bestemt til at fodre mere detaljerede scenarier af glycanfunktion. Glycoinformatik, der introduceres her, foreslås derfor som et middel til enten at styrke, forme eller afvise antagelser om specificiteten af et proteinglykom i en given sammenhæng.

Introduction

Glycaner, proteiner, som de er bundet til (glycoproteiner), og proteiner, som de binder til (lektiner eller kulhydratbindende proteiner), er de vigtigste molekylære aktører på celleoverfladen1. På trods af denne centrale rolle i celle-cellekommunikation er store undersøgelser, herunder glycomics, glycoproteomics eller glycan-interactomics data, stadig knappe sammenlignet med deres modstykke i genomik og proteomik.

Indtil for nylig var der ikke udviklet metoder til at karakterisere forgreningsstrukturerne af komplekse kulhydrater, mens de stadig blev konjugeret til bærerproteinet. Biosyntesen af glycoproteiner er en ikke-skabelondrevet proces, hvor monosacchariddonorerne, de accepterende glycoproteinsubstrater og glycosyltransferaserne og glycosidaserne spiller en interaktiv rolle. De resulterende glycoproteiner kan bære komplekse strukturer med flere forgreningspunkter, hvor hver monosaccharidkomponent kan være en af de flere typer, der er til stede i naturen1. Den ikke-skabelondrevne proces pålægger biokemisk analyse som den eneste mulighed for at generere oligosaccharidstrukturelle data. Den analytiske proces med glycanstrukturer, der er knyttet til et indfødt protein, er ofte udfordrende, da det kræver følsomme, kvantitative og robuste teknologier til bestemmelse af monosaccharidsammensætning, bindinger og forgreningssekvenser2.

I denne sammenhæng er massespektrometri (MS) den mest anvendte teknik i glycomics og glycoproteomics eksperimenter. Efterhånden som tiden går, udføres disse i højere gennemløbsindstillinger, og data akkumuleres nu i databaser. Glycanstrukturer i forskellige formater3, udfylde GlyTouCan4, det universelle glycandatalager, hvor hver struktur er forbundet med en stabil identifikator, uanset hvilket præcisionsniveau glycanen er defineret med (f.eks. muligvis manglende koblingstype eller tvetydig sammensætning). Meget lignende strukturer indsamles, men deres mindre forskelle rapporteres tydeligt. Glycoproteiner er beskrevet og kurateret i GlyConnect5 og GlyGen6, to databaser, der krydsrefererer hinanden. MS-data, der understøtter strukturelle beviser, lagres i stigende grad i GlycoPOST7. For en bredere dækning af onlineressourcer er kapitel 52 i referencemanualen, Essentials of Glycobiology, dedikeret til glycoinformatik8. Interessant nok har glycopeptididentifikationssoftware spredt sig i de senere år9,10, men ikke til gavn for reproducerbarheden. Sidstnævnte bekymring fik lederne af HUPO GlycoProteomics Initiative (HGI) til at sætte en softwareudfordring i 2019. De MS-data, der er opnået ved behandling af komplekse blandinger af N- og O-glycosylerede humane serumproteiner i CID-, ETD- og EThcD-fragmenteringstilstande, blev stillet til rådighed for konkurrenter, hvad enten det var softwarebrugere eller udviklere. Den fuldstændige rapport om resultaterne af denne udfordring11 er kun skitseret her. Til at begynde med blev der observeret en spredning af identifikationer. Det blev hovedsageligt fortolket som forårsaget af mangfoldigheden af metoder implementeret i søgemaskiner, af deres indstillinger, og hvordan output blev filtreret, og peptid “tælles”. Det eksperimentelle design kan også have sat noget software og tilgange til en (dis)fordel. Det er vigtigt, at deltagere, der brugte den samme software, rapporterede inkonsekvente resultater og derved fremhævede alvorlige reproducerbarhedsproblemer. Det blev konkluderet ved at sammenligne forskellige indlæg, at nogle softwareløsninger fungerer bedre end andre, og nogle søgestrategier giver bedre resultater. Denne feedback vil sandsynligvis være retningsgivende for forbedringen af automatiserede metoder til analyse af glycopeptiddata og vil igen påvirke databaseindholdet.

Udvidelsen af glycoinformatik førte til oprettelse af webportaler, der giver information og adgang til flere lignende eller supplerende ressourcer. De nyeste og ajourførte er beskrevet i et kapitel i bogen Comprehensive Glycoscience12, og gennem samarbejde tilbydes en løsning på datadeling og informationsudveksling i en open access-tilstand. En sådan portal blev udviklet, som oprindeligt blev kaldt Glycomics@ExPASy 13 og omdøbt Glyco@Expasy, efter den store revision af Expasy-platformen14, der har været vært for en stor samling af værktøjer og databaser, der blev brugt på tværs af flere -omics i årtier, hvor det mest populære element var UniProt15-den universelle proteinvidensbase. Glyco@Expasy tilbyder en didaktisk opdagelse af formålet med og brugen af databaser og værktøjer baseret på en visuel kategorisering og en visning af deres indbyrdes afhængigheder. Følgende protokol illustrerer procedurer til at udforske glycomics og glycoproteomics data med et udvalg af ressourcer fra denne portal, der gør forbindelsen mellem glycoproteomics og glycan-interactomics eksplicit via glycomics. Som det er, producerer glycomics eksperimenter strukturer, hvor monosaccharider er fuldt definerede og forbinder helt eller delvist bestemt, men deres proteinstedsfastgørelse er dårligt, hvis overhovedet, karakteriseret. I modsætning hertil genererer glycoproteomics eksperimenter præcise oplysninger om fastgørelse af stedet, men med en dårlig opløsning af glycanstrukturer, ofte begrænset til monosaccharidsammensætninger. Disse oplysninger er stykket sammen i GlyConnect-databasen. Desuden kan søgeværktøjer i GlyConnect bruges til at detektere potentielle glykanligander, som er beskrevet sammen med de proteiner, der genkender dem i UniLectin16, der er knyttet til GlyConnect via glycaner. Protokollen, der præsenteres her, er opdelt i to sektioner for at dække spørgsmål, der er specifikke for N-bundne og O-bundne glycaner og glycoproteiner.

Protocol

BEMÆRK: En enhed med en internetforbindelse (større skærm foretrækkes) og en opdateret webbrowser som Chrome eller Firefox er påkrævet. Brug af Safari eller Edge er muligvis ikke så pålidelig. 1. Fra et protein N-glycom i GlyConnect til et lektin af UniLectin Adgang til ressourcer fra Glyco@ExpasyBEMÆRK: Proceduren beskrevet her er at få adgang til GlyConnect, men kan anvendes til at få adgang til enhver ressource, der er registreret p…

Representative Results

Den første del af protokollen (afsnit 1) viste, hvordan man undersøger specificiteten eller fællesheden af N-glycaner fastgjort på Asn-69 af det humane prostataspecifikke antigen (PSA) ved hjælp af GlyConnect-platformen. Vævsafhængige (urin og sædvæske) samt isoformafhængige (normale og høje pI) variationer i glycanekspression blev understreget ved hjælp af to visualiseringsværktøjer (figur 4 og figur 5). <p class="jove_content…

Discussion

GlyConnect Octopus som et værktøj til at afsløre uventede sammenhænge
GlyConnect Octopus blev oprindeligt designet til at forespørge databasen med en løs definition af glycaner. Faktisk rapporterer litteraturen ofte de vigtigste egenskaber ved glycaner i et glycom, såsom at blive fucosyleret eller sialyleret, være lavet af to eller flere antenner osv. Desuden klassificeres glycaner, uanset om de er N- eller O-linkede, i kerner, som beskrevet i referencemanualen Essentials of

Divulgazioni

The authors have nothing to disclose.

Acknowledgements

Forfatteren anerkender varmt tidligere og nuværende medlemmer af Proteome Informatics Group, der er involveret i at udvikle de ressourcer, der anvendes i denne vejledning, specifikt Julien Mariethoz og Catherine Hayes for GlyConnect, François Bonnardel for UniLectin, Davide Alocci og Frederic Nikitin for Octopus og Thibault Robin for Compozitor og sidste touch på Octopus.

Udviklingen af glyco@Expasy-projektet støttes af den schweiziske forbundsregering gennem Statssekretariatet for Uddannelse, Forskning og Innovation (SERI) og suppleres i øjeblikket af Swiss National Science Foundation (SNSF: 31003A_179249). ExPASy vedligeholdes af det schweiziske institut for bioinformatik og hostes på Vital-IT Competence Center. Forfatteren anerkender også Anne Imberty for fremragende samarbejde om UniLectin-platformen, der støttes i fællesskab af ANR PIA Glyco@Alps (ANR-15-IDEX-02), Alliance Campus Rhodanien Co-funds (http://campusrhodanien.unige-cofunds.ch) Labex Arcane/CBH-EUR-GS (ANR-17-EURE-0003).

Materials

internet connection user's choice
recent version of web browser user's choice

Riferimenti

  1. Spring Harbor Laboratory Press. . Essentials of Glycobiology. , (2015).
  2. Gray, C. J., et al. Advancing solutions to the carbohydrate sequencing challenge. Journal of the American Chemical Society. 141 (37), 14463-14479 (2019).
  3. Tsuchiya, S., Yamada, I., Aoki-Kinoshita, K. F. GlycanFormatConverter: a conversion tool for translating the complexities of glycans. Bioinformatics. 35 (14), 2434-2440 (2018).
  4. Fujita, A., et al. The international glycan repository GlyTouCan version 3.0. Nucleic Acids Research. 49, 1529-1533 (2021).
  5. Alocci, D., et al. GlyConnect: glycoproteomics goes visual, interactive, and analytical. Journal of Proteome Research. 18 (2), 664-677 (2019).
  6. York, W. S., et al. GlyGen: computational and informatics resources for glycoscience. Glycobiology. 30 (2), 72-73 (2020).
  7. Watanabe, Y., Aoki-Kinoshita, K. F., Ishihama, Y., Okuda, S. GlycoPOST realizes FAIR principles for glycomics mass spectrometry data. Nucleic Acids Research. 49, 1523-1528 (2020).
  8. Campbell, M. P., Aoki-Kinoshita, K. F., Lisacek, F., York, W. S., Packer, N. H. Glycoinformatics. Essentials of Glycobiology. , (2015).
  9. Cao, W., et al. Recent advances in software tools for more generic and precise intact glycopeptide analysis. Molecular & Cellular Proteomics. 20, 100060 (2021).
  10. Mariethoz, J., Hayes, C., Lisacek, F. Glycan compositions with Compozitor to enhance glycopeptide identification. Proteomics Data Analysis. 2361, 109-127 (2021).
  11. Kawahara, R., et al. Communityevaluation of glycoproteomics informatics solutions reveals high-performance search strategies of serum glycopeptide analysis. Nature Methods. 18, 1304-1316 (2021).
  12. Lisacek, F., Aoki-Kinoshita, K. F., Vora, J. K., Mazumder, R., Tiemeyer, M. Glycoinformatics resources integrated through the GlySpace Alliance. Comprehensive Glycoscience. 1, 507-521 (2021).
  13. Mariethoz, J., et al. Glycomics@ExPASy: bridging the gap. Molecular & Cellular Proteomics. 17 (11), 2164-2176 (2018).
  14. Duvaud, S., et al. Expasy, the swiss bioinformatics resource portal, as designed by its users. Nucleic Acids Research. 49, 216-227 (2021).
  15. The UniProt Consortium et al. UniProt: the universal protein knowledgebase in 2021. Nucleic Acids Research. 49, 480-489 (2021).
  16. Bonnardel, F., Perez, S., Lisacek, F., Imberty, A. Structural database for lectins and the UniLectin web platform. Lectin Purification and Analysis. 2132, 1-14 (2020).
  17. Neelamegham, S., et al. Updates to the symbol nomenclature for glycans guidelines. Glycobiology. 29 (9), 620-624 (2019).
  18. Sharon, N. IUPAC-IUB Joint Commission on Biochemical Nomenclature (JCBN). Nomenclature of glycoproteins, glycopeptides and peptidoglycans: JCBN recommendations 1985. Glycoconjugate Journal. 3 (2), 123-133 (1986).
  19. Harvey, D. J., et al. Proposal for a standard system for drawing structural diagrams of N- and O-linked carbohydrates and related compounds. Proteomics. 9 (15), 3796-3801 (2009).
  20. Song, E., Mayampurath, A., Yu, C. -. Y., Tang, H., Mechref, Y. Glycoproteomics: identifying the glycosylation of prostate specific antigen at normal and high isoelectric points by LC-MS/MS. Journal of Proteome Research. 13 (12), 5570-5580 (2014).
  21. Moran, A. B., et al. Profiling the proteoforms of urinary prostate-specific antigen by capillary electrophoresis – mass spectrometry. Journal of Proteomics. 238, 104148 (2021).
  22. Wang, W., et al. High-throughput glycopeptide profiling of prostate-specific antigen from seminal plasma by MALDI-MS. Talanta. 222, 121495 (2021).
  23. wwPDB consortium metal. Protein Data Bank: the single global archive for 3D macromolecular structure data. Nucleic Acids Research. 47, 520-528 (2019).
  24. Sehnal, D., Grant, O. C. Rapidly display glycan symbols in 3D structures: 3D-SNFG in LiteMol. Journal of Proteome Research. 18 (2), 770-774 (2019).
  25. Bonnardel, F., et al. UniLectin3D, a database of carbohydrate binding proteins with curated information on 3D structures and interacting ligands. Nucleic Acids Research. 47, 1236-1244 (2019).
  26. Sehnal, D., et al. LiteMol suite: interactive web-based visualization of large-scale macromolecular structure data. Nature Methods. 14 (12), 1121-1122 (2017).
  27. Salentin, S., Schreiber, S., Haupt, V. J., Adasme, M. F., Schroeder, M. PLIP: fully automated protein-ligand interaction profiler. Nucleic Acids Research. 43, 443-447 (2015).
  28. Robin, T., Mariethoz, J., Lisacek, F. Examining and fine-tuning the selection of glycan compositions with GlyConnect Compozitor. Molecular & Cellular Proteomics. 19 (10), 1602-1618 (2020).
  29. Compagno, D., et al. Glycans and galectins in prostate cancer biology, angiogenesis and metastasis. Glycobiology. 24 (10), 899-906 (2014).
  30. Gentilini, L. D., et al. Stable and high expression of Galectin-8 tightly controls metastatic progression of prostate cancer. Oncotarget. 8 (27), 44654-44668 (2017).
  31. Schwämmle, V., Verano-Braga, T., Roepstorff, P. Computational and statistical methods for high-throughput analysis of post-translational modifications of proteins. Journal of Proteomics. 129, 3-15 (2015).
  32. Khatri, K., Klein, J. A., Zaia, J. Use of an informed search space maximizes confidence of site-specific assignment of glycoprotein glycosylation. Analytical and Bioanalytical Chemistry. 409 (2), 607-618 (2017).
  33. Sztain, T., et al. A glycan gate controls opening of the SARS-CoV-2 spike protein. Nature Chemistry. 13, 963-968 (2021).
check_url/it/63356?article_type=t

Play Video

Citazione di questo articolo
Lisacek, F. Bioinformatics Resources for the Study of Glycan-Mediated Protein Interactions. J. Vis. Exp. (179), e63356, doi:10.3791/63356 (2022).

View Video