Summary

Bioinformatikk ressurser for studiet av Glycan-mediert protein interaksjoner

Published: January 20, 2022
doi:

Summary

Denne protokollen illustrerer hvordan man utforsker, sammenligner og tolker humant protein glykom med online ressurser.

Abstract

Det Glyco@Expasy initiativet ble lansert som en samling av gjensidig avhengige databaser og verktøy som spenner over flere aspekter av kunnskap innen glykobiologi. Spesielt tar den sikte på å markere interaksjoner mellom glykoproteiner (som celleoverflatereseptorer) og karbohydratbindende proteiner mediert av glykaner. Her introduseres store ressurser av samlingen gjennom to illustrerende eksempler sentrert på N-glycome av human Prostata Specific Antigen (PSA) og O-glycome av humane serumproteiner. Gjennom ulike databasespørringer og ved hjelp av visualiseringsverktøy viser denne artikkelen hvordan du utforsker og sammenligner innhold i et kontinuum for å samle og korrelere ellers spredte informasjonsdeler. Innsamlede data er bestemt til å mate mer forseggjorte scenarier av glykanfunksjon. Glykoinformatikk introdusert her foreslås derfor som et middel til enten å styrke, forme eller motbevise antagelser om spesifisiteten til et protein glykom i en gitt sammenheng.

Introduction

Glykaner, proteiner som de er festet til (glykoproteiner) og proteiner som de binder (lectins eller karbohydratbindende proteiner) er de viktigste molekylære aktørene på celleoverflaten1. Til tross for denne sentrale rollen i cellecellekommunikasjon, er det fortsatt lite studier i stor skala, inkludert glykom, glykoproteomikk eller glykan-interaktivitetsdata sammenlignet med motparten i genomikk og proteomikk.

Inntil nylig hadde metoder for å karakterisere forgreningsstrukturene til komplekse karbohydrater mens de fortsatt ble konjugert til bærerproteinet ikke blitt utviklet. Biosyntesen av glykoproteiner er en ikke-maldrevet prosess der monosakkariddonorene, de aksepterende glykoproteinunderlagene og glykosyltransferaser og glykosidaser spiller en interaktiv rolle. De resulterende glykoproteinene kan bære komplekse strukturer med flere forgreningspunkter der hver monosakkaridkomponent kan være en av flere typer som er tilstede i naturen1. Den ikke-maldrevne prosessen pålegger biokjemisk analyse som det eneste alternativet for å generere oligosakkaridstrukturelle data. Den analytiske prosessen med glykanstrukturer knyttet til et innfødt protein er ofte utfordrende, da det krever sensitiv, kvantitativ og robust teknologi for å bestemme monosakkaridsammensetning, koblinger og forgreningssekvenser2.

I denne sammenhengen er massespektrometri (MS) den mest brukte teknikken i glykomikk- og glykoproteomikkeksperimenter. Etter hvert som tiden går, utføres disse i høyere gjennomstrømningsinnstillinger, og data akkumuleres nå i databaser. Glykanstrukturer i ulike formater3 fyller GlyTouCan4, det universelle glykandatalageret der hver struktur er knyttet til en stabil identifikator uavhengig av presisjonsnivået som glykanen er definert med (f.eks. muligens manglende koblingstype eller tvetydig sammensetning). Svært like strukturer samles inn, men deres mindre forskjeller rapporteres tydelig. Glykoproteiner er beskrevet og kuratert i GlyConnect5 og GlyGen6, to databaser kryssrefererer hverandre. MS-data som støtter strukturelle bevis, lagres i økende grad i GlycoPOST7. For en bredere dekning av nettressurser er kapittel 52 i referansehåndboken, Essentials of Glycobiology, dedikert til glykoinformatikk8. Interessant nok har glykopeptididentifikasjonsprogramvare spredt seg de siste årene9,10, men ikke til fordel for reproduserbarhet. Sistnevnte bekymring fikk lederne for HUPO GlycoProteomics Initiative (HGI) til å sette en programvareutfordring i 2019. MS-dataene hentet fra behandling av komplekse blandinger av N- og O-glykosylerte humane serumproteiner i CID-, ETD- og EThcD-fragmenteringsmodus, ble gjort tilgjengelig for konkurrenter enten det var programvarebrukere eller utviklere. Den fullstendige rapporten om resultatene av denne utfordringen11 er bare skissert her. Til å begynne med ble det observert en spredning av identifikasjoner. Det ble hovedsakelig tolket som forårsaket av mangfoldet av metoder implementert i søkemotorer, av deres innstillinger, og hvordan utganger ble filtrert, og peptid “telt”. Den eksperimentelle designen kan også ha satt litt programvare og tilnærminger til en (dis)fordel. Det er viktig at deltakere som bruker samme programvare rapporterte inkonsekvente resultater, og fremhevet dermed alvorlige reproduserbarhetsproblemer. Det ble konkludert med å sammenligne forskjellige innleveringer som noen programvareløsninger presterer bedre enn andre, og noen søkestrategier gir bedre resultater. Denne tilbakemeldingen vil sannsynligvis lede forbedringen av automatiserte glykopeptiddataanalysemetoder og vil igjen påvirke databaseinnholdet.

Utvidelsen av glykoinformatikk førte til at det ble opprettet nettportaler som gir informasjon og tilgang til flere lignende eller komplementerende ressurser. Den nyeste og oppdaterte er beskrevet i et kapittel i Den omfattende Glykoscience-bokserien12, og gjennom samarbeid tilbys en løsning på datadeling og informasjonsutveksling i åpen tilgangsmodus. En slik portal ble utviklet som opprinnelig ble kalt Glycomics@ExPASy 13 og omdøpt Glyco@Expasy, etter den store overhalingen av Expasy-plattformen14 som har vært vert for en stor samling verktøy og databaser som brukes på tvers av flere -omics i flere tiår, det mest populære elementet er UniProt15-den universelle proteinkunnskapsbasen. Glyco@Expasy tilbyr en didaktisk oppdagelse av formålet med og bruken av databaser og verktøy, basert på en visuell kategorisering og en visning av deres gjensidige avhengigheter. Følgende protokoll illustrerer prosedyrer for å utforske glykomikk- og glykoproteomikkdata med et utvalg ressurser fra denne portalen som gjør forbindelsen mellom glykoproteomikk og glykan-interaktivitet eksplisitt via glycomics. Som det er, produserer glycomics eksperimenter strukturer der monosakkarider er fullt definert og koblinger delvis eller helt bestemt, men deres proteinstedsfeste er dårlig, om i det hele tatt, karakterisert. I motsetning genererer glykoproteomics eksperimenter nøyaktig festeinformasjon for nettstedet, men med en dårlig oppløsning av glykanstrukturer, ofte begrenset til monosakkaridsammensetninger. Denne informasjonen er delt inn i GlyConnect-databasen. Videre kan søkeverktøy i GlyConnect brukes til å oppdage potensielle glykanliginer som er beskrevet sammen med proteinene som gjenkjenner dem i UniLectin16, knyttet til GlyConnect via glykaner. Protokollen som presenteres her er delt inn i to seksjoner for å dekke spørsmål som er spesifikke for N-koblede og O-koblede glykaner og glykoproteiner.

Protocol

MERK: En enhet med en Internett-tilkobling (større skjerm foretrukket) og en oppdatert nettleser som Chrome eller Firefox er nødvendig. Å bruke Safari eller Edge er kanskje ikke like pålitelig. 1. Fra et protein N-glycome i GlyConnect til en lectin av UniLectin Få tilgang til ressurser fra Glyco@ExpasyMERK: Prosedyren som er beskrevet her, er å få tilgang til GlyConnect, men kan brukes til å få tilgang til alle ressurser som er registrer…

Representative Results

Den første delen av protokollen (avsnitt 1) viste hvordan man undersøker spesifisiteten eller fellesiteten til N-glykaner festet på Asn-69 av det humane Prostata-spesifikke antigenet (PSA) ved hjelp av GlyConnect-plattformen. Vevsavhengige (urin- og sædvæske), samt isoformavhengige (normale og høye pI) variasjoner i glykanuttrykk, ble vektlagt ved hjelp av to visualiseringsverktøy (figur 4 og figur 5). For det …

Discussion

GlyConnect Octopus som et verktøy for å avdekke uventede korrelasjoner
GlyConnect Octopus ble opprinnelig designet for å spørre databasen med en løs definisjon av glykaner. Faktisk rapporterer litteraturen ofte de viktigste egenskapene til glykaner i en glycome som å være fucosylated eller sialylated, laget av to eller flere antenner, etc. Videre kan glykaner om N- eller O-tilknyttede er klassifisert i kjerner, som beskrevet i referansemanualen Essentials of Glycobiology1, som også ofte sitere…

Divulgazioni

The authors have nothing to disclose.

Acknowledgements

Forfatteren anerkjenner varmt tidligere og nåværende medlemmer av Proteome Informatics Group som er involvert i å utvikle ressursene som brukes i denne opplæringen, spesielt Julien Mariethoz og Catherine Hayes for GlyConnect, François Bonnardel for UniLectin, Davide Alocci og Frederic Nikitin for Blekksprut, og Thibault Robin for Compozitor og siste berøring på Octopus.

Utviklingen av glyco@Expasy-prosjektet støttes av den sveitsiske føderale regjeringen gjennom det statlige sekretariatet for utdanning, forskning og innovasjon (SERI) og suppleres for tiden av Swiss National Science Foundation (SNSF: 31003A_179249). ExPASy vedlikeholdes av Swiss Institute of Bioinformatics og arrangeres på Vital-IT Competency Center. Forfatteren anerkjenner også Anne Imberty for fremragende samarbeid på UniLectin-plattformen i fellesskap støttet av ANR PIA Glyco@Alps (ANR-15-IDEX-02), Alliance Campus Rhodanien Co-funds (http://campusrhodanien.unige-cofunds.ch) Labex Arcane/CBH-EUR-GS (ANR-17-EURE-0003).

Materials

internet connection user's choice
recent version of web browser user's choice

Riferimenti

  1. Spring Harbor Laboratory Press. . Essentials of Glycobiology. , (2015).
  2. Gray, C. J., et al. Advancing solutions to the carbohydrate sequencing challenge. Journal of the American Chemical Society. 141 (37), 14463-14479 (2019).
  3. Tsuchiya, S., Yamada, I., Aoki-Kinoshita, K. F. GlycanFormatConverter: a conversion tool for translating the complexities of glycans. Bioinformatics. 35 (14), 2434-2440 (2018).
  4. Fujita, A., et al. The international glycan repository GlyTouCan version 3.0. Nucleic Acids Research. 49, 1529-1533 (2021).
  5. Alocci, D., et al. GlyConnect: glycoproteomics goes visual, interactive, and analytical. Journal of Proteome Research. 18 (2), 664-677 (2019).
  6. York, W. S., et al. GlyGen: computational and informatics resources for glycoscience. Glycobiology. 30 (2), 72-73 (2020).
  7. Watanabe, Y., Aoki-Kinoshita, K. F., Ishihama, Y., Okuda, S. GlycoPOST realizes FAIR principles for glycomics mass spectrometry data. Nucleic Acids Research. 49, 1523-1528 (2020).
  8. Campbell, M. P., Aoki-Kinoshita, K. F., Lisacek, F., York, W. S., Packer, N. H. Glycoinformatics. Essentials of Glycobiology. , (2015).
  9. Cao, W., et al. Recent advances in software tools for more generic and precise intact glycopeptide analysis. Molecular & Cellular Proteomics. 20, 100060 (2021).
  10. Mariethoz, J., Hayes, C., Lisacek, F. Glycan compositions with Compozitor to enhance glycopeptide identification. Proteomics Data Analysis. 2361, 109-127 (2021).
  11. Kawahara, R., et al. Communityevaluation of glycoproteomics informatics solutions reveals high-performance search strategies of serum glycopeptide analysis. Nature Methods. 18, 1304-1316 (2021).
  12. Lisacek, F., Aoki-Kinoshita, K. F., Vora, J. K., Mazumder, R., Tiemeyer, M. Glycoinformatics resources integrated through the GlySpace Alliance. Comprehensive Glycoscience. 1, 507-521 (2021).
  13. Mariethoz, J., et al. Glycomics@ExPASy: bridging the gap. Molecular & Cellular Proteomics. 17 (11), 2164-2176 (2018).
  14. Duvaud, S., et al. Expasy, the swiss bioinformatics resource portal, as designed by its users. Nucleic Acids Research. 49, 216-227 (2021).
  15. The UniProt Consortium et al. UniProt: the universal protein knowledgebase in 2021. Nucleic Acids Research. 49, 480-489 (2021).
  16. Bonnardel, F., Perez, S., Lisacek, F., Imberty, A. Structural database for lectins and the UniLectin web platform. Lectin Purification and Analysis. 2132, 1-14 (2020).
  17. Neelamegham, S., et al. Updates to the symbol nomenclature for glycans guidelines. Glycobiology. 29 (9), 620-624 (2019).
  18. Sharon, N. IUPAC-IUB Joint Commission on Biochemical Nomenclature (JCBN). Nomenclature of glycoproteins, glycopeptides and peptidoglycans: JCBN recommendations 1985. Glycoconjugate Journal. 3 (2), 123-133 (1986).
  19. Harvey, D. J., et al. Proposal for a standard system for drawing structural diagrams of N- and O-linked carbohydrates and related compounds. Proteomics. 9 (15), 3796-3801 (2009).
  20. Song, E., Mayampurath, A., Yu, C. -. Y., Tang, H., Mechref, Y. Glycoproteomics: identifying the glycosylation of prostate specific antigen at normal and high isoelectric points by LC-MS/MS. Journal of Proteome Research. 13 (12), 5570-5580 (2014).
  21. Moran, A. B., et al. Profiling the proteoforms of urinary prostate-specific antigen by capillary electrophoresis – mass spectrometry. Journal of Proteomics. 238, 104148 (2021).
  22. Wang, W., et al. High-throughput glycopeptide profiling of prostate-specific antigen from seminal plasma by MALDI-MS. Talanta. 222, 121495 (2021).
  23. wwPDB consortium metal. Protein Data Bank: the single global archive for 3D macromolecular structure data. Nucleic Acids Research. 47, 520-528 (2019).
  24. Sehnal, D., Grant, O. C. Rapidly display glycan symbols in 3D structures: 3D-SNFG in LiteMol. Journal of Proteome Research. 18 (2), 770-774 (2019).
  25. Bonnardel, F., et al. UniLectin3D, a database of carbohydrate binding proteins with curated information on 3D structures and interacting ligands. Nucleic Acids Research. 47, 1236-1244 (2019).
  26. Sehnal, D., et al. LiteMol suite: interactive web-based visualization of large-scale macromolecular structure data. Nature Methods. 14 (12), 1121-1122 (2017).
  27. Salentin, S., Schreiber, S., Haupt, V. J., Adasme, M. F., Schroeder, M. PLIP: fully automated protein-ligand interaction profiler. Nucleic Acids Research. 43, 443-447 (2015).
  28. Robin, T., Mariethoz, J., Lisacek, F. Examining and fine-tuning the selection of glycan compositions with GlyConnect Compozitor. Molecular & Cellular Proteomics. 19 (10), 1602-1618 (2020).
  29. Compagno, D., et al. Glycans and galectins in prostate cancer biology, angiogenesis and metastasis. Glycobiology. 24 (10), 899-906 (2014).
  30. Gentilini, L. D., et al. Stable and high expression of Galectin-8 tightly controls metastatic progression of prostate cancer. Oncotarget. 8 (27), 44654-44668 (2017).
  31. Schwämmle, V., Verano-Braga, T., Roepstorff, P. Computational and statistical methods for high-throughput analysis of post-translational modifications of proteins. Journal of Proteomics. 129, 3-15 (2015).
  32. Khatri, K., Klein, J. A., Zaia, J. Use of an informed search space maximizes confidence of site-specific assignment of glycoprotein glycosylation. Analytical and Bioanalytical Chemistry. 409 (2), 607-618 (2017).
  33. Sztain, T., et al. A glycan gate controls opening of the SARS-CoV-2 spike protein. Nature Chemistry. 13, 963-968 (2021).
check_url/it/63356?article_type=t

Play Video

Citazione di questo articolo
Lisacek, F. Bioinformatics Resources for the Study of Glycan-Mediated Protein Interactions. J. Vis. Exp. (179), e63356, doi:10.3791/63356 (2022).

View Video