Summary

Bioinformatikresurser för studier av glykanmedierade proteininteraktioner

Published: January 20, 2022
doi:

Summary

Detta protokoll illustrerar hur man utforskar, jämför och tolkar mänskliga proteinglykom med online-resurser.

Abstract

Initiativet Glyco@Expasy lanserades som en samling databaser och verktyg som är beroende av varandra och som spänner över flera aspekter av kunskap inom glykobiologi. I synnerhet syftar det till att belysa interaktioner mellan glykoproteiner (såsom cellytereceptorer) och kolhydratbindande proteiner medierade av glykaner. Här introduceras stora resurser i samlingen genom två illustrativa exempel centrerade på N-glykomet av det humana prostataspecifika antigenet (PSA) och O-glykomet av humana serumproteiner. Genom olika databasfrågor och med hjälp av visualiseringsverktyg visar den här artikeln hur du utforskar och jämför innehåll i ett kontinuum för att samla in och korrelera annars spridda bitar av information. Insamlade data är avsedda att mata mer detaljerade scenarier av glykanfunktion. Glycoinformatik som introduceras här föreslås därför som ett sätt att antingen stärka, forma eller motbevisa antaganden om specificiteten hos ett proteinglykom i ett givet sammanhang.

Introduction

Glykaner, proteiner till vilka de är fästa (glykoproteiner) och proteiner som de binder till (lektiner eller kolhydratbindande proteiner) är de viktigaste molekylära aktörerna vid cellytan1. Trots denna centrala roll i cell-cellkommunikation är storskaliga studier, inklusive glykomik, glykopreteomik eller glykan-interkomemitiska data fortfarande knappa jämfört med deras motsvarighet inom genomik och proteomik.

Fram till nyligen hade metoder för att karakterisera förgreningsstrukturerna hos komplexa kolhydrater medan de fortfarande konjugerades till bärarproteinet inte utvecklats. Biosyntesen av glykoproteiner är en icke-malldriven process där monosackariddonatorerna, de accepterande glykoproteinsubstraten och glykosyltransferaserna och glykosidaserna spelar en interaktiv roll. De resulterande glykoproteinerna kan bära komplexa strukturer med flera förgreningspunkter där varje monosackaridkomponent kan vara en av de flera typer som finns i naturen1. Den icke-malldrivna processen inför biokemisk analys som det enda alternativet för att generera oligosackaridstrukturdata. Analysprocessen för glykanstrukturer som är fästa vid ett inhemskt protein är ofta utmanande eftersom det kräver känslig, kvantitativ och robust teknik för att bestämma monosackaridkomposition, kopplingar och förgreningssekvenser2.

I detta sammanhang är masspektrometri (MS) den mest använda tekniken i glykomik- och glykopretogenomikexperiment. Med tiden utförs dessa i högre dataflödesinställningar och data ackumuleras nu i databaser. Glykanstrukturer i olika format3, fyll i GlyTouCan4, det universella glykandatalagret där varje struktur är associerad med en stabil identifierare oavsett vilken precisionsnivå glykanen definieras med (t.ex. eventuellt saknad länktyp eller tvetydig sammansättning). Mycket liknande strukturer samlas in men deras mindre skillnader rapporteras tydligt. Glykoproteiner beskrivs och kurateras i GlyConnect5 och GlyGen6, två databaser som korsrefererar varandra. MS-data som stöder strukturella bevis lagras alltmer i GlycoPOST7. För en bredare täckning av online-resurser är kapitel 52 i referenshandboken, Essentials of Glycobiology, tillägnad glycoinformatik8. Intressant nog har glykopeptididentifieringsprogramvara spridit sig de senaste åren9,10 men inte till förmån för reproducerbarhet. Den senare oron fick ledarna för HUPO GlycoProteomics Initiative (HGI) att ställa in en mjukvaruutmaning 2019. De MS-data som erhållits genom bearbetning av komplexa blandningar av N- och O-glykosylerade humana serumproteiner i fragmenteringslägena CID, ETD och EThcD, gjordes tillgängliga för konkurrenter, oavsett om det var programvaruanvändare eller utvecklare. Den fullständiga rapporten om resultaten av denna utmaning11 beskrivs bara här. Till att börja med observerades en spridning av identifikationer. Det tolkades främst som orsakat av mångfalden av metoder som implementerades i sökmotorer, av deras inställningar och hur utgångar filtrerades och peptid “räknades”. Den experimentella designen kan också ha satt viss programvara och tillvägagångssätt på en (o)fördel. Viktigt är att deltagare som använder samma programvara rapporterade inkonsekventa resultat och därmed belyste allvarliga reproducerbarhetsproblem. Det drogs slutsatsen genom att jämföra olika inlägg att vissa mjukvarulösningar fungerar bättre än andra och vissa sökstrategier ger bättre resultat. Denna återkoppling kommer sannolikt att vägleda förbättringen av automatiserade glykopeptiddataanalysmetoder och kommer i sin tur att påverka databasinnehållet.

Expansionen av glycoinformatik ledde till att skapa webbportaler som ger information och tillgång till flera liknande eller kompletterande resurser. De senaste och senaste beskrivs i ett kapitel i bokserien Omfattande glykovetenskap12 och genom samarbete erbjuds en lösning för datadelning och informationsutbyte i ett open access-läge. En sådan portal utvecklades som ursprungligen kallades Glycomics@ExPASy 13 och döptes om Glyco@Expasy, efter den stora översynen av Expasy-plattformen14 som har varit värd för en stor samling verktyg och databaser som används över flera -omics i årtionden, det mest populära objektet är UniProt15-den universella proteinkunskapsbasen. Glyco@Expasy erbjuder en didaktisk upptäckt av syftet med och användningen av databaser och verktyg, baserat på en visuell kategorisering och en visning av deras ömsesidiga beroenden. Följande protokoll illustrerar procedurer för att utforska glykomik- och glykoproteomikdata med ett urval av resurser från denna portal som gör sambandet mellan glykopreteomik och glykan-interkomik explicit via glykomik. Som det är, producerar glykomikexperiment strukturer där monosackarider är fullständigt definierade och kopplingar delvis eller helt bestämda, men deras proteinplatsbindning är dåligt, om alls, karakteriserad. Däremot genererar glykopreogenomikexperiment exakt information om platsbindning men med en dålig upplösning av glykanstrukturer, ofta begränsade till monosackaridkompositioner. Denna information är sammansatt i GlyConnect-databasen. Dessutom kan sökverktyg i GlyConnect användas för att detektera potentiella glykanligander som beskrivs tillsammans med proteinerna som känner igen dem i UniLectin16, kopplade till GlyConnect via glykaner. Protokollet som presenteras här är uppdelat i två avsnitt för att täcka frågor som är specifika för N-länkade och O-länkade glykaner och glykoproteiner.

Protocol

OBS: En enhet med en internetanslutning (större skärm föredras) och en uppdaterad webbläsare som Chrome eller Firefox krävs. Att använda Safari eller Edge kanske inte är lika tillförlitligt. 1. Från ett protein N-glykom i GlyConnect till ett lektin av UniLectin Åtkomst till resurser från Glyco@ExpasyOBS: Proceduren som beskrivs här är att komma åt GlyConnect men kan tillämpas på åtkomst till alla resurser som registrerats på pla…

Representative Results

Den första delen av protokollet (avsnitt 1) visade hur man undersöker specificiteten eller gemensamheten hos N-glykaner fästa på Asn-69 av det humana prostataspecifika antigenet (PSA) med hjälp av GlyConnect-plattformen. Vävnadsberoende (urin och sädesvätska), liksom isoformberoende (normala och höga pI) variationer i glykanuttryck, betonades med hjälp av två visualiseringsverktyg (figur 4 och figur 5). Fö…

Discussion

GlyConnect Octopus som ett verktyg för att avslöja oväntade korrelationer
GlyConnect Octopus var ursprungligen utformad för att fråga databasen med en lös definition av glykaner. Faktum är att litteraturen ofta rapporterar de viktigaste egenskaperna hos glykaner i ett glykom, såsom att fukosyleras eller sialyleras, vara gjorda av två eller flera antenner etc. Dessutom klassificeras glykaner oavsett om de är N- eller O-länkade i kärnor, som beskrivs i referenshandboken Essentials of <sup cl…

Divulgazioni

The authors have nothing to disclose.

Acknowledgements

Författaren erkänner varmt tidigare och nuvarande medlemmar i Proteome Informatics Group som är involverade i att utveckla de resurser som används i denna handledning, särskilt Julien Mariethoz och Catherine Hayes för GlyConnect, François Bonnardel för UniLectin, Davide Alocci och Frederic Nikitin för bläckfisken och Thibault Robin för Compozitor och sista handen på bläckfisken.

Utvecklingen av glyco@Expasy-projektet stöds av den schweiziska federala regeringen genom statssekretariatet för utbildning, forskning och innovation (SERI) och kompletteras för närvarande av Swiss National Science Foundation (SNSF: 31003A_179249). ExPASy underhålls av Swiss Institute of Bioinformatics och är värd på Vital-IT Competency Center. Författaren erkänner också Anne Imberty för enastående samarbete på UniLectin-plattformen som gemensamt stöds av ANR PIA Glyco@Alps (ANR-15-IDEX-02), Alliance Campus Rhodanien Co-funds (http://campusrhodanien.unige-cofunds.ch) Labex Arcane/CBH-EUR-GS (ANR-17-EURE-0003).

Materials

internet connection user's choice
recent version of web browser user's choice

Riferimenti

  1. Spring Harbor Laboratory Press. . Essentials of Glycobiology. , (2015).
  2. Gray, C. J., et al. Advancing solutions to the carbohydrate sequencing challenge. Journal of the American Chemical Society. 141 (37), 14463-14479 (2019).
  3. Tsuchiya, S., Yamada, I., Aoki-Kinoshita, K. F. GlycanFormatConverter: a conversion tool for translating the complexities of glycans. Bioinformatics. 35 (14), 2434-2440 (2018).
  4. Fujita, A., et al. The international glycan repository GlyTouCan version 3.0. Nucleic Acids Research. 49, 1529-1533 (2021).
  5. Alocci, D., et al. GlyConnect: glycoproteomics goes visual, interactive, and analytical. Journal of Proteome Research. 18 (2), 664-677 (2019).
  6. York, W. S., et al. GlyGen: computational and informatics resources for glycoscience. Glycobiology. 30 (2), 72-73 (2020).
  7. Watanabe, Y., Aoki-Kinoshita, K. F., Ishihama, Y., Okuda, S. GlycoPOST realizes FAIR principles for glycomics mass spectrometry data. Nucleic Acids Research. 49, 1523-1528 (2020).
  8. Campbell, M. P., Aoki-Kinoshita, K. F., Lisacek, F., York, W. S., Packer, N. H. Glycoinformatics. Essentials of Glycobiology. , (2015).
  9. Cao, W., et al. Recent advances in software tools for more generic and precise intact glycopeptide analysis. Molecular & Cellular Proteomics. 20, 100060 (2021).
  10. Mariethoz, J., Hayes, C., Lisacek, F. Glycan compositions with Compozitor to enhance glycopeptide identification. Proteomics Data Analysis. 2361, 109-127 (2021).
  11. Kawahara, R., et al. Communityevaluation of glycoproteomics informatics solutions reveals high-performance search strategies of serum glycopeptide analysis. Nature Methods. 18, 1304-1316 (2021).
  12. Lisacek, F., Aoki-Kinoshita, K. F., Vora, J. K., Mazumder, R., Tiemeyer, M. Glycoinformatics resources integrated through the GlySpace Alliance. Comprehensive Glycoscience. 1, 507-521 (2021).
  13. Mariethoz, J., et al. Glycomics@ExPASy: bridging the gap. Molecular & Cellular Proteomics. 17 (11), 2164-2176 (2018).
  14. Duvaud, S., et al. Expasy, the swiss bioinformatics resource portal, as designed by its users. Nucleic Acids Research. 49, 216-227 (2021).
  15. The UniProt Consortium et al. UniProt: the universal protein knowledgebase in 2021. Nucleic Acids Research. 49, 480-489 (2021).
  16. Bonnardel, F., Perez, S., Lisacek, F., Imberty, A. Structural database for lectins and the UniLectin web platform. Lectin Purification and Analysis. 2132, 1-14 (2020).
  17. Neelamegham, S., et al. Updates to the symbol nomenclature for glycans guidelines. Glycobiology. 29 (9), 620-624 (2019).
  18. Sharon, N. IUPAC-IUB Joint Commission on Biochemical Nomenclature (JCBN). Nomenclature of glycoproteins, glycopeptides and peptidoglycans: JCBN recommendations 1985. Glycoconjugate Journal. 3 (2), 123-133 (1986).
  19. Harvey, D. J., et al. Proposal for a standard system for drawing structural diagrams of N- and O-linked carbohydrates and related compounds. Proteomics. 9 (15), 3796-3801 (2009).
  20. Song, E., Mayampurath, A., Yu, C. -. Y., Tang, H., Mechref, Y. Glycoproteomics: identifying the glycosylation of prostate specific antigen at normal and high isoelectric points by LC-MS/MS. Journal of Proteome Research. 13 (12), 5570-5580 (2014).
  21. Moran, A. B., et al. Profiling the proteoforms of urinary prostate-specific antigen by capillary electrophoresis – mass spectrometry. Journal of Proteomics. 238, 104148 (2021).
  22. Wang, W., et al. High-throughput glycopeptide profiling of prostate-specific antigen from seminal plasma by MALDI-MS. Talanta. 222, 121495 (2021).
  23. wwPDB consortium metal. Protein Data Bank: the single global archive for 3D macromolecular structure data. Nucleic Acids Research. 47, 520-528 (2019).
  24. Sehnal, D., Grant, O. C. Rapidly display glycan symbols in 3D structures: 3D-SNFG in LiteMol. Journal of Proteome Research. 18 (2), 770-774 (2019).
  25. Bonnardel, F., et al. UniLectin3D, a database of carbohydrate binding proteins with curated information on 3D structures and interacting ligands. Nucleic Acids Research. 47, 1236-1244 (2019).
  26. Sehnal, D., et al. LiteMol suite: interactive web-based visualization of large-scale macromolecular structure data. Nature Methods. 14 (12), 1121-1122 (2017).
  27. Salentin, S., Schreiber, S., Haupt, V. J., Adasme, M. F., Schroeder, M. PLIP: fully automated protein-ligand interaction profiler. Nucleic Acids Research. 43, 443-447 (2015).
  28. Robin, T., Mariethoz, J., Lisacek, F. Examining and fine-tuning the selection of glycan compositions with GlyConnect Compozitor. Molecular & Cellular Proteomics. 19 (10), 1602-1618 (2020).
  29. Compagno, D., et al. Glycans and galectins in prostate cancer biology, angiogenesis and metastasis. Glycobiology. 24 (10), 899-906 (2014).
  30. Gentilini, L. D., et al. Stable and high expression of Galectin-8 tightly controls metastatic progression of prostate cancer. Oncotarget. 8 (27), 44654-44668 (2017).
  31. Schwämmle, V., Verano-Braga, T., Roepstorff, P. Computational and statistical methods for high-throughput analysis of post-translational modifications of proteins. Journal of Proteomics. 129, 3-15 (2015).
  32. Khatri, K., Klein, J. A., Zaia, J. Use of an informed search space maximizes confidence of site-specific assignment of glycoprotein glycosylation. Analytical and Bioanalytical Chemistry. 409 (2), 607-618 (2017).
  33. Sztain, T., et al. A glycan gate controls opening of the SARS-CoV-2 spike protein. Nature Chemistry. 13, 963-968 (2021).

Play Video

Citazione di questo articolo
Lisacek, F. Bioinformatics Resources for the Study of Glycan-Mediated Protein Interactions. J. Vis. Exp. (179), e63356, doi:10.3791/63356 (2022).

View Video