Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

Bioinformatikresurser för studier av glykanmedierade proteininteraktioner

Published: January 20, 2022 doi: 10.3791/63356

Summary

Detta protokoll illustrerar hur man utforskar, jämför och tolkar mänskliga proteinglykom med online-resurser.

Abstract

Initiativet Glyco@Expasy lanserades som en samling databaser och verktyg som är beroende av varandra och som spänner över flera aspekter av kunskap inom glykobiologi. I synnerhet syftar det till att belysa interaktioner mellan glykoproteiner (såsom cellytereceptorer) och kolhydratbindande proteiner medierade av glykaner. Här introduceras stora resurser i samlingen genom två illustrativa exempel centrerade på N-glykomet av det humana prostataspecifika antigenet (PSA) och O-glykomet av humana serumproteiner. Genom olika databasfrågor och med hjälp av visualiseringsverktyg visar den här artikeln hur du utforskar och jämför innehåll i ett kontinuum för att samla in och korrelera annars spridda bitar av information. Insamlade data är avsedda att mata mer detaljerade scenarier av glykanfunktion. Glycoinformatik som introduceras här föreslås därför som ett sätt att antingen stärka, forma eller motbevisa antaganden om specificiteten hos ett proteinglykom i ett givet sammanhang.

Introduction

Glykaner, proteiner till vilka de är fästa (glykoproteiner) och proteiner som de binder till (lektiner eller kolhydratbindande proteiner) är de viktigaste molekylära aktörerna vid cellytan1. Trots denna centrala roll i cell-cellkommunikation är storskaliga studier, inklusive glykomik, glykopreteomik eller glykan-interkomemitiska data fortfarande knappa jämfört med deras motsvarighet inom genomik och proteomik.

Fram till nyligen hade metoder för att karakterisera förgreningsstrukturerna hos komplexa kolhydrater medan de fortfarande konjugerades till bärarproteinet inte utvecklats. Biosyntesen av glykoproteiner är en icke-malldriven process där monosackariddonatorerna, de accepterande glykoproteinsubstraten och glykosyltransferaserna och glykosidaserna spelar en interaktiv roll. De resulterande glykoproteinerna kan bära komplexa strukturer med flera förgreningspunkter där varje monosackaridkomponent kan vara en av de flera typer som finns i naturen1. Den icke-malldrivna processen inför biokemisk analys som det enda alternativet för att generera oligosackaridstrukturdata. Analysprocessen för glykanstrukturer som är fästa vid ett inhemskt protein är ofta utmanande eftersom det kräver känslig, kvantitativ och robust teknik för att bestämma monosackaridkomposition, kopplingar och förgreningssekvenser2.

I detta sammanhang är masspektrometri (MS) den mest använda tekniken i glykomik- och glykopretogenomikexperiment. Med tiden utförs dessa i högre dataflödesinställningar och data ackumuleras nu i databaser. Glykanstrukturer i olika format3, fyll i GlyTouCan4, det universella glykandatalagret där varje struktur är associerad med en stabil identifierare oavsett vilken precisionsnivå glykanen definieras med (t.ex. eventuellt saknad länktyp eller tvetydig sammansättning). Mycket liknande strukturer samlas in men deras mindre skillnader rapporteras tydligt. Glykoproteiner beskrivs och kurateras i GlyConnect5 och GlyGen6, två databaser som korsrefererar varandra. MS-data som stöder strukturella bevis lagras alltmer i GlycoPOST7. För en bredare täckning av online-resurser är kapitel 52 i referenshandboken, Essentials of Glycobiology, tillägnad glycoinformatik8. Intressant nog har glykopeptididentifieringsprogramvara spridit sig de senaste åren9,10 men inte till förmån för reproducerbarhet. Den senare oron fick ledarna för HUPO GlycoProteomics Initiative (HGI) att ställa in en mjukvaruutmaning 2019. De MS-data som erhållits genom bearbetning av komplexa blandningar av N- och O-glykosylerade humana serumproteiner i fragmenteringslägena CID, ETD och EThcD, gjordes tillgängliga för konkurrenter, oavsett om det var programvaruanvändare eller utvecklare. Den fullständiga rapporten om resultaten av denna utmaning11 beskrivs bara här. Till att börja med observerades en spridning av identifikationer. Det tolkades främst som orsakat av mångfalden av metoder som implementerades i sökmotorer, av deras inställningar och hur utgångar filtrerades och peptid "räknades". Den experimentella designen kan också ha satt viss programvara och tillvägagångssätt på en (o)fördel. Viktigt är att deltagare som använder samma programvara rapporterade inkonsekventa resultat och därmed belyste allvarliga reproducerbarhetsproblem. Det drogs slutsatsen genom att jämföra olika inlägg att vissa mjukvarulösningar fungerar bättre än andra och vissa sökstrategier ger bättre resultat. Denna återkoppling kommer sannolikt att vägleda förbättringen av automatiserade glykopeptiddataanalysmetoder och kommer i sin tur att påverka databasinnehållet.

Expansionen av glycoinformatik ledde till att skapa webbportaler som ger information och tillgång till flera liknande eller kompletterande resurser. De senaste och senaste beskrivs i ett kapitel i bokserien Omfattande glykovetenskap12 och genom samarbete erbjuds en lösning för datadelning och informationsutbyte i ett open access-läge. En sådan portal utvecklades som ursprungligen kallades Glycomics@ExPASy 13 och döptes om Glyco@Expasy, efter den stora översynen av Expasy-plattformen14 som har varit värd för en stor samling verktyg och databaser som används över flera -omics i årtionden, det mest populära objektet är UniProt15-den universella proteinkunskapsbasen. Glyco@Expasy erbjuder en didaktisk upptäckt av syftet med och användningen av databaser och verktyg, baserat på en visuell kategorisering och en visning av deras ömsesidiga beroenden. Följande protokoll illustrerar procedurer för att utforska glykomik- och glykoproteomikdata med ett urval av resurser från denna portal som gör sambandet mellan glykopreteomik och glykan-interkomik explicit via glykomik. Som det är, producerar glykomikexperiment strukturer där monosackarider är fullständigt definierade och kopplingar delvis eller helt bestämda, men deras proteinplatsbindning är dåligt, om alls, karakteriserad. Däremot genererar glykopreogenomikexperiment exakt information om platsbindning men med en dålig upplösning av glykanstrukturer, ofta begränsade till monosackaridkompositioner. Denna information är sammansatt i GlyConnect-databasen. Dessutom kan sökverktyg i GlyConnect användas för att detektera potentiella glykanligander som beskrivs tillsammans med proteinerna som känner igen dem i UniLectin16, kopplade till GlyConnect via glykaner. Protokollet som presenteras här är uppdelat i två avsnitt för att täcka frågor som är specifika för N-länkade och O-länkade glykaner och glykoproteiner.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

OBS: En enhet med en internetanslutning (större skärm föredras) och en uppdaterad webbläsare som Chrome eller Firefox krävs. Att använda Safari eller Edge kanske inte är lika tillförlitligt.

1. Från ett protein N-glykom i GlyConnect till ett lektin av UniLectin

  1. Åtkomst till resurser från Glyco@Expasy
    OBS: Proceduren som beskrivs här är att komma åt GlyConnect men kan tillämpas på åtkomst till alla resurser som registrerats på plattformen.
    1. Gå till https://glycoproteome.expasy.org/glycomics-expasy och överväga bubbeldiagrammet till höger som visar olika kategorier som glykokonjugat eller glykanbindning. I menyn längst till vänster som återspeglar kategorierna i bubblorna markerar du rutan Glykoproteiner så att bubbeldiagrammet till höger omedelbart zoomar in bubblan som matchar den kategorin.
      OBS: Gröna bubblor är verktyg och gula bubblor är databaser. Om du klickar på någon av dem zoomas in igen för att ge information om resursen. Innan du gör det kanske användaren vill förstå resursens beroenden till andra.
    2. Om du vill hämta information om beroenden flyttar du från fliken Resurstematisk klassificering till fliken Resursberoendehjul . Placera musen på GlyConnect i hjulet för att kontrollera dess integrationsnivå med andra källor (Figur 1).
    3. Gå tillbaka till fliken Resurstematisk klassificering för att nå GlyConnect-bubblan som i steg 1.1.1 och klicka på den (kompletterande bild 1) för att visa GlyConnect-hemsidan på en ny flik som visar statistiken för innehållet i den senaste versionen av databasen.
      OBS: Ett färgschema som beskrivs i tabell 1 matchar de olika typerna av information som lagras i databasen. Den här färgkoden är giltig på alla entitetssidor i GlyConnect och är konsekvent hela tiden. Hemsidan visar också fyra avsnitt dedikerade till fokuserade dataset som de som beskriver glykosylering av Sars-Cov-2-spikproteinet (COVID-19) eller omfattande detaljer om oligosackarider för bröstmjölk (HMO). Dessa kommer inte att undersökas i detta protokoll.
  2. Utforska den kontextuella informationen om ett protein N-glykom
    OBS: Alla glykanstrukturer i GlyConnect visas i tre alternativa och vanliga format: (1) Symbolnomenklatur för glykaner (SNFG)17 (2) IUPAC kondenserad18, och (3) Oxford19. Däremot finns det ingen standardnotering för att uttrycka glykankomposition. I GlyConnect används följande kod: Hex för hexos, HexNAc för N-acetylhexosamin, dHex för fukos och NeuAc för sialinsyror. För enkelhetens skull är visualiseringsverktyg beroende av en kondenserad notation: H för hexos, N för N-acetylhexosamin, F för fukos och S för sialinsyror. Dessutom betecknar små bokstäver modifieringar som "a" för acetylering, "p" för fosforylering och "s" för sulfatering, för de vanligaste av dessa så kallade substituenter.
    1. För att se och utforska N-glykomet av humant prostataspecifikt antigen (PSA), från GlyConnect-hemsidan, fortsätt enligt följande.
      OBS: Glykosylering av mänsklig PSA har studerats genom åren, särskilt i samband med prostatacancer. GlyConnect-databasen lagrar tre referenser20,21,22, som kombinerar glykomik och glykopreteomikdata. Observera att resultaten som tillhandahålls här erhölls med september 2021-versionen av GlyConnect. Bakomliggande användning av databasen kan ge något annorlunda statistik på grund av frekventa datauppdateringar.
    2. Välj knappen PROTEIN för att öppna databasens proteinvy. På proteinvysidan skriver du prostata i sökfönstret. Leta efter de två posterna som anges i utdata som skiljer två isoformer av PSA med distinkta pI-värden. Klicka på 790 (Id-kolumn) som motsvarar den vanliga isoformen för PSA.
      OBS: Leta efter det översta flerfärgade fältet som visar sammanfattande information extraherad från det publicerade arbetet i schemat som beskrivs ovan. Flera alternativ för navigering är möjliga enligt beskrivningen nedan.
    3. På den övre flerfärgade stapeln klickar du på SOURCE-knappen i grönt för att visa de provtyper från vilka de publicerade uppgifterna behandlades: Urin och seminalvätska. Om du vill bläddra vidare i den här informationen klickar du på någon av dessa exempeltyper. Detsamma gäller för alla objekt som visas när du klickar på en färgad knapp.
    4. För att kontrollera det hälsorelaterade innehållet i databasen, klicka på DISEASE-knappen , som innehåller två objekt, varav en är prostatacancer som länkar till motsvarande dedikerade sjukdomssida i GlyConnect. Sammanfattningen för den sidan visar att tre storskaliga studier har rapporterat 319 kompositioner på 1 087 platser som finns i 308 humana proteiner.
    5. Klicka på knappen STRUKTUR för att se hela listan över 135 strukturer associerade med PSA från glykomikdata. Klicka på KNAPPEN KOMPOSITION för de associerade 78 kompositionerna bestämda av glykopreomexperiment. Klicka på valfri struktur eller komposition för att få mer information.
      OBS: Detaljer som listan över alternativa proteiner som bär den specifika strukturen eller listan över strukturer som matchar kompositionen kan erhållas. PSA är känt för att ha endast ett N-glykosyleringsstället vid Asn-69 (endast ett objekt räknas för den bruna SITE-knappen ).
    6. För att minska tvetydigheten i kompositioner, klicka på SUGGESTED STRUCT under en vald komposition (till exempel Hex:6 HexNAc:3 NeuAc:1). Ett förslag görs varje gång monosackaridräkningen sammanfaller med den för en struktur som anges ovan (figur 2).
      OBS: Hex: 6 HexNAc: 3 NeuAc: 1-kompositionen som genereras av ett glykopreteomikexperiment matchas med fyra strukturer med högre upplösning från glykomikdata. När det gäller PSA finns det ingen tvetydighet på platsen att lösa eftersom endast Asn-69 glykosyleras.
    7. För att utforska proteinsidan fullt ut, se ytterligare information till höger på sidan (Figur 3).
      1. Visa standardposten 3QUM PDB (Protein Data Bank23) för PSA som visas med två komplexa glykaner fästa vid varje monomer (figur 3) eller den alternativa 2ZCK-posten , som också är tillgänglig på grund av ett bifogat kolhydrat. Den andra posten visar en enda kedja.
        OBS: Båda posterna visualiseras med 3D LiteMol-plugin24 som visar glykaner i SNFG-3D-notation som antagits i PDB-RCSB.
      2. Klicka på motsvarande länkar till andra korsreferenser för att utforska relevant funktionell information från stora proteomikdatabaser, till exempel UniProt (figur 3).
  3. Visualisera och korrelera kontextuell information om ett protein N-glykom
    OBS: Som framgår av föregående avsnitt kan långa listor över strukturer eller kompositioner vara svåra att förstå som helhet och GlyConnect förlitar sig på två olika verktyg för att visualisera nyckelinformation, nämligen GlyConnect Octopus och GlyConnect Compozitor (den första utökar sammanfattningsinformationen som fångats i färgade knappar och den andra tar fram strukturella beroenden när det gäller en struktur / komposition som finns i en annan). Som illustreras nedan utforskar GlyConnect Octopus associationer mellan de olika entiteter som lagras i databasen genom att markera flera eller enskilda anslutningar som en återspegling av databasinnehållet.
    1. Utför en GlyConnect Octopus-sökning för att bekräfta förekomsten av vanliga strukturella egenskaper som hybridkärnstrukturer och mycket frekventa sialinsyrainnehållande strukturer i mångfalden av glykaner fästa vid PSA, som beskrivs nedan.
    2. Gå till Octopus hemsida https://glyconnect.expasy.org/octopus/. Håll den N-länkade fliken markerad som standard. Flytta till underfliken Kärnor och klicka på hybridikonen . Flytta till underfliken Egenskaper och klicka på ikonen Sialylated . Klicka på den gröna sökknappen nedan.
      OBS: Sökresultaten visas grafiskt som relationer mellan tre kategorier av objekt. Som standard matchar mittlistan frågan för kompositioner, den vänstra samlingen spänner över relaterade proteiner och den högra spänner över relaterade glykaner.
    3. Håll muspekaren över H6N4F1S1 i det visade diagrammet över relationer för att markera länkar till sex proteiner och tre strukturer. Kontrastera detta genom att sväva över H6N4F2S1 som pekar ut de två isoformerna för PSA (båda kallade UniProt ID: KLK3_HUMAN) och en struktur (ID: 10996). Håll muspekaren över struktur-ID:t för att visa dess SNFG-representation och klicka på den för att öppna motsvarande sida (kompletterande figur 2).
    4. Ändra bläckfiskens noder till något annat ämne som beskriver sammanhanget för glykosylering. Färgkoden förblir densamma som den som beskrivits tidigare (se tabell 1).
      1. Ändra mittnoderna till vävnader för att visa 15 alternativ i mitten av diagrammet, varav många är kroppsvätskor. Leta efter alla föreningar mellan proteiner och glykaner som matchar frågan beroende på vävnadsinformation. Placera markören på urin eller sädesvätska i mitten av diagrammet för att visa olika föreningar (figur 4A,B).
      2. Ändra mittnoderna till sjukdom för att visa 13 alternativ, varav ett är prostatacancer. Det enda proteinet som är associerat är PSA (KLK3_HUMAN) (kompletterande figur 3).
        OBS: En närmare titt på PSA N-glykomet som visas på proteinsidan pekar ut den mycket höga frekvensen hos en terminal NeuAc (a?-?) Gal(b?-?) GlcNAc-understruktur i många fall på strukturer med två eller tre antenner. En annan bläckfisk kan genereras på den grunden enligt beskrivningen nedan.
    5. Klicka på knappen Rensa för att uppdatera sökningen. Flytta till underfliken Egenskaper och klicka på ikonen Bi-antenner . Gå till underfliken Determinanter och klicka på ikonen 3-Sialyl-LN (typ 2 ). Klicka på den gröna sökknappen nedan.
    6. Kontrollera de bläckfisk-hämtade föreningarna med bi-antennglykaner som innehåller ett terminalt 3-Sialyl-LN-motiv (typ 2), dvs NeuAc (a1-3) Gal (b1-4) GlcNAc. Ändra mittnoderna till vävnader för enklare läsning och håll muspekaren över KLK3_HUMAN för att direkt ansluta seminalvätska med PSA-vanlig isoform och sju strukturer (kompletterande figur 4).
      OBS: Det andra visualiseringsverktyget, GlyConnect Compozitor, utför skanningen av potentiella relationer mellan varje komposition i en lista över dessa (se nedan). Ett förhållande definieras som att det skiljer sig från endast en monosackarid mellan två kompositioner. Dessa identifierade relationer ritade i en graf exponerar (dis)kontinuiteten hos ett glykom.
    7. Använd GlyConnect Compozitor för att utföra genomsökningen av potentiella relationer mellan varje komposition i en lista över dessa, som illustreras nedan för PSA.
      OBS: GlyConnect Compozitor bearbetar kompositioner i samband med ett sammanhang. Det erbjuder distinkta flikar för att fråga GlyConnect, t.ex. proteiner, källor, cellinjer, sjukdomar som är självförklarande för att kvalificera ett sammanhang. Detta illustreras här med PSA enligt följande.
    8. Gå tillbaka till proteinsidan för PSA: https://glyconnect.expasy.org/browser/proteins/790. Klicka på Compozitor-länken till höger på PSA-inmatningssidan. Kontrollera att Compozitor-sökfälten är förifyllda med information om ID 790-posten på fliken Protein (Protein: Prostataspecifikt antigen, Art: Homo sapiens och Glykantyp: N-länkad).
    9. Klicka på knappen Lägg till i urval för att hämta data från databasen och visa diagrammet över anslutna kompositioner. Avmarkera alternativet Inkludera virtuella noder . Klicka på knappen Compute Graph för att visa ett diagram som visar en väl ansluten uppsättning av 78 kompositioner som representerar PSA N-glykomet och ett stapeldiagram som visar glykanernas huvudegenskaper.
    10. Håll muspekaren över den lila stapeln i stapeldiagrammet, som lokaliserar alla sialylerade strukturer i diagrammet för att avslöja en observerbar bias mot sialylerade strukturer.
    11. Stanna kvar på huvudfliken Protein och välj Prostataspecifikt antigen - hög Pi-isoform (psah) i fältet Protein (namn).
      OBS: Fälten Glycantyp och Glykanplats fylls i automatiskt.
    12. Klicka på knappen Lägg till i urval för att hämta data från databasen som uppgår till 57 kompositioner. Klicka på knappen Compute Graph för att generera de överlagrade graferna för båda isoformerna och bedöma skillnaderna i glykomer för de två PSA-isoformerna. Håll muspekaren över nodetiketter för att uppmana visningen av antalet strukturer som motsvarar kompositionerna/etiketterna (figur 5).
  4. Glykanbindande information i UniLectin
    OBS: Minns determinanten som testats i bläckfisken, beskriven som NeuAc(a2-3)Gal(b1-4). Per definition är det en etablerad bindande del av en glykanstruktur och kan som sådan sökas i UniLectin3D-databasen25.
    1. Gå till https://www.unilectin.eu/ och klicka på UniLectin3D-knappen . Alternativt kan du gå direkt till sidan: https://www.unilectin.eu/unilectin3D/.Click på knappen Glykansökning för att öppna den här sidan: https://www.unilectin.eu/unilectin3D/glycan_search (Kompletterande figur 6).
    2. Klicka på den lila diamanten som representerar en sialinsyra, vilket uppmanar visningen av alla glykanbindande motiv som slutar med en sialinsyra lagrad i databasen. Den övre delen av denna samling av motiv innehåller NeuAc(a2-3)Gal(b1-4)GlcNAc-motivet som undersökts tidigare (kompletterande figur 7).
    3. Klicka på NeuAc(a2-3)Gal(b1-4)GlcNAc-motivet för att uppmana visningen av alla lektiner för vilka en 3D-struktur som bekräftar interaktionen med NeuAc(a2-3)Gal(b1-4)GlcNAc är känd. Resultatet visar som standard lektiner i alla arter. Använd alternativet Sök efter fält för att begränsa vyn till människocentrerad information.
    4. Klicka på alternativet Sök efter fält . I artfältet skriver du Homo sapiens. Klicka på knappen Utforska röntgenstrukturer för att filtrera bort originallistan. Endast en post återstår, dvs den mänskliga galectin-8. Klicka på knappen Visa 3D-struktur och information i det övre högra hörnet av det listade objektet för att visa detaljerad information om mänsklig galectin-8 som interagerar med NeuAc (a2-3) Gal (b1-4) GlcNAc.
    5. Få tillgång till den strukturella informationen om mänsklig galectin-8 som visas på sidan med två olika tittare.
      1. Håll musen för att vända molekylen och föra liganden fram med Litemol-programvaran26 integrerad för att visa lektin 3D-strukturen. Mus över en av de listade interaktionerna till vänster för att uppdatera vyn till höger och lokalisera var den specifika interaktionen verkar i strukturen med PLIP-programvaran27 integrerad för att detaljera atominteraktioner mellan lektin och liganden (Figur 6).
    6. Klicka på valfri grön knapp som länkar till motsvarande poster i UniProt, PDB (europeiska eller amerikanska webbplatser) och GlyConnect för att utforska dessa korsreferenser.

2. Utforska och jämföra O-glykomer i GlyConnect

  1. Bläddra i HGI-utmaningens datauppsättning med hög konfidens
    OBS: HGI-datauppsättningen som nämns i inledningen lagras i GlyConnect-databasen. Den innehåller 163 N- och 23 O-glykopeptider som finns i 37 glykoproteiner som anses vara en hög konfidenslista. GlyConnect Compozitor28 är nyckeln till att bedöma glykomdatakonsistens. Det är viktigt att Compozitor tillåter virtuella noder (visas i grått) när endast ett mellanliggande steg behövs för att ansluta de isolerade noderna. På så sätt stramar virtuella noder grafen och kan tolkas som strukturer som potentiellt missas i experimentresultaten.
    1. Bläddra i HGI-datauppsättningen från GlyConnect-hemsidan genom att gå direkt till artikelns referenssida: https://glyconnect.expasy.org/browser/references/2943.
      OBS: Sammanfattningen i de färgade knapparna återspeglar delvis siffrorna i artikeln. Men om endast 69 unika peptider listas återspeglar detta flera föreningar mellan peptider och platser eller strukturer. I artikeln definieras en glykopeptid som en unik kombination av en peptid och en komposition. I GlyConnect beaktas först glykositer, och de beskrivs som en kombination av en peptid med strukturer. Detta förklarar skillnaden i siffror mellan GlyConnect och ovanstående citat.
    2. Kontrollera den höga frekvensen av förekomsten av N-länkade kompositioner, såsom Hex:5 HexNAc:4 NeuAc:2, identifierade på 42 platser i 43 peptider i motsats till den frekventa unikheten hos de flesta O-länkade kompositioner som identifierats på 1 plats i 1 peptid.
    3. Klicka på Länken Compozitor till höger på referensinmatningssidan för att bedöma datauppsättningens konsekvens. Se till att Compozitor-verktyget direkt bearbetar referensens DOI och fyller i sökfältet med reference=10.1101/2021.03.14.435332 på fliken Avancerat i verktyget. Skriv &glycan_type=O-länkad efter DOI-numret för att begränsa sökningen till O-länkade glykaner, så att frågan blir: Referens=10.1101/2021.03.14.435332&glycan_
      type=O-länkad
    4. Klicka på knappen Lägg till i urval för att hämta data från databasen (det finns 20 O-länkade kompositioner). Behåll alternativet Inkludera virtuella noder markerat. Klicka på knappen Compute Graph för att visa diagrammet över anslutna kompositioner. Detta resultat belyser flera luckor i den förväntade kontinuiteten i glykanbiosyntesen med nio virtuella noder som krävs för att slutföra grafen (figur 7).
  2. Jämförelse med O-glykomet för ett utvalt serumprotein i GlyConnect
    OBS: För att bedöma om luckorna kan fyllas med data som lagras i GlyConnect valdes ett O-glykosylerat protein av de 37 listade med referensen. I datasetet rapporteras Inter-alfa-trypsinhämmare tung kedja H4 (Q14624) vara en O-glykosylerad på Thr-725.
    1. Gå till fliken Protein i GlyConnect Compozitor (se steg 2.1.3). I listan Protein väljer du Inter-alfa-trypsinhämmare tung kedja H4. Se till att artvalet är Homo sapiens som standard. Avmarkera N-bunden i glykantypen. Välj endast Thr-725 i listan Webbplats genom att först klicka på minustecknet till vänster om Webbplatsen för att avmarkera alla webbplatser och sedan välja endast Thr-725 från listan.
    2. Klicka på knappen Lägg till i urval (observera att sex kompositioner är associerade med Thr-725). Klicka på knappen Compute Graph för att visa diagrammet över anslutna kompositioner (kompletterande figur 8).
    3. Observera det visade diagrammet, som visar de 17 unika kompositionerna av de 20 O-länkade kompositionerna i artikeldatauppsättningen i blått och de tre unika av sex i databasen i rött. Med andra ord är överlappningen mellan de två källorna närvarande i tre kompositioner som representeras i magenta. Observera att en 45° rotation av grafen genereras automatiskt.
      OBS: Antalet virtuella noder minskas med en. Som det visar sig är H2N2S1 som saknas i de 20 O-länkade kompositionerna i artikeldatasetet och representeras som en virtuell nod nu fylld med en ytterligare komposition associerad med Thr-725 av Inter-alfa-trypsinhämmare tung kedja H4 i databasen. Detta förenklar topologin i diagrammet eftersom två andra virtuella noder görs värdelösa eftersom de var alternativa alternativ för att fylla klyftan mellan H1N2S1 och H2N2S2. Ändå skulle en andra komposition som importeras från databasen isoleras om inte för skapandet av två nya alternativa virtuella noder H2N2F1S1 och H1N2F2S1.
    4. För att förstå de virtuella noderna, kontrollera om motsvarande kompositioner finns i GlyConnect. För att göra detta, klicka på Exportera knappen under diagrammet. Välj Endast virtuellt genom att avmarkera alla andra alternativ. Klicka på urklippsikonen för att kopiera valet av 8 kompositioner.
    5. Klistra in markeringen i frågefönstret på Fliken Anpassad i Compozitor. Välj O-länkad i fältet Glykantyp . Ange markeringsetiketten i fältet Kompositioner till exempel VN för att namnge listan med 8 kompositioner. Klicka på knappen Lägg till i markering och sedan på knappen Beräkningsdiagram . Alla virtuella noder visas nu som gröna noder (figur 8).

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Den första delen av protokollet (avsnitt 1) visade hur man undersöker specificiteten eller gemensamheten hos N-glykaner fästa på Asn-69 av det humana prostataspecifika antigenet (PSA) med hjälp av GlyConnect-plattformen. Vävnadsberoende (urin och sädesvätska), liksom isoformberoende (normala och höga pI) variationer i glykanuttryck, betonades med hjälp av två visualiseringsverktyg (figur 4 och figur 5).

För det första gav GlyConnect Octopus, som visar föreningar mellan enheter lagrade i databasen, möjlighet att utforska kontextuell information genom att (1) välja olika enheter som ska visas i bläckfisken och (2) klicka på länkar för att undersöka relaterade poster. Resultatet var distinkta föreningar beroende på vävnaden.

För det andra användes GlyConnect Compozitor, ursprungligen utformad för att definiera / förfina en kompositionsfil för glykopeptididentifiering, för att bedöma glykanuttryck i två kända PSA-isoformer (normal och hög pI). Jämförelsen av varje isoformglykom producerade en väl ansluten graf som utpekade fyra noder (kompositioner), varav två är karakteristiska för den höga pI-isoformen. Även om glykomerlappningen är signifikant, visade glykanegenskapsdiagrammet en minskning av sialylering från den gemensamma till den höga pI-isoformen (kompletterande figur 5).

Vidare pekar utforskningen av UniLectin3D ut galectin-8 som en möjlig läsare av PSA-glykomet eftersom det senare innehåller många strukturer med en NeuAc(a2-3)Gal(b1-4)GlcNAc-terminalepitetop. Detta ger en ledning att följa och kan inte betraktas som slutligt bevis. Icke desto mindre är PSA och galektiner kända för att spela en viktig roll i prostatacancer29 och den specifika roll som Galectin-8 har nyligen lyfts fram30. Den första delen av protokollet korrelerar strukturella (glykoproteomik) och funktionella (bindande) data för att fastställa ett troligt scenario för protein-proteininteraktioner medierade av glykaner.

I den andra delen av protokollet (avsnitt 2) undersöktes en högkvalitativ uppsättning O-glykankompositioner associerade med en viss vävnad (humant serum) och jämfördes med GlyConnect-databasinnehållet, vilket gav möjlighet att anpassa en glykankompositionsfil för raffinerad identifiering av glykopeptider (figur 7 och figur 8 ). Den kan förlita sig på den minimala uppsättningen av 20 kompositioner som är tillgängliga från en datauppsättning (HGI-utmaningsresultat) eller förbättras med 23 till 26 objekt som rationellt samlas in i GlyConnect för att stärka uppsättningens konsistens.

röd ljus orange grön ljusblå lila rosa mörkblå brun mörk orange
art protein vävnadskälla struktur sammansättning sjukdom hänvisning glykosit peptid

Tabell 1: Färgschema som är associerat med varje entitet i GlyConnect-databasen och gäller hela tiden.

Figure 1
Bild 1: Beroendehjulet för Glyco@Expasy instansierat för GlyConnect. Klicka här för att se en större version av denna figur.

Figure 2
Figur 2: Föreslagen glykanstruktur för en vald glykankomposition. Föreslagen glykanstruktur från ett glykomikexperiment för en glykankomposition av ett glykoproteomiskt experiment riktat mot samma glykoprotein, här humant prostataspecifikt antigen (PSA), som föreslås på GlyConnect-sidan för PSA (ID: 790). Klicka här för att se en större version av denna figur.

Figure 3
Bild 3: Sidomeny till höger på GlyConnect-sidan för PSA. Klickbara korsreferenser till andra större databaser och visa med LiteMol glykan-plugin av befintlig 3D-struktur i PDB. Klicka här för att se en större version av denna figur.

Figure 4
Figur 4: Utgången frånGlyConnect Octopus som visar vävnadsberoende föreningar mellan proteiner och glykaner. Frågan Hybrid AND Sialylated har returnerat alla kompositioner som matchar dessa kriterier och varje komposition länkar samman den associerade informationen om proteiner och glykaner som registrerats i databasen. Observera att Species som standard är inställt på Homo sapiens men det här alternativet kan ändras. Här visar GlyConnect Octopus alla mänskliga proteiner (vänstra noder) som bär hybrid- och sialylerade glykanstrukturer (högra noder) med vävnaderna i vilka de uttrycks (mittnoder). (A) Föreningarna med urin markeras och visar två proteiner: choriogonadotropin (GLHA_HUMAN) och PSA common isoform (KLK3_HUMAN) kopplade till spridda (heterogena) glykanstrukturer. (B) Föreningarna med sädesvätska markeras och visar två proteinisoformer av PSA (KLK3_HUMAN) kopplade till grupperade (liknande) glykanstrukturer. Klicka här för att se en större version av denna figur.

Figure 5
Figur 5: Utgången från GlyConnect Compozitor som visar de överlagrade N-glykomerna från de två isoformerna av PSA. Kompositioner i kondenserad notation märker varje nod. Glykanerna associerade med den gemensamma isoformen representeras som blå noder och de med hög pI-isoform som röda noder. Överlappningen mellan glykomer visas som magenta noder. Siffror inuti noderna representerar antalet glykanstrukturer som matchar den märkta kompositionen enligt innehållet i GlyConnect-databasen angående PSA. Compozitor-diagrammet som visas har modifierats något från den råa utgången för att avlägsna nätverket som genereras av D3.js-biblioteket. Detta är lätt att göra eftersom vilken nod som helst kan dras i webbläsarens fönsterutrymme varhelst en användare önskar, och banorna kan därmed förkortas eller sträckas. Användaren kan skriva en specifik komposition i fältet Zooma på i det övre högra hörnet för att zooma in och centrera diagrammet på motsvarande nod. Klicka här för att se en större version av denna figur.

Figure 6
Figur 6: Sammanfattande post för humant galectin-8 med NeuAc(a2-3)Gal(b1-4)GlcNAc-bindningsdetaljer. Genom att klicka på den gröna knappen Visa 3D-struktur och information (indikerad med en röd ellips) öppnas en ny sida där en närbild på restinteraktioner visas med PLIP-applikationen (indikerad med en röd pil). Klicka här för att se en större version av denna figur.

Figure 7
Figur 7: Utdata från GlyConnect Compozitor som visar O-glykomet från det humana serumdatasetet med hög konfidens för HGI-utmaningen. Utan virtuella noder (se text) är anslutningen för det diagrammet låg. Klicka här för att se en större version av denna figur.

Figure 8
Figur 8: Utdata från GlyConnect Compozitor som visar möjligheten att slutföra O-glykomet från det humana serumdatasetet med hög konfidens för HGI-utmaningen, med hjälp av GlyConnect-databasinnehållet. Åtkomst till innehållet i hela GlyConnect-databasen med hjälp av fliken Compozitors anpassade visar att kompositioner som motsvarar de virtuella noderna mappas med befintliga definierade strukturer som markeras i nodetiketterna. Nodstorleken representerar antalet referenser som lagras i databasen och rapporterar motsvarande sammansättning. Den numeriska etiketten för noder anger antalet motsvarande strukturer som lagras i GlyConnect. Valda kompositioner verkar ha noll till arton möjliga matchningar i databasen. Faktum är att dessa noder bara är virtuella som en återspegling av innehållet i experimentella dataset. Vi rekommenderar att du förfinar informationen i diagrammet för att testa realismen hos dessa ytterligare noder. Klicka här för att se en större version av denna figur.

Kompletterande figur 1: Bubbeldiagram över Glyco@Expasy hemsida. Zooma in bubbeldiagrammet på Glyco@Expasy hemsida för att fokusera på glykoproteinkategorin . Programvara som visas i gröna bubblor och databaser i gula bubblor. Genom att klicka på en bubbla sammanfattas syftet med resursen. Klicka här för att ladda ner den här filen.

Kompletterande figur 2: Bläckfisk-hämtade associationer som matchar frågan beroende på sammansättning. Standard GlyConnect Octopus visning av humana proteiner (vänstra noder) som bär hybrid- och sialylerade glykanstrukturer (högra noder) med matchande kompositioner (mittnoder). Sammansättning H6N4F12S1 verkar unik för båda PSA-isoformerna (KLK3_HUMAN). Genom att klicka på det unika struktur-ID (10996) öppnas motsvarande sida med detaljer som visar att de två isoformerna verkligen är de enda proteinerna som bär just denna glykan. Klicka här för att ladda ner den här filen.

Kompletterande figur 3: Bläckfisk-hämtade föreningar som matchar frågan beroende på sjukdomen. GlyConnect Octopus visning av alla humana proteiner (vänstra noder) som bär hybrid- och sialylerade glykanstrukturer (högra noder) med de sjukdomar där de uttrycks (mittnoder). Föreningarna med prostatacancer lyfts fram som visar den gemensamma isoformen av PSA (KLK3_HUMAN). Klicka här för att ladda ner den här filen.

Kompletterande figur 4: Bläckfisk-hämtade föreningar som matchar frågan beroende på vävnadsinformation. GlyConnect Octopus-visning av alla mänskliga proteiner (vänstra noder) som bär bi-antenner glykanstrukturer, inklusive NeuAc (a1-3) Gal (b1-4) GlcNAc-motiv (högra noder) med vävnaderna i vilka de uttrycks (mittnoder). Föreningarna med sädesvätska markeras och visar endast den gemensamma isoformen av PSA (KLK3_HUMAN) och sju strukturer. Klicka här för att ladda ner den här filen.

Kompletterande figur 5: Utdata från GlyConnect Compozitor som visar de överlagrade N-glykomerna för de två isoformerna av PSA. Kompositioner i kondenserad notation märker varje nod. Glykanerna associerade med den gemensamma isoformen representeras som blå noder och de med hög pI-isoform som röda noder. Överlappningen mellan glykomer visas som magenta noder. Siffror inuti noderna representerar antalet glykanstrukturer som matchar den märkta kompositionen enligt innehållet i GlyConnect-databasen angående PSA. Mousing över stapeldiagrammet över glykanegenskaper visar korrespondensen mellan frekvensen och noderna som orange bubblor. Nästan alla PSA-vanliga isoformnoder är täckta. Denna frekvens sjunker i isoformen med hög pI. Klicka här för att ladda ner den här filen.

Kompletterande figur 6: Glykansökgränssnitt i UniLectin3D. Genom att klicka på SNFG-symbolen för sialinsyra (inrind i rött) startas sökningen efter alla ligander som innehåller NeuAc, lagrade i UniLectin3D. Klicka här för att ladda ner den här filen.

Kompletterande figur 7: Utdrag ur resultatet av sökningen efter alla ligander som innehåller NeuAc. NeuAc(a2-3)Gal(b1-4)GlcNAc-motivet av intresse är inringat i rött. Klicka här för att ladda ner den här filen.

Kompletterande figur 8: Utdata från GlyConnect Compozitor som visar O-glykomet i HGI-datasetet överlagrat med det i GlyConnect. Utgången från GlyConnect Compozitor som visar O-glykomet från det humana serumdatasetet med hög konfidens av HGI-utmaningen i blått överlagrat med O-glykomet av ett O-glykosylerat protein av de 37 som anges med referensen, dvs inter-alfa-trypsinhämmare tung kedja H4 med ytterligare information i GlyConnect. Detta förbättrar grafens anslutning. Klicka här för att ladda ner den här filen.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

GlyConnect Octopus som ett verktyg för att avslöja oväntade korrelationer
GlyConnect Octopus var ursprungligen utformad för att fråga databasen med en lös definition av glykaner. Faktum är att litteraturen ofta rapporterar de viktigaste egenskaperna hos glykaner i ett glykom, såsom att fukosyleras eller sialyleras, vara gjorda av två eller flera antenner etc. Dessutom klassificeras glykaner oavsett om de är N- eller O-länkade i kärnor, som beskrivs i referenshandboken Essentials of Glycobiology1, som också ofta citeras i publicerade artiklar. Slutligen är glykanepitetoper som blodgruppsantigener ännu en egenskap som söks i strukturer och potentiellt utpekas för att skriva en glykan. I slutändan kan det vara relevant att söka efter gemensamma eller distinkta egenskaper hos ett glykom uttryckt i en specifik vävnad eller utvald art. I den meningen bör den insamlade informationen användas som en källa till nya antaganden i motsats till unika fakta.

GlyConnect Compozitor som ett verktyg för att forma en glykankompositionssats
Att bläddra i strukturell information som beskrivs på en proteinsida har begränsningar eftersom listor tenderar att dölja relationerna mellan specificerade strukturer såväl som de mellan kompositioner. GlyConnect Octopus tar hand om den förra och GlyConnect Compozitor till den senare. En noggrann titt på strukturer som listas i de flesta GlyConnect-poster avslöjar förekomsten av gemensamma understrukturer. Ändå är denna information inte lätt att förstå visuellt utan hjälp av en dedikerad tittare.

Innehållet i glykankompositionsfilen som stöder identifieringen av glykandelen som en nyckelparameter för glykopeptididentifieringsprogramvara fastställdes genom att analysera resultaten av HGI-utmaningen. De flesta klassiska proteomiksökmotorer rymmer valet av glykobaserade modifieringar från en samling som härrör från data som samlats in i databaser / förvar eller litteraturen. Andra glykopoteomik dedikerade verktyg använder kunskapen om glykanbiosyntes. På detta sätt definieras kompositionsfilen teoretiskt som ett resultat av förväntad enzymatisk aktivitet. I slutändan finns det lika många kompositionsfiler som det finns sökmotorer och överlappningen mellan dem är mycket varierande. Att lära av tidigare erfarenheter inom proteomik, särskilt när posttranslationella modifieringar redovisas, visar dock att sökmotorernas prestanda är korrelerad med att begränsa sökutrymmet31. Liknande observationer görs i glykoproteomik och GlyConnect Compozitor utformades för att stödja val av utbildade kompositionsdata, vars betydelse tidigare diskuterats32.

Användningen av detta verktyg illustrerades ofullständigt i protokollet, särskilt när det gäller fliken Avancerat där frågor som direkt startar programmatisk åtkomst till GlyConnect via dess API (Application Programming Interface) kan uttryckas. Att till exempel skriva taxonomy=homo sapiens&glycanType=N-linked&tissue=urine&disease=prostate cancer i frågefönstret på fliken Avancerat motsvarar att fylla i motsvarande fält på fliken Källa (välja Homo sapiens i Species, Urine in Tissue och N-linked in Glycan Type) och fliken Disease (välja Homo sapiens in Species, Prostatacancer vid sjukdom och N-bunden i glykantyp). Med andra ord ger det i ett steg ett resultat som skulle kräva flera val.

Slutligen, medan skapandet av virtuella noder förklaras i protokollet, behöver deras potentiella redundans en ytterligare kommentar. Två samtidiga alternativ kan vara oskiljbara eftersom den simulerade verkan av enzymer i diagrammet inte tar hänsyn till kronologin för enzymaktiviteter. Det är därför Compozitor föreslår två vägar genom två virtuella noder för att överbrygga två oanslutna noder som motsvarar monosackaridantal med upp till två skillnader. Införandet av nya data ger ofta saknade länkar. Användaren kan alltid överväga eller avvisa virtuella noder genom att (av)markera rutan Inkludera virtuella noder .

Kända databaser och programvarubegränsningar
Sammantaget, som med all navigering på webben, leder protokollen som beskrivs ovan ibland till en obefintlig sida, ofta på grund av en uppdatering av en webbplats eller en konflikt med uppdateringar mellan två webbplatser. I det här fallet och i själva verket alla fall där navigeringen inte flyter, är det enklaste att skicka en anteckning till Expasy helpdesk vars effektivitet avsevärt har bidragit till portalens framgång under de senaste 28 åren.

Innehållet i GlyConnect är partiskt som en återspegling av de nuvarande obalanserna i litteraturen. Majoriteten av publikationerna rapporterar N-glykosylering hos däggdjur och databasen är rikare på humana N-glykoproteiner. Ändå har vi tidigare blivit ombedda att inkludera mindre vanliga dataset och att vara helt öppna för att få råd och förslag.

Dessutom är Compozitor för närvarande begränsad till jämförelse av tre kompositionsdataset. En större revidering av underfliken Determinant i bläckfisken planeras. Resurser av Glyco@Expasy behöver regelbundna uppdateringar och vissa kanske inte genomförs i sinom tid. Ändå publiceras varningar och/eller tillkännagivanden när det händer.

Partnerportaler, som kallas GlyGen (https://www.glygen.org) och GlyCosmos (https://www.glycosmos.org), erbjuder olika alternativ och verktyg. I slutändan innebär surfning och sökning av information om något av alternativen en hög subjektivitet och beror till stor del på användarnas vanor och bekymmer. Vi kan bara hoppas att vår lösning passar en del av samhället.

Insatsen av glykovetenskap växer i life science-projekt och studier som fastställer glykanernas roll i hälsofrågor produceras kontinuerligt. Den senaste tidens fokus på Sars-Cov-2 avslöjade ännu en gång vikten av glykosylerade proteiner, särskilt i strukturella tillvägagångssätt33. Glycoinformatics stöder glykoforskare i dagliga uppgifter för dataanalys och tolkning.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Författarna förklarar inga intressekonflikter.

Acknowledgments

Författaren erkänner varmt tidigare och nuvarande medlemmar i Proteome Informatics Group som är involverade i att utveckla de resurser som används i denna handledning, särskilt Julien Mariethoz och Catherine Hayes för GlyConnect, François Bonnardel för UniLectin, Davide Alocci och Frederic Nikitin för bläckfisken och Thibault Robin för Compozitor och sista handen på bläckfisken.

Utvecklingen av glyco@Expasy-projektet stöds av den schweiziska federala regeringen genom statssekretariatet för utbildning, forskning och innovation (SERI) och kompletteras för närvarande av Swiss National Science Foundation (SNSF: 31003A_179249). ExPASy underhålls av Swiss Institute of Bioinformatics och är värd på Vital-IT Competency Center. Författaren erkänner också Anne Imberty för enastående samarbete på UniLectin-plattformen som gemensamt stöds av ANR PIA Glyco@Alps (ANR-15-IDEX-02), Alliance Campus Rhodanien Co-funds (http://campusrhodanien.unige-cofunds.ch) Labex Arcane/CBH-EUR-GS (ANR-17-EURE-0003).

Materials

Name Company Catalog Number Comments
internet connection user's choice
recent version of web browser user's choice

DOWNLOAD MATERIALS LIST

References

  1. Spring Harbor Laboratory Press. Essentials of Glycobiology. , Spring Harbor Laboratory Press. Cold Spring Harbor (NY). (2015).
  2. Gray, C. J., et al. Advancing solutions to the carbohydrate sequencing challenge. Journal of the American Chemical Society. 141 (37), 14463-14479 (2019).
  3. Tsuchiya, S., Yamada, I., Aoki-Kinoshita, K. F. GlycanFormatConverter: a conversion tool for translating the complexities of glycans. Bioinformatics. 35 (14), 2434-2440 (2018).
  4. Fujita, A., et al. The international glycan repository GlyTouCan version 3.0. Nucleic Acids Research. 49, 1529-1533 (2021).
  5. Alocci, D., et al. GlyConnect: glycoproteomics goes visual, interactive, and analytical. Journal of Proteome Research. 18 (2), 664-677 (2019).
  6. York, W. S., et al. GlyGen: computational and informatics resources for glycoscience. Glycobiology. 30 (2), 72-73 (2020).
  7. Watanabe, Y., Aoki-Kinoshita, K. F., Ishihama, Y., Okuda, S. GlycoPOST realizes FAIR principles for glycomics mass spectrometry data. Nucleic Acids Research. 49, 1523-1528 (2020).
  8. Campbell, M. P., Aoki-Kinoshita, K. F., Lisacek, F., York, W. S., Packer, N. H. Glycoinformatics. Essentials of Glycobiology. , (2015).
  9. Cao, W., et al. Recent advances in software tools for more generic and precise intact glycopeptide analysis. Molecular & Cellular Proteomics. 20, 100060 (2021).
  10. Mariethoz, J., Hayes, C., Lisacek, F. Glycan compositions with Compozitor to enhance glycopeptide identification. Proteomics Data Analysis. 2361, 109-127 (2021).
  11. Kawahara, R., et al. Communityevaluation of glycoproteomics informatics solutions reveals high-performance search strategies of serum glycopeptide analysis. Nature Methods. 18, 1304-1316 (2021).
  12. Lisacek, F., Aoki-Kinoshita, K. F., Vora, J. K., Mazumder, R., Tiemeyer, M. Glycoinformatics resources integrated through the GlySpace Alliance. Comprehensive Glycoscience. 1, 507-521 (2021).
  13. Mariethoz, J., et al. Glycomics@ExPASy: bridging the gap. Molecular & Cellular Proteomics. 17 (11), 2164-2176 (2018).
  14. Duvaud, S., et al. Expasy, the swiss bioinformatics resource portal, as designed by its users. Nucleic Acids Research. 49, 216-227 (2021).
  15. The UniProt Consortium et al. UniProt: the universal protein knowledgebase in 2021. Nucleic Acids Research. 49, 480-489 (2021).
  16. Bonnardel, F., Perez, S., Lisacek, F., Imberty, A. Structural database for lectins and the UniLectin web platform. Lectin Purification and Analysis. 2132, 1-14 (2020).
  17. Neelamegham, S., et al. Updates to the symbol nomenclature for glycans guidelines. Glycobiology. 29 (9), 620-624 (2019).
  18. Sharon, N. IUPAC-IUB Joint Commission on Biochemical Nomenclature (JCBN). Nomenclature of glycoproteins, glycopeptides and peptidoglycans: JCBN recommendations 1985. Glycoconjugate Journal. 3 (2), 123-133 (1986).
  19. Harvey, D. J., et al. Proposal for a standard system for drawing structural diagrams of N- and O-linked carbohydrates and related compounds. Proteomics. 9 (15), 3796-3801 (2009).
  20. Song, E., Mayampurath, A., Yu, C. -Y., Tang, H., Mechref, Y. Glycoproteomics: identifying the glycosylation of prostate specific antigen at normal and high isoelectric points by LC-MS/MS. Journal of Proteome Research. 13 (12), 5570-5580 (2014).
  21. Moran, A. B., et al. Profiling the proteoforms of urinary prostate-specific antigen by capillary electrophoresis - mass spectrometry. Journal of Proteomics. 238, 104148 (2021).
  22. Wang, W., et al. High-throughput glycopeptide profiling of prostate-specific antigen from seminal plasma by MALDI-MS. Talanta. 222, 121495 (2021).
  23. wwPDB consortium metal. Protein Data Bank: the single global archive for 3D macromolecular structure data. Nucleic Acids Research. 47, 520-528 (2019).
  24. Sehnal, D., Grant, O. C. Rapidly display glycan symbols in 3D structures: 3D-SNFG in LiteMol. Journal of Proteome Research. 18 (2), 770-774 (2019).
  25. Bonnardel, F., et al. UniLectin3D, a database of carbohydrate binding proteins with curated information on 3D structures and interacting ligands. Nucleic Acids Research. 47, 1236-1244 (2019).
  26. Sehnal, D., et al. LiteMol suite: interactive web-based visualization of large-scale macromolecular structure data. Nature Methods. 14 (12), 1121-1122 (2017).
  27. Salentin, S., Schreiber, S., Haupt, V. J., Adasme, M. F., Schroeder, M. PLIP: fully automated protein-ligand interaction profiler. Nucleic Acids Research. 43, 443-447 (2015).
  28. Robin, T., Mariethoz, J., Lisacek, F. Examining and fine-tuning the selection of glycan compositions with GlyConnect Compozitor. Molecular & Cellular Proteomics. 19 (10), 1602-1618 (2020).
  29. Compagno, D., et al. Glycans and galectins in prostate cancer biology, angiogenesis and metastasis. Glycobiology. 24 (10), 899-906 (2014).
  30. Gentilini, L. D., et al. Stable and high expression of Galectin-8 tightly controls metastatic progression of prostate cancer. Oncotarget. 8 (27), 44654-44668 (2017).
  31. Schwämmle, V., Verano-Braga, T., Roepstorff, P. Computational and statistical methods for high-throughput analysis of post-translational modifications of proteins. Journal of Proteomics. 129, 3-15 (2015).
  32. Khatri, K., Klein, J. A., Zaia, J. Use of an informed search space maximizes confidence of site-specific assignment of glycoprotein glycosylation. Analytical and Bioanalytical Chemistry. 409 (2), 607-618 (2017).
  33. Sztain, T., et al. A glycan gate controls opening of the SARS-CoV-2 spike protein. Nature Chemistry. 13, 963-968 (2021).

Tags

Biologi utgåva 179
Bioinformatikresurser för studier av glykanmedierade proteininteraktioner
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Lisacek, F. Bioinformatics Resources More

Lisacek, F. Bioinformatics Resources for the Study of Glycan-Mediated Protein Interactions. J. Vis. Exp. (179), e63356, doi:10.3791/63356 (2022).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter