Waiting
Elaborazione accesso...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

Risorse bioinformatiche per lo studio delle interazioni proteiche glicano-mediate

Published: January 20, 2022 doi: 10.3791/63356

Summary

Questo protocollo illustra come esplorare, confrontare e interpretare i glicomi proteici umani con risorse online.

Abstract

L'iniziativa Glyco@Expasy è stata lanciata come una raccolta di database e strumenti interdipendenti che coprono diversi aspetti della conoscenza della glicobiologia. In particolare, mira a evidenziare le interazioni tra glicoproteine (come i recettori della superficie cellulare) e proteine leganti i carboidrati mediate dai glicani. Qui, le principali risorse della collezione sono introdotte attraverso due esempi illustrativi centrati sull'N-glicoma dell'antigene prostatico specifico umano (PSA) e sull'O-glicoma delle proteine sieriche umane. Attraverso diverse query di database e con l'aiuto di strumenti di visualizzazione, questo articolo mostra come esplorare e confrontare il contenuto in un continuum per raccogliere e correlare informazioni altrimenti sparse. I dati raccolti sono destinati ad alimentare scenari più elaborati della funzione glicanica. La glicoinformatica qui introdotta è, quindi, proposta come mezzo per rafforzare, modellare o confutare le ipotesi sulla specificità di un glicoma proteico in un determinato contesto.

Introduction

I glicani, le proteine a cui sono attaccati (glicoproteine) e le proteine a cui si legano (lectine o proteine leganti i carboidrati) sono i principali attori molecolari sulla superficie cellulare1. Nonostante questo ruolo centrale nella comunicazione cellula-cellula, gli studi su larga scala, compresi i dati glicemici, glicoproteomici o glicano-interamici sono ancora scarsi rispetto alla loro controparte in genomica e proteomica.

Fino a poco tempo fa, non erano stati sviluppati metodi per caratterizzare le strutture ramificate dei carboidrati complessi mentre erano ancora coniugati alla proteina vettore. La biosintesi delle glicoproteine è un processo non-template-driven in cui i donatori di monosaccaridi, i substrati glicoproteici accettanti e le glicosiltransferasi e le glicosidasi svolgono un ruolo interattivo. Le glicoproteine risultanti possono portare strutture complesse con più punti di ramificazione in cui ogni componente monosaccaride può essere uno dei diversi tipi presenti in natura1. Il processo non basato su modelli impone l'analisi biochimica come unica opzione per generare dati strutturali oligosaccaridi. Il processo analitico delle strutture glicaniche associate a una proteina nativa è spesso impegnativo in quanto richiede tecnologie sensibili, quantitative e robuste per determinare la composizione dei monosaccaridi, i collegamenti e le sequenze ramificate2.

In questo contesto, la spettrometria di massa (MS) è la tecnica più utilizzata negli esperimenti di glicomica e glicoproteomica. Con il passare del tempo, questi vengono eseguiti in impostazioni di throughput più elevate e i dati si accumulano ora nei database. Le strutture glicaniche in vari formati3, popolano GlyTouCan4, il repository universale di dati sul glicano in cui ogni struttura è associata a un identificatore stabile indipendentemente dal livello di precisione con cui il glicano è definito (ad esempio, possibile tipo di collegamento mancante o composizione ambigua). Vengono raccolte strutture molto simili, ma le loro piccole differenze sono chiaramente riportate. Le glicoproteine sono descritte e curate in GlyConnect5 e GlyGen6, due database che si incrociano a vicenda. I dati sulla SM a supporto di elementi strutturali di prova sono sempre più memorizzati in GlycoPOST7. Per una più ampia copertura delle risorse online, il capitolo 52 del manuale di riferimento, Essentials of Glycobiology, è dedicato alla glicoinformatica8. È interessante notare che il software di identificazione dei glicopeptidi è proliferato negli ultimi anni9,10 anche se non a vantaggio della riproducibilità. Quest'ultima preoccupazione ha spinto i leader della HUPO GlycoProteomics Initiative (HGI) a lanciare una sfida software nel 2019. I dati ms ottenuti dall'elaborazione di miscele complesse di proteine sieriche umane N- e O-glicosilate in modalità di frammentazione CID, ETD ed EThcD, sono stati messi a disposizione dei concorrenti, siano essi utenti di software o sviluppatori. Il rapporto completo sui risultati di questa sfida11 è solo delineato qui. Per cominciare, è stata osservata una diffusione di identificazioni. È stato principalmente interpretato come causato dalla diversità dei metodi implementati nei motori di ricerca, delle loro impostazioni e del modo in cui gli output sono stati filtrati e il peptide "contato". Il progetto sperimentale potrebbe anche aver messo alcuni software e approcci a un (dis)vantaggio. È importante sottolineare che i partecipanti che utilizzano lo stesso software hanno riportato risultati incoerenti, evidenziando così gravi problemi di riproducibilità. Si è concluso confrontando diversi contributi che alcune soluzioni software funzionano meglio di altre e alcune strategie di ricerca producono risultati migliori. È probabile che questo feedback guidi il miglioramento dei metodi automatizzati di analisi dei dati sui glicopeptidi e, a sua volta, avrà un impatto sul contenuto del database.

L'espansione della glicoinformatica ha portato alla creazione di portali web che forniscono informazioni e accesso a più risorse simili o complementari. I più recenti e aggiornati sono descritti in un capitolo della serie di libri Comprehensive Glycoscience12 e attraverso la cooperazione, una soluzione per la condivisione dei dati e lo scambio di informazioni è offerta in una modalità di accesso aperto. Uno di questi portali è stato sviluppato che è stato originariamente chiamato Glycomics@ExPASy 13 e ribattezzato Glyco@Expasy, a seguito della grande revisione della piattaforma Expasy14 che ha ospitato una vasta collezione di strumenti e database utilizzati in diversi -omics per decenni, l'elemento più popolare è UniProt15-la knowledge base proteica universale. Glyco@Expasy offre una scoperta didattica dello scopo e dell'utilizzo di database e strumenti, basata su una categorizzazione visiva e una visualizzazione delle loro interdipendenze. Il seguente protocollo illustra le procedure per esplorare i dati glicemici e glicoproteomici con una selezione di risorse da questo portale che rende esplicita la connessione tra glicoproteomica e glicano-interamitomica tramite glicomico. Così com'è, gli esperimenti glicemici producono strutture in cui i monosaccaridi sono completamente definiti e i collegamenti parzialmente o completamente determinati, ma il loro attaccamento al sito proteico è scarsamente, se non del tutto, caratterizzato. Al contrario, gli esperimenti di glicoproteomica generano informazioni precise sull'attaccamento al sito ma con una scarsa risoluzione delle strutture glicaniche, spesso limitata alle composizioni monosaccaridiche. Queste informazioni sono raggruppate nel database GlyConnect. Inoltre, gli strumenti di ricerca in GlyConnect possono essere utilizzati per rilevare potenziali ligandi glicani che sono descritti insieme alle proteine che li riconoscono in UniLectin16, collegato a GlyConnect tramite glicani. Il protocollo qui presentato è diviso in due sezioni per coprire domande specifiche per glicani e glicoproteine legati a N e O.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

NOTA: è necessario un dispositivo con una connessione Internet (schermo più grande preferito) e un browser Web aggiornato come Chrome o Firefox. L'utilizzo di Safari o Edge potrebbe non essere altrettanto affidabile.

1. Da una proteina N-glicoma in GlyConnect a una lectina di UniLectin

  1. Accesso alle risorse da Glyco@Expasy
    NOTA: La procedura qui descritta è quella di accedere a GlyConnect ma può essere applicata all'accesso a qualsiasi risorsa registrata nella piattaforma.
    1. Vai a https://glycoproteome.expasy.org/glycomics-expasy e considera il grafico a bolle a destra che mostra diverse categorie come Glycoconjugates o Glycan Binding. Nel menu più a sinistra che riflette le categorie nelle bolle, seleziona la casella Glicoproteine in modo che il grafico a bolle a destra ingrandisca immediatamente la bolla corrispondente a quella categoria.
      NOTA: le bolle verdi sono strumenti e le bolle gialle sono database. Facendo clic su uno dei due si esegue nuovamente lo zoom avanti per fornire dettagli sulla risorsa. Prima di farlo, l'utente potrebbe voler comprendere le dipendenze di tale risorsa da altri.
    2. Per ottenere informazioni sulle dipendenze, passare dalla scheda Classificazione tematica delle risorse alla scheda Ruota delle dipendenze delle risorse . Posizionare il mouse su GlyConnect nella rotellina per verificarne il livello di integrazione con altre fonti (Figura 1).
    3. Torna alla scheda Classificazione tematica delle risorse per raggiungere la bolla GlyConnect come nel passaggio 1.1.1 e fai clic su di essa (Figura supplementare 1) per visualizzare la home page di GlyConnect in una nuova scheda che mostra le statistiche del contenuto nell'ultima versione del database.
      NOTA: una combinazione di colori dettagliata nella Tabella 1 corrisponde ai diversi tipi di informazioni memorizzate nel database. Questo codice colore è valido in tutte le pagine di entità in GlyConnect ed è coerente in tutto. La homepage mostra anche quattro sezioni dedicate a set di dati mirati come quelli che descrivono la glicosilazione della proteina spike Sars-Cov-2 (COVID-19) o che descrivono in dettaglio gli oligosaccaridi del latte umano (HMO). Questi non saranno esplorati in questo protocollo.
  2. Esplorare le informazioni contestuali di una proteina N-glicoma
    NOTA: tutte le strutture glicaniche in GlyConnect sono visualizzate in tre formati alternativi e comunemente usati: (1) Nomenclatura dei simboli per i glicani (SNFG)17 (2) IUPAC condensato18, e (3) Oxford19. Al contrario, non esiste una notazione standard per esprimere la composizione del glicano. In GlyConnect viene utilizzato il seguente codice: Hex per l'esoso, HexNAc per N-acetilesosamina, dHex per il fucoso e NeuAc per gli acidi sialici. Per semplicità, gli strumenti di visualizzazione si basano su una notazione condensata: H per l'esoso, N per N-acetilesosamina, F per il fucoso e S per gli acidi sialici. Inoltre, le lettere minuscole designano modifiche come "a" per l'acetilazione, "p" per la fosforilazione e "s" per la solfatazione, per il più frequente di questi cosiddetti sostituenti.
    1. Per visualizzare ed esplorare l'N-glicoma dell'antigene prostatico specifico umano (PSA), dalla homepage di GlyConnect, procedere come segue.
      NOTA: La glicosilazione del PSA umano è stata studiata nel corso degli anni, soprattutto nel contesto del cancro alla prostata. Il database GlyConnect memorizza tre riferimenti20,21,22, che combinano dati glicemici e glicoproteomici. Si noti che i risultati forniti qui sono stati ottenuti con la versione di settembre 2021 di GlyConnect. L'ulteriore utilizzo del database può produrre statistiche leggermente diverse a causa dei frequenti aggiornamenti dei dati.
    2. Selezionare il pulsante PROTEIN per aprire la vista proteina del database. Nella pagina di visualizzazione delle proteine, digitare prostata nella finestra di ricerca. Cercare le due voci elencate nell'output che distinguono due isoforme di PSA con valori pI distinti. Fare clic su 790 (colonna Id) corrispondente all'isoforma comune di PSA.
      NOTA: cercare la barra multicolore superiore che mostra le informazioni di riepilogo estratte dal lavoro pubblicato nello schema descritto sopra. Sono possibili diverse opzioni per la navigazione come descritto di seguito.
    3. Nella barra multicolore in alto, fare clic sul pulsante SOURCE in verde per visualizzare i tipi di campione da cui sono stati elaborati i dati pubblicati: Urina e Liquido seminale. Per sfogliare ulteriormente queste informazioni, fare clic su uno di questi tipi di esempio. Lo stesso vale per qualsiasi elemento che appare quando si fa clic su un pulsante colorato.
    4. Per controllare il contenuto relativo alla salute del database, fare clic sul pulsante MALATTIA , che contiene due elementi, uno dei quali è il cancro alla prostata che si collega alla corrispondente pagina dedicata alla malattia in GlyConnect. Il riassunto di quella pagina mostra che tre studi su larga scala hanno riportato 319 composizioni su 1.087 siti trovati in 308 proteine umane.
    5. Fare clic sul pulsante STRUTTURA per visualizzare l'elenco completo di 135 strutture associate a PSA dai dati glicemici. Fare clic sul pulsante COMPOSIZIONE per le 78 composizioni associate determinate da esperimenti di glicoproteomica. Clicca su qualsiasi struttura o composizione per ottenere ulteriori dettagli.
      NOTA: È possibile ottenere dettagli come l'elenco delle proteine alternative che trasportano la particolare struttura o l'elenco delle strutture corrispondenti alla composizione. PSA è noto per avere un solo sito di N-glicosilazione ad Asn-69 (solo un elemento conteggiato per il pulsante marrone SITE ).
    6. Per ridurre l'ambiguità delle composizioni, fare clic su SUGGEST STRUCT sotto una composizione selezionata (ad esempio, Hex:6 HexNAc:3 NeuAc:1). Un suggerimento viene fatto ogni volta che la conta dei monosaccaridi coincide con quella di una struttura sopra elencata (Figura 2).
      NOTA: La composizione Hex:6 HexNAc:3 NeuAc:1 generata da un esperimento di glicoproteomica è abbinata a quattro strutture a risoluzione più elevata dai dati glicemici. Nel caso del PSA, non vi è alcuna ambiguità del sito da risolvere poiché solo Asn-69 è glicosilato.
    7. Per esplorare completamente la pagina delle proteine, visualizzare ulteriori dettagli sul lato destro della pagina (Figura 3).
      1. Visualizza la voce predefinita 3QUM PDB (Protein Data Bank23) per PSA che viene mostrata con due glicani complessi attaccati a ciascun monomero (Figura 3) o la voce alternativa 2ZCK , che è disponibile anche a causa di un carboidrato collegato. La seconda voce mostra una singola catena.
        NOTA: Entrambe le voci sono visualizzate con il plugin 3D LiteMol24 che visualizza i glicani in notazione SNFG-3D adottata nel PDB-RCSB.
      2. Fare clic sui collegamenti corrispondenti di altri riferimenti incrociati per esplorare le informazioni funzionali rilevanti dai principali database di proteomica, come UniProt (Figura 3).
  3. Visualizzare e correlare le informazioni contestuali di una proteina N-glicoma
    NOTA: Come visto nella sezione precedente, lunghi elenchi di strutture o composizioni possono essere difficili da comprendere nel loro insieme e GlyConnect si basa su due diversi strumenti per visualizzare le informazioni chiave, vale a dire, GlyConnect Octopus e GlyConnect Compozitor (il primo espande le informazioni di riepilogo catturate in pulsanti colorati e il secondo fa emergere le dipendenze strutturali in termini di una struttura / composizione contenuta in un'altra). Come illustrato di seguito, GlyConnect Octopus esplora le associazioni tra le varie entità memorizzate nel database evidenziando connessioni multiple o singole come riflesso del contenuto del database.
    1. Eseguire una ricerca GlyConnect Octopus per confermare la presenza di tratti strutturali comuni come strutture del nucleo ibrido e strutture contenenti acido sialico altamente frequenti nella diversità dei glicani attaccati al PSA, come descritto di seguito.
    2. Vai alla homepage di Octopus https://glyconnect.expasy.org/octopus/. Mantenere selezionata la scheda collegata n per impostazione predefinita. Passare alla sottoscheda Core e fare clic sull'icona Ibrido . Passare alla sottoscheda Proprietà e fare clic sull'icona Sialylated . Fai clic sul pulsante verde Cerca qui sotto.
      NOTA: i risultati della ricerca vengono visualizzati graficamente come relazioni tra tre categorie di elementi. Per impostazione predefinita, l'elenco centrale corrisponde alla query per le composizioni, la raccolta di sinistra si estende sulle proteine correlate e quella di destra si estende sui glicani correlati.
    3. Nel grafico delle relazioni visualizzato, passare il puntatore del mouse su H6N4F1S1 per evidenziare i collegamenti a sei proteine e tre strutture. Confronta questo passando il mouse su H6N4F2S1 che individua le due isoforme di PSA (entrambe denominate UniProt ID: KLK3_HUMAN) e una struttura (ID: 10996). Passare il puntatore del mouse sull'ID della struttura per mostrare la sua rappresentazione SNFG e fare clic su di esso per aprire la pagina corrispondente (Figura supplementare 2).
    4. Cambia i nodi del polpo in qualsiasi altro argomento che descriva il contesto della glicosilazione. Il codice colore rimane lo stesso descritto in precedenza (vedere Tabella 1).
      1. Modificare i nodi centrali in Tessuti per visualizzare 15 opzioni al centro del grafico, molte delle quali sono fluidi corporei. Cerca tutte le associazioni tra proteine e glicani che corrispondono alla query a seconda delle informazioni sui tessuti. Posizionare il cursore su Urina o Liquido seminale al centro del grafico per visualizzare diverse associazioni (Figura 4A,B).
      2. Cambia i nodi centrali in Malattia per visualizzare 13 opzioni, una delle quali è il cancro alla prostata. L'unica proteina associata è il PSA (KLK3_HUMAN) (Figura supplementare 3).
        NOTA: Uno sguardo più da vicino al PSA N-glicoma mostrato nella pagina delle proteine individua l'altissima frequenza di un NeuAc terminale (a?-?) Gal(b?-?) Sottostruttura GlcNAc in molti casi su strutture con due o tre antenne. Un altro polpo può essere generato su questa base come descritto di seguito.
    5. Fare clic sul pulsante Cancella per aggiornare la ricerca. Passare alla sottoscheda Proprietà e fare clic sull'icona Bi-antennary . Passare alla sottoscheda Determinanti e fare clic sull'icona 3-Sialyl-LN (tipo 2 ). Fai clic sul pulsante verde Cerca qui sotto.
    6. Controllare le associazioni recuperate dal polpo con glicani bi-antennari contenenti un motivo terminale 3-Sialyl-LN (tipo 2), cioè NeuAc(a1-3)Gal(b1-4)GlcNAc. Cambia i nodi centrali in tessuti per una lettura più facile e passa il mouse su KLK3_HUMAN per collegare direttamente il liquido seminale con l'isoforma comune del PSA e sette strutture (Figura supplementare 4).
      NOTA: il secondo strumento di visualizzazione, GlyConnect Compozitor, esegue la scansione delle potenziali relazioni tra ogni composizione in un elenco di tali composizioni (vedere di seguito). Una relazione è definita come diversa da un solo monosaccaride tra due composizioni. Queste relazioni identificate tracciate in un grafico espongono la (dis)continuità di un glicoma.
    7. Utilizzare GlyConnect Compozitor per eseguire la scansione delle potenziali relazioni tra ogni composizione in un elenco di essi, come illustrato di seguito per il caso di PSA.
      NOTA: GlyConnect Compozitor elabora le composizioni in associazione con un contesto. Offre schede distinte per interrogare GlyConnect, ad esempio Proteine, Fonti, Linee cellulari, Malattie che sono autoesplicative per qualificare un contesto. Questo è illustrato qui con PSA come segue.
    8. Torna alla pagina delle proteine di PSA: https://glyconnect.expasy.org/browser/proteins/790. Sul lato destro della pagina di ingresso PSA, fare clic sul collegamento Compozitor. Assicurarsi che i campi di ricerca compozitor siano precompilati con i dettagli della voce Id 790 nella scheda Proteina (Proteina: antigene prostatico specifico, Specie: Homo sapiens e Tipo di glicano: N-linked).
    9. Fare clic sul pulsante Aggiungi alla selezione per recuperare i dati dal database e visualizzare il grafico delle composizioni collegate. Deselezionare l'opzione Includi nodi virtuali . Fare clic sul pulsante Calcola grafico per visualizzare un grafico che mostra un insieme ben collegato di 78 composizioni che rappresentano il PSA N-glicoma e un grafico a barre che mostra le principali caratteristiche dei glicani.
    10. Passa il mouse sopra la barra viola nel grafico a barre, che individua tutte le strutture sialylated nel grafico per rivelare una distorsione osservabile verso le strutture sialylated.
    11. Rimanere nella scheda Principale Proteina e selezionare Antigene prostatico specifico - isoforma Pi alta (psah) nel campo Proteina (nome).
      NOTA: i campi Glycan Type e Glycan Site vengono compilati automaticamente.
    12. Fare clic sul pulsante Aggiungi alla selezione per recuperare i dati dal database che ammontano a 57 composizioni. Fare clic sul pulsante Calcola grafico per generare i grafici sovrapposti di entrambe le isoforme e valutare le differenze nei glicomi delle due isoforme psa. Passare il puntatore del mouse sulle etichette dei nodi per richiedere la visualizzazione del numero di strutture corrispondenti alle composizioni/etichette (Figura 5).
  4. Informazioni sul legame con glicani in UniLectin
    NOTA: Ricordiamo il determinante testato nel polpo, descritto come NeuAc(a2-3)Gal(b1-4). Per definizione, è una parte legante stabilita di una struttura glicanica e, come tale, può essere ricercata nel database UniLectin3D25.
    1. Vai su https://www.unilectin.eu/ e fai clic sul pulsante UniLectin3D . In alternativa, vai direttamente alla pagina: https://www.unilectin.eu/unilectin3D/.Click sul pulsante Glycan Search per aprire questa pagina: https://www.unilectin.eu/unilectin3D/glycan_search (Figura supplementare 6).
    2. Fare clic sul diamante viola che rappresenta un acido sialico, che richiede la visualizzazione di tutti i motivi leganti il glicano che terminano con un acido sialico memorizzato nel database. La parte superiore di quella collezione di motivi contiene il motivo NeuAc(a2-3)Gal(b1-4)GlcNAc indagato in precedenza (Figura supplementare 7).
    3. Fare clic sul motivo NeuAc(a2-3)Gal(b1-4)GlcNAc per richiedere la visualizzazione di tutte le lectine per le quali è nota una struttura 3D che conferma l'interazione con NeuAc(a2-3)Gal(b1-4)GlcNAc. Il risultato per impostazione predefinita mostra le lectine in tutte le specie. Utilizzare l'opzione Cerca per campo per limitare la visualizzazione alle informazioni incentrate sull'uomo.
    4. Fare clic sull'opzione Cerca per campo . Nel campo delle specie , tipo Homo sapiens. Fare clic sul pulsante Esplora strutture a raggi X per filtrare l'elenco originale. Rimane solo una voce, cioè la galectina-8 umana. Fare clic sul pulsante Visualizza struttura e informazioni 3D nell'angolo in alto a destra dell'elemento elencato per visualizzare informazioni dettagliate sulla galectina-8 umana che interagisce con NeuAc(a2-3)Gal(b1-4)GlcNAc.
    5. Accedi alle informazioni strutturali sulla galectina-8 umana visualizzate sulla pagina con due diversi spettatori.
      1. Tenere premuto il mouse per ruotare la molecola e portare il ligando alla ribalta con il software Litemol26 integrato per mostrare la struttura 3D della lectina. Passa il mouse su una delle interazioni elencate a sinistra per aggiornare la vista a destra e individuare dove quella particolare interazione agisce nella struttura con il software PLIP27 integrato per dettagliare le interazioni atomiche tra la lectina e il ligando (Figura 6).
    6. Fare clic su qualsiasi pulsante verde che collega alle voci corrispondenti in UniProt, PDB (siti europei o americani) e GlyConnect per esplorare questi riferimenti incrociati.

2. Esplorare e confrontare gli O-glicomi in GlyConnect

  1. Esplorazione del set di dati ad alta affidabilità della sfida HGI
    NOTA: il set di dati HGI menzionato nell'introduzione è memorizzato nel database GlyConnect. Contiene 163 N- e 23 O-glicopeptidi trovati in 37 glicoproteine considerate come una lista ad alta confidenza. GlyConnect Compozitor28 è fondamentale per valutare la coerenza dei dati suglicomi. È importante sottolineare che Compozitor consente nodi virtuali (mostrati in grigio) quando è necessario un solo passaggio intermedio per connettere i nodi isolati. In questo modo, i nodi virtuali stringono il grafico e possono essere interpretati come strutture potenzialmente mancate nei risultati sperimentali.
    1. Sfoglia il set di dati HGI dalla homepage di GlyConnect andando direttamente alla pagina di riferimento dell'articolo: https://glyconnect.expasy.org/browser/references/2943.
      NOTA: Il riepilogo nei pulsanti colorati riflette parzialmente le cifre fornite nell'articolo. Tuttavia, se sono elencati solo 69 peptidi unici, ciò riflette molteplici associazioni tra peptidi e siti o strutture. Nell'articolo, un glicopeptide è definito come una combinazione unica di un peptide e una composizione. In GlyConnect, i glicositi vengono prima considerati e sono descritti come una combinazione di un peptide con strutture. Questo spiega la discrepanza nelle cifre tra GlyConnect e la citazione di cui sopra.
    2. Controllare l'alta frequenza di occorrenza di composizioni legate a N, come Hex:5 HexNAc:4 NeuAc:2, identificate su 42 siti in 43 peptidi rispetto alla frequente unicità della maggior parte delle composizioni O-linked identificate su 1 sito in 1 peptide.
    3. Fare clic sul collegamento Compozitor sul lato destro della pagina di immissione di riferimento per valutare la coerenza del set di dati. Assicurarsi che lo strumento Compozitor elabori direttamente il DOI del riferimento e riempia il campo di ricerca con reference=10.1101/2021.03.14.435332 nella scheda Avanzate dello strumento. Digitare &glycan_type=O-linked dopo il numero DOI per restringere la ricerca ai glicani legati all'O, in modo che la query diventi: riferimento=10.1101/2021.03.14.435332&glycan_
      type=O-linked
    4. Fare clic sul pulsante Aggiungi alla selezione per recuperare i dati dal database (ci sono 20 composizioni collegate a O). Mantenere selezionata l'opzione Includi nodi virtuali . Fare clic sul pulsante Calcola grafico per visualizzare il grafico delle composizioni collegate. Questo risultato evidenzia diverse lacune nella continuità attesa della biosintesi del glicano con nove nodi virtuali necessari per completare il grafico (Figura 7).
  2. Confronto con l'O-glicoma di una proteina sierica selezionata in GlyConnect
    NOTA: Per valutare se le lacune possono essere colmate dai dati memorizzati in GlyConnect, è stata selezionata una proteina O-glicosilata delle 37 elencate con il riferimento. Nel set di dati, l'inibitore dell'inter-alfa-tripsina H4 (Q14624) è segnalato per essere un O-glicosilato su Thr-725.
    1. Vai alla scheda Proteine di GlyConnect Compozitor (vedi passaggio 2.1.3). Dall'elenco delle proteine , selezionare Inter-alfa-tripsin inibitore della catena pesante H4. Assicurarsi che la selezione delle specie sia Homo sapiens per impostazione predefinita. Deselezionare N-linked nel tipo Glycan. Selezionare solo Thr-725 nell'elenco Sito facendo prima clic sul segno meno a sinistra di Sito per deselezionare tutti i siti, quindi selezionando solo Thr-725 dall'elenco.
    2. Fare clic sul pulsante Aggiungi alla selezione (si noti che sei composizioni sono associate a Thr-725). Fare clic sul pulsante Calcola grafico per visualizzare il grafico delle composizioni collegate (Figura supplementare 8).
    3. Osserva il grafico visualizzato, che mostra le 17 composizioni uniche delle 20 composizioni collegate o del set di dati dell'articolo in blu e le tre uniche su sei nel database in rosso. In altre parole, la sovrapposizione tra le due fonti è presente in tre composizioni che sono rappresentate in magenta. Si noti che una rotazione di 45° del grafico viene generata automaticamente.
      NOTA: il numero di nodi virtuali è ridotto di uno. A quanto pare, H2N2S1 mancante nelle 20 composizioni O-linked del set di dati dell'articolo e rappresentato come un nodo virtuale è ora riempito con una composizione aggiuntiva associata a Thr-725 della catena pesante H4 dell'inibitore dell'inter-alfa-tripsina nel database. Ciò semplifica la topologia del grafico perché altri due nodi virtuali vengono resi inutili poiché erano opzioni alternative per colmare il divario tra H1N2S1 e H2N2S2. Tuttavia, una seconda composizione importata dal database sarebbe isolata se non fosse per la creazione di due nuovi nodi virtuali alternativi H2N2F1S1 e H1N2F2S1.
    4. Per dare un senso ai nodi virtuali, verificare se le composizioni corrispondenti sono presenti in GlyConnect. Per fare ciò, fai clic sul pulsante Esporta sotto il grafico. Selezionare Solo virtuale deselezionando tutte le altre opzioni. Fare clic sull'icona degli appunti per copiare la selezione di 8 composizioni.
    5. Incollare la selezione nella finestra di query della scheda Personalizzata di Compozitor. Selezionare O-linked nel campo Tipo di glicano . Impostare l'etichetta di selezione nel campo Composizioni su, ad esempio, VN per denominare l'elenco di 8 composizioni. Fare clic sul pulsante Aggiungi alla selezione e quindi sul pulsante Calcola grafico . Tutti i nodi virtuali vengono ora visualizzati come nodi verdi (Figura 8).

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

La prima parte del protocollo (sezione 1) ha mostrato come indagare la specificità o la comunanza di N-glicani attaccati su Asn-69 dell'antigene prostatico specifico umano (PSA) utilizzando la piattaforma GlyConnect. Le variazioni dipendenti dai tessuti (urina e liquido seminale), così come le variazioni isoforme-dipendenti (normale e ad alto pI) nell'espressione del glicano, sono state enfatizzate utilizzando due strumenti di visualizzazione (Figura 4 e Figura 5).

In primo luogo, GlyConnect Octopus, che visualizza le associazioni tra le entità memorizzate nel database, ha fornito l'opportunità di esplorare le informazioni contestuali tramite (1) selezionando diverse entità da mostrare nel Octopus e (2) facendo clic sui collegamenti per esaminare le voci correlate. Il risultato sono state associazioni distintive a seconda del tessuto.

In secondo luogo, GlyConnect Compozitor, originariamente progettato per definire/perfezionare un file di composizione per l'identificazione dei glicopeptidi, è stato utilizzato per valutare l'espressione del glicano in due isoforme note del PSA (normale e pI elevato). Il confronto di ciascun glicome isoforme ha prodotto un grafico ben collegato che individua quattro nodi (composizioni), due dei quali sono caratteristici dell'isoforma ad alto pI. Anche se la sovrapposizione del glicoma è significativa, il grafico a barre delle proprietà del glicano ha mostrato un calo della sialilazione dall'isoforma comune a quella ad alto pI (Figura supplementare 5).

Inoltre, l'esplorazione di UniLectin3D individua la galectina-8 come possibile lettore del glicoma PSA poiché quest'ultimo contiene molte strutture con un epitopo terminale NeuAc(a2-3)Gal(b1-4)GlcNAc. Ciò fornisce un indizio da seguire e non può essere considerato come prova finale. Tuttavia, psa e galectine sono noti per svolgere un ruolo essenziale nel cancro alla prostata29 e il ruolo specifico della galectina-8 è stato recentemente evidenziato30. La prima parte del protocollo correla i dati strutturali (glicoproteomica) e funzionali (legame) per stabilire uno scenario probabile per le interazioni proteina-proteina mediate dai glicani.

Nella seconda parte del protocollo (sezione 2), è stato esaminato e confrontato con il contenuto del database GlyConnect un insieme di alta qualità di composizioni di O-glicano associate a un particolare tessuto (siero umano), offrendo così la possibilità di personalizzare un file di composizione di glicani per l'identificazione raffinata dei glicopeptidi (Figura 7 e Figura 8 ). Potrebbe fare affidamento sul set minimo di 20 composizioni disponibili da un set di dati (risultati della sfida HGI) o essere migliorato con 23-26 elementi raccolti razionalmente in GlyConnect per rafforzare la coerenza del set.

rosso arancione chiaro verde azzurro porpora rosa blu scuro marrone arancio scuro
specie proteina fonte tissutale struttura composizione malattia riferimento glicosite peptide

Tabella 1: Combinazione di colori associata a ciascuna entità del database GlyConnect e valida in tutto.

Figure 1
Figura 1: Ruota delle dipendenze di Glyco@Expasy creata un'istanza per GlyConnect. Fare clic qui per visualizzare una versione più grande di questa figura.

Figure 2
Figura 2: Struttura glicane suggerita per una composizione glicanica selezionata. Struttura glicane suggerita da un esperimento glicemico per una composizione glicanica di un esperimento glicoproteomico mirato alla stessa glicoproteina, qui antigene prostatico specifico umano (PSA), come proposto nella pagina GlyConnect per PSA (ID: 790). Fare clic qui per visualizzare una versione più grande di questa figura.

Figure 3
Figura 3: Menu laterale destro della pagina GlyConnect per PSA. Riferimenti incrociati cliccabili ad altri importanti database e visualizzazione con il plugin Glicano LiteMol della struttura 3D esistente nel PDB. Fare clic qui per visualizzare una versione più grande di questa figura.

Figure 4
Figura 4: L'output di GlyConnect Octopus che mostra associazioni tessuto-dipendenti tra proteine e glicani. La query Hybrid AND Sialylated ha restituito tutte le composizioni che corrispondono a questi criteri e ogni composizione collega insieme le informazioni associate su proteine e glicani come registrato nel database. Si noti che per impostazione predefinita Species è impostato su Homo sapiens ma questa opzione è modificabile. Qui, GlyConnect Octopus mostra tutte le proteine umane (nodi di sinistra) che trasportano strutture glicane ibride e siallate (nodi di destra) con i tessuti in cui sono espresse (nodi centrali). (A) Le associazioni con l'urina sono evidenziate mostrando due proteine: coriogonadotropina (GLHA_HUMAN) e ISOFORMA comune del PSA (KLK3_HUMAN) collegate a strutture glicane sparse (eterogenee). (B) Le associazioni con il liquido seminale sono evidenziate mostrando due isoforme proteiche di PSA (KLK3_HUMAN) collegate a strutture glicane raggruppate (simili). Fare clic qui per visualizzare una versione più grande di questa figura.

Figure 5
Figura 5: L'output di GlyConnect Compozitor che mostra gli N-glicomi sovrapposti delle due isoforme del PSA. Le composizioni in notazione condensata etichettano ogni nodo. I glicani associati all'isoforma comune sono rappresentati come nodi blu e quelli dell'isoforma ad alto pI come nodi rossi. La sovrapposizione tra glicomi è mostrata come nodi magenta. I numeri all'interno dei nodi rappresentano il numero di strutture glicaniche che corrispondono alla composizione etichettata in base al contenuto del database GlyConnect relativo al PSA. Il grafico Compozitor mostrato è stato leggermente modificato dall'output grezzo per districare la rete generata dalla libreria D3.js. Questo è facile da fare in quanto qualsiasi nodo può essere trascinato nello spazio della finestra del browser ovunque un utente desideri e i percorsi possono quindi essere abbreviati o allungati. L'utente può digitare una composizione specifica nel campo Zoom su nell'angolo in alto a destra per ingrandire e centrare il grafico sul nodo corrispondente. Fare clic qui per visualizzare una versione più grande di questa figura.

Figure 6
Figura 6: Inserimento sommario della galectina-8 umana con neuAc(a2-3)Gal(b1-4)GlcNAc binding details. Cliccando sul pulsante verde Visualizza struttura e informazioni 3D (indicato con un'ellisse rossa) si apre una nuova pagina in cui viene visualizzato un primo piano sulle interazioni dei residui con l'applicazione PLIP (indicata da una freccia rossa). Fare clic qui per visualizzare una versione più grande di questa figura.

Figure 7
Figura 7: L'output di GlyConnect Compozitor che mostra l'O-glicoma del set di dati ad alta confidenza del siero umano della sfida HGI. Senza nodi virtuali (vedi testo), la connettività di quel grafico è bassa. Fare clic qui per visualizzare una versione più grande di questa figura.

Figure 8
Figura 8: L'output di GlyConnect Compozitor che mostra la possibilità di completamento dell'O-glicoma del set di dati ad alta confidenza del siero umano della sfida HGI, utilizzando il contenuto del database GlyConnect. L'accesso al contenuto dell'intero database GlyConnect utilizzando la scheda Personalizzata di Compozitor rivela che le composizioni corrispondenti ai nodi virtuali sono mappate con strutture definite esistenti come evidenziato nelle etichette dei nodi. La dimensione del nodo rappresenta il numero di riferimenti memorizzati nel database e che riportano la composizione corrispondente. L'etichetta numerica dei nodi indica il numero di strutture corrispondenti memorizzate in GlyConnect. Le composizioni selezionate sembrano avere da zero a diciotto possibili corrispondenze nel database. In realtà, questi nodi sono solo virtuali come riflesso del contenuto dei set di dati sperimentali. Si consiglia di perfezionare le informazioni nel grafico per testare il realismo di questi nodi aggiuntivi. Fare clic qui per visualizzare una versione più grande di questa figura.

Figura 1 supplementare: Grafico a bolle della homepage Glyco@Expasy. Zoom nel grafico a bolle della homepage di Glyco@Expasy per concentrarsi sulla categoria delle glicoproteine . Software mostrato in bolle verdi e database in bolle gialle. Facendo clic su qualsiasi bolla si riepiloga lo scopo della risorsa. Fare clic qui per scaricare questo file.

Figura 2 supplementare: Associazioni recuperate dal polpo che corrispondono alla query in base alla composizione. Visualizzazione predefinita di GlyConnect Octopus di proteine umane (nodi di sinistra) che trasportano strutture glicane ibride e sialilate (nodi di destra) con composizioni corrispondenti (nodi centrali). La composizione H6N4F12S1 appare unica per entrambe le isoforme del PSA (KLK3_HUMAN). Cliccando sull'ID struttura univoca (10996) si apre la pagina corrispondente con i dettagli che mostrano che le due isoforme sono effettivamente le uniche proteine che trasportano questo particolare glicano. Fare clic qui per scaricare questo file.

Figura 3 supplementare: Associazioni recuperate dal polpo che corrispondono alla query a seconda della malattia. GlyConnect Octopus mostra di tutte le proteine umane (nodi di sinistra) portanti strutture glicani ibride e siallate (nodi di destra) con le malattie in cui sono espresse (nodi centrali). Le associazioni con il cancro alla prostata sono evidenziate mostrando l'isoforma comune del PSA (KLK3_HUMAN). Fare clic qui per scaricare questo file.

Figura 4 supplementare: Associazioni recuperate dal polpo che corrispondono alla query in base alle informazioni sui tessuti. GlyConnect Octopus mostra tutte le proteine umane (nodi di sinistra) che trasportano strutture glicani bi-antennarie, incluso il motivo NeuAc(a1-3)Gal(b1-4)GlcNAc (nodi di destra) con i tessuti in cui sono espressi (nodi centrali). Le associazioni con il liquido seminale sono evidenziate mostrando solo l'isoforma comune di PSA (KLK3_HUMAN) e sette strutture. Fare clic qui per scaricare questo file.

Figura supplementare 5: L'output di GlyConnect Compozitor che mostra gli N-glicomi sovrapposti delle due isoforme di PSA. Le composizioni in notazione condensata etichettano ogni nodo. I glicani associati all'isoforma comune sono rappresentati come nodi blu e quelli dell'isoforma ad alto pI come nodi rossi. La sovrapposizione tra glicomi è mostrata come nodi magenta. I numeri all'interno dei nodi rappresentano il numero di strutture glicaniche che corrispondono alla composizione etichettata in base al contenuto del database GlyConnect relativo al PSA. La rotazione sul grafico a barre delle proprietà glicani mostra la corrispondenza tra la frequenza e i nodi come bolle arancioni. Quasi tutti i nodi isoformi comuni del PSA sono coperti. Questa frequenza scende nell'isoforma ad alto pI. Fare clic qui per scaricare questo file.

Figura 6 supplementare: Interfaccia di ricerca glycan in UniLectin3D. Cliccando sul simbolo SNFG dell'acido sialico (cerchiato in rosso) si avvia la ricerca di tutti i ligandi che contengono NeuAc, memorizzati in UniLectin3D. Fare clic qui per scaricare questo file.

Figura supplementare 7: Estratto dell'output della ricerca di tutti i ligandi che contengono NeuAc. Il motivo di interesse NeuAc(a2-3)Gal(b1-4)GlcNAc è cerchiato in rosso. Fare clic qui per scaricare questo file.

Figura supplementare 8: L'output di GlyConnect Compozitor che mostra l'O-glicoma del set di dati HGI sovrapposto a quello in GlyConnect. L'output di GlyConnect Compozitor che mostra l'O-glicoma del set di dati ad alta confidenza del siero umano della sfida HGI in blu sovrapposto con l'O-glicoma di una proteina O-glicosilata su 37 elencate con il riferimento, cioè l'inter-alfa-tripsina inibitore della catena pesante H4 con ulteriori informazioni contenute in GlyConnect. Ciò migliora la connettività del grafico. Fare clic qui per scaricare questo file.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

GlyConnect Octopus come strumento per rivelare correlazioni inaspettate
GlyConnect Octopus è stato originariamente progettato per interrogare il database con una definizione libera di glicani. Infatti, la letteratura riporta spesso le principali caratteristiche dei glicani in un glicoma come essere fucosilati o sializzati, essere fatti di due o più antenne, ecc. Inoltre, i glicani, sia N- che O-linked, sono classificati in nuclei, come dettagliato nel manuale di riferimento Essentials of Glycobiology1, che sono anche spesso citati in articoli pubblicati. Infine, gli epitopi glicani come gli antigeni del gruppo sanguigno sono ancora un'altra proprietà ricercata nelle strutture e potenzialmente individuata per la tipizzazione di un glicano. Alla fine, può essere rilevante cercare caratteristiche comuni o distinte di un glicoma espresse in un tessuto specifico o in una specie selezionata. In questo senso, le informazioni raccolte dovrebbero essere utilizzate come fonte di nuove ipotesi anziché di fatti unici.

GlyConnect Compozitor come strumento per modellare un set di composizione glicanica
L'esplorazione delle informazioni strutturali come descritto in una pagina di proteine ha dei limiti perché gli elenchi tendono a oscurare le relazioni tra le strutture dettagliate e quelle tra le composizioni. GlyConnect Octopus si occupa del primo e GlyConnect Compozitor del secondo. Uno sguardo attento alle strutture elencate nella maggior parte delle voci di GlyConnect rivela l'esistenza di sottostrutture comuni. Eppure queste informazioni non sono facili da cogliere visivamente senza l'aiuto di uno spettatore dedicato.

Il contenuto del file di composizione del glicano che supporta l'identificazione della porzione di glicano come parametro chiave del software di identificazione dei glicopeptidi è stato stabilito analizzando i risultati della sfida HGI. La maggior parte dei motori di ricerca di proteomica classica accoglie la selezione di modifiche basate sulla glico da una raccolta che deriva dai dati raccolti in database / repository o nella letteratura. Altri strumenti dedicati alla glicoproteomica utilizzano la conoscenza della biosintesi dei glicani. In questo modo, il file di composizione è teoricamente definito come il risultato dell'attività enzimatica prevista. Alla fine, ci sono tanti file di composizione quanti sono i motori di ricerca e la sovrapposizione tra loro è altamente variabile. Tuttavia, imparare dall'esperienza passata in proteomica, specialmente quando si tiene conto delle modifiche post-traduzionali, rivela che le prestazioni dei motori di ricerca sono correlate alla limitazione dello spazio di ricerca31. Osservazioni simili sono fatte in glicoproteomica e GlyConnect Compozitor è stato progettato per supportare la selezione dei dati di composizione istruiti, la cui importanza è stata precedentemente discussa32.

L'utilizzo di questo strumento è stato illustrato in modo incompleto nel protocollo soprattutto per quanto riguarda la scheda Avanzate in cui possono essere espresse le query che avviano direttamente l'accesso programmatico a GlyConnect tramite la sua API (Application Programming Interface). Ad esempio, digitare taxonomy=homo sapiens&glycanType=N-linked&tissue=urine&disease=prostate cancer nella finestra di query della scheda Avanzate equivale a riempire i campi corrispondenti nella scheda Sorgente (selezionando Homo sapiens in Species, Urine in Tissue e N-linked in Glycan Type) e nella scheda Disease (selezionando Homo sapiens in Species, Cancro alla prostata nella malattia e N-legato nel tipo glicano). In altre parole, fornisce in un unico passaggio un risultato che richiederebbe diverse selezioni.

Infine, mentre la creazione di nodi virtuali è spiegata nel protocollo, la loro potenziale ridondanza richiede un commento aggiuntivo. Due opzioni simultanee possono essere indistinguibili perché l'azione simulata degli enzimi nel grafico non tiene conto della cronologia delle attività enzimatiche. Ecco perché Compozitor suggerisce due percorsi attraverso due nodi virtuali per collegare due nodi non connessi corrispondenti a conteggi monosaccaridi con un massimo di due differenze. L'inclusione di nuovi dati spesso fornisce collegamenti mancanti. L'utente è sempre libero di considerare o ignorare i nodi virtuali, (deselezionando) la casella Includi nodi virtuali .

Database noti e limitazioni software
Nel complesso, come per qualsiasi navigazione sul Web, i protocolli sopra descritti portano occasionalmente a una pagina inesistente, spesso a causa di un aggiornamento di un sito o di un conflitto di aggiornamenti tra due siti. In questo caso e, di fatto, in tutti i casi in cui la navigazione non scorre, il più semplice è inviare una nota all'helpdesk Expasy la cui efficienza ha contribuito in modo significativo al successo del portale negli ultimi 28 anni.

Il contenuto di GlyConnect è distorto come riflesso degli attuali squilibri in letteratura. La maggior parte delle pubblicazioni riporta N-glicosilazione nei mammiferi e il database è più ricco di N-glicoproteine umane. Tuttavia, in passato ci è stato chiesto di includere set di dati meno comuni e di rimanere completamente aperti a ricevere consigli e suggerimenti.

Inoltre, Compozitor è attualmente limitato al confronto di tre set di dati di composizione. È prevista un'importante revisione della sottoscheda Determinante nel polpo. Le risorse di Glyco@Expasy bisogno di aggiornamenti regolari e alcune potrebbero non essere effettuate a tempo debito; tuttavia, gli avvisi e/o gli annunci vengono pubblicati quando ciò accade.

I portali per i partner, noti come GlyGen (https://www.glygen.org) e GlyCosmos (https://www.glycosmos.org), offrono diverse opzioni e strumenti. In definitiva, la navigazione e la ricerca di informazioni su una delle opzioni comporta un alto livello di soggettività e dipende in gran parte dalle abitudini e dalle preoccupazioni degli utenti. Possiamo solo sperare che la nostra soluzione si adatti a una parte della comunità.

L'input della glicoscienza sta crescendo nei progetti di scienze della vita e gli studi che stabiliscono il ruolo dei glicani nei problemi di salute sono continuamente prodotti. Il recente focus su Sars-Cov-2 ha rivelato ancora una volta l'importanza delle proteine glicosilate, specialmente negli approcci strutturali33. Glycoinformatics supporta i glicoscienziati nelle attività quotidiane di analisi e interpretazione dei dati.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Gli autori non dichiarano conflitti di interesse.

Acknowledgments

L'autore riconosce calorosamente i membri passati e presenti del Proteome Informatics Group coinvolti nello sviluppo delle risorse utilizzate in questo tutorial, in particolare, Julien Mariethoz e Catherine Hayes per GlyConnect, François Bonnardel per UniLectin, Davide Alocci e Frederic Nikitin per Octopus e Thibault Robin per Compozitor e tocco finale su Octopus.

Lo sviluppo del progetto glyco@Expasy è sostenuto dalla Confederazione attraverso la Segreteria di Stato per la formazione, la ricerca e l'innovazione (SEFRI) ed è attualmente integrato dal Fondo nazionale svizzero per la ricerca scientifica (FNS: 31003A_179249). ExPASy è gestito dall'Istituto Svizzero di Bioinformatica e ospitato presso il Vital-IT Competency Center. L'autore riconosce anche Anne Imberty per l'eccezionale cooperazione sulla piattaforma UniLectin sostenuta congiuntamente da ANR PIA Glyco@Alps (ANR-15-IDEX-02), Alliance Campus Rhodanien Co-funds (http://campusrhodanien.unige-cofunds.ch) Labex Arcane/CBH-EUR-GS (ANR-17-EURE-0003).

Materials

Name Company Catalog Number Comments
internet connection user's choice
recent version of web browser user's choice

DOWNLOAD MATERIALS LIST

References

  1. Spring Harbor Laboratory Press. Essentials of Glycobiology. , Spring Harbor Laboratory Press. Cold Spring Harbor (NY). (2015).
  2. Gray, C. J., et al. Advancing solutions to the carbohydrate sequencing challenge. Journal of the American Chemical Society. 141 (37), 14463-14479 (2019).
  3. Tsuchiya, S., Yamada, I., Aoki-Kinoshita, K. F. GlycanFormatConverter: a conversion tool for translating the complexities of glycans. Bioinformatics. 35 (14), 2434-2440 (2018).
  4. Fujita, A., et al. The international glycan repository GlyTouCan version 3.0. Nucleic Acids Research. 49, 1529-1533 (2021).
  5. Alocci, D., et al. GlyConnect: glycoproteomics goes visual, interactive, and analytical. Journal of Proteome Research. 18 (2), 664-677 (2019).
  6. York, W. S., et al. GlyGen: computational and informatics resources for glycoscience. Glycobiology. 30 (2), 72-73 (2020).
  7. Watanabe, Y., Aoki-Kinoshita, K. F., Ishihama, Y., Okuda, S. GlycoPOST realizes FAIR principles for glycomics mass spectrometry data. Nucleic Acids Research. 49, 1523-1528 (2020).
  8. Campbell, M. P., Aoki-Kinoshita, K. F., Lisacek, F., York, W. S., Packer, N. H. Glycoinformatics. Essentials of Glycobiology. , (2015).
  9. Cao, W., et al. Recent advances in software tools for more generic and precise intact glycopeptide analysis. Molecular & Cellular Proteomics. 20, 100060 (2021).
  10. Mariethoz, J., Hayes, C., Lisacek, F. Glycan compositions with Compozitor to enhance glycopeptide identification. Proteomics Data Analysis. 2361, 109-127 (2021).
  11. Kawahara, R., et al. Communityevaluation of glycoproteomics informatics solutions reveals high-performance search strategies of serum glycopeptide analysis. Nature Methods. 18, 1304-1316 (2021).
  12. Lisacek, F., Aoki-Kinoshita, K. F., Vora, J. K., Mazumder, R., Tiemeyer, M. Glycoinformatics resources integrated through the GlySpace Alliance. Comprehensive Glycoscience. 1, 507-521 (2021).
  13. Mariethoz, J., et al. Glycomics@ExPASy: bridging the gap. Molecular & Cellular Proteomics. 17 (11), 2164-2176 (2018).
  14. Duvaud, S., et al. Expasy, the swiss bioinformatics resource portal, as designed by its users. Nucleic Acids Research. 49, 216-227 (2021).
  15. The UniProt Consortium et al. UniProt: the universal protein knowledgebase in 2021. Nucleic Acids Research. 49, 480-489 (2021).
  16. Bonnardel, F., Perez, S., Lisacek, F., Imberty, A. Structural database for lectins and the UniLectin web platform. Lectin Purification and Analysis. 2132, 1-14 (2020).
  17. Neelamegham, S., et al. Updates to the symbol nomenclature for glycans guidelines. Glycobiology. 29 (9), 620-624 (2019).
  18. Sharon, N. IUPAC-IUB Joint Commission on Biochemical Nomenclature (JCBN). Nomenclature of glycoproteins, glycopeptides and peptidoglycans: JCBN recommendations 1985. Glycoconjugate Journal. 3 (2), 123-133 (1986).
  19. Harvey, D. J., et al. Proposal for a standard system for drawing structural diagrams of N- and O-linked carbohydrates and related compounds. Proteomics. 9 (15), 3796-3801 (2009).
  20. Song, E., Mayampurath, A., Yu, C. -Y., Tang, H., Mechref, Y. Glycoproteomics: identifying the glycosylation of prostate specific antigen at normal and high isoelectric points by LC-MS/MS. Journal of Proteome Research. 13 (12), 5570-5580 (2014).
  21. Moran, A. B., et al. Profiling the proteoforms of urinary prostate-specific antigen by capillary electrophoresis - mass spectrometry. Journal of Proteomics. 238, 104148 (2021).
  22. Wang, W., et al. High-throughput glycopeptide profiling of prostate-specific antigen from seminal plasma by MALDI-MS. Talanta. 222, 121495 (2021).
  23. wwPDB consortium metal. Protein Data Bank: the single global archive for 3D macromolecular structure data. Nucleic Acids Research. 47, 520-528 (2019).
  24. Sehnal, D., Grant, O. C. Rapidly display glycan symbols in 3D structures: 3D-SNFG in LiteMol. Journal of Proteome Research. 18 (2), 770-774 (2019).
  25. Bonnardel, F., et al. UniLectin3D, a database of carbohydrate binding proteins with curated information on 3D structures and interacting ligands. Nucleic Acids Research. 47, 1236-1244 (2019).
  26. Sehnal, D., et al. LiteMol suite: interactive web-based visualization of large-scale macromolecular structure data. Nature Methods. 14 (12), 1121-1122 (2017).
  27. Salentin, S., Schreiber, S., Haupt, V. J., Adasme, M. F., Schroeder, M. PLIP: fully automated protein-ligand interaction profiler. Nucleic Acids Research. 43, 443-447 (2015).
  28. Robin, T., Mariethoz, J., Lisacek, F. Examining and fine-tuning the selection of glycan compositions with GlyConnect Compozitor. Molecular & Cellular Proteomics. 19 (10), 1602-1618 (2020).
  29. Compagno, D., et al. Glycans and galectins in prostate cancer biology, angiogenesis and metastasis. Glycobiology. 24 (10), 899-906 (2014).
  30. Gentilini, L. D., et al. Stable and high expression of Galectin-8 tightly controls metastatic progression of prostate cancer. Oncotarget. 8 (27), 44654-44668 (2017).
  31. Schwämmle, V., Verano-Braga, T., Roepstorff, P. Computational and statistical methods for high-throughput analysis of post-translational modifications of proteins. Journal of Proteomics. 129, 3-15 (2015).
  32. Khatri, K., Klein, J. A., Zaia, J. Use of an informed search space maximizes confidence of site-specific assignment of glycoprotein glycosylation. Analytical and Bioanalytical Chemistry. 409 (2), 607-618 (2017).
  33. Sztain, T., et al. A glycan gate controls opening of the SARS-CoV-2 spike protein. Nature Chemistry. 13, 963-968 (2021).

Tags

Biologia Numero 179
Risorse bioinformatiche per lo studio delle interazioni proteiche glicano-mediate
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Lisacek, F. Bioinformatics Resources More

Lisacek, F. Bioinformatics Resources for the Study of Glycan-Mediated Protein Interactions. J. Vis. Exp. (179), e63356, doi:10.3791/63356 (2022).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter