Summary

Risorse bioinformatiche per lo studio delle interazioni proteiche glicano-mediate

Published: January 20, 2022
doi:

Summary

Questo protocollo illustra come esplorare, confrontare e interpretare i glicomi proteici umani con risorse online.

Abstract

L’iniziativa Glyco@Expasy è stata lanciata come una raccolta di database e strumenti interdipendenti che coprono diversi aspetti della conoscenza della glicobiologia. In particolare, mira a evidenziare le interazioni tra glicoproteine (come i recettori della superficie cellulare) e proteine leganti i carboidrati mediate dai glicani. Qui, le principali risorse della collezione sono introdotte attraverso due esempi illustrativi centrati sull’N-glicoma dell’antigene prostatico specifico umano (PSA) e sull’O-glicoma delle proteine sieriche umane. Attraverso diverse query di database e con l’aiuto di strumenti di visualizzazione, questo articolo mostra come esplorare e confrontare il contenuto in un continuum per raccogliere e correlare informazioni altrimenti sparse. I dati raccolti sono destinati ad alimentare scenari più elaborati della funzione glicanica. La glicoinformatica qui introdotta è, quindi, proposta come mezzo per rafforzare, modellare o confutare le ipotesi sulla specificità di un glicoma proteico in un determinato contesto.

Introduction

I glicani, le proteine a cui sono attaccati (glicoproteine) e le proteine a cui si legano (lectine o proteine leganti i carboidrati) sono i principali attori molecolari sulla superficie cellulare1. Nonostante questo ruolo centrale nella comunicazione cellula-cellula, gli studi su larga scala, compresi i dati glicemici, glicoproteomici o glicano-interamici sono ancora scarsi rispetto alla loro controparte in genomica e proteomica.

Fino a poco tempo fa, non erano stati sviluppati metodi per caratterizzare le strutture ramificate dei carboidrati complessi mentre erano ancora coniugati alla proteina vettore. La biosintesi delle glicoproteine è un processo non-template-driven in cui i donatori di monosaccaridi, i substrati glicoproteici accettanti e le glicosiltransferasi e le glicosidasi svolgono un ruolo interattivo. Le glicoproteine risultanti possono portare strutture complesse con più punti di ramificazione in cui ogni componente monosaccaride può essere uno dei diversi tipi presenti in natura1. Il processo non basato su modelli impone l’analisi biochimica come unica opzione per generare dati strutturali oligosaccaridi. Il processo analitico delle strutture glicaniche associate a una proteina nativa è spesso impegnativo in quanto richiede tecnologie sensibili, quantitative e robuste per determinare la composizione dei monosaccaridi, i collegamenti e le sequenze ramificate2.

In questo contesto, la spettrometria di massa (MS) è la tecnica più utilizzata negli esperimenti di glicomica e glicoproteomica. Con il passare del tempo, questi vengono eseguiti in impostazioni di throughput più elevate e i dati si accumulano ora nei database. Le strutture glicaniche in vari formati3, popolano GlyTouCan4, il repository universale di dati sul glicano in cui ogni struttura è associata a un identificatore stabile indipendentemente dal livello di precisione con cui il glicano è definito (ad esempio, possibile tipo di collegamento mancante o composizione ambigua). Vengono raccolte strutture molto simili, ma le loro piccole differenze sono chiaramente riportate. Le glicoproteine sono descritte e curate in GlyConnect5 e GlyGen6, due database che si incrociano a vicenda. I dati sulla SM a supporto di elementi strutturali di prova sono sempre più memorizzati in GlycoPOST7. Per una più ampia copertura delle risorse online, il capitolo 52 del manuale di riferimento, Essentials of Glycobiology, è dedicato alla glicoinformatica8. È interessante notare che il software di identificazione dei glicopeptidi è proliferato negli ultimi anni9,10 anche se non a vantaggio della riproducibilità. Quest’ultima preoccupazione ha spinto i leader della HUPO GlycoProteomics Initiative (HGI) a lanciare una sfida software nel 2019. I dati ms ottenuti dall’elaborazione di miscele complesse di proteine sieriche umane N- e O-glicosilate in modalità di frammentazione CID, ETD ed EThcD, sono stati messi a disposizione dei concorrenti, siano essi utenti di software o sviluppatori. Il rapporto completo sui risultati di questa sfida11 è solo delineato qui. Per cominciare, è stata osservata una diffusione di identificazioni. È stato principalmente interpretato come causato dalla diversità dei metodi implementati nei motori di ricerca, delle loro impostazioni e del modo in cui gli output sono stati filtrati e il peptide “contato”. Il progetto sperimentale potrebbe anche aver messo alcuni software e approcci a un (dis)vantaggio. È importante sottolineare che i partecipanti che utilizzano lo stesso software hanno riportato risultati incoerenti, evidenziando così gravi problemi di riproducibilità. Si è concluso confrontando diversi contributi che alcune soluzioni software funzionano meglio di altre e alcune strategie di ricerca producono risultati migliori. È probabile che questo feedback guidi il miglioramento dei metodi automatizzati di analisi dei dati sui glicopeptidi e, a sua volta, avrà un impatto sul contenuto del database.

L’espansione della glicoinformatica ha portato alla creazione di portali web che forniscono informazioni e accesso a più risorse simili o complementari. I più recenti e aggiornati sono descritti in un capitolo della serie di libri Comprehensive Glycoscience12 e attraverso la cooperazione, una soluzione per la condivisione dei dati e lo scambio di informazioni è offerta in una modalità di accesso aperto. Uno di questi portali è stato sviluppato che è stato originariamente chiamato Glycomics@ExPASy 13 e ribattezzato Glyco@Expasy, a seguito della grande revisione della piattaforma Expasy14 che ha ospitato una vasta collezione di strumenti e database utilizzati in diversi -omics per decenni, l’elemento più popolare è UniProt15-la knowledge base proteica universale. Glyco@Expasy offre una scoperta didattica dello scopo e dell’utilizzo di database e strumenti, basata su una categorizzazione visiva e una visualizzazione delle loro interdipendenze. Il seguente protocollo illustra le procedure per esplorare i dati glicemici e glicoproteomici con una selezione di risorse da questo portale che rende esplicita la connessione tra glicoproteomica e glicano-interamitomica tramite glicomico. Così com’è, gli esperimenti glicemici producono strutture in cui i monosaccaridi sono completamente definiti e i collegamenti parzialmente o completamente determinati, ma il loro attaccamento al sito proteico è scarsamente, se non del tutto, caratterizzato. Al contrario, gli esperimenti di glicoproteomica generano informazioni precise sull’attaccamento al sito ma con una scarsa risoluzione delle strutture glicaniche, spesso limitata alle composizioni monosaccaridiche. Queste informazioni sono raggruppate nel database GlyConnect. Inoltre, gli strumenti di ricerca in GlyConnect possono essere utilizzati per rilevare potenziali ligandi glicani che sono descritti insieme alle proteine che li riconoscono in UniLectin16, collegato a GlyConnect tramite glicani. Il protocollo qui presentato è diviso in due sezioni per coprire domande specifiche per glicani e glicoproteine legati a N e O.

Protocol

NOTA: è necessario un dispositivo con una connessione Internet (schermo più grande preferito) e un browser Web aggiornato come Chrome o Firefox. L’utilizzo di Safari o Edge potrebbe non essere altrettanto affidabile. 1. Da una proteina N-glicoma in GlyConnect a una lectina di UniLectin Accesso alle risorse da Glyco@ExpasyNOTA: La procedura qui descritta è quella di accedere a GlyConnect ma può essere applicata all’accesso a qualsiasi risorsa …

Representative Results

La prima parte del protocollo (sezione 1) ha mostrato come indagare la specificità o la comunanza di N-glicani attaccati su Asn-69 dell’antigene prostatico specifico umano (PSA) utilizzando la piattaforma GlyConnect. Le variazioni dipendenti dai tessuti (urina e liquido seminale), così come le variazioni isoforme-dipendenti (normale e ad alto pI) nell’espressione del glicano, sono state enfatizzate utilizzando due strumenti di visualizzazione (Figura 4 e <strong class="xfi…

Discussion

GlyConnect Octopus come strumento per rivelare correlazioni inaspettate
GlyConnect Octopus è stato originariamente progettato per interrogare il database con una definizione libera di glicani. Infatti, la letteratura riporta spesso le principali caratteristiche dei glicani in un glicoma come essere fucosilati o sializzati, essere fatti di due o più antenne, ecc. Inoltre, i glicani, sia N- che O-linked, sono classificati in nuclei, come dettagliato nel manuale di riferimento Essentials of <sup class=…

Divulgazioni

The authors have nothing to disclose.

Acknowledgements

L’autore riconosce calorosamente i membri passati e presenti del Proteome Informatics Group coinvolti nello sviluppo delle risorse utilizzate in questo tutorial, in particolare, Julien Mariethoz e Catherine Hayes per GlyConnect, François Bonnardel per UniLectin, Davide Alocci e Frederic Nikitin per Octopus e Thibault Robin per Compozitor e tocco finale su Octopus.

Lo sviluppo del progetto glyco@Expasy è sostenuto dalla Confederazione attraverso la Segreteria di Stato per la formazione, la ricerca e l’innovazione (SEFRI) ed è attualmente integrato dal Fondo nazionale svizzero per la ricerca scientifica (FNS: 31003A_179249). ExPASy è gestito dall’Istituto Svizzero di Bioinformatica e ospitato presso il Vital-IT Competency Center. L’autore riconosce anche Anne Imberty per l’eccezionale cooperazione sulla piattaforma UniLectin sostenuta congiuntamente da ANR PIA Glyco@Alps (ANR-15-IDEX-02), Alliance Campus Rhodanien Co-funds (http://campusrhodanien.unige-cofunds.ch) Labex Arcane/CBH-EUR-GS (ANR-17-EURE-0003).

Materials

internet connection user's choice
recent version of web browser user's choice

Riferimenti

  1. Spring Harbor Laboratory Press. . Essentials of Glycobiology. , (2015).
  2. Gray, C. J., et al. Advancing solutions to the carbohydrate sequencing challenge. Journal of the American Chemical Society. 141 (37), 14463-14479 (2019).
  3. Tsuchiya, S., Yamada, I., Aoki-Kinoshita, K. F. GlycanFormatConverter: a conversion tool for translating the complexities of glycans. Bioinformatics. 35 (14), 2434-2440 (2018).
  4. Fujita, A., et al. The international glycan repository GlyTouCan version 3.0. Nucleic Acids Research. 49, 1529-1533 (2021).
  5. Alocci, D., et al. GlyConnect: glycoproteomics goes visual, interactive, and analytical. Journal of Proteome Research. 18 (2), 664-677 (2019).
  6. York, W. S., et al. GlyGen: computational and informatics resources for glycoscience. Glycobiology. 30 (2), 72-73 (2020).
  7. Watanabe, Y., Aoki-Kinoshita, K. F., Ishihama, Y., Okuda, S. GlycoPOST realizes FAIR principles for glycomics mass spectrometry data. Nucleic Acids Research. 49, 1523-1528 (2020).
  8. Campbell, M. P., Aoki-Kinoshita, K. F., Lisacek, F., York, W. S., Packer, N. H. Glycoinformatics. Essentials of Glycobiology. , (2015).
  9. Cao, W., et al. Recent advances in software tools for more generic and precise intact glycopeptide analysis. Molecular & Cellular Proteomics. 20, 100060 (2021).
  10. Mariethoz, J., Hayes, C., Lisacek, F. Glycan compositions with Compozitor to enhance glycopeptide identification. Proteomics Data Analysis. 2361, 109-127 (2021).
  11. Kawahara, R., et al. Communityevaluation of glycoproteomics informatics solutions reveals high-performance search strategies of serum glycopeptide analysis. Nature Methods. 18, 1304-1316 (2021).
  12. Lisacek, F., Aoki-Kinoshita, K. F., Vora, J. K., Mazumder, R., Tiemeyer, M. Glycoinformatics resources integrated through the GlySpace Alliance. Comprehensive Glycoscience. 1, 507-521 (2021).
  13. Mariethoz, J., et al. Glycomics@ExPASy: bridging the gap. Molecular & Cellular Proteomics. 17 (11), 2164-2176 (2018).
  14. Duvaud, S., et al. Expasy, the swiss bioinformatics resource portal, as designed by its users. Nucleic Acids Research. 49, 216-227 (2021).
  15. The UniProt Consortium et al. UniProt: the universal protein knowledgebase in 2021. Nucleic Acids Research. 49, 480-489 (2021).
  16. Bonnardel, F., Perez, S., Lisacek, F., Imberty, A. Structural database for lectins and the UniLectin web platform. Lectin Purification and Analysis. 2132, 1-14 (2020).
  17. Neelamegham, S., et al. Updates to the symbol nomenclature for glycans guidelines. Glycobiology. 29 (9), 620-624 (2019).
  18. Sharon, N. IUPAC-IUB Joint Commission on Biochemical Nomenclature (JCBN). Nomenclature of glycoproteins, glycopeptides and peptidoglycans: JCBN recommendations 1985. Glycoconjugate Journal. 3 (2), 123-133 (1986).
  19. Harvey, D. J., et al. Proposal for a standard system for drawing structural diagrams of N- and O-linked carbohydrates and related compounds. Proteomics. 9 (15), 3796-3801 (2009).
  20. Song, E., Mayampurath, A., Yu, C. -. Y., Tang, H., Mechref, Y. Glycoproteomics: identifying the glycosylation of prostate specific antigen at normal and high isoelectric points by LC-MS/MS. Journal of Proteome Research. 13 (12), 5570-5580 (2014).
  21. Moran, A. B., et al. Profiling the proteoforms of urinary prostate-specific antigen by capillary electrophoresis – mass spectrometry. Journal of Proteomics. 238, 104148 (2021).
  22. Wang, W., et al. High-throughput glycopeptide profiling of prostate-specific antigen from seminal plasma by MALDI-MS. Talanta. 222, 121495 (2021).
  23. wwPDB consortium metal. Protein Data Bank: the single global archive for 3D macromolecular structure data. Nucleic Acids Research. 47, 520-528 (2019).
  24. Sehnal, D., Grant, O. C. Rapidly display glycan symbols in 3D structures: 3D-SNFG in LiteMol. Journal of Proteome Research. 18 (2), 770-774 (2019).
  25. Bonnardel, F., et al. UniLectin3D, a database of carbohydrate binding proteins with curated information on 3D structures and interacting ligands. Nucleic Acids Research. 47, 1236-1244 (2019).
  26. Sehnal, D., et al. LiteMol suite: interactive web-based visualization of large-scale macromolecular structure data. Nature Methods. 14 (12), 1121-1122 (2017).
  27. Salentin, S., Schreiber, S., Haupt, V. J., Adasme, M. F., Schroeder, M. PLIP: fully automated protein-ligand interaction profiler. Nucleic Acids Research. 43, 443-447 (2015).
  28. Robin, T., Mariethoz, J., Lisacek, F. Examining and fine-tuning the selection of glycan compositions with GlyConnect Compozitor. Molecular & Cellular Proteomics. 19 (10), 1602-1618 (2020).
  29. Compagno, D., et al. Glycans and galectins in prostate cancer biology, angiogenesis and metastasis. Glycobiology. 24 (10), 899-906 (2014).
  30. Gentilini, L. D., et al. Stable and high expression of Galectin-8 tightly controls metastatic progression of prostate cancer. Oncotarget. 8 (27), 44654-44668 (2017).
  31. Schwämmle, V., Verano-Braga, T., Roepstorff, P. Computational and statistical methods for high-throughput analysis of post-translational modifications of proteins. Journal of Proteomics. 129, 3-15 (2015).
  32. Khatri, K., Klein, J. A., Zaia, J. Use of an informed search space maximizes confidence of site-specific assignment of glycoprotein glycosylation. Analytical and Bioanalytical Chemistry. 409 (2), 607-618 (2017).
  33. Sztain, T., et al. A glycan gate controls opening of the SARS-CoV-2 spike protein. Nature Chemistry. 13, 963-968 (2021).
check_url/it/63356?article_type=t

Play Video

Citazione di questo articolo
Lisacek, F. Bioinformatics Resources for the Study of Glycan-Mediated Protein Interactions. J. Vis. Exp. (179), e63356, doi:10.3791/63356 (2022).

View Video