Bioinformatics Resources for the Study of Glycan-Mediated Protein Interactions

Fr&#233;d&#233;rique Lisacek

doi:10.3791/63356

JoVE Journal > Biology

Biology

Recursos bioinforáticos para o estudo de interações proteicas mediadas por glicanos

Published: January 20, 2022

doi:

10.3791/63356

Frédérique Lisacek^2,3

¹Proteome Informatics Group,SIB Swiss Institute of Bioinformatics, ²Computer Science Department,University of Geneva, ³Section of Biology,University of Geneva

Summary

Este protocolo ilustra como explorar, comparar e interpretar as proteínas humanas com recursos on-line.

Abstract

A iniciativa Glyco@Expasy foi lançada como uma coleção de bases de dados interdependentes e ferramentas que abrangem diversos aspectos do conhecimento em glicobiologia. Em particular, tem como objetivo destacar interações entre glicoproteínas (como receptores de superfície celular) e proteínas de ligação de carboidratos mediadas por glicanos. Aqui, os principais recursos da coleção são introduzidos através de dois exemplos ilustrativos centrados na N-glycome do antígeno específico da próstata humana (PSA) e na O-glycome das proteínas de soro humano. Por meio de diferentes consultas de banco de dados e com a ajuda de ferramentas de visualização, este artigo mostra como explorar e comparar conteúdo em um contínuo para coletar e correlacionar peças de informação dispersas. Os dados coletados são destinados a alimentar cenários mais elaborados da função glican. A glicoinformática introduzida aqui é, portanto, proposta como um meio de fortalecer, moldar ou refutar suposições sobre a especificidade de uma glycome proteica em um determinado contexto.

Introduction

Os glicanos, proteínas a que estão ligados (glicoproteínas) e proteínas às quais se ligam (lectinas ou proteínas de ligação de carboidratos) são os principais atores moleculares na superfície ^celular1. Apesar desse papel central na comunicação celular, estudos em larga escala, incluindo glicomics, glicoproteomics ou dados de glicocano-interactômica ainda são escassos em comparação com sua contrapartida em genômica e proteômica.

Até recentemente, não haviam sido desenvolvidos métodos para caracterizar as estruturas ramificadas de carboidratos complexos, ainda conjugados à proteína portadora. A biossíntese das glicoproteínas é um processo não orientado por modelos no qual os doadores de monossacarídeos, os substratos de glicoproteína aceitadores e as glicosyltransferases e glicosidases desempenham um papel interativo. As glicoproteínas resultantes podem suportar estruturas complexas com múltiplos pontos de ramificação onde cada componente monossacarídeo pode ser um dos vários tipos presentes na ^natureza1. O processo não orientado por modelos impõe a análise bioquímica como a única opção para gerar dados estruturais de oligossacarídeos. O processo analítico das estruturas glicas ligadas a uma proteína nativa é muitas vezes desafiador, pois requer tecnologias sensíveis, quantitativas e robustas para determinar a composição de monossacarídeos, as ligações e sequências ^ramificadas2.

Neste contexto, a espectrometria de massa (MS) é a técnica mais utilizada em experimentos de glicoprotetomia e glicoproteômica. Com o passar do tempo, estes são realizados em configurações de rendimento mais elevado e os dados agora estão se acumulando em bancos de dados. Estruturas glíricas em vários ^formatos3, povoam o GlyTouCan4, o repositório universal de dados glicanos onde cada estrutura está associada a um identificador estável, independentemente do nível de precisão com que o glicano é definido (por exemplo, possivelmente faltando tipo de linkage ou composição ambígua). Estruturas muito semelhantes são coletadas, mas suas pequenas diferenças são claramente relatadas. Glicoproteínas são descritas e curadas em ^GlyConnect5 e GlyGen6, dois bancos de dados cruzando entre si. Os dados de MS que suportam evidências estruturais são cada vez mais armazenados no GlycoPOST7. Para uma cobertura mais ampla dos recursos on-line, o capítulo 52 do manual de referência, Essentials of Glicobiology, é dedicado à glicoinformática8. Curiosamente, o software de identificação de glicoptoptídeos proliferou nos últimos ^anos9,10, embora não em benefício da reprodutibilidade. Esta última preocupação levou os líderes da Hupo GlycoProteomics Initiative (HGI) a definir um desafio de software em 2019. Os dados de MS obtidos a partir do processamento de misturas complexas de proteínas de soro humano N e O-glicosylated nos modos de fragmentação CID, ETD e EThcD, foram disponibilizados aos concorrentes, sejam usuários de software ou desenvolvedores. O relatório completo sobre os resultados deste ^desafio11 é apenas descrito aqui. Para começar, observou-se uma disseminação de identificações. Foi interpretado principalmente como causado pela diversidade de métodos implementados nos mecanismos de busca, de suas configurações e como as saídas foram filtradas, e peptídeos “contados”. O design experimental também pode ter colocado alguns softwares e abordagens em uma (des)vantagem. É importante ressaltar que os participantes que utilizam o mesmo software relataram resultados inconsistentes, destacando problemas sérios de reprodutibilidade. Concluiu-se comparando diferentes submissões que algumas soluções de software têm melhor desempenho do que outras e algumas estratégias de pesquisa produzem melhores resultados. Esse feedback provavelmente guiará a melhoria dos métodos automatizados de análise de dados de glycopeptide e, por sua vez, afetará o conteúdo do banco de dados.

A expansão da glicoinformática levou à criação de portais web que fornecem informações e acesso a múltiplos recursos similares ou complementares. Os mais recentes e atualizados são descritos em um capítulo da série de livros de Glicociência ^Abrangente12 e através da cooperação, uma solução para compartilhamento de dados e troca de informações é oferecida em um modo de acesso aberto. Um desses portais foi desenvolvido que foi originalmente chamado de Glycomics@ExPASy ¹³ e renomeado Glyco@Expasy, após a grande revisão da plataforma Expasy14 que hospedou uma grande coleção de ferramentas e bancos de dados usados em várias omics por décadas, sendo o item mais popular UniProt15-a base universal de conhecimentos proteicos. Glyco@Expasy oferece uma descoberta didática do propósito e uso de bancos de dados e ferramentas, com base em uma categorização visual e uma exibição de suas interdependências. O protocolo a seguir ilustra procedimentos para explorar dados de glicomics e glicoproteomics com uma seleção de recursos deste portal que torna explícita a conexão entre glicoproteomia e glicomica através de glicomics. Como é, experimentos de glicomics produzem estruturas onde monossacarídeos são totalmente definidos e ligações parcial ou totalmente determinadas, mas seu apego ao local de proteína é mal caracterizado, se em tudo. Em contraste, experimentos de glicoproteomia geram informações precisas de anexo do local, mas com uma resolução ruim de estruturas glicas, muitas vezes limitadas a composições de monossacarídeos. Essas informações são reunidas no banco de dados GlyConnect. Além disso, ferramentas de pesquisa no GlyConnect podem ser usadas para detectar potenciais ligantes glicanos que são descritos juntamente com as proteínas que as reconhecem no UniLectin16, ligada ao GlyConnect via glicocanos. O protocolo aqui apresentado é dividido em duas seções para cobrir questões específicas de glicocanos ligados a N e o-ligados a O e glicoproteínas.

Protocol

NOTA: Um dispositivo com conexão à Internet (tela maior preferida) e um navegador da Web atualizado, como Chrome ou Firefox, são necessários. O uso de Safari ou Edge pode não ser tão confiável. 1. De uma proteína N-glycome em GlyConnect a uma lectina de UniLectin Acessando recursos de Glyco@ExpasyNOTA: O procedimento descrito aqui é acessar o GlyConnect, mas pode ser aplicado ao acesso a qualquer recurso registrado na plataforma. <li…

Representative Results

A primeira parte do protocolo (seção 1) mostrou como investigar a especificidade ou a comunalidade dos N-glicanos anexados no Asn-69 do antígeno específico da próstata humana (PSA) usando a plataforma GlyConnect. As variações dependentes de tecidos (urina e fluido seminal), bem como variações dependentes de isoforme (iB normal e alta) na expressão glica, foram enfatizadas utilizando duas ferramentas de visualização (Figura 4 e Figura 5</stron…

Discussion

GlyConnect Octopus como uma ferramenta para revelar correlações inesperadas
O GlyConnect Octopus foi originalmente projetado para consultar o banco de dados com uma definição frouxa de glicocanos. De fato, a literatura frequentemente relata as principais características dos glicanos em uma glycome, como ser fucosylated ou sialylated, ser feito de duas ou mais antenas, etc. Além disso, os glicocanos, sejam N ou O-vinculados, são classificados em núcleos, conforme detalhado no manual de referên…

Disclosures

The authors have nothing to disclose.

Acknowledgements

O autor reconhece calorosamente membros passados e atuais do Grupo de Informática Proteome envolvidos no desenvolvimento dos recursos utilizados neste tutorial, especificamente, Julien Mariethoz e Catherine Hayes para GlyConnect, François Bonnardel para UniLectin, Davide Alocci, e Frederic Nikitin para o Polvo, e Thibault Robin para Compozitor e toque final em Octopus.

O desenvolvimento do projeto glyco@Expasy é apoiado pelo Governo Federal suíço, por meio da Secretaria de Estado da Educação, Da Pesquisa e Inovação (SERI) e atualmente é complementado pela Fundação Nacional de Ciências da Suíça (SNSF: 31003A_179249). A ExPASy é mantida pelo Instituto Suíço de Bioinformática e hospedada no Vital-IT Competency Center. A autora também reconhece Anne Imberty pela excelente cooperação na plataforma UniLectin apoiada conjuntamente pela ANR PIA Glyco@Alps (ANR-15-IDEX-02), Alliance Campus Rhodanien Co-funds (http://campusrhodanien.unige-cofunds.ch) Labex Arcane/CBH-EUR-GS (ANR-17-EURE-0003).

Materials

internet connection	user's choice
recent version of web browser	user's choice

References

Spring Harbor Laboratory Press. . Essentials of Glycobiology. , (2015).
Gray, C. J., et al. Advancing solutions to the carbohydrate sequencing challenge. Journal of the American Chemical Society. 141 (37), 14463-14479 (2019).
Tsuchiya, S., Yamada, I., Aoki-Kinoshita, K. F. GlycanFormatConverter: a conversion tool for translating the complexities of glycans. Bioinformatics. 35 (14), 2434-2440 (2018).
Fujita, A., et al. The international glycan repository GlyTouCan version 3.0. Nucleic Acids Research. 49, 1529-1533 (2021).
Alocci, D., et al. GlyConnect: glycoproteomics goes visual, interactive, and analytical. Journal of Proteome Research. 18 (2), 664-677 (2019).
York, W. S., et al. GlyGen: computational and informatics resources for glycoscience. Glycobiology. 30 (2), 72-73 (2020).
Watanabe, Y., Aoki-Kinoshita, K. F., Ishihama, Y., Okuda, S. GlycoPOST realizes FAIR principles for glycomics mass spectrometry data. Nucleic Acids Research. 49, 1523-1528 (2020).
Campbell, M. P., Aoki-Kinoshita, K. F., Lisacek, F., York, W. S., Packer, N. H. Glycoinformatics. Essentials of Glycobiology. , (2015).
Cao, W., et al. Recent advances in software tools for more generic and precise intact glycopeptide analysis. Molecular & Cellular Proteomics. 20, 100060 (2021).
Mariethoz, J., Hayes, C., Lisacek, F. Glycan compositions with Compozitor to enhance glycopeptide identification. Proteomics Data Analysis. 2361, 109-127 (2021).
Kawahara, R., et al. Communityevaluation of glycoproteomics informatics solutions reveals high-performance search strategies of serum glycopeptide analysis. Nature Methods. 18, 1304-1316 (2021).
Lisacek, F., Aoki-Kinoshita, K. F., Vora, J. K., Mazumder, R., Tiemeyer, M. Glycoinformatics resources integrated through the GlySpace Alliance. Comprehensive Glycoscience. 1, 507-521 (2021).
Mariethoz, J., et al. Glycomics@ExPASy: bridging the gap. Molecular & Cellular Proteomics. 17 (11), 2164-2176 (2018).
Duvaud, S., et al. Expasy, the swiss bioinformatics resource portal, as designed by its users. Nucleic Acids Research. 49, 216-227 (2021).
The UniProt Consortium et al. UniProt: the universal protein knowledgebase in 2021. Nucleic Acids Research. 49, 480-489 (2021).
Bonnardel, F., Perez, S., Lisacek, F., Imberty, A. Structural database for lectins and the UniLectin web platform. Lectin Purification and Analysis. 2132, 1-14 (2020).
Neelamegham, S., et al. Updates to the symbol nomenclature for glycans guidelines. Glycobiology. 29 (9), 620-624 (2019).
Sharon, N. IUPAC-IUB Joint Commission on Biochemical Nomenclature (JCBN). Nomenclature of glycoproteins, glycopeptides and peptidoglycans: JCBN recommendations 1985. Glycoconjugate Journal. 3 (2), 123-133 (1986).
Harvey, D. J., et al. Proposal for a standard system for drawing structural diagrams of N- and O-linked carbohydrates and related compounds. Proteomics. 9 (15), 3796-3801 (2009).
Song, E., Mayampurath, A., Yu, C. -. Y., Tang, H., Mechref, Y. Glycoproteomics: identifying the glycosylation of prostate specific antigen at normal and high isoelectric points by LC-MS/MS. Journal of Proteome Research. 13 (12), 5570-5580 (2014).
Moran, A. B., et al. Profiling the proteoforms of urinary prostate-specific antigen by capillary electrophoresis – mass spectrometry. Journal of Proteomics. 238, 104148 (2021).
Wang, W., et al. High-throughput glycopeptide profiling of prostate-specific antigen from seminal plasma by MALDI-MS. Talanta. 222, 121495 (2021).
wwPDB consortium metal. Protein Data Bank: the single global archive for 3D macromolecular structure data. Nucleic Acids Research. 47, 520-528 (2019).
Sehnal, D., Grant, O. C. Rapidly display glycan symbols in 3D structures: 3D-SNFG in LiteMol. Journal of Proteome Research. 18 (2), 770-774 (2019).
Bonnardel, F., et al. UniLectin3D, a database of carbohydrate binding proteins with curated information on 3D structures and interacting ligands. Nucleic Acids Research. 47, 1236-1244 (2019).
Sehnal, D., et al. LiteMol suite: interactive web-based visualization of large-scale macromolecular structure data. Nature Methods. 14 (12), 1121-1122 (2017).
Salentin, S., Schreiber, S., Haupt, V. J., Adasme, M. F., Schroeder, M. PLIP: fully automated protein-ligand interaction profiler. Nucleic Acids Research. 43, 443-447 (2015).
Robin, T., Mariethoz, J., Lisacek, F. Examining and fine-tuning the selection of glycan compositions with GlyConnect Compozitor. Molecular & Cellular Proteomics. 19 (10), 1602-1618 (2020).
Compagno, D., et al. Glycans and galectins in prostate cancer biology, angiogenesis and metastasis. Glycobiology. 24 (10), 899-906 (2014).
Gentilini, L. D., et al. Stable and high expression of Galectin-8 tightly controls metastatic progression of prostate cancer. Oncotarget. 8 (27), 44654-44668 (2017).
Schwämmle, V., Verano-Braga, T., Roepstorff, P. Computational and statistical methods for high-throughput analysis of post-translational modifications of proteins. Journal of Proteomics. 129, 3-15 (2015).
Khatri, K., Klein, J. A., Zaia, J. Use of an informed search space maximizes confidence of site-specific assignment of glycoprotein glycosylation. Analytical and Bioanalytical Chemistry. 409 (2), 607-618 (2017).
Sztain, T., et al. A glycan gate controls opening of the SARS-CoV-2 spike protein. Nature Chemistry. 13, 963-968 (2021).

Play Video

PDF

DOI

DOWNLOAD MATERIALS LIST

Cite This Article

Lisacek, F. Bioinformatics Resources for the Study of Glycan-Mediated Protein Interactions. J. Vis. Exp. (179), e63356, doi:10.3791/63356 (2022).

Recursos bioinforáticos para o estudo de interações proteicas mediadas por glicanos

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgements

Materials

References

Tags

Play Video

Cite This Article

View Video

Recursos bioinforáticos para o estudo de interações proteicas mediadas por glicanos

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgements

Materials

References

Tags

Play Video

Cite This Article

View Video

✖

To prove you're not a robot, please enter the text in the image below