Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

Recursos bioinforáticos para o estudo de interações proteicas mediadas por glicanos

Published: January 20, 2022 doi: 10.3791/63356

Summary

Este protocolo ilustra como explorar, comparar e interpretar as proteínas humanas com recursos on-line.

Abstract

A iniciativa Glyco@Expasy foi lançada como uma coleção de bases de dados interdependentes e ferramentas que abrangem diversos aspectos do conhecimento em glicobiologia. Em particular, tem como objetivo destacar interações entre glicoproteínas (como receptores de superfície celular) e proteínas de ligação de carboidratos mediadas por glicanos. Aqui, os principais recursos da coleção são introduzidos através de dois exemplos ilustrativos centrados na N-glycome do antígeno específico da próstata humana (PSA) e na O-glycome das proteínas de soro humano. Por meio de diferentes consultas de banco de dados e com a ajuda de ferramentas de visualização, este artigo mostra como explorar e comparar conteúdo em um contínuo para coletar e correlacionar peças de informação dispersas. Os dados coletados são destinados a alimentar cenários mais elaborados da função glican. A glicoinformática introduzida aqui é, portanto, proposta como um meio de fortalecer, moldar ou refutar suposições sobre a especificidade de uma glycome proteica em um determinado contexto.

Introduction

Os glicanos, proteínas a que estão ligados (glicoproteínas) e proteínas às quais se ligam (lectinas ou proteínas de ligação de carboidratos) são os principais atores moleculares na superfície celular1. Apesar desse papel central na comunicação celular, estudos em larga escala, incluindo glicomics, glicoproteomics ou dados de glicocano-interactômica ainda são escassos em comparação com sua contrapartida em genômica e proteômica.

Até recentemente, não haviam sido desenvolvidos métodos para caracterizar as estruturas ramificadas de carboidratos complexos, ainda conjugados à proteína portadora. A biossíntese das glicoproteínas é um processo não orientado por modelos no qual os doadores de monossacarídeos, os substratos de glicoproteína aceitadores e as glicosyltransferases e glicosidases desempenham um papel interativo. As glicoproteínas resultantes podem suportar estruturas complexas com múltiplos pontos de ramificação onde cada componente monossacarídeo pode ser um dos vários tipos presentes na natureza1. O processo não orientado por modelos impõe a análise bioquímica como a única opção para gerar dados estruturais de oligossacarídeos. O processo analítico das estruturas glicas ligadas a uma proteína nativa é muitas vezes desafiador, pois requer tecnologias sensíveis, quantitativas e robustas para determinar a composição de monossacarídeos, as ligações e sequências ramificadas2.

Neste contexto, a espectrometria de massa (MS) é a técnica mais utilizada em experimentos de glicoprotetomia e glicoproteômica. Com o passar do tempo, estes são realizados em configurações de rendimento mais elevado e os dados agora estão se acumulando em bancos de dados. Estruturas glíricas em vários formatos3, povoam o GlyTouCan4, o repositório universal de dados glicanos onde cada estrutura está associada a um identificador estável, independentemente do nível de precisão com que o glicano é definido (por exemplo, possivelmente faltando tipo de linkage ou composição ambígua). Estruturas muito semelhantes são coletadas, mas suas pequenas diferenças são claramente relatadas. Glicoproteínas são descritas e curadas em GlyConnect5 e GlyGen6, dois bancos de dados cruzando entre si. Os dados de MS que suportam evidências estruturais são cada vez mais armazenados no GlycoPOST7. Para uma cobertura mais ampla dos recursos on-line, o capítulo 52 do manual de referência, Essentials of Glicobiology, é dedicado à glicoinformática8. Curiosamente, o software de identificação de glicoptoptídeos proliferou nos últimos anos9,10, embora não em benefício da reprodutibilidade. Esta última preocupação levou os líderes da Hupo GlycoProteomics Initiative (HGI) a definir um desafio de software em 2019. Os dados de MS obtidos a partir do processamento de misturas complexas de proteínas de soro humano N e O-glicosylated nos modos de fragmentação CID, ETD e EThcD, foram disponibilizados aos concorrentes, sejam usuários de software ou desenvolvedores. O relatório completo sobre os resultados deste desafio11 é apenas descrito aqui. Para começar, observou-se uma disseminação de identificações. Foi interpretado principalmente como causado pela diversidade de métodos implementados nos mecanismos de busca, de suas configurações e como as saídas foram filtradas, e peptídeos "contados". O design experimental também pode ter colocado alguns softwares e abordagens em uma (des)vantagem. É importante ressaltar que os participantes que utilizam o mesmo software relataram resultados inconsistentes, destacando problemas sérios de reprodutibilidade. Concluiu-se comparando diferentes submissões que algumas soluções de software têm melhor desempenho do que outras e algumas estratégias de pesquisa produzem melhores resultados. Esse feedback provavelmente guiará a melhoria dos métodos automatizados de análise de dados de glycopeptide e, por sua vez, afetará o conteúdo do banco de dados.

A expansão da glicoinformática levou à criação de portais web que fornecem informações e acesso a múltiplos recursos similares ou complementares. Os mais recentes e atualizados são descritos em um capítulo da série de livros de Glicociência Abrangente12 e através da cooperação, uma solução para compartilhamento de dados e troca de informações é oferecida em um modo de acesso aberto. Um desses portais foi desenvolvido que foi originalmente chamado de Glycomics@ExPASy 13 e renomeado Glyco@Expasy, após a grande revisão da plataforma Expasy14 que hospedou uma grande coleção de ferramentas e bancos de dados usados em várias omics por décadas, sendo o item mais popular UniProt15-a base universal de conhecimentos proteicos. Glyco@Expasy oferece uma descoberta didática do propósito e uso de bancos de dados e ferramentas, com base em uma categorização visual e uma exibição de suas interdependências. O protocolo a seguir ilustra procedimentos para explorar dados de glicomics e glicoproteomics com uma seleção de recursos deste portal que torna explícita a conexão entre glicoproteomia e glicomica através de glicomics. Como é, experimentos de glicomics produzem estruturas onde monossacarídeos são totalmente definidos e ligações parcial ou totalmente determinadas, mas seu apego ao local de proteína é mal caracterizado, se em tudo. Em contraste, experimentos de glicoproteomia geram informações precisas de anexo do local, mas com uma resolução ruim de estruturas glicas, muitas vezes limitadas a composições de monossacarídeos. Essas informações são reunidas no banco de dados GlyConnect. Além disso, ferramentas de pesquisa no GlyConnect podem ser usadas para detectar potenciais ligantes glicanos que são descritos juntamente com as proteínas que as reconhecem no UniLectin16, ligada ao GlyConnect via glicocanos. O protocolo aqui apresentado é dividido em duas seções para cobrir questões específicas de glicocanos ligados a N e o-ligados a O e glicoproteínas.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

NOTA: Um dispositivo com conexão à Internet (tela maior preferida) e um navegador da Web atualizado, como Chrome ou Firefox, são necessários. O uso de Safari ou Edge pode não ser tão confiável.

1. De uma proteína N-glycome em GlyConnect a uma lectina de UniLectin

  1. Acessando recursos de Glyco@Expasy
    NOTA: O procedimento descrito aqui é acessar o GlyConnect, mas pode ser aplicado ao acesso a qualquer recurso registrado na plataforma.
    1. Vá para https://glycoproteome.expasy.org/glycomics-expasy e considere o gráfico de bolhas à direita mostrando diferentes categorias, como Glycoconjugates ou Glycan Binding. No menu mais à esquerda que reflete as categorias nas bolhas, verifique a caixa Glicoproteins para que o gráfico de bolhas à direita amplie imediatamente a bolha que corresponde a essa categoria.
      NOTA: Bolhas verdes são ferramentas e bolhas amarelas são bancos de dados. Clicar em qualquer um zooms novamente para fornecer detalhes sobre o recurso. Antes de fazer isso, o usuário pode querer entender as dependências desse recurso para os outros.
    2. Para obter as informações sobre dependências, passe da guia Classificação Temática de Recursos para a guia Roda de Dependência de Recursos . Coloque o mouse no GlyConnect na roda para verificar seu nível de integração com outras fontes (Figura 1).
    3. Volte para a guia Classificação Temática de Recursos para alcançar a bolha GlyConnect como na etapa 1.1.1 e clique nela (Figura Suplementar 1) para exibir a página inicial do GlyConnect em uma nova guia que mostra as estatísticas do conteúdo na versão mais recente do banco de dados.
      NOTA: Um esquema de cores detalhado na Tabela 1 corresponde aos diferentes tipos de informações armazenadas no banco de dados. Este código de cores é válido em todas as páginas da entidade no GlyConnect e é consistente em todo. A página inicial também exibe quatro seções dedicadas a conjuntos de dados focados, como aqueles que descrevem a glicosylation da proteína de pico Sars-Cov-2 (COVID-19) ou detalhando extensivamente oligossacarídeos de leite humano (HMO). Estes não serão explorados neste protocolo.
  2. Explorando as informações contextuais de uma proteína N-glycome
    NOTA: Todas as estruturas glican no GlyConnect são exibidas em três formatos alternativos e comumente usados: (1) Nomenclatura de símbolo para glicocanos (SNFG)17 (2) IUPAC condensado18, e (3) Oxford19. Em contraste, não há notação padrão para expressar a composição glican. Em GlyConnect, o seguinte código é usado: Hex para hexose, HexNAc para N-Acetylhexosamine, dHex para fucose e NeuAc para ácidos sálicos. Para simplificar, as ferramentas de visualização dependem de uma notação condensada: H para hexose, N para N-Acetylhexosamine, F para fucose e S para ácidos sílicos. Além disso, letras pequenas designam modificações como "a" para acetilação, "p" para fosforilação e "s" para sulfação, para os mais frequentes desses chamados substitutos.
    1. Para visualizar e explorar o N-glycome do Antígeno Específico da Próstata (PSA) humano, a partir da página inicial do GlyConnect, proceda da seguinte forma.
      NOTA: A glicossylation do PSA humano tem sido estudada ao longo dos anos, especialmente no contexto do câncer de próstata. O banco de dados GlyConnect armazena três referências20,21,22, que combinam dados de glicoproteomics e glicoproteomics. Note que os resultados aqui fornecidos foram obtidos com o lançamento de setembro de 2021 do GlyConnect. O uso oculto do banco de dados pode produzir estatísticas ligeiramente diferentes devido a atualizações frequentes de dados.
    2. Selecione o botão PROTEIN para abrir a visão proteica do banco de dados. Na página de visualização de proteínas, digite próstata na janela de pesquisa. Procure as duas entradas listadas na saída distinguindo dois isóformes de PSA com valores de iE. Clique em 790 (coluna de identidade) correspondente à isoforma comum do PSA.
      NOTA: Procure a barra multicolorida superior que mostra informações resumidas do trabalho publicado no esquema detalhado acima. Várias opções de navegação são possíveis como descrito abaixo.
    3. Na barra multicolorida superior, clique no botão SOURCE em verde para exibir os tipos de amostra dos quais os dados publicados foram processados: Urina e Fluido Seminal. Para navegar mais a esta informação, clique em qualquer um desses tipos de amostra. O mesmo se aplica a qualquer item que apareça ao clicar em um botão colorido.
    4. Para verificar o conteúdo relacionado à saúde do banco de dados, clique no botão DOENÇA , que contém dois itens, um deles é câncer de próstata que se liga à página de doença dedicada correspondente no GlyConnect. O resumo dessa página mostra que três estudos de grande escala relataram 319 composições em 1.087 locais encontrados em 308 proteínas humanas.
    5. Clique no botão ESTRUTURAr para ver a lista completa de 135 estruturas associadas ao PSA a partir de dados glicomics. Clique no botão COMPOSIÇÃO para as 78 composições associadas determinadas por experimentos de glicoproteomia. Clique em qualquer estrutura ou composição para obter mais detalhes.
      NOTA: Podem ser obtidos detalhes como a lista de proteínas alternativas que carregam a estrutura específica ou a lista de estruturas que correspondem à composição. A PSA é conhecida por ter apenas um site de glicosylation N em Asn-69 (apenas um item contado para o botão LOCAL marrom).
    6. Para reduzir a ambiguidade das composições, clique em STRUCT SUGERIDO abaixo de uma composição selecionada (por exemplo, Hex:6 HexNAc:3 NeuAc:1). Uma sugestão é feita cada vez que a contagem de monossacarídeos coincide com a de uma estrutura listada acima (Figura 2).
      NOTA: A composição Hex:6 HexNAc:3 NeuAc:1 gerada por um experimento de glicoproteomia é combinada com quatro estruturas de resolução mais alta a partir dos dados glicomics. No caso da PSA, não há ambiguidade no local para resolver, uma vez que apenas o Asn-69 é glicosilálido.
    7. Para explorar totalmente a página de proteínas, visualize mais detalhes no lado direito da página (Figura 3).
      1. Veja a entrada padrão 3QUM PDB (Protein Data Bank23) para PSA que é mostrada com dois glíquidos complexos ligados a cada monômero (Figura 3) ou a entrada alternativa 2ZCK , que também está disponível por causa de um carboidrato conectado. A segunda entrada mostra uma única corrente.
        NOTA: Ambas as entradas são visualizadas com o plugin 3D LiteMol24 que exibe glicocanos em notação SNFG-3D adotada no PDB-RCSB.
      2. Clique nos links correspondentes de outras referências cruzadas para explorar informações funcionais relevantes dos principais bancos de dados proteômicos, como o UniProt (Figura 3).
  3. Visualizando e correlacionando as informações contextuais de uma proteína N-glycome
    NOTA: Como visto na seção anterior, longas listas de estruturas ou composições podem ser difíceis de apreender como um todo e o GlyConnect conta com duas ferramentas diferentes para visualizar informações-chave, ou seja, GlyConnect Octopus e GlyConnect Compozitor (o primeiro expande as informações sumárias capturadas em botões coloridos e o segundo traz dependências estruturais em termos de uma estrutura/composição sendo contida em outra). Como ilustrado abaixo, o GlyConnect Octopus explora associações entre as várias entidades armazenadas no banco de dados através do destaque de múltiplas ou únicas conexões como reflexo do conteúdo do banco de dados.
    1. Realize uma pesquisa do Polvo GlyConnect para confirmar a presença de traços estruturais comuns, como estruturas de núcleos híbridos e estruturas altamente frequentes contendo ácido sálico na diversidade de glicanos ligados ao PSA, conforme descrito abaixo.
    2. Vá para a página inicial do Octopus https://glyconnect.expasy.org/octopus/. Mantenha a guia vinculada em N selecionada por padrão. Mova-se para o subtabto Cores e clique no ícone Híbrido . Mova-se para o subtabelecimento de Propriedades e clique no ícone Sialylated . Clique no botão de pesquisa verde abaixo.
      NOTA: Os resultados da pesquisa são exibidos graficamente como relacionamentos entre três categorias de itens. Por padrão, a lista central corresponde à consulta para composições, a coleção esquerda abrange proteínas relacionadas e a direita abrange glícans relacionados.
    3. No gráfico exibido de relacionamentos, paire sobre o H6N4F1S1 para destacar links para seis proteínas e três estruturas. Contraste isso pairando sobre H6N4F2S1 que destaca os dois isoforms de PSA (ambos chamados de UniProt ID: KLK3_HUMAN) e uma estrutura (ID: 10996). Passe o mouse sobre o ID da estrutura para mostrar sua representação SNFG e clique nela para abrir a página correspondente (Figura Suplementar 2).
    4. Mude os nódulos do Polvo para qualquer outro tópico que descreva o contexto da glicosylation. O código de cor permanece o mesmo descrito anteriormente (ver Tabela 1).
      1. Altere os nodes centrais para tecidos para exibir 15 opções no meio do gráfico, muitas das quais são fluidos corporais. Procure todas as associações entre proteínas e glicanos que correspondam à consulta dependendo das informações do tecido. Coloque o cursor em Urina ou Fluido Seminal no meio do gráfico para ver diferentes associações (Figura 4A,B).
      2. Mude os nodes do Centro para Doença para apresentar 13 opções, uma delas é o Câncer de Próstata. A única proteína associada é a PSA (KLK3_HUMAN) (Figura Suplementar 3).
        NOTA: Um olhar mais atento para o PSA N-glycome mostrado na página de proteínas destaca a frequência muito alta de um Terminal NeuAc(a?-?) Gal(b?-?) Subestrutura GLCNAc em muitos casos em estruturas com duas ou três antenas. Outro Polvo pode ser gerado com base nisso, conforme descrito abaixo.
    5. Clique no botão Limpar para atualizar a pesquisa. Mova-se para o subtabelecimento propriedades e clique no ícone Bi-antenas . Mova-se para o subtabelecido determinantes e clique no ícone 3-Sialyl-LN (tipo 2). Clique no botão de pesquisa verde abaixo.
    6. Verifique as associações recuperadas pelo Polvo com glicanos bi-antenas contendo um motivo terminal 3-Sialyl-LN (tipo 2), ou seja, NeuAc(a1-3)Gal(b1-4)GlcNAc. Altere os nodes centrais para tecidos para facilitar a leitura e paire sobre KLK3_HUMAN para conectar diretamente fluido seminal com isoforme comum PSA e sete estruturas (Figura Suplementar 4).
      NOTA: A segunda ferramenta de visualização, GlyConnect Compozitor, realiza a varredura de possíveis relações entre cada composição em uma lista (veja abaixo). Uma relação é definida como diferente de apenas um monossacarídeo entre duas composições. Essas relações identificadas traçadas em um gráfico expõem a (des)continuidade de uma glycome.
    7. Use o GlyConnect Compozitor para realizar a varredura de relações potenciais entre cada composição em uma lista delas, conforme ilustrado abaixo para o caso da PSA.
      NOTA: GlyConnect Compozitor processa composições em associação com um contexto. Oferece guias distintas para consulta do GlyConnect, por exemplo, Proteínas, Fontes, Linhas Celulares, Doenças que são autoexplicativas para qualificar um contexto. Isso é ilustrado aqui com psa da seguinte forma.
    8. Volte para a página de proteínas de PSA: https://glyconnect.expasy.org/browser/proteins/790. No lado direito da página de entrada do PSA, clique no link Compozitor. Certifique-se de que os campos de pesquisa do Compozitor estejam pré-preenchidos com os detalhes da entrada do ID 790 na guia Proteína (Proteína: Antígeno específico da próstata, Espécies: Homo sapiens e tipo glycano: N-ligado).
    9. Clique no botão Adicionar à Seleção para recuperar dados do banco de dados e exibir o gráfico de composições conectadas. Desmarque a opção Incluir nodes virtuais . Clique no botão Compute Graph para exibir um gráfico mostrando um conjunto bem conectado de 78 composições representando o PSA N-glycome, e um gráfico de barras mostrando as principais características dos glicanos.
    10. Paire sobre a barra roxa no enredo da barra, que localiza todas as estruturas sialylated no gráfico para revelar um viés observável em direção a estruturas sialylated.
    11. Permaneça na guia principal de proteína e selecione antígeno específico da próstata - alto isoforme pi (psah) no campo proteína (nome).
      NOTA: Os campos Glycan Type e Glycan Site são preenchidos automaticamente.
    12. Clique no botão Adicionar à Seleção para recuperar dados do banco de dados que equivalem a 57 composições. Clique no botão Gráfico de Computação para gerar os gráficos sobrepostos de ambos os isoforms e avalie as diferenças nas glicéis dos dois isoformes PSA. Passe o mouse sobre os rótulos de nó para solicitar a exibição do número de estruturas correspondentes às composições/rótulos (Figura 5).
  4. Informações vinculativas glicos no UniLectin
    NOTA: Lembre-se do determinante testado no Polvo, descrito como NeuAc(a2-3)Gal(b1-4). Por definição, é uma parte vinculante estabelecida de uma estrutura glican e, como tal, pode ser pesquisada no banco de dados UniLectin3D25.
    1. Vá para https://www.unilectin.eu/ e clique no botão UniLectin3D . Alternativamente, acesse diretamente a página: https://www.unilectin.eu/unilectin3D/.Click no botão Pesquisa Glycan para abrir esta página: https://www.unilectin.eu/unilectin3D/glycan_search (Figura Suplementar 6).
    2. Clique no diamante roxo representando um ácido sálico, que solicita a exibição de todos os motivos de ligação glicano que terminam com um ácido sálico armazenado no banco de dados. A parte superior dessa coleção de motivos contém o motivo NeuAc(a2-3)Gal(b1-4)GlcNAc investigado anteriormente (Figura Suplementar 7).
    3. Clique no motivo NeuAc(a2-3)Gal(b1-4)GlcNAc para solicitar a exibição de todas as lectinas para as quais é conhecida uma estrutura 3D confirmando a interação com NeuAc(a2-3)Gal(b1-4)GlcNAc. O resultado por padrão mostra lectinas em todas as espécies. Use a opção Pesquisa por Campo para limitar a exibição a informações centradas no homem.
    4. Clique na opção Pesquisa por Campo . No campo de espécies , digite Homo sapiens. Clique no botão Explorar estruturas de raios-X para filtrar a lista original. Apenas uma entrada permanece, ou seja, a galectina humana-8. Clique no botão Exibir a estrutura 3D e informações no canto superior direito do item listado para exibir informações detalhadas da galectina humana-8 interagindo com NeuAc(a2-3)Gal(b1-4)GlcNAc.
    5. Acesse as informações estruturais sobre galectina humana-8 exibidas na página com dois espectadores diferentes.
      1. Segure o mouse para virar a molécula e trazer o ligante à tona com o software Litemol26 integrado para mostrar a estrutura 3D da lectina. Mouse sobre uma das interações listadas à esquerda para atualizar a visão à direita e localizar onde essa interação particular atua na estrutura com o software PLIP27 integrado para detalhar as interações atômicas entre a lectina e o ligante (Figura 6).
    6. Clique em qualquer botão verde que se vincule às entradas correspondentes no UniProt, PDB (sites europeus ou americanos) e GlyConnect para explorar essas referências cruzadas.

2. Explorar e comparar O-glycomes em GlyConnect

  1. Navegar no HGI desafia o conjunto de dados de alta confiança
    NOTA: O conjunto de dados HGI mencionado na introdução é armazenado no banco de dados GlyConnect. Contém 163 N-e 23 O-glycopeptides encontrados em 37 glicoproteínas consideradas como uma lista de alta confiança. O GlyConnect Compozitor28 é fundamental para avaliar a consistência dos dados de glycome. É importante ressaltar que o Compozitor permite nódulos virtuais (mostrados em cinza) quando apenas um passo intermediário é necessário para conectar os nódulos isolados. Dessa forma, os nós virtuais apertam o gráfico e podem ser interpretados como estruturas potencialmente perdidas nos resultados experimentais.
    1. Navegue pelo conjunto de dados HGI a partir da página inicial do GlyConnect indo diretamente para a página de referência do artigo: https://glyconnect.expasy.org/browser/references/2943.
      NOTA: O resumo nos botões coloridos reflete parcialmente os números fornecidos no artigo. No entanto, se apenas 69 peptídeos únicos forem listados, isso reflete múltiplas associações entre peptídeos e locais ou estruturas. No artigo, um glicocopeptídeo é definido como uma combinação única de um peptídeo e uma composição. Em GlyConnect, os glicosites são primeiro considerados, e eles são descritos como uma combinação de um peptídeo com estruturas. Isso explica a discrepância nos números entre o GlyConnect e a citação acima.
    2. Verifique a alta frequência de ocorrência de composições ligadas a N, como Hex:5 HexNAc:4 NeuAc:2, identificado em 42 locais em 43 peptídeos em oposição à singularidade frequente da maioria das composições ligadas ao O identificadas em 1 sítio em 1 peptídeo.
    3. Clique no link Compozitor no lado direito da página de entrada de referência para avaliar a consistência do conjunto de dados. Certifique-se de que a ferramenta Compozitor processe diretamente o DOI da referência e preencha o campo de pesquisa com referência=10.1101/2021.03.14.435332 na guia Avançado da ferramenta. Tipo &glycan_type=O-vinculado após o número DOI para reduzir a pesquisa para glícans ligados ao O, de modo que a consulta se torne: referência=10.1101/2021.03.14.435332&glycan_
      type=O-linked
    4. Clique no botão Adicionar à Seleção para recuperar dados do banco de dados (há 20 composições vinculadas a O). Mantenha a opção Incluir nodes virtuais selecionada. Clique no botão Gráfico de Computação para exibir o gráfico de composições conectadas. Este resultado destaca várias lacunas na continuidade esperada da biossíntese glican com nove nódulos virtuais necessários para completar o gráfico (Figura 7).
  2. Comparando com o O-glycome de uma proteína séum selecionada em GlyConnect
    NOTA: Para avaliar se as lacunas podem ser preenchidas por dados armazenados no GlyConnect, foi selecionada uma proteína O-glicosylated das 37 listadas com a referência. No conjunto de dados, o inibidor de inter-alfa-trippsina H4 (Q14624) é relatado como um O-glicosylated no Thr-725.
    1. Vá para a guia Proteína do GlyConnect Compozitor (ver passo 2.1.3). Na lista de proteínas , selecione inibidor inter-alfa-trippsina cadeia pesada H4. Certifique-se de que a seleção de espécies é Homo sapiens por padrão. Desmarque n-ligado no tipo glicano. Selecione apenas o Thr-725 na lista do Site clicando primeiro no sinal de menos à esquerda do Site para desmarcar todos os sites e, em seguida, selecionar apenas o Thr-725 da lista.
    2. Clique no botão Adicionar à Seleção (observe que seis composições estão associadas ao Thr-725). Clique no botão Gráfico computacional para exibir o gráfico de composições conectadas (Figura Suplementar 8).
    3. Observe o gráfico exibido, que mostra as 17 composições únicas das 20 composições vinculadas ao O do conjunto de dados do artigo em azul e as três únicas de seis no banco de dados em vermelho. Em outras palavras, a sobreposição entre as duas fontes está presente em três composições que estão representadas em magenta. Observe que uma rotação de 45° do gráfico é gerada automaticamente.
      NOTA: O número de nódulos virtuais é reduzido em um. Como se vê, h2N2S1 ausente nas 20 composições ligadas ao O do conjunto de dados do artigo e representado como um nó virtual está agora preenchido com uma composição adicional associada ao Thr-725 do inibidor inter-alfa-trypsin cadeia pesada H4 no banco de dados. Isso simplifica a topologia do gráfico porque dois outros nós virtuais são inúteis, pois eram opções alternativas para preencher a lacuna entre H1N2S1 e H2N2S2. No entanto, uma segunda composição importada do banco de dados seria isolada se não fosse a criação de dois novos nós virtuais alternativos H2N2F1S1 e H1N2F2S1.
    4. Para dar sentido aos nós virtuais, verifique se as composições correspondentes estão presentes no GlyConnect. Para fazer isso, clique no botão Exportar abaixo do gráfico. Selecione Virtual apenas desmarcando todas as outras opções. Clique no ícone da área de transferência para copiar a seleção de 8 composições.
    5. Cole a seleção na janela de consulta da guia Personalizado do Compozitor. Selecione O-linked no campo Tipo Glycan . Defina o rótulo de seleção no campo Composições para, por exemplo, VN para nomear a lista de 8 composições. Clique no botão Adicionar à seleção e, em seguida, no botão Gráfico de Cálculo . Todos os nós virtuais são agora exibidos como nós verdes (Figura 8).

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

A primeira parte do protocolo (seção 1) mostrou como investigar a especificidade ou a comunalidade dos N-glicanos anexados no Asn-69 do antígeno específico da próstata humana (PSA) usando a plataforma GlyConnect. As variações dependentes de tecidos (urina e fluido seminal), bem como variações dependentes de isoforme (iB normal e alta) na expressão glica, foram enfatizadas utilizando duas ferramentas de visualização (Figura 4 e Figura 5).

Primeiro, o GlyConnect Octopus, que exibe associações entre entidades armazenadas no banco de dados, proporcionou a oportunidade de explorar informações contextuais através ( 1) selecionando diferentes entidades a serem mostradas no Polvo e (2) clicando em links para examinar entradas relacionadas. O resultado foram associações distintas dependendo do tecido.

Em segundo lugar, o GlyConnect Compozitor, originalmente projetado para definir/refinar um arquivo de composição para identificação de glicoptocida, foi usado para avaliar a expressão glican em duas isoformas psa conhecidas (pI normal e alta). A comparação de cada gligrava isoforme produziu um gráfico bem conectado com quatro nós (composições), dois dos quais são característicos do alto ioforme do IE. Embora a sobreposição de gli renda seja significativa, o gráfico de barras de propriedade glicano mostrou uma queda da sialylation do comum para o alto isoforme do IB (Figura Suplementar 5).

Além disso, a exploração do UniLectin3D destaca a galectina-8 como um possível leitor do glycome PSA, uma vez que esta última contém muitas estruturas com um epitope terminal NeuAc(a2-3)Gal(b1-4)GlcNAc. Isso fornece uma pista a seguir e não pode ser considerado como prova final. No entanto, psa e galectinas são conhecidos por desempenhar um papel essencial no câncer de próstata29 e o papel específico de Galectin-8 foi recentemente destacado30. A primeira parte do protocolo correlaciona dados estruturais (glicoproteomics) e funcionais (vinculantes) para estabelecer um cenário provável para interações proteína-proteína mediadas por glicanos.

Na segunda parte do protocolo (seção 2), foi examinado um conjunto de composições O-glycan de alta qualidade associadas a um determinado tecido (soro humano) e comparado ao conteúdo do banco de dados GlyConnect, oferecendo assim a opção de personalizar um arquivo de composição glicano para a identificação refinada de glycopeptides (Figura 7 e Figura 8 ). Ele poderia contar com o conjunto mínimo de 20 composições disponíveis a partir de um conjunto de dados (resultados de desafio hgi) ou ser aprimorado com 23 a 26 itens coletados racionalmente no GlyConnect para fortalecer a consistência do conjunto.

vermelho laranja leve verde azul claro roxo rosa azul escuro marrom laranja escura
espécie proteína fonte de tecido estrutura composição doença referência glicosite peptídeo

Tabela 1: Esquema de cores associado a cada entidade do banco de dados GlyConnect e válido em todo o país.

Figure 1
Figura 1: Roda de dependência de Glyco@Expasy instantânea para GlyConnect. Clique aqui para ver uma versão maior desta figura.

Figure 2
Figura 2: Estrutura glican sugerida para uma composição glican selecionada. Sugeriu estrutura glica a partir de um experimento glicêmico para uma composição glican de um experimento glicoproteomico direcionado à mesma glicoproteína, aqui antígeno específico da próstata humana (PSA), como proposto na página GlyConnect para PSA (ID: 790). Clique aqui para ver uma versão maior desta figura.

Figure 3
Figura 3: Menu lateral à direita da página GlyConnect para PSA. Referências cruzadas clicáveis a outros principais bancos de dados e exibição com plugin límbo LiteMol da estrutura 3D existente no PDB. Clique aqui para ver uma versão maior desta figura.

Figure 4
Figura 4: A saída do Polvo GlyConnect mostrando associações dependentes de tecidos entre proteínas e glicanos. A consulta Híbrida e Sialylated retornou todas as composições que correspondem a esses critérios e cada composição une as informações associadas sobre proteínas e glicocanos, conforme registrado no banco de dados. Observe que por padrão As espécies são definidas como Homo sapiens, mas esta opção é modificável. Aqui, o GlyConnect Octopus exibe todas as proteínas humanas (nós esquerdos) carregando estruturas glicas híbridas e sialylated (nós da direita) com os tecidos em que são expressos (nós centrais). (A) Destacam-se as associações com a urina mostrando duas proteínas: a coriogonadotropina (GLHA_HUMAN) e a isoforma comum psa (KLK3_HUMAN) conectadas a estruturas glicansas dispersas (heterogêneas). (B) Destacam-se as associações com fluido seminal mostrando duas isóformas proteicas de PSA (KLK3_HUMAN) ligadas a estruturas glican agrupadas (semelhantes). Clique aqui para ver uma versão maior desta figura.

Figure 5
Figura 5: A saída do GlyConnect Compozitor mostrando as N-glycomes sobrepostas dos dois isoformes de PSA. Composições em etiqueta de notação condensada cada nó. Os glicanos associados à isoforme comum são representados como nós azuis e os do alto ioforme do IE como nós vermelhos. A sobreposição entre os glycomes é mostrada como nós magenta. Os números dentro dos nódulos representam o número de estruturas glican que correspondem à composição rotulada de acordo com o conteúdo do banco de dados GlyConnect em relação ao PSA. O gráfico Compozitor mostrado foi ligeiramente modificado da saída bruta para desembaraçar a rede gerada pela biblioteca D3.js. Isso é fácil de fazer, pois qualquer nó pode ser arrastado no espaço da janela do navegador onde um usuário desejar, e os caminhos podem, portanto, ser encurtados ou esticados. O usuário pode digitar uma composição específica no campo Zoom On no canto superior direito para ampliar e centralizar o gráfico no nó correspondente. Clique aqui para ver uma versão maior desta figura.

Figure 6
Figura 6: Entrada sumária da galectina humana-8 com NeuAc(a2-3)Gal(b1-4)GlcNAc detalhes de vinculação. Clicando no botão verde Exibir o botão Estrutura 3D e Informações (indicado com uma elipse vermelha) abre uma nova página na qual um close-up sobre interações de resíduos é exibido com o aplicativo PLIP (indicado por uma seta vermelha). Clique aqui para ver uma versão maior desta figura.

Figure 7
Figura 7: A saída do GlyConnect Compozitor mostrando o O-glycome do conjunto de dados de alta confiança do soro humano do desafio HGI. Sem nódulos virtuais (ver texto), a conectividade desse gráfico é baixa. Clique aqui para ver uma versão maior desta figura.

Figure 8
Figura 8: A saída do GlyConnect Compozitor mostrando a possibilidade de conclusão do O-glycome do conjunto de dados de alta confiança do soro humano do desafio HGI, usando o conteúdo do banco de dados GlyConnect. Acessar o conteúdo de todo o banco de dados GlyConnect usando a guia Custom do Compozitor revela que as composições correspondentes aos nós virtuais são mapeadas com estruturas definidas existentes como destacado nos rótulos de nó. O tamanho do nó representa o número de referências armazenadas no banco de dados e a comunicação da composição correspondente. O rótulo numérico de nódulos denota o número de estruturas correspondentes armazenadas em GlyConnect. As composições selecionadas parecem ter de zero a dezoito correspondências possíveis no banco de dados. Na verdade, esses nós são apenas virtuais como reflexo do conteúdo de conjuntos de dados experimentais. Recomenda-se refinar as informações no gráfico para testar o realismo desses nódulos adicionais. Clique aqui para ver uma versão maior desta figura.

Figura suplementar 1: Gráfico de bolhas da página inicial Glyco@Expasy. Ampliando o gráfico de bolhas da página inicial Glyco@Expasy para focar na categoria glicoproteína . Software mostrado em bolhas verdes e bancos de dados em bolhas amarelas. Clicar em qualquer bolha resume o propósito do recurso. Clique aqui para baixar este Arquivo.

Figura suplementar 2: Associações recuperadas por polvo que correspondem à consulta dependendo da composição. Display GlyConnect Octopus padrão de proteínas humanas (nódulos esquerdos) carregando estruturas glicas híbridas e sialylated (nódulos à direita) com composições correspondentes (nodes centrais). A composição H6N4F12S1 parece única tanto para isoforms PSA (KLK3_HUMAN). Clicar na estrutura única ID (10996) abre a página correspondente com detalhes mostrando que os dois isoformes são de fato as únicas proteínas que carregam este glicano em particular. Clique aqui para baixar este Arquivo.

Figura suplementar 3: Associações recuperadas por polvo que correspondem à consulta dependendo da doença. GlyConnect Octopus exibe todas as proteínas humanas (nós esquerdos) carregando estruturas glicas híbridas e sialylated (nós da direita) com as doenças em que são expressas (nós centrais). As associações com câncer de próstata são destacadas mostrando a isoforma comum do PSA (KLK3_HUMAN). Clique aqui para baixar este Arquivo.

Figura suplementar 4: Associações recuperadas por polvo que correspondem à consulta dependendo das informações do tecido. GlyConnect Octopus exibe todas as proteínas humanas (nós esquerdos) carregando estruturas glicas bi-antenas, incluindo o motivo NeuAc(a1-3)Gal(b1-4)GlcNAc (nós da direita) com os tecidos em que são expressos (nós centrais). As associações com fluido seminal são destacadas mostrando apenas a isoforma comum do PSA (KLK3_HUMAN) e sete estruturas. Clique aqui para baixar este Arquivo.

Figura suplementar 5: A saída do GlyConnect Compozitor mostrando as N-glycomes sobrepostas das duas isoformas da PSA. Composições em notação condensada estão rotulando cada nó. Os glicanos associados à isoforme comum são representados como nós azuis e os do alto ioforme do IE como nós vermelhos. A sobreposição entre os glycomes é mostrada como nós magenta. Os números dentro dos nódulos representam o número de estruturas glican que correspondem à composição rotulada de acordo com o conteúdo do banco de dados GlyConnect em relação ao PSA. Mousing sobre o gráfico de barras de propriedades glicas mostra a correspondência entre a frequência e os nós como bolhas laranjas. Quase todos os nós isoformes comuns da PSA estão cobertos. Esta frequência cai no alto ioforme do II. Clique aqui para baixar este Arquivo.

Figura suplementar 6: Interface de pesquisa glycan em UniLectin3D. Clicando no símbolo SNFG ácido sílico (circulado em vermelho) lança a busca por todos os ligantes que contêm NeuAc, armazenados em UniLectin3D. Clique aqui para baixar este Arquivo.

Figura suplementar 7: Trecho da saída da busca por todos os ligantes que contenham NeuAc. O motivo de interesse neuAc(a2-3)Gal(b1- 4)GlcNAc é circulado em vermelho. Clique aqui para baixar este Arquivo.

Figura suplementar 8: A saída do GlyConnect Compozitor mostrando o O-glycome do conjunto de dados HGI sobreposto com o do GlyConnect. A saída do GlyConnect Compozitor mostrando o O-glycome do conjunto de dados de alta confiança do soro humano do desafio HGI em azul sobreposto com o O-glycome de uma proteína O-glicosylated dos 37 listados com a referência, ou seja, inibidor inter-alfa-trippsin pesado cadeia H4 com informações adicionais contidas no GlyConnect. Isso aumenta a conectividade do gráfico. Clique aqui para baixar este Arquivo.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

GlyConnect Octopus como uma ferramenta para revelar correlações inesperadas
O GlyConnect Octopus foi originalmente projetado para consultar o banco de dados com uma definição frouxa de glicocanos. De fato, a literatura frequentemente relata as principais características dos glicanos em uma glycome, como ser fucosylated ou sialylated, ser feito de duas ou mais antenas, etc. Além disso, os glicocanos, sejam N ou O-vinculados, são classificados em núcleos, conforme detalhado no manual de referência Essentials of Glicobiology1, que também são frequentemente citados em artigos publicados. Finalmente, epítopos glicanos como antígenos de grupo sanguíneo são mais uma propriedade procurada em estruturas e potencialmente apontadas para digitar um glicano. No final, pode ser relevante procurar características comuns ou distintas de um gli vir expresso em um tecido específico ou espécies selecionadas. Nesse sentido, as informações coletadas devem ser usadas como fonte de novas suposições em oposição a fatos únicos.

GlyConnect Compozitor como uma ferramenta para moldar um conjunto de composição glycan
Navegar informações estruturais como descrito em uma página de proteína tem limitações porque listas tendem a obscurecer as relações entre estruturas itemizadas, bem como aquelas entre as composições. GlyConnect Octopus atende ao primeiro e GlyConnect Compozitor para o último. Uma análise cuidadosa das estruturas listadas na maioria das entradas do GlyConnect revela a existência de subestruturas comuns. No entanto, essas informações não são fáceis de entender visualmente sem a ajuda de um espectador dedicado.

O conteúdo do arquivo de composição glicano que sustenta a identificação da moiety glicano como parâmetro-chave do software de identificação de glicoptoptida foi estabelecido através da análise dos resultados do desafio HGI. A maioria dos mecanismos de busca de proteômica clássica acomoda a seleção de modificações baseadas em glico de uma coleção que deriva de dados coletados em bancos de dados/repositórios ou na literatura. Outras ferramentas dedicadas à glicoproteomia utilizam o conhecimento da biossíntese glicana. Dessa forma, o arquivo de composição é teoricamente definido como resultado da atividade enzimática esperada. No final, há tantos arquivos de composição quanto há mecanismos de busca e a sobreposição entre eles é altamente variável. No entanto, aprender com a experiência passada em proteômica, especialmente quando as modificações pós-transacionais são contabilizadas, revela que o desempenho dos mecanismos de busca está correlacionado com a limitação do espaço de busca31. Observações semelhantes são feitas em glicoproteomia e o GlyConnect Compozitor foi projetado para apoiar a seleção de dados de composição educada, da qual foi discutida anteriormente32.

O uso desta ferramenta foi incompletamente ilustrado no protocolo especialmente no que diz respeito à guia Advanced , na qual podem ser expressas consultas que lançam diretamente o acesso programático ao GlyConnect através de sua API (Application Programming Interface). Por exemplo, digitar taxonomia=homo sapiens&glycanType=N-linked&tissue=urine&disease=prostate cancer in the query window of the Advanced tab é equivalente ao preenchimento dos campos correspondentes na guia Fonte (selecionando Homo sapiens em espécies, urina no tecido e n-ligado no tipo Glycan) e a guia Doença (selecionando Homo sapiens em Espécies, Câncer de próstata em Doença e N-ligado em Tipo Glycan). Em outras palavras, fornece em uma etapa um resultado que exigiria várias seleções.

Finalmente, enquanto a criação de nódulos virtuais é explicada no protocolo, sua potencial redundância precisa de um comentário adicional. Duas opções simultâneas podem ser indistinguíveis porque a ação simulada de enzimas no gráfico não explica a cronologia das atividades enzimáveis. É por isso que o Compozitor sugere dois caminhos através de dois nódulos virtuais para fazer a ponte de dois nódulos não ligados correspondentes a contagens de monossacarídeos com até duas diferenças. A inclusão de novos dados muitas vezes fornece links perdidos. O usuário é sempre livre para considerar ou descartar nódulos virtuais, por (un)marcar a caixa Incluir Nodes Virtuais .

Bancos de dados conhecidos e limitações de software
No geral, como em qualquer navegação na Web, os protocolos descritos acima ocasionalmente levam a uma página inexistente, muitas vezes devido a uma atualização de um site ou a um conflito de atualizações entre dois sites. Neste caso e, de fato, em todos os casos em que a navegação não está fluindo, o mais fácil é enviar uma nota para o helpdesk expasy cuja eficiência contribuiu significativamente para o sucesso do portal nos últimos 28 anos.

O conteúdo do GlyConnect é tendencioso como reflexo dos desequilíbrios atuais na literatura. A maioria das publicações relata n-glicosylation em mamíferos e o banco de dados é mais rico em N-glicoproteínas humanas. No entanto, foi-nos solicitado no passado a incluir conjuntos de dados menos comuns e a permanecer completamente aberto ao recebimento de conselhos e sugestões.

Além disso, a Compozitor está atualmente limitada à comparação de três conjuntos de dados de composição. Uma grande revisão do subtab determinante no Polvo está planejada. Os recursos de Glyco@Expasy necessitam de atualizações regulares e alguns podem não ser realizados no devido tempo; no entanto, avisos e/ou anúncios são publicados quando isso acontece.

Portais parceiros, conhecidos como GlyGen (https://www.glygen.org) e GlyCosmos (https://www.glycosmos.org), oferecem diferentes opções e ferramentas. Em última análise, navegar e pesquisar informações sobre qualquer uma das opções implica um alto nível de subjetividade e depende em grande parte dos hábitos e preocupações dos usuários. Só podemos esperar que nossa solução sirva para uma parte da comunidade.

A contribuição da glicociência está crescendo em projetos de ciências da vida e estudos que estabelecem o papel dos glicanos em questões de saúde são continuamente produzidos. O foco recente no Sars-Cov-2 revelou mais uma vez a importância das proteínas glicosiladas, especialmente em abordagens estruturais33. A Glicoinformática apoia os glicoscientistas nas tarefas diárias de análise e interpretação de dados.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Os autores não declaram conflitos de interesse.

Acknowledgments

O autor reconhece calorosamente membros passados e atuais do Grupo de Informática Proteome envolvidos no desenvolvimento dos recursos utilizados neste tutorial, especificamente, Julien Mariethoz e Catherine Hayes para GlyConnect, François Bonnardel para UniLectin, Davide Alocci, e Frederic Nikitin para o Polvo, e Thibault Robin para Compozitor e toque final em Octopus.

O desenvolvimento do projeto glyco@Expasy é apoiado pelo Governo Federal suíço, por meio da Secretaria de Estado da Educação, Da Pesquisa e Inovação (SERI) e atualmente é complementado pela Fundação Nacional de Ciências da Suíça (SNSF: 31003A_179249). A ExPASy é mantida pelo Instituto Suíço de Bioinformática e hospedada no Vital-IT Competency Center. A autora também reconhece Anne Imberty pela excelente cooperação na plataforma UniLectin apoiada conjuntamente pela ANR PIA Glyco@Alps (ANR-15-IDEX-02), Alliance Campus Rhodanien Co-funds (http://campusrhodanien.unige-cofunds.ch) Labex Arcane/CBH-EUR-GS (ANR-17-EURE-0003).

Materials

Name Company Catalog Number Comments
internet connection user's choice
recent version of web browser user's choice

DOWNLOAD MATERIALS LIST

References

  1. Spring Harbor Laboratory Press. Essentials of Glycobiology. , Spring Harbor Laboratory Press. Cold Spring Harbor (NY). (2015).
  2. Gray, C. J., et al. Advancing solutions to the carbohydrate sequencing challenge. Journal of the American Chemical Society. 141 (37), 14463-14479 (2019).
  3. Tsuchiya, S., Yamada, I., Aoki-Kinoshita, K. F. GlycanFormatConverter: a conversion tool for translating the complexities of glycans. Bioinformatics. 35 (14), 2434-2440 (2018).
  4. Fujita, A., et al. The international glycan repository GlyTouCan version 3.0. Nucleic Acids Research. 49, 1529-1533 (2021).
  5. Alocci, D., et al. GlyConnect: glycoproteomics goes visual, interactive, and analytical. Journal of Proteome Research. 18 (2), 664-677 (2019).
  6. York, W. S., et al. GlyGen: computational and informatics resources for glycoscience. Glycobiology. 30 (2), 72-73 (2020).
  7. Watanabe, Y., Aoki-Kinoshita, K. F., Ishihama, Y., Okuda, S. GlycoPOST realizes FAIR principles for glycomics mass spectrometry data. Nucleic Acids Research. 49, 1523-1528 (2020).
  8. Campbell, M. P., Aoki-Kinoshita, K. F., Lisacek, F., York, W. S., Packer, N. H. Glycoinformatics. Essentials of Glycobiology. , (2015).
  9. Cao, W., et al. Recent advances in software tools for more generic and precise intact glycopeptide analysis. Molecular & Cellular Proteomics. 20, 100060 (2021).
  10. Mariethoz, J., Hayes, C., Lisacek, F. Glycan compositions with Compozitor to enhance glycopeptide identification. Proteomics Data Analysis. 2361, 109-127 (2021).
  11. Kawahara, R., et al. Communityevaluation of glycoproteomics informatics solutions reveals high-performance search strategies of serum glycopeptide analysis. Nature Methods. 18, 1304-1316 (2021).
  12. Lisacek, F., Aoki-Kinoshita, K. F., Vora, J. K., Mazumder, R., Tiemeyer, M. Glycoinformatics resources integrated through the GlySpace Alliance. Comprehensive Glycoscience. 1, 507-521 (2021).
  13. Mariethoz, J., et al. Glycomics@ExPASy: bridging the gap. Molecular & Cellular Proteomics. 17 (11), 2164-2176 (2018).
  14. Duvaud, S., et al. Expasy, the swiss bioinformatics resource portal, as designed by its users. Nucleic Acids Research. 49, 216-227 (2021).
  15. The UniProt Consortium et al. UniProt: the universal protein knowledgebase in 2021. Nucleic Acids Research. 49, 480-489 (2021).
  16. Bonnardel, F., Perez, S., Lisacek, F., Imberty, A. Structural database for lectins and the UniLectin web platform. Lectin Purification and Analysis. 2132, 1-14 (2020).
  17. Neelamegham, S., et al. Updates to the symbol nomenclature for glycans guidelines. Glycobiology. 29 (9), 620-624 (2019).
  18. Sharon, N. IUPAC-IUB Joint Commission on Biochemical Nomenclature (JCBN). Nomenclature of glycoproteins, glycopeptides and peptidoglycans: JCBN recommendations 1985. Glycoconjugate Journal. 3 (2), 123-133 (1986).
  19. Harvey, D. J., et al. Proposal for a standard system for drawing structural diagrams of N- and O-linked carbohydrates and related compounds. Proteomics. 9 (15), 3796-3801 (2009).
  20. Song, E., Mayampurath, A., Yu, C. -Y., Tang, H., Mechref, Y. Glycoproteomics: identifying the glycosylation of prostate specific antigen at normal and high isoelectric points by LC-MS/MS. Journal of Proteome Research. 13 (12), 5570-5580 (2014).
  21. Moran, A. B., et al. Profiling the proteoforms of urinary prostate-specific antigen by capillary electrophoresis - mass spectrometry. Journal of Proteomics. 238, 104148 (2021).
  22. Wang, W., et al. High-throughput glycopeptide profiling of prostate-specific antigen from seminal plasma by MALDI-MS. Talanta. 222, 121495 (2021).
  23. wwPDB consortium metal. Protein Data Bank: the single global archive for 3D macromolecular structure data. Nucleic Acids Research. 47, 520-528 (2019).
  24. Sehnal, D., Grant, O. C. Rapidly display glycan symbols in 3D structures: 3D-SNFG in LiteMol. Journal of Proteome Research. 18 (2), 770-774 (2019).
  25. Bonnardel, F., et al. UniLectin3D, a database of carbohydrate binding proteins with curated information on 3D structures and interacting ligands. Nucleic Acids Research. 47, 1236-1244 (2019).
  26. Sehnal, D., et al. LiteMol suite: interactive web-based visualization of large-scale macromolecular structure data. Nature Methods. 14 (12), 1121-1122 (2017).
  27. Salentin, S., Schreiber, S., Haupt, V. J., Adasme, M. F., Schroeder, M. PLIP: fully automated protein-ligand interaction profiler. Nucleic Acids Research. 43, 443-447 (2015).
  28. Robin, T., Mariethoz, J., Lisacek, F. Examining and fine-tuning the selection of glycan compositions with GlyConnect Compozitor. Molecular & Cellular Proteomics. 19 (10), 1602-1618 (2020).
  29. Compagno, D., et al. Glycans and galectins in prostate cancer biology, angiogenesis and metastasis. Glycobiology. 24 (10), 899-906 (2014).
  30. Gentilini, L. D., et al. Stable and high expression of Galectin-8 tightly controls metastatic progression of prostate cancer. Oncotarget. 8 (27), 44654-44668 (2017).
  31. Schwämmle, V., Verano-Braga, T., Roepstorff, P. Computational and statistical methods for high-throughput analysis of post-translational modifications of proteins. Journal of Proteomics. 129, 3-15 (2015).
  32. Khatri, K., Klein, J. A., Zaia, J. Use of an informed search space maximizes confidence of site-specific assignment of glycoprotein glycosylation. Analytical and Bioanalytical Chemistry. 409 (2), 607-618 (2017).
  33. Sztain, T., et al. A glycan gate controls opening of the SARS-CoV-2 spike protein. Nature Chemistry. 13, 963-968 (2021).

Tags

Biologia Edição 179
Recursos bioinforáticos para o estudo de interações proteicas mediadas por glicanos
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Lisacek, F. Bioinformatics Resources More

Lisacek, F. Bioinformatics Resources for the Study of Glycan-Mediated Protein Interactions. J. Vis. Exp. (179), e63356, doi:10.3791/63356 (2022).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter