Summary

Recursos bioinformáticos para el estudio de las interacciones de proteínas mediadas por glicanos

Published: January 20, 2022
doi:

Summary

Este protocolo ilustra cómo explorar, comparar e interpretar los glicomas de proteínas humanas con recursos en línea.

Abstract

La iniciativa Glyco@Expasy se lanzó como una colección de bases de datos y herramientas interdependientes que abarcan varios aspectos del conocimiento en glicobiología. En particular, tiene como objetivo resaltar las interacciones entre las glicoproteínas (como los receptores de la superficie celular) y las proteínas de unión a carbohidratos mediadas por glicanos. Aquí, los principales recursos de la colección se presentan a través de dos ejemplos ilustrativos centrados en el N-glicoma del antígeno prostático específico (PSA) humano y el O-glicoma de las proteínas séricas humanas. A través de diferentes consultas de bases de datos y con la ayuda de herramientas de visualización, este artículo muestra cómo explorar y comparar contenido en un continuo para recopilar y correlacionar piezas de información dispersas. Los datos recopilados están destinados a alimentar escenarios más elaborados de la función del glicano. La glicoinformática introducida aquí se propone, por lo tanto, como un medio para fortalecer, dar forma o refutar las suposiciones sobre la especificidad de un glicoma proteico en un contexto dado.

Introduction

Los glicanos, proteínas a las que están unidos (glicoproteínas) y proteínas a las que se unen (lectinas o proteínas de unión a carbohidratos) son los principales actores moleculares en la superficie celular1. A pesar de este papel central en la comunicación célula-célula, los estudios a gran escala, incluidos los datos de glicómica, glicoproteómica o glicano-interactómica, siguen siendo escasos en comparación con su contraparte en genómica y proteómica.

Hasta hace poco, no se habían desarrollado métodos para caracterizar las estructuras ramificadas de los carbohidratos complejos sin dejar de conjugarse con la proteína portadora. La biosíntesis de glicoproteínas es un proceso no basado en plantillas en el que los donantes de monosacáridos, los sustratos de glicoproteínas que aceptan y las glicosiltransferasas y glucosidasas desempeñan un papel interactivo. Las glicoproteínas resultantes pueden soportar estructuras complejas con múltiples puntos de ramificación donde cada componente monosacárido puede ser uno de los varios tipos presentes en la naturaleza1. El proceso no basado en plantillas impone el análisis bioquímico como la única opción para generar datos estructurales de oligosacáridos. El proceso analítico de las estructuras de glicanos unidas a una proteína nativa a menudo es un desafío, ya que requiere tecnologías sensibles, cuantitativas y robustas para determinar la composición de monosacáridos, enlaces y secuencias de ramificación2.

En este contexto, la espectrometría de masas (EM) es la técnica más utilizada en experimentos de glucómica y glicoproteómica. A medida que pasa el tiempo, estos se llevan a cabo en configuraciones de mayor rendimiento y los datos ahora se acumulan en las bases de datos. Estructuras de glicanos en varios formatos3, rellenen GlyTouCan4, el repositorio universal de datos de glicanos donde cada estructura está asociada con un identificador estable independientemente del nivel de precisión con el que se defina el glicano (por ejemplo, posiblemente falta el tipo de enlace o la composición ambigua). Se recogen estructuras muy similares, pero sus pequeñas diferencias se informan claramente. Las glicoproteínas se describen y curan en GlyConnect5 y GlyGen6, dos bases de datos que se cruzan entre sí. Los datos de EM que respaldan las piezas estructurales de evidencia se almacenan cada vez más en GlycoPOST7. Para una cobertura más amplia de los recursos en línea, el capítulo 52 del manual de referencia, Essentials of Glycobiology, está dedicado a la glicoinformática8. Curiosamente, el software de identificación de glicopéptidos ha proliferado en los últimos años9,10 aunque no en beneficio de la reproducibilidad. Esta última preocupación llevó a los líderes de la Iniciativa de Glicoproteómica (HGI) de HUPO a establecer un desafío de software en 2019. Los datos de EM obtenidos del procesamiento de mezclas complejas de proteínas séricas humanas N- y O-glicosiladas en los modos de fragmentación CID, ETD y EThcD, se pusieron a disposición de los competidores, ya sean usuarios de software o desarrolladores. El informe completo sobre los resultados de este desafío11 solo se describe aquí. Para empezar, se observó una propagación de identificaciones. Se interpretó principalmente como causado por la diversidad de métodos implementados en los motores de búsqueda, de sus configuraciones y cómo se filtraron las salidas y se “contaron” los péptidos. El diseño experimental también puede haber puesto algunos software y enfoques en una (des)ventaja. Es importante destacar que los participantes que usaron el mismo software informaron resultados inconsistentes, destacando así graves problemas de reproducibilidad. Se concluyó comparando diferentes presentaciones que algunas soluciones de software funcionan mejor que otras y algunas estrategias de búsqueda producen mejores resultados. Es probable que esta retroalimentación guíe la mejora de los métodos automatizados de análisis de datos de glicopéptidos y, a su vez, afecte el contenido de la base de datos.

La expansión de la glicoinformática llevó a la creación de portales web que proporcionan información y acceso a múltiples recursos similares o complementarios. Los más recientes y actualizados se describen en un capítulo de la serie de libros Comprehensive Glycoscience12 y, a través de la cooperación, se ofrece una solución para el intercambio de datos y la información en un modo de acceso abierto. Se desarrolló uno de estos portales, que originalmente se llamó Glycomics@ExPASy 13 y pasó a llamarse Glyco@Expasy, tras la importante revisión de la plataforma Expasy14 que ha alojado una gran colección de herramientas y bases de datos utilizadas en varias ómicas durante décadas, siendo el elemento más popular UniProt15, la base de conocimiento universal de proteínas. Glyco@Expasy ofrece un descubrimiento didáctico del propósito y uso de bases de datos y herramientas, basado en una categorización visual y una visualización de sus interdependencias. El siguiente protocolo ilustra los procedimientos para explorar datos de glicómica y glicoproteómica con una selección de recursos de este portal que hace explícita la conexión entre la glicoproteómica y la glicano-interactómica a través de la glucómica. Tal como están las cosas, los experimentos glucómicos producen estructuras donde los monosacáridos están completamente definidos y los enlaces parcial o totalmente determinados, pero su unión al sitio de la proteína está mal caracterizada, si es que lo está. Por el contrario, los experimentos de glicoproteómica generan información precisa de unión al sitio, pero con una resolución deficiente de las estructuras de glicanos, a menudo limitadas a composiciones de monosacáridos. Esta información se reúne en la base de datos GlyConnect. Además, las herramientas de búsqueda en GlyConnect se pueden utilizar para detectar posibles ligandos de glicanos que se describen junto con las proteínas que los reconocen en UniLectin16, vinculados a GlyConnect a través de glicanos. El protocolo presentado aquí se divide en dos secciones para cubrir preguntas específicas de los glicanos y glicoproteínas ligados a N y O.

Protocol

NOTA: Se requiere un dispositivo con conexión a Internet (se prefiere una pantalla más grande) y un navegador web actualizado como Chrome o Firefox. El uso de Safari o Edge puede no ser tan confiable. 1. De una proteína N-glicoma en GlyConnect a una lectina de UniLectin Acceso a recursos desde Glyco@ExpasyNOTA: El procedimiento descrito aquí es acceder a GlyConnect, pero se puede aplicar para acceder a cualquier recurso registrado en la plata…

Representative Results

La primera parte del protocolo (sección 1) mostró cómo investigar la especificidad o la similitud de los N-glicanos unidos en Asn-69 del antígeno prostático específico (PSA) humano utilizando la plataforma GlyConnect. Las variaciones dependientes de tejidos (orina y líquido seminal), así como las variaciones dependientes de isoformas (pI normal y alta) en la expresión de glicanos, se enfatizaron utilizando dos herramientas de visualización (Figura 4 y <strong class…

Discussion

GlyConnect Octopus como herramienta para revelar correlaciones inesperadas
GlyConnect Octopus fue diseñado originalmente para consultar la base de datos con una definición suelta de glicanos. De hecho, la literatura a menudo informa de las principales características de los glicanos en un glicoma, como ser fucosilado o sialilado, estar hecho de dos o más antenas, etc. Además, los glicanos, ya sean N u O, enlazados se clasifican en núcleos, como se detalla en el manual de referencia Essentials<su…

Disclosures

The authors have nothing to disclose.

Acknowledgements

El autor reconoce calurosamente a los miembros pasados y presentes del Grupo de Informática Proteome involucrados en el desarrollo de los recursos utilizados en este tutorial, específicamente, Julien Mariethoz y Catherine Hayes para GlyConnect, François Bonnardel para UniLectin, Davide Alocci y Frederic Nikitin para Octopus, y Thibault Robin para Compozitor y el toque final sobre Octopus.

El desarrollo del proyecto glyco@Expasy cuenta con el apoyo del Gobierno Federal Suizo a través de la Secretaría de Estado de Educación, Investigación e Innovación (SERI) y actualmente se complementa con la Fundación Nacional Suiza para la Ciencia (SNSF: 31003A_179249). ExPASy es mantenido por el Instituto Suizo de Bioinformática y alojado en el Centro de Competencias Vital-IT. El autor también reconoce a Anne Imberty por su destacada cooperación en la plataforma UniLectin apoyada conjuntamente por ANR PIA Glyco@Alps (ANR-15-IDEX-02), Alliance Campus Rhodanien Co-funds (http://campusrhodanien.unige-cofunds.ch) Labex Arcane/CBH-EUR-GS (ANR-17-EURE-0003).

Materials

internet connection user's choice
recent version of web browser user's choice

References

  1. Spring Harbor Laboratory Press. . Essentials of Glycobiology. , (2015).
  2. Gray, C. J., et al. Advancing solutions to the carbohydrate sequencing challenge. Journal of the American Chemical Society. 141 (37), 14463-14479 (2019).
  3. Tsuchiya, S., Yamada, I., Aoki-Kinoshita, K. F. GlycanFormatConverter: a conversion tool for translating the complexities of glycans. Bioinformatics. 35 (14), 2434-2440 (2018).
  4. Fujita, A., et al. The international glycan repository GlyTouCan version 3.0. Nucleic Acids Research. 49, 1529-1533 (2021).
  5. Alocci, D., et al. GlyConnect: glycoproteomics goes visual, interactive, and analytical. Journal of Proteome Research. 18 (2), 664-677 (2019).
  6. York, W. S., et al. GlyGen: computational and informatics resources for glycoscience. Glycobiology. 30 (2), 72-73 (2020).
  7. Watanabe, Y., Aoki-Kinoshita, K. F., Ishihama, Y., Okuda, S. GlycoPOST realizes FAIR principles for glycomics mass spectrometry data. Nucleic Acids Research. 49, 1523-1528 (2020).
  8. Campbell, M. P., Aoki-Kinoshita, K. F., Lisacek, F., York, W. S., Packer, N. H. Glycoinformatics. Essentials of Glycobiology. , (2015).
  9. Cao, W., et al. Recent advances in software tools for more generic and precise intact glycopeptide analysis. Molecular & Cellular Proteomics. 20, 100060 (2021).
  10. Mariethoz, J., Hayes, C., Lisacek, F. Glycan compositions with Compozitor to enhance glycopeptide identification. Proteomics Data Analysis. 2361, 109-127 (2021).
  11. Kawahara, R., et al. Communityevaluation of glycoproteomics informatics solutions reveals high-performance search strategies of serum glycopeptide analysis. Nature Methods. 18, 1304-1316 (2021).
  12. Lisacek, F., Aoki-Kinoshita, K. F., Vora, J. K., Mazumder, R., Tiemeyer, M. Glycoinformatics resources integrated through the GlySpace Alliance. Comprehensive Glycoscience. 1, 507-521 (2021).
  13. Mariethoz, J., et al. Glycomics@ExPASy: bridging the gap. Molecular & Cellular Proteomics. 17 (11), 2164-2176 (2018).
  14. Duvaud, S., et al. Expasy, the swiss bioinformatics resource portal, as designed by its users. Nucleic Acids Research. 49, 216-227 (2021).
  15. The UniProt Consortium et al. UniProt: the universal protein knowledgebase in 2021. Nucleic Acids Research. 49, 480-489 (2021).
  16. Bonnardel, F., Perez, S., Lisacek, F., Imberty, A. Structural database for lectins and the UniLectin web platform. Lectin Purification and Analysis. 2132, 1-14 (2020).
  17. Neelamegham, S., et al. Updates to the symbol nomenclature for glycans guidelines. Glycobiology. 29 (9), 620-624 (2019).
  18. Sharon, N. IUPAC-IUB Joint Commission on Biochemical Nomenclature (JCBN). Nomenclature of glycoproteins, glycopeptides and peptidoglycans: JCBN recommendations 1985. Glycoconjugate Journal. 3 (2), 123-133 (1986).
  19. Harvey, D. J., et al. Proposal for a standard system for drawing structural diagrams of N- and O-linked carbohydrates and related compounds. Proteomics. 9 (15), 3796-3801 (2009).
  20. Song, E., Mayampurath, A., Yu, C. -. Y., Tang, H., Mechref, Y. Glycoproteomics: identifying the glycosylation of prostate specific antigen at normal and high isoelectric points by LC-MS/MS. Journal of Proteome Research. 13 (12), 5570-5580 (2014).
  21. Moran, A. B., et al. Profiling the proteoforms of urinary prostate-specific antigen by capillary electrophoresis – mass spectrometry. Journal of Proteomics. 238, 104148 (2021).
  22. Wang, W., et al. High-throughput glycopeptide profiling of prostate-specific antigen from seminal plasma by MALDI-MS. Talanta. 222, 121495 (2021).
  23. wwPDB consortium metal. Protein Data Bank: the single global archive for 3D macromolecular structure data. Nucleic Acids Research. 47, 520-528 (2019).
  24. Sehnal, D., Grant, O. C. Rapidly display glycan symbols in 3D structures: 3D-SNFG in LiteMol. Journal of Proteome Research. 18 (2), 770-774 (2019).
  25. Bonnardel, F., et al. UniLectin3D, a database of carbohydrate binding proteins with curated information on 3D structures and interacting ligands. Nucleic Acids Research. 47, 1236-1244 (2019).
  26. Sehnal, D., et al. LiteMol suite: interactive web-based visualization of large-scale macromolecular structure data. Nature Methods. 14 (12), 1121-1122 (2017).
  27. Salentin, S., Schreiber, S., Haupt, V. J., Adasme, M. F., Schroeder, M. PLIP: fully automated protein-ligand interaction profiler. Nucleic Acids Research. 43, 443-447 (2015).
  28. Robin, T., Mariethoz, J., Lisacek, F. Examining and fine-tuning the selection of glycan compositions with GlyConnect Compozitor. Molecular & Cellular Proteomics. 19 (10), 1602-1618 (2020).
  29. Compagno, D., et al. Glycans and galectins in prostate cancer biology, angiogenesis and metastasis. Glycobiology. 24 (10), 899-906 (2014).
  30. Gentilini, L. D., et al. Stable and high expression of Galectin-8 tightly controls metastatic progression of prostate cancer. Oncotarget. 8 (27), 44654-44668 (2017).
  31. Schwämmle, V., Verano-Braga, T., Roepstorff, P. Computational and statistical methods for high-throughput analysis of post-translational modifications of proteins. Journal of Proteomics. 129, 3-15 (2015).
  32. Khatri, K., Klein, J. A., Zaia, J. Use of an informed search space maximizes confidence of site-specific assignment of glycoprotein glycosylation. Analytical and Bioanalytical Chemistry. 409 (2), 607-618 (2017).
  33. Sztain, T., et al. A glycan gate controls opening of the SARS-CoV-2 spike protein. Nature Chemistry. 13, 963-968 (2021).

Play Video

Cite This Article
Lisacek, F. Bioinformatics Resources for the Study of Glycan-Mediated Protein Interactions. J. Vis. Exp. (179), e63356, doi:10.3791/63356 (2022).

View Video