Summary

글리칸 매개 단백질 상호작용 연구를 위한 생물정보학 자료

Published: January 20, 2022
doi:

Summary

이 프로토콜은 온라인 리소스로 인간 단백질 글리오를 탐색, 비교 및 해석하는 방법을 보여줍니다.

Abstract

Glyco@Expasy 이니셔티브는 당생물학 지식의 여러 측면에 걸친 상호 의존적 데이터베이스 및 도구 모음으로 시작되었습니다. 특히, 당단백질 (예 : 세포 표면 수용체)과 글리칸에 의해 매개되는 탄수화물 결합 단백질 간의 상호 작용을 강조하는 것을 목표로합니다. 여기서, 수집의 주요 자원은 인간 전립선 특이적 항원 (PSA)의 N 글리코메와 인간 혈청 단백질의 O-글리코메에 중심을 둔 두 가지 예시적인 예를 통해 소개된다. 다양한 데이터베이스 쿼리를 통해 시각화 도구를 통해 이 문서에서는 연속체의 콘텐츠를 탐색하고 비교하여 흩어져 있는 정보를 수집하고 상호 연관시키는 방법을 보여 줍니다. 수집 된 데이터는 글리 칸 기능의보다 정교한 시나리오를 제공 할 운명입니다. 따라서 여기에 소개된 글리코인포매틱스는 주어진 맥락에서 단백질 글리코메의 특이성에 대한 가정을 강화, 형성 또는 반박하는 수단으로서 제안된다.

Introduction

글리칸, 그들이 붙어있는 단백질 (당단백질) 및 그들이 결합하는 단백질 (렉틴 또는 탄수화물 결합 단백질)은 세포 표면의 주요 분자 작용자입니다1. 세포 – 세포 통신에서 이러한 중심 역할에도 불구하고, 글리 코믹스, 글리 프로테오믹스 또는 글리칸 – 상호 작용 데이터를 포함한 대규모 연구는 유전체학 및 단백체학에서 그들의 대응물에 비해 여전히 부족합니다.

최근까지, 운반체 단백질에 여전히 접합되는 동안 복합 탄수화물의 분지화 구조를 특성화하는 방법은 개발되지 않았다. 당단백질의 생합성은 단당류 공여체, 수용된 당단백질 기질, 글리코실트랜스퍼라제와 글리코시다제가 상호작용적인 역할을 하는 비주형 주도 과정이다. 생성 된 당단백질은 각 단당류 성분이 자연에 존재하는 여러 유형 중 하나 일 수있는 여러 분지점을 가진 복잡한 구조를 가질 수 있습니다1. 비주형 주도 공정은 올리고당 구조 데이터를 생성하기 위한 유일한 옵션으로 생화학적 분석을 부과한다. 천연 단백질에 부착된 글리칸 구조의 분석 과정은 단당류 조성, 결합 및 분지화 서열을 결정하기 위해 민감하고 정량적이며 강력한 기술이 필요하기 때문에 종종 도전적입니다2.

이러한 맥락에서, 질량 분광법 (MS)은 글리코믹스 및 글리코프로테오믹스 실험에서 가장 널리 사용되는 기술이다. 시간이 지남에 따라 이러한 작업은 더 높은 처리량 설정에서 수행되며 데이터는 이제 데이터베이스에 누적되고 있습니다. 다양한 포맷3의 글리칸 구조는, 글리칸이 정의되는 정밀도의 레벨에 관계없이 각각의 구조가 안정한 식별자와 연관되는 범용 글리칸 데이터 저장소인 GlyTouCan4를 채운다(예를 들어, 아마도 결합 유형 또는 모호한 조성이 누락될 수 있음). 매우 유사한 구조가 수집되지만 사소한 차이점이 명확하게보고됩니다. 당단백질은 GlyConnect5 및 GlyGen6에서 기술되고 큐레이팅되며, 두 개의 데이터베이스는 서로 상호 참조한다. 구조적 증거 조각을 뒷받침하는 MS 데이터는 GlycoPOST7에 점점 더 많이 저장됩니다. 온라인 자원의 더 넓은 범위를 위해, 참조 매뉴얼의 52 장, 당생물학의 본질, 글리코 정보학에 전념합니다8. 흥미롭게도, 글리코펩티드 동정 소프트웨어는 재현성의 이점이 없긴 하지만 최근 몇 년 동안9,10 동안 증식하였다. 후자의 우려로 인해 HUPO GlycoProteomics Initiative (HGI)의 지도자들은 2019 년에 소프트웨어 과제를 설정하게되었습니다. CID, ETD 및 EThcD 단편화 모드에서 N- 및 O-글리코실화된 인간 혈청 단백질의 복합 혼합물을 처리함으로써 수득된 MS 데이터는 소프트웨어 사용자 또는 개발자이든 경쟁사에 이용가능하게 되었다. 이 챌린지의 결과에 대한 전체 보고서11은 여기에만 설명되어 있습니다. 우선, 신원 확인의 확산이 관찰되었습니다. 주로 검색 엔진에서 구현 된 방법의 다양성, 설정 및 출력이 필터링되는 방법 및 펩티드가 “계산”된 것으로 해석되었습니다. 실험 설계는 또한 일부 소프트웨어 및 접근법을 (dis) 이점으로 두었을 수 있습니다. 중요한 것은 동일한 소프트웨어를 사용하는 참가자가 일관성없는 결과를보고하여 심각한 재현성 문제를 강조한다는 것입니다. 일부 소프트웨어 솔루션이 다른 솔루션보다 더 잘 수행되고 일부 검색 전략이 더 나은 결과를 산출한다는 다른 제출물을 비교하여 결론지었습니다. 이러한 피드백은 자동화된 글리코펩타이드 데이터 분석 방법의 개선을 안내할 가능성이 높으며 차례로 데이터베이스 콘텐츠에 영향을 미칠 것이다.

글리코 정보학의 확장은 정보를 제공하고 여러 유사하거나 보완하는 리소스에 대한 액세스를 제공하는 웹 포털을 만들었습니다. 가장 최신의 최신 정보는 Comprehensive Glycoscience book series12의 한 장에 설명되어 있으며 협력을 통해 데이터 공유 및 정보 교환에 대한 솔루션이 오픈 액세스 모드로 제공됩니다. 이러한 포털 중 하나는 원래 Glycomics@ExPASy 13이라고 불리며 Glyco@Expasy로 이름이 바뀌 었으며, 수십 년 동안 여러 -omics에서 사용되는 많은 도구와 데이터베이스를 호스팅해온 Expasy platform14의 주요 정밀 검사에 따라 가장 인기있는 품목은 UniProt15 – 보편적 인 단백질 지식 기반입니다. Glyco@Expasy는 시각적 범주화 및 상호 종속성 표시를 기반으로 데이터베이스 및 도구의 목적과 사용에 대한 교훈적 발견을 제공합니다. 다음 프로토콜은 글리코믹스를 통해 글리코프로테오믹스와 글리칸-상호작용 사이의 연결을 명백하게 하는 이 포털로부터의 자원의 선택과 함께 글리코믹스 및 글리코프로테오믹스 데이터를 탐색하는 절차를 예시한다. 그대로, 글리코믹스 실험은 단당류가 완전히 정의되고 부분적으로 또는 완전히 결합되는 구조를 생성하지만, 그들의 단백질 부위 부착은 전혀 특징이 없다면 열악하다. 대조적으로, 글리코프로테오믹스 실험은 정확한 부위 부착 정보를 생성하지만, 글리칸 구조의 분해능이 좋지 않으며, 종종 단당류 조성물로 제한된다. 이 정보는 GlyConnect 데이터베이스에 함께 저장됩니다. 또한, GlyConnect의 검색 도구는 글리칸을 통해 GlyConnect에 연결된 UniLectin16에서 이들을 인식하는 단백질과 함께 설명되는 잠재적 글리칸 리간드를 검출하는 데 사용될 수 있습니다. 여기에 제시된 프로토콜은 N 연결 글리 칸 및 O 결합 글리 칸 및 당단백질에 관한 질문을 다루기 위해 두 섹션으로 나뉩니다.

Protocol

참고: 인터넷에 연결된 기기(더 큰 화면 선호)와 Chrome 또는 Firefox와 같은 최신 웹 브라우저가 필요합니다. Safari 또는 Edge를 사용하는 것이 그다지 신뢰할 수 없을 수 있습니다. 1. GlyConnect의 단백질 N-글리코메에서 UniLectin의 렉틴까지 Glyco@Expasy에서 리소스 액세스참고: 여기에 설명된 절차는 GlyConnect에 액세스하는 것이지만 플랫폼에 기록된 모…

Representative Results

프로토콜의 첫 번째 부분 (섹션 1)은 GlyConnect 플랫폼을 사용하여 인간 전립선 특이 항원 (PSA)의 Asn-69에 부착 된 N- 글리칸의 특이성 또는 공통성을 조사하는 방법을 보여주었습니다. 조직-의존성(소변 및 정액액)뿐만 아니라 글리칸 발현의 이소형-의존적(정상 및 높은 pI) 변형은, 두 가지 시각화 도구를 사용하여 강조되었다(도 4 및 도 5). <…

Discussion

GlyConnect 문어는 예기치 않은 상관 관계를 드러내는 도구로 사용됩니다.
GlyConnect Octopus는 원래 글리 칸의 느슨한 정의로 데이터베이스를 쿼리하도록 설계되었습니다. 실제로, 문헌은 종종 글리칸의 주요 특성을 fucosylated 또는 sialylated, 둘 이상의 안테나로 만들어지는 것과 같은 글리코메에서보고합니다. 또한, N- 또는 O 연결 여부의 글리칸은 참조 설명서 Essentials of Glycobi…

Divulgazioni

The authors have nothing to disclose.

Acknowledgements

저자는 이 튜토리얼에 사용된 리소스를 개발하는 데 관여하는 Proteome Informatics Group의 과거와 현재 구성원, 특히 GlyConnect의 Julien Mariethoz와 Catherine Hayes, UniLectin의 François Bonnardel, Davide Alocci, Octopus의 Frederic Nikitin, Compozitor의 Thibault Robin 및 Octopus에 대한 최종 터치를 따뜻하게 인정합니다.

glyco@Expasy 프로젝트의 개발은 교육, 연구 및 혁신을위한 주 사무국 (SERI)을 통해 스위스 연방 정부에 의해 지원되며 현재 스위스 국립 과학 재단 (SNSF : 31003A_179249)에 의해 보완됩니다. ExPASy는 스위스 생물 정보학 연구소에서 유지 관리하고 Vital-IT 역량 센터에서 호스팅됩니다. 저자는 또한 ANR PIA Glyco@Alps (ANR-15-IDEX-02), Alliance Campus Rhodanien Co-funds (http://campusrhodanien.unige-cofunds.ch) Labex Arcane / CBH-EUR-GS (ANR-17-EURE-0003)가 공동으로 지원하는 UniLectin 플랫폼에 대한 탁월한 협력을 인정합니다.

Materials

internet connection user's choice
recent version of web browser user's choice

Riferimenti

  1. Spring Harbor Laboratory Press. . Essentials of Glycobiology. , (2015).
  2. Gray, C. J., et al. Advancing solutions to the carbohydrate sequencing challenge. Journal of the American Chemical Society. 141 (37), 14463-14479 (2019).
  3. Tsuchiya, S., Yamada, I., Aoki-Kinoshita, K. F. GlycanFormatConverter: a conversion tool for translating the complexities of glycans. Bioinformatics. 35 (14), 2434-2440 (2018).
  4. Fujita, A., et al. The international glycan repository GlyTouCan version 3.0. Nucleic Acids Research. 49, 1529-1533 (2021).
  5. Alocci, D., et al. GlyConnect: glycoproteomics goes visual, interactive, and analytical. Journal of Proteome Research. 18 (2), 664-677 (2019).
  6. York, W. S., et al. GlyGen: computational and informatics resources for glycoscience. Glycobiology. 30 (2), 72-73 (2020).
  7. Watanabe, Y., Aoki-Kinoshita, K. F., Ishihama, Y., Okuda, S. GlycoPOST realizes FAIR principles for glycomics mass spectrometry data. Nucleic Acids Research. 49, 1523-1528 (2020).
  8. Campbell, M. P., Aoki-Kinoshita, K. F., Lisacek, F., York, W. S., Packer, N. H. Glycoinformatics. Essentials of Glycobiology. , (2015).
  9. Cao, W., et al. Recent advances in software tools for more generic and precise intact glycopeptide analysis. Molecular & Cellular Proteomics. 20, 100060 (2021).
  10. Mariethoz, J., Hayes, C., Lisacek, F. Glycan compositions with Compozitor to enhance glycopeptide identification. Proteomics Data Analysis. 2361, 109-127 (2021).
  11. Kawahara, R., et al. Communityevaluation of glycoproteomics informatics solutions reveals high-performance search strategies of serum glycopeptide analysis. Nature Methods. 18, 1304-1316 (2021).
  12. Lisacek, F., Aoki-Kinoshita, K. F., Vora, J. K., Mazumder, R., Tiemeyer, M. Glycoinformatics resources integrated through the GlySpace Alliance. Comprehensive Glycoscience. 1, 507-521 (2021).
  13. Mariethoz, J., et al. Glycomics@ExPASy: bridging the gap. Molecular & Cellular Proteomics. 17 (11), 2164-2176 (2018).
  14. Duvaud, S., et al. Expasy, the swiss bioinformatics resource portal, as designed by its users. Nucleic Acids Research. 49, 216-227 (2021).
  15. The UniProt Consortium et al. UniProt: the universal protein knowledgebase in 2021. Nucleic Acids Research. 49, 480-489 (2021).
  16. Bonnardel, F., Perez, S., Lisacek, F., Imberty, A. Structural database for lectins and the UniLectin web platform. Lectin Purification and Analysis. 2132, 1-14 (2020).
  17. Neelamegham, S., et al. Updates to the symbol nomenclature for glycans guidelines. Glycobiology. 29 (9), 620-624 (2019).
  18. Sharon, N. IUPAC-IUB Joint Commission on Biochemical Nomenclature (JCBN). Nomenclature of glycoproteins, glycopeptides and peptidoglycans: JCBN recommendations 1985. Glycoconjugate Journal. 3 (2), 123-133 (1986).
  19. Harvey, D. J., et al. Proposal for a standard system for drawing structural diagrams of N- and O-linked carbohydrates and related compounds. Proteomics. 9 (15), 3796-3801 (2009).
  20. Song, E., Mayampurath, A., Yu, C. -. Y., Tang, H., Mechref, Y. Glycoproteomics: identifying the glycosylation of prostate specific antigen at normal and high isoelectric points by LC-MS/MS. Journal of Proteome Research. 13 (12), 5570-5580 (2014).
  21. Moran, A. B., et al. Profiling the proteoforms of urinary prostate-specific antigen by capillary electrophoresis – mass spectrometry. Journal of Proteomics. 238, 104148 (2021).
  22. Wang, W., et al. High-throughput glycopeptide profiling of prostate-specific antigen from seminal plasma by MALDI-MS. Talanta. 222, 121495 (2021).
  23. wwPDB consortium metal. Protein Data Bank: the single global archive for 3D macromolecular structure data. Nucleic Acids Research. 47, 520-528 (2019).
  24. Sehnal, D., Grant, O. C. Rapidly display glycan symbols in 3D structures: 3D-SNFG in LiteMol. Journal of Proteome Research. 18 (2), 770-774 (2019).
  25. Bonnardel, F., et al. UniLectin3D, a database of carbohydrate binding proteins with curated information on 3D structures and interacting ligands. Nucleic Acids Research. 47, 1236-1244 (2019).
  26. Sehnal, D., et al. LiteMol suite: interactive web-based visualization of large-scale macromolecular structure data. Nature Methods. 14 (12), 1121-1122 (2017).
  27. Salentin, S., Schreiber, S., Haupt, V. J., Adasme, M. F., Schroeder, M. PLIP: fully automated protein-ligand interaction profiler. Nucleic Acids Research. 43, 443-447 (2015).
  28. Robin, T., Mariethoz, J., Lisacek, F. Examining and fine-tuning the selection of glycan compositions with GlyConnect Compozitor. Molecular & Cellular Proteomics. 19 (10), 1602-1618 (2020).
  29. Compagno, D., et al. Glycans and galectins in prostate cancer biology, angiogenesis and metastasis. Glycobiology. 24 (10), 899-906 (2014).
  30. Gentilini, L. D., et al. Stable and high expression of Galectin-8 tightly controls metastatic progression of prostate cancer. Oncotarget. 8 (27), 44654-44668 (2017).
  31. Schwämmle, V., Verano-Braga, T., Roepstorff, P. Computational and statistical methods for high-throughput analysis of post-translational modifications of proteins. Journal of Proteomics. 129, 3-15 (2015).
  32. Khatri, K., Klein, J. A., Zaia, J. Use of an informed search space maximizes confidence of site-specific assignment of glycoprotein glycosylation. Analytical and Bioanalytical Chemistry. 409 (2), 607-618 (2017).
  33. Sztain, T., et al. A glycan gate controls opening of the SARS-CoV-2 spike protein. Nature Chemistry. 13, 963-968 (2021).
check_url/it/63356?article_type=t

Play Video

Citazione di questo articolo
Lisacek, F. Bioinformatics Resources for the Study of Glycan-Mediated Protein Interactions. J. Vis. Exp. (179), e63356, doi:10.3791/63356 (2022).

View Video