Summary

グリカン媒介タンパク質相互作用の研究のためのバイオインフォマティクスリソース

Published: January 20, 2022
doi:

Summary

このプロトコルは、オンラインリソースでヒトタンパク質グリカムを探索、比較、および解釈する方法を示しています。

Abstract

Glyco@Expasyイニシアチブは、糖鎖生物学における知識のいくつかの側面にまたがる相互依存的なデータベースとツールのコレクションとして開始されました。特に、糖タンパク質(細胞表面受容体など)と糖鎖によって媒介される炭水化物結合タンパク質との間の相互作用を強調することを目的としている。ここでは、ヒト前立腺特異抗原(PSA)のNグリコームとヒト血清タンパク質のOグリコームを中心とした2つの例示的な例を通じて、コレクションの主要なリソースを紹介します。この記事では、さまざまなデータベース クエリと視覚化ツールを使用して、連続体内のコンテンツを探索および比較して、散在する情報を収集して関連付ける方法を示します。収集されたデータは、グリカン機能のより精巧なシナリオを養う運命にあります。したがって、ここで紹介するグリコインフォマティクスは、所与の文脈におけるタンパク質グリコームの特異性に関する仮定を強化、形成、または反論する手段として提案される。

Introduction

グリカン、それらが結合するタンパク質(糖タンパク質)およびそれらが結合するタンパク質(レクチンまたは炭水化物結合タンパク質)は、細胞表面における主要な分子アクターである1。細胞間通信におけるこの中心的な役割にもかかわらず、グリコミック、グリコプロテオミクス、またはグリカン相互作用データを含む大規模な研究は、ゲノミクスおよびプロテオミクスにおける対応するものと比較して依然として乏しい。

最近まで、キャリアタンパク質にコンジュゲートされたまま複雑な炭水化物の分岐構造を特徴付ける方法は開発されていなかった。糖タンパク質の生合成は、単糖ドナー、受容性糖タンパク質基質、および糖転移酵素およびグリコシダーゼが相互作用的な役割を果たす非テンプレート駆動型プロセスである。得られた糖タンパク質は、複数の分岐点を持つ複雑な構造を持つことができ、各単糖成分は自然界に存在するいくつかのタイプの1つであり得る1。非テンプレート駆動型プロセスは、オリゴ糖構造データを生成するための唯一の選択肢として生化学的分析を課します。天然タンパク質に結合しているグリカン構造の分析プロセスは、単糖組成、結合、および分岐配列を決定するために高感度、定量的、堅牢な技術を必要とするため、しばしば困難です2

この文脈において、質量分析(MS)は、グリコミクスおよびグリコプロテオミクス実験において最も広く使用されている技術である。時間が経つにつれて、これらはより高いスループット設定で実行され、データは現在データベースに蓄積されています。様々なフォーマットのグリカン構造3は、グリカンが定義される精度のレベル(例えば、おそらく欠損連鎖タイプまたは曖昧な組成)に関係なく、各構造が安定した識別子と関連付けられている普遍的なグリカンデータリポジトリであるGlyTouCan4に移入する。非常によく似た構造が収集されていますが、それらのわずかな違いが明確に報告されています。糖タンパク質は、互いに相互参照する2つのデータベースであるGlyConnect5およびGlyGen6に記載およびキュレーションされています。構造的証拠を裏付けるMSデータは、GlycoPOST7にますます保存されています。オンラインリソースのより広い範囲をカバーするために、リファレンスマニュアルの第52章「糖鎖生物学の要点」は、グリコインフォマティクスに捧げられています8。興味深いことに、糖ペプチド同定ソフトウェアは近年増殖している9,10が再現性の恩恵を受けていない。後者の懸念により、HUPO GlycoProteomics Initiative(HGI)のリーダーは、2019年にソフトウェアの課題を設定しました。CID、ETD、およびEThcDフラグメンテーションモードでNおよびOグリコシル化ヒト血清タンパク質の複雑な混合物を処理することから得られたMSデータは、ソフトウェアユーザーまたは開発者のいずれであっても競合他社に利用可能であった。この課題11の結果に関する完全なレポートは、ここでのみ概説されています。まず、識別の広がりが観察された。これは主に、検索エンジンに実装された方法の多様性、その設定、出力のフィルタリング方法、およびペプチドの「カウント」によって引き起こされたと解釈されました。実験計画はまた、いくつかのソフトウェアとアプローチを(不)利点に置いたかもしれない。重要なことに、同じソフトウェアを使用している参加者が一貫性のない結果を報告し、それによって深刻な再現性の問題が浮き彫りになりました。異なる提出物を比較することで、一部のソフトウェアソリューションは他のソリューションよりも優れたパフォーマンスを発揮し、一部の検索戦略はより良い結果をもたらすと結論付けられました。このフィードバックは、自動糖ペプチドデータ解析方法の改善を導く可能性が高く、ひいてはデータベースの内容に影響を与えるでしょう。

グリコインフォマティクスの拡大により、情報を提供し、複数の類似または補完するリソースにアクセスするWebポータルが作成されました。最新かつ最新のものは、包括的糖科学の本シリーズ12の章で説明されており、協力を通じて、データ共有と情報交換のソリューションがオープンアクセスモードで提供されています。そのようなポータルの1つは、もともとGlycomics@ExPASy 13と呼ばれ、何十年もの間、いくつかのオミクスで使用されているツールとデータベースの大規模なコレクションをホストしてきたExpasyプラットフォーム14の大規模なオーバーホールに続いて、Glyco@Expasyに改名されました最も人気のあるアイテムはUniProt15 – 普遍的なタンパク質知識ベースです。Glyco@Expasyは、データベースとツールの目的と使用法を、視覚的な分類と相互依存関係の表示に基づいて教訓的に発見します。以下のプロトコルは、グリコプロテオミクスとグリカン相互作用ミクスの間の接続をglycomicsを介して明示するこのポータルからのリソースの選択を使用して、グリコミクスおよびグリコプロテオミクスデータを探索する手順を示しています。グリコミクス実験は、単糖が完全に定義され、結合が部分的または完全に決定される構造を生成するが、それらのタンパク質部位の結合は、たとえそうであっても、特徴付けが不十分である。対照的に、グリコプロテオミクス実験は正確な部位結合情報を生成するが、グリカン構造の分解能は悪く、しばしば単糖組成物に限定される。この情報は、GlyConnect データベースでつなぎ合わされています。さらに、GlyConnectの検索ツールを使用して、UniLectin16でそれらを認識するタンパク質とともに記載されている潜在的なグリカンリガンドを検出し、グリカンを介してGlyConnectにリンクすることができます。ここで提示されたプロトコルは、N結合型およびO結合型グリカンおよび糖タンパク質に特有の質問をカバーするために、2つのセクションに分かれています。

Protocol

注: インターネットに接続されたデバイス(大画面を推奨)と、Chrome や Firefox などの最新のウェブブラウザが必要です。SafariやEdgeを使用することはそれほど信頼できないかもしれません。 1. GlyConnectのタンパク質Nグリコームからユニレクチンのレクチンへ Glyco@Expasyからのリソースへのアクセスメモ: ここで説明する手順は GlyConnect にアク…

Representative Results

プロトコルの最初の部分(セクション1)は、GlyConnectプラットフォームを使用して、ヒト前立腺特異抗原(PSA)のAsn-69に結合したN-グリカンの特異性または共通性を調査する方法を示した。グリカン発現における組織依存性(尿および精液)、ならびにアイソフォーム依存性(正常および高pI)の変動を、2つの視覚化ツールを使用して強調した(図4および…

Discussion

予期せぬ相関関係を明らかにするためのツールとしてのGlyConnectタコ
GlyConnect Octopusはもともと、グリカンの緩やかな定義でデータベースを照会するように設計されています。実際、文献はしばしば、フコシル化またはシアリル化されている、2つ以上のアンテナで作られているなど、グリコーム中のグリカンの主な特徴を報告している。さらに、N結合型かO結合型かのグリカンは…

Divulgazioni

The authors have nothing to disclose.

Acknowledgements

著者は、このチュートリアルで使用されるリソースの開発に関与したProteome Informatics Groupの過去と現在のメンバー、特にGlyConnectのJulien MariethozとCatherine Hayes、UniLectinのFrançois Bonnardel、OctopusのDavide Alocci、Frederic Nikitin、CompozitorのThibault Robin、そしてOctopusのファイナルタッチを暖かく認めています。

glyco@Expasyプロジェクトの開発は、教育、研究、イノベーションのための国家事務局(SERI)を通じてスイス連邦政府によって支援され、現在はスイス国立科学財団(SNSF:31003A_179249)によって補完されています。ExPASyはスイスのバイオインフォマティクス研究所によって管理され、Vital-IT Competency Centerでホストされています。著者はまた、ANR PIA Glyco@Alps(ANR-15-IDEX-02)、Alliance Campus Rhodanien Co-fund (http://campusrhodanien.unige-cofunds.ch) Labex Arcane/CBH-EUR-GS (ANR-17-EURE-0003)が共同で支援するUniLectinプラットフォームにおける優れた協力について、Anne Imbertyに謝意を表します。

Materials

internet connection user's choice
recent version of web browser user's choice

Riferimenti

  1. Spring Harbor Laboratory Press. . Essentials of Glycobiology. , (2015).
  2. Gray, C. J., et al. Advancing solutions to the carbohydrate sequencing challenge. Journal of the American Chemical Society. 141 (37), 14463-14479 (2019).
  3. Tsuchiya, S., Yamada, I., Aoki-Kinoshita, K. F. GlycanFormatConverter: a conversion tool for translating the complexities of glycans. Bioinformatics. 35 (14), 2434-2440 (2018).
  4. Fujita, A., et al. The international glycan repository GlyTouCan version 3.0. Nucleic Acids Research. 49, 1529-1533 (2021).
  5. Alocci, D., et al. GlyConnect: glycoproteomics goes visual, interactive, and analytical. Journal of Proteome Research. 18 (2), 664-677 (2019).
  6. York, W. S., et al. GlyGen: computational and informatics resources for glycoscience. Glycobiology. 30 (2), 72-73 (2020).
  7. Watanabe, Y., Aoki-Kinoshita, K. F., Ishihama, Y., Okuda, S. GlycoPOST realizes FAIR principles for glycomics mass spectrometry data. Nucleic Acids Research. 49, 1523-1528 (2020).
  8. Campbell, M. P., Aoki-Kinoshita, K. F., Lisacek, F., York, W. S., Packer, N. H. Glycoinformatics. Essentials of Glycobiology. , (2015).
  9. Cao, W., et al. Recent advances in software tools for more generic and precise intact glycopeptide analysis. Molecular & Cellular Proteomics. 20, 100060 (2021).
  10. Mariethoz, J., Hayes, C., Lisacek, F. Glycan compositions with Compozitor to enhance glycopeptide identification. Proteomics Data Analysis. 2361, 109-127 (2021).
  11. Kawahara, R., et al. Communityevaluation of glycoproteomics informatics solutions reveals high-performance search strategies of serum glycopeptide analysis. Nature Methods. 18, 1304-1316 (2021).
  12. Lisacek, F., Aoki-Kinoshita, K. F., Vora, J. K., Mazumder, R., Tiemeyer, M. Glycoinformatics resources integrated through the GlySpace Alliance. Comprehensive Glycoscience. 1, 507-521 (2021).
  13. Mariethoz, J., et al. Glycomics@ExPASy: bridging the gap. Molecular & Cellular Proteomics. 17 (11), 2164-2176 (2018).
  14. Duvaud, S., et al. Expasy, the swiss bioinformatics resource portal, as designed by its users. Nucleic Acids Research. 49, 216-227 (2021).
  15. The UniProt Consortium et al. UniProt: the universal protein knowledgebase in 2021. Nucleic Acids Research. 49, 480-489 (2021).
  16. Bonnardel, F., Perez, S., Lisacek, F., Imberty, A. Structural database for lectins and the UniLectin web platform. Lectin Purification and Analysis. 2132, 1-14 (2020).
  17. Neelamegham, S., et al. Updates to the symbol nomenclature for glycans guidelines. Glycobiology. 29 (9), 620-624 (2019).
  18. Sharon, N. IUPAC-IUB Joint Commission on Biochemical Nomenclature (JCBN). Nomenclature of glycoproteins, glycopeptides and peptidoglycans: JCBN recommendations 1985. Glycoconjugate Journal. 3 (2), 123-133 (1986).
  19. Harvey, D. J., et al. Proposal for a standard system for drawing structural diagrams of N- and O-linked carbohydrates and related compounds. Proteomics. 9 (15), 3796-3801 (2009).
  20. Song, E., Mayampurath, A., Yu, C. -. Y., Tang, H., Mechref, Y. Glycoproteomics: identifying the glycosylation of prostate specific antigen at normal and high isoelectric points by LC-MS/MS. Journal of Proteome Research. 13 (12), 5570-5580 (2014).
  21. Moran, A. B., et al. Profiling the proteoforms of urinary prostate-specific antigen by capillary electrophoresis – mass spectrometry. Journal of Proteomics. 238, 104148 (2021).
  22. Wang, W., et al. High-throughput glycopeptide profiling of prostate-specific antigen from seminal plasma by MALDI-MS. Talanta. 222, 121495 (2021).
  23. wwPDB consortium metal. Protein Data Bank: the single global archive for 3D macromolecular structure data. Nucleic Acids Research. 47, 520-528 (2019).
  24. Sehnal, D., Grant, O. C. Rapidly display glycan symbols in 3D structures: 3D-SNFG in LiteMol. Journal of Proteome Research. 18 (2), 770-774 (2019).
  25. Bonnardel, F., et al. UniLectin3D, a database of carbohydrate binding proteins with curated information on 3D structures and interacting ligands. Nucleic Acids Research. 47, 1236-1244 (2019).
  26. Sehnal, D., et al. LiteMol suite: interactive web-based visualization of large-scale macromolecular structure data. Nature Methods. 14 (12), 1121-1122 (2017).
  27. Salentin, S., Schreiber, S., Haupt, V. J., Adasme, M. F., Schroeder, M. PLIP: fully automated protein-ligand interaction profiler. Nucleic Acids Research. 43, 443-447 (2015).
  28. Robin, T., Mariethoz, J., Lisacek, F. Examining and fine-tuning the selection of glycan compositions with GlyConnect Compozitor. Molecular & Cellular Proteomics. 19 (10), 1602-1618 (2020).
  29. Compagno, D., et al. Glycans and galectins in prostate cancer biology, angiogenesis and metastasis. Glycobiology. 24 (10), 899-906 (2014).
  30. Gentilini, L. D., et al. Stable and high expression of Galectin-8 tightly controls metastatic progression of prostate cancer. Oncotarget. 8 (27), 44654-44668 (2017).
  31. Schwämmle, V., Verano-Braga, T., Roepstorff, P. Computational and statistical methods for high-throughput analysis of post-translational modifications of proteins. Journal of Proteomics. 129, 3-15 (2015).
  32. Khatri, K., Klein, J. A., Zaia, J. Use of an informed search space maximizes confidence of site-specific assignment of glycoprotein glycosylation. Analytical and Bioanalytical Chemistry. 409 (2), 607-618 (2017).
  33. Sztain, T., et al. A glycan gate controls opening of the SARS-CoV-2 spike protein. Nature Chemistry. 13, 963-968 (2021).
check_url/it/63356?article_type=t

Play Video

Citazione di questo articolo
Lisacek, F. Bioinformatics Resources for the Study of Glycan-Mediated Protein Interactions. J. Vis. Exp. (179), e63356, doi:10.3791/63356 (2022).

View Video