该协议说明了如何使用在线资源探索,比较和解释人类蛋白质糖组。
Glyco@Expasy倡议是作为相互依存的数据库和工具的集合而发起的,这些数据库和工具跨越了糖生物学知识的几个方面。特别是,它旨在突出糖蛋白(如细胞表面受体)与聚糖介导的碳水化合物结合蛋白之间的相互作用。在这里,通过两个以人前列腺特异性抗原(PSA)的N-糖组和人血清蛋白的O-糖组为中心的说明性示例介绍了该系列的主要资源。通过不同的数据库查询和可视化工具的帮助,本文演示了如何在连续体中浏览和比较内容,以收集和关联原本分散的信息片段。收集的数据注定要为更复杂的聚糖功能方案提供信息。因此,这里介绍的Glycoinformatics被提议作为一种在给定背景下加强,塑造或反驳对蛋白质糖组特异性的假设的手段。
聚糖、它们附着的蛋白质(糖蛋白)和它们结合的蛋白质(凝集素或碳水化合物结合蛋白)是细胞表面的主要分子参与者1。尽管在细胞 – 细胞通讯中发挥了核心作用,但与基因组学和蛋白质组学中的对应物相比,包括糖组学,糖组学或聚糖相互作用组学数据的大规模研究仍然稀缺。
直到最近,尚未开发出表征复杂碳水化合物的分支结构,同时仍与载体蛋白偶联的方法。糖蛋白的生物合成是一个非模板驱动的过程,其中单糖供体,接受糖蛋白底物以及糖基转移酶和糖苷酶起着相互作用的作用。由此产生的糖蛋白可以具有具有多个分支点的复杂结构,其中每个单糖组分都可以是自然界中存在的几种类型之一1。非模板驱动的过程将生化分析作为生成寡糖结构数据的唯一选择。附着在天然蛋白质上的聚糖结构的分析过程通常具有挑战性,因为它需要灵敏,定量和稳健的技术来确定单糖组成,键和分支序列2。
在这种情况下,质谱(MS)是糖组学和糖蛋白质组学实验中使用最广泛的技术。随着时间的推移,这些都是在更高的吞吐量设置中执行的,数据现在正在数据库中积累。各种格式的聚糖结构3,填充GlyTouCan4,通用聚糖数据存储库,其中每个结构都与稳定的标识符相关联,而不管定义聚糖的精度水平如何(例如,可能缺少链接类型或模糊的组成)。收集了非常相似的结构,但清楚地报告了它们的微小差异。糖蛋白在GlyConnect5和GlyGen6中进行了描述和策划,这两个数据库相互交叉引用。支持结构性证据的MS数据越来越多地存储在GlycoPOST7中。为了更广泛地覆盖在线资源,参考手册的第52章“糖生物学精要”专门介绍glycoinformatics8。有趣的是,糖肽鉴定软件近年来激增9,10尽管没有达到可重复性的好处。后一种担忧促使HUPO GlycoProteomics Initiative(HGI)的领导者在2019年设定了软件挑战。通过处理CID,ETD和EThcD片段化模式下的N-和O糖基化人血清蛋白的复杂混合物获得的MS数据可供竞争对手使用,无论是软件用户还是开发人员。关于这一挑战的结果11的完整报告仅在此概述。首先,观察到身份的传播。它主要被解释为由搜索引擎中实施的方法的多样性,它们的设置以及输出如何过滤和肽“计数”引起的。实验设计也可能使一些软件和方法处于(不)优势。重要的是,使用相同软件的参与者报告了不一致的结果,从而突出了严重的可重复性问题。通过比较不同的提交得出的结论是,某些软件解决方案的性能优于其他软件解决方案,并且某些搜索策略产生了更好的结果。这种反馈可能会指导自动化糖肽数据分析方法的改进,进而影响数据库内容。
glycoinformatics的扩展导致创建了门户网站,提供信息和访问多个相似或互补的资源。最新和最新的在综合糖科学丛书的一章中进行了描述12,通过合作,以开放获取模式提供了数据共享和信息交换的解决方案。在对Expasy平台14进行重大改革之后,开发了一个这样的门户网站,最初称为Glycomics@ExPASy 13,并更名为Glyco@Expasy,该平台托管了数十年来在几个组学中使用的大量工具和数据库,最受欢迎的项目是UniProt15 – 通用蛋白质知识库。Glyco@Expasy基于可视化分类和显示其相互依赖关系,对数据库和工具的目的和用途进行了教学性发现。以下协议说明了探索糖组学和糖组学数据的程序,并从该门户网站中选择资源,通过糖组学明确地将糖组学和聚糖相互作用组学之间的联系明确化。事实上,糖组学实验产生的结构是完全定义的单糖和部分或完全确定的键,但它们的蛋白质位点附着很差,如果有的话,表征得很差。相反,糖蛋白质组学实验产生精确的位点附着信息,但聚糖结构的分辨率较差,通常仅限于单糖组合物。这些信息在GlyConnect数据库中拼凑在一起。此外,GlyConnect中的搜索工具可用于检测潜在的聚糖配体,这些配体与UniLectin16中识别它们的蛋白质一起描述,通过聚糖与GlyConnect相关联。这里介绍的方案分为两个部分,以涵盖N-连接和O-连接聚糖和糖蛋白特异性的问题。
GlyConnect Octopus作为揭示意外相关性的工具
GlyConnect Octopus最初设计用于查询具有松散的聚糖定义的数据库。事实上,文献经常报道糖组中聚糖的主要特征,例如岩藻糖基化或唾液酸化,由两个或多个触角组成等。此外,无论是N-还是O-连接的聚糖都被归类为核心,如参考手册《Glycobiology的精要》1中所述,这些聚糖也经常在已发表的文章中引用。最后,聚糖表位(如?…
The authors have nothing to disclose.
作者热烈感谢过去和现在参与开发本教程中使用的资源的蛋白质组信息学小组的成员,特别是GlyConnect的Julien Mariethoz和Catherine Hayes,UniLectin的François Bonnardel,Octopus的Davide Alocci和Frederic Nikitin,以及Octopus的Compozitor和最后的Totouch的Thibault Robin。
glyco@Expasy项目的发展得到了瑞士联邦政府通过国家教育、研究和创新秘书处(SERI)的支持,目前还得到了瑞士国家科学基金会(SNSF:31003A_179249)的补充。ExPASy由瑞士生物信息学研究所维护,并在Vital-IT能力中心托管。作者还感谢Anne Imberty在AnR PIA Glyco@Alps(ANR-15-IDEX-02),Alliance Campus Rhodanien共同基金(http://campusrhodanien.unige-cofunds.ch)Labex Arcane/CBH-EUR-GS(ANR-17-EURE-0003)共同支持的UniLectin平台上的出色合作。
internet connection | user's choice | ||
recent version of web browser | user's choice |