Summary
该协议介绍了可用于在大分子的冷冻EM图谱中建模小分子配体的工具。
Abstract
破译大分子复合物中的蛋白质-配体相互作用对于理解分子机制、潜在的生物学过程和药物开发至关重要。近年来,低温样品电子显微镜(cryoEM)已成为确定大分子结构和研究近原子分辨率配体结合模式的有力技术。由于目标分子的各向异性分辨率和数据中固有的噪声,在冷冻电磁图谱中识别和建模非蛋白质分子通常具有挑战性。在本文中,向读者介绍了目前用于配体鉴定、模型构建和使用选定大分子细化原子坐标的各种软件和方法。如烯醇化酶所示,识别配体存在的最简单方法之一是减去有和没有配体获得的两张图谱。即使在更高的阈值下,配体的额外密度也可能在差异图中脱颖而出。在某些情况下,如代谢型谷氨酸受体 mGlu5 的情况所示,当无法生成这种简单的差异图时。最近引入的推导Fo-Fc省略图的方法可以作为验证和证明配体存在的工具。最后,以经过充分研究的β-半乳糖苷酶为例,分析了分辨率对冷冻电子显微镜图谱中配体和溶剂分子建模的影响,并对冷冻电子镜在药物发现中的应用进行了展望。
Introduction
细胞通过同时独立地进行无数的化学反应来实现其功能,每个化学反应都经过精心调节,以确保它们的生存和对环境线索的适应性。这是通过分子识别实现的,它使生物分子(尤其是蛋白质)能够与其他大分子以及小分子或配体形成瞬时或稳定的复合物1。因此,蛋白质-配体相互作用是生物学中所有过程的基础,包括蛋白质表达和活性的调节、酶对底物和辅因子的识别,以及细胞如何感知和传递信号 1,2。更好地了解蛋白质-配体复合物的动力学、热力学和结构特性揭示了配体相互作用的分子基础,并通过优化药物相互作用和特异性促进了合理的药物设计。研究蛋白质-配体相互作用的一种经济且更快的方法是使用分子对接,这是一种计算方法,可以虚拟筛选各种小分子并预测这些配体与靶蛋白的结合模式和亲和力3。然而,通过 X 射线衍射 (XRD)、核磁共振 (NMR) 或电子冷冻显微镜 (cryoEM) 确定的高分辨率结构的实验证据为此类预测提供了必要的证据,并有助于开发针对给定靶点的更新、更有效的激活剂或抑制剂。本文使用缩写“cryoEM”,因为该技术通常被称为“cryoEM”。然而,关于选择正确的命名法一直存在争议,最近,有人提出了术语冷冻基因样本 Electron Microscopy (cryoEM) 来表示样本处于低温并用电子成像4。同样,从冷冻电镜得出的图被称为电子电位、静电势或库仑电位,为了简单起见,这里我们使用冷冻电镜图5,6,7,8,9,10。
尽管 XRD 一直是蛋白质-配体复合物高分辨率结构测定的金标准技术,但分辨率革命后的11 cryoEM 已经获得了动力,正如过去几年中沉积在电子显微镜数据库 (EMDB) 12 中的库仑电位图或冷冻 EM 图的激增所表明的那样 14。由于样品制备、成像和数据处理方法的进步,2010 年至 2020 年间,使用冷冻电镜的蛋白质数据库 (PDB)14 沉积数量从 0.7% 增加到 17%,2020 年报告的结构中约有 50% 是以 3.5 Å 或更高的分辨率确定的 15,16。CryoEM 已迅速被包括制药行业在内的结构生物学界采用,因为它允许以近原子分辨率研究柔性和非结晶性生物大分子,尤其是膜蛋白和多蛋白复合物,克服了结晶过程并获得通过 XRD 进行高分辨率结构测定所需的衍射良好的晶体。
在cryoEM图谱中准确建模配体至关重要,因为它在分子水平上是蛋白质-配体复合物的蓝图。X 射线晶体学中使用了几种自动配体构建工具,这些工具依赖于配体密度的形状和拓扑结构,以便将配体拟合或构建到电子密度中 17,18,19,20。然而,如果分辨率低于 3 Å,这些方法往往会产生不太理想的结果,因为它们识别和构建所依赖的拓扑特征变得不那么明确。在许多情况下,这些方法已被证明在将配体准确建模到 cryoEM 图谱中是无效的,因为这些图谱是在中低分辨率范围内确定的,通常在 3.5 Å-5 Å17 之间。
使用 cryoEM 测定蛋白质-配体复合物 3D 结构的第一步包括将配体与蛋白质共纯化(当配体与蛋白质具有高结合亲和力时)或在网格制备之前将蛋白质溶液与配体孵育特定持续时间。随后,将少量样品放置在等离子体清洁的多孔透射电镜网格上,然后在液态乙烷中快速冷冻,最后使用冷冻透射电镜成像。对数十万到数百万个单个粒子的 2D 投影图像进行平均,以重建大分子的 3D (3D) 库仑势图。在许多情况下,由于图谱上的各向异性分辨率(即大分子之间的分辨率不均匀)、配体结合区域的灵活性以及数据中的噪声,这些图谱中的配体和溶剂分子的识别和建模带来了重大挑战。许多为 XRD 开发的建模、改进和可视化工具现在正被用于冷冻电子市场,用于相同的目的 18,19,20,21。在本文中,概述了目前用于识别配体、构建模型和优化从 cryoEM 得出的坐标的各种方法和软件。已经提供了一个分步方案来说明使用具有不同分辨率和复杂性的特定蛋白质-配体复合物对配体进行建模所涉及的过程。
在冷冻EM图谱中对配体进行建模的第一步包括识别图谱中的配体密度(非蛋白质)。如果配体结合不会引起蛋白质的任何构象变化,那么计算蛋白质-配体复合物和载脂蛋白之间的简单差异图基本上突出了额外密度的区域,表明配体的存在。这种差异可以立即观察到,因为它只需要两张图谱,甚至在3D细化过程中的中间图也可以用来检查配体是否存在。此外,如果分辨率足够高 (<3.0 Å),那么差异图还可以深入了解水分子的位置以及与配体和蛋白质残基相互作用的离子。
在没有 apo-protein maps 的情况下,现在可以使用 Servalcat22,它可作为独立工具使用,并且作为 Refmac 改进的一部分也已集成到 CCP-EM 软件套件 23,24 和 CCP4 8.0 版本25,26 中。Servalcat 允许使用未锐化的半图和载脂蛋白模型作为输入来计算 FSC 加权差 (Fo-Fc) 图。Fo-Fc 省略图表示实验图(Fo)和从模型派生的图(Fc)之间的差异。在模型中没有配体的情况下,Fo-Fc图谱中的正密度与实验EM图谱重叠通常表明配体的存在。这里的假设是蛋白质链在图谱中拟合良好,剩余的正密度表明配体的位置。然而,重要的是要仔细检查正密度是否源于建模的不准确性,例如蛋白质侧链的错误转子。
第二步涉及从可用的化学信息中获取或创建配体的笛卡尔坐标文件,该配体具有明确定义的几何形状。CCP4 单体库中已有的标准配体(例如,ATP 和 NADP+)可以通过其单体登录代码检索坐标和几何文件来用于精细化。但是,对于未知或非标准配体,可以使用各种工具来创建几何文件。其中一些示例包括 Phenix28 中的 eLBOW27 - (电子配体构建器和优化工作台)、Lidia - Coot29 中的内置工具、JLigand/ACEDRG30,31、CCP-EM23,24、Ligprep32-薛定谔套件中的 Glide 模块。然后,在实验冷冻电镜图和Coot中的差异图的指导下,将配体坐标文件拟合到密度中。接下来是 Phenix28 中的实时空间细化或 Refmac33 中的倒数细化。需要 Linux 工作站或配备优质显卡和上述软件的笔记本电脑。这些程序中的大多数都包含在各种套件中。CCP-EM24 和 Phenix28 可供学术用户免费使用,并包含本文中使用的各种工具,包括 Coot、Refmac533、34、35、36、Servalcat、phenix.real_space_refine 等。同样,Chimera37 和 ChimeraX38 为学术用户提供免费许可证。
Subscription Required. Please recommend JoVE to your librarian.
Protocol
1. 结核分枝杆菌烯醇化酶中的磷酸烯醇丙酮酸 (PEP) 建模
- PEP-烯醇化酶复合物冷冻电镜图中配体密度的鉴定
- 从 EMDB 中的其他数据中下载 apo-烯醇化酶的未锐化半图(emd_30988_additional_1.map 和 emd_30988_additional_2.map)(参见 材料表)。
- 打开 ChimeraX(参见 材料表)。通过单击工具栏中的“ 打开 ”并选择文件名来打开 apo-烯醇化酶的半图。在命令行中键入 vop add #1 #2 以合并两个半映射以获得 apo-enolase 未锐化映射。
注意:#1 和 #2 表示 apo-烯醇化酶的两个半图,如步骤 1.1.1 中所述。 - 通过键入 rename #3 Apo-enolase-unsharpened-map 重命名组合地图(ChimeraX 地图 ID:#3)。从模型面板中将地图设置为灰色。该图表明,烯醇化酶在溶液中是八聚体,具有 D4 对称性。
- 使用以下半映射重复步骤 1.1.1-1.1.3 emd_30989_additional_1.map(映射 ID:4)和 emd_30989_additional_2.map(映射 ID:5)以获取 PEP-烯醇化酶未锐化映射(映射 ID:#6)。
- 为了计算差异图,首先通过单击ChimeraX的地图面板(工具栏)中的拟合(图中图)将两个图(步骤1.1.3和步骤1.1.4中的PEP-烯醇化酶和apo-烯醇化酶未锐化图)相互拟合。
注意:在两个映射之间不执行归一化。在某些情况下,可能需要进行归一化才能使地图达到相同的比例。 - 通过在命令行中键入 vop subtract #6 #3 ,从 apo-enolase 图中减去 PEP-烯醇化酶图。
注意:#6 = PEP-烯醇化酶未锐化映射,#3 = Apo-烯醇化酶未锐化映射。 - 将减去的图谱(图ID:7)涂成绿色,表示正密度(按照X射线晶体学的惯例)39。
- 从蛋白质数据库 (PDB) 下载 结核分 枝杆菌八聚体烯醇化酶 (PDB: 7e4x) 的坐标,单击工具栏中的 打开 ,然后选择 文件名。
- 通过在命令行中键入 rename #8 Apo_enolase.pdb 来重命名模型 7e4x.pdb。#8 表示 ChimeraX 中的 Apo_enolase.pdb。
- 从模型面板中选择模型。单击工具栏中的鼠标右键。单击“移动分子”,将模型放置在靠近 PEP-烯醇化酶图(#2) 的位置,并使模型相对于图对齐。通过在命令行中键入 fit #8 in #6,将此模型拟合到 PEP-enolase-unsharpened-map 中。在这里,地图编号为 6,模型编号为 8。
注意:在某些情况下,ChimeraX 中的局部拟合可能不足以对齐模型。在这些情况下,可以在 Phenix 中执行额外的全局拟合步骤(DockinMap,参见 材料表)。 - 通过在命令行中键入 save Apo-enolase.pdb #8 来保存拟合模型。
- PEP-烯醇化酶复合物的 B 因子锐化冷冻电镜图中 PEP 的建模和细化
- 通过键入 ./Coot & 从端子打开“coot”(参见材料表)。
- 通过单击 “文件”>打开坐标 Apo-enolase.pdb 来显示“Apo-enolase.pdb”。坐标文件由键显示(颜色由原子显示)。
- 从 EMDB 下载 PEP 结合的烯醇化酶锐化地图,即 emd_30989.map。通过单击 “文件”>“打开地图”> emd_30989.map 来显示相同的内容。通过滚动鼠标中键将阈值设置为 7.00 σ 。
- 通过单击“ 验证”>“未建模的 blobs”>“查找 Blob”来查找未建模的 blob。
- 在烯醇化酶模型的活性位点残基 Ser 42、Lys-386 和 Arg-364 附近找到未建模的配体密度。
- 通过单击 “文件”>“获取单体 ”并从 Coot 单体库中获取 PEP 单体模型文件,然后输入 PEP 作为 3 个字母的代码。
- 使用侧边栏菜单中的旋转/平移-区域/链/分子选项将 PEP 分子移动到密度。在 Coot 中使用实时空间细化,通过单击侧边栏菜单中的 Real Space Refine Zone,将 PEP 分子拟合到密度中。使用编辑选项卡中的合并分子选项将拟合的配体与 Apo-enolase.pdb 合并。将模型另存为 PEP-Enolase.pdb。
注意:也可以使用 配体>Jiggle-Fit 配体 选项来拟合配体。 - 要将配体添加到坐标文件中的其余单体中,请单击 “计算 NCS 工具> NCS 配体>。将出现一个名为“查找 NCS 相关配体”的单独窗口。对于 Protein with NCS 选项,选择坐标文件 Apo-enolase.pdb 和 链 ID A 作为 NCS 主链。
- 对于含有配体的分子,选择 Apo-enolase.pdb 作为坐标文件, 并选择链 ID、J 和残基编号 1 到 1。点击 “查找候选人职位”。将出现一个名为“拟合配体”的窗口,其中包含候选位置的列表。通过单击单个候选配体来评估拟合,并直观地分析拟合。
注意:在Servalcat/Refmac中,只能提供单体模型,可以给出重建中使用的对称性来获得扩展模型。
- 对于含有配体的分子,选择 Apo-enolase.pdb 作为坐标文件, 并选择链 ID、J 和残基编号 1 到 1。点击 “查找候选人职位”。将出现一个名为“拟合配体”的窗口,其中包含候选位置的列表。通过单击单个候选配体来评估拟合,并直观地分析拟合。
- 在配体附近还观察到溶剂分子的额外密度。来自各种同系物的烯醇化酶的高分辨率晶体结构表明存在两个 Mg2+ 离子40,41,这可能稳定了反应中间体的负电荷。通过单击“将原子置于指针上”并从“指针原子类型”列表中选择“MG”,对活性位点密度中的两个 Mg2+ 离子进行建模。
注意:键的几何形状和距离可用作选择金属离子的指南。在 Mg2+ 与蛋白质残基中的氧原子结合的情况下,键距在 2.1 Å -2.4 Å 之间变化,具有八面体几何形状。但是,在低分辨率地图的情况下,协调球通常是不完整的,并且由于分辨率的限制,距离也可能有所不同。 - 重复步骤1.2.8,以在对称性相关单体中添加Mg2+ 离子。
- 通过单击 “文件”>“保存坐标”>“选择文件名 >”并键入 Enolase+PEP+Mg.pdb 来保存模型。
- 打开 Phenix 图形用户界面 (参见 材料表)。使用默认参数,分别使用 Enolase+PEP+Mg.pdb 和 emd_30989.map 作为输入模型和地图来运行真实空间细化作业。此步骤是使用 Coot 迭代完成的,以实现良好的地图模型拟合和几何形状。
注意:未锐化的差异图用于演示配体的存在,例如在图中。出于建模目的,已使用并建议使用 B 因子锐化贴图。与未锐化映射相比,B 因子锐化映射也可用于计算差异映射以进行演示。但是,如果配体结合区域的分辨率较低,则用于锐化整个图谱的单个B因子可能无法清楚地揭示配体密度。
- 建模配体的可视化和图形生成
- 通过单击“文件”>“打开”并选择文件名,从PyMOL42中的最终Phenix精炼作业中打开精制的烯醇化酶+PEP+Mg模型(参见材料表)。
- 通过单击“打开文件”并选择文件名来加载 emd-30989.map(PEP 绑定>锐化地图)。
- 通过单击针对emd_30989对象重命名的操作>并键入 PEP-sharpened,将地图重命名为 PEP-sharpened。
注意:在大多数情况下,例如烯醇化酶,在 pymol 中打开时的映射会被归一化,因为在 pymol 中默认选中归一化映射选项。由于冷冻电磁图以一个更大的盒子为中心,因此归一化将包括盒子中的所有内容。因此,在 pymol 中打开之前,可以关闭归一化。 - 通过单击 “显示>序列”来选择配体。
- 在命令行中键入 isomesh mesh_ligands, PEP-sharpened, 6.0, sele, carve=3.0,然后按 回车键。
- 通过单击mesh_ligand对象旁边的最后一个框 C,将mesh_ligand着色为蓝色。
- 显示活性位点残基 Ser-42、Asp-241、Glu-283、Asp-310、Arg-364 和 Lys-386 分别在棒状和球状表示中与 PEP 和 Mg2+ 相互作用,并在卡通表示中显示烯醇化酶。
- 通过键入 ray 3600、3600 生成出版质量的图像,并通过单击 “文件”>保存 并选择 PEP.png 作为文件名来另存为 png 文件。
2. 代谢型谷氨酸受体 mGlu 5 中配体的建模
- 识别和建模激动剂和拮抗剂结合的 mGlu 的 cryoEM 图中的配体密度5
- 下载两个半图以及每个激动剂结合 (EMD-31536、7fd8.pdb) 和拮抗剂结合 (EMD-31537,7fd9.pdb) mGlu5 复合物的相应坐标文件。
- 打开 ChimeraX
- 单击“ 打开 ”并选择“7fd8.pdb”,打开坐标文件 7fd8.pdb。
- 在命令行中键入 delete ligand ,然后按 Enter 键。
- 同样,使用命令 delete/B 删除链 B。
注意:可以使用顶部的下拉菜单使用 选择 和 操作>原子/键>删除来删除配体和链。 - 通过在命令行中键入以下内容来保存未配体的 pdb: save 7fd8_noligand_chainA.pdb #1。#1 表示模型 ID。
- 对 7fd9.pdb 重复步骤 2.1.2.1-2.1.2.4。
- 打开 CCP-EM。创建一个名为 mGlu5 的新项目,并指定项目目录和用户名。
- 从左侧面板的选项中打开 Relion 。
- 转到 Mask Creation 选项卡。
- 提供 EMD-31536 的其中一个半图作为输入。
注意:Relion 接受带有 .mrc 作为后缀的地图,而 EMD 地图具有 .map 后缀。地图文件可以在ChimeraX中打开以供检查,并以.mrc格式保存。 - 在 掩模 选项卡中,提供 0.89 Å 的像素大小和 0.007 的初始二值化阈值。
- 使用别名 31536(或任何其他易于遵循的名称)运行作业。
- 同样,为 EMD - 31537 半贴图创建掩膜。
- 从CCPEM左侧面板的选项中打开 Refmac Servalcat 程序。
- 提供名称为 mGlu5_agonist。
- 按照模型部分 2.1.2.4 中所述导入7fd8_noligand_chainA .pdb 文件。提供两个半贴图的位置以及在 Relion 中创建的相应蒙版。
- 将分辨率指定为 3.8 Å。
- 转到 Strict Symmetry >细化设置 ,并提及 C2 作为 Relion 点群对称性。
- 按下顶部的开始按钮启动程序。
- 从左侧面板的选项中打开 Relion 。
- 作业完成后,在 Coot 中打开结果(选项位于结果部分的顶部)。默认情况下,这将在 Coot 中显示 diffmap.mtz,其中红色和绿色分别表示负和正密度。
- 转到 显示管理器> 标记为 DELFWT PHDELWT 的差异映射的属性,并将等值线级别更改为 4.0 (绝对值)。
注意:阈值的选择取决于地图和分辨率。 - 隐藏标记为 FWT PHWT 的映射和标记为 refined.pdb 的分子。
- 使用鼠标移动地图以可视化正密度(绿色),并将较大的斑点置于中心。
- 转到 文件>获取单体,键入 QUS,然后按 回车键。
- 转到 Calculate > Modeling > Rigid Body Fit 分子 ,然后双击 QUS 单体以调整分子以适应 Fo-Fc 密度。
- 使用编辑选项卡中的合并分子选项将 QUS 分子添加到坐标文件 refined.pdb。
- 重复步骤 2.1.4.3-2.1.4.6,分别在细胞外和跨膜结构域顶部的较小斑点中拟合具有单体代码 NAG 和 CHS 的配体。
- 将坐标另存为 refined_ligands.pdb。
注意:跨膜 (TM) 结构域的分辨率较低,因此此处不讨论。
- 转到 显示管理器> 标记为 DELFWT PHDELWT 的差异映射的属性,并将等值线级别更改为 4.0 (绝对值)。
- mGlu5 配体结构的改进
- 打开 CCPEM 并克隆上一个优化作业(步骤 2.1.3.2),并使用 refined_ligands.pdb 和锐化映射 (emd.31536.mrc) 作为输入,使用默认参数和 C2 对称性。
注意:如果程序无法识别配体,则需要提供 CIF 文件。这些 CIF 文件可以从 PDB 下载或使用各种程序生成(有关详细信息,请参阅步骤 3.1.1)。
- 打开 CCPEM 并克隆上一个优化作业(步骤 2.1.3.2),并使用 refined_ligands.pdb 和锐化映射 (emd.31536.mrc) 作为输入,使用默认参数和 C2 对称性。
- PyMOL中的可视化和图形生成
- 在 PyMOL 中打开最新的 Refmac 优化作业中的 refined_expanded.pdb 模型。
- 转到 File > Open 并浏览到 Refmac 作业目录以加载 diffmap_normalised_fofc.mrc(与步骤 2.1.3.2 中的 Servalcat 作业的差异映射)文件。
注意:如果 .mrc 扩展名文件在浏览时不可见,请将文件类型更改为 所有文件 并浏览。 - 使用 显示>序列选择配体。
- 转到 “操作 ”按钮,然后将选择重命名为配体。
- 在命令行中键入以下内容 并按回车键:isomesh mesh_ligands, diffmap_normalised_fofc, 6.0, ligands, carve=2.5。
注意: 网格宽度可以调整。这里使用 0.2 网格宽度,这是使用以下命令设置的: set mesh_width=0.2。 - 右键单击其中一个 单体 ,然后转到 链接>颜色 以指定每个单体的颜色。使用配体中 标记为 c 的最后一个框 为配体和网格着色,并mesh_ligands对象。mGlu5 受体二聚体以卡通表示形式显示,单体呈蓝绿色和小麦色。配体以棒状显示,构成配体轮廓的网状物为绿色。
- 使用 对对象>定向/居中/缩放 选项的操作,并手动调整以清晰地可视化网格。选择附近可能与配体相互作用的残基,例如,QUS 的 Tyr64、Trp100,并根据需要显示它们的侧链或主链或两者作为棒状表示。
- 光线追踪可生成高分辨率图像并将其保存为 png 文件。
注:对拮抗剂绑定图EMD-31537和相应的坐标文件PDB-7fd9重复上述步骤。
3. 在高分辨率锐化β-半乳糖苷酶图谱中对抑制剂、脱氧半乳糖-野尻霉素 (DGN) 和溶剂分子进行建模
- 使用 cryoEM 的半图鉴定配体 DGN
- 用于建模的未知配体字典的制备 [Deoxygalacto-nojirimycin(DGN)]
注:脱氧半乳糖-nojirimycin 字典文件作为 DGJ(3 个字母配体 ID)包含在 CCP4 单体库中。然而,这里它被认为是一种新的和未知的配体,以说明为未知配体生成字典文件的过程,DGN 用作 3 个字母的代码。- 在 PubChem 网页中打开脱氧半乳糖-野尻霉素 (DGN) 的化合物摘要,并复制化合物脱氧半乳糖-野尻霉素的微笑字符串。
- Open Phenix > 配体 > eLBOW.
- 将 smiles 字符串指定为输入。
- 指定适当的配体构建优化方法。这里,使用了简单的优化。
- 将化学微笑字符串粘贴到配体定义部分。
- 提供适当的职位名称、输出文件前缀和配体 ID,然后按运行。
注意:作业的输出包含坐标文件 DGN.pdb 和字典文件 DGN.cif 文件。Jligand29 也可用于制作 cif 文件。
- 从 PDB 下载 β-半乳糖苷酶坐标文件 (6tsh.pdb),并使用文本编辑器或 Coot 中的删除链/区域选项删除蛋白质链(B、C、D)、配体、DGN 和其他溶剂分子的坐标。将坐标文件另存为 apo-betaGal_chainA.pdb。
注意:ChimeraX 或 Pymol 也可用于去除配体/溶剂分子。 - 从 EMDB 的 EMD-10563 条目的其他数据中下载半地图(emd_10563_half_map_1.map 和 emd_10563_half_map_2.map)。
- 打开 CCPEM 并使用 Relion 在阈值 0.01 处为地图创建掩码(如步骤 2.1.3.1.1-2.1.3.1.4 中所述)。
- 使用步骤 3.1.3 中获得的半映射和步骤 3.1.2 中获得的 apo 模型和 D2 对称性运行 Servalcat(在步骤 2 中所述的 CCPEM 套件中)。
注意:模型必须与半图或全图之一对齐,以定位配体密度。这可以通过使用 ChimeraX 将模型拟合到地图中,然后保存相对于半地图的坐标来完成。在此示例中,半贴图和EMDB中的主贴图具有不同的框大小/网格,需要将模型放置在半贴图中。 - 打开 Coot。
- 打开 DGN.cif 以获取在步骤 3.1.1 中使用 Phenix eLBOW 生成的配体字典。这是通过转到 文件>导入 CIF 字典 并浏览 eLBOW 作业目录来完成的。
- 打开蛋白质和配体坐标文件,分别是步骤 3.1.2 中的 apo-betaGal_chainA.pdb 和步骤 3.1.6 中的 DGN.pdb。
- 从 Servalcat 作业(步骤 3.1.5)自动打开 diffmap.mtz 文件,并在 Coot 中可视化标记为 DELFWT PHDELWT 的地图。在阈值 ~ 4 绝对值处绘制地图轮廓。
注意:通过键入 标题 map.mrc 或使用 Chimera 中的工具来检查地图统计信息非常重要。可以获得有关像素大小、框大小、最小值、平均值和最大密度以及与平均密度的均方根偏差的所有必要信息。检查冷冻EM图谱的像素大小和盒子大小至关重要。3D 图表示 3D 体素网格中的蛋白质-配体图体积。在每个体素中,都存储了电子势值或在该位置找到电子的概率。当选择某个阈值时,密度低于指定值的体素将设置为零。这有助于最小化地图中的实验噪声,并更好地可视化地图特征43.因此,地图的轮廓应设置在一个阈值处,在该阈值下,地图要素易于看到,并且地图中的噪声最小。 - 转到 配体>查找配体。在出现的新窗口中,选择配体、差值图和 apo-betaGal_chainA.pdb 模型。将其他选项保留为默认设置,然后单击“ 查找配体 ”以开始搜索。
- 显示潜在配体密度的热门命中列表,并在每个密度中放置一个副本。手动检查放置配体的所有命中。保留最可能的命中,并删除模棱两可的命中。
注:在高阈值下图谱密度的差异清楚地表明活性位点中存在配体。
- 用于建模的未知配体字典的制备 [Deoxygalacto-nojirimycin(DGN)]
- 对配体 DGN 和溶剂分子进行建模
- 在Coot中进行 实空间细化 ,使配体(DGN.pdb)拟合到差密度图中,然后将配体坐标与apo-betaGal_chainA.pdb 合并 ,另存为betaGal_chainA+ligand.pdb。
注意:在保存合并的坐标文件时,可以删除已放置在其他链区域的配体,并且不会合并。其他链中的配体可以通过NCS配体生成,如示例1,步骤1.2.8所示,或者在Refmac / Servalcat中使用对称扩展。 - 如上所述(步骤 3.1.5)运行另一个 Servalcat 作业,将 betaGal_chainA+ligand.pdb 作为输入模型,并使用 D2 对称性进行半映射(来自步骤 3.1.3)。
- 建模配体周围的差异密度(来自步骤 3.2.2 的 Servalcat 作业)表明存在与配体分子配位的溶剂分子。对于水分子来说,靠近配体的中心密度似乎太大。
- 根据先前的生化和结构数据表明该位置存在 Mg2+,通过单击放置原子选项并将原子指定为 MG,可以在此处对 Mg2+ 离子进行建模。
- 通过单击指针处的放置原子并选择水,对活性位点中指示溶剂分子存在的不同密度中的水分子进行建模。
注意:Coot 还可以选择自动选择水分子。在这里,由于焦点仅在活性位点上,因此水分子是手动添加的。 - 将 Mg2+ 和水的坐标与 betaGal+ligand.pdb 文件合并,并将其另存为 betaGal+ligand+solvent_chainA.pdb。
- 使用 betaGal+ligand+solvent_chainA.pdb,在具有 D2 对称性的 Servalcat 中执行 Refmac 细化。
注意:此作业的输出差值图可以作为一种方法来验证配体是否已准确建模,因为差值图应显示最小的残余正或负密度。
- 在Coot中进行 实空间细化 ,使配体(DGN.pdb)拟合到差密度图中,然后将配体坐标与apo-betaGal_chainA.pdb 合并 ,另存为betaGal_chainA+ligand.pdb。
- 使用 PyMOL 进行可视化和图形生成
注意:下面概述的步骤提供了一些使用模型和图谱制作图形的示例,这些模型和图谱可用于说明配体和溶剂的存在。- 打开最后一个Servalcat作业(步骤3.2.6)的refined_expanded.pdb,并对配体和溶剂进行建模。
- 分别选择不同的链,将它们染成洋红色、黄色、绿色和蓝绿色,如示例 2 中所述。
- 转到 “显示>序列”,分别选择水分子、镁和 DGN,并将对象分别重命名为水、MG 和 DGN。
- 通过选择 对象,右键单击并 显示球体,将 MG 和水分子显示为球体>。同样,以棒状表示形式显示配体,并适当地为配体和溶剂着色。在这种情况下,配体被杂原子染成黄色,镁离子被染成紫色,水分子被染成红色。
- 选择 DGN、MG 和 水分子。右键单击并选择 >复制到对象的操作 ,并将其命名为配体。
- 在步骤 3.2.6 中打开 Servalcat 作业中的 diffmap_normalised_fo.mrc,并重命名为 ligand_fo.mrc。键入以下命令: isomesh mesh_ligands_fo, ligand_fo, 3, ligands, carve=2。
注意:2 Å 的雕刻选项应用于原子周围,根据地图的分辨率和质量,可以使用 3-5 的值。此外,在 PyMOL 中打开 cryoEM 地图时,建议将normalize_ccp4_maps设置为关闭。 - 使用 定向/缩放选项>操作 并手动调整以可视化配体和附近的相互作用残基(如果适用),如步骤 2.3.7 所示。
- 光线追踪这些场景以使用命令 ray 3600、3600 保存高分辨率图像。
- 将场景另存为.png文件。
注意:以下步骤是可选的,并概述了可视化 (1) 未建模配体 DGN 的差异密度 (Fo-Fc)、(2) 建模配体的密度 (Fo) 以及未建模溶剂的差异密度 (Fo-Fc) 以及最后 (3) 建模配体的密度 (Fo) 、DGN 和活性位点中的溶剂分子。 - 要使用差异图证明配体、DGN 和周围溶剂分子的存在,请在步骤 3.1.5 中从 Servalcat 作业中打开 diffmap_normalised_fofc.mrc 。通过单击地图对象旁边的 操作>重命名 ,将地图文件重命名为 unliganded_fofc.mrc。在命令行中键入以下内容: isomesh mesh_ligands_fofc, unliganded_fofc, ligands, level=6, carve=2。
- 要演示建模配体 DGN 的密度和周围未建模的溶剂密度,请在步骤 3.2.2 中打开 servalcat 作业中的 diffmap_normalised_fo.mrc 和 diffmap_normalised_fofc.mrc 。将 diffmap_normalised_fo.mrc 重命名为 DGN_fo ,将 diffmap_normalised_fofc.mrc 重命名为 DGN_unmodelled_solvents_fofc。
- 从“显示>序列”中选择“MG”和“水”,右键单击并选择>复制到对象的操作,并将它们命名为溶剂。
- 在命令行中键入以下内容: isomesh mesh_DGN_fo, DGN_fo, DGN, level=3, carve=2;isomesh mesh_solvent_fofc, DGN_unmodelled_solvents_fofc, solvents, level=6, carve=2。
注意:mesh_DGN_fo将显示配体的密度,mesh_solvent_fofc将显示 MG 和水的省略密度。 - 最后,要可视化建模的配体以及活性位点中的周围溶剂分子,请在步骤 3.2.6 中从 Servalcat 作业中打开 diffmap_normalised_fo.mrc ,并将其重命名为 ligand_fo.mrc。
- 在命令行中键入以下内容: isomesh mesh_ligand_fo, ligand_fo, selection=ligands, level=3, carve=2。
注意:在这里,我们使用了 diffmap_normalised_fo.mrc,但最终的锐化图可用于显示配体和周围残基的密度。在图例中提及所使用的地图类型、B 因子锐化值是一种很好的做法。 - 可以通过键入以下命令来设置网格宽度和球体大小: set mesh_width=0.2 和 set sphere_scale=0.25 以减小球体尺寸。
- 将 fo 网格涂成蓝色,将 fofc 网格涂成绿色。
- 使用 定向/缩放选项>操作 并手动调整以可视化配体和附近的相互作用残基(如果适用),如步骤 2.3.7 所示。
- 光线追踪这些场景以使用命令 ray 3600、3600 保存高分辨率图像。
- 将各个场景另存为.png文件。
4. 分辨率对β-半乳糖苷酶配体建模的影响
- 打开 Terminal 并转到包含两个半映射的目录。
- 在 ChimeraX 中打开 .map 格式的两个半映射(步骤 3.1.3),将它们可视化并将它们保存为 emd10563_half1_1_unfil.mrc 和 emd10563_half2_1_unfil.mrc。
- 在步骤 3.1.4 中创建的掩码可以用作输入。
- 在 Relion 中使用步骤 4.2-4.3 中的半贴图和掩码,使用默认参数运行 PostProcessing 作业。
- 重复步骤 4.4,现在启用 Skip FSC 称量 并指定 3 Å 的临时低通滤光片。
- 使用 3.5 Å 的临时低通滤波器重复步骤 4.4。
- 在PyMOL中打开步骤4.4-4.6中的映射(postprocess.mrc),以不同的分辨率进行过滤,以及步骤3.1.2中的模型坐标6tsh.pdb(与ChimeraX中的半映射对齐)文件。将不同的映射重命名为 3.0、3.5 和 2.3,具体取决于其分辨率。
注意:可以通过在 ChimeraX 或 Coot 中可视化地图来确认地图的低通过滤。 - 如步骤3.3.6中所述,通过在配体和溶剂分子周围以6σ的阈值创建2 Å的网格,将映射过滤到不同的分辨率,从而可视化分辨率对配体和溶剂分子密度的影响。
Subscription Required. Please recommend JoVE to your librarian.
Representative Results
示例 1
来自结核分枝杆菌的烯醇化酶催化糖酵解的倒数第二步,并将 2-磷酸甘油酸转化为磷酸烯醇丙酮酸 (PEP),这是几种代谢途径的重要中间体44,45。在相同像素大小 1.07 Å 下收集 apo-烯醇化酶和 PEP 结合烯醇化酶样品的 CryoEM 数据,并使用 Relion 3.146,47 进行图像处理。载脂蒲-烯醇化酶和PEP-烯醇化酶结构分别在3.1 Å和3.2 Å处测定48。地图和模型存放在 EMDB 和 PDB49,50(EMD-30988、EMD-30989、PDB-7e4x 和 PDB-7e51)中。该酶的冷冻EM图谱显示它是溶液中的八聚体(图1A)。为了识别PEP-烯醇化酶图谱中的配体密度,选取了脱辅辅基酶和PEP结合酶的未锐化图谱,并通过从脱辅部酶图中减去PEP-烯醇化酶图谱,在ChimeraX中计算出差异图谱。在高阈值下观察到明显的密度(绿色),这表明存在配体(图1B)。在未锐化的图谱中对蛋白质链进行建模清楚地表明,蛋白质的活性位点中存在额外的密度(图1C)。然后使用Coot在B因子锐化图中对配体PEP进行建模,并使用Phenix在真实空间中优化蛋白质+配体模型。在配体附近观察到的密度中模拟了两个Mg2+离子(图1D)。配体 PEP 采用与其他烯醇化酶同系物中观察到的相似取向,并且几种活性位点残基(如 Lys-386、Arg-364)与配体 PEP 形成氢键相互作用。Mg2+ 离子与 Asp-241、Glu-283、Asp-310 和 PEP 的磷酸盐形成金属配位键(图 1D)。
示例 2
在没有可用的载脂蛋白结构的情况下,或者如果蛋白质经历了较大的构象变化,则无法计算上述差异图。2021 年,剑桥分子生物学实验室的 Garib Murshudov 团队推出了 Servalcat22,它使用 Refmac 实现细化工作流程,并在细化后计算 Fo-Fc 差异图。正的 Fo-Fc 差分密度表明存在在细化过程中未包含在模型中的分子/配体,本质上是一个省略图。但是,建议先评估模型与地图的一般拟合度,然后再评估差分密度图。
为了说明Servalcat/Refmac的使用,选择了mGlu5,一种与神经递质结合的二聚体G蛋白偶联受体,L-谷氨酸。在激动剂 L-quisqualate 结合后,细胞外结构域重新定向,从而触发 7TM 的旋转,使它们更接近以稳定活化状态。因此,在 apo/拮抗剂 与 apo/拮抗剂之间观察到很大的构象变化。激动剂结合态51(图2A 和 图2E)。激动剂 (EMD-31536) 和拮抗剂 (EMD-31537) 结合复合物的两个半图图均来自 EMDB,冷冻 EM 图谱显示整个分子的不同分辨率和更好的细胞外结构域分辨率。随后,这些被用作 Servalcat 的输入以及 apo-protein 作为模型来计算每个数据集的差异或 Fo-Fc 映射。该图清楚地显示了各种配体分子(非蛋白质)的存在。FSC(傅里叶壳相关性)估计的激动剂和拮抗剂结合复合物的分辨率分别为3.8 Å和4.0 Å。在激动剂结合的mGlu5的情况下,Servalcat Fo-Fc差异图显示激动剂(L-quisqualate)(图2B)和N-乙酰氨基葡萄糖(NAG)(图2C)在受体的ECD中都存在(由于TMD的分辨率较低,这里我们只关注ECD和TMD的顶部)。蛋白质残基,包括 Tyr-64、Trp-100、Ser-151 和 Thr-175,被认为与激动剂相互作用。Asn-210残基附近的密度表明存在N-乙酰氨基葡萄糖(图2C)。在跨膜螺旋 1 的顶部附近观察到与纯化 mGlu5 期间添加的胆固醇半琥珀酸酯一致的密度(图 2D)。由于分辨率适中,并且配体L-quisqualate可以放置在不同的方向上,因此使用配体的细胞外结构域(PDB-6N50)的先验结构作为对配体建模的指南。拮抗剂结合稳定受体的开放或静止状态(图2E)。在ECD的金星捕蝇器结构域的叶I和叶II的铰链处观察到与拮抗剂LY341495一致的密度。拮抗剂与类似于激动剂的残基相互作用。叶II中的Tyr-223与拮抗剂之间的堆叠相互作用使受体处于开放状态稳定(图2F)。与激动剂结构类似,在Asn-210附近观察到糖基化或N-乙酰氨基葡萄糖部分的存在(图2G)。
示例 3
第三个示例阐明了在高分辨率 CryoEM 图谱中对片段大小或小尺寸的配体和溶剂分子进行建模的方案。基于片段的药物发现 (FBDD) 已成为一种强大而创新的方法,用于在各种疾病领域开发基于靶向的新型疗法,使其成为制药研发中一个有前途的途径52,53。FBDD首先要筛选和仔细选择与特定靶蛋白或目标生物分子结合的小的、高度可溶的、低分子量的分子片段。确定这些蛋白质-片段复合物的结构揭示了这些片段的结合模式,这为设计更大、更复杂的药物样分子提供了指导,这些分子对靶蛋白的亲和力和特异性越来越强54。然而,这种方法需要高分辨率的配体密度才能准确确定姿态并正确放置配体15的官能团。
β-半乳糖苷酶是 cryoEM 技术进步中最早确定的高分辨率结构之一,是一种经过充分研究的 450kDa 同型四聚体酶,可催化乳糖水解为葡萄糖和半乳糖55。为了展示冷冻电镜在 FBDD 中的应用,英国 Astex 用片段大小的抑制剂脱氧半乳糖nojirimycin(DGN)结合活性位点 (EMDB-10563, PDB:6tsh)56 确定了 β-半乳糖苷酶的结构。该数据集用于说明在高分辨率图谱中明确建模配体和溶剂的协议。为了展示分辨率对配体建模和可视化的影响,在Relion的后处理步骤中,将图谱过滤到3.0 Å和3.5 Å。这突出了不同分辨率下的图谱密度质量,并强调了对配体和溶剂建模需要更高分辨率的需求。
该酶是溶液中具有D2对称性的四聚体(图3A)。由Servalcat计算的差异图(图谱和模型之间)表明酶的活性位点中存在DGN和几种溶剂分子(图3B)。在估计的分辨率为2.3 Å时,密度显示出高分辨率特征,这有助于准确建模蛋白质活性位点中的抑制剂。观察到DGN与Tyr-503和His-540之间的相互作用(图3C)。差异密度还表明存在与DGN相互作用的溶剂分子以及蛋白质残基。在密度中模拟了Mg2+ 和几个水分子(图3D)。观察到Mg2+ 和Glu-416,Glu-461和几种水分子之间的金属配位键(图3D)。Mg2+ 被发现通过水分子与 DGN 相互作用。
在3.5 Å和3.0 Å的较低分辨率下,配体密度类似于一个斑点,缺乏对配体准确建模至关重要的高分辨率特征(图4A,B)。在这些分辨率下,水分子的密度几乎不存在。总之,随着分辨率的提高,特别是高于3.0 Å,密度使得能够对更多的水分子进行建模(图4C,D)。配体手性中心的正确定位在~2.3 Å(图4C,D)时变得可以实现,因为图中存在指导水分子和Mg2+的放置和建模的独特特征。相比之下,Mg2+的密度在整个分辨率范围内仍然清晰可辨(图4A-C)。
图 1:结核分枝杆菌烯醇化酶中配体磷酸烯醇丙酮酸建模。 (A) 显示了 PEP 结合的烯醇化酶的 B 因子锐化图。该图表明烯醇化酶在溶液中是八聚体,并且图中的每种单体的颜色都不同。(B) 以灰色显示 apo-Enolase 酶的未锐化 cryoEM 图,差异图(PEP 结合和 apo-Enolase 未锐化图)以绿色覆盖,表明存在配体 PEP。这是显示配体存在的演示图。(C) 显示烯醇化酶模型在未锐化的 cryoEM 图中的拟合,突出显示差异密度相对于蛋白质的位置。蛋白质模型以卡通表示形式显示,并以 Chainbow 着色。该图显示额外的密度(绿色)存在于每个单体的活性位点中。(D)表示配体PEP,包裹在B因子锐化图中,颜色为蓝色。此外,还观察到两个 Mg2+ 离子的密度,它们与几个活性位点残基形成金属配位键,包括 Ser-42、Asp 241、Glu-283、Asp-310 和配体原子。配体与 Lys-386、Lys-335 和 Arg-364 发生氢键相互作用。蛋白质残基以棒状表示形式显示,Mg2+ 离子以紫色球体形式显示。面板 (A-D) 中的数字是用 Pymol 生成的。请点击这里查看此图的较大版本.
图 2:mGlu5 受体中各种配体的鉴定、建模和可视化。 Fo-Fc 省略图是使用 Servalcat 获得的。(A)以卡通表示的形式显示了mGlu5 受体二聚体结构(PDB-7fd8),每个单体分别用蓝绿色和小麦色着色,并与激动剂L-quisqualate结合。在受体的细胞外和跨膜结构域顶部鉴定的所有配体都被包裹在Fo-Fc省略图中,呈绿色,并在6σ处轮廓一致。(B)突出了激动剂的拟合度,L-quisqualate包裹在差异图中。L-quisqualate 与几种 mGlu5 残基相互作用,包括 Tyr-64、Trp-100、Ser-151、Thr-175 和 Gly-280。氢键相互作用用红色破折号表示。在(C)中,Asn-210附近明显存在额外的密度,Asn-210存在于受体的细胞外结构域中,并且N-乙酰氨基葡萄糖分子(NAG)在此密度中建模。为清楚起见,NAG在当前图中没有与Asn相关联。(D)显示了胆固醇琥珀酸酯(CHS)在受体脂质暴露表面附近的绿色密度差异。棒中表示的CHS分子是在这个密度下建模的。(E) 以卡通表示的形式显示了 mGlu5 受体结构 (PDB-7fd9) 与拮抗剂LY341495结合。在(F)中,位于细胞外结构域叶I和叶II之间的铰链处的Fo-Fc差异图中的额外密度表明存在拮抗剂。拮抗剂周围的关键残基(Tyr-64、Trp-100、Ser-152、Ser-173、Thr-175 和 Tyr-223)以棒状表示形式显示,与拮抗剂的潜在氢键相互作用以红色虚线表示。(G) 显示密度差异,表明拮抗剂结合结构中 Asn-210 附近存在 NAG 分子(注意,为了清楚起见,NAG 未与 Asn 链接)。这些数字是用 Pymol 生成的。 请点击这里查看此图的较大版本.
图 3:β-半乳糖苷酶 (EMD-10563) 高分辨率图谱中小抑制剂和溶剂分子的鉴定、建模和精制。 (A) 显示了在卡通表示中分辨率为 2.3 Å (PDB: 6tsh) 的 β-半乳糖苷酶模型,其中每个单体都有不同的颜色。灰色框突出显示了配体结合位点。(B) 在酶活性位点的绿色网格中显示 Fo-Fc 差异密度(来自 Servalcat)。密度的差异表明活性位点中存在抑制剂 (DGN) 和几种溶剂分子。(C)表明,在Fo-Fc图谱的指导下,抑制剂脱氧半乳糖-野尻霉素(DGN)在活性位点中被建模。这种建模的配体以棒状格式描绘,并包裹在Fo密度中(由Servalcat提供),该密度在blue_mesh着色。观察到 DGN 与几种蛋白质残基(包括 Tyr-503 和 His-540)之间的氢键相互作用。配体周围额外的Fo-Fc差异密度(绿色)表示溶剂分子。(D) 该图显示了在确保每个溶剂分子与蛋白质(Glu-416、His-418 和 Glu-461)或配体残基键合后,分别表示为红色和紫色球体的几种溶剂分子(分别表示为红色和紫色球体)在活性位点中建模。水分子和 Mg2+ 被包裹在 Fo 密度(蓝色网格)中。Mg2+ 被认为通过水分子与配体 DGN 相互作用。面板 (B,C) 中的 Fo-Fc 图(绿色网格)的轮廓为 6σ,而 C 和 D 中的 Fo 密度 - 蓝色网格(来自建模后的 Servalcat 细化)的轮廓为 3σ。面板 (A-D) 中的数字是用 Pymol 生成的。请点击这里查看此图的较大版本.
图 4:分辨率对 β-半乳糖苷酶配体建模的影响。 在Rerelion 后处理步骤中,将 EMD-10563 的半图用作输入,并将组合的后处理图过滤到分辨率为 2.3 Å、3.0 Å 和 3.5 Å,具有不同的 B 因子。所有面板中显示的地图的等高线为 6σ。为清楚起见,图A、B和C中仅显示蛋白质骨架,没有侧链、配体或溶剂分子。 (A)将图谱过滤至3.5 Å,并显示β-半乳糖苷酶的活性位点。在此分辨率下可以看到一个类似于配体DGN的斑点,并在附近伴随着一些较小的斑点。由于图谱中缺乏明显的特征,因此在正确的方向上对配体进行建模被证明是具有挑战性的。(B) 显示过滤到 3.0 Å 分辨率的地图。在这里,配体斑点变得稍微清晰一些,但总体上仍然缺乏特征。还观察到一些提示溶剂分子的小斑点。(C) 滤波到2.3 Å分辨率的图谱揭示了配体密度,并具有明显的特征,特别是揭示了亚氨基糖的椅子构象。在此分辨率下,可以观察到大量对应于水分子的小斑点。Relion 后处理中的自动 B 因子估计/锐化对于过滤到 3 Å 和 3.5 Å 的映射的值为 -18 Å2,而对于过滤到 2.3 Å 的映射,值为 -52 Å2。 也可以使用 Coot 执行 EM 映射的不同 B 因子锐化,这在模型构建中很有用。(D) 该面板说明了配体 DGN(棒表示)、Mg2+ 和水分子(作为球体)在活性位点和 2.3 Å 处的锐化图中建模,以这些原子周围的蓝色网格显示。面板 (A-D) 中的数字是用 Pymol 生成的。请点击这里查看此图的较大版本.
Subscription Required. Please recommend JoVE to your librarian.
Discussion
近年来,显微镜硬件和软件的改进导致冷冻电子显微镜结构数量的增加。尽管目前在单颗粒冷冻EM中实现的最高分辨率为1.2 Å 57,58,59,但大多数结构的确定分辨率约为3-4 Å。在中低分辨率图谱中对配体进行建模可能很棘手,而且往往充满歧义。鉴于冷冻电镜在学术界和制药行业广泛用于转化研究和药物发现,确保配体建模正确且无歧义至关重要。因此,通过计算Q 分数 60 来量化配体原子的可分辨性是谨慎的,Q 分数现在在 EMDB 中可用作评估映射质量和模型拟合度的指标,以及在 Chimera 中。
在第一个示例中,ChimeraX用于计算结核分枝杆菌烯醇化酶中apo和配体结合图之间的真实空间差异图。高阈值下的额外密度表明活性位点中存在配体磷酸烯醇丙酮酸,并且 Mg2+ 与配体结合。需要注意的是,在这种情况下,图谱的分辨率为中等分辨率(3.2 Å),无法自信地对水分子进行建模(图1)。与该方法相关的局限性在于,它只能在配体结合不诱导蛋白质中显着的构象变化时应用。在这种情况下,没有执行映射归一化,因为 apo 和配体结合数据集都是在相同的像素大小下采集的,并在 Relion 中使用相同的参数进行处理。然而,值得注意的是,在比较由不同重建程序(如 Relion46,47 和 CryoSparc61)生成的地图或不同质量的地图时,在进行有意义的比较之前,地图的归一化变得至关重要。
下一个例子是 mGlu5,它在激动剂结合时会经历大分子重组,从 cryoEM 结构51,62 中可以明显看出(图 2)。在这种情况下,由于映射之间存在很大差异,因此计算未结合 (apo) 和配体结合受体之间的简单差异图是不可行的。在这里,使用了 Servalcat,它使用未锐化和未加权的半贴图作为在倒数空间中进行细化的输入,然后计算实验映射和从模型派生的映射之间的差异映射。在高阈值下,可以可视化差异,并作为模型校正和改进的指南。在mGlu5的细胞外和跨膜结构域附近观察到几个未建模的斑点,并将其用作建模配体的指南(图2)。
第三个示例显示了分辨率 (2.3 Å) 如何在 β-半乳糖苷酶中片段大小的抑制剂的图谱解释和建模中起关键作用。在这里,挑战在于在数据中固有的噪声中识别出Servalcat差分图中一个非常小的配体(<200 Da),并对其进行准确建模。除了使用傅里叶壳相关 (FSC) 确定的高全局分辨率外,配体特异性的局部分辨率也足够高,以确保配体手性中心的准确放置(图 3)。在整个酶的差异图中观察到溶剂分子的密度,尤其是配体周围的差异图。还证明了分辨率对模拟配体和溶剂原子的影响(图4)。在对水或溶剂分子进行建模时,务必谨慎行事,因为有时,低阈值下的噪声可能类似于水或溶剂分子,从而导致潜在的误解。
另一个重要的考虑因素是,仅靠冷冻电磁图可能不足以准确识别金属离子。通常需要额外的生物物理方法,如扩展 X 射线吸收精细结构 (EXAFS) 或能量色散 X 射线光谱 (EDX) 来确认金属离子的存在和身份。在烯醇化酶和β-半乳糖苷酶中,由于这些蛋白质已有大量信息,因此对Mg2+ 进行了建模,证实了金属离子的身份。此外,在这些情况下,金属离子的配位,以经典的八面体几何形状和Mg2+的近乎理想的配位距离为例,为它们的同一性提供了实质性的证据。
一般来说,在冷冻电磁图谱中对配体进行建模时,应考虑一些重要的考虑因素。首先,选择正确的配体识别和建模图谱非常重要。在所有情况下,建议使用未锐化和未加权的图谱或半图,而不是锐化和加权的图谱,以可视化配体密度,因为锐化和加权可能会导致图中出现锐化不足或锐化过度(由于序列终止导致的噪声)区域。这可能会导致配体密度欠佳,并且在 Coot 模型构建过程中,可以使用不同的 B 因子锐化来评估密度。尽管在冷冻EM图谱中使用锐化图谱来识别配体存在风险,但未锐化的图谱可能无法显示配体密度的全部细节,但可用于演示目的,如图1B,C所示。
应验证建模配体的姿态,尤其是在数据较弱的情况下。如此处所示的 mGlu5,整个 cryoEM 图谱的局部分辨率各不相同,配体的无偏建模可能具有挑战性。Servalcat 可以用作检测蛋白质和配体建模中潜在不准确性的宝贵工具22。
蛋白质-配体复合物中可能存在成分异质性,其中只有特定群体可能存在配体(如果配体分子量低,则分类步骤可能无法消除异质性)。然而,在配体建模之前,在图像处理过程中迭代执行 3D 分类63 步骤并验证配体的密度是否提高是很重要的。如果存在多个蛋白质拷贝,则在初始模型生成和细化期间,在图谱上应用对称性时应谨慎,因为这可能会平均所有对称性相关分子中的配体密度。只有在彻底检查图谱以确认所有蛋白质链中存在配体密度后,才应实施对称性。
根据状态(晶体或溶液)和位置(埋藏或表面),原子可以是动态的,在模型细化中,这被称为原子位移参数(ADP)。除了为模型中可能存在的不准确提供视觉线索的差异图外,ADP值还可用于评估细化后的配体的准确性64,65,66,67。通常,配体应具有与周围残基相似的 ADP 值,即如果它们稳定结合且建模准确。然而,远离大分子的外围配体或配体原子(如脂质)可能具有更高的 ADP 值。除了细化坐标外,Refmac 33,34 和 Phenix 都允许细化 ADP 值28,68。在Refmac中,Mott-Bethe近似用于在映射计算过程中计算单个原子的电子散射因子。在最新版本的Phenix中,引入了类似于晶体学的单个B因子细化来解释原子无序。很多时候,在从cryoEM导出的精细模型中,会观察到范围很广的ADP值(有时值接近于零),甚至EMDB中用于评估模型与图符拟合度的Q分数也取决于沉积的主图和B因子锐化的性质60。在冷冻电子模型构建中,经常使用多个图谱,因此,在建模和细化中使用的图谱应在方法中明确提及,因为由于许多大分子的各向异性分辨率,一个图谱可能不足以解释所有细节。
在大分子配体建模中,冷冻电磁图谱(如晶体学)的主要局限性之一是,如果配体结合位点的分辨率较低,或者结合的配体是动态的,那么确定正确的构象可能会很困难。此外,大多数冷冻电镜结构的分辨率低于 3 Å,并且图谱中水分子的表示有限,因此难以评估水合在配体或药物结合中的作用(如图所示的烯醇化酶和 mGluR 示例)。计算方法可以与冷冻EM数据结合使用,以解决这些局限性69.与晶体学相比,只有模型进行了细化,而没有对地图进行细化。目前,指示配体存在或确保准确建模的唯一方法是生成省略图(使用Servalcat等工具)。因此,有许多工具可以帮助研究人员构建和评估模型,但在模型改进中有几个领域,可以预期在不久的将来会出现更新的方法或对当前方法的修改。
在本文中,我们重点介绍了当前用于建模配体的方法,其中包括手动检查配体密度,生成配体几何文件,然后在冷冻EM图中对配体进行建模。这是结构生物学和药物发现的一个激动人心的时期,因为具有更快帧速率和使用更快数据采集的直接电子检测器70 导致在相对较短的时间内获得通常与小分子配体结合的几种大分子的高分辨率图谱 (<2.8 Å)。最近推出的自动化配体建模工具,如薛定谔套件中的GEMspot69 和Rosetta套件中的EMERALD17 ,试图在考虑实验性冷冻EM数据的同时找到配体最可能的结合姿态,有望简化和自动化这一过程。与X射线晶体学类似,可以预见的是,通过冷冻电镜识别小分子配体的结合模式,可能在一天内识别两个或更多,将成为一个现实的可能性。
Subscription Required. Please recommend JoVE to your librarian.
Disclosures
作者没有什么可透露的。
Acknowledgments
SJ 是 DAE-TIFR 博士生奖学金的获得者,并且资金得到认可。KRV 感谢 DBT B-Life 赠款 DBT/PR12422/MED/31/287/2014 以及印度政府原子能部在项目识别号下的支持。RTI4006.
Materials
Name | Company | Catalog Number | Comments |
CCP4-8.0 | Consortium of several institutes | https://www.ccp4.ac.uk | Free for academic users and includes Coot and list of tools developed for X-ray crystallography |
CCP-EM | Consortium of several institutes | https://www.ccpem.ac.uk/download.php | Free for academic users and includes Coot, Relion and many others |
Coot | Paul Emsley, LMB, Cambridge | https://www2.mrc-lmb.cam.ac.uk/personal/pemsley/coot/ | General software for model building but also available with other suites described above |
DockinMap (Phenix) | Consortium of several institutes | https://phenix-online.org/documentation/reference/dock_in_map.html | Software inside the Phenix suite for docking model into cryoEM maps |
Electron Microscopy Data Bank | Consortium of several institutes | https://www.ebi.ac.uk/emdb/ | Public Repository for Electron Microscopy maps |
Falcon | Thermo Fisher Scientific | https://assets.thermofisher.com/TFS-Assets/MSD/Technical-Notes/Falcon-3EC-Datasheet.pdf | Commercial, camera from Thermo Fisher |
Phenix | Consortium of several institutes | https://phenix-online.org/download | Free for academic users and includes Coot |
Protein Data Bank | Consortium of several institutes | https://rcsb.org | Public database of macromolecular structures |
Pymol | Schrodinger | https://pymol.org/2/ | Molecular viusalization tool. Educational version is free but comes with limitation. The full version can be obtained with a small fee. |
Relion | MRC-LMB, Cambridge | https://relion.readthedocs.io/en/release-4.0/Installation.html | Software for cryoEM image processing, also available with CCP-EM |
Titan Krios | Thermo Fisher Scientific | https://www.thermofisher.com/in/en/home/electron-microscopy/products/transmission-electron-microscopes/krios-g4-cryo-tem.html?cid=msd_ls_xbu_xmkt_tem-krios_285811_gl_pso_gaw_tpne1c& gad_source=1&gclid=CjwKCAiA-P-rBhBEEiwAQEXhHyw5c8MKThmdA AkZesWC4FYQSwIQRk ZApkj08MfYG040DtiiuL8 RihoCebEQAvD_BwE |
Commercial, cryoTEM from Thermo Fisher |
UCSF Chimera | UCSF, USA | https://www.cgl.ucsf.edu/chimera/download.html | General purpose software for display, analysis and more |
UCSF Chimera X | UCSF, USA | https://www.cgl.ucsf.edu/chimerax/ | General purpose software for display, analysis and more |
References
- Steinbrecher, T., Labahn, A. Towards accurate free energy calculations in ligand protein-binding studies. Curr Med Chem. 17, 767-785 (2010).
- Fu, Y., Zhao, J., Chen, Z. Insights into the molecular mechanisms of protein-ligand interactions by molecular docking and molecular dynamics simulation: a case of oligopeptide binding protein. Comput Math Methods Med. 4, 3502514 (2018).
- Grinter, S. Z., Zou, X. Challenges, applications, and recent advances of protein-ligand docking in structure-based drug design. Molecules. 19 (7), 10150-10176 (2014).
- Henderson, R., Hasnain, S. Cryo-EM': electron cryomicroscopy, cryo electron microscopy or something else. IUCrJ. 10 (5), 519-520 (2023).
- Rosenthal, P. B. A potential difference for single-particle cryo-EM. IUCrJ. 6, 988-989 (2019).
- Wang, J., Moore, P. B. On the interpretation of electron microscopic maps of biological macromolecules. Prot Sci. 26 (1), 122-129 (2017).
- Murshudov, G. N. Refinement of atomic structures against cryo-EM Maps. Meth Enzymol. 579, 277-305 (2016).
- Kulik, M., Chodkiewicz, M. L., Dominiak, P. M. Theoretical 3D electron diffraction electrostatic potential maps of proteins modeled with a multipolar pseudoatom data bank. Acta Crystallogr D Struct Biol. 78 (8), 1010-1020 (2022).
- Yonekura, K., Kato, K., Ogasawara, M., Tomita, M., Toyoshima, C. Electron crystallography of ultrathin 3D protein crystals: Atomic model with charges. Proc Natl Acad Sci U S A. 112 (11), 3368-3373 (2015).
- Mu, X., Gillman, C., Nguyen, C., Gonen, T. An overview of microcrystal electron diffraction (MicroED). Annu Rev Biochem. 90, 431-450 (2021).
- Kühlbrandt, W.
The resolution revolution. Science. 343 (6178), 1443-1444 (2014). - EMDB (the Electron Microscopy Data Bank. , Available from: www.ebi.ac.uk/emdb/ (2023).
- Lawson, C. L., et al. EMDataBank unified data resource for 3DEM. Nucleic Acids Res. 44, 396-403 (2016).
- RCSB.org. , Available from: http://www.rcsb.org/stats/growth/growth-em (2024).
- Lees, J. A., Dias, J. M., Han, S. Applications of Cryo-EM in small molecule and biologics drug design. Biochem Soc Trans. 49 (6), 2627-2638 (2021).
- Robertson, M. J., Meyerowitz, J. G., Skiniotis, G. Drug discovery in the era of cryo-electron microscopy. Trends Biochem Sci. 47 (2), 124-135 (2022).
- Muenks, A., Zepeda, S., Zhou, G., Veesler, D., DiMaio, F. Automatic and accurate ligand structure determination guided by cryo-electron microscopy maps. Nat Commun. 14, 1164 (2023).
- Oldfield, T. J. X-ligand: An application for the automated addition of flexible ligands into electron density. Acta Crystallogr D Biol Crystallogr. 57 (5), 696-705 (2001).
- Zwart, P. H., Langer, G. G., Lamzin, V. S. Modelling bound ligands in protein crystal structures. Acta Crystallogr D Biol Crystallogr. 60, 2230-2239 (2004).
- Terwilliger, T. C., Klei, H., Adams, P. D., Moriarty, N. W., Cohn, J. D. Automated ligand fitting by core-fragment fitting and extension into density. Acta Crystallogr D Biol Crystallogr. 62 (8), 915-922 (2006).
- Casañal, A., Lohkamp, B., Emsley, P. Current developments in Coot for macromolecular model building of Electron Cryo-microscopy and Crystallographic Data. Prot Sci. 29 (4), 1069-1078 (2020).
- Yamashita, K., Palmer, C. M., Burnley, T., Murshudov, G. N. Cryo-EM single-particle structure refinement and map calculation using Servalcat. Acta Crystallogr D Struct Biol. 77 (10), 1282-1291 (2021).
- Wood, C. Collaborative computational project for electron cryo-microscopy. Acta Crystallogr D Biol Crystallogr. 71 (1), 123-126 (2015).
- Burnley, T., Palmer, C. M., Winn, M. Recent developments in the CCP-EM software suite. Acta Crystallogr D Struct Biol. 73 (6), 469-477 (2017).
- Potterton, E., McNicholas, S., Krissinel, E., Cowtan, K., Noble, M.
The CCP4 molecular-graphics project. Acta Crystallogr D Biol Crystallogr. 58 (11), 1955-1957 (2002). - Agirre, J. The CCP4 suite: Integrative software for macromolecular crystallography. Acta Crystallogr D Struct Biol. 79 (6), 449-461 (2023).
- Moriarty, N. W., Grosse-Kunstleve, R. W., Adams, P. D. Electronic ligand builder and optimization workbench (eLBOW): A tool for ligand coordinate and restraint generation. Acta Crystallogr D Biol Crystallogr. 65 (10), 1074-1080 (2009).
- Adams, P. D. A comprehensive Python-based system for macromolecular structure solution. Acta Crystallogr D Biol Crystallogr. 66 (2), 213-221 (2010).
- Emsley, P., Cowtan, K. Coot: Model-building tools for molecular graphics. Acta Crystallogr D Biol Crystallogr. 60 (12), 2126-2132 (2004).
- Debreczeni, J. É, Emsley, P.
Handling ligands with Coot. Acta Crystallogr D Biol Crystallogr. 68 (4), 425-430 (2012). - Long, F., et al. AceDRG: A stereochemical description generator for ligands. Acta Crystallogr D Struct Biol. 73 (2), 112-122 (2017).
- Schrödinger. LigPrep. Schrödinger Release 2022-1: Schrödinger, LLC. , Schrödinger, LLC. New York, NY. (2022).
- Brown, A. Tools for macromolecular model building and refinement into electron cryo-microscopy reconstructions. Acta Crystallogr D Biol Crystallogr. 71 (1), 136-153 (2015).
- Murshudov, G. N., Vagin, A. A., Dodson, E. J. Refinement of macromolecular structures by the maximum-likelihood method. Acta Crystallogr D Biol Crystallogr. 53, 240-255 (1997).
- Kovalevskiy, O., Nicholls, R. A., Long, F., Carlon, A., Murshudov, G. N. Overview of refinement procedures within REFMAC 5: Utilizing data from different sources. Acta Crystallogr D Struct Biol. 74 (3), 215-227 (2018).
- Winn, M. D., et al. Overview of the CCP4 suite and current developments. Acta Crystallogr D Biol Crystallogr. 67 (4), 235-242 (2011).
- Pettersen, E. F., et al. UCSF Chimera - A visualization system for exploratory research and analysis. J Comput Chem. 25 (13), 1605-1612 (2004).
- Pettersen, E. F., et al. UCSF ChimeraX: Structure visualization for researchers, educators, and developers. Prot Sci. 30 (1), 70-82 (2021).
- Lamb, A. L., Kappock, T. J., Silvaggi, N. R. You are lost without a map: Navigating the sea of protein structures. Biochim Biophys Acta Proteins Proteom. 1854 (4), 256-268 (2015).
- Ehinger, S., Schubert, W. D., Bergmann, S., Hammerschmidt, S., Heinz, D. W. Plasmin(ogen)-binding α-Enolase from streptococcus pneumoniae: Crystal structure and evaluation of plasmin(ogen)-binding sites. J Mol Biol. 343 (4), 997-1005 (2004).
- Tjia-Fleck, S., Readnour, B. M., Ayinuola, Y. A., Castellino, F. J. High-Resolution single-particle cryo-EM hydrated structure of streptococcus pyogenes enolase offers insights into its function as a plasminogen receptor. Biochemistry. 62 (3), 735-746 (2023).
- DeLano, W. L. The PyMOL molecular graphics system. Schrödinger LLC wwwpymolorg. Version 1. , Available from: http://www.pymol.org (2002).
- Pfab, J., Si, D. Automated threshold selection for cryo-EM density maps. ACM-BCB 2019. Proceedings of the 10th ACM International Conference on Bioinformatics, Computational Biology and Health Informatics. , 161-166 (2019).
- Rahi, A., et al. Enolase of Mycobacterium tuberculosis is a surface exposed plasminogen binding protein. Biochim Biophys Acta Gen Subj. 1861 (1), 3355-3364 (2017).
- Henderson, B., Martin, A. Bacterial virulence in the moonlight: Multitasking bacterial moonlighting proteins are virulence determinants in infectious disease. Infect Immun. 79 (9), 3476-3491 (2011).
- Scheres, S. H. W. A bayesian view on cryo-EM structure determination. J Mol Biol. 415 (2), 406-418 (2012).
- Zivanov, J., et al. New tools for automated high-resolution cryo-EM structure determination in RELION-3. Elife. 7, 42166 (2018).
- Mohammed, A., et al. Structural snapshots of Mycobacterium tuberculosis enolase reveal dual mode of 2PG binding and its implication in enzyme catalysis. IUCrJ. 10 (6), 738-753 (2023).
- RCSB Protein Data Bank (RCSB PDB). , Available from: http://www.rcsb.org (2023).
- Berman, H. M., et al.
The Protein Data Bank. Nucleic Acids Res. 28 (1), 3-21 (2000). - Nasrallah, C. Agonists and allosteric modulators promote signaling from different metabotropic glutamate receptor 5 conformations. Cell Rep. 36 (9), 109648 (2021).
- Doak, B. C., Norton, R. S., Scanlon, M. J. The ways and means of fragment-based drug design. Pharmacol Ther. 167, 28-37 (2016).
- Baker, M. Fragment-based lead discovery grows up. Nat Rev Drug Discov. 12 (1), 5-7 (2013).
- Kirsch, P., Hartman, A. M., Hirsch, A. K. H., Empting, M. Concepts and core principles of fragment-based drug design. Molecules. 24 (3), 4309 (2019).
- Bartesaghi, A., et al. 2.2 Å resolution cryo-EM structure of β-galactosidase in complex with a cell-permeant inhibitor. Science. 348 (6239), 1147-1151 (2015).
- Saur, M. Fragment-based drug discovery using cryo-EM. Drug Discov Today. 25 (3), 485-490 (2020).
- Maki-Yonekura, S., Kawakami, K., Takaba, K., Hamaguchi, T., Yonekura, K. Measurement of charges and chemical bonding in a cryo-EM structure. Commun Chem. 6 (1), 98 (2023).
- Yip, K. M., Fischer, N., Paknia, E., Chari, A., Stark, H. Atomic-resolution protein structure determination by cryo-EM. Nature. 587 (7832), 157-161 (2020).
- Nakane, T. Single-particle cryo-EM at atomic resolution. Nature. 587 (7832), 152-156 (2020).
- Pintilie, G. Measurement of atom resolvability in cryo-EM maps with Q-scores. Nat Methods. 17 (3), 328-334 (2020).
- Punjani, A., Rubinstein, J. L., Fleet, D. J., Brubaker, M. A. CryoSPARC: Algorithms for rapid unsupervised cryo-EM structure determination. Nat Methods. 14 (3), 290-296 (2017).
- Koehl, A. Structural insights into the activation of metabotropic glutamate receptors. Nature. 566 (7742), 79-84 (2019).
- Scheres, S. H. W. Classification of structural heterogeneity by maximum-likelihood methods. Meth Enzymol. 482, 295-320 (2010).
- Carugo, O. Atomic displacement parameters in structural biology. Amino Acids. 50 (7), 775-786 (2018).
- Wlodawer, A., Li, M., Dauter, Z. High-resolution Cryo-EM maps and models: A crystallographer's perspective. Structure. 25 (10), 1589-1597 (2017).
- Masmaliyeva, R. C., Babai, K. H., Murshudov, G. N. Local and global analysis of macromolecular atomic displacement parameters. Acta Crystallogr D Struct Biol. 76 (10), 926-937 (2020).
- Merritt, E. A. To B or not to B: A question of resolution. Acta Crystallogr D Biol Crystallogr. 68 (4), 468-477 (2012).
- Afonine, P. V., et al. Real-space refinement in PHENIX for cryo-EM and crystallography. Acta Crystallogr D Struct Biol. 74 (60), 531-544 (2018).
- Roberts on, M. J., van Zundert, G. C. P., Borrelli, K., Skiniotis, G. GemSpot: A pipeline for robust modeling of ligands into Cryo-EM maps. Structure. 28 (6), 707-716 (2020).
- Weis, F., Hagen, W. J. H. Combining high throughput and high quality for cryo-electron microscopy data collection. Acta Crystallogr D Struct Biol. 76 (8), 724-728 (2020).