Genetics

为患者组织甲基结合DNA序列捕获

Published: October 31, 2016 doi: 10.3791/54131

Rohit R. Jadhav¹, Yao V. Wang¹, Ya-Ting Hsu¹, Joseph Liu¹, Dawn Garcia², Zhao Lai², Tim H. M. Huang¹, Victor X. Jin¹

¹Department of Molecular Medicine, University of Texas Health Science Center at San Antonio, ²Greehey Children's Cancer Research Institute, University of Texas Health Science Center at San Antonio

Summary

在这里，我们提出了一个协议，调查使用甲基结合DNA测序捕获（MBDCap-SEQ或MBD-SEQ）技术以及随后的生物信息学分析管道的大规模临床病人的筛查研究全基因组DNA甲基化。

Abstract

甲基化是必要的表观遗传修饰的DNA，这是负责为不同组织类型的稳定发展和分化所需的基因的精确调节中的一个。这个过程的失调经常是各种疾病，如癌症的标志。在这里，我们勾勒出近期测序技术之一，甲基结合DNA测序捕获（MBDCap-SEQ），用于为大型患者群的各种正常和疾病组织进行量化甲基化。我们描述一个生物信息学管道，以达到最佳的量化沿着这条亲和富集方法的详细的协议。这一技术已被用于测序数百名患者在各种癌症类型为1000甲基化项目（癌症甲基化系统）的一部分。

Introduction

通过DNA甲基化的基因的表观遗传调控是确定在主体¹由不同的组织类型的稳定分化的细胞命运所需的基本机制之一。这个过程的失调已经知道，引起各种疾病，包括癌症^2。

该方法主要涉及对DNA中³的CpG二核苷酸的胞嘧啶残基的加入甲基团。目前有用于调查此机制，每一个都具有如在许多研究中^2-8概述自身优势几个不同的技术。在这里，我们将讨论这些技术称为甲基结合DNA测序捕获（MBDCap-SEQ），在这里我们使用一个亲和富集技术来识别DNA的甲基化区域之一。该技术是建立在以富集含有甲基化CpG位点的基因组DNA片段的MBD2蛋白的甲基结合能力。我们利用商业甲基化DNA富集试剂盒这些甲基化区域的隔离。我们的实验室已筛选使用这种技术数百患者样品的，在这里我们提供了全面优化的协议，它可以被用来研究大患者群。

正如任何下一代测序技术明显，MBDCap-SEQ也需要以横跨所述样本以准确定量的甲基化水平的特定生物信息学方法。已经有许多最近的努力来优化测序数据^{^{^9,10}}的正常化和分析过程的研究。在这个协议中，我们展示的实施独特的读恢复的方法，这些方法中的一种 - LONUT - 其次是每个样品的线性正常化，以实现跨越大量的患者样本公正的比较。

Subscription Required. Please recommend JoVE to your librarian.

Protocol

所有的组织得到以下机构审查委员会委员的批准，并在所有参与者同意双方分子分析和后续研究。该协议是由人类研究委员会在得克萨斯大学健康科学中心大学圣安东尼奥的批准。

1.甲基结合DNA捕获（MBDCap）

样品采集和DNA提取
1. 从患者的石蜡包埋组织标本收集大块肿瘤和正常组织样本。
2. 使用商业DNA mini试剂盒来分离从根据制造商的协议的石蜡包埋的组织样品的基因组DNA。
3. 使用具有根据制造商的协议在这里描述的方法的甲基化的DNA富集试剂盒。
初始卷边洗
注意：珠粒用来偶联用MBD-生物素蛋白，它检测在基因组上的DNA甲基化。珠通常被暂停在原液。使用下列步骤来洗掉这种液体。
1. 轻轻吹打起来悬浮的链霉珠粒（见材料表 ）的库存和向下，得到均匀的悬浮液。不要震荡混合珠。
2. 对于输入DNA之一微克，珠与1X绑定/洗涤液的90微升管ADD10微升。旋转1分钟。不要震荡混合。
3. 放置管（多个）上进行1分钟的磁架。
4. 用移液器除去液体并丢弃该液体。
5. 添加1个绑定/洗涤缓冲液250微升至珠和旋转1分钟。
6. 重复步骤1.2.3 - 1.2.5两次。
耦合MBD-生物素蛋白的小珠
1. 对于输入DNA的1.2微克，加MBD-生物素蛋白7微升（3.5微克），每管。
2. 添加1个绑定/洗涤缓冲液，93微升的蛋白质，使100微升的最终体积。
3. 混合珠蛋白混合物于室温旋转混合器1小时。
支离破碎的DNA（输入）
1. 通过在96微升的TE缓冲液中，24 5倍的微升绑定/洗涤缓冲液中加入总基因组DNA的1.2微克声处理的DNA，使120微升的溶液。使用30秒接通电源和超声在30秒关闭电源，20 - 25倍。
2. 根据制造商的协议350bp的 - 用生物分析仪系统与市售的高灵敏度的DNA试剂盒以检查片段的大小是在150的范围内运行超声处理的DNA溶液1微升。
洗MBD-珠
1. 上放置装有磁性机架MBD-珠1分钟的管。
2. 去除并丢弃用吸管的液体不接触珠。
3. 与1X绑定/洗涤液250微升重悬珠。
4. 混合珠上在RT旋转混合器5分钟。
5. 重复步骤1.5.1 - 1.5.4两次。
6. 支离破碎的DNA俘获反应（1微克输入DNA）
  1. 该DNA /缓冲混合物转移到含有MBD-珠的管中。
  2. 混合MBD-珠与DNA上的旋转混合器，在室温1小时。另外，在^4℃混合O / N
7. 从珠中除去非捕获的DNA
  1. 混合该DNA和MBD-珠后，将在该磁性架管1分钟，从而集中所有的珠粒在管的内壁上。
  2. 用吸管除去上层液体，并将其保存在干净的DNA酶的离心管作为nonmethylated DNA。储存在冰这个样本。
  3. 添加1个绑定/洗涤缓冲液200微升至珠洗珠。
  4. 混合珠在旋转混合器3分钟。
  5. 放置在管上1分钟磁性机架。
  6. 用吸管取出液体，并将其保存在离心管。
  7. 对于帽TURE≤1微克输入DNA的反应，重复步骤1.7.3 - 1.7.6在总共2个洗分数。
8. 单次洗脱
  1. 混合使用高盐缓冲液低盐缓冲液（1：1），以获得洗脱缓冲液（1,000毫摩尔NaCl）。
  2. 悬浮在洗脱缓冲液（1,000毫摩尔NaCl）的200μL珠。
  3. 孵育在旋转混合器珠粒3分钟。
  4. 放置在管上1分钟磁性机架。
  5. 随着管处的磁架，去除液体用吸管没有枪头触及珠，并将其保存在干净的DNA酶的1.5 ml离心管。储存在冰这个样本。
  6. 重复步骤1.8.1 - 1.8.4一次，收集在同一个管中的第二样品（总体积将400微升）。存放在冰合并样本。
9. 乙醇沉淀（DNA清理）
  1. 到每个noncaptured，洗涤和洗脱馏分FR嗡前面的步骤中，添加1μL的肝糖（20微克/微升，包括在试剂盒），3M醋酸钠1/10的样品体积，pH为5.2（例如，每400 40微升样品的微升）和100％的2样品体积乙醇（例如，每400 800μL样品μL）。总体积为1,241微升。
  2. 拌匀，并在-80孵化^℃下至少2小时。
  3. 离心管15分钟，在11363 XG在^4℃
  4. 小心弃去上清液而不扰乱沉淀。
  5. 加入冷的70％乙醇500微升。
  6. 离心管5分钟，在11363 XG在^4℃
  7. 小心弃去上清液而不扰乱沉淀。
  8. 重复步骤1.9.6 - 1.9.7一次，并删除任何剩余的残留上清。
  9. 风干〜5分钟沉淀。不要完全干燥沉淀。
  10. 重悬DNA沉淀中的游离DNA酶的水或其它37.5微升缓冲区适当的音量。
  11. 置于冰上的DNA或DNA储存在-20 ^度或以下，直至进一步使用。
  12. 检查的DNA的总量超过20纳克，（例如，使用荧光定量系统，见材料数据表 ）。
2.测序
1. 使用来自MBDCap方法回收用于测序的DNA片段。对于待测序的每个样品，20的总量 - 需要用于文库制备40纳克的DNA。
2. 对于DNA的序列库准备使用一个完全自动化的文库构建系统（见材料表 ），并按照制造商提供的标准协议。 400个基点文库制备 - 尺寸200，选择的DNA片段。自动化文库制备系统允许标准化文库制备过程和整个样本的变化减少因手工准备。
3. 使用适配器总理RS并稀释至100倍的浓度。如此，使用10μL的各样品。
4. 以下步骤2.2，取出反应，并使用荧光定量系统（见材料表 ）量化的DNA序列文库。
  1. 建立PCR扩增步骤。 PCR主混合物的选择是改善基因组的GC富集区的PCR效率。向PCR管中，添加15微升的DNA SEQ文库，25μL的PCR主混合物（见材料表 ），2微升的PCR引物混合物（见材料表 ），以及8微升H ₂ O
5. 按照从PCR扩增预混制造商PCR的建议，改变循环时间和温度不同的原料^：98℃下45秒^，98℃下15秒^，65℃下30秒^，72℃下30×周期s，然后1分钟72 ^摄氏度。保持在^4℃
  1. PERFORM足够的周期，2落得 - 10纳米文库DNA（8 - 10次）。
6. 清理用1 PCR反应：1的比例的，根据制造商的协议PCR纯化珠粒（见材料表 ）。
7. 30μL洗脱缓冲液 - 20洗脱。
8. 条码每个样品池4个样品汇集成的流动池的一个车道。使用测序标准的50个基点的单读协议（见材料表 ）。
3.生物信息学分析
注意：进一步处理从测序获得的原始FASTQ文件来执行的质量控制和映射所述短DNA序列（读取）到基因组中。
1. 用蝴蝶结短读对齐，对每个样品FASTQ文件基因组映射工具映射读取到参考基因组。多个读映射工具可用于执行该步骤，并且可以根据个人的优先使用。
  1. 允许最多在whol 2个错配Ë同时映射到参考基因组的读取。报告最多的每次读20路线最好。例如，使用领结-v 2 --best -k 20 --chunkmbs 200 <ebwt> <fastqFile> <alignFile>。
2. 使用LONUT ⁹来恢复乘法映射读取提高富集区域的检测。对于每个读，至多一个对准将当它是足够接近上述任何称为峰回收。例如，使用：perl的lonut.pl -g hg19 -w 250 -p 99 <alignFile> <outputPath>。 LONUT将执行以下步骤。
  1. 分割成路线唯一地映射读取和乘法映射读取。在唯一映射峰电话使用读取峰值主叫带^11。 -w在示例命令250和-p 99选项是带。
  2. 联合收割机唯一映射读取与恢复的读取从LONUT获得，合并的读出，在床的格式，将在进一步的分析中使用。计算COMBIN数编读为未来的正常化。
3. 斌读取。提取读取使用perl脚本感兴趣区域：perl的methyPipeline.pl <sampleInfoFile> <refGeneFile> -up <向上游延伸长度> -dn <向下游延伸长度>。在sampleInfoFile列出的每个床档，Perl脚本执行以下任务。
  注：见补充编码文件的Perl脚本。
  1. 斌读入固定的容器大小，例如，100个基点，24条染色体。
  2. 对于refGeneFile指定的每个基因，提取各地转录起始位点（TSS）的垃圾桶，直至达到选项-up和-dn指定延伸长度。例如，提取就是上行和下行的TSS的4kb的该区域中的数据。在块大小为100bp，该提取的数据有81箱，而中心区段对应到TSS。
  3. 对于反义链上的基因，翻转所提取的区域从左至右，使得上游箱总是PLA土木工程署左侧用perl脚本。
  4. 进一步分裂TSS±4 KB区域分为三个子区：左，中上游4 kb的上游2 kb的;中东，上行和下行2 KB;右，下游2 KB到4 KB。
  5. 对于每个样品，除以计数的在由组合映射读取在3.3.3计算总数每个仓读取。正常化将消除样品特定阅读差异，并允许比较不同样本的读取。
4. 运行bash脚本（如在脚本文件中指示），以归一化执行统计测试读取从左侧区域获得的，在描述为在侧翼区的区域，以检测正常和病例组之间差异甲基化。
  注：请参阅的bash脚本的补充编码文件。基于被差异甲基化的区域，有七个组合：
  整个区域：整个TSS±4 kb的区域差异甲基化
  MiddleLeft：在这两个中间和左侧区域差异甲基化
  MiddleRight：在这两个中间和右侧区域差异甲基化
  侧翼：在左，右区域差异甲基化
  左图：在左侧区域差异甲基化只
  右：在右侧区域差异甲基化只
  中东：在中间区域差异甲基化只
5. 使用相同的bash脚本以可视化的差异甲基化龙卷风情节。绘制一个单独的面板上的超和低甲基化的基因，并如分别在3.4中描述，排序在该区域组合的顺序。

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

我们已经使用MBDCap-SEQ研究DNA甲基化的改变在大量的病人来自不同癌症类型包括乳腺癌^12，子宫内膜^13，前列腺^14，和肝癌等。这里，我们证明从最近公布的¹²乳腺癌研究的一些信息。在这种情况下，我们使用了全基因组测序的方法，以确定被差动在肿瘤在不同的基因组区域的甲基化相对于正常CpG岛。调查显示，在总共调查了位于基因启动子（N = 13,081）CpG岛，相对于普通19.5％，表现出差异甲基化在肿瘤。同样，出于对6959基因内的CpG岛，55.2％，表现出差异甲基化。基因间的启动子表现出的4,847和用于基因的启动子没有CpG岛28.1％，5454研究区域的1.8％，表现出微分DNA甲基化（ 图1A）。视觉表现（ 图1B）示出了以上所讨论的地区的代表例。热图清楚地示出了在整个77乳腺肿瘤，10乳腺正常组织和38乳腺癌细胞系的甲基化区域。如在本手稿详述的生物信息学协议讨论的甲基化的定量，使我们能够在这些患者样品进行各种统计测试，以确定在整个群体或亚群显著甲基化差异。这种分析方法为我们提供了可测试的目标，以进一步调查这些患者样品中的表观遗传机制。一旦这些目标被确定，甲基化的水平可以进一步量化，并使用焦磷酸测序验证。该MBDCap-SEQ提供了约100个的基因组解析 - 为目标的200基点。以获得进一步的分辨率，这些区域内的各个的CpG位置可以被选择用于焦磷酸测序定量。我们用这种方式来泉tify并验证在一个更高的分辨率和用于个体患者组之间的比较中MBDCap-SEQ数据中观察到的甲基化差异。图2示出了甲基化2子宫内膜癌的量化子组非复发（NR）相比复发（R）。该图描绘了DNA甲基化在启动子CpG岛所确定的靶基因SFRP1不同的CpG位点中的2组每个病人的水平。

图 1： 相对于正常乳腺组织中的启动子和非启动子 CpG 岛 的乳腺癌样品中的 DNA的 甲基化甲基捕获测序（MBD-SEQ）用于产生乳腺肿瘤的基因组的DNA甲基化谱（N = 77）和正常乳腺组织（N = 10）。（A）丕È图表表明在子，基因内差异甲基化，和基因间的CGI以及非CGI启动子区域（B）的实施例基因座示出启动子的CGI，基因内，基因间和非CGI启动子区域。虚线方框选中对应乳腺癌甲基化地区。请点击此处查看该图的放大版本。

图 2：使用 CpG 位点 的焦磷酸测序技术 在识别靶基因的 DNA甲基化在通过焦磷酸测序法检测经常性和非经常性子宫内膜癌患者5 SFRP启动子区域的DNA甲基化定量 。每个站点代表一个CpG位点（R：经常，N = 21和NR：非经常，N = 71）。该图显示均值和误差条显示平均值或SEM的标准误。请点击此处查看该图的放大版本。

Subscription Required. Please recommend JoVE to your librarian.

Discussion

所述MBDCap-SEQ技术是亲和富集的方法^3，用大量的患者¹⁵调查队列时视为一个成本有效的替代方案。这里介绍的管道描述了从样品采购到数据分析和解释一个全面的方法。其中最重要的步骤是建立一个PCR扩增过程，以改善在GC富集区域的基因组中的PCR效率，这是在DNA甲基化发生。此外，它是必不可少的，以确保测序后，每个样品具有至少20多万唯一映射读取到基因组中。此覆盖范围预计将提供足够的富集或序列深度映射整个基因组^12。如果此覆盖未对特定样品的第一轮测序和多个DNA为样本期间将部分满足一个可用，在第二部分测序的另一轮可运行。由此产生的读取可以使用R合并从第一轮EADS实现的覆盖范围。整体实验的设计应包括一些生物控制（ 例如，正常组织），以占基于像拷贝数变异^15个因素的偏差。

我们的生物信息学方法来研究的患者样品中所观察到的DNA甲基化提供了显示在核心启动差异甲基化富集，启动子岸区域和这些也各种组合可能的靶基因。尽管MBDCap-SEQ最多可达到的分辨率下只能达到100基点，这些地区为核心与岸在协议中所描述的区别使我们能够确定的调控作用的进一步调查潜在目标区域差异甲基化富集和未来进行机理研究。在这里，我们还描述了一种使用龙卷风地块可视化这些识别的区域，其提供所述差分富集的概述图案。

有其基于到尿嘧啶通过脱氨基非甲基化胞嘧啶的化学转化由硫氢化钠的其他技术，并且在一个单核苷酸分辨率提供的DNA甲基化的更全面的覆盖。二硫化碳转换后一般，将DNA用焦磷酸测序用于基于目标实验或通过全基因组鸟枪二硫化物测序（BS-SEQ）测序。这些技术解决此处描述为MBDCap-SEQ可以在高达100bp的最分辨率仅实现了该技术的限制。然而，尽管这些方法是更全面，它们相对昂贵，并且可以成倍增加成本作为测序的深度或患者的数量增加。另一方面，常用的二硫化碳微阵列平台是成本有效的，但提供覆盖相对低的与探针调查接近基因启动子，而不是整个基因组的区域。 MBDCap-SEQ但是，提供这些高成本测序技术和低成本甲基阵列¹⁶之间的平衡。我们正在使用这个协议来调查了大量的患者群的DNA甲基化，作为癌症甲基化系统项目¹⁰的一部分，可以在涉及大型患者群未来的研究中使用。

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

该协议是在添黄医生和Victor金博士在得克萨斯大学健康科学中心在圣安东尼奥大学的实验室开发的。

Acknowledgments

这项工作是由CPRIT研究培训奖RP140105支持，以及部分由美国国立卫生研究院（NIH）授予R01 GM114142和威廉与艾拉·欧文斯医学研究基金会的支持。

Materials

Name	Company	Catalog Number	Comments
Methylminer DNA enrichment Kit	Invitrogen	ME10025
Dynabeads M-280 Streptavidin	Invitrogen	112-05D
Bioruptor Plus Sonication Device	diagenode	B01020001
3 M sodium acetate, pH 5.2	Sigma	S7899	100 mL
SPRIworks Fragment Library System I	Beckman Coulter	A50100	Fully automated library construction system
Adapter Primers	Bioo Scientific	514104	PCR primer mix
Qubit	Invitrogen	Q32854	Fluorometric Quantitation System
PCR master mix	KAPA scientific	KK2621	PCR master mix
AMPure XP	Beckman Coulter	A63881	PCR Purification beads
EB Buffer	Qiagen	19086
HiSeq 2000 Sequencing System	Illumina