Summary

利用下一代序列染色体构象捕获 (4 c 序列) 的高通量识别基因调控数列

Published: October 05, 2018
doi:

Summary

基因和调控元素之间的物理相互作用的识别是具有挑战性的, 但已被染色体构象捕获方法所促进。这种对 4 c 序列协议的修改可以减少 pcr 模板的过度放大, 并通过加入限制酶消化步骤来最大限度地提高 mappability 的读数。

Abstract

由于调控元素对目标基因的定位和作用大小的变化, 确定特定目标基因的调控元素构成了重大的技术挑战。通过保守转录因子结合位点的生物信息学预测与活化基因表达相关的近表观遗传修饰的存在和功能, 取得了一些进展。染色质构象捕获研究已经改变了我们的能力, 发现在序列之间的物理染色质接触, 甚至在整个基因组。环形染色质构象捕获与下一代测序 (4 c 序列), 特别是设计, 以发现所有可能的物理染色质相互作用的特定序列的利益 (观点), 如目标基因或监管增强。目前的 4 c 序列策略直接从视点内排列, 但需要多个不同的视点同时进行排序, 以避免与下一代测序平台一致的基调用 (成像) 技术难题。这一量的实验对许多实验室来说可能并不实际。在这里, 我们报告了一个改进的方法, 4 c 序列协议, 包括了额外的限制酶文摘和基于 qPCR 的放大步骤, 旨在促进更大的捕获不同的序列读取和减少可能的PCR 偏倚, 分别。我们修改后的4C 方法适合于标准分子生物学实验室评估染色质体系结构。

Introduction

DNA 元素百科全书 (编码) 项目为人类基因组1280% 的功能活动提供了综合注解, 从而促进了基因表达的调控元素的识别。在体内转录因子结合, DNaseI 过敏, 和表观组蛋白和 DNA 甲基化修饰的个体细胞类型的地点的鉴定为候选调控的功能分析铺平了道路。目标基因表达的元素。有了这些发现, 我们面临着确定调控元素和基因之间功能互联的挑战。具体来说, 一个给定的目标基因和它的增强剂之间的关系是什么?染色质构象捕获 ( 3C ) 方法通过在固定染色质 3 中通过捕获的事件识别一个感兴趣区域和候选交互序列之间的物理和可能的功能互 , 直接解决这个问题 ..然而, 随着我们对染色质相互作用的理解增加, 显然, 对预选候选基因座的调查不足以提供对基因增强器相互作用的完全理解。例如, 编码使用高通量染色体构象捕获碳拷贝 (5C) 方法来检查人类基因组的一小部分 (1%, 44 个基因座的先导集), 并报告了基因座的复杂互联。基因和促进剂与确定的相互作用平均2–4不同的相互作用的伙伴, 其中许多是数以百计的 kilobases 离开在线性空间4。还有, 李。采用配对端标记测序 (嘉-PET) 进行染色质相互作用分析, 分析全基因组启动子相互作用, 发现65% 的 RNA 聚合酶 II 结合部位参与了染色质的相互作用。其中一些相互作用导致大, 多基因复合体横跨数以百计的 kilobases 基因组距离和包含, 平均, 8-9 个基因每5。这些发现结合在一起, 强调需要无偏全基因组方法来审问染色质相互作用。其中一些方法在施密特和al中进行了评述。6

最近的染色质构象捕获研究方法, 加上下一代测序 (高 c 和 4 C 序列), 使发现未知数列与感兴趣的区域6。具体来说, 用下一代测序 (4 c 序列) 建立环状染色体构象捕获, 以以无偏见的方式7通过测序 DNA 从近距离捕获的染色质到3D 空间感兴趣的区域。简要地说, 染色质是固定的, 以保持其原生蛋白-DNA 相互作用, 与限制酶, 并随后结扎在稀释条件下, 以捕获生物学相关的 “缠结” 的相互作用的基因座 (图 1)。交叉链接被逆转, 以去除蛋白质, 从而留下的 DNA 可用于额外的分裂与第二限制酶。最后的结扎会产生更小的相互作用的圆圈。然后用引物对感兴趣的序列进行生成, 从发送的片段中产生未知序列的放大库, 其次是下游下一代测序。

此处提出的关于样本准备的协议对现有的4种 c 序列方法89101112进行了两项重大修改。首先, 它使用一种基于 qPCR 的方法来经验主义地确定 4 c 序列库准备步骤的最佳放大周期数, 从而减少了由于图书馆过度扩增而导致的 PCR 偏倚的可能性。其次, 它使用额外的限制摘要步骤, 努力减少已知的 “诱饵” 序列的一致性, 这会阻碍测序仪精确地进行基调用, 从而使每读中的唯一信息序列最大化。其他协议通过将许多 (12-15)8 4 c 序列库与不同的诱饵顺序和/或限制站点汇集在一起来规避这个问题, 这是其他实验室可能无法实现的大量实验。此处所做的修改允许少量的实验、样本和/或复制被编入索引, 并汇集到一个单独的车道中。

Protocol

1. 限制酶的选择 确定一个感兴趣的区域 (例如, 基因启动子, 单核苷酸多态性 (SNP), 增强剂), 并从资料库中获取 DNA 序列, 如国家生物技术信息中心 (NCBI)。 确定第一限制酶消化 (RE1) 中的候选限制酶 (REs), 它不在感兴趣的序列内切割, 在重新消化后产生粘性端 (DNA 终点), 其活动不受中央甲基化。注意: 数据的分辨率由 RE1 决定。一个6基对 (bp) 识别序列的酶平均产生大约 4 kilobases…

Representative Results

从2–3丢弃的新生儿包皮、池中和培养的 KSFM 中分离出主要的人角质形成细胞, 辅以30µg/毫升牛垂体提取物、0.26 毫升重组人表皮生长因子和0.09 毫米氯化钙 (CaCl2) 摄氏37摄氏度, 5% 二氧化碳。这些细胞被分成两个烧瓶, 一个烧瓶由添加 CaCl2到最终浓度为1.2 毫米的72小时 107细胞分别被固定在1%室温下甲醛为10分钟。另外, K562 细胞生长在 RPMI 补充10% 胎牛?…

Discussion

4C 结果有可能揭示染色质相互作用, 可以识别以前未知的调控元素和/或目标基因是重要的在特定的生物环境24,25,26。然而, 技术障碍可能会限制从这些实验获得的数据。在4C 协议中, 模板过度放大引起的 PCR 偏倚很可能。该协议通过利用 qPCR 来确定最佳的放大周期数以客观的方式来解决这个问题。此外, 通过限制文摘从扩增的反?…

Disclosures

The authors have nothing to disclose.

Acknowledgements

这项工作得到了结缔组织国立研究院 (R01AR065523) 的支持。

Materials

HindIII NEB R0104S
CviQI NEB R0639S
DNA oligonucleotide primers IDT To be designed by the reader
50 mL conical centrifuge tubes Fisher Scientific 06-443-19
1.7 mL microcentrifuge tubes MidSci AVSS1700
Phosphate buffered saline Thermo Fisher 14190-136
Formaldehyde, methanol free Electron Microscopy Sciences 15710
Nutator VWR 15172-203
Glycine JT Baker 4059-00
Benchtop centrifuge
Refrigerated microcentrifuge
Ethylenediaminetetraacetic acid (EDTA) Sigma-Aldrich ED2SS
20% SDS solution Sigma-Aldrich 05030
Trypan Blue Thermo Fisher 15250061
Glass slides Fisher Scientific 12-550-143
Cover slips VWR 16004-094
Light microscope
Triton X-100 Alfa Aesar A16046
Shaking heat block
2M Tris-HCl Quality Biological 351-048-101
Proteinase K NEB P8107S
Phenol:chloroform:isoamyl alcohol (25:24:1) Sigma-Aldrich P2069
Sodium acetate Sigma-Aldrich M5661
20 mg/mL glycogen Thermo Fisher R0561
Ethanol Fisher Scientific 04-355-223
Nuclease-free water Fisher Scientific MT-46-000-CM
qPCR cycler Thermo Fisher 4453536
qPCR plates Thermo Fisher 4309849
Thermocycler Thermo Fisher 4375786
PCR strip tubes MidSci AVSST-FL
1M Magnesium chloride Quality Biological 351-033-721
Dithiothreotol Sigma-Aldrich 43815
Adenosine triphosphate Sigma-Aldrich A2383
T4 DNA Ligase NEB M0202S
Agarose Sigma-Aldrich A6013
RNase A Thermo Fisher EN0531
Qiaquick PCR purification kit Qiagen 28104
MinElute PCR Purification kit Qiagen 28004
Spectrophotometer
Expand Long Template PCR System Sigma-Aldrich 11681834001
dNTP mix Thermo Fisher R0191
SYBR Green I Sigma-Aldrich S9430
ROX BioRad 172-5858
Sodium chloride Sigma-Aldrich S5886
End-It DNA End-Repair Kit Lucigen ER0720
LigaFast Rapid DNA Ligation System Promega M8221
SYBR Safe Thermo Fisher S33102
Taq Polymerase NEB M0267S
UltraSieve Agarose IBI Scientific IB70054
Qiaquick Gel Extraction Kit Qiagen 28704

References

  1. Dunham, I., et al. An integrated encyclopedia of DNA elements in the human genome. Nature. 489 (7414), 57-74 (2012).
  2. Hoffman, M. M., et al. Integrative annotation of chromatin elements from ENCODE data. Nucleic Acids Research. 41 (2), 827-841 (2013).
  3. Dekker, J., Rippe, K., Dekker, M., Kleckner, N. Capturing Chromosome Conformation. Science. 295 (5558), 1306-1311 (2002).
  4. Sanyal, A., Lajoie, B. R., Jain, G., Dekker, J. The long-range interaction landscape of gene promoters. Nature. 489 (7414), 109-113 (2012).
  5. Li, G., et al. Extensive promoter-centered chromatin interactions provide a topological basis for transcription regulation. Cell. 148 (1-2), 84-98 (2012).
  6. Schmitt, A. D., Hu, M., Ren, B. Genome-wide mapping and analysis of chromosome architecture. Nature Reviews Molecular Cell Biology. 17 (12), 743-755 (2016).
  7. Zhao, Z., et al. Circular chromosome conformation capture (4C) uncovers extensive networks of epigenetically regulated intra- and interchromosomal interactions. Nature genetics. 38 (11), 1341-1347 (2006).
  8. Splinter, E., de Wit, E., van de Werken, H. J. G., Klous, P., de Laat, W. Determining long-range chromatin interactions for selected genomic sites using 4C-seq technology: From fixation to computation. Methods. 58 (3), 221-230 (2012).
  9. Van De Werken, H. J. G., et al. 4C technology: Protocols and data analysis. Methods in Enzymology. 513, (2012).
  10. Brouwer, R. W. W., van den Hout, M. C. G. N., van IJcken, W. F. J., Soler, E., Stadhouders, R. Unbiased Interrogation of 3D Genome Topology Using Chromosome Conformation Capture Coupled to High-Throughput Sequencing (4C-Seq). Eukaryotic Transcriptional and Post-Transcriptional Gene Expression Regulation. , 199-220 (2017).
  11. Matelot, M., Noordermeer, D. Determination of High-Resolution 3D Chromatin Organization Using Circular Chromosome Conformation Capture (4C-seq). Polycomb Group Proteins: Methods and Protocols. , 223-241 (2016).
  12. Gheldof, N., Leleu, M., Noordermeer, D., Rougemont, J., Reymond, A. Detecting Long-Range Chromatin Interactions Using the Chromosome Conformation Capture Sequencing (4C-seq) Method. Gene Regulatory Networks: Methods and Protocols. , 211-225 (2012).
  13. Göndör, A., Rougier, C., Ohlsson, R. High-resolution circular chromosome conformation capture assay. Nature. 3 (2), 303-313 (2008).
  14. Hagège, H., et al. Quantitative analysis of chromosome conformation capture assays (3C-qPCR). Nature. 2 (7), 1722-1733 (2007).
  15. Anand, R. D., Sertil, O., Lowry, C. V. Restriction digestion monitors facilitate plasmid construction and PCR cloning. BioTechniques. 36 (6), 982-985 (2004).
  16. Afgan, E., et al. The Galaxy platform for accessible, reproducible and collaborative biomedical analyses: 2016 update. Nucleic acids research. 44 (W1), W3-W10 (2016).
  17. Li, H., Durbin, R. Fast and accurate long-read alignment with Burrows-Wheeler transform. Bioinformatics. 26 (5), 589-595 (2010).
  18. Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25 (16), 2078-2079 (2009).
  19. Walter, C., Schuetzmann, D., Rosenbauer, F., Dugas, M. Basic4Cseq: An R/Bioconductor package for analyzing 4C-seq data. Bioinformatics. 30 (22), 3268-3269 (2014).
  20. Raviram, R., et al. 4C-ker: A Method to Reproducibly Identify Genome-Wide Interactions Captured by 4C-Seq Experiments. PLoS Computational Biology. 12 (3), (2016).
  21. Klein, F. A., Pakozdi, T., Anders, S., Ghavi-helm, Y., Furlong, E. E. M., Huber, W. FourCSeq: analysis of 4C sequencing data. Bioinformatics. 31 (19), 3085-3091 (2015).
  22. Williams, R. L., et al. fourSig a method for determining chromosomal interactions in 4C-Seq data. Nucleic Acids Research. 42 (8), (2014).
  23. McLean, C. Y., et al. GREAT improves functional interpretation of cis-regulatory regions. Nature Biotechnology. 28 (5), 495-501 (2010).
  24. Stolzenburg, L. R., et al. Regulatory dynamics of 11p13 suggest a role for EHF in modifying CF lung disease severity. Nucleic Acids Research. 45 (15), 8773-8784 (2017).
  25. Meddens, C. A., et al. Systematic analysis of chromatin interactions at disease associated loci links novel candidate genes to inflammatory bowel disease. Genome Biology. 17 (1), 1-15 (2016).
  26. Yeung, J., et al. Transcription factor activity rhythms and tissue-specific chromatin interactions explain circadian gene expression across organs. Genome research. , 207787 (2017).
check_url/58030?article_type=t

Play Video

Cite This Article
Brettmann, E. A., Oh, I. Y., de Guzman Strong, C. High-throughput Identification of Gene Regulatory Sequences Using Next-generation Sequencing of Circular Chromosome Conformation Capture (4C-seq). J. Vis. Exp. (140), e58030, doi:10.3791/58030 (2018).

View Video