Summary

High-throughput identificatie van regelgevende gensequenties met behulp van Next-generation Sequencing van circulaire chromosoom conformatie Capture (4C-seq)

Published: October 05, 2018
doi:

Summary

De identificatie van de fysieke interacties tussen genen en regelgevende elementen is uitdagend maar heeft bevorderd door chromosoom conformatie opname methoden. Deze wijziging van het 4C-seq-protocol PCR bias vermindert door het minimaliseren van de over-amplificatie van PCR sjablonen en maximaliseert de mappability van leest door het opnemen van een toevoeging restrictie-enzym digest stap.

Abstract

De identificatie van regulerende elementen voor een bepaald doel-gen is een belangrijke technische uitdaging als gevolg van de variabiliteit in de positionering en effect grootte van regelgevende elementen naar een target-gen. Enige vooruitgang is geboekt met de bioinformatic voorspelling van het bestaan en de functie van de proximale epigenetische aanpassingen geactiveerde genexpressie met behulp van geconserveerde transcriptie factor bandplaatsen is gekoppeld. Chromatine conformatie vangen studies hebben een revolutie teweeggebracht in ons vermogen om te ontdekken van fysieke chromatine contacten tussen sequenties en zelfs binnen een gehele genoom. Circulaire chromatine conformatie vastleggen in combinatie met de volgende-generatie sequencing (4C-seq), in het bijzonder, is ontworpen om te ontdekken alle mogelijke fysieke chromatine interacties voor een bepaalde reeks van belang (gezichtspunt), zoals een target-gen of een regelgevende versterker. Huidige 4C-seq strategieën direct opeenvolging van binnen het gezichtspunt maar vereisen talrijke en uiteenlopende standpunten te worden om te voorkomen dat de technische uitdagingen van uniform gelijktijdig sequenced baseren (imaging) bellen met sequencing-platforms van de volgende generatie. Dit volume van experimenten mogelijk niet praktisch voor veel laboratoria. Hier, rapporteren we een gewijzigde aanpak bij het 4C-seq-protocol waarin zowel een extra restrictie-enzym-digest en versterking van de qPCR gebaseerde stappen die zijn ontworpen om een grotere opname van uiteenlopende reeks luidt vergemakkelijken en beperken de mogelijkheden voor PCR bias, respectievelijk. Onze gemodificeerde 4C methode is vatbaar voor de standaard moleculaire biologie lab voor de beoordeling van de chromatine het platform.

Introduction

De identificatie van regulerende elementen voor genexpressie is bevorderd door de encyclopedie van DNA elementen (CODEER)-Project, dat uitvoerig geannoteerd functionele activiteit voor 80% van het menselijk genoom1,2. De identificatie van de sites voor in vivo transcription factor binding, DNaseI overgevoeligheid, en epigenetische histone en DNA methylering wijzigingen in afzonderlijke celtypen effende de weg voor de functionele analyses van kandidaat regelgevende elementen voor doel genexpressie. Gewapend met deze bevindingen, worden we geconfronteerd met de uitdaging van de functionele interconnectiviteit tussen regelgevende elementen en genen bepalen. Specifiek, wat is de relatie tussen een bepaalde doel-gen en de enhancer(s)? De chromatine conformatie vastleggen (3C) methode adressen direct deze vraag door identificerende fysieke en waarschijnlijk functioneel, interacties tussen een gebied van belang en kandidaat-interactie sequenties via vastgelegde gebeurtenissen in vaste chromatine3 . Als ons begrip van de interacties van de chromatine is toegenomen, maar is het duidelijk dat het onderzoek van vooraf geselecteerde kandidaat loci volstaat om te zorgen voor een compleet begrip van de gen-enhancer interacties. Bijvoorbeeld, ENCODE gebruikt met de methode high-throughput chromosomale conformatie vangen carbon copy (5C) te onderzoeken van een klein deel van het menselijk genoom (1%, pilot set van 44 loci) en complexe interconnectiviteit van de loci gemeld. Genen en versterkers met geconstateerde interacties gemiddeld 2-4 verschillende interagerende partners, waarvan vele honderden kilobases weg in lineaire ruimte4 werden. Verder, Li et al. Chromatine interactie analyse door gepaarde-End Tag Sequencing (ChIA-PET) gebruikt om te analyseren geheel-genoom promotor interacties en vond dat 65% van RNA polymerase II bandplaatsen bij de interacties van de chromatine betrokken waren. Sommige van deze interacties resulteerde in grote, multi gene complexen verspreid over honderden kilobases van genomic afstand en bevatten gemiddeld 8-9 genen elke5. Samen, onderstrepen deze bevindingen de noodzaak voor onbevooroordeelde geheel-genoom methoden voor de raadpleging van de chromatine interacties. Enkele van deze methoden worden beoordeeld in Schmitt et al. 6.

Meer recente methoden voor chromatine conformatie vangen studies in combinatie met volgende-generatie sequencing (Hi-C en 4C-seq) inschakelen de ontdekking van onbekende sequenties interactie met een gebied van belang6. Specifiek, circulair chromosoom conformatie vastleggen met volgende-generatie sequencing (4C-seq) werd ontwikkeld om te identificeren loci interactie met een opeenvolging van belang in een onpartijdige wijze7 door DNA sequencing van vastgelegde chromatine proximale aan de regio van belang in 3D-ruimte. Kort, chromatine is vastgesteld voor het behoud van haar oorspronkelijke eiwit-DNA interacties, gekloofd met een restrictie-enzym, en vervolgens afgebonden verdunde voorwaarden vast te leggen van biologisch relevante “verwarring” van interagerende loci (Figuur 1). De cross links worden teruggedraaid om te verwijderen van het eiwit, waardoor het DNA beschikbaar voor extra decolleté met een tweede restrictie-enzym. Een definitieve afbinding genereert kleinere kringen van interagerende loci. Inleidingen tot de opeenvolging van belang worden vervolgens gebruikt voor het genereren van een versterkte bibliotheek van onbekende sequenties van de circularized fragmenten, gevolgd door sequentiebepaling van downstream komende generatie.

Het protocol gepresenteerd hier, dat zich op de bereiding van de monsters richt, maakt twee belangrijke wijzigingen aan bestaande 4C-seq methoden8,9,10,11,12. Ten eerste het een qPCR gebaseerde methode gebruikt voor het optimale aantal amplificatie cycli voor 4C-seq bibliotheek voorbereiding stappen en vermindert dus het potentieel voor PCR bias die voortvloeien uit over-amplificatie van bibliotheken empirisch te bepalen. Ten tweede, gebruikt het een aanvullende beperkingsopties digest stap in een poging om de uniformiteit van de bekende “aas” opeenvolgingen die nauwkeurige base-roept door het instrument sequencing belemmert en, vandaar, maximaliseert de unieke, informatieve reeks in elke Lees. Andere protocollen omzeilen van dit probleem door de bundeling van de vele (12-15)8 4 C-seq bibliotheken met verschillende aas sequenties en/of beperkingsplaatsen, een volume van experimenten die mogelijk niet haalbaar door andere laboratoria. De hier gepresenteerde wijzigingen toestaan een klein aantal experimenten, monsters, en/of worden gerepliceerd om te worden geïndexeerd en gebundeld in een enkele baan.

Protocol

1. restrictie-enzym selectie Identificeren van een regio van belang (bv., gene promotor, single nucleotide polymorphism (SNP), versterker) en het verkrijgen van de opeenvolging van DNA van repositories zoals National Center voor de informatie van de biotechnologie (NCBI). Identificeren van de kandidaat-restrictie-enzymen (REs) voor de eerste restrictie-enzym vertering (RE1) die doen niet snijden in de opeenvolging van belang, die sticky ends (DNA termini met overhangen) produceren na RE spijs…

Representative Results

Primaire menselijke keratinocyten werden geïsoleerd van de afgedankte neonatale foreskins 2 – 3, gebundelde en gekweekte in KSFM aangevuld met 30 µg/mL boviene hypofyse extract, 0,26 ng/mL recombinante menselijke epidermale groeifactor, en 0.09 mM calciumchloride (CaCl2 ) bij 37 ° C, 5% kooldioxide. De cellen werden opgesplitst in twee maatkolven, en één kolf werd onderscheiden door de toevoeging van CaCl2 om een eindconcentratie van 1.2 mM voor 72 h. 107…

Discussion

4C resultaten hebben het potentieel om te openbaren chromatine interacties die voorheen onbekende regelgevende elementen kunnen aanduiden en/of doelgenen die belangrijk in een specifieke biologische context24,25,26 zijn. Technische hindernissen kunnen echter de gegevens uit deze experimenten beperken. PCR bias die voortvloeien uit over-amplificatie van sjabloon in 4 C protocollen is waarschijnlijk. Dit protocol behandelt deze kw…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Dit werk werd gesteund door NIAMS (R01AR065523).

Materials

HindIII NEB R0104S
CviQI NEB R0639S
DNA oligonucleotide primers IDT To be designed by the reader
50 mL conical centrifuge tubes Fisher Scientific 06-443-19
1.7 mL microcentrifuge tubes MidSci AVSS1700
Phosphate buffered saline Thermo Fisher 14190-136
Formaldehyde, methanol free Electron Microscopy Sciences 15710
Nutator VWR 15172-203
Glycine JT Baker 4059-00
Benchtop centrifuge
Refrigerated microcentrifuge
Ethylenediaminetetraacetic acid (EDTA) Sigma-Aldrich ED2SS
20% SDS solution Sigma-Aldrich 05030
Trypan Blue Thermo Fisher 15250061
Glass slides Fisher Scientific 12-550-143
Cover slips VWR 16004-094
Light microscope
Triton X-100 Alfa Aesar A16046
Shaking heat block
2M Tris-HCl Quality Biological 351-048-101
Proteinase K NEB P8107S
Phenol:chloroform:isoamyl alcohol (25:24:1) Sigma-Aldrich P2069
Sodium acetate Sigma-Aldrich M5661
20 mg/mL glycogen Thermo Fisher R0561
Ethanol Fisher Scientific 04-355-223
Nuclease-free water Fisher Scientific MT-46-000-CM
qPCR cycler Thermo Fisher 4453536
qPCR plates Thermo Fisher 4309849
Thermocycler Thermo Fisher 4375786
PCR strip tubes MidSci AVSST-FL
1M Magnesium chloride Quality Biological 351-033-721
Dithiothreotol Sigma-Aldrich 43815
Adenosine triphosphate Sigma-Aldrich A2383
T4 DNA Ligase NEB M0202S
Agarose Sigma-Aldrich A6013
RNase A Thermo Fisher EN0531
Qiaquick PCR purification kit Qiagen 28104
MinElute PCR Purification kit Qiagen 28004
Spectrophotometer
Expand Long Template PCR System Sigma-Aldrich 11681834001
dNTP mix Thermo Fisher R0191
SYBR Green I Sigma-Aldrich S9430
ROX BioRad 172-5858
Sodium chloride Sigma-Aldrich S5886
End-It DNA End-Repair Kit Lucigen ER0720
LigaFast Rapid DNA Ligation System Promega M8221
SYBR Safe Thermo Fisher S33102
Taq Polymerase NEB M0267S
UltraSieve Agarose IBI Scientific IB70054
Qiaquick Gel Extraction Kit Qiagen 28704

References

  1. Dunham, I., et al. An integrated encyclopedia of DNA elements in the human genome. Nature. 489 (7414), 57-74 (2012).
  2. Hoffman, M. M., et al. Integrative annotation of chromatin elements from ENCODE data. Nucleic Acids Research. 41 (2), 827-841 (2013).
  3. Dekker, J., Rippe, K., Dekker, M., Kleckner, N. Capturing Chromosome Conformation. Science. 295 (5558), 1306-1311 (2002).
  4. Sanyal, A., Lajoie, B. R., Jain, G., Dekker, J. The long-range interaction landscape of gene promoters. Nature. 489 (7414), 109-113 (2012).
  5. Li, G., et al. Extensive promoter-centered chromatin interactions provide a topological basis for transcription regulation. Cell. 148 (1-2), 84-98 (2012).
  6. Schmitt, A. D., Hu, M., Ren, B. Genome-wide mapping and analysis of chromosome architecture. Nature Reviews Molecular Cell Biology. 17 (12), 743-755 (2016).
  7. Zhao, Z., et al. Circular chromosome conformation capture (4C) uncovers extensive networks of epigenetically regulated intra- and interchromosomal interactions. Nature genetics. 38 (11), 1341-1347 (2006).
  8. Splinter, E., de Wit, E., van de Werken, H. J. G., Klous, P., de Laat, W. Determining long-range chromatin interactions for selected genomic sites using 4C-seq technology: From fixation to computation. Methods. 58 (3), 221-230 (2012).
  9. Van De Werken, H. J. G., et al. 4C technology: Protocols and data analysis. Methods in Enzymology. 513, (2012).
  10. Brouwer, R. W. W., van den Hout, M. C. G. N., van IJcken, W. F. J., Soler, E., Stadhouders, R. Unbiased Interrogation of 3D Genome Topology Using Chromosome Conformation Capture Coupled to High-Throughput Sequencing (4C-Seq). Eukaryotic Transcriptional and Post-Transcriptional Gene Expression Regulation. , 199-220 (2017).
  11. Matelot, M., Noordermeer, D. Determination of High-Resolution 3D Chromatin Organization Using Circular Chromosome Conformation Capture (4C-seq). Polycomb Group Proteins: Methods and Protocols. , 223-241 (2016).
  12. Gheldof, N., Leleu, M., Noordermeer, D., Rougemont, J., Reymond, A. Detecting Long-Range Chromatin Interactions Using the Chromosome Conformation Capture Sequencing (4C-seq) Method. Gene Regulatory Networks: Methods and Protocols. , 211-225 (2012).
  13. Göndör, A., Rougier, C., Ohlsson, R. High-resolution circular chromosome conformation capture assay. Nature. 3 (2), 303-313 (2008).
  14. Hagège, H., et al. Quantitative analysis of chromosome conformation capture assays (3C-qPCR). Nature. 2 (7), 1722-1733 (2007).
  15. Anand, R. D., Sertil, O., Lowry, C. V. Restriction digestion monitors facilitate plasmid construction and PCR cloning. BioTechniques. 36 (6), 982-985 (2004).
  16. Afgan, E., et al. The Galaxy platform for accessible, reproducible and collaborative biomedical analyses: 2016 update. Nucleic acids research. 44 (W1), W3-W10 (2016).
  17. Li, H., Durbin, R. Fast and accurate long-read alignment with Burrows-Wheeler transform. Bioinformatics. 26 (5), 589-595 (2010).
  18. Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25 (16), 2078-2079 (2009).
  19. Walter, C., Schuetzmann, D., Rosenbauer, F., Dugas, M. Basic4Cseq: An R/Bioconductor package for analyzing 4C-seq data. Bioinformatics. 30 (22), 3268-3269 (2014).
  20. Raviram, R., et al. 4C-ker: A Method to Reproducibly Identify Genome-Wide Interactions Captured by 4C-Seq Experiments. PLoS Computational Biology. 12 (3), (2016).
  21. Klein, F. A., Pakozdi, T., Anders, S., Ghavi-helm, Y., Furlong, E. E. M., Huber, W. FourCSeq: analysis of 4C sequencing data. Bioinformatics. 31 (19), 3085-3091 (2015).
  22. Williams, R. L., et al. fourSig a method for determining chromosomal interactions in 4C-Seq data. Nucleic Acids Research. 42 (8), (2014).
  23. McLean, C. Y., et al. GREAT improves functional interpretation of cis-regulatory regions. Nature Biotechnology. 28 (5), 495-501 (2010).
  24. Stolzenburg, L. R., et al. Regulatory dynamics of 11p13 suggest a role for EHF in modifying CF lung disease severity. Nucleic Acids Research. 45 (15), 8773-8784 (2017).
  25. Meddens, C. A., et al. Systematic analysis of chromatin interactions at disease associated loci links novel candidate genes to inflammatory bowel disease. Genome Biology. 17 (1), 1-15 (2016).
  26. Yeung, J., et al. Transcription factor activity rhythms and tissue-specific chromatin interactions explain circadian gene expression across organs. Genome research. , 207787 (2017).
check_url/58030?article_type=t

Play Video

Cite This Article
Brettmann, E. A., Oh, I. Y., de Guzman Strong, C. High-throughput Identification of Gene Regulatory Sequences Using Next-generation Sequencing of Circular Chromosome Conformation Capture (4C-seq). J. Vis. Exp. (140), e58030, doi:10.3791/58030 (2018).

View Video