Summary

Høj overførselshastighed identifikation af regulerende gensekvenser ved hjælp af næste generations sekventering af cirkulære kromosom kropsbygning Capture (4C-seq)

Published: October 05, 2018
doi:

Summary

Identifikation af fysiske interaktion mellem gener og regulerende elementer er udfordrende men er blevet fremmet af kromosom kropsbygning fange metoder. Denne ændring i 4C-seq protokollen afbøder PCR bias ved at minimere overdreven forstærkning af PCR skabeloner og maksimerer mappability af læser ved at indarbejde en tilføjelse begrænsning enzym digest trin.

Abstract

Identifikation af regulerende elementer for en given mål gen udgør en betydelig teknisk udfordring som følge af variabiliteten i positionering og virkning størrelser af regulerende elementer til en mål-genet. Har gjort nogle fremskridt med bioinformatic forudsigelse af eksistensen og funktion af proksimale epigenetiske ændringer forbundet med aktiveret genekspression ved hjælp af bevarede transskription faktor bindingssteder. Kromatin kropsbygning capture undersøgelser har revolutioneret vores evne til at opdage fysiske kromatin kontakter mellem sekvenser og selv inden for en hele genom. Cirkulær kromatin kropsbygning capture kombineret med næste generation sequencing (4C-FF.), især, er designet til at opdage alle mulige fysiske kromatin interaktioner for en given sekvens af interesse (synspunkt), som et mål gen eller en regulerende forstærker. Nuværende 4C-seq strategier direkte sekvens fra inden for et synspunkt, men kræver talrige og forskelligartede synspunkter til at være samtidig sekventeret for at undgå de tekniske udfordringer ved uniform base ringer (imaging) med næste generation sequencing platforme. Denne mængde af eksperimenter kan ikke være praktisk for mange laboratorier. Her rapporterer vi en modificeret tilgang i 4C-seq-protokollen, der omfatter både en yderligere begrænsning enzym digest og qPCR-baseret forstærkning trin, der er designet til at lette en større fangst af forskelligartede sekvens læsninger og mindske risikoen for PCR bias, henholdsvis. Vores ændrede 4C metode er indstillet til standard molekylær biologi lab for at vurdere kromatin arkitektur.

Introduction

Identifikation af regulerende elementer for genekspression er blevet fremmet som encyklopædi af DNA elementer (INDKODE) projekt, der udførligt kommenteret funktionelle aktivitet for 80% af det menneskelige genom1,2. Identifikation af websteder for i vivo transskription faktor bindende, DNaseI overfølsomhed, og epigenetiske Histon og DNA methylering ændringer i enkelte celletyper banede vejen for de funktionelle analyser af kandidat regulerende elementer for target genekspression. Bevæbnet med disse resultater, står vi over for udfordringen, fastsættelse af den funktionelle sammenkobling mellem regulerende elementer og gener. Specifikt, hvad er forholdet mellem et givet mål gen og dets enhancer(s)? Metoden kromatin kropsbygning capture (3C) omhandler direkte dette spørgsmål ved at identificere fysiske, og sandsynligvis funktionelle, interaktioner mellem en region af interesse og kandidat interagere sekvenser gennem optagne begivenheder i faste kromatin3 . Som vores forståelse af kromatin interaktioner er steget, men er det klart, at undersøgelsen af forudvalgte kandidat loci er utilstrækkelige til at give en komplet forståelse af gen-forstærker interaktioner. For eksempel, ENCODE bruges metoden høj overførselshastighed kromosomale kropsbygning capture carbon copy (5C) til at undersøge en lille del af det menneskelige genom (1%, pilot sæt 44 loci) og rapporteret kompleks sammenkobling af loci. Gener og smagsforstærkere med konstaterede interaktioner i gennemsnit 2 – 4 forskellige interagerende partnere, hvoraf mange var hundredvis af kilobases væk i lineære plads4. Yderligere, Li al.. brugt kromatin interaktion analyse af forbundne-ende Tag sekventering (ChIA-PET) at analysere hele-genom promotor interaktioner og fandt, at 65% af RNA polymerase II bindingssteder var involveret i kromatin interaktioner. Nogle af disse interaktioner resulterede i store, multi gen komplekser spanning hundredvis af kilobases af genomisk afstand og indeholder i gennemsnit 8-9 gener hver5. Sammen, fremhæve disse resultater behovet for fordomsfri hele-genom metoder til spørgekriterierne kromatin interaktioner. Nogle af disse metoder er gennemgået i Schmitt mfl. 6.

Nyere metoder til kromatin kropsbygning capture undersøgelser kombineret med næste generation sequencing (Hi-C og 4C-seq) aktiver opdagelsen af ukendte sekvenser interagere med en region af interesse6. Specifikt, cirkulær kromosom kropsbygning opsamling med næste generation sequencing (4C-FF.) blev udviklet til at identificere loci interagere med en sekvens af interesse i en fordomsfri måde7 ved sekventering DNA fra erobrede kromatin proksimalt for den region af interesse i 3D-rum. Kort, kromatin er fastsat til at bevare sin oprindelige protein-DNA interaktioner, kløvet med en restriktion enzym, og efterfølgende forbundet fortyndet betingelser at fange biologisk relevante “tangles” af interagerende loci (figur 1). Cross links er vendt for at fjerne protein, hvilket giver DNA tilgængelige for ekstra kavalergang med en anden begrænsning enzym. En endelige ligatur genererer mindre cirkler af interagerende loci. Primere til sekvens af interesse er derefter bruges til at generere en forstærket bibliotek af ukendt sekvenser fra de circularized fragmenter, efterfulgt af downstream næste generation sequencing.

Protokollen præsenteres her, som fokuserer på prøveforberedelse, gør to væsentlige ændringer til eksisterende 4C-seq metoder8,9,10,11,12. Først, det bruger en qPCR-baseret metode til empirisk bestemme det optimale antal forstærkning cykler for 4C-seq bibliotek præparationstrin og dermed afbøder potentialet for PCR bias som følge af overdreven forstærkning af biblioteker. Andet, det bruger en yderligere begrænsning digest skridt i et forsøg på at reducere den ensartethed af kendte “lokkemad” sekvenser, der hæmmer præcis base-ringer af sekventering instrument og derfor maksimerer den unikke, informative sekvens i hvert Læs. Andre protokoller omgå dette problem ved at samle mange (12-15)8 4 C-seq biblioteker med forskellige agn sekvenser og/eller begrænsning steder, en mængde af eksperimenter, der ikke kan opnås af andre laboratorier. De ændringer, der præsenteres her tillader et lille antal eksperimenter, prøver og/eller kopierer for at blive indekseret og samles i en enkelt lane.

Protocol

1. begrænsning enzym udvalg Identificere en region af interesse (fx., gen promotor, enkelt nukleotid polymorfisme (SNP), enhancer) og få DNA-sekvens fra repositories som National Center for bioteknologi oplysninger (NCBI). Identificere kandidat-restriktionsenzymer (REs) for det første begrænsning enzym fordøjelse (RE1) der ikke skære i rækkefølgen af interesse, som producerer sticky ender (DNA termini med udhæng) efter RE fordøjelsen, og hvis aktiviteter ikke hæmmes af CpG methyler…

Representative Results

Primære humane keratinocytter blev isoleret fra 2 – 3 kasserede neonatal foreskins, samles og kulturperler i KSFM suppleret med 30 µg/mL bovin hypofyse ekstrakt, 0,26 ng/mL rekombinant human epidermal vækstfaktor og 0,09 mM calciumchlorid (CaCl2 ) ved 37 ° C, 5% kuldioxid. Cellerne var opdelt i to kolber, og én kolbe blev differentieret ved tilsætning af CaCl2 til en endelig koncentration på 1,2 mM for 72 h. 107 celler hver fra prolifererende og d…

Discussion

4C resultater har potentiale til at afsløre kromatin samspil, der kan identificere hidtil ukendte regulerende elementer og/eller target gener, der er vigtige i en bestemte biologiske forbindelse24,25,26. Tekniske forhindringer kan imidlertid begrænse resultaterne af disse eksperimenter. PCR bias som følge af overdreven forstærkning af skabelon i 4 C protokoller er sandsynligt. Denne protokol løser dette problem ved at udnyt…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Dette arbejde blev støttet af NIAMS (R01AR065523).

Materials

HindIII NEB R0104S
CviQI NEB R0639S
DNA oligonucleotide primers IDT To be designed by the reader
50 mL conical centrifuge tubes Fisher Scientific 06-443-19
1.7 mL microcentrifuge tubes MidSci AVSS1700
Phosphate buffered saline Thermo Fisher 14190-136
Formaldehyde, methanol free Electron Microscopy Sciences 15710
Nutator VWR 15172-203
Glycine JT Baker 4059-00
Benchtop centrifuge
Refrigerated microcentrifuge
Ethylenediaminetetraacetic acid (EDTA) Sigma-Aldrich ED2SS
20% SDS solution Sigma-Aldrich 05030
Trypan Blue Thermo Fisher 15250061
Glass slides Fisher Scientific 12-550-143
Cover slips VWR 16004-094
Light microscope
Triton X-100 Alfa Aesar A16046
Shaking heat block
2M Tris-HCl Quality Biological 351-048-101
Proteinase K NEB P8107S
Phenol:chloroform:isoamyl alcohol (25:24:1) Sigma-Aldrich P2069
Sodium acetate Sigma-Aldrich M5661
20 mg/mL glycogen Thermo Fisher R0561
Ethanol Fisher Scientific 04-355-223
Nuclease-free water Fisher Scientific MT-46-000-CM
qPCR cycler Thermo Fisher 4453536
qPCR plates Thermo Fisher 4309849
Thermocycler Thermo Fisher 4375786
PCR strip tubes MidSci AVSST-FL
1M Magnesium chloride Quality Biological 351-033-721
Dithiothreotol Sigma-Aldrich 43815
Adenosine triphosphate Sigma-Aldrich A2383
T4 DNA Ligase NEB M0202S
Agarose Sigma-Aldrich A6013
RNase A Thermo Fisher EN0531
Qiaquick PCR purification kit Qiagen 28104
MinElute PCR Purification kit Qiagen 28004
Spectrophotometer
Expand Long Template PCR System Sigma-Aldrich 11681834001
dNTP mix Thermo Fisher R0191
SYBR Green I Sigma-Aldrich S9430
ROX BioRad 172-5858
Sodium chloride Sigma-Aldrich S5886
End-It DNA End-Repair Kit Lucigen ER0720
LigaFast Rapid DNA Ligation System Promega M8221
SYBR Safe Thermo Fisher S33102
Taq Polymerase NEB M0267S
UltraSieve Agarose IBI Scientific IB70054
Qiaquick Gel Extraction Kit Qiagen 28704

References

  1. Dunham, I., et al. An integrated encyclopedia of DNA elements in the human genome. Nature. 489 (7414), 57-74 (2012).
  2. Hoffman, M. M., et al. Integrative annotation of chromatin elements from ENCODE data. Nucleic Acids Research. 41 (2), 827-841 (2013).
  3. Dekker, J., Rippe, K., Dekker, M., Kleckner, N. Capturing Chromosome Conformation. Science. 295 (5558), 1306-1311 (2002).
  4. Sanyal, A., Lajoie, B. R., Jain, G., Dekker, J. The long-range interaction landscape of gene promoters. Nature. 489 (7414), 109-113 (2012).
  5. Li, G., et al. Extensive promoter-centered chromatin interactions provide a topological basis for transcription regulation. Cell. 148 (1-2), 84-98 (2012).
  6. Schmitt, A. D., Hu, M., Ren, B. Genome-wide mapping and analysis of chromosome architecture. Nature Reviews Molecular Cell Biology. 17 (12), 743-755 (2016).
  7. Zhao, Z., et al. Circular chromosome conformation capture (4C) uncovers extensive networks of epigenetically regulated intra- and interchromosomal interactions. Nature genetics. 38 (11), 1341-1347 (2006).
  8. Splinter, E., de Wit, E., van de Werken, H. J. G., Klous, P., de Laat, W. Determining long-range chromatin interactions for selected genomic sites using 4C-seq technology: From fixation to computation. Methods. 58 (3), 221-230 (2012).
  9. Van De Werken, H. J. G., et al. 4C technology: Protocols and data analysis. Methods in Enzymology. 513, (2012).
  10. Brouwer, R. W. W., van den Hout, M. C. G. N., van IJcken, W. F. J., Soler, E., Stadhouders, R. Unbiased Interrogation of 3D Genome Topology Using Chromosome Conformation Capture Coupled to High-Throughput Sequencing (4C-Seq). Eukaryotic Transcriptional and Post-Transcriptional Gene Expression Regulation. , 199-220 (2017).
  11. Matelot, M., Noordermeer, D. Determination of High-Resolution 3D Chromatin Organization Using Circular Chromosome Conformation Capture (4C-seq). Polycomb Group Proteins: Methods and Protocols. , 223-241 (2016).
  12. Gheldof, N., Leleu, M., Noordermeer, D., Rougemont, J., Reymond, A. Detecting Long-Range Chromatin Interactions Using the Chromosome Conformation Capture Sequencing (4C-seq) Method. Gene Regulatory Networks: Methods and Protocols. , 211-225 (2012).
  13. Göndör, A., Rougier, C., Ohlsson, R. High-resolution circular chromosome conformation capture assay. Nature. 3 (2), 303-313 (2008).
  14. Hagège, H., et al. Quantitative analysis of chromosome conformation capture assays (3C-qPCR). Nature. 2 (7), 1722-1733 (2007).
  15. Anand, R. D., Sertil, O., Lowry, C. V. Restriction digestion monitors facilitate plasmid construction and PCR cloning. BioTechniques. 36 (6), 982-985 (2004).
  16. Afgan, E., et al. The Galaxy platform for accessible, reproducible and collaborative biomedical analyses: 2016 update. Nucleic acids research. 44 (W1), W3-W10 (2016).
  17. Li, H., Durbin, R. Fast and accurate long-read alignment with Burrows-Wheeler transform. Bioinformatics. 26 (5), 589-595 (2010).
  18. Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25 (16), 2078-2079 (2009).
  19. Walter, C., Schuetzmann, D., Rosenbauer, F., Dugas, M. Basic4Cseq: An R/Bioconductor package for analyzing 4C-seq data. Bioinformatics. 30 (22), 3268-3269 (2014).
  20. Raviram, R., et al. 4C-ker: A Method to Reproducibly Identify Genome-Wide Interactions Captured by 4C-Seq Experiments. PLoS Computational Biology. 12 (3), (2016).
  21. Klein, F. A., Pakozdi, T., Anders, S., Ghavi-helm, Y., Furlong, E. E. M., Huber, W. FourCSeq: analysis of 4C sequencing data. Bioinformatics. 31 (19), 3085-3091 (2015).
  22. Williams, R. L., et al. fourSig a method for determining chromosomal interactions in 4C-Seq data. Nucleic Acids Research. 42 (8), (2014).
  23. McLean, C. Y., et al. GREAT improves functional interpretation of cis-regulatory regions. Nature Biotechnology. 28 (5), 495-501 (2010).
  24. Stolzenburg, L. R., et al. Regulatory dynamics of 11p13 suggest a role for EHF in modifying CF lung disease severity. Nucleic Acids Research. 45 (15), 8773-8784 (2017).
  25. Meddens, C. A., et al. Systematic analysis of chromatin interactions at disease associated loci links novel candidate genes to inflammatory bowel disease. Genome Biology. 17 (1), 1-15 (2016).
  26. Yeung, J., et al. Transcription factor activity rhythms and tissue-specific chromatin interactions explain circadian gene expression across organs. Genome research. , 207787 (2017).
check_url/58030?article_type=t

Play Video

Cite This Article
Brettmann, E. A., Oh, I. Y., de Guzman Strong, C. High-throughput Identification of Gene Regulatory Sequences Using Next-generation Sequencing of Circular Chromosome Conformation Capture (4C-seq). J. Vis. Exp. (140), e58030, doi:10.3791/58030 (2018).

View Video