Summary

Identificazione di High-throughput di sequenze regolatorie del Gene mediante sequenziamento di nuova generazione di cromosoma circolare conformazione catturare (4C-seq)

Published: October 05, 2018
doi:

Summary

L’identificazione delle interazioni fisiche tra geni ed elementi regolatori è impegnativo ma è stata facilitata dai metodi di cattura conformazione del cromosoma. Questa modifica del protocollo 4C-seq mitiga bias PCR riducendo al minimo eccessiva amplificazione dei modelli di PCR e massimizza la mappability di letture incorporando un passo di digest di aggiunta degli enzimi di limitazione.

Abstract

L’identificazione di elementi regolatori per un gene target dato pone una sfida tecnica notevole a causa della variabilità nelle misure di posizionamento e di effetto di elementi regolatori ad un gene dell’obiettivo. Alcuni progressi compiuti con il pronostico di bioinformatica dell’esistenza e la funzione delle modificazioni epigenetiche prossimale associata con l’espressione di gene attivato utilizzando siti di legame del fattore di trascrizione conservata. Gli studi di cattura di conformazione cromatinica hanno rivoluzionato la nostra capacità di individuazione dei contatti fisici della cromatina tra sequenze e anche all’interno di un intero genoma. Acquisizione di conformazione cromatinica circolare accoppiato con sequenziamento di nuova generazione (4C-seq), in particolare, è progettato per scoprire tutte le possibili interazioni fisiche della cromatina per una data sequenza di interesse (Belvedere), ad esempio un gene bersaglio o una regolamentazione Enhancer. Attuali strategie di 4C-seq direttamente sequenza all’interno il punto di vista ma richiedono numerose e punti di vista diversi da sequenziare contemporaneamente per evitare le sfide tecniche della divisa base chiamata (imaging) con successiva generazione di piattaforme di sequenziamento. Questo volume di esperimenti potrebbe non essere pratico per molti laboratori. Qui, segnaliamo un metodo modificato del protocollo di 4C-seq che incorpora sia un digest di ulteriori degli enzimi di limitazione e passaggi di amplificazione qPCR-basato che sono progettati per facilitare una maggiore acquisizione di sequenza diverse letture e ridurre il potenziale per Bias di PCR, rispettivamente. Il nostro metodo modificato di 4C è favorevole al laboratorio di biologia molecolare standard per la valutazione della architettura della cromatina.

Introduction

L’identificazione di elementi regolatori per l’espressione genica è stata facilitata dal progetto Enciclopedia di DNA Elements (ENCODE) che globalmente annotati attività funzionale per l’80% del genoma umano1,2. L’identificazione dei siti per in vivo associazione di fattore di trascrizione, ipersensibilità di DNaseI e istone epigenetici e modifiche di metilazione del DNA in tipi cellulari individuali ha spianato la strada per l’analisi funzionale del candidato normativo elementi di espressione genica. Armati di questi risultati, dobbiamo affrontare la sfida di determinare l’interconnessione funzionale tra elementi regolatori e geni. In particolare, qual è la relazione tra un gene target dato e sua enhancer(s)? Il metodo di cattura (3C) conformazione cromatinica si rivolge direttamente questa domanda di identificazione fisiche e probabile che interazioni funzionali, tra una regione di interesse e candidato interagendo sequenze attraverso eventi acquisiti nella cromatina fisso3 . Come la nostra comprensione delle interazioni della cromatina è aumentato, tuttavia, è chiaro che l’indagine di loci candidati preselezionati è insufficiente per fornire una comprensione completa delle interazioni gene-enhancer. Ad esempio, codifica usato il metodo di copia carbone (5C) cattura conformazione cromosomica ad alta produttività per esaminare una piccola porzione del genoma umano (1%, pilota set di 44 loci) e segnalato complesso interconnettività dei loci. Geni ed esaltatori di sapidità con interazioni identificate una media di 2 – 4 diversi partner interagenti, molti dei quali erano centinaia di kilobasi distanza di spazio lineare4. Inoltre, Li et al. usato analisi delle interazioni della cromatina di Paired-End Tag Sequencing (ChIA-PET) per analizzare le interazioni promotore intero genoma e trovato che il 65% dei siti di RNA polimerasi II legame erano coinvolti nelle interazioni della cromatina. Alcune di queste interazioni è derivato in complessi di grandi dimensioni, del multi-gene spanning centinaia di kilobasi di distanza genomica contenente, in media, 8-9 geni ogni5. Insieme, questi risultati evidenziano la necessità di imparziale intero genoma metodi per interrogare interazioni della cromatina. Alcuni di questi metodi sono esaminati a Schmitt et al. 6.

Metodi più recenti per gli studi di cattura di conformazione cromatinica accoppiato con generazione sequenziamento (Hi-C e 4C-seq) attiva la scoperta di sequenze sconosciute che interagiscono con una regione di interesse6. Specificamente, cromosoma circolare conformazione cattura con sequenziamento di nuova generazione (4C-seq) è stata sviluppata per identificare loci interagendo con una sequenza di interesse in un modo imparziale7 mediante sequenziamento del DNA dalla cromatina catturata prossimale per la regione di interesse nello spazio 3D. Brevemente, la cromatina è fisso per preservare le interazioni proteina-DNA nativo, spaccati con un enzima di restrizione e successivamente legato in condizioni diluite per catturare biologicamente rilevanti “grovigli” di loci interagenti (Figura 1). I collegamenti trasversali sono invertiti per rimuovere la proteina, lasciando così il DNA disponibile per ulteriore scissione con un secondo enzima di restrizione. Una legatura finale genera cerchi più piccoli di loci interagenti. Primers per la sequenza di interesse vengono quindi utilizzati per generare una libreria amplificata di sequenze sconosciute dai frammenti circolare, seguite da sequenziamento di nuova generazione a valle.

Il protocollo presentato qui, che si concentra sulla preparazione del campione, fa due principali alterazioni al esistente 4C-seq metodi8,9,10,11,12. In primo luogo, utilizza un metodo basato su qPCR empiricamente determinare il numero ottimale di amplificazione cicli per passaggi di preparazione libreria 4C-seq e così riduce il potenziale per la parzialità PCR derivanti dalla eccessiva amplificazione delle librerie. In secondo luogo, utilizza un’ulteriore restrizione del digest passo nel tentativo di ridurre l’uniformità delle sequenze di note “esca” che ostacola accurata base chiamata dallo strumento di sequenziamento e, quindi, massimizza la sequenza unica, ben informativa in ogni lettura. Altri protocolli di aggirano questo problema mettendo in comune molte librerie di 4C-seq8 (12-15) con esche diverse sequenze e/o siti di restrizione, un volume di esperimenti che potrebbero non essere realizzabili da altri laboratori. Le modifiche qui presentate consentono un piccolo numero di esperimenti, campioni e/o replica per essere indicizzati e raggruppati in una sola corsia.

Protocol

1. selezione degli enzimi di limitazione Identificare una regione di interesse (ad es., promotore del gene, polimorfismo a singolo nucleotide (SNP), enhancer) e ottenere la sequenza di DNA dai repository come centro nazionale per Biotechnology Information (NCBI). Identificare gli enzimi di limitazione del candidato (REs) per la prima digestione degli enzimi di restrizione (RE1) che non tagliare all’interno della sequenza di interesse, che producono l’estremità appiccicosa (termini di DNA con…

Representative Results

Keratinocytes umani primari sono stati isolati da 2 – 3 scartati neonatale prepuzi, riunita e colta in KSFM completati con 30 µ g/mL pituitaria bovina Estratto, 0,26 ng/mL ricombinante umano fattore di crescita epidermico e 0,09 mM di cloruro di calcio (CaCl2 ) a 37 ° C, 5% di anidride carbonica. Le cellule sono state divise in due boccette, e una boccetta è stata differenziata dall’aggiunta di CaCl2 a una concentrazione finale di 1.2 mM per cellule7 …

Discussion

4C risultati hanno il potenziale per rivelare le interazioni di cromatina che possono identificare gli elementi normativi precedentemente sconosciuti e/o geni bersaglio che sono importanti in un contesto biologico specifico24,25,26. Tuttavia, gli ostacoli tecnici possono limitare i dati ottenuti da questi esperimenti. Bias PCR derivanti dalla eccessiva amplificazione del modello nei protocolli 4C è probabile. Questo protocollo …

Disclosures

The authors have nothing to disclose.

Acknowledgements

Questo lavoro è stato supportato da NIAMS (R01AR065523).

Materials

HindIII NEB R0104S
CviQI NEB R0639S
DNA oligonucleotide primers IDT To be designed by the reader
50 mL conical centrifuge tubes Fisher Scientific 06-443-19
1.7 mL microcentrifuge tubes MidSci AVSS1700
Phosphate buffered saline Thermo Fisher 14190-136
Formaldehyde, methanol free Electron Microscopy Sciences 15710
Nutator VWR 15172-203
Glycine JT Baker 4059-00
Benchtop centrifuge
Refrigerated microcentrifuge
Ethylenediaminetetraacetic acid (EDTA) Sigma-Aldrich ED2SS
20% SDS solution Sigma-Aldrich 05030
Trypan Blue Thermo Fisher 15250061
Glass slides Fisher Scientific 12-550-143
Cover slips VWR 16004-094
Light microscope
Triton X-100 Alfa Aesar A16046
Shaking heat block
2M Tris-HCl Quality Biological 351-048-101
Proteinase K NEB P8107S
Phenol:chloroform:isoamyl alcohol (25:24:1) Sigma-Aldrich P2069
Sodium acetate Sigma-Aldrich M5661
20 mg/mL glycogen Thermo Fisher R0561
Ethanol Fisher Scientific 04-355-223
Nuclease-free water Fisher Scientific MT-46-000-CM
qPCR cycler Thermo Fisher 4453536
qPCR plates Thermo Fisher 4309849
Thermocycler Thermo Fisher 4375786
PCR strip tubes MidSci AVSST-FL
1M Magnesium chloride Quality Biological 351-033-721
Dithiothreotol Sigma-Aldrich 43815
Adenosine triphosphate Sigma-Aldrich A2383
T4 DNA Ligase NEB M0202S
Agarose Sigma-Aldrich A6013
RNase A Thermo Fisher EN0531
Qiaquick PCR purification kit Qiagen 28104
MinElute PCR Purification kit Qiagen 28004
Spectrophotometer
Expand Long Template PCR System Sigma-Aldrich 11681834001
dNTP mix Thermo Fisher R0191
SYBR Green I Sigma-Aldrich S9430
ROX BioRad 172-5858
Sodium chloride Sigma-Aldrich S5886
End-It DNA End-Repair Kit Lucigen ER0720
LigaFast Rapid DNA Ligation System Promega M8221
SYBR Safe Thermo Fisher S33102
Taq Polymerase NEB M0267S
UltraSieve Agarose IBI Scientific IB70054
Qiaquick Gel Extraction Kit Qiagen 28704

References

  1. Dunham, I., et al. An integrated encyclopedia of DNA elements in the human genome. Nature. 489 (7414), 57-74 (2012).
  2. Hoffman, M. M., et al. Integrative annotation of chromatin elements from ENCODE data. Nucleic Acids Research. 41 (2), 827-841 (2013).
  3. Dekker, J., Rippe, K., Dekker, M., Kleckner, N. Capturing Chromosome Conformation. Science. 295 (5558), 1306-1311 (2002).
  4. Sanyal, A., Lajoie, B. R., Jain, G., Dekker, J. The long-range interaction landscape of gene promoters. Nature. 489 (7414), 109-113 (2012).
  5. Li, G., et al. Extensive promoter-centered chromatin interactions provide a topological basis for transcription regulation. Cell. 148 (1-2), 84-98 (2012).
  6. Schmitt, A. D., Hu, M., Ren, B. Genome-wide mapping and analysis of chromosome architecture. Nature Reviews Molecular Cell Biology. 17 (12), 743-755 (2016).
  7. Zhao, Z., et al. Circular chromosome conformation capture (4C) uncovers extensive networks of epigenetically regulated intra- and interchromosomal interactions. Nature genetics. 38 (11), 1341-1347 (2006).
  8. Splinter, E., de Wit, E., van de Werken, H. J. G., Klous, P., de Laat, W. Determining long-range chromatin interactions for selected genomic sites using 4C-seq technology: From fixation to computation. Methods. 58 (3), 221-230 (2012).
  9. Van De Werken, H. J. G., et al. 4C technology: Protocols and data analysis. Methods in Enzymology. 513, (2012).
  10. Brouwer, R. W. W., van den Hout, M. C. G. N., van IJcken, W. F. J., Soler, E., Stadhouders, R. Unbiased Interrogation of 3D Genome Topology Using Chromosome Conformation Capture Coupled to High-Throughput Sequencing (4C-Seq). Eukaryotic Transcriptional and Post-Transcriptional Gene Expression Regulation. , 199-220 (2017).
  11. Matelot, M., Noordermeer, D. Determination of High-Resolution 3D Chromatin Organization Using Circular Chromosome Conformation Capture (4C-seq). Polycomb Group Proteins: Methods and Protocols. , 223-241 (2016).
  12. Gheldof, N., Leleu, M., Noordermeer, D., Rougemont, J., Reymond, A. Detecting Long-Range Chromatin Interactions Using the Chromosome Conformation Capture Sequencing (4C-seq) Method. Gene Regulatory Networks: Methods and Protocols. , 211-225 (2012).
  13. Göndör, A., Rougier, C., Ohlsson, R. High-resolution circular chromosome conformation capture assay. Nature. 3 (2), 303-313 (2008).
  14. Hagège, H., et al. Quantitative analysis of chromosome conformation capture assays (3C-qPCR). Nature. 2 (7), 1722-1733 (2007).
  15. Anand, R. D., Sertil, O., Lowry, C. V. Restriction digestion monitors facilitate plasmid construction and PCR cloning. BioTechniques. 36 (6), 982-985 (2004).
  16. Afgan, E., et al. The Galaxy platform for accessible, reproducible and collaborative biomedical analyses: 2016 update. Nucleic acids research. 44 (W1), W3-W10 (2016).
  17. Li, H., Durbin, R. Fast and accurate long-read alignment with Burrows-Wheeler transform. Bioinformatics. 26 (5), 589-595 (2010).
  18. Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25 (16), 2078-2079 (2009).
  19. Walter, C., Schuetzmann, D., Rosenbauer, F., Dugas, M. Basic4Cseq: An R/Bioconductor package for analyzing 4C-seq data. Bioinformatics. 30 (22), 3268-3269 (2014).
  20. Raviram, R., et al. 4C-ker: A Method to Reproducibly Identify Genome-Wide Interactions Captured by 4C-Seq Experiments. PLoS Computational Biology. 12 (3), (2016).
  21. Klein, F. A., Pakozdi, T., Anders, S., Ghavi-helm, Y., Furlong, E. E. M., Huber, W. FourCSeq: analysis of 4C sequencing data. Bioinformatics. 31 (19), 3085-3091 (2015).
  22. Williams, R. L., et al. fourSig a method for determining chromosomal interactions in 4C-Seq data. Nucleic Acids Research. 42 (8), (2014).
  23. McLean, C. Y., et al. GREAT improves functional interpretation of cis-regulatory regions. Nature Biotechnology. 28 (5), 495-501 (2010).
  24. Stolzenburg, L. R., et al. Regulatory dynamics of 11p13 suggest a role for EHF in modifying CF lung disease severity. Nucleic Acids Research. 45 (15), 8773-8784 (2017).
  25. Meddens, C. A., et al. Systematic analysis of chromatin interactions at disease associated loci links novel candidate genes to inflammatory bowel disease. Genome Biology. 17 (1), 1-15 (2016).
  26. Yeung, J., et al. Transcription factor activity rhythms and tissue-specific chromatin interactions explain circadian gene expression across organs. Genome research. , 207787 (2017).
check_url/kr/58030?article_type=t

Play Video

Cite This Article
Brettmann, E. A., Oh, I. Y., de Guzman Strong, C. High-throughput Identification of Gene Regulatory Sequences Using Next-generation Sequencing of Circular Chromosome Conformation Capture (4C-seq). J. Vis. Exp. (140), e58030, doi:10.3791/58030 (2018).

View Video