Summary

High-throughput Identification des séquences régulatrices du gène à l’aide de prochaine génération séquençage du Chromosome circulaire Conformation Capture (4C-seq)

Published: October 05, 2018
doi:

Summary

L’identification des interactions physiques entre les gènes et les éléments de régulation est difficile, mais a été facilitée par les méthodes de capture de conformation du chromosome. Cette modification du protocole 4C-seq atténue la partialité de la PCR en réduisant au minimum l’amplification excessive des modèles PCR et maximise la mappability se lit en y incorporant une étape digest d’enzyme de restriction addition.

Abstract

L’identification des éléments de régulation pour un gène cible donnée constitue un défi technique considérable en raison de la variabilité dans les tailles de positionnement et de l’effet des éléments régulateurs à un gène cible. Certains progrès ont été réalisés avec la prédiction de bioinformatique de l’existence et la fonction de modifications épigénétiques proximales, associée à l’expression des gènes activés à l’aide de sites de fixation de facteurs de transcription conservée. Études de chromatine conformation capture ont révolutionné notre capacité à découvrir des contacts physiques chromatine entre les séquences et même au sein d’un génome entier. Capture de conformation de la chromatine circulaire couplé avec la nouvelle génération séquençage (4C-seq), en particulier, est conçu pour découvrir tous les possibles interactions de chromatine physique pour une séquence donnée d’intérêt (point de vue), par exemple un gène cible ou une réglementation Enhancer. Les stratégies actuelles de 4c-seq directement partir de séquence au sein du point de vue mais pour lesquels nombreux et divers points de vue à séquencer simultanément afin d’éviter les difficultés techniques de l’uniforme de base aux prochaines plates-formes de séquençage appelant (imagerie). Ce volume d’expériences n’est peut-être pas pratique pour de nombreux laboratoires. Nous rapportons ici une approche modifiée du protocole 4C-seq qui incorpore un digest de l’enzyme de restriction supplémentaire et étapes de qPCR-fonction amplification qui sont conçus pour faciliter une saisie plu de séquences diverses lectures et atténuer les risques de Biaiser les PCR, respectivement. Notre méthode modifiée de 4c se prête au laboratoire de la biologie moléculaire standard pour évaluer l’architecture de la chromatine.

Introduction

L’identification des éléments de régulation de l’expression des gènes a été facilitée par le projet d’encyclopédie des éléments de l’ADN (Encoder) qui annotée complète l’activité fonctionnelle de 80 % du génome humain1,2. L’identification des sites pour en vivo liaison de facteur de transcription, hypersensibilité de la DNase i et histone épigénétique et modifications de méthylation de l’ADN dans les cellules individuelles a ouvert la voie pour les analyses fonctionnelles du candidat réglementaire éléments pour l’expression des gènes cibles. Armé de ces résultats, nous sommes confrontés au défi de la détermination de l’interconnectivité fonctionnelle entre gènes et des éléments de régulation. Plus précisément, quelle est la relation entre un gène cible donnée et son enhancer(s) ? La méthode de capture (3C) de conformation de la chromatine répond directement à cette question par identification les interactions fonctionnelles, physiques et probables entre une région d’intérêt et candidat interagissant les séquences à travers les événements capturés dans la chromatine fixe3 . Comme notre compréhension des interactions de la chromatine a augmenté, cependant, il est clair que l’enquête de locus de candidats présélectionnés ne suffit pas fournir une compréhension complète des interactions gène-enhancer. Par exemple, ENCODE utilisé la méthode de copie carbone (5C) haut débit chromosomiques conformation capture pour examiner une petite partie du génome humain (1 %, pilote mis de 44 loci) et rapportée interconnexion complexe des loci. Gènes et rehausseurs avec interactions identifiées en moyenne 2 à 4 différents partenaires interdépendants, dont beaucoup étaient des centaines de kilobases loin dans l’espace linéaire4. En outre, Li et al. utilisé la chromatine analyse des interactions en bout appariés Tag séquençant (clerbois-PET) pour analyser les interactions de promoteur du génome entier et trouvé que 65 % de l’ARN polymérase II accepteurs étaient impliqués dans les interactions de la chromatine. Certaines de ces interactions résultèrent en grands, multi-gene complexes s’étendant sur des centaines de kilobases de distance génomique et contenant, en moyenne, 8-9 gènes chaque5. Ensemble, ces résultats soulignent la nécessité de méthodes de génome entier impartiales pour interroger les interactions de la chromatine. Certaines de ces méthodes sont examinés dans Schmitt et al. 6.

Des méthodes plus récentes études de chromatine conformation capture couplé avec génération séquençage (Hi-C et 4C-seq) activer la découverte de séquences inconnues interagissant avec une région d’intérêt6. Plus précisément, chromosome circulaire conformation capture avec génération de séquençage (4C-seq) a été développée pour identifier les locus interagissant avec une séquence d’intérêt dans une manière impartiale7 par séquençage ADN de chromatine capturée proximale à la région d’intérêt dans l’espace 3D. En bref, la chromatine est fixée à préserver ses interactions protéine-ADN natif, s’est fendue avec une enzyme de restriction et ensuite ligaturé conditions diluées pour capturer biologiquement pertinentes « enchevêtrements » d’interaction loci (Figure 1). Les liaisons transversales sont inversées pour enlever les protéines, laissant ainsi l’ADN disponible par clivage supplémentaire avec une deuxième enzyme de restriction. Une ligature finale génère des petits cercles de loci qui interagissent. Amorces pour la séquence d’intérêt sont ensuite utilisés pour générer une bibliothèque amplifiée de séquences inconnues des fragments ΦH1, suivies de séquençage en aval de génération suivant.

Le protocole présenté ici, qui met l’accent sur la préparation de l’échantillon, fait deux modifications majeures existantes 4C-seq méthodes8,9,10,11,12. Tout d’abord, il utilise une méthode axée sur le qPCR empiriquement déterminer le nombre optimal d’amplification des cycles pour les étapes de préparation de bibliothèque 4C-seq et atténue ainsi les risques de biais PCR découlant de l’amplification excessive des bibliothèques. Ensuite, il utilise une restriction supplémentaire condensé étape dans un effort pour réduire l’uniformité des séquences connues « appâts » qui entrave d’appel base précise par l’instrument de séquençage et, donc, optimise la séquence unique et informative à chaque lecture. Autres protocoles de contournent ce problème en mettant en commun de nombreuses bibliothèques de 4c-seq8 (12-15) avec appât différentes séquences et/ou des sites de restriction, un volume d’expériences qui ne peut être réalisable par d’autres laboratoires. Les modifications présentées ici laisser un petit nombre d’expériences, des échantillons ou réplique pour être indexé et regroupés en une seule voie.

Protocol

1. les enzymes de Restriction sélection Identifier une région d’intérêt (p. ex.., promoteur du gène, polymorphisme de nucléotides simples (SNP), rehausseur) et obtenir la séquence d’ADN de référentiels comme Centre National pour l’Information de biotechnologie (NCBI). Identifier les enzymes de restriction du candidat (REs) pour la première enzyme de restriction digestion (RE1) qui ne coupent pas au sein de la séquence d’intérêt, qui produisent les extrémités cohésives …

Representative Results

Des kératinocytes humains primaires ont été isolées de prépuces néonatales mis au rebut de 2 – 3, mis en commun et mis en culture dans KSFM complétée avec 30 µg/mL pituitaire bovine extrait, 0.26 ng/mL recombinant humain facteur de croissance épidermique et chlorure de calcium 0,09 mM (ACIC2 ) à 37 ° C, 5 % de dioxyde de carbone. Les cellules étaient divisés en deux flacons, et un ballon a été différencié par l’ajout de CaCl2 à une concentratio…

Discussion

Résultats 4C sont susceptibles de révéler des interactions de la chromatine qui identifient les éléments réglementaires précédemment inconnus et/ou des gènes de cible qui sont importantes dans un contexte biologique spécifique24,25,26. Cependant, les obstacles techniques peuvent limiter les données obtenues de ces expériences. Biais PCR découlant de l’amplification excessive de modèle dans les protocoles de 4 C e…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Ce travail a été soutenu par NIAMS (R01AR065523).

Materials

HindIII NEB R0104S
CviQI NEB R0639S
DNA oligonucleotide primers IDT To be designed by the reader
50 mL conical centrifuge tubes Fisher Scientific 06-443-19
1.7 mL microcentrifuge tubes MidSci AVSS1700
Phosphate buffered saline Thermo Fisher 14190-136
Formaldehyde, methanol free Electron Microscopy Sciences 15710
Nutator VWR 15172-203
Glycine JT Baker 4059-00
Benchtop centrifuge
Refrigerated microcentrifuge
Ethylenediaminetetraacetic acid (EDTA) Sigma-Aldrich ED2SS
20% SDS solution Sigma-Aldrich 05030
Trypan Blue Thermo Fisher 15250061
Glass slides Fisher Scientific 12-550-143
Cover slips VWR 16004-094
Light microscope
Triton X-100 Alfa Aesar A16046
Shaking heat block
2M Tris-HCl Quality Biological 351-048-101
Proteinase K NEB P8107S
Phenol:chloroform:isoamyl alcohol (25:24:1) Sigma-Aldrich P2069
Sodium acetate Sigma-Aldrich M5661
20 mg/mL glycogen Thermo Fisher R0561
Ethanol Fisher Scientific 04-355-223
Nuclease-free water Fisher Scientific MT-46-000-CM
qPCR cycler Thermo Fisher 4453536
qPCR plates Thermo Fisher 4309849
Thermocycler Thermo Fisher 4375786
PCR strip tubes MidSci AVSST-FL
1M Magnesium chloride Quality Biological 351-033-721
Dithiothreotol Sigma-Aldrich 43815
Adenosine triphosphate Sigma-Aldrich A2383
T4 DNA Ligase NEB M0202S
Agarose Sigma-Aldrich A6013
RNase A Thermo Fisher EN0531
Qiaquick PCR purification kit Qiagen 28104
MinElute PCR Purification kit Qiagen 28004
Spectrophotometer
Expand Long Template PCR System Sigma-Aldrich 11681834001
dNTP mix Thermo Fisher R0191
SYBR Green I Sigma-Aldrich S9430
ROX BioRad 172-5858
Sodium chloride Sigma-Aldrich S5886
End-It DNA End-Repair Kit Lucigen ER0720
LigaFast Rapid DNA Ligation System Promega M8221
SYBR Safe Thermo Fisher S33102
Taq Polymerase NEB M0267S
UltraSieve Agarose IBI Scientific IB70054
Qiaquick Gel Extraction Kit Qiagen 28704

References

  1. Dunham, I., et al. An integrated encyclopedia of DNA elements in the human genome. Nature. 489 (7414), 57-74 (2012).
  2. Hoffman, M. M., et al. Integrative annotation of chromatin elements from ENCODE data. Nucleic Acids Research. 41 (2), 827-841 (2013).
  3. Dekker, J., Rippe, K., Dekker, M., Kleckner, N. Capturing Chromosome Conformation. Science. 295 (5558), 1306-1311 (2002).
  4. Sanyal, A., Lajoie, B. R., Jain, G., Dekker, J. The long-range interaction landscape of gene promoters. Nature. 489 (7414), 109-113 (2012).
  5. Li, G., et al. Extensive promoter-centered chromatin interactions provide a topological basis for transcription regulation. Cell. 148 (1-2), 84-98 (2012).
  6. Schmitt, A. D., Hu, M., Ren, B. Genome-wide mapping and analysis of chromosome architecture. Nature Reviews Molecular Cell Biology. 17 (12), 743-755 (2016).
  7. Zhao, Z., et al. Circular chromosome conformation capture (4C) uncovers extensive networks of epigenetically regulated intra- and interchromosomal interactions. Nature genetics. 38 (11), 1341-1347 (2006).
  8. Splinter, E., de Wit, E., van de Werken, H. J. G., Klous, P., de Laat, W. Determining long-range chromatin interactions for selected genomic sites using 4C-seq technology: From fixation to computation. Methods. 58 (3), 221-230 (2012).
  9. Van De Werken, H. J. G., et al. 4C technology: Protocols and data analysis. Methods in Enzymology. 513, (2012).
  10. Brouwer, R. W. W., van den Hout, M. C. G. N., van IJcken, W. F. J., Soler, E., Stadhouders, R. Unbiased Interrogation of 3D Genome Topology Using Chromosome Conformation Capture Coupled to High-Throughput Sequencing (4C-Seq). Eukaryotic Transcriptional and Post-Transcriptional Gene Expression Regulation. , 199-220 (2017).
  11. Matelot, M., Noordermeer, D. Determination of High-Resolution 3D Chromatin Organization Using Circular Chromosome Conformation Capture (4C-seq). Polycomb Group Proteins: Methods and Protocols. , 223-241 (2016).
  12. Gheldof, N., Leleu, M., Noordermeer, D., Rougemont, J., Reymond, A. Detecting Long-Range Chromatin Interactions Using the Chromosome Conformation Capture Sequencing (4C-seq) Method. Gene Regulatory Networks: Methods and Protocols. , 211-225 (2012).
  13. Göndör, A., Rougier, C., Ohlsson, R. High-resolution circular chromosome conformation capture assay. Nature. 3 (2), 303-313 (2008).
  14. Hagège, H., et al. Quantitative analysis of chromosome conformation capture assays (3C-qPCR). Nature. 2 (7), 1722-1733 (2007).
  15. Anand, R. D., Sertil, O., Lowry, C. V. Restriction digestion monitors facilitate plasmid construction and PCR cloning. BioTechniques. 36 (6), 982-985 (2004).
  16. Afgan, E., et al. The Galaxy platform for accessible, reproducible and collaborative biomedical analyses: 2016 update. Nucleic acids research. 44 (W1), W3-W10 (2016).
  17. Li, H., Durbin, R. Fast and accurate long-read alignment with Burrows-Wheeler transform. Bioinformatics. 26 (5), 589-595 (2010).
  18. Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25 (16), 2078-2079 (2009).
  19. Walter, C., Schuetzmann, D., Rosenbauer, F., Dugas, M. Basic4Cseq: An R/Bioconductor package for analyzing 4C-seq data. Bioinformatics. 30 (22), 3268-3269 (2014).
  20. Raviram, R., et al. 4C-ker: A Method to Reproducibly Identify Genome-Wide Interactions Captured by 4C-Seq Experiments. PLoS Computational Biology. 12 (3), (2016).
  21. Klein, F. A., Pakozdi, T., Anders, S., Ghavi-helm, Y., Furlong, E. E. M., Huber, W. FourCSeq: analysis of 4C sequencing data. Bioinformatics. 31 (19), 3085-3091 (2015).
  22. Williams, R. L., et al. fourSig a method for determining chromosomal interactions in 4C-Seq data. Nucleic Acids Research. 42 (8), (2014).
  23. McLean, C. Y., et al. GREAT improves functional interpretation of cis-regulatory regions. Nature Biotechnology. 28 (5), 495-501 (2010).
  24. Stolzenburg, L. R., et al. Regulatory dynamics of 11p13 suggest a role for EHF in modifying CF lung disease severity. Nucleic Acids Research. 45 (15), 8773-8784 (2017).
  25. Meddens, C. A., et al. Systematic analysis of chromatin interactions at disease associated loci links novel candidate genes to inflammatory bowel disease. Genome Biology. 17 (1), 1-15 (2016).
  26. Yeung, J., et al. Transcription factor activity rhythms and tissue-specific chromatin interactions explain circadian gene expression across organs. Genome research. , 207787 (2017).
check_url/kr/58030?article_type=t

Play Video

Cite This Article
Brettmann, E. A., Oh, I. Y., de Guzman Strong, C. High-throughput Identification of Gene Regulatory Sequences Using Next-generation Sequencing of Circular Chromosome Conformation Capture (4C-seq). J. Vis. Exp. (140), e58030, doi:10.3791/58030 (2018).

View Video