Genuttrykk reguleres av interaksjoner av genpromotorer med distale regulatoriske elementer. Her beskriver vi hvor lav inngang Capture Hi-C (liCHi-C) tillater identifisering av disse interaksjonene i sjeldne celletyper, som tidligere ikke var målbare.
Spatiotemporal gentranskripsjon er tett regulert av distale regulatoriske elementer, for eksempel forsterkere og lyddempere, som er avhengige av fysisk nærhet med målgenpromotorene for å kontrollere transkripsjon. Selv om disse regulatoriske elementene er enkle å identifisere, er deres målgener vanskelige å forutsi, siden de fleste av dem er celletypespesifikke og kan skilles av hundrevis av kilobaser i den lineære genomsekvensen, og hopper over andre ikke-målgener. I flere år har Promoter Capture Hi-C (PCHi-C) vært gullstandarden for assosiasjon av distale regulatoriske elementer til deres målgener. Imidlertid er PCHi-C avhengig av tilgjengeligheten av millioner av celler, og forbyr studiet av sjeldne cellepopulasjoner som de som vanligvis oppnås fra primære vev. For å overvinne denne begrensningen har lav inngang Capture Hi-C (liCHi-C), en kostnadseffektiv og tilpassbar metode for å identifisere repertoaret av distale regulatoriske elementer som styrer hvert gen i genomet, blitt utviklet. liCHi-C er avhengig av et lignende eksperimentelt og beregningsorientert rammeverk som PCHi-C, men ved å bruke minimale rørendringer, modifisere reagenskonsentrasjonen og volumene, og bytte eller eliminere trinn, står det for minimalt materialtap under bibliotekkonstruksjon. Samlet muliggjør liCHi-C studiet av genregulering og spatiotemporal genomorganisasjon i sammenheng med utviklingsbiologi og cellulær funksjon.
Temporal genuttrykk driver celledifferensiering og til slutt organismeutvikling, og endringen er nært knyttet til en bred mengde sykdommer 1,2,3,4,5. Gentranskripsjon er fint regulert av virkningen av regulatoriske elementer, som kan klassifiseres som proksimale (dvs. genpromotorer) og distale (f.eks. Forsterkere eller lyddempere), hvorav sistnevnte ofte ligger langt fra deres målgener og fysisk interagerer med dem gjennom kromatinsløyfing for å modulere genuttrykk 6,7,8.
Identifiseringen av distale regulatoriske regioner i genomet er et spørsmål som det er bred enighet om, siden disse regionene har spesifikke histonmodifikasjoner 9,10,11 og inneholder spesifikke transkripsjonsfaktorgjenkjenningsmotiver, som fungerer som rekrutteringsplattformer for dem12,13,14. Dessuten, når det gjelder forsterkere og superforsterkere 15,16, har de også lavt nukleosombelegg 17,18 og transkriberes til ikke-kodende eRNA 19,20.
Ikke desto mindre er hvert distale regulatoriske elements målgener vanskeligere å forutsi. Oftere enn ikke er interaksjoner mellom distale regulatoriske elementer og deres mål celletype og stimulusspesifikke 21,22, spenner over hundrevis av kilobaser, bygger bro over andre gener i hvilken som helst retning 23,24,25, og kan til og med lokaliseres inne i introniske regioner av deres målgen eller andre ikke-intervenerende gener 26,27. Videre kan distale regulatoriske elementer også kontrollere mer enn ett gen samtidig, og omvendt28,29. Denne posisjonelle kompleksiteten hindrer å finne regulatoriske assosiasjoner mellom dem, og derfor forblir de fleste av hvert regulatoriske elements mål i hver celletype ukjente.
I løpet av de siste årene har det vært en betydelig boom i utviklingen av kromosomkonformasjonsfangst (3C) teknikker for å studere kromatininteraksjoner. Den mest brukte av dem, Hi-C, gjør det mulig å generere et kart over alle interaksjonene mellom hvert fragment av en celles genom30. For å oppdage betydelige interaksjoner på restriksjonsfragmentnivået, er Hi-C imidlertid avhengig av ultradyp sekvensering, og forbyr bruken av den til rutinemessig å studere det regulatoriske landskapet til individuelle gener. For å overvinne denne økonomiske begrensningen har flere anrikningsbaserte 3C-teknikker dukket opp, for eksempel ChIA-PET31, HiChIP 32 og dens motstykke HiCuT33 med lav inngang. Disse teknikkene er avhengige av bruk av antistoffer for å berike for genom-brede interaksjoner mediert av et spesifikt protein. Ikke desto mindre er den unike egenskapen til disse 3C-teknikkene også bane for deres anvendelse; Brukere regner med tilgjengeligheten av antistoffer av høy kvalitet for proteinet av interesse og kan ikke sammenligne forhold der bindingen av proteinet er dynamisk.
Promoter Capture Hi-C (PCHi-C) er en annen anrikningsbasert 3C-teknikk som omgår disse begrensningene34,35. Ved å bruke et biotinylert RNA-proberikelsessystem, er PCHi-C i stand til å generere genombrede høyoppløselige biblioteker av genomiske regioner som interagerer med 28 650 human- eller 27 595 musekommenterte genpromotorer, også kjent som promotorinteraktomet. Denne tilnærmingen gjør det mulig å oppdage signifikante langdistanseinteraksjoner ved restriksjonsfragmentnivåoppløsningen til både aktive og inaktive promotorer, og robust sammenligne promotorinteraktomer mellom enhver tilstand uavhengig av dynamikken til histonmodifikasjoner eller proteinbinding. PCHi-C har blitt mye brukt de siste årene for å identifisere promotorinteraktomreorganiseringer under celledifferensiering 36,37, identifisere virkningsmekanismen til transkripsjonsfaktorer38,39, og oppdage nye potensielle gener og veier deregulert i sykdom av ikke-kodende varianter 40,41,42,43,44,45,46,47,48, sammen med nye driver-ikke-kodende mutasjoner49,50. Dessuten, ved bare å modifisere fangstsystemet, kan denne teknikken tilpasses i henhold til det biologiske spørsmålet for å forhøre ethvert interaktom (f.eks. forsterkerinteraktomet 51 eller interaktomet til en samling ikke-kodende endringer41,52).
Imidlertid er PCHi-C avhengig av minst 20 millioner celler for å utføre teknikken, noe som forhindrer studiet av knappe cellepopulasjoner som de som ofte brukes i utviklingsbiologi og kliniske applikasjoner. Av denne grunn har vi utviklet lav inngang Capture Hi-C (liCHi-C), en ny kostnadseffektiv og tilpassbar metode basert på det eksperimentelle rammeverket til PCHi-C for å generere høyoppløselige promotorinteraktomer med lavcelleinngang. Ved å utføre eksperimentet med minimale rørendringer, bytte eller eliminere trinn fra den opprinnelige PCHi-C-protokollen, drastisk redusere reaksjonsvolumer og modifisere reagenskonsentrasjoner, maksimeres bibliotekets kompleksitet og det er mulig å generere biblioteker av høy kvalitet med så lite som 50 000 celler53.
Low input Capture Hi-C (liCHi-C) har blitt benchmarked mot PCHi-C og brukt til å belyse promotorinteraktomomkobling under human hematopoietisk celledifferensiering, oppdage potensielle nye sykdomsassosierte gener og veier deregulert av ikke-kodende endringer, og oppdage kromosomale abnormiteter53. Den trinnvise protokollen og de forskjellige kvalitetskontrollene gjennom teknikken er detaljert her til den endelige generasjonen av bibliotekene og deres beregningsanalyse.
liCHi-C tilbyr muligheten til å generere høyoppløselige promotor-interaktombiblioteker ved hjelp av et lignende eksperimentelt rammeverk fra PCHi-C, men med et sterkt redusert cellenummer. Dette oppnås i stor grad ved å eliminere unødvendige trinn, for eksempel fenolrensing og fjerning av biotin. I den klassiske in-nucleus ligation Hi-C protokoll57 og dens påfølgende derivatteknikk PCHi-C, fjernes biotin fra ikke-ligerte restriksjonsfragmenter for å unngå å trekke ned DNA-fragmenter som…
The authors have nothing to disclose.
Vi takker resten av medlemmene fra Javierre-laboratoriet for tilbakemeldinger på manuskriptet. Vi takker CERCA-programmet, Generalitat de Catalunya og Josep Carreras-stiftelsen for institusjonell støtte. Dette arbeidet ble finansiert av FEDER / det spanske departementet for vitenskap og innovasjon (RTI2018-094788-A-I00), European Hematology Association (4823998) og den spanske foreningen mot kreft (AECC) LABAE21981JAVI. BMJ er finansiert av La Caixa Banking Foundation Junior Leader-prosjektet (LCF / BQ / PI19 / 11690001), LR er finansiert av et AGAUR FI-fellesskap (2019FI-B00017), og LT-D er finansiert av et FPI Fellowship (PRE2019-088005). Vi takker biokjemi og molekylærbiologi PhD-programmet fra Universitat Autònoma de Barcelona for støtten. Ingen av finansiørene var involvert på noe tidspunkt i eksperimentell design eller manuskriptskriving.
0.4 mM Biotin-14-dATP | Invitrogen | 19524-016 | |
0.5 M EDTA pH 8.0 | Invitrogen | AM9260G | |
1 M Tris pH 8.0 | Invitrogen | AM9855G | |
10x NEBuffer 2 | New England Biolabs | B7002S | Referenced as restriction buffer 2 in the manuscript |
10x PBS | Fisher Scientific | BP3994 | |
10x T4 DNA ligase reaction buffer | New England Biolabs | B0202S | |
16% formaldehyde solution (w/v), methanol-free | Thermo Scientific | 28908 | |
20 mg/mL Bovine Serum Albumin | New England Biolabs | B9000S | |
5 M NaCl | Invitrogen | AM9760G | |
5PRIME Phase Lock Gel Light tubes | Qiuantabio | 2302820 | For phenol-chloroform purification in section 4 (DNA purification). Phase Lock Gel tubes are a commercial type of tubes specially designed to maximize DNA recovery after phenol-chloroform purifications while avoiding carryover of contaminants in the organic phase by containing a resin of intermediate density which settles between the organic and aqueous phase and isolates them. PLG tubes should be spun at 12,000 x g for 30 s before use to ensure that the resin is well-placed at the bottom of the tube |
Adapters and PCR primers for library amplification | Integrated DNA Technologies | – | Bought as individual primers with PAGE purification for NGS |
Cell scrappers | Nunc | 179693 | Or any other brand |
Centrifuge (fixed-angle rotor for 1.5 mL tubes) | Any brand | ||
CHiCAGO R package | 1.14.0 | ||
CleanNGS beads | CleanNA | CNGS-0050 | |
dATP, dCTP, dGTP, dTTP | Promega | U120A, U121A, U122A, U123A | Or any other brand |
DNA LoBind tube, 1.5 mL | Eppendorf | 30108051 | |
DNA LoBind tube, 2 mL | Eppendorf | 30108078 | |
DNA polymerase I large (Klenow) fragment 5000 units/mL | New England Biolabs | M0210L | |
Dynabeads MyOne Streptavidin C1 beads | Invitrogen | 65002 | For biotin pull-down of the pre-captured library in section 8 (biotin pull-down) |
Dynabeads MyOne Streptavidin T1 beads | Invitrogen | 65602 | For biotin pull-down of the post-captured library in section 11 (biotin pull-down and PCR amplification) |
DynaMag-2 | Invitrogen | 12321D | Or any other magnet suitable for 1.5 ml tubeL |
Ethanol absolute | VWR | 20821.321 | |
FBS, qualified | Gibco | 10270-106 | Or any other brand |
Glycine | Fisher BioReagents | BP381-1 | |
GlycoBlue Coprecipitant | Invitrogen | AM9515 | Used for DNA coprecipitation in section 4 (DNA purification) |
HiCUP | 0.8.2 | ||
HindIII, 100 U/µL | New England Biolabs | R0104T | |
IGEPAL CA-630 | Sigma-Aldrich | I8896-50ML | |
Klenow EXO- 5000 units/mL | New England Biolabs | M0212L | |
Low-retention filter tips (10 µL, 20 µL, 200 µL and 1000 µL) | ZeroTip | PMT233010, PMT252020, PMT231200, PMT252000 | |
M220 Focused-ultrasonicator | Covaris | 500295 | |
Micro TUBE AFA Fiber Pre-slit snap cap 6 x 16 mm vials | Covaris | 520045 | For sonication in section 6 (sonication) |
NheI-HF, 100 U/µL | New England Biolabs | R3131M | |
Nuclease-free molecular biology grade water | Sigma-Aldrich | W4502 | |
PCR primers for quality controls | Integrated DNA Technologies | – | |
PCR strips and caps | Agilent Technologies | 410022, 401425 | |
Phenol: Chloroform: Isoamyl Alcohol 25:24:1, Saturated with 10 mM Tris, pH 8.0, 1 mM EDTA | Sigma-Aldrich | P3803 | |
Phusion High-Fidelity PCR Master Mix with HF Buffer | New England Biolabs | M0531L | For amplification of the library in sections 9 (dATP-tailing, adapter ligation and PCR amplification) and 11 (biotin pull-down and PCR amplification) |
Protease inhibitor cocktail (EDTA-free) | Roche | 11873580001 | |
Proteinase K, recombinant, PCR grade | Roche | 3115836001 | |
Qubit 1x dsDNA High Sensitivity kit | Invitrogen | Q33230 | For DNA quantification after precipitation in section 4 (DNA purification) |
Qubit assay tubes | Invitrogen | Q32856 | |
rCutsmart buffer | New England Biolabs | B6004S | |
RPMI Medium 1640 1x + GlutaMAX | Gibco | 61870-010 | Or any other brand |
SDS – Solution 10% for molecular biology | PanReac AppliChem | A0676 | |
Sodium acetate pH 5.2 | Sigma-Aldrich | S7899-100ML | |
SureSelect custom 3-5.9 Mb library | Agilent Technologies | 5190-4831 | Custom designed mouse or human capture system, used for the capture |
SureSelect Target Enrichment Box 1 | Agilent Technologies | 5190-8645 | Used for the capture |
SureSelect Target Enrichment Kit ILM PE Full Adapter | Agilent Technologies | 931107 | Used for the capture |
T4 DNA ligase 1 U/µL | Invitrogen | 15224025 | For ligation in section 3 (ligation and decrosslink) |
T4 DNA ligase 2000000/mL | New England Biolabs | M0202T | For ligation in section 9 (dATP-tailing, adapter ligation and PCR amplification) |
T4 DNA polymerase 3000 units/mL | New England Biolabs | M0203L | |
T4 PNK 10000 units/mL | New England Biolabs | M0201L | |
Tapestation 4200 instrument | Agilent Technologies | For automated electrophoresis in section 9 (dATP-tailing, adapter ligation, and PCR amplification) and section 11 (Biotin pull-down and PCR amplification). Any other automated electrophoresis system is valid |
|
Tapestation reagents | Agilent Technologies | 5067-5582, 5067-5583, 5067-5584, 5067-5585, | For automated electrophoresis in section 9 (dATP-tailing, adapter ligation, and PCR amplification) and section 11 (Biotin pull-down and PCR amplification). Any other automated electrophoresis system is valid |
Triton X-100 for molecular biology | PanReac AppliChem | A4975 | |
Tween 20 | Sigma-Aldrich | P9416-50ML |