Genuttryck regleras av interaktioner mellan genpromotorer med distala reglerande element. Här beskriver vi hur lågt inmatat Capture Hi-C (liCHi-C) möjliggör identifiering av dessa interaktioner i sällsynta celltyper, som tidigare var omätbara.
Spatiotemporal gentranskription regleras tätt av distala reglerande element, såsom förstärkare och ljuddämpare, som förlitar sig på fysisk närhet med sina målgenpromotorer för att kontrollera transkription. Även om dessa reglerande element är lätta att identifiera är deras målgener svåra att förutsäga, eftersom de flesta av dem är celltypspecifika och kan separeras av hundratals kilobaser i den linjära genomsekvensen och hoppa över andra icke-målgener. Under flera år har Promoter Capture Hi-C (PCHi-C) varit guldstandarden för associering av distala reglerande element till deras målgener. PCHi-C förlitar sig emellertid på tillgången på miljontals celler, vilket förbjuder studier av sällsynta cellpopulationer som de som vanligtvis erhålls från primära vävnader. För att övervinna denna begränsning har Capture Hi-C (liCHi-C), en kostnadseffektiv och anpassningsbar metod för att identifiera repertoaren av distala regulatoriska element som styr varje gen i genomet, utvecklats. liCHi-C bygger på ett liknande experimentellt och beräkningsmässigt ramverk som PCHi-C, men genom att använda minimala rörbyten, modifiera reagenskoncentrationen och volymerna och byta eller eliminera steg står det för minimal materialförlust under bibliotekskonstruktionen. Sammantaget möjliggör liCHi-C studier av genreglering och spatiotemporal genomorganisation i samband med utvecklingsbiologi och cellulär funktion.
Temporalt genuttryck driver celldifferentiering och i slutändan organismutveckling, och dess förändring är nära besläktad med en stor mängd sjukdomar 1,2,3,4,5. Gentranskription regleras fint av verkan av reglerande element, som kan klassificeras som proximala (dvs. genpromotorer) och distala (t.ex. förstärkare eller ljuddämpare), varav de senare ofta ligger långt från sina målgener och fysiskt interagerar med dem genom kromatinslingning för att modulera genuttryck 6,7,8.
Identifieringen av distala reglerande regioner i genomet är en fråga som är allmänt accepterad, eftersom dessa regioner har specifika histonmodifieringar 9,10,11 och innehåller specifika transkriptionsfaktorigenkänningsmotiv, som fungerar som rekryteringsplattformar för dem12,13,14. Dessutom, när det gäller förstärkare och superförstärkare 15,16, har de också låg nukleosombeläggning 17,18 och transkriberas till icke-kodande eRNA 19,20.
Ändå är varje distalt reglerande elements målgener svårare att förutsäga. Oftare än inte är interaktioner mellan distala reglerande element och deras mål celltyp- och stimulansspecifika 21,22, spänner över hundratals kilobaser, överbryggar över andra gener i vilken riktning som helst 23,24,25 och kan till och med lokaliseras inom introniska regioner av deras målgen eller andra icke-mellanliggande gener 26,27. Dessutom kan distala reglerande element också styra mer än en gen samtidigt och vice versa28,29. Denna positionskomplexitet hindrar att man identifierar regleringsföreningar mellan dem, och därför förblir de flesta av varje regleringselements mål i varje celltyp okända.
Under de senaste åren har det skett en betydande boom i utvecklingen av kromosomkonformationsfångst (3C) tekniker för att studera kromatininteraktioner. Den mest använda av dem, Hi-C, gör det möjligt att generera en karta över alla interaktioner mellan varje fragment av en cells genom30. Men för att upptäcka signifikanta interaktioner på restriktionsfragmentnivå förlitar sig Hi-C på ultradjup sekvensering, vilket förbjuder dess användning för att rutinmässigt studera det reglerande landskapet för enskilda gener. För att övervinna denna ekonomiska begränsning har flera anrikningsbaserade 3C-tekniker uppstått, såsom ChIA-PET31, HiChIP 32 och dess låginsatsmotsvarighet HiCuT33. Dessa tekniker är beroende av användningen av antikroppar för att anrika för genomomfattande interaktioner medierade av ett specifikt protein. Ändå är den unika egenskapen hos dessa 3C-tekniker också banan för deras tillämpning; Användare räknar med tillgången på högkvalitativa antikroppar för proteinet av intresse och kan inte jämföra förhållanden där bindningen av proteinet är dynamisk.
Promoter Capture Hi-C (PCHi-C) är en annan anrikningsbaserad 3C-teknik som kringgår dessa begränsningar34,35. Genom att använda ett biotinylerat RNA-sondanrikningssystem kan PCHi-C generera genomomfattande högupplösta bibliotek av genomiska regioner som interagerar med 28 650 humana eller 27 595 mus-annoterade genpromotorer, även kända som promotorinteraktomet. Detta tillvägagångssätt gör det möjligt att upptäcka signifikanta långväga interaktioner vid restriktionsfragmentnivåupplösningen för både aktiva och inaktiva promotorer och robust jämföra promotorinteraktomer mellan vilket tillstånd som helst oberoende av dynamiken i histonmodifieringar eller proteinbindning. PCHi-C har använts i stor utsträckning under de senaste åren för att identifiera promotorinteraktomomorganisationer under celldifferentiering 36,37, identifiera verkningsmekanismen för transkriptionsfaktorer38,39 och upptäcka nya potentiella gener och vägar som avregleras vid sjukdom av icke-kodande varianter 40,41,42,43,44,45,46,47,48, tillsammans med nya drivrutinsicke-kodande mutationer49,50. Dessutom, genom att bara modifiera fångstsystemet, kan denna teknik anpassas enligt den biologiska frågan för att förhöra alla interaktomer (t.ex. förstärkaren interactome 51 eller interactome av en samling icke-kodande ändringar41,52).
PCHi-C förlitar sig dock på minst 20 miljoner celler för att utföra tekniken, vilket förhindrar studier av knappa cellpopulationer som de som ofta används i utvecklingsbiologi och kliniska tillämpningar. Av denna anledning har vi utvecklat Capture Hi-C (liCHi-C) med låg inmatning, en ny kostnadseffektiv och anpassningsbar metod baserad på det experimentella ramverket för PCHi-C för att generera högupplösta promotorinteraktomer med lågcellingång. Genom att utföra experimentet med minimala rörbyten, byta eller eliminera steg från det ursprungliga PCHi-C-protokollet, drastiskt minska reaktionsvolymerna och modifiera reagenskoncentrationer, maximeras bibliotekskomplexiteten och det är möjligt att generera högkvalitativa bibliotek med så lite som 50 000 celler53.
Low input Capture Hi-C (liCHi-C) har jämförts med PCHi-C och använts för att belysa promotorinteraktomkoppling under human hematopoetisk celldifferentiering, upptäcka potentiella nya sjukdomsassocierade gener och vägar som avregleras av icke-kodande förändringar och upptäcka kromosomavvikelser53. Steg-för-steg-protokollet och de olika kvalitetskontrollerna genom tekniken beskrivs här fram till den slutliga generationen av biblioteken och deras beräkningsanalys.
liCHi-C erbjuder möjligheten att generera högupplösta promotorinteraktombibliotek med hjälp av ett liknande experimentellt ramverk från PCHi-C men med ett kraftigt reducerat cellantal. Detta uppnås i hög grad genom att eliminera onödiga steg, såsom fenolrening och borttagning av biotin. I det klassiska in-nucleus ligation Hi-C protokollet57 och dess efterföljande derivatteknik PCHi-C avlägsnas biotin från icke-ligerade restriktionsfragment för att undvika att dra ner DNA-fragment som …
The authors have nothing to disclose.
Vi tackar resten av medlemmarna från Javierre-labbet för deras feedback på manuskriptet. Vi tackar CERCA-programmet, Generalitat de Catalunya och Josep Carreras Foundation för institutionellt stöd. Detta arbete finansierades av FEDER/spanska ministeriet för vetenskap och innovation (RTI2018-094788-A-I00), European Hematology Association (4823998) och Spanish Association against Cancer (AECC) LABAE21981JAVI. BMJ finansieras av La Caixa Banking Foundation Junior Leader-projektet (LCF/BQ/PI19/11690001), LR finansieras av ett AGAUR FI-stipendium (2019FI-B00017) och LT-D finansieras av ett FPI-stipendium (PRE2019-088005). Vi tackar forskarutbildningen i biokemi och molekylärbiologi från Universitat Autònoma de Barcelona för sitt stöd. Ingen av finansiärerna var inblandad vid något tillfälle i den experimentella designen eller manuskriptskrivningen.
0.4 mM Biotin-14-dATP | Invitrogen | 19524-016 | |
0.5 M EDTA pH 8.0 | Invitrogen | AM9260G | |
1 M Tris pH 8.0 | Invitrogen | AM9855G | |
10x NEBuffer 2 | New England Biolabs | B7002S | Referenced as restriction buffer 2 in the manuscript |
10x PBS | Fisher Scientific | BP3994 | |
10x T4 DNA ligase reaction buffer | New England Biolabs | B0202S | |
16% formaldehyde solution (w/v), methanol-free | Thermo Scientific | 28908 | |
20 mg/mL Bovine Serum Albumin | New England Biolabs | B9000S | |
5 M NaCl | Invitrogen | AM9760G | |
5PRIME Phase Lock Gel Light tubes | Qiuantabio | 2302820 | For phenol-chloroform purification in section 4 (DNA purification). Phase Lock Gel tubes are a commercial type of tubes specially designed to maximize DNA recovery after phenol-chloroform purifications while avoiding carryover of contaminants in the organic phase by containing a resin of intermediate density which settles between the organic and aqueous phase and isolates them. PLG tubes should be spun at 12,000 x g for 30 s before use to ensure that the resin is well-placed at the bottom of the tube |
Adapters and PCR primers for library amplification | Integrated DNA Technologies | – | Bought as individual primers with PAGE purification for NGS |
Cell scrappers | Nunc | 179693 | Or any other brand |
Centrifuge (fixed-angle rotor for 1.5 mL tubes) | Any brand | ||
CHiCAGO R package | 1.14.0 | ||
CleanNGS beads | CleanNA | CNGS-0050 | |
dATP, dCTP, dGTP, dTTP | Promega | U120A, U121A, U122A, U123A | Or any other brand |
DNA LoBind tube, 1.5 mL | Eppendorf | 30108051 | |
DNA LoBind tube, 2 mL | Eppendorf | 30108078 | |
DNA polymerase I large (Klenow) fragment 5000 units/mL | New England Biolabs | M0210L | |
Dynabeads MyOne Streptavidin C1 beads | Invitrogen | 65002 | For biotin pull-down of the pre-captured library in section 8 (biotin pull-down) |
Dynabeads MyOne Streptavidin T1 beads | Invitrogen | 65602 | For biotin pull-down of the post-captured library in section 11 (biotin pull-down and PCR amplification) |
DynaMag-2 | Invitrogen | 12321D | Or any other magnet suitable for 1.5 ml tubeL |
Ethanol absolute | VWR | 20821.321 | |
FBS, qualified | Gibco | 10270-106 | Or any other brand |
Glycine | Fisher BioReagents | BP381-1 | |
GlycoBlue Coprecipitant | Invitrogen | AM9515 | Used for DNA coprecipitation in section 4 (DNA purification) |
HiCUP | 0.8.2 | ||
HindIII, 100 U/µL | New England Biolabs | R0104T | |
IGEPAL CA-630 | Sigma-Aldrich | I8896-50ML | |
Klenow EXO- 5000 units/mL | New England Biolabs | M0212L | |
Low-retention filter tips (10 µL, 20 µL, 200 µL and 1000 µL) | ZeroTip | PMT233010, PMT252020, PMT231200, PMT252000 | |
M220 Focused-ultrasonicator | Covaris | 500295 | |
Micro TUBE AFA Fiber Pre-slit snap cap 6 x 16 mm vials | Covaris | 520045 | For sonication in section 6 (sonication) |
NheI-HF, 100 U/µL | New England Biolabs | R3131M | |
Nuclease-free molecular biology grade water | Sigma-Aldrich | W4502 | |
PCR primers for quality controls | Integrated DNA Technologies | – | |
PCR strips and caps | Agilent Technologies | 410022, 401425 | |
Phenol: Chloroform: Isoamyl Alcohol 25:24:1, Saturated with 10 mM Tris, pH 8.0, 1 mM EDTA | Sigma-Aldrich | P3803 | |
Phusion High-Fidelity PCR Master Mix with HF Buffer | New England Biolabs | M0531L | For amplification of the library in sections 9 (dATP-tailing, adapter ligation and PCR amplification) and 11 (biotin pull-down and PCR amplification) |
Protease inhibitor cocktail (EDTA-free) | Roche | 11873580001 | |
Proteinase K, recombinant, PCR grade | Roche | 3115836001 | |
Qubit 1x dsDNA High Sensitivity kit | Invitrogen | Q33230 | For DNA quantification after precipitation in section 4 (DNA purification) |
Qubit assay tubes | Invitrogen | Q32856 | |
rCutsmart buffer | New England Biolabs | B6004S | |
RPMI Medium 1640 1x + GlutaMAX | Gibco | 61870-010 | Or any other brand |
SDS – Solution 10% for molecular biology | PanReac AppliChem | A0676 | |
Sodium acetate pH 5.2 | Sigma-Aldrich | S7899-100ML | |
SureSelect custom 3-5.9 Mb library | Agilent Technologies | 5190-4831 | Custom designed mouse or human capture system, used for the capture |
SureSelect Target Enrichment Box 1 | Agilent Technologies | 5190-8645 | Used for the capture |
SureSelect Target Enrichment Kit ILM PE Full Adapter | Agilent Technologies | 931107 | Used for the capture |
T4 DNA ligase 1 U/µL | Invitrogen | 15224025 | For ligation in section 3 (ligation and decrosslink) |
T4 DNA ligase 2000000/mL | New England Biolabs | M0202T | For ligation in section 9 (dATP-tailing, adapter ligation and PCR amplification) |
T4 DNA polymerase 3000 units/mL | New England Biolabs | M0203L | |
T4 PNK 10000 units/mL | New England Biolabs | M0201L | |
Tapestation 4200 instrument | Agilent Technologies | For automated electrophoresis in section 9 (dATP-tailing, adapter ligation, and PCR amplification) and section 11 (Biotin pull-down and PCR amplification). Any other automated electrophoresis system is valid |
|
Tapestation reagents | Agilent Technologies | 5067-5582, 5067-5583, 5067-5584, 5067-5585, | For automated electrophoresis in section 9 (dATP-tailing, adapter ligation, and PCR amplification) and section 11 (Biotin pull-down and PCR amplification). Any other automated electrophoresis system is valid |
Triton X-100 for molecular biology | PanReac AppliChem | A4975 | |
Tween 20 | Sigma-Aldrich | P9416-50ML |