Her præsenterer vi en tilpasning af kromosomkonformationsfangstteknikken (3C) i detaljer med vægt på bachelorinddragelse og læring.
Kromosom konformation capture (3C) er et kraftfuldt værktøj, der har skabt en familie af lignende teknikker (fx Hi-C, 4C og 5C, her benævnt 3C teknikker), der giver detaljerede oplysninger om den tredimensionelle organisation af kromatin. 3C-teknikkerne er blevet brugt i en lang række undersøgelser, fra overvågning af ændringer i kromatinorganisation i kræftceller til identifikation af forstærkerkontakter foretaget med genpromotorer. Mens mange af de undersøgelser, der bruger disse teknikker, stiller store genom-dækkende spørgsmål med indviklede prøvetyper (dvs. enkeltcelleanalyse), er det, der ofte går tabt, at 3C-teknikkerne er baseret på grundlæggende molekylærbiologiske metoder, der kan anvendes til en bred vifte af undersøgelser. Ved at behandle tæt fokuserede spørgsmål om kromatinorganisation kan denne banebrydende teknik bruges til at forbedre bachelorforsknings- og undervisningslaboratorieoplevelsen. Dette papir præsenterer en 3C-protokol og giver tilpasninger og fokuspunkter til implementering på primært bachelorinstitutioner i bachelorforskning og undervisningserfaringer.
En organismes genom indeholder ikke kun alle de gener, der kræves for funktion, men også alle instruktioner om, hvordan og hvornår de skal bruges. Dette gør regulering af adgangen til genomet til en af cellens vigtigste funktioner. Der er mange mekanismer til at kontrollere genfunktionen; På sit basisniveau kommer genregulering imidlertid ned til regulatoriske transkriptionsfaktorers evne (transfaktorer) til at binde til deres specifikke DNA-sekvenser (cis-regulerende sekvenser). Dette er ikke en medfødt evne; I stedet styres det af organisationen / strukturen af genomet i kernen, som styrer tilgængeligheden / eksponeringen af de cis-regulerende sekvenser for transfaktorerne 1,2,3. Hvis transfaktorerne ikke kan finde deres cis-regulerende sekvenser, kan transfaktorerne ikke udføre deres regulatoriske opgaver. Dette har gjort forståelsen af, hvordan genomer er organiseret i kernen, til en vigtig kilde til undersøgelse.
Det er almindeligt accepteret, at eukaryote kromosomer i kernen under interfase optager deres eget domæne forankret til den nukleare lamina og nukleare matrix (figur 1), hvilket gør kromosomet mere som et stykke pizza snarere end en nudel på en tallerken spaghetti. Kromosomer kondenseres delvist af protein-DNA-interaktioner (kromatin), der vrider og sløjfer dele af kromosomet. Gennem elektronmikroskopi, tredimensionel DNA-fluorescens in situ-hybridisering (FISH) og DNA-mærkningsteknikker (dvs. fluorescerende og kunstig DNA-methylering) har inaktive kromatindomæner vist sig at være pakket tæt langs den nukleare periferi 4,5,6, mens dele af aktivt, mindre kondenseret kromatin findes i det indre af kernen 7,8,9, 10. Disse eksperimenter giver et vidvinkelbillede af kromosomdynamikken, men gør lidt for at fange de ændringer, der forekommer lokalt omkring genpromotorerne observeret i DNase11,12 og nukleosom13,14,15 undersøgelser.
Nøglen til at låse op for kromatindynamik med højere opløsning var formuleringen af 3D-kromosomkortlægningsteknikken, 3C. Selve 3C-teknikken består af fire hovedtrin: tværbinding af kromatin, kromatinfordøjelse ved restriktionsenzymer, kromatinligering og DNA-oprensning (figur 2). De nye kunstige DNA-fragmenter, der genereres ved denne proces, kan derefter karakteriseres for at afsløre den tætte fysiske sammenhæng mellem lineært fjerne stykker DNA16. 3C-teknikken blev grundlaget for oprettelsen af flere spin-off-teknikker, der udnytter de indledende trin i 3C til at stille bredere genom-dækkende spørgsmål (f.eks. Hi-C, 4C, ChIP-C). Denne familie af 3C-teknikker har identificeret, at kromosomer er organiseret i flere diskrete enheder kaldet topologisk associerede domæner (TAD’er). TAD’er er kodet i genomet og defineres af kromatinsløjfer flankeret af ikke-loopede grænser16,17,18,19. TAD-grænserne opretholdes af to evolutionært bevarede og allestedsnærværende faktorer, herunder CCCT-bindingsfaktor (CTCF) og kohæsion, som forhindrer sløjfer inden for separate TAD’er i at interagere16,20. Sløjferne formidles af transfaktorernes interaktion med deres regulatoriske sekvenser samt CTCF og samhørighed21.
Selvom mange undersøgelser, der bruger 3C-teknologier, stiller brede genom-dækkende spørgsmål og anvender komplicerede prøveindsamlingsteknikker, er formuleringen af 3C-teknikken baseret på grundlæggende molekylærbiologiske teknikker. Dette gør 3C spændende til implementering i både bachelorforskning og undervisningslaboratorier. 3C-teknikken kan anvendes til mindre fokuserede spørgsmål og er i sagens natur fleksibel til at skalere op eller ned (enkeltgener22, kromosomer16 og / eller genomer18) afhængigt af fokus og retning af de stillede spørgsmål. Denne teknik er også blevet anvendt på en bred vifte af modelsystemer 7,16,19,23 og har vist sig at være alsidig i brugen. Dette gør 3C til en fremragende teknik for studerende, idet eleverne kan få erfaring med almindelige molekylærbiologiske teknikker, samtidig med at de får værdifuld erfaring med at besvare rettede spørgsmål.
Her præsenteres en tilpasset protokol til 3C-biblioteksforberedelse baseret på tidligere offentliggjorte protokoller24,25,26,27. Denne protokol er optimeret til ca. 1 × 107 celler, selvom den har genereret 3C-biblioteker med så lidt som 1 × 105 celler. Denne protokol har vist sig at være alsidig og er blevet brugt til at generere 3C-biblioteker fra zebrafiskembryoner, zebrafiskcellelinjer og ung-voksen (YA) Caenorhabditis elegans (rundorm). Protokollen bør også være hensigtsmæssig for cellelinjer hos pattedyr og, med yderligere tilpasning, gær.
Målet med disse tilpasninger er at gøre 3C mere tilgængelig for studerende. Der er sørget for at bruge teknikker, der ligner dem, der kan opnås i et bachelorundervisningslaboratorium. 3C-teknikken giver mange læringsmuligheder for studerende at lære grundlæggende molekylærbiologiske teknikker, der vil gavne deres udvikling på bænken, i klasseværelset og i deres bestræbelser efter eksamen.
3C er en kraftfuld teknik, der er forankret i grundlæggende molekylære teknikker. Det er dette fundament af grundlæggende værktøjer, der gør 3C til en så spændende teknik at bruge med studerende. Med så mange nylige undersøgelser, der observerer kromatindynamik i så bred skala, har brugen af disse resultater til at udtænke et snævert fokuseret eksperiment på et enkelt gen eller genomisk region potentialet til at skabe et unikt og virkningsfuldt eksperiment inden for bachelorforskning. Ofte betragtes eksperimenter som disse som for avancerede til studerende, men med omhyggelig planlægning er de let opnåelige. Det er vigtigt at bemærke, at analyserne designet til at undersøge kromatinforbindelserne fanget af 3C-biblioteket kan variere fra semikvantitativ endepunkts-PCR til helgenomsekventering. Faktisk blev data fra det første 3C-papir16 genereret fra qPCR. Denne brede vifte af assays kan alle bruges, fordi alle 3C-teknologier producerer det samme produkt – et bibliotek af DNA-fragmenter, der repræsenterer 3D-forbindelser i kernen.
Præsenteret her er en tilpasning af en mere fleksibel og imødekommende protokol, der passer bedre til bachelorforskere. De pauseperioder, der er anført ovenfor, indebærer forsinkelser natten over; Disse pauser kan dog strække sig over weekender og i tilfælde af celler og kerner i uger. Den mest afgørende overvejelse er, hvornår arbejdet bliver gjort. Ofte i protokoller er der tidsfølsomme trin, når pause ikke er en mulighed. Uden for nogle få punkter (dag 1 og dag 2) er der mange steder at stoppe og fryse prøven. Disse er kritiske, når man arbejder med studerende, hvor tidsplanerne og timingerne for laboratoriearbejde skal være fleksible. Ud over at konstruere disse stop i protokollen, opfordres studerende til at arbejde parvis eller endda små grupper på tre eller fire. Grupper fungerer godt for denne protokol, da eleverne kan støtte hinanden og oprette et kammeratsystem, så alle arbejder sikkert. Laboratoriearbejde er også sjovere med andre involverede. Med grupper kan eleverne også arbejde på en række spørgsmål med fokus på organisering af kromatin, mens de stadig udfører den samme protokol. Selv mens eleverne arbejder på separate projekter, forbinder protokollen således deres indsats, og på grund af dette kan de støtte hinanden.
Andre tilpasninger er beregnet til at omgå det faktum, at visse specialiserede værktøjer og udstyr ikke nødvendigvis findes i alle bachelorinstitutioner. Disse stykker udstyr omfatter, men er ikke begrænset til, qPCR-termocyklister, geldokumentationssystemer og nanovolumenspektrometre. Faktisk er disse stykker udstyr praktisk, men er ikke et krav. Her beskrives den klassiske metode til 3C også i primerdesigndelen; Dette indebærer at identificere et genomisk sted af interesse og ud fra det vurdere andre genomiske loci for kromatinkontaktpunkter længere væk. Denne teknik fungerer også godt, hvis der bruges et publiceret datasæt, f.eks. et datasæt, der bruger Hi-C, hvor kendte positive (forbindende) og negative (ikke-forbindende) loci identificeres. Design af eksperimenter ved hjælp af disse offentliggjorte datasæt er en anden stor tilpasning til undervisningslaboratorier, da chancen for en vellykket identifikation af kromatinforbindelser normalt er større. Derudover kan forskningsartiklen diskuteres i klassen og bruges som reference.
Denne protokol bruger en modificeret qPCR-tilgang til at visualisere 3C-produktdannelsen. Kontrol er afgørende for 3C-teknikkens succes. Hvert eksperiment bruger både prøvekontroller og primerkontroller til at bestemme afslutningen af 3C-proceduren. Prøvekontrollerne omfatter en ufordøjet kontrol (genomisk DNA) og fordøjet kontrol. Den ufordøjede kontrol bestemmer basislinjesignalet for primersættene og bruges sammen med den tværbundne fordøjelseskontrol til at bestemme fordøjelseseffektiviteten Det forventes, at der vil være et fald i produktet for eventuelle primere, der er rettet over et restriktionssted. Sammenligning af denne værdi med den ufordøjede kontrol giver en indikation af, hvor godt prøven blev fordøjet.
Primere til PCR inkluderer en kontrolprimer og testprimere. Kontrolprimeren er et primersæt, der er nær det genomiske område, der analyseres, og indeholder ikke et restriktionssted. Dette giver basislinjen til bestemmelse af overflod af testprimerens PCR-produkter. Testprimere er fremadgående og omvendte primere, der flankerer et restriktionssted for et bestemt genomisk sted af interesse (figur 3). Reaktioner ved hjælp af disse primersæt sammenlignes for at bestemme fordøjelseseffektiviteten, da produktmængden skal falde, hvis begrænsningsstedet er blevet skåret. Ved bestemmelse af kromatinorganisationen parres en testprimer fra et locus med en anden testprimer fra et andet genomisk locus for at bestemme, om disse to loci er tæt på hinanden i 3D-rum. I så fald er forventningen, at et PCR-produkt kun findes ved hjælp af 3C-prøven som skabelon.
Det er vigtigt at bemærke, at selv validerede primere har tendens til at svigte (figur 4: r14 primersæt). Derudover identificeres PCR-produkter ofte i kontrolreaktioner og i reaktioner, hvor en kromatinforbindelse ikke forudsiges (såsom den fordøjede kontrol, da den ikke er ligeret). Disse forekomster sekventeres og mislykkes enten Sanger QC eller returnerer uden en defineret sekvens (figur 5). Derudover genererer traditionelle 3C-eksperimenter en “kontrolskabelon”, en ikke-tværbundet, fordøjet og ligeret DNA-prøve, som repræsenterer alle mulige ligerede fragmenter, der kan produceres med en given mængde DNA. “Kontrolskabelonen” spiller en vigtig rolle i sammenligningen af intensiteterne af qPCR-signaler mellem to genomiske loci for at afgøre, om signalet repræsenterer en sand interaktion eller blot en tilfældig forening. Oprettelse af en “kontrolskabelon” kan være problematisk, da en stor del af kromatinet, der analyseres, skal fanges i form af et kunstigt kromosom og behandles sammen med 3C-prøverne. Sikring af en sådan konstruktion er muligvis ikke mulig, og oprettelse af en kan være uden for rammerne af et semesterprojekt. På grund af disse vanskeligheder foreslår vi at bruge en kontrolprimer. Kontrolprimeren erstatter ikke al funktionaliteten i “kontrolskabelonen”, men giver stadig mulighed for at analysere dataene for at foretage “tilstedeværelse” eller “fravær” -bestemmelser.
Når du udfører qPCR, er det vigtigt at bruge lige store mængder af prøven. Dette bør bestemmes, selv om der anvendes et nanospektrofotometer, såsom et nanodrop, ved at generere en standardkurve fra genomisk DNA med en kendt koncentration og tilpasse 3C-prøverne til denne linje. Disse mængder bør registreres og anvendes i efterfølgende PCR’er. Kvaliteten af PCR-reaktionen er også vigtig. Da PCR kører i qPCR, måles produktmængden ved hjælp af fluorescens og registreres. Denne optagelse er tilgængelig i forstærkningsplottet. Når programmet er færdigt, er det vigtigt at kontrollere forstærkningsplottet og sikre, at reaktionerne (bortset fra kontrolelementerne uden skabelon) har tre faser: en basislinje, en eksponentiel og en plateau/mætningsfase. Det er vigtigt at kontrollere, at reaktionerne har en eksponentiel fase, især for fastsættelse af tærsklen (se nedenfor). For serielt fortyndede prøver bør der desuden ske et skift i Ct-værdier, der er i overensstemmelse med fortyndingen af prøven (den højeste koncentration vil have de laveste Ct-værdier, mens den laveste koncentration vil have de højeste Ct-værdier). Prøver, der ikke afspejler denne ændring i amplifikationsplottet, kræver en ny fortynding eller indikerer et større problem med 3C-prøvedannelsen. Endelig, mens standardkurven genereres, beregner PCR-softwaren PCR-effektiviteten ogR2-værdien . PCR-effektiviteten skal være større end 90%, ogR2-værdien skal være større end 0,99. Hvis en af disse betingelser ikke er opfyldt, er det sandsynligt, at der er noget galt med prøven eller PCR-primerne.
Post qPCR kan den procentvise fordøjelse og tilstedeværelsen af 3C-interaktioner beregnes ved hjælp af qPCR Ct for hver reaktion. For at bestemme disse skal tærsklen for PCR-reaktionen først indstilles. Dette gøres normalt ved hjælp af den software, der følger med qPCR-maskinen. Indstilling af tærsklen definerer koncentrationen af PCR-produkt, der vil blive brugt til at sammenligne prøvens Ct-værdier. Tærsklen bør gennemskære amplifikationskurverne for PCR-reaktionerne i amplifikationsfasens eksponentielle fase. Kun PCR-reaktioner med eksponentiel amplifikation kan sammenlignes (i dette tilfælde kontrolprimerne og testprimerreaktionerne), da dette er den eneste måde at sikre, at reaktionerne forstærker DNA med samme hastighed og kan sammenlignes trofast. Ved analyse af 3C-graferne identificeres betinget positive reaktioner som dem med mere produkt over kontrolprøverne, genomisk kontrol og fordøjelseskontrol (figur 4B). Disse prøver skal dog valideres yderligere ved hjælp af Sanger-sekventering efter gelrensning af PCR-produktet.
Efter Sanger-sekventering kan prøver, der passerer QC, analyseres ved hjælp af Blat. Målet med denne analyse er at bestemme, om prøven har sekvensen af begge målgenomiske loci, der flankerer restriktionsstedet (DpnII i tilfælde af denne protokol). Hvis begge sekvenser identificeres, kan 3C-fragmentet betragtes som valideret. Hvis resultaterne af Blat ikke returnerer den forventede sekvens, kan dette indikere, at en eller begge primere ikke er optimale, hvilket resulterer i et falsk positivt qPCR-resultat. Sporingsfilerne for de falsk positive prøver vil have udefinerede basetoppe, og Seq-rapporterne indeholder for det meste “n”-basiskald.
Sanger-validering er afgørende, da falske positiver fra kunstig PCR-produktdannelse er mulige. Disse falske positiver kan identificeres, når sekventeringsprodukterne ikke har den forventede målsekvens eller et DpnII-sted, der er karakteristisk for et korrekt 3C-fragment (figur 5). Sekventering af PCR-fragmenterne giver også et andet datapunkt for eksperimentet og viser eleverne, at 3C-teknikken identificerer fjerne genomiske loci, der kommer sammen i 3D-rum i kernerne.
3C-teknikken giver et væld af grundlæggende molekylære teknikker til studerende i en fleksibel, ligetil procedure. Denne 3C-teknik er også et udgangspunkt for de andre 3C-teknikker, der inkorporerer næste generations sekventering (NGS). Disse typer eksperimenter kan udsætte studerende for vigtige aspekter af bioinformatik og er forankret i de grundlæggende principper, der er skitseret her. Undergraduate erfaring og engagement er nøglen til deres succes og udvikling som unge forskere. Ved at give disse muligheder kan bachelorer styrke deres forståelse af grundlæggende principper, samtidig med at de opbygger deres tillid til at tackle banebrydende teknikker og spørgsmål.
The authors have nothing to disclose.
Dette arbejde blev delvist støttet af Rhode Island Institutional Development Award (IDeA) Network of Biomedical Research Excellence fra National Institute of General Medical Sciences ved National Institutes of Health under bevillingsnummer P20GM103430 og Bryant Center of Health and Behavioral Sciences.
37% Formaldehyde | Millapore-Sigma | F8775 | |
100% Ethanol | Millapore-Sigma | E7023 | |
CaCl2 | MP Biomedical | 215350280 | |
chloroform | Millapore-Sigma | C0549 | |
cOmplete, EDTA-free Protease Inhibitor Cocktail | Millapore-Sigma | COEDTAF-RO | mixed to 50x in water. Diluted to 1x in Sucrose buffer and GB buffer fresh |
Dithiothreitol (DTT) | Millapore-Sigma | D0632 | 1 M stock diluted to 500 µM in Sucrose buffer and GB buffer fresh |
DpnII | NEB | R0543M | |
Glycerol | Millapore-Sigma | G9012 | |
glycine | Millapore-Sigma | G8898 | |
glycogen | Millapore-Sigma | 10901393001 | |
HEPES | Millapore-Sigma | H3375 | |
KCl | Millapore-Sigma | P3911 | |
KH2PO4 | Millapore-Sigma | P5655 | |
methyl green pyronin | Millapore-Sigma | HT70116 | |
MgAc2 | Thermoscientific | 1222530 | |
Na2HPO4 | Millapore-Sigma | S5136 | |
NaCl | Millapore-Sigma | S9888 | |
phenol-chloroform | Millapore-Sigma | P3803 | |
Pronase | Millapore-Sigma | 11459643001 | |
Proteinase K | IBI Scientific | IB05406 | |
qPCR Ready mix (Phire Taq etc) | Millapore-Sigma | KCQS07 | |
RNase A | Millapore-Sigma | R6148 | |
Sodium Acetate | Millapore-Sigma | S2889 | |
sodium dodecyl sulfate (SDS) | Millapore-Sigma | L3771 | |
Sucrose | Millapore-Sigma | S0389 | |
T4 DNA Ligase | Promega | M1804 | |
Tris-HCl | Millapore-Sigma | 108319 | |
Triton X-100 | Millapore-Sigma | T9284 | |
Trypsin-EDTA | Millapore-Sigma | T4049 |