Enhanced Reduced Representation Bisulfite Sequencing is a method for the preparation of sequencing libraries for DNA methylation analysis based on restriction enzyme digestion combined with cytosine bisulfite conversion. This protocol requires 50 ng of starting material and yields base pair resolution data at GC-rich genomic regions.
DNA metylering mønster kartleggingen er tungt studert i normale og syke vev. En rekke metoder er etablert for å avhøre de cytosin metylering mønstre i cellene. Redusert representasjon av hele genomet bisulfitt sekvensering ble utviklet for å detektere kvantitative basepar oppløsning cytosin metylering mønstre ved GC-rik genomiske loci. Dette oppnås ved å kombinere bruken av et restriksjonsenzym fulgt av bisulfitt-konvertering. Forbedret Redusert Representasjon Bisulfite Sekvense (ERRBS) øker biologisk relevant genomiske loci dekket og har vært brukt til å profilere cytosin metylering i DNA fra menneske, mus og andre organismer. ERRBS initierer med restriksjonsenzym-nedbrytning av DNA for å generere lavmolekylære fragmenter for bruk i fremstillingen av bibliotek. Disse fragmentene blir underkastet standard bibliotek konstruksjon for neste generasjon sekvensering. Bisulfite konvertering av unmethylated cytosines før den endelige amplificatipå trinnet kan for kvantitativ basen oppløsning av cytosin metylering nivåer i dekket genomisk loci. Protokollen kan være ferdig i løpet av fire dager. Til tross for lav kompleksitet i de tre første baser sekvensert, ERRBS bibliotekene gi høy kvalitet data når du bruker en utpekt sekvense kontroll kjørefelt. Kartlegging og bioinformatikk analyse utføres deretter og gir data som enkelt kan integreres med en rekke genom-wide plattformer. ERRBS kan utnytte små innspill materialmengder som gjør det mulig å behandle kliniske prøver og anvendbar i en rekke forskningssøknader. Videoen produsert demonstrerer kritiske trinn i ERRBS protokollen.
DNA-metylering ved cytosin (5-metylcytosin) er et epigenetisk mark kritisk i pattedyrceller i en rekke biologiske prosesser, inkludert, men ikke begrenset til preging, X-kromosom inaktivering, utvikling og regulering av genekspresjon 1-8. Studiet av DNA metylering mønstre i maligne og andre lidelser har bestemt sykdoms bestemte mønstre og bidratt til forståelsen av sykdoms patogenesen og potensielle biomarkør funn 9-17. Det er mange protokoller som avhøre den epigenome for DNA metylering status. Disse kan deles inn i affinitets-baserte, restriksjonsenzymbasert, og bisulfitt-konverterings-baserte assays som anvender mikromatrise eller sekvenseringsplattformene nedstrøms. Videre er det noen protokoller som bro disse generelle kategorier, inkludert, men ikke begrenset til, Kombinert Bisulfite Restriction Analyse 18 og Redusert Representasjon Bisulfite Sekvensering (RRBS 19). </p>
RRBS ble opprinnelig beskrevet av Meissner et al., 19,20. Protokollen innføres et trinn for å berike GC-rik genomiske regioner fulgt av bisulfitt-sekvensering, noe som resulterte i kvantitativt basepar oppløsning data som er kostnadseffektivt 21,22. GC-rike regioner blir målrettet av MspI (C ^ CGG) restriksjonsenzym, og cytosin metylering løses ved omdannelse av bisulfitt cytosines (deaminering av umodifiserte cytosines til uracil), etterfulgt av polymerasekjedereaksjon (PCR) amplifikasjon. RRBS dekket mesteparten av genet promotorer og CpG øyer i en brøkdel av sekvensering som er nødvendig for et helt genom; imidlertid RRBS hatt begrenset dekning av CpG bredder og andre intergeniske regioner av biologisk relevans. Flere grupper har publisert oppdatert RRBS protokoller siden den opprinnelige rapporten som forbedre metodikken og resulterende dekning av disse genomiske regioner 23-25. Forbedret Redusert Representasjon Bisulfite Sequtene (ERRBS) inkluderer bibliotek forberedelse modifikasjoner og en alternativ justering av data tilnærming 26 når sammenlignet med RRBS. ERRBS resulterte i et høyere antall CPGs representert i data generert og økt dekning av alle genomiske regioner avhørt 26. Denne metoden har vært brukt til å løse DNA metylering mønstre i menneskelig pasient og andre dyr eksemplarer 26-30.
Den ERRBS protokoll beskrevet tilbud informasjon om alle trinnene som trengs for ferdigstillelse og data ble generert ved hjelp av representative menneskelig DNA (prøver ble innhentet fra tidligere rapportert, avidentifiserte pasientprøver 31, og en CD34 + benmargsprøve fra en normal menneskelig donor). Protokollen omfatter en automatisert størrelse utvelgelsesprosess, noe som reduserer behandlingstiden per prøve og tillater for økt nøyaktighet i biblioteket størrelse valg. Protokollen kombinerer en rekke etablerte molekylærbiologiske teknikker. Med høy molekylvekt-DNA blir spaltet wed en metylering-insensitive begrensning enzym (MspI) etterfulgt av end-reparasjon, A-tailing, og ligering av denaturert adaptere. Størrelse valg av GC-rike-fragmenter blir fulgt av bisulfitt-konvertering og PCR-amplifikasjon før sekvensering. Bisulfite konvertering har vært tidligere beskrevet 32 og detaljert gjennomgang av dataanalyse og programmer er utenfor rammen av denne utredningen, men anbefalinger og referanser er inkludert om lesernes bruk. Protokollen kan utføres over fire dager og er mottagelig for liten inngang (50 ng eller mindre) vesentlige beløp. Den protokoll som er beskrevet gir data med høy dekning per CpG side tilstrekkelig ikke bare for differensial metylering stedet og region bestemmelser, men også for epigenetisk polymorfisme deteksjon som beskrevet av Landan, et al., 33.
Protokollen present gir basepar oppløsning data av cytosin metylering på biologisk relevante genomiske regioner. Den protokoll som er skrevet er optimalisert for 50 ng av utgangsmateriale, men den kan tilpasses til å håndtere en rekke inngangsmaterialet (5 ng eller flere) 26. Dette vil kreve justering av noen av protokollen trinn som vist i tabell 6. De ERRBS biblioteker er mottagelig for parede endesekvensering og ytterligere genomisk dekning kan også bli oppnådd ved sekvensering leser mer enn 51 sykluser. Multiplekset sekvensering vil tilby en lavere kostnad protokoll per prøve, men dette vil resultere i redusert dekning per CpG nettstedet representert i dataene (figur 5 og tabell 8), og vil ikke gi tilstrekkelig dybde på dekning for å gjennomføre analyser som krever høy dekning per CpG området (for eksempel som beskrevet av Landan et al. 33). Til slutt, denne protokollen (eller sulfitt-baserte protokollen,l) kan ikke skille mellom metyl-cytosin og hydroksymetyl-cytosin 46,47. Men data generert kan integreres med andre protokollen resulterer 48,49 å avgrense de forskjellige modifikasjoner, og andre cytosin modifikasjoner nylig rapportert 50, bør de være av interesse.
Høy kvalitet-biblioteker vil fremstå som vist i figur 3A-C, og en gang ble samlet for sekvensering gir en kurve som vist på figur 3G (rød kurve) som representerer like molare bidrag fra begge bibliotek fraksjoner. Bibliotek preparat svikt kan resultere fra hvilket som helst trinn under prosedyren. Hvis nedbrutt DNA behandles det vil resultere i biblioteker som ikke er anriket på MspI fragmenter og dermed lav CpG dekning ved hjelp av sekvenseringsparametere er beskrevet i denne protokoll. Hvis et enzym er ikke-funksjonell eller utilsiktet ekskludert fra en av reaksjonene, vil protokollen ikke gi det forventede biblioteket. Hvis ligation reaDette skjer er ineffektivt, adaptere er ved en høyere konsentrasjon enn forventet, og / eller primere konsentrasjonen som brukes er en begrensende reagens for sluttforsterkertrinn, kan biblioteket svikt oppstår. Overflødige adaptere (sett på som en topper på ~ 150 bp i Bioanalyzer resultater, Figur 3D-F) i biblioteket vil også forstyrre sekvensering på grunn av kritikkløs clustering av både biblioteket og overskytende adaptere. Mens et slikt bibliotek kan sekvensere tilsynelatende normalt en vesentlig del av den leser vil være bare adaptersekvenser. Hvis skytende adaptere er observert i et bibliotek, er det best å gjenta biblioteket forberedelse hvis materialet er tilgjengelig ved hjelp av optimal innsatsmateriale på adapteren kvantums forholdstall. Til slutt, for å sikre effektiv PCR forsterkning av bibliotekene, blir de lavere og høyere bibliotek fraksjoner opprettholdes som separate prøver hele bisulfite konvertering og PCR berikelse trinn. Unnlatelse av å gjøre dette gir differensial effektiviteten av utvidelsen under PCR omsetning av høyere og lavere fraksjoner (som sett i figur 3G blå strek) og potensialet for ulik representasjon av den respektive genomiske loci dekket i hvert bibliotek fraksjon under sekvensering. Brukeren kan velge å inkludere en kvantitativ PCR steg umiddelbart etter bisulfit konvertering for videre titrering av optimale PCR-sykluser for å forsterke bibliotekene blir generert.
ERRBS bibliotek forberedelse protokollen har flere viktige skritt i som er anbefalt spesifikke reagenser. Ved slutten reparasjonstrinn, tillater bruk av en fire-nukleotid dNTP blanding for ende-reparasjon av produkter som ikke inneholder CG overheng, slik som de som resulterer fra MspI enzymatisk stjerne aktivitet og skåret DNA-fragmenter som er tilstede i den opprinnelige DNA-prøve. Dette resulterer i forbedret CpG representasjon i resultatene. Ved ligeringstrinnet er det viktig å bruke en høy konsentrasjon ligase (2000000 enheter / ml) og denaturert adaptere for å sikre at ligeringsreaksjonpå er effektiv og at bisulfit konverteringen ikke påvirke adapter sekvenser essensielle for nøyaktig justering av data. Ved PCR-trinnet, ved anvendelse av en polymerase er i stand til å forsterke bisulfitt-behandlede GC-rikt DNA-fragmenter som er nødvendig for høy spesifisitet. Til slutt, for å sikre eliminering av overskytende adaptere og primere, SPRI perle rensing (for eksempel: Agencourt AMPure XP) anbefales i stedet for kolonnebaserte analyser for ligering og PCR produkt isoleringer.
For å generere data av høy kvalitet, er det viktig å sikre effektiv bisulfitt konvertering. Kontrollen presenteres gir brukeren muligheten til å bestemme konvertering effektivitet før sekvensering. Som et alternativ, kan en ikke-human DNA som lambda-DNA brukes som en intern kontroll (spike-in). På grunn av forskjellene i arten, kan denne type av en kontroll være direkte inkludert i nedstrøms-sekvensering (for eksempel som anvendt ved Yu, et al. 34). Imidlertid, dersom piggen-i is utnyttet, kan det ikke brukes til å bestemme konvertering effektivitet før bibliotek sekvensering med mindre entydig forsterket og uavhengig sekvensert før bibliotek sekvensering. Omregningskursene bestemmes er basert på metylering status på ikke-CpG nettsteder. Dette kan ikke være egnet for bruk i sammenheng med høy cytosin metylering i ikke-CpG kontekst (f.eks embryonale stamceller) og parallelle prøver eller andre midler for å vurdere for konvertering effektivitet kan benyttes for dette formål.
Det er et par ting til adressen som er unike for sekvensering av ERRBS biblioteker. De første tre baser av bibliotek fraksjoner sekvensert er nesten jevnt ikke-tilfeldig på grunn av MspI gjenkjennings kuttet område (C ^ CGG; se figur 4B, C). Dette resulterer i at potensialet for betydelige tap av data på grunn av lav kvalitet leser som følge av dårlig klynge lokalisering på tross av tilsynelatende høy klynge tetthet under sekvensering. For å overvinne denne barriere,inkluderer en høy kompleksitet bibliotek i en uavhengig kjørefelt (phix kontroll eller andre bibliotek type) som en dedikert kontroll kjørefelt. Høy kompleksitet biblioteker har ender som inneholder en balansert representasjon av A, C, T og G i de første fire baser sekvensert. Egnede kontrollfelt omfatter bibliotekene som RNA-seq, ChIP-seq, hele genomsekvensering, eller en kontroll som tilbys av sekvensemaskinprodusenten (f.eks phix Kontroll v3). Når betegnet som en kontrollsone for den respektive sekvense løp, kan det tjene som grunnlag for generering matrise som anvendes i løpet av de første fire baser av sekvens, for å detektere klase stillinger. Jo høyere kvalitet leser fanget vil heve den gjennomsnittlige dekning per CpG nettstedet ved 5,2 (n = 4). Alternativt kan dette tekniske problemer også bli overvunnet ved hjelp av en mørk sekvense tilnærming som tidligere beskrevet 23. Andre sekvense kriteriene følger standard prosedyrer per produsentens protokoller. Endelig dekning per CpG chosen for dataanalyse vil bli veiledet av brukeren, og delvis av de biologiske spørsmål av interesse. 10x dekning terskel gir en høy dekning analyse tilnærming, men denne terskelen kan senkes bør det være av interesse.
En full diskusjon av ERRBS dataanalyse er utenfor omfanget av denne artikkelen, men ulikt denaturert cytosines og regioner kan bestemmes ved hjelp av open source verktøy 31,51-53. Flere analyse hensyn og tilnærminger har blitt godt beskrevet 54,55, og leserne oppfordres til å søke i litteraturen for verktøy mest aktuelle for analysen planlagt.
Sammenlignet med andre publiserte metoder, ERRBS tilbyr en fire-dagers-protokollen som når utført som beskrevet Rentene høy forekomst av reproduserbarhet. Det har blitt validert i forhold til gullstandarden MassARRAY EpiTYPER 26, er kostnadseffektivt for høye dekningsdata, og kan tilpasses for forskjellige inngangsmaterialetmengder (gunstige for klinisk utvalgets behandling og andre celletyper med lav frekvens) og sekvense tilnærminger. Det tilbyr basepar oppløsning på biologisk relevant loci og kan brukes i integrerende analyser med andre teknikker profilering genom-wide transkripsjon faktor bindende, kromatin remodellering, epigenetiske merker og andre cytosin modifikasjoner av interesse. ERRBS data anvendelse i slike studier kan bidra til en omfattende molekyl tilnærming og tillate høy dimensjons analyser i studiet av biologiske modeller og human sykdom.
The authors have nothing to disclose.
We thank all the authors of the original ERRBS report. We thank Mame Fall for technical assistance. We acknowledge the Weill Cornell Medical College Epigenomics Core for technical services and assistance. The work was supported by a Sass Foundation Judah Folkman Fellowship, an NCI K08CA169055 and ASH-AMFDP12005 to FGB, NIH R01HG006798 and R01NS076465, funding from the Irma T. Hirschl and Monique Weill-Caulier Charitable Trusts and STARR Consortium (I7-A765) to CEM, and an LLS SCORE grant (7006-13) to AMM.
Name of Reagent/ Equipment | Company | Catalog Number | Comments/Description | URL |
MspI | New England Biolabs | R0106M | 100,000 units/ml | https://www.neb.com/products/r0106-mspi |
NEBuffer 2 | New England Biolabs | B7002S | Reaction buffer for MspI enzyme; protocol step 1.2 | https://www.neb.com/products/b7002-nebuffer-2 |
Phenol solution | Sigma-Aldrich | P4557 | Equilibrated with 10 mM Tris HCl, pH 8.0; see safety and handling instructions at http://www.sigmaaldrich.com/catalog/product/sigma/p4557 | http://www.sigmaaldrich.com/catalog/product/sigma/p4557 |
Chloroform | Sigma-Aldrich | C2432 | See safety and handling instructions at http://www.sigmaaldrich.com/catalog/product/sial/c2432 | http://www.sigmaaldrich.com/catalog/product/sial/c2432 |
Glycogen | Sigma-Aldrich | G1767 | 19-22 mg/ml | http://www.sigmaaldrich.com/catalog/product/sigma/g1767 |
NaOAc | Sigma-Aldrich | S7899 | 3M pH 5.2 | http://www.sigmaaldrich.com/catalog/product/sigma/s7899 |
Ethanol | Sigma-Aldrich | E7023 | 200 proof, for molecular biology | http://www.sigmaaldrich.com/catalog/product/sial/e7023 |
Buffer EB | Qiagen | 19086 | 10 mM Tris-Cl, pH 8.5 | http://www.qiagen.com/products/catalog/lab-essentials-and-accessories/buffer-eb |
tris(hydroxymethyl)aminomethane (Tris) | Sigma-Aldrich | T1503 | prepare a 1M pH 8.5 solution | http://www.sigmaaldrich.com/catalog/product/sigma/t1503 |
Tris- Ethylenediaminetetraacetic acid (TE) | Sigma-Aldrich | T9285 | Dilute to 1X buffer solution per manufacturer's recommendations | http://www.sigmaaldrich.com/catalog/product/sigma/t9285 |
T4 DNA Ligase Reaction Buffer | New England Biolabs | B0202S | 10X concentration | https://www.neb.com/products/b0202-t4-dna-ligase-reaction-buffer |
Deoxynucleotide triphosphate (dNTP) Solution Mix | New England Biolabs | N0447L | 10 mM each nucleotide | https://www.neb.com/products/n0447-deoxynucleotide-dntp-solution-mix |
T4 DNA Polymerase | New England Biolabs | M0203L | 3,000 units/ml | https://www.neb.com/products/m0203-t4-dna-polymerase |
DNA Polymerase I, Large (Klenow) Fragment | New England Biolabs | M0210L | 5,000 units/ml | https://www.neb.com/products/m0210-dna-polymerase-i-large-klenow-fragment |
T4 Polynucleotide Kinase | New England Biolabs | M0201L | 10,000 units/ml | https://www.neb.com/products/m0201-t4-polynucleotide-kinase |
QIAquick PCR Purification Kit | Qiagen | 28104 | Used for DNA product purification in protocol step 2.3 | http://www.qiagen.com/products/catalog/sample-technologies/dna-sample-technologies/dna-cleanup/qiaquick-pcr-purification-kit |
2'-deoxyadenosine 5'-triphosphate (dATP) | Promega | U1201 | 100 mM | http://www.promega.com/products/pcr/routine-pcr/deoxynucleotide-triphosphates-_dntps_/ |
Klenow Fragment (3'→5' exo-) | New England Biolabs | M0212L | 5,000 units/ml | https://www.neb.com/products/m0212-klenow-fragment-3-5-exo |
MinElute PCR Purification Kit | Qiagen | 28004 | Used for DNA product purification in protocol step 3.3 | http://www.qiagen.com/products/catalog/sample-technologies/dna-sample-technologies/dna-cleanup/minelute-pcr-purification-kit |
T4 DNA Ligase | New England Biolabs | M0202M | 2,000,000 units/ml | https://www.neb.com/products/m0202-t4-dna-ligase |
Methylation Adapter Oligo Kit | Illumina | ME-100-0010 | ||
Agencourt AMPure XP | Beckman Coulter | A63881 | Used in protocol sections that implement magnetic bead purification steps (steps 4.3 and 8.2). Equilibrate to room temperature before use | https://www.beckmancoulter.com/wsrportal/wsrportal/wsr/research-and-discovery/products-and-services/nucleic-acid-sample-preparation/agencourt-ampure-xp-pcr-purification/index.htm?i=A63882#2/10//0/25/1/0/asc/2/A63882///0/1//0/ |
Pippin Prep Gel Cassettes, 2% Agarose, dye-free | Sage Science | CDF2010 | with internal standards | http://store.sagescience.com/s.nl/it.A/id.1036/.f |
Certified Low Range Ultra Agarose | Bio-Rad | 161-3106 | http://www.bio-rad.com/en-us/sku/161-3106-certified-low-range-ultra-agarose | |
Tris-Borate-EDTA (TBE) buffer | Sigma-Aldrich | T4415 | http://www.sigmaaldrich.com/catalog/product/sigma/t4415 | |
Ethidium bromide solution | Sigma-Aldrich | E1510 | 10 mg/ml | http://www.sigmaaldrich.com/catalog/product/sigma/e1510 |
50 bp DNA Ladder | NEB | N3236S | https://www.neb.com/products/n3236-50-bp-dna-ladder | |
100 bp DNA Ladder | NEB | N3231S | https://www.neb.com/products/n3231-100-bp-dna-ladder | |
Gel Loading Dye, Orange (6X) | NEB | B7022S | https://www.neb.com/products/b7022-gel-loading-dye-orange-6x | |
Scalpel Blade No. 11 | Fisher Scientific | 3120030 | http://www.fishersci.com/ecomm/servlet/fsproductdetail?position=content&tab=Items&productId=11876776 | |
QIAquick Gel Extraction Kit | Qiagen | 28704 | http://www.qiagen.com/products/catalog/sample-technologies/dna-sample-technologies/dna-cleanup/qiaquick-gel-extraction-kit | |
EZ DNA Methylation Kit | Zymo Research | D5001 | Used in protocol step 6.2 | http://www.zymoresearch.com/epigenetics/dna-methylation/bisulfite-conversion/ez-dna-methylation-kits/ez-dna-methylation-kit |
EZ DNA Methylation-Lightning Kit | Zymo Research | D5030 | Alternative for step 6.2 | http://www.zymoresearch.com/epigenetics/dna-methylation/bisulfite-conversion/ez-dna-methylation-lightning-kit |
Universal Methylated Human DNA Standard | Zymo Research | D5011 | Used as bisulfite conversion control | http://www.zymoresearch.com/epigenetics/dna-methylation/methylated-dna-standards/universal-methylated-human-dna-standard |
FastStart High Fidelity PCR System | Roche | 03553426001 | http://lifescience.roche.com/shop/products/faststart-high-fidelity-pcr-system#tab-0 | |
Qubit dsDNA High Sensitivity Assay Kit | Life Technologies | Q32854 | A fluorescence-based DNA quantitation assay; used in protocol steps 1.1, 9.1 and 10.1 | http://www.lifetechnologies.com/order/catalog/product/Q32854 |
DynaMag-2 Magnet | Life Technologies | 12321D | https://www.lifetechnologies.com/order/catalog/product/12321D | |
High Sensitivity DNA Kit | Agilent Technologies | 5067-4626 | http://www.genomics.agilent.com/en/Bioanalyzer-DNA-RNA-Kits/High-Sensitivity-DNA-Analysis-Kits/?cid=AG-PT-105&tabId=AG-PR-1069 | |
2100 Bioanalyzer | Agilent Technologies | http://www.genomics.agilent.com/en/Bioanalyzer-System/2100-Bioanalyzer-Instruments/?cid=AG-PT-106&tabId=AG-PR-1001 | ||
PhiX Control v3 | Illumina | FC-110-3001 | http://www.illumina.com/products/phix_control_v3.ilmn | |
HiSeq 2500 | Illumina | http://www.illumina.com/systems/hiseq_2500_1500.ilmn | ||
Pippin Prep | Sage Science | http://www.sagescience.com/products/pippin-prep/ | ||
Qubit 2.0 Fluorometer | Life Technologies | Q32872 | http://www.lifetechnologies.com/order/catalog/product/Q32872 | |
TruSeq SR Cluster Kit v3-cBot-HS | Illumina | GD-401-3001 | http://www.illumina.com/products/truseq_sr_cluster_kit_v3-cbot-hs.ilmn | |
TruSeq SBS Kit v3-HS | Illumina | FC-401-3002 | http://www.illumina.com/products/truseq_sbs_kit_v3-hs.ilmn | |
TruSeq RNA Sample prep | Illumina | RS-122-2001 | Barcoded adapters used for multiplexing libraries; See Supplemental file for multiplexing protocol | http:/http://www.illumina.com/products/truseq-rna-access-kit.ilmn |
Microcentrifuge | ||||
Vortex Mixer | ||||
Dry Block Heater | ||||
Thermal Cycler | ||||
Water Bath | ||||
Gel electrophoresis system | ||||
Electrophoresis power supply | ||||
Gel doc | ||||
UV or blue light transilluminator |