Enhanced Reduced Representation Bisulfite Sequencing is a method for the preparation of sequencing libraries for DNA methylation analysis based on restriction enzyme digestion combined with cytosine bisulfite conversion. This protocol requires 50 ng of starting material and yields base pair resolution data at GC-rich genomic regions.
DNA-methylering mønster kortlægning er stærkt undersøgt i normale og sygdomsramte væv. En række fremgangsmåder er blevet etableret for at forespørge cytosin mønstre for methylering i celler. Reduceret repræsentation af hele genomet bisulfit sekventering blev udviklet for at detektere kvantitative basepar opløsning cytosin mønstre for methylering ved GC-rig genomisk loci. Dette opnås ved at kombinere brugen af et restriktionsenzym, efterfulgt af omdannelse med bisulfit. Forbedret Reduceret Repræsentation bisulfit sekventering (ERRBS) øger biologisk relevante genomiske loci dækket og har været anvendt til at profilere cytosin-methylering i DNA fra menneske, mus og andre organismer. ERRBS indleder med restriktionsenzymfordøjelse af DNA til generering lavmolekylære fragmenter til brug i biblioteket forberedelse. Disse fragmenter underkastes standard bibliotek konstruktion for næste generation sekventering. Bisulfit konvertering af ikke-methylerede cytosiner før den endelige amplificatipå trin giver mulighed for kvantitativ basis løsning af cytosin methylering niveauer i overdækket genomiske loci. Protokollen kan være afsluttet inden for fire dage. Trods lav kompleksitet i de første tre baser sekventerede, ERRBS biblioteker giver høj kvalitet af data ved brug af en udpeget sekventering kontrol lane. Kortlægning og bioinformatik analyse udføres derefter og giver data, der let kan integreres med en række af genom-dækkende platforme. ERRBS kan udnytte små input materiale mængder gør det muligt at behandle kliniske prøver og gældende menneskelige i en række forskningsansøgninger. Videoen er produceret demonstrerer kritiske trin i ERRBS protokollen.
DNA-methylering ved cytosin (5-methylcytosin) er en epigenetisk varemærke kritisk i pattedyrceller for en række biologiske processer, herunder, men ikke begrænset til prægning, X-kromosom inaktivering, udvikling og regulering af genekspression 1-8. Studiet af DNA methyleringsmønstre i maligne og andre lidelser har bestemt sygdomsspecifikke mønstre og bidraget til forståelsen af sygdommen patogenese og potentielle biomarkør opdagelser 9-17. Der er mange protokoller, forespørge epigenome for methylering af DNA status. Disse kan opdeles i affinitet-baseret, restriktionsenzym-baseret, og omdannelse med bisulfit-assays, der udnytter microarray eller sekventering platforme nedstrøms. Desuden er der et par protokoller broen disse generelle kategorier, herunder, men ikke begrænset til, Kombineret Bisulfite Restriction Analysis 18 og nedsat Repræsentation bisulfit sekventering (RRBS 19). </p>
RRBS blev oprindeligt beskrevet af Meissner et al. 19,20. Protokollen indførte et skridt til at berige GC-rige genomiske regioner efterfulgt af bisulfit sekventering, hvilket resulterede i kvantitativ basepar opløsning data som er omkostningseffektiv 21,22. GC-rige regioner er målrettet af enzymet MspI (C ^ CGG) begrænsning, og cytosin-methylering er løst ved omdannelse med bisulfit af cytosiner (deaminering af umodificerede cytosiner til uracil) efterfulgt af polymerasekædereaktion (PCR) amplifikation. RRBS dækkede størstedelen af genpromotorer og CpG-øer i en brøkdel af sekventering nødvendige for en hele genomet; dog RRBS havde begrænset dækning af CpG kyster og andre intergeniske regioner i biologisk relevans. Flere grupper har offentliggjort opdaterede RRBS protokoller siden den oprindelige rapport, forbedrer metoden og deraf følgende dækning af disse genomiske regioner 23-25. Forbedret Reduceret Repræsentation Bisulfite Sequder lever (ERRBS) indeholder bibliotek forberedelse ændringer og en suppleant tilpasning data tilgang 26 sammenlignet med RRBS. ERRBS resulterede i et højere antal CpG'er repræsenteret i de data, der genereres og øget dækning af alle genomiske regioner forhørt 26. Denne fremgangsmåde er blevet anvendt til at løse DNA methyleringsmønstre i human patient og andre animalske prøver 26-30.
Den ERRBS beskrevne protokol tilbyder detaljeret information om alle nødvendige skridt til færdiggørelse og data blev genereret ved hjælp af repræsentative humant DNA (prøver blev opnået fra tidligere rapporteret, de identificerede patientprøver 31, og et CD34 + knoglemarv prøve fra en normal human donor). Protokollen omfatter en automatiseret størrelse udvælgelsesprocessen, hvilket reducerer behandlingstiden pr prøven og giver mulighed for øget nøjagtighed i biblioteket udvælgelse størrelse. Protokollen kombinerer en række etablerede molekylærbiologiske teknikker. DNA med høj molekylvægt fordøjes wed en methylering-ufølsom restriktionsenzym (MspI) efterfulgt af ende-reparation, A-hale, og ligering af methylerede adaptere. Størrelse udvalg af GC-rige fragmenter efterfølges af bisulfit konvertering og PCR-amplifikation før sekventering. Bisulfit konvertering har været beskrevet tidligere 32 og detaljeret gennemgang af dataanalyse og applikationer er uden for rammerne af dette papir, men anbefalinger og referencer er inkluderet for læsernes brug. Protokollen kan udføres i løbet af fire dage og er modtagelig for lille input (50 ng eller mindre) materielle beløb. Protokollen som beskrevet giver data med høj dækning pr CpG websted tilstrækkelig ikke kun for differentierede bestemmelser methylering stedet og region, men også for epigenetisk polymorfisme detektion som beskrevet af Landan, et al. 33.
Data Protokollen præsenterede udbytter basepar opløsning på cytosin methylering på biologisk relevante genomiske regioner. Protokollen som skrevet er optimeret til 50 ng af udgangsmateriale, men det kan tilpasses til at håndtere en række input materiale (5 ng eller mere) 26. Dette vil kræve justeringer af nogle af protokoltrin som det ses i tabel 6. De ERRBS biblioteker er egnede til parret ende sekventering og yderligere genomisk dækning kan også opnås ved sekventering læser længere end 51 cyklusser. Multipleksede sekventering vil tilbyde en lavere pris protokol per prøve, men dette vil resultere i en reduceret dækning pr CpG websted repræsenteret i data (figur 5 og tabel 8), og vil ikke give tilstrækkelig dybde af dækningen til at udføre analyser, der kræver høj dækning pr CpG sted (fx som beskrevet af Landan et al. 33). Endelig er denne protokol (eller enhver bisulfit-baserede protocol) kan ikke skelne mellem methyl-cytosin og hydroxymethyl-cytosin 46,47. Men de genererede data kan integreres med andre protokol resultater 48,49 at afgrænse de forskellige ændringer, og andre cytosin ændringer nylig rapporteret 50, bør de være af interesse.
Høj kvalitet biblioteker vises som vist i figur 3A-C, og når samlet til sekventering giver et spor som vist i figur 3G (rød spor), der repræsenterer lige molære bidrag fra både bibliotekets fraktioner. Bibliotek fiasko forberedelse kan skyldes ethvert skridt under proceduren. Hvis nedbrudt DNA behandles det vil resultere i biblioteker, der ikke er beriget med MspI fragmenter og dermed lav CpG dækning ved hjælp af sekventering parametre er beskrevet i denne protokol. Hvis et enzym er ikke-funktionelt eller uforvarende udelukket fra en af reaktionerne, vil protokollen ikke gav den forventede biblioteket. Hvis ligering reaktion er ineffektiv, adaptere ved en højere koncentration end forventet, og / eller primerne anvendte koncentration er en begrænsende reagens til de endelige amplifikationstrinnene kan svigt bibliotek forekomme. Overskydende adaptere (ses som en toppe ved ~ 150 bp i Bioanalyzer resultater; Figur 3D-F) i biblioteket vil også forstyrre sekventering på grund af den vilkårlige gruppering af både biblioteket og overskydende adaptere. Mens et sådant bibliotek kan sekventere tilsyneladende normalt, en betydelig del af den læser vil blot være adaptorsekvenser. Hvis overskydende adaptere observeres i et bibliotek, er det bedst at gentage biblioteket præparat, hvis materialet er tilgængelige ved hjælp af optimal råmateriale til adapter mængde nøgletal. Endelig, for at sikre en effektiv PCR-amplifikation af bibliotekerne, er lavere og højere bibliotekets fraktioner opretholdes som separate prøver hele omdannelse med bisulfit og PCR berigelse trin. I modsat fald giver forskellen effektivitet forstærkning under PCR omsætning af højere og lavere fraktioner (som set i figur 3G blå spor) og potentialet for ulige repræsentation af den respektive genomiske loci, der er omfattet i hvert bibliotek fraktion under sekventering. Brugeren kan vælge at omfatte en kvantitativ PCR skridt umiddelbart efter bisulfit konvertering for yderligere titrering af optimale PCR-cyklusser er nødvendige for at forstærke bibliotekerne, der genereres.
ERRBS forberedelse bibliotek protokol har flere vigtige skridt i hvilke specifikke reagenser anbefales. Ved udgangen reparation trin, anvendelse af en fire-nukleotid dNTP mix tillader udgangen reparation af produkter, der ikke indeholder CG overhænget, såsom dem, der skyldes MspI enzymatisk stjerne aktivitet og klippede DNA-fragmenter til stede i den oprindelige DNA-prøve. Dette resulterer i forbedret CpG repræsentation i resultaterne. Ved ligering trin er det vigtigt at anvende en høj koncentration ligase (2.000.000 enheder / ml) og denatureret adaptere at sikre, at ligering Reactier effektiv, og at bisulfit konvertering ikke påvirke adapter sekvenser afgørende for præcis justering af data. Ved PCR trin er nødvendigt for høj specificitet under anvendelse af en polymerase er i stand til at amplificere bisulfit-behandlede GC-rige DNA-fragmenter. Endelig, for at sikre fjernelse af overskydende adaptorer og primere SPRI perle-oprensning (for eksempel: Agencourt AMPure XP) anbefales i stedet kolonne baserede assays til ligering og PCR-produktet isoleringer.
For at generere data af høj kvalitet, er det vigtigt at sikre en effektiv omdannelse med bisulfit. Styringen præsenteres giver brugeren mulighed for at bestemme omdannelseseffektivitet før sekventering. Som et alternativ, kan et ikke-humant DNA, såsom lambda-DNA anvendes som en intern kontrol (spike-in). På grund af forskelle i arten, kan denne type af kontrol direkte inkluderet i nedstrøms sekventering (fx som anvendt af Yu et al., 34). Men hvis spike-in is udnyttet, kan det ikke anvendes til at bestemme virkningsgraden før biblioteket sekventering medmindre entydigt amplificeret og uafhængigt sekventeret før biblioteket sekventering. De satser bestemmes konvertering er baseret på status for methylering til ikke-CpG sites. Det kan ikke være egnet til brug i forbindelse med høje cytosin methylering i ikke-CpG kontekst (f.eks embryonale stamceller) og parallelle prøver eller andre midler til at vurdere for virkningsgraden kan anvendes til dette formål.
Der er et par protester til adressen, der er unikke for sekventering af ERRBS biblioteker. De første tre baser af bibliotekets fraktioner sekventerede er næsten ensartet ikke-tilfældige på grund af MspI anerkendelse kløvningspunkt (C ^ CGG, se figur 4B, C). Dette resulterer i potentialet for betydelige tab af data på grund af lav kvalitet læser som følge af dårlig klynge lokalisering på trods af det store klynge tæthed under sekventering. For at overvinde denne barriere,omfatte en høj kompleksitet bibliotek i en uafhængig Lane (PhiX eller anden bibliotek type) som en dedikeret kontrol lane. Høj kompleksitet biblioteker har ender, der indeholder en ligelig repræsentation af A, C, T og G i de første fire baser sekventeret. Egnede kontrolbaner omfatter biblioteker, såsom RNA-seq, chip-seq, hele genomsekventering, eller en kontrol, der tilbydes af sekventering maskinfabrikanten (f.eks PhiX Kontrol v3). Når der er udpeget som en kontrol vognbane for den pågældende sekventering sigt kan danne grundlag for den matrix generation, som er udnyttet i de første fire baser af sekventering til at opdage klynge positioner. Den højere kvalitet læser fanget vil hæve den gennemsnitlige dækning pr CpG websted med 5,2 (n = 4). Alternativt kan denne tekniske vanskelighed også overvindes ved hjælp af en mørk sekventering fremgangsmåde som tidligere beskrevet 23. Andre sekventering kriterier følger standardprocedurer pr producentens protokoller. Endelig dækning pr CpG cHosen til dataanalyse vil blive styret af brugeren, og delvist af de biologiske spørgsmål af interesse. 10x dækning tærskel giver en høj dækning analyse tilgang dog denne tærskel kan sænkes, bør det være af interesse.
En mere detaljeret gennemgang af ERRBS dataanalyse er uden for rammerne af denne artikel, dog differentielt methylerede cytosiner og regioner kan bestemmes ved hjælp af open source-værktøjer 31,51-53. Yderligere analyse overvejelser og tilgange er blevet godt beskrevet 54,55, og læseren opfordres til at søge i litteraturen for værktøjer mest hensigtsmæssige for analysen planlagt.
Sammenlignet med andre offentliggjorte metoder, ERRBS tilbyder en fire-dages protokol, som når de udføres som beskrevet udbytter høje reproducerbarhed. Det er blevet valideret i forhold til guldstandarden MassARRAY EpiTYPER 26, er omkostningseffektiv for høje data dækning, og kan tilpasses til forskellige input-materialemængder (gunstige for klinisk prøve forarbejdning og andre celletyper af lavfrekvens) og sekventering metoder. Det tilbyder basepar opløsning på biologisk relevant loci og kan bruges i integrativ analyser med andre teknikker profilering genom-dækkende transkriptionsfaktorbindende, kromatin remodeling, epigenetiske mærker og andre cytosin modifikationer af interesse. ERRBS data anvendelse i sådanne undersøgelser kan bidrage til en omfattende molekylær tilgang og mulighed for høj dimensionel analyser i studiet af biologiske modeller og sygdom hos mennesker.
The authors have nothing to disclose.
We thank all the authors of the original ERRBS report. We thank Mame Fall for technical assistance. We acknowledge the Weill Cornell Medical College Epigenomics Core for technical services and assistance. The work was supported by a Sass Foundation Judah Folkman Fellowship, an NCI K08CA169055 and ASH-AMFDP12005 to FGB, NIH R01HG006798 and R01NS076465, funding from the Irma T. Hirschl and Monique Weill-Caulier Charitable Trusts and STARR Consortium (I7-A765) to CEM, and an LLS SCORE grant (7006-13) to AMM.
Name of Reagent/ Equipment | Company | Catalog Number | Comments/Description | URL |
MspI | New England Biolabs | R0106M | 100,000 units/ml | https://www.neb.com/products/r0106-mspi |
NEBuffer 2 | New England Biolabs | B7002S | Reaction buffer for MspI enzyme; protocol step 1.2 | https://www.neb.com/products/b7002-nebuffer-2 |
Phenol solution | Sigma-Aldrich | P4557 | Equilibrated with 10 mM Tris HCl, pH 8.0; see safety and handling instructions at http://www.sigmaaldrich.com/catalog/product/sigma/p4557 | http://www.sigmaaldrich.com/catalog/product/sigma/p4557 |
Chloroform | Sigma-Aldrich | C2432 | See safety and handling instructions at http://www.sigmaaldrich.com/catalog/product/sial/c2432 | http://www.sigmaaldrich.com/catalog/product/sial/c2432 |
Glycogen | Sigma-Aldrich | G1767 | 19-22 mg/ml | http://www.sigmaaldrich.com/catalog/product/sigma/g1767 |
NaOAc | Sigma-Aldrich | S7899 | 3M pH 5.2 | http://www.sigmaaldrich.com/catalog/product/sigma/s7899 |
Ethanol | Sigma-Aldrich | E7023 | 200 proof, for molecular biology | http://www.sigmaaldrich.com/catalog/product/sial/e7023 |
Buffer EB | Qiagen | 19086 | 10 mM Tris-Cl, pH 8.5 | http://www.qiagen.com/products/catalog/lab-essentials-and-accessories/buffer-eb |
tris(hydroxymethyl)aminomethane (Tris) | Sigma-Aldrich | T1503 | prepare a 1M pH 8.5 solution | http://www.sigmaaldrich.com/catalog/product/sigma/t1503 |
Tris- Ethylenediaminetetraacetic acid (TE) | Sigma-Aldrich | T9285 | Dilute to 1X buffer solution per manufacturer's recommendations | http://www.sigmaaldrich.com/catalog/product/sigma/t9285 |
T4 DNA Ligase Reaction Buffer | New England Biolabs | B0202S | 10X concentration | https://www.neb.com/products/b0202-t4-dna-ligase-reaction-buffer |
Deoxynucleotide triphosphate (dNTP) Solution Mix | New England Biolabs | N0447L | 10 mM each nucleotide | https://www.neb.com/products/n0447-deoxynucleotide-dntp-solution-mix |
T4 DNA Polymerase | New England Biolabs | M0203L | 3,000 units/ml | https://www.neb.com/products/m0203-t4-dna-polymerase |
DNA Polymerase I, Large (Klenow) Fragment | New England Biolabs | M0210L | 5,000 units/ml | https://www.neb.com/products/m0210-dna-polymerase-i-large-klenow-fragment |
T4 Polynucleotide Kinase | New England Biolabs | M0201L | 10,000 units/ml | https://www.neb.com/products/m0201-t4-polynucleotide-kinase |
QIAquick PCR Purification Kit | Qiagen | 28104 | Used for DNA product purification in protocol step 2.3 | http://www.qiagen.com/products/catalog/sample-technologies/dna-sample-technologies/dna-cleanup/qiaquick-pcr-purification-kit |
2'-deoxyadenosine 5'-triphosphate (dATP) | Promega | U1201 | 100 mM | http://www.promega.com/products/pcr/routine-pcr/deoxynucleotide-triphosphates-_dntps_/ |
Klenow Fragment (3'→5' exo-) | New England Biolabs | M0212L | 5,000 units/ml | https://www.neb.com/products/m0212-klenow-fragment-3-5-exo |
MinElute PCR Purification Kit | Qiagen | 28004 | Used for DNA product purification in protocol step 3.3 | http://www.qiagen.com/products/catalog/sample-technologies/dna-sample-technologies/dna-cleanup/minelute-pcr-purification-kit |
T4 DNA Ligase | New England Biolabs | M0202M | 2,000,000 units/ml | https://www.neb.com/products/m0202-t4-dna-ligase |
Methylation Adapter Oligo Kit | Illumina | ME-100-0010 | ||
Agencourt AMPure XP | Beckman Coulter | A63881 | Used in protocol sections that implement magnetic bead purification steps (steps 4.3 and 8.2). Equilibrate to room temperature before use | https://www.beckmancoulter.com/wsrportal/wsrportal/wsr/research-and-discovery/products-and-services/nucleic-acid-sample-preparation/agencourt-ampure-xp-pcr-purification/index.htm?i=A63882#2/10//0/25/1/0/asc/2/A63882///0/1//0/ |
Pippin Prep Gel Cassettes, 2% Agarose, dye-free | Sage Science | CDF2010 | with internal standards | http://store.sagescience.com/s.nl/it.A/id.1036/.f |
Certified Low Range Ultra Agarose | Bio-Rad | 161-3106 | http://www.bio-rad.com/en-us/sku/161-3106-certified-low-range-ultra-agarose | |
Tris-Borate-EDTA (TBE) buffer | Sigma-Aldrich | T4415 | http://www.sigmaaldrich.com/catalog/product/sigma/t4415 | |
Ethidium bromide solution | Sigma-Aldrich | E1510 | 10 mg/ml | http://www.sigmaaldrich.com/catalog/product/sigma/e1510 |
50 bp DNA Ladder | NEB | N3236S | https://www.neb.com/products/n3236-50-bp-dna-ladder | |
100 bp DNA Ladder | NEB | N3231S | https://www.neb.com/products/n3231-100-bp-dna-ladder | |
Gel Loading Dye, Orange (6X) | NEB | B7022S | https://www.neb.com/products/b7022-gel-loading-dye-orange-6x | |
Scalpel Blade No. 11 | Fisher Scientific | 3120030 | http://www.fishersci.com/ecomm/servlet/fsproductdetail?position=content&tab=Items&productId=11876776 | |
QIAquick Gel Extraction Kit | Qiagen | 28704 | http://www.qiagen.com/products/catalog/sample-technologies/dna-sample-technologies/dna-cleanup/qiaquick-gel-extraction-kit | |
EZ DNA Methylation Kit | Zymo Research | D5001 | Used in protocol step 6.2 | http://www.zymoresearch.com/epigenetics/dna-methylation/bisulfite-conversion/ez-dna-methylation-kits/ez-dna-methylation-kit |
EZ DNA Methylation-Lightning Kit | Zymo Research | D5030 | Alternative for step 6.2 | http://www.zymoresearch.com/epigenetics/dna-methylation/bisulfite-conversion/ez-dna-methylation-lightning-kit |
Universal Methylated Human DNA Standard | Zymo Research | D5011 | Used as bisulfite conversion control | http://www.zymoresearch.com/epigenetics/dna-methylation/methylated-dna-standards/universal-methylated-human-dna-standard |
FastStart High Fidelity PCR System | Roche | 03553426001 | http://lifescience.roche.com/shop/products/faststart-high-fidelity-pcr-system#tab-0 | |
Qubit dsDNA High Sensitivity Assay Kit | Life Technologies | Q32854 | A fluorescence-based DNA quantitation assay; used in protocol steps 1.1, 9.1 and 10.1 | http://www.lifetechnologies.com/order/catalog/product/Q32854 |
DynaMag-2 Magnet | Life Technologies | 12321D | https://www.lifetechnologies.com/order/catalog/product/12321D | |
High Sensitivity DNA Kit | Agilent Technologies | 5067-4626 | http://www.genomics.agilent.com/en/Bioanalyzer-DNA-RNA-Kits/High-Sensitivity-DNA-Analysis-Kits/?cid=AG-PT-105&tabId=AG-PR-1069 | |
2100 Bioanalyzer | Agilent Technologies | http://www.genomics.agilent.com/en/Bioanalyzer-System/2100-Bioanalyzer-Instruments/?cid=AG-PT-106&tabId=AG-PR-1001 | ||
PhiX Control v3 | Illumina | FC-110-3001 | http://www.illumina.com/products/phix_control_v3.ilmn | |
HiSeq 2500 | Illumina | http://www.illumina.com/systems/hiseq_2500_1500.ilmn | ||
Pippin Prep | Sage Science | http://www.sagescience.com/products/pippin-prep/ | ||
Qubit 2.0 Fluorometer | Life Technologies | Q32872 | http://www.lifetechnologies.com/order/catalog/product/Q32872 | |
TruSeq SR Cluster Kit v3-cBot-HS | Illumina | GD-401-3001 | http://www.illumina.com/products/truseq_sr_cluster_kit_v3-cbot-hs.ilmn | |
TruSeq SBS Kit v3-HS | Illumina | FC-401-3002 | http://www.illumina.com/products/truseq_sbs_kit_v3-hs.ilmn | |
TruSeq RNA Sample prep | Illumina | RS-122-2001 | Barcoded adapters used for multiplexing libraries; See Supplemental file for multiplexing protocol | http:/http://www.illumina.com/products/truseq-rna-access-kit.ilmn |
Microcentrifuge | ||||
Vortex Mixer | ||||
Dry Block Heater | ||||
Thermal Cycler | ||||
Water Bath | ||||
Gel electrophoresis system | ||||
Electrophoresis power supply | ||||
Gel doc | ||||
UV or blue light transilluminator |