Next generation sequencing (NGS) er et stærkt værktøj for genomisk karakterisering, der er begrænset af den høje fejlrate af platform (~0.5–2.0%). Vi beskriver vores metoder til fejl-korrigeret sekventering, der tillader os at imødegå NGS fejlprocent og påvise mutationer på variant allel brøker så sjældne som 0,0001.
Konventionelle næste generation sequencing teknikker (NGS) har tilladt enorme genomisk karakterisering for over et årti. Specifikt, har NGS været brugt til at analysere spektret af klonede mutationer i malignitet. Selv om langt mere effektive end traditionelle Sanger metoder, NGS kæmper med at identificere sjældne klonede og subclonal mutationer på grund af sin høje fejlrate på ~0.5–2.0%. Således standard NGS har en grænse på registrering af mutationer, der er > 0,02 variant allel brøkdel (VAF). Mens den kliniske betydning for mutationer denne sjældne hos patienter uden kendt sygdom er fortsat uklart, patienter behandlet for leukæmi har væsentligt forbedret resultater når residual sygdom er < 0,0001 ved flowcytometri. For at afbøde denne artefactual baggrund af NGS, er talrige metoder blevet udviklet. Her beskriver vi en metode for fejl-korrigeret DNA og RNA sekventering (ECS), der omfatter tagging individuelle molekyler med både en 16 bp tilfældige indeks til korrektion af fejl og en 8 bp patient-specifikke indeks for multiplexing. Vores metode kan finde og spore klonede mutationer på variant allel fraktioner (VAFs) to størrelsesordener lavere end detektionsgrænsen for NGS og så sjældne som 0.0001 VAF.
Som vi alder, udsættelse for mutagener og stokastiske fejl under celledelingen resultere i ophobning af somatiske aberrationer i genomet, og dette ligger til grund for den grundlæggende patogenesen af maligne transformation, neuro-udviklingsmæssige sygdomme, pædiatrisk lidelser og normal aldring1,2. Somatiske mutationer med sygdom-kørsel potentiale er vigtige diagnostiske og prognostiske biomarkører for tidlig detektion og risiko styring3,4,5. For bedre at forstå fysiologisk clonogenesis, er som vil informere kliniske og forskning beslutninger, nøjagtig kvantificering og karakterisering af disse mutationer af primær betydning. Next generation sequencing (NGS) er i øjeblikket brugt til at studere klonede mutationer i heterogene DNA prøver; NGS er dog begrænset til at identificere mutationer på > 0,02 variant allel brøkdel (VAF) — på grund af den iboende fejlrate på 0,5-2,0% af sekventering platforme6,7,8. Som et resultat, kan ikke tracking diagnostisk og prognostically betydelig somatiske varianter på lavere VAF opnås ved hjælp af standard NGS.
For nylig, forskellige metoder er blevet udviklet for at omgå fejlprocenten NGS8,9,10,11. Disse metoder udnytte molekylære tagging, som gør det muligt for fejlkorrektion efter sekvensering. Hvert molekyle eller genomisk fragment i biblioteket sekventering er markeret med en tilfældig unikke molekylære id (UMI) der er specifikke for dette molekyle. (UMIS) velkommen er konstrueret af permutationer af en streng af randomiserede nukleotider (8 – 16 N). En anden prøve-specifik stregkode er også integreret i den arbejdsgang, der gør det muligt for multiplexing flere prøver til samme NGS Sekventeringen køre. PCR-amplifikation udføres på molekylært tagged biblioteket, og efterfølgende biblioteket er sendt til sekvensering. Under bibliotek forberedelse forventes det, at fejl vil blive tilfældigt introduceret til den genomisk fragment under PCR-amplifikation og sekventering8. Hvis du vil fjerne tilfældig rækkefølge for fejl, er rå sekventering læsninger grupperet efter UMI. Artefakter fra sekventering forventes ikke at være til stede i alle læser med samme UMI på den samme genomiske position på grund af stokastiske karakter af indledning, en sand variant vil være trofast forstærkes og sekventeret i alle læser, som deler den samme UMI. Artefakter er bioinformatically fjernet. Her, vi beskriver tre metoder af fejl-korrigeret sekventering (ECS) optimeret i laboratoriet for DNA til at identificere enkelt nucleotid varianter (SNVs) og små indsættelse-sletninger (Indels), og RNA til at lette kvantificering af genekspression nedenfor de NGS fejlgrænseværdi.
Den første metode beskriver en måde at lede efter sjældne somatiske begivenhed ved hjælp af genet specifikke primere designet af forskere. Før bibliotek forberedelse, bør forskere design primere til at målrette fragmenter af interesse. Vi har brugt web-app Primer3 (http://bioinfo.ut.ee/primer3-0.4.0/). Amplikoner af 200 – 250 bp er ideelle til Polymerasekædereaktionen (PCR), da disse vil, når (UMIS) velkommen er blevet indarbejdet, generere overlappende parret ende læser med 150 bp parret ende læser. Optimal primer design betingelser anvendes: Minimum primer størrelse = 19; Optimal primer størrelse = 25; Maksimale primer størrelse = 30; Minimum Tm = 64 ° C; Optimal Tm = 70 ° C; Maksimale Tm = 74 ° C; Maksimale Tm forskel = 5 ° C; Minimumsindholdet af GC = 45; Maksimale GC indhold = 80; Antal tilbage = 20; Maksimalt 3′ enden stabilitet = 100.
I metode 2 beskriver vi en metode kombinerer ECS-DNA-protokollen med Illumina kemi til undersøgelse for klonede SNVs og lille Indels så sjældne som 0.0001 VAF ved hjælp af kommercielt tilgængelige gen paneler, der omfatter hundredvis af amplikoner. Vi har brugt TruSight Myeloid sekventering Panel (Illumina) til vores eksperiment og designet en udvidet panel til at omfatte yderligere gener af interesse for pediatric myeloide sygdomme. Disse paneler har ikke tilbudt unikke molekylære identifikatorer ((UMIS) velkommen), der ville lette fejlkorrektion, så vi har tilføjet vores eget adapter strategi til at disse paneler. ECS bør arbejde lige så godt med nogen andre paneler, der er designet til at berige for gener forbundet med forskellige sygdomme. Efter DNA isolation og efterfølgende kvantitativ bestemmelse fra væv eller prøve af interesse, det anbefales at have mindst 500 ng af stock DNA per eksemplar. Vi rutinemæssigt foretage en enkelt sekventering bibliotek brug 250 ng af DNA for at fange så meget unikke genomisk fragment som muligt for nedstrøms læser de-duplikering og VAF beregning. En valgfri Repliker sekventering bibliotek kan gøres med de resterende 250 ng af DNA. Vi gøre altid to Repliker biblioteker pr. eksemplar, og vi mener kun disse begivenheder fundet uafhængigt i begge replikater som sandt positive. Vi har også implementeret en genomisk holdning-specifikke binomial fejl model for at øge nøjagtigheden af variant kræver4,13.
Endelig vil beskrive vi en metode kobling ECS til RNA sekventering for udskrift kvantificering ved hjælp af off-the-shelf QIAseq målrettet RNA paneler (Qiagen). (UMIS) velkommen kræves for deduplikering og fejlkorrektion er blevet indarbejdet i kits, og forskere kan gøre biblioteker efter fabrikantens anvisninger. Bioinformatically, forskere kan følge rørledningen skitseret for ECS-DNA, som vil blive forklaret i detaljer i afsnittet protokol.
Her viser vi en række fejl-korrigeret sekventering protokoller, der let kan implementeres for at studere mutationer med lav VAFs i forskellige sygdomme. Den vigtigste faktor er iblandingen af (UMIS) velkommen med hvert molekyle før sekventering, som de aktiverer fejlkorrektion af de rå læsninger. De metoder, der beskrives her giver forskere at indarbejde tilpassede (UMIS) velkommen til både kommercielt tilgængelige gen paneler og selv designet gen-specifikke oligos.
NGS standardprotokol til hinder for påvisning af mutationer med VAF under 2% på grund af sekventering fejlrate, og det begrænser anvendelsen af NGS i studier hvor påvisning af sjældne varianter er afgørende. Ved at omgå NGS fejl standardsats, muliggør ECS følsomme påvisning af disse rå varianter. For eksempel er påvisning af patogene mutationer når disse mutationer opstår først (derfor at have lav VAF) bydende nødvendigt at informere tidlig indgriben af sygdom14,15. I leukæmi forskning, påvisning af minimal residual sygdom (resterende leukemic celler efterbehandling) oplyser risiko stratificering og kunne bruges til at informere behandlingsmuligheder på en måde, som binære flow cytometric vurderinger ikke kan. ECS er desuden relevant at opdage cirkulerende tumor nukleinsyre og evaluere metastatisk potentiale i solid tumor patienter ved at vurdere for tilstedeværelse/fravær samt variant byrden af bestemte mutationer, der er særlige kendetegn ved primære tumor16.
Som vist i tabel 1, afhænger magt ved hjælp af binomial fordeling-baseret holdning-specifik fejl model for at kalde varianter i høj grad antallet af sekventeret biblioteker samt dybden af sekventering bruges til at bygge modellen fejl. Robustheden af modellens fejl stiger med højere antal prøver og flere sekventering dybde. Det anbefales at bruge mindst 10 sekventeret prøver med et gennemsnit på fejl-korrigeret Læs dækning af 3000 x pr. prøve for at bygge en fejl profil for hver prøve. Position-specifik tilgang er lignende MAGERI, men i stedet for ved hjælp af en samlet fejlrate for alle seks forskellige substitution typer (A > C/T > G, A > G/T > C, A > T/T > A, C > A/G > T, C > G/G > C C > T/G > A)13, vi model hver substitution uafhængigt i enhver position. For eksempel, en fejlrate på C > T ved en given genomisk position er forskellig fra en anden position. Vores tilgang også tager hensyn en sekventering batch effekt, som den base substitution sats observeret i en sekventering køre kan være forskellig fra en køre. Derfor er det vigtigt at modellere hver position for alle substitution typer, især når prøver fra forskellige sekventering kører sammenlægges til at bygge modellen.
En vigtig overvejelse, når du udformer en ECS eksperiment er den ønskede påvisningsgrænse. Skønheden i NGS undersøgelser er, at de nemt kan skaleres i form af gener/mål af interesse, påvisningsgrænse (dikteret af dybden af sekventering) og antal individer forespørges. For eksempel, hvis forskerne er interesseret i at finde sjældne mutationer i to amplikoner med en påvisningsgrænse af 0,0001, kan de samle maksimalt 75 prøver i et enkelt sekventering køres ved hjælp af MiSeq V2 kemi, som udsender op til 15 millioner lyder (2 amplikoner * 10.000 molekyler * 10 læser til korrektion af fejl * 75 prøver = 15 millioner sekventering læser). Forskere kan variere antallet af molekyler kommer til sekvensering eller antallet af poolede prøver i et enkelt sekventering køre til at justere påvisningsgrænsen. Vores undersøgelser, vi havde til formål at finde mutationer med en påvisningsgrænse af 0.0001 VAF (1:10, 000) ved hjælp af panelet Illumina genet. Vi bruger rutinemæssigt 250 ng af start DNA for at sikre, at tilstrækkelig molekyler er fanget for at opnå den ovennævnte påvisningsgrænse. Forskere kan vælge for at starte med lavere beløb af DNA (50 ng anbefales) hvis den ønskede detektionsgrænsen er > 0.001 VAF.
Som (UMIS) velkommen er vedlagt på i5 indekser, skal sekventering indstillinger ændres i overensstemmelse hermed. For eksempel, vi brugt 16 N (UMIS) velkommen, og sekventering indstillinger var 2 x 144 parrede ende læser, 8 cyklusser af indeks 1 og 16 cyklusser af indeks 2 i stedet for de sædvanlige 8 cyklusser af indeks 2. Stigningen i indeks 2 cyklus opvejes af et fald i det samlede antal cyklusser tildeles læser. Hvis forskere vælger for at bruge 12N (UMIS) velkommen10,17, skal indstillingerne ændres til 12 cyklusser af indeks 2.
Denne UMI-baserede sekventering metode er optimeret til at korrigere for sekventering fejl. Det stadig ikke optimalt i forbindelse med PCR jackpotting, hvilket er et problem for alle forstærkning-baseret metode. Vi udførte runder efter sekvensering og post-Bioinformatik validering ved hjælp af ddPCR, og vi opdage næppe eventuelle falske positiver på grund af PCR jackpotting. Dog anbefales det, at forskere udføre eksperimenter med high fidelity polymerase for at sikre lav forstærkning fejl.
The authors have nothing to disclose.
Vi takke deltagerne i børnenes onkologisk gruppe AAML1531 undersøgelsen og sygeplejerskernes sundhed studere for deres bidrag i form af patientprøver. Dette arbejde blev finansieret af National Institutes of Health (UM1 CA186107, RO1 CA49449 og RO1 CA149445), børnenes Discovery Institute of Washington University og St. Louis children’s Hospital (MC-II-2015-461), og Eli Seth Matthews leukæmi Foundation.
Q5 High Fidelity Hot Start Master Mix | New England BioLabs | M0492S | |
Agencourt AMPure XP | Beckman Coulter | A63880 | |
Qubit dsDNA HS Assay Kit | Thermo Fisher Scientific | Q32854 | |
SYBR Safe DNA Gel Stain | Thermo Fisher Scientific | S33102 | |
Truseq Custom Amplicon Index Kit | Illumina | FC-130-1003 | |
UMI i5 adapter sequences | Integrated DNA Technologies | – | |
NEBNext Ultra End Repair/dA-Tailing Module | New England BioLabs | E7442S | |
NEBNext Ultra II Ligation Module | New England BioLabs | E7595S | |
QX200 ddPCR EvaGreen Supermix | Bio-Rad | 1864034 | |
QX200 Droplet Generation Oil for EvaGreen | Bio-Rad | 1864005 | |
QX200 Droplet Digital PCR System | Bio-Rad | 1864001 | |
ddPCR 96-Well Plates | Bio-Rad | 12001925 | |
DG8 Cartridges for QX200/QX100 Droplet Generator | Bio-Rad | 1864008 | |
DG8 Gaskets for QX200/QX100 Droplet Generator | Bio-Rad | 1863009 | |
Bioanalyzer | Agilent Genomics | G2939BA | |
TapeStation | Agilent Genomics | G2991AA | |
TruSight Myeloid Sequencing Panel | Illumina | FC-130-1010 | |
Bowtie 2 | Johns Hopkins University | – | |
Customized QIAseq Targeted RNA Panel | Qiagen | – | |
Rneasy Plus Mini Kit (50) | Qiagen | 74134 |