Rare Event Detection Using Error-corrected DNA and RNA Sequencing

Wing H. Wong; R. Spencer Tong; Andrew L. Young; Todd E. Druley

doi:10.3791/57509

JoVE Journal > Genetics

유전학

Sjælden begivenhed registrering ved hjælp af fejl-korrigeret DNA og RNA sekventering

Published: August 03, 2018

doi:

10.3791/57509

Wing H. Wong*^1,2, R. Spencer Tong*^1,2, Andrew L. Young², Todd E. Druley²

¹Department of Pediatrics, Division of Hematology and Oncology,Washington University School of Medicine, ²Center for Genome Sciences and Systems Biology,Washington University School of Medicine

Summary

Next generation sequencing (NGS) er et stærkt værktøj for genomisk karakterisering, der er begrænset af den høje fejlrate af platform (~0.5–2.0%). Vi beskriver vores metoder til fejl-korrigeret sekventering, der tillader os at imødegå NGS fejlprocent og påvise mutationer på variant allel brøker så sjældne som 0,0001.

Abstract

Konventionelle næste generation sequencing teknikker (NGS) har tilladt enorme genomisk karakterisering for over et årti. Specifikt, har NGS været brugt til at analysere spektret af klonede mutationer i malignitet. Selv om langt mere effektive end traditionelle Sanger metoder, NGS kæmper med at identificere sjældne klonede og subclonal mutationer på grund af sin høje fejlrate på ~0.5–2.0%. Således standard NGS har en grænse på registrering af mutationer, der er > 0,02 variant allel brøkdel (VAF). Mens den kliniske betydning for mutationer denne sjældne hos patienter uden kendt sygdom er fortsat uklart, patienter behandlet for leukæmi har væsentligt forbedret resultater når residual sygdom er < 0,0001 ved flowcytometri. For at afbøde denne artefactual baggrund af NGS, er talrige metoder blevet udviklet. Her beskriver vi en metode for fejl-korrigeret DNA og RNA sekventering (ECS), der omfatter tagging individuelle molekyler med både en 16 bp tilfældige indeks til korrektion af fejl og en 8 bp patient-specifikke indeks for multiplexing. Vores metode kan finde og spore klonede mutationer på variant allel fraktioner (VAFs) to størrelsesordener lavere end detektionsgrænsen for NGS og så sjældne som 0.0001 VAF.

Introduction

Som vi alder, udsættelse for mutagener og stokastiske fejl under celledelingen resultere i ophobning af somatiske aberrationer i genomet, og dette ligger til grund for den grundlæggende patogenesen af maligne transformation, neuro-udviklingsmæssige sygdomme, pædiatrisk lidelser og normal aldring¹^,². Somatiske mutationer med sygdom-kørsel potentiale er vigtige diagnostiske og prognostiske biomarkører for tidlig detektion og risiko styring³^,⁴^,⁵. For bedre at forstå fysiologisk clonogenesis, er som vil informere kliniske og forskning beslutninger, nøjagtig kvantificering og karakterisering af disse mutationer af primær betydning. Next generation sequencing (NGS) er i øjeblikket brugt til at studere klonede mutationer i heterogene DNA prøver; NGS er dog begrænset til at identificere mutationer på > 0,02 variant allel brøkdel (VAF) — på grund af den iboende fejlrate på 0,5-2,0% af sekventering platforme⁶^,⁷^,⁸. Som et resultat, kan ikke tracking diagnostisk og prognostically betydelig somatiske varianter på lavere VAF opnås ved hjælp af standard NGS.

For nylig, forskellige metoder er blevet udviklet for at omgå fejlprocenten NGS⁸^,⁹^,¹⁰^,¹¹. Disse metoder udnytte molekylære tagging, som gør det muligt for fejlkorrektion efter sekvensering. Hvert molekyle eller genomisk fragment i biblioteket sekventering er markeret med en tilfældig unikke molekylære id (UMI) der er specifikke for dette molekyle. (UMIS) velkommen er konstrueret af permutationer af en streng af randomiserede nukleotider (8 – 16 N). En anden prøve-specifik stregkode er også integreret i den arbejdsgang, der gør det muligt for multiplexing flere prøver til samme NGS Sekventeringen køre. PCR-amplifikation udføres på molekylært tagged biblioteket, og efterfølgende biblioteket er sendt til sekvensering. Under bibliotek forberedelse forventes det, at fejl vil blive tilfældigt introduceret til den genomisk fragment under PCR-amplifikation og sekventering⁸. Hvis du vil fjerne tilfældig rækkefølge for fejl, er rå sekventering læsninger grupperet efter UMI. Artefakter fra sekventering forventes ikke at være til stede i alle læser med samme UMI på den samme genomiske position på grund af stokastiske karakter af indledning, en sand variant vil være trofast forstærkes og sekventeret i alle læser, som deler den samme UMI. Artefakter er bioinformatically fjernet. Her, vi beskriver tre metoder af fejl-korrigeret sekventering (ECS) optimeret i laboratoriet for DNA til at identificere enkelt nucleotid varianter (SNVs) og små indsættelse-sletninger (Indels), og RNA til at lette kvantificering af genekspression nedenfor de NGS fejlgrænseværdi.

Den første metode beskriver en måde at lede efter sjældne somatiske begivenhed ved hjælp af genet specifikke primere designet af forskere. Før bibliotek forberedelse, bør forskere design primere til at målrette fragmenter af interesse. Vi har brugt web-app Primer3 (http://bioinfo.ut.ee/primer3-0.4.0/). Amplikoner af 200 – 250 bp er ideelle til Polymerasekædereaktionen (PCR), da disse vil, når (UMIS) velkommen er blevet indarbejdet, generere overlappende parret ende læser med 150 bp parret ende læser. Optimal primer design betingelser anvendes: Minimum primer størrelse = 19; Optimal primer størrelse = 25; Maksimale primer størrelse = 30; Minimum Tm = 64 ° C; Optimal Tm = 70 ° C; Maksimale Tm = 74 ° C; Maksimale Tm forskel = 5 ° C; Minimumsindholdet af GC = 45; Maksimale GC indhold = 80; Antal tilbage = 20; Maksimalt 3′ enden stabilitet = 100.

I metode 2 beskriver vi en metode kombinerer ECS-DNA-protokollen med Illumina kemi til undersøgelse for klonede SNVs og lille Indels så sjældne som 0.0001 VAF ved hjælp af kommercielt tilgængelige gen paneler, der omfatter hundredvis af amplikoner. Vi har brugt TruSight Myeloid sekventering Panel (Illumina) til vores eksperiment og designet en udvidet panel til at omfatte yderligere gener af interesse for pediatric myeloide sygdomme. Disse paneler har ikke tilbudt unikke molekylære identifikatorer ((UMIS) velkommen), der ville lette fejlkorrektion, så vi har tilføjet vores eget adapter strategi til at disse paneler. ECS bør arbejde lige så godt med nogen andre paneler, der er designet til at berige for gener forbundet med forskellige sygdomme. Efter DNA isolation og efterfølgende kvantitativ bestemmelse fra væv eller prøve af interesse, det anbefales at have mindst 500 ng af stock DNA per eksemplar. Vi rutinemæssigt foretage en enkelt sekventering bibliotek brug 250 ng af DNA for at fange så meget unikke genomisk fragment som muligt for nedstrøms læser de-duplikering og VAF beregning. En valgfri Repliker sekventering bibliotek kan gøres med de resterende 250 ng af DNA. Vi gøre altid to Repliker biblioteker pr. eksemplar, og vi mener kun disse begivenheder fundet uafhængigt i begge replikater som sandt positive. Vi har også implementeret en genomisk holdning-specifikke binomial fejl model for at øge nøjagtigheden af variant kræver⁴^,¹³.

Endelig vil beskrive vi en metode kobling ECS til RNA sekventering for udskrift kvantificering ved hjælp af off-the-shelf QIAseq målrettet RNA paneler (Qiagen). (UMIS) velkommen kræves for deduplikering og fejlkorrektion er blevet indarbejdet i kits, og forskere kan gøre biblioteker efter fabrikantens anvisninger. Bioinformatically, forskere kan følge rørledningen skitseret for ECS-DNA, som vil blive forklaret i detaljer i afsnittet protokol.

Protocol

1. målrettet fejl-korrigeret sekventering for DNA PCR-amplifikation af genomisk fragmenter af interesse. Bruge en high-fidelity DNA polymerase til at forstærke amplikoner (Materialer tabel, punkt 1). Forstærke PCR reaktionen med de følgende betingelser i en termisk cycler: 30 s på 98 ° C; 18-40 cyklusser af 10 s på 98 ° C, 30 s på 66 ° C og 30 s ved 72 ° C; 2 min. ved 72 ° C; hold ved 4 ° C. Rense PCR-produkter med Paramagnetiske perler (Materialer tabel, punkt 2). Tilføje PCR reaktion til perlerne i forholdet 1: 1.8 (PCR reaktion volumen: bead volumen) efter producentens protokol. Elueres med 20 µL af Hedeselskabet2O. Kvantificere koncentrationen af DNA (Materialer tabel, punkt 3) til bestemmelse af endelige koncentration af DNA. Køre en alikvot af DNA på en 2% agarosegel (Materialer tabel, punkt 4) at bekræfte størrelsen af amplikoner.Bemærk: Alternativt forskere kan vælge for at udføre en Bioanalyzer analyse på PCR-produkter til at bestemme størrelsen af forstærkede genomisk fragmenter og koncentrationen af produkterne. Sekventering adapter udglødning Få i7 adaptere (Materialer tabel, punkt 5). Bruge dem som de er givet til de senere trin. Køb 16N i5 adaptere kommercielt med følgende oligo sekvens (materialer tabellen vare 6): AATGATACGGCGACCACCGAGATCTACAC(N1:25252525)(N1)(N1)(N1)(N1)(N1)(N1)(N1)(N1)(N1)(N1)(N1)(N1)(N1)(N1) (N1) ACACTCTTTCCCTACACGACGCTCTTCCGATCTBemærk: 16N i5 adaptere erstatte standard i5 adaptere og de adaptere med en streng af 16 tilfældige-nukleotid at lette ECS. Gøre 16N i5 adapter brugsopløsning: 40 µL af 100 µM 16N i5 adapter stock, 10 µL af TE buffer og 10 µL af 500 µM NaCl opløsning. Alikvot 7,5 µL af den i5 brugsopløsning forberedt i trin 1.2.3 i separate PCR-brønde. Tilsæt 5 µL af prøven-specifikke i7 adapter i tilsvarende brønd. Der inkuberes ved 95 ° C i 5 min og derefter afkøles med 1 ° C hvert 30 s til 4 ° C i en termisk cycler. Hold ved 4 ° C. Ende-reparation & dA-hale af bibliotekerBemærk: Parallelt med adapter udglødning man kan udføre slutningen reparation og dA-hale på PCR-amplikoner fra trin 1.1. Efter afslutningen af disse trin, ligatur af udglødet adaptere fra trin 1.2 på udgangen repareret og dA-tailed PCR-amplikoner er udført. Efter adapter ligatur er ECS bibliotek opbygning fuldført. Begynd med højst 1 µg for at starte DNA (minimum ~ 200 ng) Udføre slutningen-reparation og dA-hale på amplikoner (Materialer tabel, punkt 7). Tilføje 3,0 µL af slutningen Prep enzym Mix og 6,5 µL af slutningen reparation Buffer. Inkuber mix i 30 min. ved 20 ° C, derefter i 30 min. ved 65 ° C og holde ved 4 ° C. Udføre ligatur på de udglødet adaptere (Materialer tabel, punkt 8). Tilføje 2,5 µL af de udglødet adaptere fra trin 2, 15 µL af stump/TA Ligase Mastermix og 1 µL af ligatur enhancer. Inkuber blanding i 15 min. ved 20 ° C, derefter i 15 min. ved 37 ° C. Rydde op i biblioteker med magnetiske perler (materialer tabellen vare 2): tilføje PCR reaktion til perler i forholdet modificerede 1: 0,75 (PCR reaktion volumen: magnetisk bead volumen): Der afpipetteres 62.6 µL af magnetisk bead løsning i den 83.5 µL PCR produkter fra trin 1.2.7. Overfør blandingen til en 1,5 mL lave bindende tube. Blandes grundigt ved pipettering op og ned på mindst 10 gange. Lad blandingen stå ved stuetemperatur i 5 minutter. Sted rør en magnetisk holderen til. Der inkuberes i 2 minutter ved stuetemperatur eller indtil supernatanten er klart. Fjern supernatanten. Vaske perlerne med 200 µL af 70% ethanol. Inkuber i 30 s. Fjern ethanol. Gentag ethanol vask trin en gang. Lufttørre perlerne. Elueres med 20 µL af Hedeselskabet2O.Bemærk: Denne ændring i PCR reaktion til magnetisk bead forholdet vil fortrinsvis fjerne DNA-fragmenter, der er mindre end 200 bp. Kvantificering af droplet digital PCRBemærk: Præcise mutation kvantificering kræver streng overholdelse af antallet af molekyler af hver bibliotek, der er lastet på sequencer. For at opnå dette, kvantificerer antallet af molekyler for enkelte biblioteker pr. enhedsvolumen udføres ved hjælp af QX200 droplet digital PCR (ddPCR) platform — kvantitativ PCR er en alternativ mulighed. Efter ddPCR analyse, vil udlæsningen angive antallet af molekyler per µL pr. bibliotek. Fortynd ECS biblioteker 1:1,000 ved trinvist fortynding af en faktor 10 i PCR strip-rør. Forbered de følgende mastermix for ddPCR i 1,5 mL tube: 10 µL PCR mix (Materialer tabel, punkt 9), 0,2 µL af P5 Primer, 0,2 µL af P7 Primer, 5 µL af ECS rensede produkt fra trin 1.4.1., og 4,5 µL af Hedeselskabet2O. Alikvot 20 µL af mastermix i hver prøve godt gør sikker der er multipla af 8. Alikvot 70 µL af droplet generation olie (Materialer tabel, punkt 10) i hver oliekilde. Dække kassette med en gummipakning. Gøre dråber ved hjælp af droplet generator (Materialer tabel, punkt 11). Ved hjælp af en multikanalpipette, indlæse dråber genereret i trin 1.4.4 i en PCR plade sikrer, Pipettering af prøven udføres langsomt over en span af 5 sekunder for at undgå klipning DNA. Forstærke signalet i dråber til 40 cykler i et termisk cycler ved hjælp af følgende betingelser: 5 min. ved 95 ° C; 40 cyklusser af 30 s ved 95 ° C, 1 min til 63 ° C; 5 min. ved 4 ° C, 5 min. ved 90 ° C; og derefter holde ved 4 ° C. Forberede ddPCR skabelon droplet læser maskine (Materialer tabel, punkt 11). Sikre specifikation for parametre til Absolut kvantificering og ved hjælp af den QX200 ddPCR Eva Green Supermix. Når ddPCR analyse er færdig, Sørg for at indstille den samme splittende tærskel på tværs af alle prøver. Ved hjælp af koncentration udlæsningen fra QX200 Droplet læser, prøve den passende mængde at indføre det ønskede antal molekyler i efterfølgende trin. PCR-amplifikation af biblioteker til sekvensering Forbered de følgende mastermix for det ønskede antal molekyler fra trin 1.4.9: 25 µL af Q5 Mastermix (Materialer tabel, punkt 1), 2,5 µL af P5 Primer (10 µM), 2,5 µL af P7 Primer (10 µM), X µL af DNA, 20-X µL af Hedeselskabet2O. Forstærke biblioteker fra trin 1.5.1 i en termisk cycler ved hjælp af følgende betingelser: 30 s på 98 ° C; 20 cyklusser af 10 s på 98 ° C, 30 s til 63 ° C, 30 s ved 72 ° C; 2 min. ved 72 ° C; og derefter holde ved 4 ° C. Rydde op i biblioteker med magnetiske perler (materialer tabel, punkt 2): tilføje PCR reaktion til magnetiske perler i en modificeret 1: 0,75 ratio (PCR reaktion volumen: magnetisk bead volumen). Der afpipetteres 37,5 µL af magnetisk bead løsning i de 50 µL PCR produkter fra trin 1.5.2. Overfør blandingen til en 1,5 mL lave bindende tube. Blandes grundigt ved pipettering op og ned på mindst 10 gange. Lad blandingen stå ved stuetemperatur i 5 min. Sted rør en magnetisk holderen til. Der inkuberes i 2 minutter ved stuetemperatur eller indtil supernatanten er klart. Fjern supernatanten. Vaske perlerne med 200 µL af 70% ethanol. Inkuber i 30 s. Fjern ethanol. Gentag ethanol vask trin en gang. Lufttørre perlerne. Elueres med 20 µL af Hedeselskabet2O. Køre en alikvot af DNA på en 2%-agarosegel at bekræfte størrelsen af amplikoner. Kvantificere koncentrationen af DNA (Materialer tabel, punkt 3) til at bestemme koncentrationen af de separate ECS biblioteker. Pool biblioteker i equimolar mængder.Bemærk: For eksempel forskere kan samle otte biblioteker i en equimolar gruppe4 med 4 millioner starter molekyler til sekvensering ved hjælp af en sekventering platform, som udsender op til 400 millioner læser. Konservativt, anbefales det at bruge et gennemsnit på ti rå læsninger til korrektion af fejl pr. molekyler. Dette vil tage op 360 millioner læser (4 millioner molekyler * 8 biblioteker * 10 læser til korrektion af fejl). Med 4 millioner unikke molekyler per bibliotek, kan forskere forvente at få en teoretisk betyder konsensus læse dækning af 7042 x pr. amplikon (4 millioner/568 amplikoner fra panelet gen). Kvantificere koncentrationen af DNA (Materialer tabel, punkt 3) til at bestemme koncentrationen af poolede ECS bibliotek. Indsende poolede ECS biblioteket på ca 4 nM. Give følgende sekventering indstillinger til Illumina sekventering platforme (MiSeq, HiSeq eller NextSeq): 2 x 144 parret-ende læser, 8 cykler indeks 1 og 16 cykler indeks 2. 2. gen paneler med fejl-korrigeret sekventering af DNA Hybridisering af oligos fra gen panelerBemærk: I dette trin, vil man konstruere sekventering biblioteker ved hjælp af en modificeret Illumina TruSight eller TruSeq protokollen for at indarbejde (UMIS) velkommen (Materialer tabel, punkt 17). Krydse oligos på genomisk fragment efter producentens protokol. Brug 250 ng af DNA (eller nogen ønskede mængde starter materiale). Fjerne ubundne oligos efter producentens protokol. Udføre udvidelse-ligatur efter producentens protokol.Bemærk: Ændringer til producentens protokol begynde nedenfor. Indarbejdelse af i5 og i7 adaptere via PCR Forberede PCR-mastermix af pipettering af følgende reagenser ind i et rør af passende volumen størrelse: 37,5 µL af Q5 Mastermix (Materialer tabel, punkt 1), 6 µL af 10 µM 16N i5 adaptere (detaljeret i metode 1, trin 1.2.2), 6 µL af i7 adaptere (brug forskellige i7 adaptere til separate prøver for multiplexing), og 22 µL af udvidelse-ligatur løsning med perler fra trin 2.1.3.Bemærk: Q5 Mastermix erstatter polymerase mastermix fra Illumina. Q5 polymerase forstærker den genomisk fragment med højere troskab og færre indførte fejl. Køre PCR program på en termisk cycler ved hjælp af følgende parametre: 30 s på 98 ° C, 4 – 6 cyklusser af 10 s på 98 ° C, 30 s på 66 ° C, 30 s ved 72 ° C; 2 min. ved 72 ° C, og derefter holde ved 4 ° C.Bemærk: Antallet af cyklusser afhænger panel størrelse. Fra vores erfaring er en 4-cyklus PCR tilstrækkeligt, hvis panelet gen har omkring 1.500 forskellige par gen specifikke oligos, forudsaetter et panel med 500 – 600 par oligos 6 cyklusser af PCR. Rydde op i PCR reaktioner med magnetiske perler (materialer tabel, punkt 2): tilføje PCR reaktion til magnetiske perler i en modificeret 1 PCR reaktion: 0,75 magnetisk bead forholdet: Der afpipetteres 56,25 µL af magnetisk bead løsning i 75 µL PCR produkter fra trin 2.2.2. Overfør blandingen til en 1,5 mL lave bindende tube. Blandes grundigt ved pipettering op og ned på mindst 10 gange. Lad blandingen stå ved stuetemperatur i 5 min. Sted rør en magnetisk holderen til. Der inkuberes i 2 min. ved stuetemperatur eller indtil supernatanten er klart. Fjern supernatanten. Vaske perlerne med 200 µL af 70% ethanol. Inkuber i 30 s. Fjern ethanol. Gentag ethanol vask trin en gang. Lufttørre perlerne. Elueres med 20 µL af Hedeselskabet2O. Kvantificere biblioteker ved hjælp af QX200 ddPCR platform. Følg trin 1.4 i metode 1.Bemærk: 4 millioner molekyler var normaliseret pr. sample bibliotek4 i det repræsentative resultat (figur 2) for at opnå en teoretisk gennemsnit af 7,042 unikt indekseret molekyler (4 millioner divideret med 568 gen-specifikke oligos). Forstærke og normalisere biblioteker til sekvensering. Forstærke det ønskede antal molekyler ved hjælp af de følgende mastermix for den endelige PCR sammentælling 50 µL: 25 µL af Q5 Mastermix, 2 µL af P5 Primer (1 µM), 2 µL af P7 Primer (1 µM), og 21 µL af DNA-molekyler. Køre PCR program på en termisk cycler ved hjælp af følgende parameter: 30 s på 98 ° C; 16 cyklusser af 10 s på 98 ° C, 30 s på 66 ° C, 30 s ved 72 ° C; 2 min. ved 72 ° C; og derefter holde ved 4 ° C. Oprydning sekventering biblioteker ved hjælp af magnetiske perler (Materialer tabel, punkt 2): tilføje PCR reaktion til magnetiske perler i en modificeret 1 PCR reaktion: 0,75 magnetisk bead forholdet: Der afpipetteres 37,5 µL af magnetisk bead løsning i de 50 µL PCR produkter fra trin 2.4.2. Overfør blandingen til en 1,5 mL lave bindende tube. Blandes grundigt ved pipettering op og ned på mindst 10 gange. Lad blandingen stå ved stuetemperatur i 5 min. Sted rør en magnetisk holderen til. Der inkuberes i 2 min. ved stuetemperatur eller indtil supernatanten er klart. Fjern supernatanten. Vaske perlerne med 200 µL af 70% ethanol. Inkuber i 30 s. Fjern ethanol. Gentag ethanol vask trin en gang. Lufttørre perlerne. Elueres med 20 µL af Hedeselskabet2O. Køre en alikvot af elueret DNA (~ 3 µL) på en 2%-agarosegel at bekræfte størrelsen af amplikoner. Kvantificere koncentrationen af DNA (Materialer tabel, punkt 3) til at bestemme koncentrationen af de separate ECS biblioteker. Pool biblioteker i equimolar mængder. Se metode 1 trin 1.5.6. og også diskussionen for flere detaljer om sammenlægning. Indsende poolede ECS biblioteket på ca 4 nM. Give følgende sekventering indstillinger til Illumina sekventering platforme (MiSeq, HiSeq eller NextSeq): 2 x 144 parret-ende læser, 8 cykler indeks 1 og 16 cykler indeks 2. ECS Bioinformatic behandling og analyse Opnå den prøve-demultiplexed læser fra sequencer eller udføre demultiplexing af rå sekvens læser i forskellige prøver ved hjælp af i7 adapter sekvenser bioinformatically med et brugerdefineret script. Trim off de første 30 nukleotider af hver demultiplexed læse at fjerne oligo sekvenser fra panelet genet. Juster læser, som deler de samme (UMIS) velkommen til hinanden for at danne Læs familier.Bemærk: Forskere kan bruge UMI-vide programmel såsom MAGERI13 hen til uddrag Læs familier. Ingen hamming afstand var tilladt i UMI sekvens i dette eksperiment at øge specificiteten af metoden. Udføre de-duplikering og fejlkorrektion ved hjælp af følgende anbefalede parametre. Brug ≥5 læse par i samme læse familie. Et minimum af tre Læs par anbefales. Sammenlign nukleotid på alle positioner på tværs af alle læser i samme Læs familie, og genererer en konsensus nukleotid, hvis der er mindst 90% konkordans blandt læser for en bestemt nukleotidsekvens. Kalde en N, hvis der er mindre end 90% aftale for nukleotid holdning. Kassér konsensus læser, der har > 10% af det samlede antal konsensus nukleotider bliver kaldt som N. Justere alle beholdt konsensus læser lokalt til enten hg19 eller hg38 menneskelige reference genom ved hjælp af forskerens foretrukne aligner(s) som Bowtie2 og BWA. Processen justeret læser med Mpileup ved hjælp af parametre – BQ0 – d 10,000,000,000,000 at fjerne dækning tærskler for at sikre en ordentlig pileup output uanset VAF. Filtrer de positioner med mindre end 1000 x konsensus læse dækning.Bemærk: Forskeren bestemmer den mindste dækning for hver nukleotid vilkårligt, det anbefales at have mindst 500 x konsensus læse dækning for downstream analyse. Bruge binomiale fordeling for at kalde enkelt nucleotid varianter (SNPs) i lagrede data fra trin 2.5.7 med følgende parametre. Det binomiale statistik vil være baseret på en genomisk holdning-specifik fejl model. Hver genomisk position er modelleret uafhængigt efter opsummering ud fejlrater af alle prøver til denne særlige stilling. Følgende eksempel:Sandsynligheden for nukleotid profil på en given genomisk position, p∑ Variant RF2 ∑ samlede RFs= 26/255505= 0.000101759Binominal sandsynlighed for 24 variant RFs ud af 35911 samlede RFs, P(X ≥ x) i prøven K= 1 – binomial(24, 35911, 0.000101759)= 2.26485E-13Bemærk: For hver genomisk forespørges, vil der være tre mulige mutationsmønstre ændringer (dvs.A > T, A > C, A > G), og hver især er repræsenteret som baggrund artefakt. Somatiske begivenheder, der er væsentligt forskellige fra baggrunden efter Bonferroni korrektion bevares. I eksemplet vist i tabel 1, var antallet af prøvninger 11, dermed en Bonferroni korrigeret p-værdi ≤0.00454545 (0,05/11) var forpligtet til at kalde en begivenhed som statistisk signifikant. Somatiske begivenheder er forpligtet til at være til stede i begge replikater fra den samme prøvemateriale; ellers betragte dem som falske positiver. Tabel 1: Eksempel demonstrerer den måde at konstruere en holdning-specifikke binomial fejl model. 3. fejl-korrigeret sekventering af RNA Ud over vurderingen af for mutationer på DNA niveau, skal du integrere ECS med forskellige målrettede RNA sekventering paneler til at opdage sjældne eller lav overflod udskrift på RNA niveau. Ved at kombinere ECS med off-the-shelf Qiagen RNA sekventering paneler, demonstrerede vi digital kvantificering af genekspression for udskrifter med så få som 10 kopier uden behov for normalisering mod en husholdning genet. (UMIS) velkommen kræves til korrektion af fejl er blevet integreret i panelet. Udføre total RNA udvinding (Materialer tabel, punkt 20). Udføre ECS-RNA bibliotek forberedelse efter producentens protokol (Materialer tabel, punkt 19). Udføre Bioinformatik pipeline ifølge skridt 2.5.1–2.5.6. Metode 2 skitseret i det foregående afsnit. Efter trin 2.5.6 repræsenterer antallet af justeret konsensus læser per gen niveauet udtryk af genet uden brug af genet længde normalisering.

Representative Results

Med Targeted Error-Corrected sekvensering til DNA, har vi udført et bevis for princippet eksperiment fortynding mutant patienten DNA i kommercielle genomisk DNA. Patienten havde en mutation i GATA1 (chrX:48650264, C > G) med oprindelige VAF af 0,19. Vi demonstrere i figur 1 , at ECS er kvantitative til et niveau af 1:10,000 for enkelt nucleotid variant. Figur 1: fortyndingsrække af GATA1 SNV påviser, at ECS kvantitative til niveauet af 1:10,000. Venligst klik her for at se en større version af dette tal. Vi viser også, at ECS-DNA pålideligt registrerer sjældne klonede mutationer i gener jævne i voksen akut myeloid leukæmi (AML) i raske ældre personer4. Vi fik buffy coat prøver fra 20 sunde individer i sygeplejersken sundhed undersøgelse krænges ca ~ 10 års mellemrum. Vi anvendte ECS-DNA panel protokol på disse prøver. For dette eksperiment, vi tilpasset Illumina TruSight Myeloid sekventering panelet, der består af 568 amplikoner (yderligere oplysninger om gen liste på https://www.illumina.com/products/by-type/clinical-research-products/trusight-myeloid.html) og sekventeret 80 biblioteker fra 20 personer (2 samlinger på forskellige tidspunkter, 2 replikater pr. individ pr. gang punkt) ved hjælp af Illumina NextSeq platform, der genereres et gennemsnit af 47,7 millioner parret ende læser og gennemsnitligt 3,4 millioner fejl-korrigeret konsensus sekvenser pr. bibliotek4. Den gennemsnitlige nukleotid dækning pr. bibliotek var cirka 6.000 x (3,4 millioner divideret med 568). For hver prøve konstrueret vi en holdning-specifik fejl profil ved hjælp af sekventeret biblioteker, der ikke er fra samme prøve. Vi fandt 109 klonede somatiske mutationer, der var til stede i begge replikater af mindst én samling tidspunkt. Disse mutationer har VAF spænder fra 0,0003 – 0.1451. Vi valgte 21 mutationer med kendte kosmiske repræsentationer, og valideres alle 21 mutationer i en eller to samling tid point (s) ved hjælp af ddPCR (n = 34, figur 2, tilpasset fra unge et al. 20164). Figur 2: mutationer identificeret af ECS blev kontrolleret via ddPCR med meget overensstemmende VAFs. (n = 34, ændret fra unge et al. 20164). Venligst klik her for at se en større version af dette tal. Med hensyn til fejl-korrigeret udtryk niveau ved hjælp af ECS-RNA protokol, tilpasset vi et gen panel ved hjælp af QIAseq kemi, der består af 416 gener kendt for at være forbundet med forskellige kræftformer (tilpasset fra QIAseq menneskelige kræft transkriptom panel), og vi forstærket den oftest udtrykt exon af et bestemt gen (gen liste i supplerende materiale 1). Vi sekventeret biblioteker via Illumina MiSeq platform i parret-end-format, der gav et gennemsnit på 8,3 millioner læsninger per bibliotek, og det lykkedes os at fange et gennemsnit på 0.417 millioner fejl-korrigeret konsensus sekvenser. Vi viste, at udtryk niveauet af lav overflod udskrift (< 1.000 udskrift tæller i 50 ng af total RNA) er yderst reproducerbare mellem flergangsbestemmelser (data punkt n = 300, figur 3). Validering af ddPCR (seks udvalgte gener af varierende grad af udtryk) viste, at niveauet udtryk af gener havde været korrekt fanget af ECS-protokollen uden behov for normalisering. Figur 3: Top, korrelation af udskrift tæller af ECS-RNA mellem replikater af den samme prøve (n = 300). Bunden, udskrift tæller identificeret af ECS blev kontrolleret af ddPCR (n = 6). Venligst klik her for at se en større version af dette tal.

Discussion

Her viser vi en række fejl-korrigeret sekventering protokoller, der let kan implementeres for at studere mutationer med lav VAFs i forskellige sygdomme. Den vigtigste faktor er iblandingen af (UMIS) velkommen med hvert molekyle før sekventering, som de aktiverer fejlkorrektion af de rå læsninger. De metoder, der beskrives her giver forskere at indarbejde tilpassede (UMIS) velkommen til både kommercielt tilgængelige gen paneler og selv designet gen-specifikke oligos.

NGS standardprotokol til hinder for påvisning af mutationer med VAF under 2% på grund af sekventering fejlrate, og det begrænser anvendelsen af NGS i studier hvor påvisning af sjældne varianter er afgørende. Ved at omgå NGS fejl standardsats, muliggør ECS følsomme påvisning af disse rå varianter. For eksempel er påvisning af patogene mutationer når disse mutationer opstår først (derfor at have lav VAF) bydende nødvendigt at informere tidlig indgriben af sygdom¹⁴^,¹⁵. I leukæmi forskning, påvisning af minimal residual sygdom (resterende leukemic celler efterbehandling) oplyser risiko stratificering og kunne bruges til at informere behandlingsmuligheder på en måde, som binære flow cytometric vurderinger ikke kan. ECS er desuden relevant at opdage cirkulerende tumor nukleinsyre og evaluere metastatisk potentiale i solid tumor patienter ved at vurdere for tilstedeværelse/fravær samt variant byrden af bestemte mutationer, der er særlige kendetegn ved primære tumor¹⁶.

Som vist i tabel 1, afhænger magt ved hjælp af binomial fordeling-baseret holdning-specifik fejl model for at kalde varianter i høj grad antallet af sekventeret biblioteker samt dybden af sekventering bruges til at bygge modellen fejl. Robustheden af modellens fejl stiger med højere antal prøver og flere sekventering dybde. Det anbefales at bruge mindst 10 sekventeret prøver med et gennemsnit på fejl-korrigeret Læs dækning af 3000 x pr. prøve for at bygge en fejl profil for hver prøve. Position-specifik tilgang er lignende MAGERI, men i stedet for ved hjælp af en samlet fejlrate for alle seks forskellige substitution typer (A > C/T > G, A > G/T > C, A > T/T > A, C > A/G > T, C > G/G > C C > T/G > A)¹³, vi model hver substitution uafhængigt i enhver position. For eksempel, en fejlrate på C > T ved en given genomisk position er forskellig fra en anden position. Vores tilgang også tager hensyn en sekventering batch effekt, som den base substitution sats observeret i en sekventering køre kan være forskellig fra en køre. Derfor er det vigtigt at modellere hver position for alle substitution typer, især når prøver fra forskellige sekventering kører sammenlægges til at bygge modellen.

En vigtig overvejelse, når du udformer en ECS eksperiment er den ønskede påvisningsgrænse. Skønheden i NGS undersøgelser er, at de nemt kan skaleres i form af gener/mål af interesse, påvisningsgrænse (dikteret af dybden af sekventering) og antal individer forespørges. For eksempel, hvis forskerne er interesseret i at finde sjældne mutationer i to amplikoner med en påvisningsgrænse af 0,0001, kan de samle maksimalt 75 prøver i et enkelt sekventering køres ved hjælp af MiSeq V2 kemi, som udsender op til 15 millioner lyder (2 amplikoner * 10.000 molekyler * 10 læser til korrektion af fejl * 75 prøver = 15 millioner sekventering læser). Forskere kan variere antallet af molekyler kommer til sekvensering eller antallet af poolede prøver i et enkelt sekventering køre til at justere påvisningsgrænsen. Vores undersøgelser, vi havde til formål at finde mutationer med en påvisningsgrænse af 0.0001 VAF (1:10, 000) ved hjælp af panelet Illumina genet. Vi bruger rutinemæssigt 250 ng af start DNA for at sikre, at tilstrækkelig molekyler er fanget for at opnå den ovennævnte påvisningsgrænse. Forskere kan vælge for at starte med lavere beløb af DNA (50 ng anbefales) hvis den ønskede detektionsgrænsen er > 0.001 VAF.

Som (UMIS) velkommen er vedlagt på i5 indekser, skal sekventering indstillinger ændres i overensstemmelse hermed. For eksempel, vi brugt 16 N (UMIS) velkommen, og sekventering indstillinger var 2 x 144 parrede ende læser, 8 cyklusser af indeks 1 og 16 cyklusser af indeks 2 i stedet for de sædvanlige 8 cyklusser af indeks 2. Stigningen i indeks 2 cyklus opvejes af et fald i det samlede antal cyklusser tildeles læser. Hvis forskere vælger for at bruge 12N (UMIS) velkommen¹⁰^,¹⁷, skal indstillingerne ændres til 12 cyklusser af indeks 2.

Denne UMI-baserede sekventering metode er optimeret til at korrigere for sekventering fejl. Det stadig ikke optimalt i forbindelse med PCR jackpotting, hvilket er et problem for alle forstærkning-baseret metode. Vi udførte runder efter sekvensering og post-Bioinformatik validering ved hjælp af ddPCR, og vi opdage næppe eventuelle falske positiver på grund af PCR jackpotting. Dog anbefales det, at forskere udføre eksperimenter med high fidelity polymerase for at sikre lav forstærkning fejl.

Disclosures

The authors have nothing to disclose.

Acknowledgements

Vi takke deltagerne i børnenes onkologisk gruppe AAML1531 undersøgelsen og sygeplejerskernes sundhed studere for deres bidrag i form af patientprøver. Dette arbejde blev finansieret af National Institutes of Health (UM1 CA186107, RO1 CA49449 og RO1 CA149445), børnenes Discovery Institute of Washington University og St. Louis children’s Hospital (MC-II-2015-461), og Eli Seth Matthews leukæmi Foundation.

Materials

Q5 High Fidelity Hot Start Master Mix	New England BioLabs	M0492S
Agencourt AMPure XP	Beckman Coulter	A63880
Qubit dsDNA HS Assay Kit	Thermo Fisher Scientific	Q32854
SYBR Safe DNA Gel Stain	Thermo Fisher Scientific	S33102
Truseq Custom Amplicon Index Kit	Illumina	FC-130-1003
UMI i5 adapter sequences	Integrated DNA Technologies	–
NEBNext Ultra End Repair/dA-Tailing Module	New England BioLabs	E7442S
NEBNext Ultra II Ligation Module	New England BioLabs	E7595S
QX200 ddPCR EvaGreen Supermix	Bio-Rad	1864034
QX200 Droplet Generation Oil for EvaGreen	Bio-Rad	1864005
QX200 Droplet Digital PCR System	Bio-Rad	1864001
ddPCR 96-Well Plates	Bio-Rad	12001925
DG8 Cartridges for QX200/QX100 Droplet Generator	Bio-Rad	1864008
DG8 Gaskets for QX200/QX100 Droplet Generator	Bio-Rad	1863009
Bioanalyzer	Agilent Genomics	G2939BA
TapeStation	Agilent Genomics	G2991AA
TruSight Myeloid Sequencing Panel	Illumina	FC-130-1010
Bowtie 2	Johns Hopkins University	–
Customized QIAseq Targeted RNA Panel	Qiagen	–
Rneasy Plus Mini Kit (50)	Qiagen	74134

References

Hoang, M. L., et al. Genome-wide quantification of rare somatic mutations in normal tissues using massively parallel sequencing. Proceedings of the National Academy of Sciences USA. 113, 9846-9851 (2016).
O’Roak, B. J., et al. Sporadic autism exomes reveal a highly interconnected protein network of de novo mutations. Nature. 485, 246-250 (2012).
Young, A. L., et al. Quantifying ultra-rare pre-leukemic clones via targeted error-corrected sequencing. Leukemia. 29 (7), 1608-1611 (2015).
Young, A. L., Challen, G. A., Birmann, B. M., Druley, T. E. Clonal hematopoiesis harbouring AML-associated mutations is ubiquitous in healthy adults. NatureCommunications. 7, 12484 (2016).
Patel, J. P., et al. Prognostic relevance of integrated genetic profiling in acute myeloid leukemia. New England Journal of Medicine. 366, 1079-1089 (2012).
Shendure, J., Ji, H. Next-generation DNA sequencing. Nature Biotechnology. 26 (10), 1135-1145 (2008).
Kohlmann, A., et al. Monitoring of residual disease by next-generation deep-sequencing of RUNX1 mutations can identify acute myeloid leukemia patients with resistant disease. Leukemia. 28, 129-137 (2014).
Luthra, R., et al. Next-generation sequencing-based multigene mutational screening for acute myeloid leukemia using MiSeq: applicability for diagnostics and disease monitoring. Haematologica. 99, 465-473 (2014).
Kinde, I., Wu, J., Papadopoulos, N., Kinzler, K. W., Vogelstein, B. Detection and quantification of rare mutations with massively parallel sequencing. Proceedings of the National Academy of Sciences USA. 108 (23), 9530-9535 (2011).
Schmitt, M., et al. Detection of ultra-rare mutations by next-generation sequencing. Proceedings of the National Academy of Sciences USA. 109 (36), 14508-14513 (2012).
Vander Heiden, J. A., et al. pRESTO: a toolkit for processing high-throughput sequencing raw reads of lymphocyte receptor repertoires. Bioinformatics. 30 (13), 1930-1932 (2014).
Newman, A. M., et al. Integrated digital error suppression for improved detection of circulating tumor DNA. NatureBiotechnology. 34, 547-555 (2016).
Shugay, M., et al. MAGERI: Computational pipeline for molecular-barcoded targeted resequencing. PLOSComputationalBiology. 13 (5), e1005480 (2017).
Wong, T. N., et al. Role of TP53 mutations in the origin and evolution of therapy-related acute myeloid leukaemia. Nature. 518, 552-555 (2014).
Krimmel, J. D., et al. Ultra-deep sequencing detects ovarian cancer cells in peritoneal fluid and reveals somatic TP53 mutations in noncancerous tissues. Proceedings of the National Academy of Sciences USA. 113 (21), 6005-6010 (2016).
Phallen, J., et al. Direct detection of early-stage cancers using circulating tumor DNA. ScienceTranslationalMedicine. 9, eaan2415 (2017).
Egorov, E. S., et al. Quantitative profiling of immune repertoires for minor lymphocyte counts using unique molecular identifiers. The Journal of Immunology. 194 (12), 6155-6163 (2015).

Play Video

PDF

DOI

DOWNLOAD MATERIALS LIST

Cite This Article

Wong, W. H., Tong, R. S., Young, A. L., Druley, T. E. Rare Event Detection Using Error-corrected DNA and RNA Sequencing. J. Vis. Exp. (138), e57509, doi:10.3791/57509 (2018).

Sjælden begivenhed registrering ved hjælp af fejl-korrigeret DNA og RNA sekventering

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgements

Materials

References

Tags

Play Video

Cite This Article

View Video

Sjælden begivenhed registrering ved hjælp af fejl-korrigeret DNA og RNA sekventering

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgements

Materials

References

Tags

Play Video

Cite This Article

View Video

✖

To prove you're not a robot, please enter the text in the image below