Rare Event Detection Using Error-corrected DNA and RNA Sequencing

Wing H. Wong; R. Spencer Tong; Andrew L. Young; Todd E. Druley

doi:10.3791/57509

JoVE Journal > Genetics

Please note that all translations are automatically generated. Click here for the English version.

Genetics

Detektion av sällsynta händelser med fel-korrigerade DNA och RNA-sekvensering

Published: August 03, 2018

doi:

10.3791/57509

Wing H. Wong*^1,2, R. Spencer Tong*^1,2, Andrew L. Young², Todd E. Druley²

¹Department of Pediatrics, Division of Hematology and Oncology,Washington University School of Medicine, ²Center for Genome Sciences and Systems Biology,Washington University School of Medicine

Summary

Nästa generations sekvensering (NGS) är ett kraftfullt verktyg för genomisk karakterisering som begränsas av den höga felprocenten av plattformen (~0.5–2.0%). Vi beskriver våra metoder för fel-korrigerade sekvensering som tillåter oss att undanröja NGS felprocenten och upptäcka mutationer på variant allel fraktioner lika sällsynt som 0,0001.

Abstract

Konventionella nästa generations sekvensering tekniker (NGS) tillåtit för enorma genomisk karakterisering för över ett decennium. NGS har särskilt använts för att analysera spectrumen av klonala mutationer i malignitet. Men långt effektivare än traditionella Sanger metoder, NGS kämpar med att identifiera sällsynta klonal och subclonal mutationer på grund av dess hög felfrekvens på ~0.5–2.0%. Sålunda, standard NGS har en detektionsgräns för mutationer som är > 0,02 variant allel bråkdel (VAF). Medan den kliniska signifikansen för mutationer denna sällsynta hos patienter utan känd sjukdom förblir oklart, patienter behandlas för leukemi har avsevärt förbättrat resultat när kvarvarande sjukdom är < 0,0001 av flödescytometri. För att mildra denna tingsliga bakgrund av NGS, har många metoder utvecklats. Här beskriver vi en metod för fel-korrigerade DNA och RNA sekvensering (ECS), som innebär taggning enskilda molekyler med både en 16 bp slumpmässiga för felkorrigering och en 8 bp patientspecifika index för multiplexering. Vår metod kan upptäcka och spåra klonal mutationer på variant allel fraktioner (VAFs) två tiopotenser lägre än detektionsgränsen för NGS och lika sällsynt som 0,0001 VAF.

Introduction

Som vi ålder, exponering till mutagena ämnen och stokastiska fel under celldelning resulterar i ansamling av somatiska avvikelser i genomet, och detta ligger till grund för grundläggande patogenesen av elakartad omformning, neuro-developmental sjukdomar, pediatric störningar och normalt åldrande¹^,². Somatiska mutationer med sjukdom-driving potential är viktiga diagnostiska och prognostiska biomarkörer för tidig upptäckt och risk management³^,⁴^,⁵. För att bättre förstå fysiologiska clonogenesis, är som kommer att informera kliniska och forskning beslut, exakt kvantifiering och karakterisering av dessa mutationer av primär betydelse. Nästa generations sekvensering (NGS) används för att studera klonal mutationer i heterogena DNA-prover; NGS är dock begränsad till att identifiera mutationer på > 0,02 variant allel bråkdel (VAF) — på grund av den inneboende fel-0,5 – 2,0% av sekvensering plattformar⁶^,⁷^,⁸. Som ett resultat, spåra diagnostiskt och prognostiskt betydande somatisk varianter på lägre VAF kan inte uppnås med hjälp av standard NGS.

Nyligen har olika metoder utvecklats för att kringgå felprocenten NGS⁸^,⁹^,¹⁰^,¹¹. Dessa metoder använder molekylär taggning, som gör det möjligt för felkorrigering efter sekvensering. Varje molekyl eller genomisk fragment i sekvensering biblioteket är Taggad med en random unika molekylära identifierare (UMI) som är specifik för den molekylen. UMIs är byggda av permutationer av en sträng av randomiserade nukleotider (8 – 16 N). En andra prov-specifika streckkod är också integrerad i arbetsflödet som möjliggör multiplexing flera prover i samma NGS sekvensering kör. PCR-amplifiering utförs på molekylärt märkta biblioteket och därefter biblioteket skickas för sekvensering. Under bibliotek beredning förväntas det att fel kommer att slumpmässigt introduceras till genomisk fragmentet under PCR-amplifiering och sekvensering⁸. Ta bort slumpmässiga sekvensering fel, är rå sekvensering läsningar grupperade enligt UMI. Artefakter från sekvensering förväntas inte vara närvarande i alla läser med samma UMI på samma genomiska position stokastiska pågrund av introduktion, en sann variant kommer vara troget förstärks och sekvenserade i alla läser som delar samma UMI. Artefakter är bioinformatically bort. Här, vi beskriver tre metoder för fel-korrigerade sekvensering (ECS) optimerad i laboratorium för DNA att identifiera enda nukleotid varianter (SNVs) och små införande-borttagningar (Indels) och RNA att underlätta kvantifiering av genuttryck nedan den NGS feltröskelvärdet.

Den första metoden beskrivs ett sätt att leta efter sällsynta somatiska händelsen med gen specifika primers designad av forskare. Innan biblioteket förberedelse, bör forskare utforma grundfärger att rikta fragment av intresse. Vi använde den webb-app Primer3 (http://bioinfo.ut.ee/primer3-0.4.0/). Amplikoner av 200 – 250 bp är idealiska för polymeraskedjereaktion (PCR) som dessa kommer, när UMIs har införlivats, generera överlappande Parade-end läsningar med 150 bp Parade-end läser. De optimala primer design villkor som används är: Minimum primer storlek = 19; Optimal primer storlek = 25; Maximala primer storlek = 30; Minsta Tm = 64 ° C; Optimal Tm = 70 ° C; Maximala Tm = 74 ° C; Maximala Tm skillnaden = 5 ° C; Minimihalt av GC = 45; Maximihalten GC = 80; Nummer att återvända = 20; Maximalt 3′ slutet stabilitet = 100.

I metod 2 beskriver vi en metod som kombinerar protokollet ECS-DNA med Illumina kemi till undersökning för klonal SNVs och små Indels lika sällsynt som 0,0001 VAF använder kommersiellt tillgängliga gen paneler som innehåller hundratals amplikoner. Vi har använt TruSight myeloisk sekvensering panelen (Illumina) för våra experiment och utformade en expanderad panel att inkludera ytterligare gener av intresse för pediatric myeloiska sjukdomar. Dessa paneler har inte erbjudit unika molekylära identifierare (UMIs) som skulle underlätta felkorrigering, så vi har lagt vår egen adapter strategi till dessa paneler. ECS bör fungera lika bra med någon av andra paneler som utformats för att berika för gener associerade med olika sjukdomar. Efter DNA isolering och efterföljande kvantifieringen från vävnad eller prov av intresse, det rekommenderas att ha minst 500 ng av lagret DNA per exemplar. Vi rutinmässigt göra en enda sekvensering bibliotek med 250 ng DNA för att fånga så mycket unika genomisk fragment som möjligt för nedströms läser de-duplicering och VAF beräkning. Ett valfritt replikera sekvensering bibliotek kan göras med återstående 250 ng DNA. Vi gör alltid två replikera bibliotek per prov, och vi anser endast dessa händelser upptäcks självständigt i båda replikat som sant positiva. Vi har också genomfört en genomisk position-specifika binomial fel modell för att öka noggrannheten i variant ringer⁴^,¹³.

Slutligen beskriver vi en metod som koppling ECS till RNA-sekvensering för avskrift kvantifiering med off-the-shelf QIAseq riktade RNA paneler (Qiagen). UMIs krävs för de-duplicering och felkorrigering har införlivats i kits och forskare kan göra bibliotek efter tillverkarens rekommendationer. Bioinformatically, forskare kan följa rörledningen beskrivs för ECS-DNA, som kommer att förklaras i detalj i avsnittet protokoll.

Protocol

1. riktade fel-korrigerade sekvensering för DNA PCR-amplifiering av genomisk fragment av intresse. Använd en HiFi-DNA-polymeras för att förstärka amplikoner (Material tabell, punkt 1). Förstärka PCR-reaktionen med följande villkor i en termocykel: 30 s vid 98 ° C; 18 – 40 cykler av 10 s på 98 ° C, 30 s vid 66 ° C och 30 s vid 72 ° C; 2 minuter vid 72 ° C; Håll vid 4 ° C. Rena PCR-produkterna med paramagnetiska pärlor (Material tabell, punkt 2). Lägg till PCR-reaktionen till pärlorna i förhållandet 1: 1.8 (PCR-reaktionsvolym: bead volym) enligt tillverkarens protokollet. Eluera med 20 µL av ddH2O. Kvantifiera koncentration av DNA (Material tabell, punkt 3) för att fastställa slutliga koncentrationen av DNA. Kör en alikvot av DNA på en 2% agarosgel (Material tabell, punkt 4) att bekräfta storleken på amplikoner.Obs: Alternativt forskare kan välja för att utföra en Bioanalyzer analys på PCR-produkter att bestämma storleken på förstärkta genomisk fragment samt koncentrationen av produkterna. Sekvensering adapter glödgning Erhålla i7 adaptrar (Material tabell, punkt 5). Använd dem som de tillhandahålls för efterföljande steg. Köpa 16N i5 adaptrar kommersiellt med följande oligo sekvens (material tabell objekt 6): AATGATACGGCGACCACCGAGATCTACAC(N1:25252525)(N1)(N1)(N1)(N1)(N1)(N1)(N1)(N1)(N1)(N1)(N1)(N1)(N1)(N1) (N1) ACACTCTTTCCCTACACGACGCTCTTCCGATCTObs: 16N i5 adaptrarna ersätter standard i5 korten och de adaptrar med en sträng med 16 random-nukleotid att underlätta ECS. Gör 16N i5 adapter fungerande lösning: 40 µL av 100 µM 16N i5 adapter lager, 10 µL TE buffert och 10 µL 500 µM NaCl-lösning. Alikvotens 7,5 µL i5 arbetslösning bereddes i steg 1.2.3 i separat PCR brunnar. Tillsätt 5 µL prov-specifika i7 adapter i motsvarande brunnar. Inkubera vid 95 ° C i 5 min och sedan kyla med 1 ° C varje 30 s till 4 ° C i en termocykel. Håll vid 4 ° C. Slutet-reparation & dA-tailing bibliotekObs: Parallellt med adapter glödgning, man kan utföra slutet reparation och dA-tailing på den PCR-amplikoner från steg 1,1. Efter slutförandet av dessa steg, ligering av glödgad adaptrar från steg 1,2 på slutet repareras och dA-tailed PCR-amplikoner utförs. Efter adapter ligatur är ECS bibliotek byggandet komplett. Börja med högst 1 µg av start DNA (minsta ~ 200 ng) Utföra slutet-reparation och dA-tail på amplikoner (Material tabell, punkt 7). Lägg till 3,0 µL slutet Prep enzym Mix och 6,5 µL av slutet reparation buffert. Inkubera mixen i 30 min vid 20 ° C, därefter i 30 min vid 65 ° C och håll vid 4 ° C. Utföra ligatur på glödgad nätverkskorten (Material tabell, punkt 8). Tillsätt 2,5 µL glödgad nätverkskort från steg 2, 15 µL av Blunt/TA Ligase Mastermix och 1 µL Ligation förstärkare. Inkubera mixen i 15 min vid 20 ° C, sedan under 15 minuter vid 37 ° C. Städa upp bibliotek med magnetiska pärlor (material tabell punkt 2): lägga till PCR-reaktionen till pärlor i förhållandet modifierade 1: 0,75 (PCR-reaktionsvolym: magnetiska pärla volym): Pipettera 62,6 µL magnetiska pärla lösning i den 83,5 µL av PCR produkter från steg 1.2.7. Överför blandningen till ett 1,5 mL låg bindande rör. Blanda omsorgsfullt genom pipettering upp och ner minst 10 gånger. Låt blandningen stå i rumstemperatur i 5 minuter. Placera röret på en magnetisk hållare. Inkubera i 2 minuter i rumstemperatur eller tills supernatanten är klart. Ta bort supernatanten. Tvätta pärlorna med 200 µL av 70% etanol. Inkubera i 30 s. ta bort etanol. Upprepa tvättningen etanol en gång. Lufttorka pärlorna. Eluera med 20 µL av ddH2O.Anmärkning: Denna ändring i PCR-reaktionen till magnetiska pärla förhållande kommer prioriterat bort DNA-fragment som är mindre än 200 bp. Kvantifiering av droplet digital PCRObs: Exakt mutation kvantifiering kräver strikt efterlevnad av antalet molekyler av varje bibliotek som lastas på sequencer. För att uppnå detta, kvantifiera antalet molekyler för enskilda bibliotek per volymenhet utförs med hjälp av QX200 droplet digital PCR (ddPCR) plattform — kvantitativa PCR är ett alternativ. Efter ddPCR analys anger utslaget antalet molekyler per µL per bibliotek. Späd ECS bibliotek 1:1,000 genom stegvis spädning med en faktor 10 i PCR-strip-rören. Förbereda de följande mastermix för ddPCR i 1,5 mL tub: 10 µL av PCR-Mix (Material tabell, punkt 9), 0,2 µL av P5 Primer, 0.2 µL av P7 Primer, 5 µL av ECS städas upp produkten från steg 1.4.1., och 4,5 µL av ddH2O. Alikvotens 20 µL av mastermix till varje prov väl se till att det finns multiplar av 8. Alikvotens 70 µL av droplet generation olja (Material tabell, punkt 10) in varje oljekälla. Täcka kassett med en gummipackning. Göra små droppar med hjälp av droplet-generator (Material tabell, punkt 11). Med hjälp av en flerkanalspipett, Ladda de droppar som genereras i steg 1.4.4 till ett PCR-plattan säkerställer att pipettering av provet görs långsamt över en spännvidd på 5 sekunder för att undvika klippning DNA. Förstärka signalen i droppar för 40 cykler i en termocykel med följande villkor: 5 min vid 95 ° C; 40 cykler av 30 s vid 95 ° C, 1 min vid 63 ° C; 5 minuter vid 4 ° C, 5 min vid 90 ° C; och håll sedan vid 4 ° C. Förbered ddPCR mall droplet läsaren maskin (Material tabell, punkt 11). Säkerställa specifikation för parametrar för Absolut kvantifiering och använda den QX200 ddPCR Eva Green Supermix. När ddPCR analysen är klar, se till att ange samma splittrande tröskel över alla prover. Använda den koncentration avläsningen från QX200 Droplet läsaren, alikvot lämplig volym att införa önskat antal molekyler i efterföljande steg. PCR-amplifiering av biblioteken för sekvensering Förbereda de följande mastermix för önskat antal molekyler från steg 1.4.9: 25 µL av Q5 Mastermix (Material tabell, punkt 1), 2,5 µL P5 Primer (10 µM), 2,5 µL av P7 Primer (10 µM), X µL av DNA, 20-X µL av ddH2O. Förstärka biblioteken från steg 1.5.1 i en termocykel med följande villkor: 30 s vid 98 ° C; 20 cykler av 10 s på 98 ° C, 30 s vid 63 ° C, 30 s vid 72 ° C; 2 minuter vid 72 ° C; och håll sedan vid 4 ° C. Städa upp bibliotek med magnetiska pärlor (material tabell, punkt 2): lägga till PCR-reaktionen till magnetiska pärlor i en modifierad 1: 0,75 baserat (PCR-reaktionsvolym: magnetiska pärla volym). Pipettera över 37,5 µL magnetiska pärla lösning till 50 µL PCR produkter från steg 1.5.2. Överför blandningen till ett 1,5 mL låg bindande rör. Blanda omsorgsfullt genom pipettering upp och ner minst 10 gånger. Låt blandningen stå i rumstemperatur i 5 min. Placera röret på en magnetisk hållare. Inkubera i 2 minuter i rumstemperatur eller tills supernatanten är klart. Ta bort supernatanten. Tvätta pärlorna med 200 µL av 70% etanol. Inkubera i 30 s. ta bort etanol. Upprepa tvättningen etanol en gång. Lufttorka pärlorna. Eluera med 20 µL av ddH2O. Kör en alikvot av DNA på en 2% agarosgel att bekräfta storleken på amplikoner. Kvantifiera koncentration av DNA (Material tabell, punkt 3) för att bestämma koncentrationen av de separata ECS-bibliotek. Pool, biblioteken i equimolar belopp.Obs: till exempel forskare kan pool åtta bibliotek i en equimolar grupp4 med 4 miljoner börjar molekyler för sekvensering använder en sekvensering plattform som utgångar upp till 400 miljoner läsningar. Konservativt, rekommenderas det att använda ett genomsnitt av tio raw-läsningar för felkorrigering per molekyler. Detta skulle ta upp 360 miljoner läsningar (4 miljoner molekyler * 8 bibliotek * 10 läser för felkorrigering). Med 4 miljoner unika molekyler per bibliotek, kan forskare räkna med att få teoretiska medelvärdet konsensus Läs täckning av 7042 x per amplikon (4 miljoner/568 amplikoner från panelen genen). Kvantifiera koncentration av DNA (Material tabell, punkt 3) för att bestämma koncentrationen av poolade ECS bibliotek. Lämna in det poolade ECS-biblioteket på ungefär 4 nM. Ange följande inställningar för sekvensering att Illumina sekvensering plattformar (MiSeq, HiSeq eller NextSeq): 2 x 144 Parade-end läser, 8 cykler Index 1 och 16 cykler Index 2. 2. gen paneler med fel-korrigerade sekvensering av DNA Hybridisering av oligos från gen panelerObs: I det här steget kommer en konstruera sekvensering bibliotek använder en modifierad Illumina TruSight eller TruSeq-protokollet för att införliva UMIs (Material tabell, punkt 17). Hybridisera oligos på genomisk fragment efter tillverkarens protokollet. Användning 250 ng DNA (eller någon önskad mängd utgångsmaterial). Ta bort obundna oligos efter tillverkarens protokollet. Utföra förlängning-ligatur efter tillverkarens protokollet.Obs: Ändringar av tillverkarens protokollet börjar nedan. Införlivandet av i5 och i7 adaptrar via PCR Förbereda den PCR mastermix av pipett följande reagenser till ett rör med lämplig volymstorlek: 37,5 µL av Q5 Mastermix (Material tabell, punkt 1), 6 µL 10 µM 16N i5 adaptrar (detaljerad i metod 1, steg 1.2.2), 6 µL av i7 adaptrar (Använd olika i7 adaptrar för separata prover för multiplexing), och 22 µL förlängning-ligatur lösning med pärlor från steg 2.1.3.Obs: Den Q5 Mastermix ersätter polymeras mastermix som tillhandahålls av Illumina. Q5 polymerasen förstärker genomisk fragmentet med högre trohet och färre introducerade fel. Köra PCR-program på en termocykel med följande parametrar: 30 s vid 98 ° C, 4 – 6 cykler av 10 s på 98 ° C, 30 s vid 66 ° C, 30 s vid 72 ° C; 2 min vid 72 ° C, och håll sedan vid 4 ° C.Anmärkning: Antalet cykler beror på storleken på panelen. Från vår erfarenhet är en 4-takts PCR tillräcklig om panelen genen har ca 1500 olika par av genen specifika oligos, medan en panel med 500 – 600 par oligos kräver 6 cykler av PCR. Städa upp PCR-reaktioner med magnetiska pärlor (material tabell, punkt 2): lägga till PCR-reaktionen till magnetiska pärlor i en modifierad 1 PCR-reaktion: 0,75 baserat på magnetiska pärla: Pipettera 56.25 µL magnetiska pärla lösning i de 75 µL av PCR produkter från steg 2.2.2. Överför blandningen till ett 1,5 mL låg bindande rör. Blanda omsorgsfullt genom pipettering upp och ner minst 10 gånger. Låt blandningen stå i rumstemperatur i 5 min. Placera röret på en magnetisk hållare. Inkubera i 2 min i rumstemperatur eller tills supernatanten är klart. Ta bort supernatanten. Tvätta pärlorna med 200 µL av 70% etanol. Inkubera i 30 s. ta bort etanol. Upprepa tvättningen etanol en gång. Lufttorka pärlorna. Eluera med 20 µL av ddH2O. Kvantifiera bibliotek med hjälp av QX200 ddPCR plattform. Följ steg 1.4 i metod 1.Obs: 4 miljoner molekyler var normaliserade per prov bibliotek4 i det representativa resultatet (figur 2) för att erhålla en teoretiska medelvärdet av 7,042 unikt indexerade molekyler (4 miljoner dividerat med 568 gen-specifika oligos). Förstärka och normalisera bibliotek för sekvensering. Förstärka önskat antal molekyler med den följande mastermix för sista PCR totalt 50 µL: 25 µL av Q5 Mastermix, 2 µL av P5 Primer (1 µM), 2 µL av P7 Primer (1 µM), och 21 µL av DNA-molekyler. Köra PCR-program på en termocykel med följande parameter: 30 s vid 98 ° C; 16 cykler av 10 s på 98 ° C, 30 s vid 66 ° C, 30 s vid 72 ° C; 2 minuter vid 72 ° C; och håll sedan vid 4 ° C. Städa upp sekvensering bibliotek med hjälp av magnetiska pärlor (Material tabell, punkt 2): lägga till PCR-reaktionen till magnetiska pärlor i en modifierad 1 PCR-reaktion: 0,75 baserat på magnetiska pärla: Pipettera över 37,5 µL magnetiska pärla lösning till 50 µL PCR produkter från steg 2.4.2. Överför blandningen till ett 1,5 mL låg bindande rör. Blanda omsorgsfullt genom pipettering upp och ner minst 10 gånger. Låt blandningen stå i rumstemperatur i 5 min. Placera röret på en magnetisk hållare. Inkubera i 2 min i rumstemperatur eller tills supernatanten är klart. Ta bort supernatanten. Tvätta pärlorna med 200 µL av 70% etanol. Inkubera i 30 s. ta bort etanol. Upprepa tvättningen etanol en gång. Lufttorka pärlorna. Eluera med 20 µL av ddH2O. Kör en alikvot av eluerade DNA (~ 3 µL) på en 2% agarosgel att bekräfta storleken på amplikoner. Kvantifiera koncentration av DNA (Material tabell, punkt 3) för att bestämma koncentrationen av de separata ECS-bibliotek. Pool, biblioteken i equimolar belopp. Se metod 1 steg 1.5.6. och också diskussion för mer information om poolning. Lämna in det poolade ECS-biblioteket på ungefär 4 nM. Ange följande inställningar för sekvensering att Illumina sekvensering plattformar (MiSeq, HiSeq eller NextSeq): 2 x 144 Parade-end läser, 8 cykler Index 1 och 16 cykler Index 2. ECS bioinformatiska bearbetning och analys Skaffa den prov-demultiplexed läser från sequencer eller utföra demultiplexning av rå sekvensen läser in olika prov med i7 adapter sekvenser bioinformatically med ett anpassat skript. Trimma bort de första 30 nucleotides av varje demultiplexed Läs ta bort oligo sekvenser från panelen genen. Justera läsningar som delar de samma UMIs till varandra för att bilda Läs familjer.Obs: Forskare kan använda UMI-medveten programvara såsom MAGERI13 att extrahera Läs familjer. Ingen hamming avstånd var tillåten inom UMI sekvensen i detta experiment att öka specificiteten av metoden. Utföra de-duplicering och felkorrigering använder följande rekommenderade parametrar. Par i samma Läs användning ≥5 familj. Minst tre Läs par rekommenderas. Jämföra nukleotid på varje position i alla läser samma Läs familj och generera en konsensus-nukleotid om det finns minst 90% konkordans bland läser för de särskilda nukleotid. Ring en N om det finns mindre än 90% avtal för nukleotid position. Kassera samförstånd läsningar som har > 10% av det totala antalet samförstånd nukleotider kallas som N. Justera alla balanserade konsensus lyder lokalt till antingen hg19 eller hg38 mänsklig referens genomet med forskarens Rekommenderad aligner(s) såsom Bowtie2 och BWA. Processen i linje läser med Mpileup med hjälp av parametrar – BQ0 – d 10,000,000,000,000 ta bort täckning tröskelvärden för att säkerställa en korrekt pileup oavsett VAF. Filtrera ut positioner med mindre än 1000 x samförstånd Läs täckning.Obs: Forskaren bestämmer den lägsta täckningen för varje nukleotid position godtyckligt, det rekommenderas att ha minst 500 x samförstånd Läs täckning för efterföljande analys. Använd binomialfördelningen för att ringa enda nukleotid varianter (SNP) i lagrade uppgifter från steg 2.5.7 med följande parametrar. Den binomiala statistiken kommer att baseras på en genomisk position-specifikt fel modell. Varje genomisk position är modellerad självständigt efter sammanräkning in fel priser av alla prover för det särskilda ställning. Exempel:Sannolikheten för nukleotid profil på en viss genomisk position, p∑ Variant RF2 ∑ totala RFs= 26/255505= 0.000101759Binomial sannolikhet av 24 variant RFs ur 35911 totala RFs, P(X ≥ x) i provet K= 1 – binomial(24, 35911, 0.000101759)= 2.26485E-13Obs: För varje genomisk position som efterfrågas, det skulle bli tre möjliga mutationsanalys förändringar (dvs.A > T, A > C, A > G), och som alla skulle vara representerade som bakgrund artefakt. Somatiska händelser som skiljer sig avsevärt från bakgrunden efter Bonferroni korrigering behålls. I exemplet i tabell 1, antalet tester utförs var 11, därav en Bonferroni korrigeras p-värde ≤0.00454545 (0,05/11) var tvungen att ringa en händelse som statistiskt signifikanta. Somatiska händelser är skyldig att vara närvarande i båda replikerar från samma prov; annars betrakta dem som falska positiva. Tabell 1: Exempel demonstrerar sättet att konstruera en position-specifika binomial fel modell. 3. fel-korrigerade sekvensering av RNA Förutom att bedöma för mutationer på DNA-nivå, integrera ECS med olika riktade RNA-sekvensering paneler att upptäcka sällsynta eller låg överflöd avskrift på RNA-nivå. Genom att kombinera ECS med off-the-shelf Qiagen RNA-sekvensering paneler, visat vi digital kvantifiering av genuttryck för avskrifter med så få som tio kopior utan behov av normalisering mot en städning gen. De UMIs krävs för felkorrigering har integrerats i panelen. Utföra total RNA-extraktion (Material tabell, punkt 20). Genomföra ECS-RNA bibliotek beredning enligt tillverkarens protokollet (Material tabell, punkt 19). Utföra bioinformatik rörledning enligt steg 2.5.1–2.5.6. Metod 2 som beskrivs i föregående avsnitt. Efter steg 2.5.6 representerar antalet justerad samförstånd läsningar per gen nivån uttryck av genen utan behov av genen längd normalisering.

Representative Results

Med Targeted Error-Corrected sekvensering för DNA, har vi utfört ett bevis av princip experiment späda mutant patienten DNA i kommersiella genomiskt DNA. Patienten hade en mutation i GATA1 (chrX:48650264, C > G) med ursprungliga VAF av 0,19. I figur 1 visar vi att ECS är kvantitativt till en nivå av 1:10,000 för enda nukleotid variant. Figur 1: utspädning serie GATA1 SNV visar att ECS är kvantitativa nivån på 1:10,000. Klicka här för att se en större version av denna siffra. Vi visar också att ECS-DNA tillförlitligt upptäcker sällsynt klonal mutationer i gener återkommande i vuxna akut myeloisk leukemi (AML) i friska äldre individer4. Vi fått lättcellsskikt prover från 20 friska individer i sjuksköterskans Health Study bankas ungefär ~ 10 års mellanrum. ECS-DNA panel protokollet har tillämpats på dessa prover. För detta experiment, vi anpassade Illumina TruSight myeloisk sekvensering panelen som består av 568 amplikoner (mer information på genen lista på https://www.illumina.com/products/by-type/clinical-research-products/trusight-myeloid.html) och sekvenseras 80 bibliotek från 20 individer (2 samlingar vid olika tidpunkter, 2 replikat per individ per tid punkt) med Illumina NextSeq platform, vilket genererat ett genomsnitt på 47,7 miljoner Parade-end läsningar och ett genomsnitt på 3,4 miljoner fel-korrigerade konsensus-sekvenser per bibliotek4. Den genomsnittliga nukleotid täckningen per bibliotek var ungefär 6 000 x (3,4 miljoner dividerat med 568). För varje prov konstruerat vi en position-specifikt fel profil med sekvenserade bibliotek som inte är från samma prov. Vi hittade 109 klonal somatiska mutationer som fanns i både replikat av minst en samling tidpunkt. Dessa mutationer har VAF alltifrån 0.0003 – 0.1451. Vi valt 21 mutationer med kända KOSMISKA representationer och validerade alla 21 mutationer i en eller två collection tid (s) med ddPCR (n = 34, figur 2, anpassade från unga et al. 20164). Figur 2: mutationer identifieras av ECS kontrollerades via ddPCR med mycket samstämmiga VAFs. (n = 34, modifierad från unga et al. 20164). Klicka här för att se en större version av denna siffra. När det gäller fel-korrigerade uttryck nivå med ECS-RNA-protokollet, anpassat vi en gen panel med hjälp av QIAseq kemi som består av 416 gener kända för att vara associerade med olika cancerformer (anpassad från QIAseq Human Cancer transkriptom panel), och vi förstärks de oftast uttryckt exon av en viss gen (genen lista i kompletterande Material 1). Vi sekvenserade biblioteken använder Illumina MiSeq plattformen i parad-slutet format som gav i genomsnitt 8,3 miljoner läsningar per bibliotek, och vi lyckades fånga ett genomsnitt av 0.417 miljoner fel-korrigerade samförstånd sekvenser. Vi visade att nivån uttryck av låg överflöd avskrift (< 1000 avskrift greven i 50 ng av total-RNA) är mycket reproducerbara mellan replikat (data pekar n = 300, figur 3). Validering av ddPCR (sex utvalda gener av varierande grad av uttryck) visade att nivån uttryck av gener korrekt hade fångats av ECS protokollet utan behov av normalisering. Figur 3: topp, korrelation av avskrift räknas av ECS-RNA mellan replikat av samma prov (n = 300). Botten, avskrift räknas som identifierats av ECS kontrollerades av ddPCR (n = 6). Klicka här för att se en större version av denna siffra.

Discussion

Här visar vi en svit av fel-korrigerade sekvensering protokoll som enkelt kan implementeras för att studera mutationer med låg VAFs vid olika sjukdomar. Den viktigaste faktorn är införlivandet av UMIs med varje molekyl innan sekvensering som de aktivera felkorrigering av raw läser. Metoderna som beskrivs här tillåter forskare att införliva anpassade UMIs både kommersiellt tillgängliga gen paneler och egendesignade gen-specifika oligos.

NGS standardprotokoll utesluter detektion av mutationer med VAF under 2% på grund av sekvensering felprocenten, och detta begränsar tillämpningen av NGS i studier där detektion av sällsynta varianter är avgörande. Genom att kringgå standard NGS felprocenten, möjliggör ECS känslig detektion av dessa råa varianter. Detektion av patogena mutationer när dessa mutationer uppstår först (därför med låg VAF) är exempelvis nödvändigt att informera tidigt ingripande av sjukdom¹⁴^,¹⁵. I leukemi forskning, detektion av minimal kvarvarande sjukdom (kvarstående leukemic celler efter behandling) informerar riskstratifiering och kunde användas för att informera behandlingsalternativ på ett sätt som binära flödet flödescytometrisk bedömningar inte kan. ECS är dessutom tillämplig att upptäcka cirkulerande tumör-nukleinsyra och utvärdera metastatisk potential i solid tumör patienter genom att utvärdera för närvaro/frånvaro samt variant bördan av vissa mutationer som är kännetecken för primärt tumör¹⁶.

Som visat i tabell 1, beror har befogenhet att använda binomialfördelningen-baserade position-specifika fel modell för att kalla varianter på antalet sekvenserade bibliotek samt djupet av sekvensering används för att bygga den fel modellen. Robustheten av fel modellen ökar med högre antal prover och mer sekvensering djup. Det rekommenderas att använda minst 10 sekvenserade prover med ett genomsnitt på fel-korrigerade Läs täckning av 3000 x per prov för att bygga en fel profil för varje prov. Position-specifika tillvägagångssättet är liknande till MAGERI, men istället för att använda en aggregerad felprocent för alla sex olika substitution typer (A > C/T > G, A > G/T > C, A > T/T > A, C > A/G > T, C > G/G > C C > T/G > A)¹³, vi modell varje substitution oberoende vid varje position. Exempelvis en felfrekvens på C > T vid en viss genomisk position skiljer sig från en annan position. Vårt arbetssätt tar också hänsyn till en sekvensering batch effekt, eftersom bas substitution-grad som observerats i en sekvensering kör kan skilja sig från en annan körning. Därför är det viktigt att modellera varje position för alla substitution typer speciellt när prover från olika sekvensering körningar sammanförs för att bygga modellen.

En viktig faktor när du utformar ett ECS experiment är den önska påvisbara gränsen. Skönheten i NGS studier är att de enkelt kan skalas upp i form av gener/mål av intresse, påvisbara gränsen (dikteras av djup av sekvensering) och antalet individer som efterfrågas. Om forskarna är intresserad att hitta sällsynta mutationer i två amplikoner med ett upptäckt tröskelvärde på 0,0001, kan de till exempel pool maximally 75 prover i en enda sekvensering köras med MiSeq V2 kemi som utgångar upp till 15 miljoner läsningar (2 amplikoner * 10 000 molekyler * 10 läser för felkorrigering * 75 prover = 15 miljoner sekvensering läsningar). Forskare kan variera antalet molekyler gå in sekvensering eller antalet poolade prover i en enda sekvensering kör för att justera den påvisbara gränsen. I våra studier syftar vi till att hitta mutationer med ett tröskelvärde för detektion av 0,0001 VAF (1:10 000) med hjälp av Illumina gen panelen. Vi använder rutinmässigt 250 ng av start DNA för att säkerställa att tillräcklig molekyler fångas för att uppnå den ovan nämnda påvisbara gränsen. Forskare kan välja för att börja med lägre mängd DNA (50 ng rekommenderas) om önskad detektionsgränsen är > 0,001 VAF.

UMIs läggs på i5 indexen, måste sekvensering inställningar följaktligen ändras. Till exempel använde vi 16 N UMIs och sekvensering inställningarna var 2 x 144 Parade slutet läsningar, 8 cykler av Index 1 och 16 cykler av index 2 i motsats till vanliga 8 cykler av Index 2. Ökningen i Index 2 cykel kompenseras av en minskning av det totala antalet cykler som tilldelats läser. Om forskare väljer för att använda 12N UMIs¹⁰^,¹⁷, bör inställningarna ändras till 12 behandlingscykler om Index 2.

UMI-baserade sekvensering metoden är optimerad för att korrigera för sekvensering fel. Det återstår suboptimal i hanteringen av PCR-jackpotting, som är en fråga för alla förstärkning-baserad metod. Vi spelade rundor efter sekvensering och post-bioinformatik validering med ddPCR och vi upptäcka knappast eventuella falsklarm på grund av PCR-jackpotting. Det rekommenderas dock att forskare genomföra experiment med HiFi-polymeras för att säkerställa låg förstärkning fel.

Disclosures

The authors have nothing to disclose.

Acknowledgements

Vi tackar deltagarna i barnens Oncology Group AAML1531 studie och sjuksköterskors hälsa studera för deras bidrag i form av patientprover. Detta arbete finansierades av National Institutes of Health (UM1 CA186107, RO1 CA49449 och RO1 CA149445), barnens Discovery Institute i Washington University och St. Louis Children’s Hospital (MC-II-2015-461) och Eli Seth Matthews leukemi Foundation.

Materials

Q5 High Fidelity Hot Start Master Mix	New England BioLabs	M0492S
Agencourt AMPure XP	Beckman Coulter	A63880
Qubit dsDNA HS Assay Kit	Thermo Fisher Scientific	Q32854
SYBR Safe DNA Gel Stain	Thermo Fisher Scientific	S33102
Truseq Custom Amplicon Index Kit	Illumina	FC-130-1003
UMI i5 adapter sequences	Integrated DNA Technologies	–
NEBNext Ultra End Repair/dA-Tailing Module	New England BioLabs	E7442S
NEBNext Ultra II Ligation Module	New England BioLabs	E7595S
QX200 ddPCR EvaGreen Supermix	Bio-Rad	1864034
QX200 Droplet Generation Oil for EvaGreen	Bio-Rad	1864005
QX200 Droplet Digital PCR System	Bio-Rad	1864001
ddPCR 96-Well Plates	Bio-Rad	12001925
DG8 Cartridges for QX200/QX100 Droplet Generator	Bio-Rad	1864008
DG8 Gaskets for QX200/QX100 Droplet Generator	Bio-Rad	1863009
Bioanalyzer	Agilent Genomics	G2939BA
TapeStation	Agilent Genomics	G2991AA
TruSight Myeloid Sequencing Panel	Illumina	FC-130-1010
Bowtie 2	Johns Hopkins University	–
Customized QIAseq Targeted RNA Panel	Qiagen	–
Rneasy Plus Mini Kit (50)	Qiagen	74134

References

Hoang, M. L., et al. Genome-wide quantification of rare somatic mutations in normal tissues using massively parallel sequencing. Proceedings of the National Academy of Sciences USA. 113, 9846-9851 (2016).
O’Roak, B. J., et al. Sporadic autism exomes reveal a highly interconnected protein network of de novo mutations. Nature. 485, 246-250 (2012).
Young, A. L., et al. Quantifying ultra-rare pre-leukemic clones via targeted error-corrected sequencing. Leukemia. 29 (7), 1608-1611 (2015).
Young, A. L., Challen, G. A., Birmann, B. M., Druley, T. E. Clonal hematopoiesis harbouring AML-associated mutations is ubiquitous in healthy adults. NatureCommunications. 7, 12484 (2016).
Patel, J. P., et al. Prognostic relevance of integrated genetic profiling in acute myeloid leukemia. New England Journal of Medicine. 366, 1079-1089 (2012).
Shendure, J., Ji, H. Next-generation DNA sequencing. Nature Biotechnology. 26 (10), 1135-1145 (2008).
Kohlmann, A., et al. Monitoring of residual disease by next-generation deep-sequencing of RUNX1 mutations can identify acute myeloid leukemia patients with resistant disease. Leukemia. 28, 129-137 (2014).
Luthra, R., et al. Next-generation sequencing-based multigene mutational screening for acute myeloid leukemia using MiSeq: applicability for diagnostics and disease monitoring. Haematologica. 99, 465-473 (2014).
Kinde, I., Wu, J., Papadopoulos, N., Kinzler, K. W., Vogelstein, B. Detection and quantification of rare mutations with massively parallel sequencing. Proceedings of the National Academy of Sciences USA. 108 (23), 9530-9535 (2011).
Schmitt, M., et al. Detection of ultra-rare mutations by next-generation sequencing. Proceedings of the National Academy of Sciences USA. 109 (36), 14508-14513 (2012).
Vander Heiden, J. A., et al. pRESTO: a toolkit for processing high-throughput sequencing raw reads of lymphocyte receptor repertoires. Bioinformatics. 30 (13), 1930-1932 (2014).
Newman, A. M., et al. Integrated digital error suppression for improved detection of circulating tumor DNA. NatureBiotechnology. 34, 547-555 (2016).
Shugay, M., et al. MAGERI: Computational pipeline for molecular-barcoded targeted resequencing. PLOSComputationalBiology. 13 (5), e1005480 (2017).
Wong, T. N., et al. Role of TP53 mutations in the origin and evolution of therapy-related acute myeloid leukaemia. Nature. 518, 552-555 (2014).
Krimmel, J. D., et al. Ultra-deep sequencing detects ovarian cancer cells in peritoneal fluid and reveals somatic TP53 mutations in noncancerous tissues. Proceedings of the National Academy of Sciences USA. 113 (21), 6005-6010 (2016).
Phallen, J., et al. Direct detection of early-stage cancers using circulating tumor DNA. ScienceTranslationalMedicine. 9, eaan2415 (2017).
Egorov, E. S., et al. Quantitative profiling of immune repertoires for minor lymphocyte counts using unique molecular identifiers. The Journal of Immunology. 194 (12), 6155-6163 (2015).

Play Video

PDF

DOI

DOWNLOAD MATERIALS LIST

Cite This Article

Wong, W. H., Tong, R. S., Young, A. L., Druley, T. E. Rare Event Detection Using Error-corrected DNA and RNA Sequencing. J. Vis. Exp. (138), e57509, doi:10.3791/57509 (2018).

Detektion av sällsynta händelser med fel-korrigerade DNA och RNA-sekvensering

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgements

Materials

References

Tags

Play Video

Cite This Article

View Video

Detektion av sällsynta händelser med fel-korrigerade DNA och RNA-sekvensering

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgements

Materials

References

Tags

Play Video

Cite This Article

View Video

✖

To prove you're not a robot, please enter the text in the image below