Vi har tidigare validerat ett protokoll för amplicon-baserade hela genomet Usutu virus (USUV) sekvensering på en nanopore sekvensering plattform. Här beskriver vi de metoder som används mer i detalj och bestämmer felfrekvensen för nanopore R10-flödescellen.
Hela genomsekvensering kan användas för att karakterisera och spåra virusutbrott. Nanopore-baserade hela genomsekvenseringsprotokoll har beskrivits för flera olika virus. Dessa metoder använder en överlappande amplicon-baserade metod som kan användas för att rikta ett visst virus eller grupp av genetiskt relaterade virus. Förutom bekräftelse av virusnärvaron kan sekvensering användas för genomiska epidemiologistudier, för att spåra virus och reda ut ursprung, reservoarer och överföringssätt. För sådana tillämpningar är det viktigt att förstå möjliga effekter av felfrekvensen som är associerad med den plattform som används. Rutinmässig tillämpning i kliniska och folkhälsoinställningar kräver att detta dokumenteras med varje viktig förändring i protokollet. Tidigare validerades ett protokoll för hela genomet Usutu-virussekvensering på nanoporesekvenseringsplattformen (R9.4-flödescell) genom direkt jämförelse med Illumina-sekvensering. Här beskriver vi den metod som används för att bestämma den nödvändiga lästäckningen, med jämförelsen mellan R10-flödescellen och Illumina-sekvenseringen som exempel.
Den snabba utvecklingen inom tredje generationens sekvensteknik gör det möjligt för oss att gå vidare mot nära sekvensering i realtid under virusutbrott. Denna tid sett till att genetisk information är tillgänglig kan vara användbar för att bestämma viruspatogenernas ursprung och utveckling. Guld standarder inom nästa generations sekvensering är dock fortfarande andra generationens sequencers. Dessa tekniker är beroende av specifika och tidskrävande tekniker som klonal förstärkning under en emulsion PCR eller klonal bro förstärkning. De tredje generationens sequencers är billigare, handhållna och kommer med förenklade biblioteksberedningsmetoder. Speciellt den lilla storleken på sekvensenheten och det låga inköpspriset gör det till en intressant kandidat för utbyggbar, fältbar sekvensering. Detta kan till exempel ses under ebolavirusutbrottet i Sierra Leone och under de pågående utredningarna av utbrott av arbovirus i Brasilien1,2,3. Den rapporterade höga felfrekvensen4 kan dock begränsa de program för vilka nanoporesekvensering kan användas.
Nanopore sekvensering utvecklas snabbt. Nya produkter finns på marknaden regelbundet. Exempel på detta är till exempel de 1D-kvadratiska satser som möjliggör sekvensering av båda delarna av DNA-molekylen, vilket ökar noggrannheten hos de kallas baserna5 och utvecklingen av R10-flödescellen som mäter förändringen i ström vid två olika fall ipor6 . Dessutom kommer förbättrade bioinformatiska verktyg som förbättringar i bascalling att förbättra noggrannheten hos basecalling7. En av de mest använda basuppringarna (t.ex. Albacore) har uppdaterats minst 12 gånger under en niomånadersperiod5. Nyligen släppte tillverkaren också en ny basecaller kallas flip-flop, som genomförs i standard nanopore programvara8. Tillsammans kommer alla dessa förbättringar att leda till mer exakta sekvenser och kommer att minska felfrekvensen för nanopore sequencer.
Usutu virus (USUV) är en mygga-borne arbovirus av familjen Flaviviridae och det har en positiv-strandsatta RNA genomet på cirka 11.000 nukleotider. USUV drabbar främst stora gråugglor och koltrastar9,10, även om andra fågelarter är också mottagliga för USUV infektion11. Nyligen identifierades USUV också hos gnagare och shrews även om deras potentiella roll i överföringen av viruset är okänd12. Hos människor, asymtomatiska infektioner har beskrivits i blodgivare13,14,15,16 medan USUV infektioner har också rapporterats vara associerade med encefalit eller meningo-encefalit17,18. I Nederländerna upptäcktes USUV först hos vilda fåglar 201610 och i asymtomatiska blodgivare 201814. Sedan den första upptäckten av USUV har utbrott rapporterats under de följande åren och övervakning, inklusive hela genomsekvensering, pågår för närvarande för att övervaka framforskning och spridning av ett trädvirus i en tidigare naiv population.
I likhet med vad som har beskrivits för andra virus, såsom ebolavirus, Zika virus och gula febern virus3,19,20, har vi utvecklat en primer inställd på sekvens full längd USUV21. Denna polymeras kedjereaktion (PCR)-baserad metod möjliggör återvinning av full längd USUV genom från mycket värd-förorenade provtyper som hjärnprover i prover upp till ett Ct-värde på cirka 32. Fördelarna med en amplicon-baserad sekvensering sett är en högre känslighet jämfört med metagenomisk sekvensering och en högre specificitet. Begränsningar av att använda en amplicon-baserad metod är att sekvenserna bör vara liknande för att utforma primers passar alla stammar och att primers är utformade på vår nuvarande kunskap om viruset mångfald.
Med tanke på den ständiga utvecklingen och förbättringarna i tredje generationens sekvensering finns det ett behov av att regelbundet utvärdera felfrekvensen för sequencer. Här beskriver vi en metod för att utvärdera nanopores prestanda direkt mot Belysningsarmatursekvensering med USUV som exempel. Denna metod tillämpas på sekvenser som genereras med den senaste R10 flödescellen och basecalling utförs med den senaste versionen av flip-flop basecaller.
Nanopore sekvensering utvecklas ständigt och därför finns det ett behov av metoder för att övervaka felfrekvensen. Här beskriver vi ett arbetsflöde för att övervaka felfrekvensen för nanopore sequencer. Detta kan vara användbart efter lanseringen av en ny flödescell, eller om nya versioner av basecalling släpps. Detta kan dock också vara användbart för användare som vill ställa in och validera sitt eget sekvenseringsprotokoll.
Olika verktyg för programvara och justering kan ge olika resultat33. I detta manuskript syftade vi till att använda fritt tillgängliga mjukvarupaket som ofta används, och som har tydlig dokumentation. I vissa fall kan man prioritera kommersiella verktyg, som i allmänhet har ett mer användarvänligt gränssnitt men måste betalas. I framtiden kan denna metod tillämpas på samma prov om stora ändringar i sekvensteknik eller basanropsprogram införs Företrädesvis bör detta göras efter varje uppdatering av basuppringaren eller flödescellen, men med tanke på hastigheten på den aktuella utvecklingen kan detta också göras först efter större uppdateringar.
Minskningen av felfrekvensen vid sekvensering gör det möjligt att multiplexera ett högre antal prover. Därmed är nanopore sekvensering komma närmare att ersätta konventionella realtid PCRs för diagnostiska analyser, vilket redan är fallet för influensavirus diagnostik. Dessutom ökar minskningen av felfrekvensen användbarheten av denna tekniksekvensering, till exempel för bestämning av mindre varianter och för opartisk metagenomisk sekvensering med hög genomströmning.
Ett viktigt steg i protokollet är att nära, tillförlitliga referenssekvenser måste vara tillgängliga. Grundfärger är baserade på den nuvarande kunskapen om virusmångfald och kan behöva uppdateras då och då. En annan kritisk punkt när du ställer in en amplicon-baserad sekvensering strategi är balanseringen av primer koncentrationen för att få en jämn balans i amplicon djup. Detta möjliggör multiplexering av fler exempel på en sekvenskörning och resulterar i en betydande kostnadsminskning.
The authors have nothing to disclose.
Detta arbete har fått finansiering från Europeiska unionens forsknings- och innovationsprogram Horisont 2020 enligt bidragsavtalet nr 643476 (COMPARE).
Agencourt AMPure XP beads | Beckman Coulter | A63881 | |
dNTPs | Qiagen | 201900 | |
FLO-MIN106 R10 flowcell | Nanopore | R10 flowcell | |
KAPA Hyperplus libarary preparation kit | Roche | 7962436001 | |
Library Loading Bead Kit | Nanopore | EXP-LLB001 | |
Ligation Sequencing Kit 1D | Nanopore | SQK-LSK109 | |
Native Barcoding Kit 1D 1-12 | Nanopore | EXP-NBD103 | |
Native Barcoding Kit 1D 13-24 | Nanopore | EXP-NBD104 | |
NEB Blunt/TA Ligase Master Mix | NEB | M0367S | |
NEB Next Quick Ligation Module | NEB | E6056 | |
NEB Next Ultra II End Repair / dA-Tailing Module | NEB | E7546S | |
Protoscript II Reverse Transcriptase | NEB | M0368X | |
Q5 High-Fidelity polymerase | NEB | M0491 | |
Qubit dsDNA HS Assay kit | Thermo Fisher | Q32851 | |
Random Primers | Promega | C1181 | |
RNAsin Ribonuclease Inhibitor | Promega | N2111 |