Vi har tidligere validert en protokoll for amplicon-basert hele genomet Usutu virus (USUV) sekvensering på en nanopore sekvensering plattform. Her beskriver vi metodene som brukes mer detaljert og bestemmer feilfrekvensen til nanopore R10-strømningscellen.
Hele genomsekvensering kan brukes til å karakterisere og spore virusutbrudd. Nanopore-baserte hele genomsekvenseringsprotokoller er beskrevet for flere forskjellige virus. Disse tilnærmingene benytter en overlappende amplicon-basert tilnærming som kan brukes til å målrette mot et bestemt virus eller en gruppe genetisk relaterte virus. I tillegg til bekreftelse av virusets tilstedeværelse, kan sekvensering brukes til genomiske epidemiologistudier, for å spore virus og avdekke opprinnelse, reservoarer og overføringsformer. For slike applikasjoner er det avgjørende å forstå mulige effekter av feilfrekvensen knyttet til plattformen som brukes. Rutinemessig anvendelse i kliniske og folkehelsemiljøer krever at dette er dokumentert med alle viktige endringer i protokollen. Tidligere ble en protokoll for hele genomet Usutu virussekvensering på nanoporesekvenseringsplattformen validert (R9.4 flowcell) ved direkte sammenligning med Illumina sekvensering. Her beskriver vi metoden som brukes til å bestemme den nødvendige lesedekningen, ved hjelp av sammenligningen mellom R10-flytcellen og Illumina-sekvenseringen som et eksempel.
Rask utvikling i tredje generasjons sekvensteknologier gjør at vi kan gå videre mot sekvensering i sanntid under virusutbrudd. Denne rettidige tilgjengeligheten av genetisk informasjon kan være nyttig for å bestemme opprinnelsen og utviklingen av virale patogener. Gullstandarder innen neste generasjons sekvensering er imidlertid fortsatt andre generasjons sequencere. Disse teknikkene er avhengige av spesifikke og tidkrevende teknikker som klonal forsterkning under en emulsjon PCR eller klonal bro forsterkning. Tredjegenerasjons sequencere er billigere, håndholdte og kommer med forenklede bibliotekforberedelsesmetoder. Spesielt den lille størrelsen på sekvensenheten og den lave kjøpesummen gjør den til en interessant kandidat for distribuerbar, feltbar sekvensering. Dette kan for eksempel ses under Ebola virusutbruddet i Sierra Leone og under den pågående arbovirus utbrudd undersøkelser i Brasil1,2,3. Den rapporterte høye feilfrekvensen4 kan imidlertid begrense programmene som nanoporesekvensering kan brukes for.
Nanopore sekvensering utvikler seg raskt. Nye produkter er tilgjengelige i markedet med jevne mellomrom. Eksempler på dette er for eksempel 1D-kvadrerte sett som muliggjør sekvensering av begge tråder av DNA-molekylet, og dermed øke nøyaktigheten av de kalte basene5 og utviklingen av R10-strømningscellen som måler endringen i strøm ved to forskjellige forekomster i pore6. I tillegg vil forbedrede bio-informatikkverktøy som forbedringer i basecalling forbedre nøyaktigheten av basecalling7. En av de mest brukte grunnanropstegnene ( f.eks. Albacore), har blitt oppdatert minst 12 ganger i løpet av en 9-måneders tidsperiode5. Nylig ga produsenten også ut en ny basecaller kalt flip-flop, som er implementert i standard nanopore programvare8. Sammen vil alle disse forbedringene føre til mer nøyaktige sekvenser og vil redusere feilfrekvensen til nanopore sequenceren.
Usutu virus (USUV) er et myggbåren arbovirus av familien Flaviviridae og det har et positivt strandet RNA-genom på rundt 11.000 nukleotider. USUV påvirker hovedsakelig store grå ugler og blackbirds9,10, selv om andre fuglearter er også utsatt for USUV infeksjon11. Nylig ble USUV også identifisert i gnagere og shrews selv om deres potensielle rolle i overføring av viruset forblir ukjent12. Hos mennesker har asymptomatiske infeksjoner blitt beskrevet hos blodgivere13,14,15,16 mens USUV-infeksjoner også er rapportert å være forbundet med encefalitt eller meningo-encefalitt17,18. I Nederland ble USUV først oppdaget hos ville fugler i 201610 og i asymptomatiske blodgivere i 201814. Siden den første oppdagelsen av USUV har utbrudd blitt rapportert i løpet av de påfølgende årene, og overvåking, inkludert hele genomsekvensering, pågår for tiden for å overvåke fremvoksende og spredning av et arbovirus i en tidligere naiv befolkning.
Ligner på det som er beskrevet for andre virus, som Ebola virus, Zika virus og gul feber virus3,19,20, har vi utviklet en primer satt til sekvens full lengde USUV21. Denne polymerasekjedereaksjonen (PCR)-basert tilnærming gjør det mulig å gjenopprette USUV-genomer i full lengde fra svært vertsforurensede prøvetyper som hjerneprøver i prøver opp til en Ct-verdi på rundt 32. Fordelene med en ampliconbasert sekvenseringstilnærming er en høyere følsomhet sammenlignet med metaagenomisk sekvensering og høyere spesifisitet. Begrensninger ved bruk av en amplicon-basert tilnærming er at sekvensene skal være like for å designe primere som passer alle stammer og at primere er utformet på vår nåværende kunnskap om virusmangfoldet.
Gitt den konstante utviklingen og forbedringene i tredje generasjons sekvensering, er det behov for å evaluere feilfrekvensen til sequenceren regelmessig. Her beskriver vi en metode for å evaluere ytelsen til nanopore direkte mot Illumina sekvensering ved hjelp av USUV som et eksempel. Denne metoden brukes på sekvenser generert med den nyeste R10 flow celle og basecalling utføres med den nyeste versjonen av flip-flop basecaller.
Nanopore sekvensering er i stadig utvikling, og derfor er det behov for metoder for å overvåke feilfrekvensen. Her beskriver vi en arbeidsflyt for å overvåke feilfrekvensen til nanoporesequenceren. Dette kan være nyttig etter utgivelsen av en ny flytcelle, eller hvis nye versjoner av basekall er utgitt. Dette kan imidlertid også være nyttig for brukere som ønsker å konfigurere og validere sin egen sekvenseringsprotokoll.
Ulike programvare- og justeringsverktøy kan gi forskjellige resultater33. I dette manuskriptet hadde vi som mål å bruke fritt tilgjengelige programvarepakker som ofte brukes, og som har klar dokumentasjon. I noen tilfeller kan preferanse gis til kommersielle verktøy, som vanligvis har et mer brukervennlig grensesnitt, men må betales for. I fremtiden kan denne metoden brukes på samme prøve i tilfelle store modifikasjoner i sekvensteknologi eller basecalling programvare introduseres Fortrinnsvis dette bør gjøres etter hver oppdatering av basecaller eller flowcell, men gitt hastigheten på dagens utvikling dette kan også gjøres først etter store oppdateringer.
Reduksjonen i feilfrekvensen i sekvensering gjør det mulig for et høyere antall prøver å bli multipleksert. Dermed kommer nanoporesekvensering nærmere å erstatte konvensjonelle sanntids-PCRs for diagnostiske analyser, som allerede er tilfelle for influensavirusdiagnostikk. I tillegg øker reduksjonen av feilfrekvensen brukervennligheten til denne teknikken sekvensering, for eksempel for fastsettelse av mindre varianter og for objektiv metaagenomisk sekvensering med høy gjennomstrømning.
Et kritisk skritt i protokollen er at nære, pålitelige referansesekvenser må være tilgjengelige. Primere er basert på dagens kunnskap om virusmangfold og må kanskje oppdateres av og til. Et annet kritisk punkt når du setter opp en amplicon-basert sekvenseringstilnærming, er balanseringen av primerkonsentrasjonen for å få en jevn balanse i amplicondybde. Dette gjør det mulig å multipleksing av flere prøver på en sekvenskjøring og resulterer i en betydelig kostnadsreduksjon.
The authors have nothing to disclose.
Dette arbeidet har fått støtte fra EUs forsknings- og innovasjonsprogram horizon 2020 under tilskuddsavtale nr.
Agencourt AMPure XP beads | Beckman Coulter | A63881 | |
dNTPs | Qiagen | 201900 | |
FLO-MIN106 R10 flowcell | Nanopore | R10 flowcell | |
KAPA Hyperplus libarary preparation kit | Roche | 7962436001 | |
Library Loading Bead Kit | Nanopore | EXP-LLB001 | |
Ligation Sequencing Kit 1D | Nanopore | SQK-LSK109 | |
Native Barcoding Kit 1D 1-12 | Nanopore | EXP-NBD103 | |
Native Barcoding Kit 1D 13-24 | Nanopore | EXP-NBD104 | |
NEB Blunt/TA Ligase Master Mix | NEB | M0367S | |
NEB Next Quick Ligation Module | NEB | E6056 | |
NEB Next Ultra II End Repair / dA-Tailing Module | NEB | E7546S | |
Protoscript II Reverse Transcriptase | NEB | M0368X | |
Q5 High-Fidelity polymerase | NEB | M0491 | |
Qubit dsDNA HS Assay kit | Thermo Fisher | Q32851 | |
Random Primers | Promega | C1181 | |
RNAsin Ribonuclease Inhibitor | Promega | N2111 |