Hybrid <em>De Novo</em> Genome Assembly for the Generation of Complete Genomes of Urinary Bacteria using Short- and Long-read Sequencing Technologies

Belle M. Sharon; Neha V. Hulyalkar; Vivian H. Nguyen; Philippe E. Zimmern; Kelli L. Palmer; Nicole J. De Nisco

doi:10.3791/62872

JoVE Journal > Genetics

Genética

Hybrid De Novo Genome Assembly for generering av komplette genomer av urinbakterier ved hjelp av kort- og langleste sekvenseringsteknologier

Published: August 20, 2021

doi:

10.3791/62872

Belle M. Sharon, Neha V. Hulyalkar, Vivian H. Nguyen, Philippe E. Zimmern, Kelli L. Palmer, Nicole J. De Nisco

¹Department of Biological Sciences,University of Texas at Dallas, ²Department of Urology,University of Texas Southwestern Medical Center

Summary

Denne protokollen beskriver en omfattende tilnærming for dyrking, sekvensering og de novo hybrid genom montering av urinbakterier. Det gir en reproduserbar prosedyre for generering av komplette, sirkulære genomsekvenser som er nyttige for å studere både kromosomale og ekstrakromosomale genetiske elementer som bidrar til urinkolonisering, patogenese og antimikrobiell resistensformidling.

Abstract

Komplette genomsekvenser gir verdifulle data for forståelse av genetisk mangfold og unike koloniseringsfaktorer for urinmikrober. Disse dataene kan omfatte mobile genetiske elementer, som plasmider og ekstrakroosomal fekt, som bidrar til spredning av antimikrobiell resistens og ytterligere komplisere behandling av urinveisinfeksjon (UVI). I tillegg til å gi fin oppløsning av genomstruktur, tillater komplette, lukkede genomer detaljerte komparative genomikk og evolusjonære analyser. Genereringen av komplette genomer de novo har lenge vært en utfordrende oppgave på grunn av begrensninger i tilgjengelig sekvenseringsteknologi. Pardelt Next Generation Sequencing (NGS) produserer korte lesninger av høy kvalitet, noe som ofte resulterer i nøyaktige, men fragmenterte genomsamlinger. Tvert imot gir Nanopore-sekvensering lange lesninger av lavere kvalitet som normalt fører til feilutsatte komplette samlinger. Slike feil kan hemme genom-brede assosiasjonsstudier eller gi villedende variantanalyseresultater. Derfor har hybridtilnærminger som kombinerer både korte og lange lesninger dukket opp som pålitelige metoder for å oppnå svært nøyaktige lukkede bakterielle genomer. Rapportert heri er en omfattende metode for kulturen av ulike urinbakterier, artsidentifikasjon ved 16S rRNA gensekvensering, utvinning av genomisk DNA (gDNA), og generering av korte og lange lesninger av henholdsvis NGS- og Nanopore-plattformer. I tillegg beskriver denne metoden en bioinformatisk rørledning av kvalitetskontroll-, monterings- og genprediksjonsalgoritmer for generering av kommenterte komplette genomsekvenser. Kombinasjon av bioinformatiske verktøy muliggjør valg av lesedata av høy kvalitet for hybrid genommontering og nedstrømsanalyse. Den strømlinjeformede tilnærmingen til hybrid de novo-genomenheten som er beskrevet i denne protokollen, kan tilpasses for bruk i alle dyrkbare bakterier.

Introduction

Urinmikrobiomet er et fremvoksende forskningsområde som har knust en tiår lang misforståelse om at urinveiene er sterile hos friske individer. Medlemmer av urinmikrobiota kan tjene til å balansere urinmiljøet og forhindre urinveisinfeksjon (UVI)¹^,². Uropathogene bakterier invaderer urinveiene og bruker forskjellige virulensmekanismer for å fortrenge den bosatte mikrobiota, kolonisere urotelet, unngå immunresponser og motvirke miljøtrykk^3,⁴. Urin er et relativt næringsbegrenset medium preget av høy osmolaritet, begrenset nitrogen- og karbohydrattilgjengelighet, lav oksygenering og lav pH⁵^,⁶^,⁷. Urin anses også å være antimikrobiell, sammensatt av høye konsentrasjoner av hemmende urea og antimikrobielle peptider som den menneskelige cathelicidin LL-37⁸. Å undersøke mekanismer som brukes av både beboende bakterier og uropathogener for å kolonisere urinveiene er avgjørende for å forstå urinveishelsen ytterligere og utvikle nye strategier for UVI-behandling. Videre, etter hvert som svikt i frontlinje antimikrobielle terapier blir vanligere, blir det stadig viktigere å overvåke spredningen av mobile genetiske elementer som bærer antimikrobielle resistens determinanter i populasjoner av urinbakterier^9,¹⁰.

For å undersøke genotyper og fenotyper av urinbakterier, er deres vellykkede kultur og påfølgende hele genomsekvensering (WGS) avgjørende. Kulturavhengige metoder er nødvendige for å oppdage og identifisere levedyktige mikrober i urinprøver¹¹. Standard klinisk urinkultur innebærer å plating urin på 5% saueblod agar (BAP) og MacConkey agar og inkubere aerobt ved 35 °C i 24 timer^{og 12}. Men med en deteksjonsterskel på ≥10⁵ CFU / ml¹³, rapporteres mange medlemmer av urinmikrobiota ikke ved denne metoden. Forbedrede kultiveringsteknikker som Enhanced Quantitative Urin Culture (EQUC)¹¹ bruker ulike kombinasjoner av forskjellige urinvolumer, inkubasjonstider, kulturmedier og atmosfæriske forhold for å identifisere mikrober som vanligvis går glipp av standard urinkultur. Beskrevet i denne protokollen er en modifisert versjon av EQUC, kalt her Modified Enhanced Urin Culture protocol, som muliggjør culturing av ulike urinbakterier og uropathogener ved hjelp av selektive medier og optimale atmosfæriske forhold, men er ikke iboende kvantitativ. Den vellykkede isolasjonen av urinbakterier muliggjør utvinning av genomisk DNA (gDNA) for nedstrøms WGS og genommontering.

Genomsamlinger, komplette samlinger spesielt, muliggjør oppdagelsen av genetiske faktorer som kan bidra til kolonisering, nisjevedlikehold og virulens blant både bosatte mikrobiota og uropatogengene bakterier. Utkast til genomsamlinger inneholder et mangfoldig antall sammenhengende sekvenser (sammenhengende) som kan inneholde sekvenseringsfeil og mangler orienteringsinformasjon. I en fullstendig genomsamling er både orienteringen og nøyaktigheten til hvert basispar verifisert¹⁴. Videre gir oppnåelse av komplette genomsekvenser innsikt i genomstruktur, genetisk mangfold og mobile genetiske elementer¹⁵. Korte lesninger alene kan identifisere tilstedeværelsen eller fraværet av viktige gener, men kan ikke finne deres genomiske kontekst¹⁶. Med muliggjørende langleste sekvenseringsteknologier som Oxford Nanopore og PacBio, krever det ikke lenger anstrengende metoder som manuell lukking av de novo-samlinger av multiplex PCR¹⁷^,¹⁸. Kombinasjonen av neste generasjons kortleste sekvensering og Nanopore langleste sekvenseringsteknologier gjør det mulig å facile generering av nøyaktige, komplette og lukkede bakterielle genomenheter til relativt lave kostnader¹⁹. Kortlest sekvensering gir nøyaktige, men fragmenterte genomsamlinger som vanligvis består av et gjennomsnitt på 40-100 sammenhengende, mens Nanopore-sekvensering genererer lange avlesninger på omtrent 5-100 kb i lengde som er mindre nøyaktige, men som kan tjene som stillaser for å bli med i sammenhengende og løse genomisk synteny. Hybrid tilnærminger ved hjelp av både kortleste og langleste teknologier kan produsere nøyaktige og komplette bakterielle genomer¹⁹.

Beskrevet her er en omfattende protokoll for isolering og identifisering av bakterier fra menneskelig urin, genomisk DNA-ekstraksjon, sekvensering og fullstendig genommontering ved hjelp av en hybrid monteringstilnærming. Denne protokollen legger særlig vekt på trinnene som er nødvendige for å endre lesninger som genereres ved kortlesing og langlest sekvensering for nøyaktig montering av et lukket bakterielt kromosom og ekstrakroosomale elementer som plasmider.

Protocol

Bakterier ble dyrket fra urin samlet inn fra samtykkende kvinner som en del av institusjonelle gjennomgangsstyregodkjente studier 19MR0011 (UTD) og STU 032016-006 (UTSW). 1. Modifisert forbedret urinkultur MERK: Alle kulturtrinn må utføres under sterile forhold. Steriliser alle instrumenter, løsninger og medier. Rengjør arbeidsområdet med 70% etanol, sett deretter opp en Bunsen brenner og arbeid forsiktig nær flammen for å redusere sjansene for forurensning. Alternativt kan et biosikkerhetsskap i klasse II brukes til å opprettholde et sterilt miljø. Bruk egnet personlig verneutstyr (PVU) for å unngå eksponering for potensielt patogene mikrober. Plating glyserolfylt urin og koloniisolasjon Tine glyserolfylt urin ved romtemperatur (RT). Når den er tint, virveler prøven i 5 s for å blande. I sterile mikrocentrifuge rør, forberede 1:3 og 1:30 fortynning av urinen i sterile 1x fosfat-bufret saltvann (PBS) til et endelig volum på 100 μL.MERK: Glyserolfylt urin fremstilles ved å blande 500 μL ufortynnet urin og 500 μL 50% steril glyserol i kryoårer og lagring ved -80 °C. Forvarm agarplater ved 37 °C i 15 minutter før bruk. Se figur 1 for medietyper og kulturforhold som er egnet for vanlige urinbakterielle slekter. Bland den fortynnede urinen godt ved pipettering før plating, plate 100 μL av fortynnet urin på ønsket agarplate og spre prøven ved hjelp av sterile glassperler. Plate 100 μL av 1x PBS-fortynningsmiddelet på en separat plate som ingen vekstkontroll.MERK: Hvis du forsøker å dyrke vanlige uropatogeniske arter (f.eks. Escherichia coli, Klebsiella spp., Enterococcus faecalis, etc.), anbefales det å bruke kromogene agar (Tabell over materialer) da det tillater enkel identifisering av uropathogene bakteriearter ( Figur1). Colistin Nalidixic Acid (CNA) eller MRS agar er nyttige for å isolere begeistrede Gram-positive arter (f.eks. Lactobacillus spp.) fra urin kjent for å inneholde Gram-negative uropathogener, som kan utkonkurrere de begeistrede artene i ikke-selektive agarer. Inkuber platen invertert i ønsket atmosfærisk tilstand ved 35 °C i en periode på 24 timer for uropathogener og 3-5 dager for raske bakterier (Figur 1). Etter inkubasjonsperioden, fjern platene fra inkubatoren. Velg koloniene som viser en unik farge, morfologi eller hemolytiske mønstre, fra hver plate. Re-stripe bakteriekolonien ved hjelp av en steril sløyfe på den tilsvarende agaren og inkuber platen invertert i 2-5 dager i ønsket atmosfære for å oppnå godt isolerte kolonier.MERK: Hvis du bruker BAP for primærkultur, kan patchingkolonier på kromogene agar gi nyttig informasjon om heterogeniteten til bakteriepopulasjonen i prøven. Culturing i flytende buljong og glyserol-strømpe bakterielle isolerer Når de isolerte koloniene som samsvarer med morfologien til foreldrekolonien er oppnådd, velg en enkelt koloni og inokuler i 3 ml flytende buljong ved hjelp av en steril inokulasjonssløyfe. Se figur 1 for buljong som er i stand til å støtte veksten av vanlige mikrobiota-slekter i urinen. Forsegle agarplatene med parafilm og oppbevar dem ved 4 °C i 2-4 dager. Inkuber flytende kulturer i de ønskede atmosfæriske forholdene i 1-5 dager til kulturen er synlig uklar. Etter at veksten er observert, virvel kulturen, og legg deretter 1 ml av nattkulturen til 500 μL steril 50% glyserol i en 2 ml kryonal; forsegling og bland forsiktig ved inversjon. Forbered to glyserollagrer for hver koloni (en fungerer som en sikkerhetskopi) og lagre ved -80 °C. 2. Identifisering av bakteriearter ved 16S rRNA gen Sanger sekvensering MERK: Mikrobiell identitet kan alternativt bekreftes ved hjelp av Matrix-Assisted Laser Desorption Ionization Time of Flight Mass Spectrometry (MALDI-TOF)20. Kolonipolymerase kjedereaksjon (PCR) Forbered en 25 μL PCR-reaksjon i PCR-rør ved å legge til 12,5 μL 2x Taq Polymerase Master Mix, 0,5 μL 10 μM 8F primer, 0,5 μL 10 μM 1492R primer (Materialbord) og 11,5 μL nukleasefritt vann21.MERK: Hvis du utfører PCR for flere prøver, lager du en reaksjonsmasterblanding av Taq Polymerase-blanding, primere og sterilt nukleasefritt vann. Deretter aliquot 25 μL inn i hvert PCR-rør. For å utføre koloni-PCR, sveip en godt isolert koloni fra re-streken ved hjelp av en steril tannpirker eller pipettespiss. Resuspender kolonien i PCR-reaksjonsblandingen tilberedt i trinn 2.1.1. Bland forsiktig. Samle væsken nederst på røret med et raskt spinn på 2000 x g.MERK: Sørg for at prøven er fri for luftbobler. Ta med en NTC-prøve (no-template control) som inneholder PCR-reaksjonsblandingen alene. Plasser prøverørene i termosykleren og kjør følgende program: 95 °C i 3 minutter; 40 sykluser av: 95 °C i 30 s, 51 °C i 30 s og 72 °C i 1 min. 30 s; 72 °C i 10 min; ved 10 °C. Gelutvinning og artsidentifikasjon Når PCR-kjøringen er fullført, må du kontrollere PCR-produktet på en 1 % agarosegel tilberedt i 0,5x Tris-Borate-EDTA (TBE)-buffer. Før du kaster gelen, tilsett ethidiumbromid (EtBr). Deretter støper du gelen med kammer for brønner som holder minst 20 μL prøvevolum.FORSIKTIG: EtBr er et interkalerende middel som mistenkes å være kreftfremkallende. Bruk alltid hansker og verneutstyr ved håndtering av det og kast materialer som inneholder EtBr i henhold til institusjonens retningslinjer. Når gelen er satt, plasser gelen i elektroforesetanken fylt med 0,5x TBE buffer og fjern kammen. Last 1 kb stigen i den første brønnen og 10-20 μL av PCR-reaksjonen i etterfølgende brønner. Kjør på 100-140 V til den er løst. Visualiser gelen under UV-lys og bekreft tilstedeværelsen av et klart definert bånd på ~ 1,5 kb som er fraværende i NTC-brønnen.FORSIKTIG: UV-stråler er skadelige for hud og øyne, bruk et passende vernedeksel når du visualiserer gelen og bruker passende personlig verneutstyr.MERK: Colony PCR kan være mislykket for noen bakterier; Å fortsette med PCR fra isolert gDNA er et alternativt alternativ22. Excise ~1,5 kb bånd ved hjelp av en barberhøvel og overføre gel stiklinger til rene microcentrifuge rør. Fortsett med gelavsugsprotokoll i henhold til produsentens instruksjoner (Materialliste). Mål konsentrasjonen av renset DNA ved mikrovolumspektrofotometer.MERK: En konsentrasjon >10 ng/μL er ønskelig, og A260/280 mellom 1,7-2,0 er akseptabelt. Forbered to Sanger-sekvenseringsreaksjoner for hver prøve, den ene ved hjelp av 8F og den andre ved hjelp av 1492R-primeren i nukleasefritt vann i henhold til retningslinjene til en valgt Sanger-sekvenseringstjeneste. Når sekvenseringsdataene er mottatt, laster du opp DNA-sekvensene til nettstedet TIL NCBI Basic Local Alignment Search Tool (BLAST) (blast.ncbi.nlm.nih.gov/Blast.cgi), velger Nucleotide BLAST (blastn), velger rRNA/ITS-databasen 16S ribosomal RNA-sekvenser (Bakterier og Arkaea), og kjører Megablast-programmet. Isolen kan identifiseres med treff av høyeste kvalitet til en referanse fra databasen.MERK: Noen bakteriearter viser høy identitet i sine 16S rRNA-sekvenser og kan være uutslettelige med denne metoden alene. Spesiering vil kreve DNA-homologi og biokjemiske analyser for å trygt skille medlemmer av samme slekt23. 3. Utvinning av genomisk DNA (gDNA) MERK: Denne delen benytter reagenser og spin-kolonner som er gitt i gDNA-ekstraksjonssettet som det refereres til i materialtabellen for høyutbytteutvinning av genomisk DNA av høy avkastning fra forskjellige bakteriearter. Nedenfor finner du anbefalte endringer og instruksjoner. Klargjør settreagenser i henhold til produsentens instruksjoner. Forbered 3-10 ml kulturer i passende steril buljong (Figur 1) ved å inokulere bakterier fra godt isolerte kolonier inn i media og inkubere ved temperatur og atmosfærisk trykk som er notert i figur 1 til tilstrekkelig vekst observeres. Etter inkubasjon måler du den optiske tettheten ved 600 nm (OD600) av kulturen ved hjelp av et spektrofotometer24. Forbered prøven for kvantifisering ved å fortynne nattkulturer i 1:10-forholdet. Inkluder også et blankt av de sterile kulturmediene for måling. Beregn den optiske tettheten ved å trekke den tomme avlesningen fra prøveavlesningen og multiplisere med fortynningsfaktoren på ti. Ved hjelp av OD600-målingen og et forhåndsetablert OD600 til CFU/ml-forhold for arten, må du beregne hvor mange milliliter kultur som er nødvendige for å oppnå 2 x 109 celler. Sentrifuger det nødvendige kulturvolumet i 5 min ved 5000 x g til pellets. Aspirer den supernatante og resuspend pellet i 200 μL kald TE-buffer (pre-chill på is i begynnelsen av prosedyren). Sentrifuger prøven i 2 min ved 5000 x g. Fjern supernatanten, og bruk deretter pelletsen på nytt i 180 μL enzymatisk lysisbuffer (ELB) og tilsett 20 μL ferdigkokt RNase A (10 mg/ml). For effektiv lysis av Gram-positive bakterier, tilsett 18 μL mutanolysin (25 kU/ml). Vortex godt, og inkuber deretter prøvene ved 37 °C på rotator i 2 timer.MERK: Det anbefales å bruke ELB som er beskrevet i produsentens protokoll for både Gram-positive og Gram-negative bakterier. Fortsett i henhold til produsentens instruksjoner.MERK: Gjenta elution-trinnene en eller to ganger til for å oppnå ekstra gDNA-utbytte, om ønskelig. Vurder kvaliteten på ekstrahert gDNA som beskrevet i avsnitt 4 og oppbevar gDNA ved 4 °C hvis den skal brukes innen 1 uke. Alternativt kan du holde gDNA ved -20 °C for langtidslagring. 4. Vurdering av kvaliteten på ekstrahert gDNA For å vurdere kvaliteten ved gelelektroforese, lag 1% agarose gel som beskrevet i ledd 2.2. Forbered prøven i et rent rør: Bland 1-2 μL ekstrahert gDNA og 3 μL 2x lastefargestoff på parafilm. Kjør gelen når den er lastet, og visualiser den deretter under UV-lys.MERK: Vellykket gDNA-ekstraksjon vil være tydelig av et diskret bånd på toppen av gelen og minimal smøring (Figur 2A). Smøring er en indikasjon på skjæring. Hvis det ikke er noe gDNA-bånd som er tydelig og/eller smøring er betydelig, gjentar du gDNA-ekstraksjonen. Vurder å redusere inkubasjonstidene i RNase A og Proteinase K. Hvis to bånd rundt 1,5-3 kb observeres, antyder dette RNA-forurensning (Figur 2B). Forbered fersk RNase A og gjenta utvinning. For å vurdere kvaliteten med mikrovolumspektrofotometer måler du gDNA-konsentrasjons- og absorbansforholdet A260/280 ved mikrovolumspektrofotometer. Konsentrasjoner >50 ng/μL og A260/280 mellom 1,7-2,0 er akseptable.MERK: Lavt gDNA-utbytte kan skyldes lav inngang, høy inngang, forurensning av nukleaser, utilstrekkelig lysis. Absorbansforhold over området indikerer RNA-forurensning. Gjenta ekstraksjon hvis gDNA-kvaliteten er dårlig. For å vurdere kvaliteten med fluorometer, følg produsentens instruksjoner for å kvantifisere gDNA-konsentrasjon ved hjelp av høysensitiv analysesett og fluorometerinstrument (Materialtabell). Konsentrasjon >50 ng/μL er ønskelig. 5. Parret neste generasjons kortlest sekvensering og bibliotekforberedelse MERK: Kortlest sekvensering kan utføres på ulike instrumenter ved distinkte leselengder og retninger. 150 bp (300 syklus) parret-end sekvensering anbefales for bakteriell WGS. Både bibliotekforberedelse og sekvensering kan settes ut til kjerneanlegg eller kommersielle laboratorier. Klargjør sekvenseringsbiblioteket i henhold til produsentens instruksjoner (Materialfortegnelse). Følg produsentens anbefalte konsentrasjon av sluttlastingsbibliotek; En anbefalt modifikasjon er imidlertid å laste inn det samlede biblioteket på 1,8 pM for optimal lesegenerering på NextSeq-instrumenter. Selv om det er valgfritt, kan du bruke en Bioanalyzer (Tabell over materialer) for å vurdere fragmentdistribusjonen i det samlede biblioteket og sikre at fragmentstørrelsen i gjennomsnitt er 600 bp. 6. Nanopore MinION sekvensering bibliotek forberedelse Klargjør sekvenseringsbiblioteket i henhold til produsentens protokoll (Materialfortegnelse). Ved å bruke to strekkodeutvidelsessett kan du bruke multipleksing av opptil 24 prøver på en enkelt strømningscelle. Det anbefales å utføre bibliotekforberedelse i to deler, 12 prøver om gangen når multipleksing 24 prøver. Alle de 24 prøvene kan samles som beskrevet nedenfor.MERK: Prøver kan lagres ved 4 °C over natten etter endt native barcode ligation – dette gir et stoppested i protokollen, om nødvendig. På slutten av native strekkode ligation delen av biblioteket forberedelse protokollen, anbefales det å samle likevektsmengder av hver prøve opp til maksimal DNA-masse (ng) mulig. For å gjøre dette, kvantifisere alle prøvene etter strekkode ligation ved hjelp av et fluorometer (Tabell over materialer) i henhold til produsentens instruksjoner. Beregn volumet av prøven med den laveste dsDNA-konsentrasjonen, og beregn deretter den totale dsDNA som finnes i dette utvalget. Bruk dette tallet til å bestemme likevektsmengdene for alle de andre utvalgene som skal samles sammen.MERK: Fordi equimolarberegningen vil maksimere mengden samlet dsDNA og dermed gi et basseng med høyt volum (>65 μL), er opprydding nødvendig for å konsentrere bassenget. dsDNA bassengopprydding og konsentrasjon Tilsett 2,5x volum paramagnetiske perler (Materialfortegnelse) i DNA-bassenget, og sveip deretter forsiktig røret for å blande innholdet. Plasser røret i rotatoren i 5 min ved RT. Snurr ned prøven ved 2000 x g og pellets på en magnet. Tilsett 250 μL nytilberedt 70% etanol (i nukleasefritt vann), pass på at du ikke forstyrrer pelletsen. Aspirer etanol og gjenta etanolvasken en gang. Etter den andre ambisjonen, spinn ned prøven på 2000 x g og legg den tilbake på magneten. Pipette av eventuell gjenværende etanol og la prøven tørke i ca. 30 s. Fjern røret fra magneten og resuspend pellet i 60-70 μL nukleasefritt vann. Inkuber på RT i 2 min. Pellet prøven på magneten til elutten er klar, og fjern deretter elutten og overfør den til et rent 1,5 ml mikrosenterrør. Kvantifisere det konsentrerte bassenget ved hjelp av et fluorometer, og forbered deretter en aliquot for å fortsette til adapterligasjonstrinnet: forbered 700 ng av prøven i 65 μL sluttvolum. Behold resten av bassenget ved 4 °C for en andre løpetur som skal fullføres når den første kjøringen er fullført. Fortsett med adapterligation som instruert av produsenten og last prøven på strømningscellen. Start sekvenseringskjøringen.MERK: Aspirer luft og ~200 μL lagringsbuffer fra strømningscellens påfyllingsport før prøvelastingen. Dette er avgjørende for vellykket strømningscellepriming og prøvelasting. Bruk en p1000 pipette og spisser når du tegner og deponerer løsninger gjennom grunneporten til strømningscellen. Sekvenser biblioteket i henhold til produsentens instruksjoner. Åpne driftsprogramvaren for sekvensering, og klikk Start. Skriv inn et navn for eksperimentet, en anbefalt terminologi inkluderer kjøredatoen og brukerens navn. Klikk Fortsett til kitvalg, velg riktig bibliotekforberedelsessett og utvidelsespakke(r) for strekkode som brukes, og klikk deretter Fortsett til kjørealternativer. Juster løpelengden til 48 timer hvis du planlegger å klargjøre tilstrekkelig bibliotek for en andre kjøring (ellers la det være i standard 72 timer). Klikk Fortsett til Basecalling. Kontroller basecalling-alternativet Config: Fast Basecalling og sørg for at Barcoding er satt til Aktivert slik at UTDATAENE FASTQ-filer vil bli trimmet av strekkodesekvensene og demultiplexed i separate kataloger basert på strekkode. Klikk Fortsett til utdata. Velg hvor du vil lagre data for utdatasekvensering. Forvent omtrent 30-50 Gb data hvis du bare lagrer FASTQ-utgang og > 500 Gb data hvis du også lagrer FAST5-utdata. Fjern merket for Filtreringsalternativet Qscore: 7 | Leselengde: Ufiltrert hvis du planlegger å fortsette med filtrering som er beskrevet i pkt. 7.2, må du ellers la det være kontrollert og justere leselengden til 200. Klikk Fortsett for å kjøre installasjonsprogrammet, og se gjennom alle innstillingene. Hvis innstillingene er riktige, klikker du på Start, ellers klikker du på Tilbake og gjør nødvendige justeringer. Om ønskelig kan strømningscellen vaskes i henhold til produsentens instruksjoner og lastes på nytt med det gjenværende bassenget. Gjenta trinnene i 6.2 for det gjenværende utvalget når den første kjøringen er fullført og flytcellen er vasket.MERK: Når du setter opp den andre kjøringen, justerer du Bias-spenningen til -250 mV i henhold til produsentens anbefalinger for strømningsceller som tidligere ble brukt i løp over 48 timer. 7. Vurdering og forberedelse av lesninger MERK: En anbefalt katalogstruktur er avbildet i figur 4. Opprett mappene som finnes i Skrivebordet, nemlig Long_Reads, Short_Reads og Trimmed_Reads, før du fortsetter med beregningstrinnene nedenfor. Korte leseoperasjoner (Figur 3)MERK: Korte lesinger genereres i FASTQ-format. Filene inneholder maksimalt 4000 leseoperasjoner per FASTQ. Disse er ofte zippet (.gz arkiv) og organisert i flere filer. Avhengig av plattformen blir strekkoder vanligvis trimmet. Noen programmer godtar filer i zippet format, andre kan kreve utvinning før import. Lesingene må bestå kvalitetskontrolltrinn (QC) for å sikre datanøyaktighet under genommontering. Hvis CLC Genomics Workbench ikke er tilgjengelig, kan alternative programmer brukes til å trimme og QC korte lesninger som Trimmomatic25 eller Trim Galore (https://www.bioinformatics.babraham.ac.uk/projects/trim_galore/) for trimming og FastQC (http://www.bioinformatics.babraham.ac.uk/projects/fastqc/) for evaluering av lesekvalitet. Gjennomsnittlig kort lesedekning, estimert ved å multiplisere antall lesninger etter gjennomsnittlig leselengde og deling med genomstørrelsen, anbefales å være >100x.Åpne Genomics Workbench programvare (Tabell over materialer) og import alle parvise kortleste FASTQ filer. Sammenkoblede filer genereres automatisk. Opprett en ny mappe under CLC_Data ved å klikke på Ny øverst på verktøylinjen og velge Mappe… for å lagre filene. Gi mappen et navn etter ønske, en anbefalt konvensjon bruker eksempel-IDen. Lagre alle utdataene fra følgende trinn i denne mappen. På den øverste verktøylinjen klikker du på Importer-knappen og velger Illumina… Naviger til og velg alle kortleste filer som tilsvarer eksemplet. Kontroller at alternativet for sammenkoblede lesinger er valgt, og fjern merket for Fjern mislykkede lesinger . Klikk Neste, velg Lagre, og klikk Neste på nytt. Velg å lagre de importerte filene i den nye mappen som ble opprettet i forrige trinn, og klikk Fullfør. Opprett en sekvensliste over alle sammenkoblede filer for isolasjonen. Dette vil sette sammen lesedata i en enkelt fil for enkel analyse. På den øverste verktøylinjen klikker du på Ny-knappen og velger Sekvensliste… I kataloglisten til venstre velger du filene som skal settes sammen, og bruker pilene til å flytte dem til listen over valgte filer til høyre. Klikk Neste, velg Lagre, og klikk Neste på nytt. Velg å lagre sekvenslisten og klikk Fullfør. Når sekvenslisten er generert, må du umiddelbart gi den nytt navn med eksempel-IDen. Kjør verktøyet QC for Sequencing Reads på sekvenslisten: Denne prosedyren vil vurdere de generelle kvalitetsparametrene for lesingene som genereres av kortlest NGS. Søk etter verktøyet QC for Sequencing Reads i verktøykassemenyen (nederst til venstre). Dobbeltklikk verktøyet, og velg deretter sekvenslisten som skal analyseres, og klikk Neste. Kontroller at det er merket av for alle utdataalternativene, og velg Lagre under Resultatbehandling. Klikk Neste og angi for å lagre utdatafilene, og klikk deretter Fullfør. Kjør trimlesingsverktøyet på sekvenslisten: Trimming vil bli gjort basert på kvalitet, lengde og tvetydighet. Denne prosessen forutsetter at strekkodene som brukes i sekvensering, er trimmet før dette trinnet. Søk etter trimlesingsverktøyet i verktøykassen (nederst til venstre). Dobbeltklikk Trim leseoperasjoner, og velg deretter sekvenslisten som skal analyseres, og klikk Neste. Kvalitetstrimming: Sett kvalitetspoenggrensen til 0,01 og la tvetydige nukleotider stå på 2. Klikk Neste.MERK: Parametere kan justeres etter brukerens skjønn; Dette er de anbefalte innstillingene. Fjern merket for Automatisk gjennomlesing av korttrimming (bare gjør dette hvis kortene er trimmet fra lesingene før import til CLC). Klikk Neste og merk av for Forkast leseoperasjoner under lengde, bruk standard 15. Klikk Neste, merk av for Opprett rapport, og velg deretter Lagre. Klikk på Neste og spesifiser hvor du skal lagre utdatafilene. Klikk Fullfør. Eksporter den trimmede sekvenslisten: Etterfølgende hybridsamling og analyse vil bli fullført utenfor CLC og krever at trimmede kortleste filer eksporteres. Fra katalognavigasjonen øverst til venstre velger du den trimmede filen som ble generert i trinn 7.1.4, og deretter klikker du på Eksporter øverst på verktøylinjen. Velg Fastq for eksportfiltypen, og klikk Neste. Merk av for Eksporter liste over sammenkoblede sekvenser til To filer. Klikk deretter på Neste og velg den Trimmed_Reads katalogen du vil eksportere filene til. Klikk Fullfør. Kontroller at de trimmede kortleste filene ble eksportert som to filer (R1 og R2) med filtypen FASTQ.MERK: Den trimmede sekvenslisten må eksporteres til to filer, vanligvis angitt av CLC som R1 og R2. Dette er kritisk fordi nedstrøms hybridsamling krever at datainndata med kort lesing settes opp som sådan. Gi nytt navn til de eksporterte filene, avstå fra bruk av mellomrom og spesialtegn i filnavn. For enkelhets skyld er et anbefalt format trimmed_short_file. R1.fastq. Lang (MinION) leser (Figur 3)MERK: Følgende rørledning for fremstilling av lange (MinION) sekvenseringslesninger for hybridmontering bruker NanoFilt- og Nanostat-programmene26 utført av kommandolinjen. Installer verktøyene før du fortsetter, og vær kjent med det grunnleggende i UNIX for å utføre disse kommandoene. Standard terminaler og Bash Shell anbefales. En leksjonsveiledning for vanlige terminalkommandoer og bruk finner du på Software Carpentry27. Instruksjonene nedenfor antar at filene som genereres vil bli navngitt med strekkode nomenklatur (NB01, NB02, etc.) og lagres i Long_Reads katalogen. Les filtrering kan også utføres ved hjelp av MinKNOW når du konfigurerer sekvenseringskjøringen. Gjennomsnittlig lang lesedekning anbefales å være >100x. Anbefalt gjennomsnittlig leselengde er > 2000 bp; Derfor er antall lange avlesninger som trengs, lavere enn antall korte leseoperasjoner. Opprett nye kataloger for hver strekkode som brukes i kjøringen (barcode01, barcode02 osv.) i Long_Reads katalog (figur 4). Kopier alle FASTQ-filene som tilsvarer hver strekkode, til riktig mappe. Kombiner alle .fastq-filer for hver strekkode fra hver kjøring. Åpne Terminal og naviger til strekkodekatalogene i Long_Reads-katalogen ved hjelp av cd-kommandoen: cd Desktop/Long_Reads/barcode01 Sett sammen alle FASTQ-filer per strekkode i én enkelt FASTQ-fil ved å utføre følgende kommando: cat *.fastq > NB01.fastqMERK: Denne kommandoen kombinerer alle lesingene fra hver av FASTQ-filene til en stor, enkel FASTQ som heter NB01.fastq. Bruk NanoStat til å vurdere lesekvaliteten på prøven ved å utføre følgende kommando: NanoStat –fastq NB01.fastq Registrer resultatene ved å kopiere utdataene til en tekst- eller Word-fil for fremtidig referanse. Bruk NanoFilt til å filtrere MinION-lesinger som kaster lesninger med Q < 7 og lengde < 200 ved å utføre kommandoen: NanoFilt -q 7 -l 200 bp NB01.fastq | gzip > NB01 _trimmed.fastq.gz Kjør NanoStat på den trimmede filen som ble generert i trinn 7.2.6 ved å utføre kommandoen: NanoStat –fastq NB01 _trimmed.fastq.gz Registrer resultatene ved å kopiere utdataene til en tekst- eller Word-fil og sammenligne med resultatene fra trinn 7.2.4 for å sikre at filtreringen var vellykket (Tabell 1). Gjenta trinn 7.2.2 til 7.2.8 for hver strekkode som brukes i sekvenseringskjøringen.MERK: filen NB01_trimmed.fastq.gz som ble generert i trinn 7.2.6, vil bli brukt til hybrid montering. 8. Genererer hybrid genommontering MERK: Følgende monteringsrørledning bruker Unicycler19,28,29,30 for å kombinere korte og lange avlesninger utarbeidet i avsnittene 7.1 og 7.2 ( Figur3). Installer Unicycler og dens avhengigheter, og utfør kommandoene nedenfor. Kortleste filer som eksporteres i trinn 7.1.5, antas å ha navnet trimmed_short_file. R1.fastq og trimmed_short_file. R2.fastq for enkelhets skyld. Organiser kortleste filer og filer med lang lesing i én enkelt mappe med navnet Trimmed_Reads. Katalogen må inneholde følgende: En FASTQ.gz fil for trimmede lange lesinger (generert i trinn 7.2.6). To FASTQ-filer (R1 og R2) for trimmede korte lesinger (generert i trinn 7.1.5). Naviger til katalogen Trimmed_Reads som lagrer lesefilene ved hjelp av CD-kommandoen i Terminal: cd Desktop/Trimmed_Reads Når du er i riktig katalog, pakker du de to kortleste filene slik at de også er i .fastq.gz-format ved å utføre følgende kommando: gzip trimmed_short_file. R1.fastq Gjenta trinn 8.2 for både R1 og R2. Kontroller at alle lesefilene nå er i FASTQ.gz-format, og kontroller at alle filene samsvarer med samme isoler. Start hybridsamlingen ved hjelp av Unicycler ved å kjøre følgende kommando:unicycler -1 trimmed_short_file. R1.fastq.gz -2 trimmed_short_file. R2.fastq.gz -l NB01 _trimmed.fastq.gz -o unicycler_output_directoryMERK: -o angir mappen der Unicycler-utdataene skal lagres, Unicycler vil opprette denne mappen når kommandoen er utført. Ikke generer katalogen på forhånd. Kjøretiden varierer etter beregningskraften til datamaskinen som brukes, samt genomstørrelse og antall leseoperasjoner. Dette kan ta alt fra 4 timer til 1 eller 2 dager. Denne protokollen ble utført på en CentOS Linux 7-maskin med 250 Gb RAM, Intel Xeon (R) CPU med 2,5 GHz 12 praktiske kjerner og 48 virtuelle kjerner. Alternativt kan personlige datamaskiner med 16 Gb RAM og 2,6 GHz 6-kjerners prosessorer beregne disse samlingene på lengre behandlingstid. Når kjøringen er fullført, ser du gjennom filen unicycler.log for å sikre ingen feil . Hvis ufullstendige sammenhengende sammenhengende data identifiseres (betegnet som ufullstendige i Unicycler-loggen), kjører du Unicycler på nytt i fet modus ved å legge til følgende flagg i kommandoen i trinn 8.4: –modus fet.MERK: Fet modus vil senke kvalitetsterskelen som aksepteres for langlesede broer under montering; Dette kan gi en fullstendig montering, men monteringskvaliteten kan bli redusert. Det anbefales å bruke dristig modus bare når det er nødvendig, og som foreløpig bevis for at sammenhengende sammenføyning senere skal bekreftes av PCR. 9. Vurdering av monteringskvalitet MERK: Følgende protokoll bruker Bandage31 og QUAST32, to programmer som må settes opp før bruk (Figur 2 og Figur 4). Bandasje krever ikke installasjon når den er lastet ned, og QUAST krever kjennskap til grunnleggende kommandolinjebruk. Det anbefales også å vurdere genomfullhet ved hjelp av Benchmarking Universal Single-Copy Orthologs (BUSCO)33. Bandasje: Klikk på Fil. Velg deretter Last inn graf og velg assembly.gfa-filen som ble lagret i unicycler_output_directory generert av Unicycler i trinn 8.4. Når den er lastet inn, klikker du Tegnediagram -knappen på verktøylinjen til venstre og ser på hvordan tiltrekningene (kalt noder) er koblet sammen og organisert for å evaluere om samlingen er fullført (Figur 5).MERK: Komplette samlinger representeres av enkle sirkulære sammenhengende sammenhengende koblinger i begge ender (Figur 5A,B). Ufullstendige samlinger har flere sammenhengende eller lineære (Figur 5C). Små lineære sammenhengende kan ikke være ufullstendige, da de kan indikere lineære ekstrakroosomale elementer. Dekning, også kalt dybde, vil bli notert i bandasje og representerer den relative overflod av sammenhengende til kromosomet, normalisert i Unicycler til 1x. QUAST I terminalen navigerer du til mappen som lagrer Unicycler-utdataene ved hjelp av cd-kommandoen: cd Desktop/Trimmed_Reads/unicycler_output_directoryMERK: Mellomrom er ikke tillatt i banen til der monteringen er plassert, det vil si at ingen kataloger som fører til Unicycler-utgangen kan ha mellomrom i navnet. Du kan også kopiere assembly.fasta-filen til skrivebordet for enkel tilgang. Kjør QUAST ved å utføre følgende kommando: quast assembly.fasta -o quast_output_directory Se gjennom rapportene som genereres av QUAST, i utdatamappen quast_output_directory. 10. Genom merknad MERK: Merknadssamlebåndet nedenfor bruker Prokka34, et kommandolinjeverktøy som må installeres før bruk. Alternativt kan du bruke Prokka gjennom den automatiserte GUI K-Base (Tabell over materialer) eller kommentere genomer via webserveren RAST35. Hvis deponerer genomer i NCBI, vil de automatisk bli kommentert ved hjelp av Prokaryotic Genome Annotation Pipeline (PGAP)36. Naviger i terminalen til mappen som lagrer Unicycler-utdataene ved hjelp av cd-kommandoen (se trinn 9.2.1). Deretter kjører du Prokka ved å utføre følgende kommando: prokka –prefiks sample_ID –outdir prokka_output_directory assembly.fastaMERK: –prefiks vil navngi alle utdatafiler basert på den angitte sample_ID. –outdir vil opprette en utdatakatalog med det angitte navnet der alle Prokka-utdatafiler vil bli lagret; Ikke opprett en utdatamappe for Prokka på forhånd. Se gjennom merknadene ved å åpne TSV-tabellen og/eller ved å laste opp GFF-filen som genereres i en sekvensanalyseprogramvare, for å visualisere og analysere merknadene (figur 6). Spesifikke typer merknader kan genereres avhengig av genetiske faktorer av interesse. Det anbefales å starte med de brukervennlige verktøyene på Web-serveren Center for Genomic Epidemiology (www.genomicepidemiology.org/) for foreløpig analyse37,38,39,40,41. Ytterligere verktøy for påvisning av CRISPR-cas systemer og prophage er tilgjengelig (Figur 3)42,43. 11. Foreslått praksis for datademokratisering Når det er mulig, deponer alle rå lesedata samt sammensatte genomer i et offentlig depot som NCBI Sequence Read Archive (SRA) og Genbank. Genomer kommenteres automatisk via PGAP-rørledningen under NCBI-avsetningsprosessen.

Representative Results

Denne protokollen er optimalisert for kultur og sekvensering av urinbakterier som tilhører slekten som er oppført i figur 1. Ikke alle urinbakterier er dyrkbare ved denne metoden. Kulturmedier og -betingelser angis av slekten i figur 1. Eksemplariske geleelektroforesevurderinger av gDNA-integritet er avbildet i figur 2. En oversikt over bioinformatikkrørledningen for sekvensering av lesebehandling, genomsamling og merknad er beskrevet i figur 3. En veiledning for beregningskatalogstruktur finnes i figur 4 for både å forenkle protokollforståelsen og gi rammeverk for vellykket organisering. Videre er inkludert representative komplette genomer av to Klebsiella spp., K. pneumoniae og K. oxytoca, som ble generert av denne protokollen. En representasjon av disse samlingene er gitt i figur 5 og inkluderer også et ekstra ufullstendig eksempel K. pneumoniae genom. En detaljert oversikt over hvert fullt kommenterte fullstendige genom er vist i figur 6. Til slutt er det gitt en oppsummering av sekvenseringslesestatistikken i tabell 1 for å gi en bred forståelse av rå og trimmede data som er tilstrekkelig for generering av lukkede genomsamlinger av høy kvalitet. I tillegg fullfører nøkkelparameterne til de to representative Klebsiella spp. genomer er oppført. Genomer og rådata ble deponert i Genbank under BioProject PRJNA683049. Figur 1: Modifisert forbedret urinkultur av forskjellige uringener. Diagram for agar og flytende buljong som kan brukes til å dyrke ulike uringener. All dyrking foreslås utført ved 35 °C som beskrevet i punkt 1.1. Sirkler representerer medier som passer for å dyrke et bestemt slekt, farger ble vilkårlig valgt for å skille en medietype fra en annen. CDC-AN BAP (rød), CDC Anaerobe Sheep Blood Agar; 5% sau-BAP (oransje), saueblod agar; BHI (grønn), Hjernehjerteinfusjon; TSB (gul), Tryptic Soy Broth; CHROMagar Orientering (blå). aGardnerella vaginalis bør dyrkes på HBT Bilayer G. vaginalis Selektiv agar i mikroatrofisk atmosfære og under spesielle buljongkulturkrav44. bLactobacillus-iners bør dyrkes på 5% Kanin-BAP-plater og NYCIII buljong i mikroatrofob atmosfære. cLactobacillus spp. kan dyrkes på MRS under mikroaerofile forhold. Klikk her for å se en større versjon av denne figuren. Figur 2: Genomisk DNA-ekstraksjon agarose gel bilder. Representative gelbilder som viser gDNA-ekstraksjonsutfall. (A) Lane 1: 1 kb stige, Lane 2: intakt gDNA representerer vellykket utvinning, Lane 3: smøring indikerer fragmentert gDNA. (B) Lane 1: 1 kb stige, Lanes 2 &3: rRNA forurensning betegnet av to bånd mellom 1,5 kb og 3 kb. Klikk her for å se en større versjon av denne figuren. Figur 3: Arbeidsflyt for hybrid genomsamling. Skjematisk for trinn fra lesekvalitetskontroll og forhåndsbehandling til samlingsmerknad. Lesetrimming fjerner tvetydige leseoperasjoner og leseoperasjoner av lav kvalitet. Q-score- og lengdeparametere angis og representerer lesingene som beholdes. Assembly benytter både korte og lange lesninger for å generere en hybrid de novo genom samling. Monteringskvaliteten evalueres basert på fullstendighet og korrekthet ved hjelp av spesifiserte verktøy og parametere. Den endelige genomsamlingen er kommentert for alle gener og spesifikk interesse. Klikk her for å se en større versjon av denne figuren. Figur 4: Veiledning for katalogstruktur for bioinformatikk. Et skjematisk skjema for anbefalt katalog- og filorganisasjon for behandling av korte og lange lesinger, hybridsamling og genommerknad og QC. Viktige kommandolinjedatabehandlingstrinn utheves ved siden av tilsvarende filer og mapper. Fremkalle kommandoer og flagg (fet), inndatafiler (blå), utdatafiler eller kataloger (rød), brukerinndata som navnekonvensjon for filer (magenta). Klikk her for å se en større versjon av denne figuren. Figur 5: Genome montering grafer av Bandage. Representative komplette genom montering grafer av (A) Klebsiella oxytoca KoPF10 og (B) Klebsiella pneumoniae KpPF25 og ufullstendig genom montering av (C) Klebsiella pneumoniae KpPF46. Det komplette genomet til KoPF10 demonstrerer et enkelt lukket kromosom, og det komplette genomet til KpPF25 består av et lukket kromosom og fem lukkede plasmider. Det ufullstendige kromosomet til KpPF46 består av to sammenkoblede sammenhengende sammenhengende. Unicycler hybrid de novo-montering genererer en monteringsgraf som visualiseres av Bandage. Monteringsgrafen gir et forenklet skjematisk av genomet, noe som indikerer lukket kromosom eller plasmider av en linker som forbinder to ender av en enkelt sammenhengende. Tilstedeværelsen av mer enn én sammenkoblet sammenhengende sammenhengende angir ufullstendig samling. Sammenhengende størrelse og dybde kan også noterres i Bandasje. Klikk her for å se en større versjon av denne figuren. Figur 6: Komplette genomkart over kommenterte hybridsamlinger. Monteringskart generert av Geneious Prime for det komplette genomet til (A) K. oxytoca KoPF10 og (B) K. pneumoniae KpPF25 som viser kommenterte gener betegnet av fargede piler langs plasmid ryggrader. Kromosomer viser bare rRNA- og tRNA-gener for enkelhets skyld. Genommerknader ble utført ved hjelp av Prokka som angitt i avsnitt 10 i denne protokollen. Klikk her for å se en større versjon av denne figuren. Tabell 1: Representant Klebsiella spp. Monteringsparametere for K. oxytoca-stammen KoPF10 og K. lungebetennelsesstamme KpPF25. Tiltredelsesnumre for de avsatte dataene på NCBI er gitt. Antall leseoperasjoner både før og etter beskjæring er angitt for begge sekvenseringsteknologiene. N50 er kun gitt for lange lesninger siden korte lesninger er av kontrollert lengde. Plasmid replicon spådde ved hjelp av PlasmidFinder v2.1 Enteroebacteriaceae database med parametere satt til 80% identitet og 60% lengde. mlst, multilocus sekvens type. b CDS, kodesekvenser. c Plasmid replicon spådd ved hjelp av PlasmidFinder v2.1 Enterobacteriaceae database med parametere satt til 80% identitet og 60% lengde. d Oxford Nanopore Technologies (ONT) deponerte lesedata. e Illumina deponerte lesedata. Klikk her for å laste ned denne tabellen.

Discussion

Den omfattende hybrid genommonteringsprotokollen beskrevet her tilbyr en strømlinjeformet tilnærming for vellykket dyrking av forskjellige urinmikrobiota og uropathogener, og fullstendig montering av deres genomer. Vellykket WGS av bakterielle genomer begynner med isolering av forskjellige og noen ganger begeistrede mikrober for å trekke ut deres genomiske DNA. Til dags dato mangler eksisterende urinkulturprotokoller enten den nødvendige følsomheten for å oppdage mange urinarter eller innebærer lange og omfattende tilnærminger som krever utvidet tid og ressurser¹¹. Den modifiserte forbedrede urinkulturen som er beskrevet, tilbyr en forenklet, men omfattende protokoll for vellykket isolering av bakterier som tilhører 17 vanlige uringener, inkludert potensielt patogene eller gunstige commensale arter, og både fakultetsmessige og obligatoriske aerobe eller anaerobe bakterier. Dette gir i sin tur det nødvendige startmaterialet for nøyaktig sekvensering og montering av bakterielle genomer og for kritiske fenotypiske eksperimenter, noe som bidrar til forståelsen av urinhelse og sykdom. Videre gir denne modifiserte kulturtilnærmingen en mer definert klinisk diagnose av levedyktige mikroorganismer som finnes i urinprøver og tillater biobanking for fremtidige genomiske studier. Denne protokollen er imidlertid ikke uten begrensninger. Det kan kreve lange inkubasjonstider avhengig av organismen, samt bruk av ressurser som et hypoksikammer eller kontrollerte inkubatorer som kanskje ikke er lett tilgjengelige. Bruken av anaerobe GasPaks tilbyr en alternativ løsning, men disse er kostbare og produserer ikke alltid et vedvarende og kontrollert miljø. Til slutt kan kulturbias samt prøvemangfold gjøre det mulig for bestemte organismer og uropathogener å utkonkurrere begeistrede bakterier. Til tross for disse begrensningene er en kultur av forskjellige urinbakterier muliggjort av denne tilnærmingen.

Genomisk sekvensering har blitt populært med utviklingen av neste generasjons sekvenseringsteknologier som enormt økte både utbyttet og nøyaktigheten til sekvenseringsdata¹⁴^,¹⁵. Kombinert med utviklingen av algoritmer for databehandling og de novo-montering, er komplette genomsekvenser lett tilgjengelig for både nybegynnere og ekspertforskere^15,⁴⁵. Kunnskap om generell genomorganisasjon levert av komplette genomer gir viktig evolusjonær og biologisk innsikt, inkludert genduplisering, gentap og horisontal genoverføring¹⁴. I tillegg er gener som er viktige for antimikrobiell motstand og virulens ofte lokalisert på mobile elementer, som vanligvis ikke løses i utkast til genomsamlinger¹⁵^,¹⁶.

Protokollen heri følger en hybrid tilnærming for kombinasjonen av sekvenseringsdata fra kortleste og langleste plattformer for å generere komplette genomsamlinger. Mens du fokuserer på urinbakterielle genomer, kan denne prosedyren tilpasses ulike bakterier fra ulike isolasjonskilder. Kritiske trinn i denne tilnærmingen inkluderer å følge tilstrekkelig steril teknikk og bruke passende medier og kulturforhold for isolering av rene urinbakterier. Videre er utvinning av intakt, høy avkastning gDNA avgjørende for å generere sekvenseringsdata uten forurensende lesninger som kan hemme monteringssuksess. Etterfølgende bibliotekforberedelsesprotokoller er avgjørende for generering av kvalitetslesninger med tilstrekkelig lengde og dybde. Derfor er det av største betydning å håndtere gDNA med forsiktighet under bibliotekforberedelse for langlest sekvensering spesielt, da denne teknologiens største fordel er genereringen av lange lesninger uten teoretisk øvre lengdegrense. Også skissert er seksjoner for riktig kvalitetskontroll (QC) av sekvensering leser som eliminerer støyende data og forbedrer monteringsresultatet.

Til tross for vellykket DNA-isolasjon, bibliotekforberedelse og sekvensering, kan arten av genomisk arkitektur av noen arter fortsatt gi et hinder for generering av en lukket genomsamling⁴⁵^,⁴⁶. Repeterende sekvenser kompliserer ofte monteringsberegning, og til tross for lange lesedata, kan disse regionene løses med lav tillit, eller ikke i det hele tatt. Lange avlesninger må derfor i gjennomsnitt være lengre enn den største repetisjonsregionen i genomet eller dekningen må være høy (>100x)¹⁹. Noen genomer kan forbli ufullstendige og krever manuelle tilnærminger for ferdigstillelse. Likevel består hybridmonterte ufullstendige genomer vanligvis av færre sammenhengende enn kortleste trekkgenomer. Justering av standardparametere for monteringsalgoritmen eller etter strengere avskjæringer for lesing av QC kan hjelpe. Alternativt er en foreslått tilnærming å kartlegge lange lesninger til de ufullstendige regionene på jakt etter bevis for den mest sannsynlige monteringsbanen, og deretter bekrefte banen ved hjelp av PCR- og Sanger-sekvensering av den forsterkede regionen. Kartlegging av leseoperasjoner ved hjelp av Minimap2 foreslås, og Bandage tilbyr et nyttig verktøy for visualisering av kartlagte leseoperasjoner langs monterte sammenhengende enheter som gir bevis for sammenhengende kobling⁴⁷.

En ekstra utfordring med å generere komplette genomer ligger i kjennskap og komfort med kommandolinjeverktøy. Mange bioinformatiske verktøy er utviklet for å tilby beregningsmuligheter til enhver bruker; Imidlertid er deres utnyttelse avhengig av en forståelse med det grunnleggende om UNIX og programmering. Denne protokollen tar sikte på å gi tilstrekkelig detaljerte instruksjoner for å gjøre det mulig for enkeltpersoner uten tidligere kommandolinjeerfaring å generere lukkede genomsamlinger og kommentere dem.

Declarações

The authors have nothing to disclose.

Acknowledgements

Vi takker Dr. Moutusee Jubaida Islam og Dr. Luke Joyce for deres bidrag til denne protokollen. Vi vil også gjerne anerkjenne University of Texas ved Dallas Genome Center for deres tilbakemelding og støtte. Dette arbeidet ble finansiert av Welch Foundation, tildelingsnummer AT-2030-20200401 til N.J.D., av National Institutes of Health, tildelingsnummer R01AI116610 til K.P., og av Felecia og John Cain Chair in Women’s Health, holdt av P.E.Z.

Materials

Equipment:
Bioanalyzer 2100	Agilent	G29398A	Optional but recommended
Centrifuge	Eppendorf	—	Any centrifuge for spinning conicals and microcentrifuge tubes (e.g. Models 5810R/5424R)
Electrophoresis	BioRad Laboratories	1645070
Gel Imaging System	BioRad Laboratories		ChemiDoc models
Incubator	ThermoFisher Scientific	—	Any CO₂ Incubator (e.g. Thermo Forma model 3110)
Magnetic Rack	New England BioLabs	S15095	12-tube rack
MinION	Oxford Nanopore Technologies	—
Nanodrop	ThermoFisher Scientific	ND-ONE-W
NextSeq 500	Illumina	SY-415-1002	Other Illumina models are acceptable
Plate Reader	BioTek	—	Synergy H1
Qubit fluorometer	ThermoFisher Scientific	Q33238
Rotator	Benchmark Scientific	H2024
Thermocycler	ThermoFisher Scientific	—	Any thermocycler for PCR reactions (e.g. ProFlex PCR system)
Materials:
10X Phosphate Buffered Saline (PBS)	Fisher Scientific	BP3991
10X TBE buffer	—	—	1M Tris,1M Boric Acid,0.2M EDTA (pH 8.0)
1429R primer	Sigma Aldrich (Custom oligos)	—	GGTTACCTTGTTACGACTT
1kb Ladder	VWR	101228-494
1M Tris-Cl (pH 7.5)	ThermoFisher Scientific	15567027
6x Loading dye	Fisher Scientific	NC0783588
8F primer	Sigma Aldrich (Custom oligos)	—	AGAGTTTGATCCTGGCTCAG
Agar	Fisher Scientific	BP1423-2
Agarose	BioRad Laboratories	63001
AMPure XP Beads	Beckman Coulter	A63880
Anaerobe Pouch System – GasPak EZ	BD Diagnostic Systems	B260683
Boric Acid	Fisher Scientific	A73-500
Brain Heart Infusion Broth	BD Diagnostic Systems	212304
CDC Anaerobe 5% Sheep Blood Agar	BD Diagnostic Systems	L007357
CHROMagar Orientation	BD Diagnostic Systems	PA-257481.04
DNeasy Blood & Tissue	QIAGEN	69504
DreamTaq Master Mix	ThermoFisher Scientific	K1081
Dry Anaerobic Indicator Strips	BD Diagnostic Systems	271051
EDTA	Fisher Scientific	S311-500
Ethanol 200 Proof	Sigma Aldrich	E7023	For molecular biology
Ethidium Bromide	ThermoFisher Scientific	BP130210
Flow cell priming kit	Oxford Nanopore Technologies	EXP-FLP002
Flow cell wash kit	Oxford Nanopore Technologies	EXP-WSH003
Gel Extraction Miniprep Kit	BioBasic	BS654
Ligation sequencing kit	Oxford Nanopore Technologies	SQK-LSK109
Lysozyme	Research Products International Corp	L381005.05
Mutanolysin	Sigma Aldrich	M9901-5KU
Native barcoding expansion 1-12	Oxford Nanopore Technologies	EXP-NBD104
NEB Blunt/TA Ligase Master Mix	New England BioLabs	M0367L
NEBNext FFPE DNA Repair Mix	New England BioLabs	M6630L
NEBNext quick ligation buffer	New England BioLabs	B6058S
NEBNext Ultra II End repair / dA-tailing module	New England BioLabs	E7546L
Nextera DNA CD Indexes	Illumina	20018708
Nextera DNA Flex Library Prep – (M) Tagmentation	Illumina	20018705
Nuclease-free water	Sigma Aldrich	W4502
Qubit 1X dsDNA HS Assay Kit	ThermoFisher Scientific	Q33230
Qubit Assay Tubes	ThermoFisher Scientific	Q32856
Quick T4 DNA Ligase	New England BioLabs	E6056L
R9 Flow cell	Oxford Nanopore Technologies	FLO-MIN106D
RNase A	ThermoFisher Scientific	EN0531
Sheep Blood	Hemostat Laboratories	DS13250
TE buffer	—	—	10mM Tris, 1mM EDTA (pH 8.0)
Triton X-100	Sigma Aldrich	T8787
Tryptic Soy Broth	BD Diagnostic Systems	211825
Software & Bioinformatic Tools:
Bandage	—	—	https://rrwick.github.io/Bandage/
Center for Genomic Epidemiology	—	—	http://www.genomicepidemiology.org/
CLC Genomics Workbench 12	QIAGEN	—
CRISPRcasFinder	—	—	https://crisprcas.i2bc.paris-saclay.fr/
FastQC	—	—	https://www.bioinformatics.babraham.ac.uk/projects/fastqc/
Geneious Prime	Geneious	—
gVolante (BUSCO)	—	—	https://gvolante.riken.jp/
Kbase Prokka Wrapper	—	—	https://kbase.us/applist/apps/ProkkaAnnotation/annotate_contigs/release
Minimap2	—	—	https://github.com/lh3/minimap2
MinKNOW	Oxford Nanopore Technologies	—
NanoFilt	—	—	https://github.com/wdecoster/nanofilt
NanoStat	—	—	https://github.com/wdecoster/nanostat
PHASTER	—	—	https://phaster.ca/
Prokka	—	—	https://github.com/tseemann/prokka
QUAST	—	—	http://quast.sourceforge.net/quast
Trim Galore	—	—	https://www.bioinformatics.babraham.ac.uk/projects/trim_galore/
Trimmomatic	—	—	http://www.usadellab.org/cms/?page=trimmomatic
Unicycler	—	—	https://github.com/rrwick/Unicycler#necessary-read-length

Referências

Brubaker, L., Wolfe, A. The urinary microbiota: a paradigm shift for bladder disorders. Current Opinion in Obstetrics & Gynecology. 28 (5), 407-412 (2016).
Neugent, M. L., Hulyalkar, N. V., Nguyen, V. H., Zimmern, P. E., De Nisco, N. J. Advances in understanding the human urinary microbiome and its potential role in urinary tract infection. mBio. 11 (2), (2020).
Klein, R. D., Hultgren, S. J. Urinary tract infections: microbial pathogenesis, host-pathogen interactions and new treatment strategies. Nature Reviews. Microbiology. 18 (4), 211-226 (2020).
Horsley, H., et al. Enterococcus faecalis subverts and invades the host urothelium in patients with chronic urinary tract infection. PLoS One. 8 (12), 83637 (2013).
Reitzer, L., Zimmern, P. Rapid growth and metabolism of uropathogenic Escherichia coli in relation to urine composition. Clinical Microbiology Reviews. 33 (1), 00101-00119 (2019).
Snyder, J. A., et al. Transcriptome of uropathogenic Escherichia coli during urinary tract infection. Infection and Immunity. 72 (11), 6373-6381 (2004).
Ipe, D. S., Horton, E., Ulett, G. C. The basics of bacteriuria: Strategies of microbes for persistence in urine. Frontiers in Cellular and Infection Microbiology. 6, 14 (2016).
Babikir, I. H., et al. The impact of cathelicidin, the human antimicrobial peptide LL-37 in urinary tract infections. BMC Infectious Diseases. 18 (1), 17 (2018).
Jancel, T., Dudas, V. Management of uncomplicated urinary tract infections. The Western Journal of Medicine. 176 (1), 51-55 (2002).
Ventola, C. L. The antibiotic resistance crisis: part 1: causes and threats. P & T. 40 (4), 277-283 (2015).
Price, T. K., et al. The clinical urine culture: Enhanced techniques improve detection of clinically relevant microorganisms. Journal of Clinical Microbiology. 54 (5), 1216-1222 (2016).
Kass, E. H. Asymptomatic infections of the urinary tract. Transactions of the Association of American Physicians. 69, 56-64 (1956).
Garcia, L. S. . Clinical microbiology procedures handbook. 3rd edn. , (2010).
Fraser, C. M., Eisen, J. A., Nelson, K. E., Paulsen, I. T., Salzberg, S. L. The value of complete microbial genome sequencing (you get what you pay for). Journal of Bacteriology. 184 (23), 6403-6405 (2002).
Chen, Z., Erickson, D. L., Meng, J. Benchmarking hybrid assembly approaches for genomic analyses of bacterial pathogens using Illumina and Oxford Nanopore sequencing. BMC Genomics. 21 (1), 631 (2020).
Greig, D. R., Dallman, T. J., Hopkins, K. L., Jenkins, C. MinION nanopore sequencing identifies the position and structure of bacterial antibiotic resistance determinants in a multidrug-resistant strain of enteroaggregative Escherichia coli. Microbial Genomics. 4 (10), 000213 (2018).
Carraro, D. M., et al. PCR-assisted contig extension: stepwise strategy for bacterial genome closure. Biotechniques. 34 (3), 626-628 (2003).
Tettelin, H., Radune, D., Kasif, S., Khouri, H., Salzberg, S. L. Optimized multiplex PCR: efficiently closing a whole-genome shotgun sequencing project. Genomics. 62 (3), 500-507 (1999).
Wick, R. R., Judd, L. M., Gorrie, C. L., Holt, K. E. Unicycler: Resolving bacterial genome assemblies from short and long sequencing reads. PLoS Computational Biology. 13 (6), 1005595 (2017).
Singhal, N., Kumar, M., Kanaujia, P. K., Virdi, J. S. MALDI-TOF mass spectrometry: an emerging technology for microbial identification and diagnosis. Frontiers in Microbiology. 6, 791 (2015).
Turner, S., Pryer, K. M., Miao, V. P., Palmer, J. D. Investigating deep phylogenetic relationships among cyanobacteria and plastids by small subunit rRNA sequence analysis. The Journal of Eukaryotic Microbiology. 46 (4), 327-338 (1999).
Weisburg, W. G., Barns, S. M., Pelletier, D. A., Lane, D. J. 16S ribosomal DNA amplification for phylogenetic study. Journal of Bacteriology. 173 (2), 697-703 (1991).
Janda, J. M., Abbott, S. L. 16S rRNA gene sequencing for bacterial identification in the diagnostic laboratory: pluses, perils, and pitfalls. Journal of Clinical Microbiology. 45 (9), 2761-2764 (2007).
Stevenson, K., McVey, A. F., Clark, I. B. N., Swain, P. S., Pilizota, T. General calibration of microbial growth in microplate readers. Science Reports. 6, 38828 (2016).
Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
De Coster, W., D’Hert, S., Schultz, D. T., Cruts, M., Van Broeckhoven, C. NanoPack: visualizing and processing long-read sequencing data. Bioinformatics. 34 (15), 2666-2669 (2018).
Wilson, G., et al. The UNIX Shell. Zenodo. , (2019).
Bankevich, A., et al. SPAdes: a new genome assembly algorithm and its applications to single-cell sequencing. Journal of Computational Biology. 19 (5), 455-477 (2012).
Vaser, R., Sovic, I., Nagarajan, N., Sikic, M. Fast and accurate de novo genome assembly from long uncorrected reads. Genome Research. 27 (5), 737-746 (2017).
Walker, B. J., et al. Pilon: an integrated tool for comprehensive microbial variant detection and genome assembly improvement. PLoS One. 9 (11), 112963 (2014).
Wick, R. R., Schultz, M. B., Zobel, J., Holt, K. E. Bandage: interactive visualization of de novo genome assemblies. Bioinformatics. 31 (20), 3350-3352 (2015).
Gurevich, A., Saveliev, V., Vyahhi, N., Tesler, G. QUAST: quality assessment tool for genome assemblies. Bioinformatics. 29 (8), 1072-1075 (2013).
Simao, F. A., Waterhouse, R. M., Ioannidis, P., Kriventseva, E. V., Zdobnov, E. M. BUSCO: assessing genome assembly and annotation completeness with single-copy orthologs. Bioinformatics. 31 (19), 3210-3212 (2015).
Seemann, T. Prokka: rapid prokaryotic genome annotation. Bioinformatics. 30 (14), 2068-2069 (2014).
Aziz, R. K., et al. The RAST server: rapid annotations using subsystems technology. BMC Genomics. 9, 75 (2008).
Tatusova, T., et al. NCBI prokaryotic genome annotation pipeline. Nucleic Acids Research. 44 (14), 6614-6624 (2016).
Carattoli, A., Hasman, H. PlasmidFinder and In Silico pMLST: Identification and Typing of Plasmid Replicons in Whole-Genome Sequencing (WGS). Methods in Molecular Biology. 2075, 285-294 (2020).
Carattoli, A., et al. In silico detection and typing of plasmids using PlasmidFinder and plasmid multilocus sequence typing. Antimicrobial Agents and Chemotherapy. 58 (7), 3895-3903 (2014).
Larsen, M. V., et al. Multilocus sequence typing of total-genome-sequenced bacteria. Journal of Clinical Microbiology. 50 (4), 1355-1361 (2012).
Bortolaia, V., et al. ResFinder 4.0 for predictions of phenotypes from genotypes. The Journal of Antimicrobial Chemotherapy. 75 (12), 3491-3500 (2020).
Joensen, K. G., et al. Real-time whole-genome sequencing for routine typing, surveillance, and outbreak detection of verotoxigenic Escherichia coli. Journal of Clinical Microbiology. 52 (5), 1501-1510 (2014).
Arndt, D., et al. PHASTER: a better, faster version of the PHAST phage search tool. Nucleic Acids Research. 44 (1), 16-21 (2016).
Couvin, D., et al. CRISPRCasFinder, an update of CRISRFinder, includes a portable version, enhanced performance and integrates search for Cas proteins. Nucleic Acids Research. 46 (1), 246-251 (2018).
Totten, P. A., Amsel, R., Hale, J., Piot, P., Holmes, K. K. Selective differential human blood bilayer media for isolation of Gardnerella (Haemophilus) vaginalis. Journal of Clinical Microbiology. 15 (1), 141-147 (1982).
Nagarajan, N., Pop, M. Sequence assembly demystified. Nat Reviews. Genetics. 14 (3), 157-167 (2013).
Phillippy, A. M., Schatz, M. C., Pop, M. Genome assembly forensics: finding the elusive mis-assembly. Genome Biology. 9 (3), 55 (2008).
. Unicycler Wiki Available from: https://github.com/rrwick/Unicycler/wiki (2017)

Play Video

PDF

DOI

DOWNLOAD MATERIALS LIST

Citar este artigo

Sharon, B. M., Hulyalkar, N. V., Nguyen, V. H., Zimmern, P. E., Palmer, K. L., De Nisco, N. J. Hybrid De Novo Genome Assembly for the Generation of Complete Genomes of Urinary Bacteria using Short- and Long-read Sequencing Technologies. J. Vis. Exp. (174), e62872, doi:10.3791/62872 (2021).

Hybrid De Novo Genome Assembly for generering av komplette genomer av urinbakterier ved hjelp av kort- og langleste sekvenseringsteknologier

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Declarações

Acknowledgements

Materials

Referências

Tags

Play Video

Citar este artigo

View Video

Hybrid De Novo Genome Assembly for generering av komplette genomer av urinbakterier ved hjelp av kort- og langleste sekvenseringsteknologier

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Declarações

Acknowledgements

Materials

Referências

Tags

Play Video

Citar este artigo

View Video

✖

To prove you're not a robot, please enter the text in the image below