Denne protokollen beskriver en omfattende tilnærming for dyrking, sekvensering og de novo hybrid genom montering av urinbakterier. Det gir en reproduserbar prosedyre for generering av komplette, sirkulære genomsekvenser som er nyttige for å studere både kromosomale og ekstrakromosomale genetiske elementer som bidrar til urinkolonisering, patogenese og antimikrobiell resistensformidling.
Komplette genomsekvenser gir verdifulle data for forståelse av genetisk mangfold og unike koloniseringsfaktorer for urinmikrober. Disse dataene kan omfatte mobile genetiske elementer, som plasmider og ekstrakroosomal fekt, som bidrar til spredning av antimikrobiell resistens og ytterligere komplisere behandling av urinveisinfeksjon (UVI). I tillegg til å gi fin oppløsning av genomstruktur, tillater komplette, lukkede genomer detaljerte komparative genomikk og evolusjonære analyser. Genereringen av komplette genomer de novo har lenge vært en utfordrende oppgave på grunn av begrensninger i tilgjengelig sekvenseringsteknologi. Pardelt Next Generation Sequencing (NGS) produserer korte lesninger av høy kvalitet, noe som ofte resulterer i nøyaktige, men fragmenterte genomsamlinger. Tvert imot gir Nanopore-sekvensering lange lesninger av lavere kvalitet som normalt fører til feilutsatte komplette samlinger. Slike feil kan hemme genom-brede assosiasjonsstudier eller gi villedende variantanalyseresultater. Derfor har hybridtilnærminger som kombinerer både korte og lange lesninger dukket opp som pålitelige metoder for å oppnå svært nøyaktige lukkede bakterielle genomer. Rapportert heri er en omfattende metode for kulturen av ulike urinbakterier, artsidentifikasjon ved 16S rRNA gensekvensering, utvinning av genomisk DNA (gDNA), og generering av korte og lange lesninger av henholdsvis NGS- og Nanopore-plattformer. I tillegg beskriver denne metoden en bioinformatisk rørledning av kvalitetskontroll-, monterings- og genprediksjonsalgoritmer for generering av kommenterte komplette genomsekvenser. Kombinasjon av bioinformatiske verktøy muliggjør valg av lesedata av høy kvalitet for hybrid genommontering og nedstrømsanalyse. Den strømlinjeformede tilnærmingen til hybrid de novo-genomenheten som er beskrevet i denne protokollen, kan tilpasses for bruk i alle dyrkbare bakterier.
Urinmikrobiomet er et fremvoksende forskningsområde som har knust en tiår lang misforståelse om at urinveiene er sterile hos friske individer. Medlemmer av urinmikrobiota kan tjene til å balansere urinmiljøet og forhindre urinveisinfeksjon (UVI)1,2. Uropathogene bakterier invaderer urinveiene og bruker forskjellige virulensmekanismer for å fortrenge den bosatte mikrobiota, kolonisere urotelet, unngå immunresponser og motvirke miljøtrykk3,4. Urin er et relativt næringsbegrenset medium preget av høy osmolaritet, begrenset nitrogen- og karbohydrattilgjengelighet, lav oksygenering og lav pH5,6,7. Urin anses også å være antimikrobiell, sammensatt av høye konsentrasjoner av hemmende urea og antimikrobielle peptider som den menneskelige cathelicidin LL-378. Å undersøke mekanismer som brukes av både beboende bakterier og uropathogener for å kolonisere urinveiene er avgjørende for å forstå urinveishelsen ytterligere og utvikle nye strategier for UVI-behandling. Videre, etter hvert som svikt i frontlinje antimikrobielle terapier blir vanligere, blir det stadig viktigere å overvåke spredningen av mobile genetiske elementer som bærer antimikrobielle resistens determinanter i populasjoner av urinbakterier9,10.
For å undersøke genotyper og fenotyper av urinbakterier, er deres vellykkede kultur og påfølgende hele genomsekvensering (WGS) avgjørende. Kulturavhengige metoder er nødvendige for å oppdage og identifisere levedyktige mikrober i urinprøver11. Standard klinisk urinkultur innebærer å plating urin på 5% saueblod agar (BAP) og MacConkey agar og inkubere aerobt ved 35 °C i 24 timerog 12. Men med en deteksjonsterskel på ≥105 CFU / ml13, rapporteres mange medlemmer av urinmikrobiota ikke ved denne metoden. Forbedrede kultiveringsteknikker som Enhanced Quantitative Urin Culture (EQUC)11 bruker ulike kombinasjoner av forskjellige urinvolumer, inkubasjonstider, kulturmedier og atmosfæriske forhold for å identifisere mikrober som vanligvis går glipp av standard urinkultur. Beskrevet i denne protokollen er en modifisert versjon av EQUC, kalt her Modified Enhanced Urin Culture protocol, som muliggjør culturing av ulike urinbakterier og uropathogener ved hjelp av selektive medier og optimale atmosfæriske forhold, men er ikke iboende kvantitativ. Den vellykkede isolasjonen av urinbakterier muliggjør utvinning av genomisk DNA (gDNA) for nedstrøms WGS og genommontering.
Genomsamlinger, komplette samlinger spesielt, muliggjør oppdagelsen av genetiske faktorer som kan bidra til kolonisering, nisjevedlikehold og virulens blant både bosatte mikrobiota og uropatogengene bakterier. Utkast til genomsamlinger inneholder et mangfoldig antall sammenhengende sekvenser (sammenhengende) som kan inneholde sekvenseringsfeil og mangler orienteringsinformasjon. I en fullstendig genomsamling er både orienteringen og nøyaktigheten til hvert basispar verifisert14. Videre gir oppnåelse av komplette genomsekvenser innsikt i genomstruktur, genetisk mangfold og mobile genetiske elementer15. Korte lesninger alene kan identifisere tilstedeværelsen eller fraværet av viktige gener, men kan ikke finne deres genomiske kontekst16. Med muliggjørende langleste sekvenseringsteknologier som Oxford Nanopore og PacBio, krever det ikke lenger anstrengende metoder som manuell lukking av de novo-samlinger av multiplex PCR17,18. Kombinasjonen av neste generasjons kortleste sekvensering og Nanopore langleste sekvenseringsteknologier gjør det mulig å facile generering av nøyaktige, komplette og lukkede bakterielle genomenheter til relativt lave kostnader19. Kortlest sekvensering gir nøyaktige, men fragmenterte genomsamlinger som vanligvis består av et gjennomsnitt på 40-100 sammenhengende, mens Nanopore-sekvensering genererer lange avlesninger på omtrent 5-100 kb i lengde som er mindre nøyaktige, men som kan tjene som stillaser for å bli med i sammenhengende og løse genomisk synteny. Hybrid tilnærminger ved hjelp av både kortleste og langleste teknologier kan produsere nøyaktige og komplette bakterielle genomer19.
Beskrevet her er en omfattende protokoll for isolering og identifisering av bakterier fra menneskelig urin, genomisk DNA-ekstraksjon, sekvensering og fullstendig genommontering ved hjelp av en hybrid monteringstilnærming. Denne protokollen legger særlig vekt på trinnene som er nødvendige for å endre lesninger som genereres ved kortlesing og langlest sekvensering for nøyaktig montering av et lukket bakterielt kromosom og ekstrakroosomale elementer som plasmider.
Den omfattende hybrid genommonteringsprotokollen beskrevet her tilbyr en strømlinjeformet tilnærming for vellykket dyrking av forskjellige urinmikrobiota og uropathogener, og fullstendig montering av deres genomer. Vellykket WGS av bakterielle genomer begynner med isolering av forskjellige og noen ganger begeistrede mikrober for å trekke ut deres genomiske DNA. Til dags dato mangler eksisterende urinkulturprotokoller enten den nødvendige følsomheten for å oppdage mange urinarter eller innebærer lange og omfattende tilnærminger som krever utvidet tid og ressurser11. Den modifiserte forbedrede urinkulturen som er beskrevet, tilbyr en forenklet, men omfattende protokoll for vellykket isolering av bakterier som tilhører 17 vanlige uringener, inkludert potensielt patogene eller gunstige commensale arter, og både fakultetsmessige og obligatoriske aerobe eller anaerobe bakterier. Dette gir i sin tur det nødvendige startmaterialet for nøyaktig sekvensering og montering av bakterielle genomer og for kritiske fenotypiske eksperimenter, noe som bidrar til forståelsen av urinhelse og sykdom. Videre gir denne modifiserte kulturtilnærmingen en mer definert klinisk diagnose av levedyktige mikroorganismer som finnes i urinprøver og tillater biobanking for fremtidige genomiske studier. Denne protokollen er imidlertid ikke uten begrensninger. Det kan kreve lange inkubasjonstider avhengig av organismen, samt bruk av ressurser som et hypoksikammer eller kontrollerte inkubatorer som kanskje ikke er lett tilgjengelige. Bruken av anaerobe GasPaks tilbyr en alternativ løsning, men disse er kostbare og produserer ikke alltid et vedvarende og kontrollert miljø. Til slutt kan kulturbias samt prøvemangfold gjøre det mulig for bestemte organismer og uropathogener å utkonkurrere begeistrede bakterier. Til tross for disse begrensningene er en kultur av forskjellige urinbakterier muliggjort av denne tilnærmingen.
Genomisk sekvensering har blitt populært med utviklingen av neste generasjons sekvenseringsteknologier som enormt økte både utbyttet og nøyaktigheten til sekvenseringsdata14,15. Kombinert med utviklingen av algoritmer for databehandling og de novo-montering, er komplette genomsekvenser lett tilgjengelig for både nybegynnere og ekspertforskere15,45. Kunnskap om generell genomorganisasjon levert av komplette genomer gir viktig evolusjonær og biologisk innsikt, inkludert genduplisering, gentap og horisontal genoverføring14. I tillegg er gener som er viktige for antimikrobiell motstand og virulens ofte lokalisert på mobile elementer, som vanligvis ikke løses i utkast til genomsamlinger15,16.
Protokollen heri følger en hybrid tilnærming for kombinasjonen av sekvenseringsdata fra kortleste og langleste plattformer for å generere komplette genomsamlinger. Mens du fokuserer på urinbakterielle genomer, kan denne prosedyren tilpasses ulike bakterier fra ulike isolasjonskilder. Kritiske trinn i denne tilnærmingen inkluderer å følge tilstrekkelig steril teknikk og bruke passende medier og kulturforhold for isolering av rene urinbakterier. Videre er utvinning av intakt, høy avkastning gDNA avgjørende for å generere sekvenseringsdata uten forurensende lesninger som kan hemme monteringssuksess. Etterfølgende bibliotekforberedelsesprotokoller er avgjørende for generering av kvalitetslesninger med tilstrekkelig lengde og dybde. Derfor er det av største betydning å håndtere gDNA med forsiktighet under bibliotekforberedelse for langlest sekvensering spesielt, da denne teknologiens største fordel er genereringen av lange lesninger uten teoretisk øvre lengdegrense. Også skissert er seksjoner for riktig kvalitetskontroll (QC) av sekvensering leser som eliminerer støyende data og forbedrer monteringsresultatet.
Til tross for vellykket DNA-isolasjon, bibliotekforberedelse og sekvensering, kan arten av genomisk arkitektur av noen arter fortsatt gi et hinder for generering av en lukket genomsamling45,46. Repeterende sekvenser kompliserer ofte monteringsberegning, og til tross for lange lesedata, kan disse regionene løses med lav tillit, eller ikke i det hele tatt. Lange avlesninger må derfor i gjennomsnitt være lengre enn den største repetisjonsregionen i genomet eller dekningen må være høy (>100x)19. Noen genomer kan forbli ufullstendige og krever manuelle tilnærminger for ferdigstillelse. Likevel består hybridmonterte ufullstendige genomer vanligvis av færre sammenhengende enn kortleste trekkgenomer. Justering av standardparametere for monteringsalgoritmen eller etter strengere avskjæringer for lesing av QC kan hjelpe. Alternativt er en foreslått tilnærming å kartlegge lange lesninger til de ufullstendige regionene på jakt etter bevis for den mest sannsynlige monteringsbanen, og deretter bekrefte banen ved hjelp av PCR- og Sanger-sekvensering av den forsterkede regionen. Kartlegging av leseoperasjoner ved hjelp av Minimap2 foreslås, og Bandage tilbyr et nyttig verktøy for visualisering av kartlagte leseoperasjoner langs monterte sammenhengende enheter som gir bevis for sammenhengende kobling47.
En ekstra utfordring med å generere komplette genomer ligger i kjennskap og komfort med kommandolinjeverktøy. Mange bioinformatiske verktøy er utviklet for å tilby beregningsmuligheter til enhver bruker; Imidlertid er deres utnyttelse avhengig av en forståelse med det grunnleggende om UNIX og programmering. Denne protokollen tar sikte på å gi tilstrekkelig detaljerte instruksjoner for å gjøre det mulig for enkeltpersoner uten tidligere kommandolinjeerfaring å generere lukkede genomsamlinger og kommentere dem.
The authors have nothing to disclose.
Vi takker Dr. Moutusee Jubaida Islam og Dr. Luke Joyce for deres bidrag til denne protokollen. Vi vil også gjerne anerkjenne University of Texas ved Dallas Genome Center for deres tilbakemelding og støtte. Dette arbeidet ble finansiert av Welch Foundation, tildelingsnummer AT-2030-20200401 til N.J.D., av National Institutes of Health, tildelingsnummer R01AI116610 til K.P., og av Felecia og John Cain Chair in Women’s Health, holdt av P.E.Z.
Equipment: | |||
Bioanalyzer 2100 | Agilent | G29398A | Optional but recommended |
Centrifuge | Eppendorf | — | Any centrifuge for spinning conicals and microcentrifuge tubes (e.g. Models 5810R/5424R) |
Electrophoresis | BioRad Laboratories | 1645070 | |
Gel Imaging System | BioRad Laboratories | ChemiDoc models | |
Incubator | ThermoFisher Scientific | — | Any CO2 Incubator (e.g. Thermo Forma model 3110) |
Magnetic Rack | New England BioLabs | S15095 | 12-tube rack |
MinION | Oxford Nanopore Technologies | — | |
Nanodrop | ThermoFisher Scientific | ND-ONE-W | |
NextSeq 500 | Illumina | SY-415-1002 | Other Illumina models are acceptable |
Plate Reader | BioTek | — | Synergy H1 |
Qubit fluorometer | ThermoFisher Scientific | Q33238 | |
Rotator | Benchmark Scientific | H2024 | |
Thermocycler | ThermoFisher Scientific | — | Any thermocycler for PCR reactions (e.g. ProFlex PCR system) |
Materials: | |||
10X Phosphate Buffered Saline (PBS) | Fisher Scientific | BP3991 | |
10X TBE buffer | — | — | 1M Tris,1M Boric Acid,0.2M EDTA (pH 8.0) |
1429R primer | Sigma Aldrich (Custom oligos) | — | GGTTACCTTGTTACGACTT |
1kb Ladder | VWR | 101228-494 | |
1M Tris-Cl (pH 7.5) | ThermoFisher Scientific | 15567027 | |
6x Loading dye | Fisher Scientific | NC0783588 | |
8F primer | Sigma Aldrich (Custom oligos) | — | AGAGTTTGATCCTGGCTCAG |
Agar | Fisher Scientific | BP1423-2 | |
Agarose | BioRad Laboratories | 63001 | |
AMPure XP Beads | Beckman Coulter | A63880 | |
Anaerobe Pouch System – GasPak EZ | BD Diagnostic Systems | B260683 | |
Boric Acid | Fisher Scientific | A73-500 | |
Brain Heart Infusion Broth | BD Diagnostic Systems | 212304 | |
CDC Anaerobe 5% Sheep Blood Agar | BD Diagnostic Systems | L007357 | |
CHROMagar Orientation | BD Diagnostic Systems | PA-257481.04 | |
DNeasy Blood & Tissue | QIAGEN | 69504 | |
DreamTaq Master Mix | ThermoFisher Scientific | K1081 | |
Dry Anaerobic Indicator Strips | BD Diagnostic Systems | 271051 | |
EDTA | Fisher Scientific | S311-500 | |
Ethanol 200 Proof | Sigma Aldrich | E7023 | For molecular biology |
Ethidium Bromide | ThermoFisher Scientific | BP130210 | |
Flow cell priming kit | Oxford Nanopore Technologies | EXP-FLP002 | |
Flow cell wash kit | Oxford Nanopore Technologies | EXP-WSH003 | |
Gel Extraction Miniprep Kit | BioBasic | BS654 | |
Ligation sequencing kit | Oxford Nanopore Technologies | SQK-LSK109 | |
Lysozyme | Research Products International Corp | L381005.05 | |
Mutanolysin | Sigma Aldrich | M9901-5KU | |
Native barcoding expansion 1-12 | Oxford Nanopore Technologies | EXP-NBD104 | |
NEB Blunt/TA Ligase Master Mix | New England BioLabs | M0367L | |
NEBNext FFPE DNA Repair Mix | New England BioLabs | M6630L | |
NEBNext quick ligation buffer | New England BioLabs | B6058S | |
NEBNext Ultra II End repair / dA-tailing module | New England BioLabs | E7546L | |
Nextera DNA CD Indexes | Illumina | 20018708 | |
Nextera DNA Flex Library Prep – (M) Tagmentation | Illumina | 20018705 | |
Nuclease-free water | Sigma Aldrich | W4502 | |
Qubit 1X dsDNA HS Assay Kit | ThermoFisher Scientific | Q33230 | |
Qubit Assay Tubes | ThermoFisher Scientific | Q32856 | |
Quick T4 DNA Ligase | New England BioLabs | E6056L | |
R9 Flow cell | Oxford Nanopore Technologies | FLO-MIN106D | |
RNase A | ThermoFisher Scientific | EN0531 | |
Sheep Blood | Hemostat Laboratories | DS13250 | |
TE buffer | — | — | 10mM Tris, 1mM EDTA (pH 8.0) |
Triton X-100 | Sigma Aldrich | T8787 | |
Tryptic Soy Broth | BD Diagnostic Systems | 211825 | |
Software & Bioinformatic Tools: | |||
Bandage | — | — | https://rrwick.github.io/Bandage/ |
Center for Genomic Epidemiology | — | — | http://www.genomicepidemiology.org/ |
CLC Genomics Workbench 12 | QIAGEN | — | |
CRISPRcasFinder | — | — | https://crisprcas.i2bc.paris-saclay.fr/ |
FastQC | — | — | https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ |
Geneious Prime | Geneious | — | |
gVolante (BUSCO) | — | — | https://gvolante.riken.jp/ |
Kbase Prokka Wrapper | — | — | https://kbase.us/applist/apps/ProkkaAnnotation/annotate_contigs/release |
Minimap2 | — | — | https://github.com/lh3/minimap2 |
MinKNOW | Oxford Nanopore Technologies | — | |
NanoFilt | — | — | https://github.com/wdecoster/nanofilt |
NanoStat | — | — | https://github.com/wdecoster/nanostat |
PHASTER | — | — | https://phaster.ca/ |
Prokka | — | — | https://github.com/tseemann/prokka |
QUAST | — | — | http://quast.sourceforge.net/quast |
Trim Galore | — | — | https://www.bioinformatics.babraham.ac.uk/projects/trim_galore/ |
Trimmomatic | — | — | http://www.usadellab.org/cms/?page=trimmomatic |
Unicycler | — | — | https://github.com/rrwick/Unicycler#necessary-read-length |