Denne protokol beskriver en omfattende tilgang til dyrkning, sekventering, og de novo hybrid genom samling af urinbakterier. Det giver en reproducerbar procedure for generering af komplette, cirkulære genomsekvenser, der er nyttige til at studere både kromosomale og ekstrakromosomgene genetiske elementer, der bidrager til urinkolonisering, patogenese og antimikrobiel resistensformidling.
Komplette genomsekvenser giver værdifulde data til forståelse af genetisk mangfoldighed og unikke koloniseringsfaktorer af urinmikrober. Disse data kan omfatte mobile genetiske elementer, såsom plasmider og ekstrakromosom phage, der bidrager til udbredelsen af antimikrobiel resistens og yderligere komplicere behandling af urinvejsinfektion (UTI). Ud over at give fin opløsning af genomstrukturen giver komplette, lukkede genomer mulighed for detaljerede komparative genomforskninger og evolutionære analyser. Generering af komplette genomer de novo har længe været en udfordrende opgave på grund af begrænsninger af tilgængelig sekventeringsteknologi. Paired-end Next Generation Sekventering (NGS) producerer korte aflæsninger af høj kvalitet, hvilket ofte resulterer i nøjagtige, men fragmenterede genomsamlinger. Tværtimod giver Nanopore sekventering lange aflæsninger af lavere kvalitet, der normalt fører til fejlbehæftede komplette samlinger. Sådanne fejl kan hæmme foreningsundersøgelser for hele genomet eller give vildledende analyseresultater for varianter. Derfor hybrid tilgange kombinerer både korte og lange læser har vist sig som pålidelige metoder til at opnå meget præcise lukkede bakterielle genomer. Rapporteret heri er en omfattende metode til kultur af forskellige urinbakterier, artsidentifikation af 16S rRNA-gensekvensering, ekstraktion af genomisk DNA (gDNA) og generering af henholdsvis korte og lange læsninger af henholdsvis NGS- og Nanopore-platforme. Derudover beskriver denne metode en bioinformatisk pipeline af kvalitetskontrol, samling og genforudsigelsesalgoritmer til generering af kommenterede komplette genomsekvenser. Kombination af bioinformatiske værktøjer gør det muligt at vælge læsedata af høj kvalitet til hybridgenommontering og downstream-analyse. Den strømlinede tilgang til hybrid de novo genomsamlingen, der er beskrevet i denne protokol, kan tilpasses til brug i eventuelle kultter.
Urinmikrobiomet er et nyt forskningsområde, der har knust en årtier lang misforståelse om, at urinvejene er sterile hos raske individer. Medlemmer af urinmikrobiota kan tjene til at afbalancere urinmiljøet og forhindre urinvejsinfektion (UTI)1,2. Uropatogene bakterier invaderer urinvejene og anvender forskellige virulensmekanismer til at fortrænge det residente mikrobiota, kolonisere urotelet, undgå immunrespons og modvirkemiljøbelastninger 3,4. Urin er et relativt næringsrigt medium karakteriseret ved høj osmolaritet, begrænset kvælstof- og kulhydrattilgængelighed, lav iltning og lav pH5,6,7. Urin anses også for at være antimikrobiel, der består af høje koncentrationer af hæmmende urinstof og antimikrobielle peptider som den menneskelige cathelicidin LL-378. Undersøgelsesmekanismer, der anvendes af både hjemmehørende bakterier og uropathogener til at kolonisere urinvejene er afgørende for yderligere at forstå urinvejs sundhed og udvikle nye strategier for UTI behandling. Desuden, som svigt af front-line antimikrobielle behandlinger bliver mere almindelige, er det stadig vigtigere at overvåge udbredelsen af mobile genetiske elementer, der bærer antimikrobiel resistens determinanter i populationer af urinbakterier9,10.
At undersøge genotyper og fænotyper af urinbakterier, deres succesfulde kultur og efterfølgende hele genom sekventering (WGS) er bydende nødvendigt. Kulturafhængige metoder er nødvendige for at opdage og identificere levedygtige mikrober i urinprøver11. Standard klinisk urin kultur indebærer plating urin på 5% får blod agar (BAP) og MacConkey agar og inkubation aerobt ved 35 °C for 24 timer12. Men med en detektionstærskel på ≥10 5 CFU/mL13, mange medlemmer af urinmikrobiota er ikke rapporteret af denne metode. Forbedrede dyrkningsteknikker som forbedret kvantitativ urinkultur (EQUC)11 anvender forskellige kombinationer af forskellige urinmængder, inkubationstider, kulturmedier og atmosfæriske forhold for at identificere mikrober, der almindeligvis savnes af standard urinkultur. Beskrevet i denne protokol er en modificeret version af EQUC, der her kaldes Modified Enhanced Urine Culture protocol, der muliggør dyrkning af forskellige urinbakterier og uropatogener ved hjælp af selektive medier og optimale atmosfæriske forhold, men er ikke i sagens natur kvantitativ. Den vellykkede isolering af urinbakterier muliggør udvinding af genomisk DNA (gDNA) til downstream WGS og genomsamling.
Genom forsamlinger, komplette samlinger i særdeleshed, muliggøre opdagelsen af genetiske faktorer, der kan bidrage til kolonisering, niche vedligeholdelse, og virulens blandt både hjemmehørende mikrobiota og uropatogene bakterier. Udkast til genomsamlinger indeholder et varieret antal sammenhængende sekvenser (kontiger), der kan indeholde sekventeringsfejl og manglende orienteringsoplysninger. I en komplet genomsamling er både retningen og nøjagtigheden af hvert basispar blevet verificeret14. Desuden giver opnåelse af komplette genomsekvenser indsigt i genomstruktur, genetisk mangfoldighed og mobile genetiske elementer15. Korte læser alene kan identificere tilstedeværelsen eller fraværet af vigtige gener, men kan ikke lokalisere deres genomiske sammenhæng16. Med muliggør langaflæste sekventering teknologier såsom Oxford Nanopore og PacBio, generere lukkede de novo samlinger af bakterielle genomer ikke længere kræver anstrengende metoder såsom manuel lukning af de novo samlinger af multiplex PCR17,18. Kombinationen af Next Generation kortlæst sekventering og Nanopore langaflæste sekventering teknologier giver mulighed for letkøbt generation af nøjagtige, komplette og lukkede bakterielle genom samlinger med relativt lave omkostninger19. Kortlæst sekventering producerer nøjagtige, men fragmenterede genomsamlinger, der generelt består af et gennemsnit på 40-100 kontiger, mens Nanopore sekventering genererer lange aflæsninger på ca. 5-100 kb i længden, der er mindre nøjagtige, men kan tjene som stilladser til at slutte sig til kontigs og løse genomisk synteny. Hybride tilgange, der anvender både kortlæste og langlæste teknologier, kan producere nøjagtige og komplette bakterielle genomer19.
Beskrevet her er en omfattende protokol for isolering og identifikation af bakterier fra human urin, genomisk DNA-ekstraktion, sekventering, og komplet genom samling ved hjælp af en hybrid samling tilgang. Denne protokol lægger særlig vægt på de nødvendige skridt til korrekt at ændre aflæsninger genereret af kortlæst og langlæst sekventering for nøjagtig samling af et lukket bakteriekromosom og ekstrakromosomelementer som plasmid.
Den omfattende hybrid genom samling protokol beskrevet her tilbyder en strømlinet tilgang til en vellykket dyrkning af forskellige urinmikrobiota og uropathogener, og den komplette samling af deres genomer. Vellykket WGS af bakterielle genomer begynder med isolering af forskellige og til tider kræsne mikrober for at udtrække deres genomiske DNA. Til dato mangler eksisterende urinkulturprotokoller enten den nødvendige følsomhed til at opdage mange urinarter eller involverer langvarige og omfattende tilgange, der kræver forlænget tid og ressourcer11. Den beskrevne metode for modificeret forbedret urinkultur tilbyder en forenklet, men omfattende protokol for vellykket isolering af bakterier, der tilhører 17 almindelige uringener, herunder potentielt patogene eller gavnlige commensale arter og både fakultetsmæssige og obligatoriske aerobe eller anaerobe bakterier. Dette giver igen det nødvendige udgangsmateriale til nøjagtig sekventering og samling af bakterielle genomer og til kritiske fænotypiske eksperimenter, som bidrager til forståelsen af urin sundhed og sygdom. Desuden giver denne ændrede kulturtilgang mulighed for en mere defineret klinisk diagnose af levedygtige mikroorganismer, der findes i urinprøver, og giver mulighed for deres biobanking til fremtidige genomiske undersøgelser. Denne protokol er dog ikke uden begrænsninger. Det kan kræve lange inkubationstider afhængigt af organismen samt brug af ressourcer såsom et hypoxikammer eller kontrollerede inkubatorer, der måske ikke er let tilgængelige. Brugen af anaerobe GasPaks tilbyder en alternativ løsning, men disse er dyre og giver ikke altid et vedvarende og kontrolleret miljø. Endelig kan kultur bias samt prøve mangfoldighed give mulighed for særlige organismer og uropathogener at udkonkurrere kræsne bakterier. På trods af disse begrænsninger, en kultur af forskellige urinbakterier er muliggjort af denne tilgang.
Genomisk sekventering har vundet popularitet med udviklingen af Next Generation Sekventering teknologier, som enormt øget både udbytte og nøjagtigheden af sekventering data14,15. Kombineret med udviklingen af algoritmer til databehandling og de novo-samling er komplette genomsekvenser lige ved hånden på både nybegyndere og ekspertforskere15,45. Kendskab til den samlede genomorganisation, der leveres af komplette genomer, giver vigtig evolutionær og biologisk indsigt, herunder genduplikation, gentab og horisontal genoverførsel14. Derudover er gener, der er vigtige for antimikrobiel resistens og virulens, ofte lokaliseret på mobile elementer, som typisk ikke løses i udkast til genomsamlinger15,16.
Protokollen heri følger en hybrid tilgang til kombinationen af sekventering af data fra kortlæste og langlæste platforme til at generere komplette genomsamlinger. Mens fokuseret på urinbakterielle genomer, denne procedure kan tilpasses forskellige bakterier fra forskellige isolationskilder. Kritiske skridt i denne tilgang omfatter følgende passende steril teknik og udnytte passende medier og kultur betingelser for isolering af rene urinbakterier. Desuden er ekstraktion af intakt, højtydende gDNA afgørende for at generere sekventeringsdata uden forurenende aflæsninger, der kan hæmme montagesuccesen. Efterfølgende bibliotek forberedelse protokoller er afgørende for generering af kvalitet læser af tilstrækkelig længde og dybde. Derfor er det af total betydning at håndtere gDNA med omhu under biblioteksforberedelse til langlæst sekventering i særdeleshed, da denne teknologis største fordel er den generation af lange læser uden teoretisk øvre længdegrænse. Også skitseret er sektioner for passende kvalitetskontrol (QC) af sekventering læser, der eliminerer støjende data og forbedrer montageresultatet.
På trods af vellykket DNA-isolation, biblioteksforberedelse og sekventering kan arten af genomisk arkitektur af nogle arter stadig udgøre en hindring for dannelsen af en lukket genomsamling45,46. Gentagne sekvenser komplicerer ofte montageberegningen, og på trods af lange læsedata kan disse områder løses med lav tillid eller slet ikke. Lange aflæsninger skal således i gennemsnit være længere end den største gentagne region i genomet, eller dækningen skal være høj (>100x)19. Nogle genomer kan forblive ufuldstændige og kræver manuelle tilgange til færdiggørelse. Ikke desto mindre består hybridsamlede ufuldstændige genomer typisk af færre kontiger end kortlæste udkast til genomer. Det kan hjælpe at justere standardparametrene for assemblyalgoritmen eller følge strengere skæringer for læsning af QC. Alternativt er en foreslået tilgang at kortlægge lange læser til de ufuldstændige regioner på jagt efter beviser for den mest sandsynlige samling sti, og derefter bekræfte stien udnytte PCR og Sanger sekventering af den forstærkede region. Kortlægning læser ved hjælp af Minimap2 foreslås, og Bandage tilbyder et nyttigt værktøj til visualisering af kortlagte læser langs samlede contigs giver bevis for contig linkage47.
En yderligere udfordring med at generere komplette genomer ligger i fortrolighed og komfort med kommandolinjeværktøjer. Mange bioinformatiske værktøjer er udviklet til at tilbyde beregningsmæssige muligheder for enhver bruger; Deres udnyttelse afhænger dog af en forståelse med det grundlæggende i UNIX og programmering. Denne protokol har til formål at give tilstrækkeligt detaljerede instruktioner til at gøre det muligt for personer uden forudgående kommandolinjeerfaring at generere lukkede genomsamlinger og anmærke dem.
The authors have nothing to disclose.
Vi takker Dr. Moutusee Jubaida Islam og Dr. Luke Joyce for deres bidrag til denne protokol. Vi vil også gerne anerkende University of Texas i Dallas Genome Center for deres feedback og støtte. Dette arbejde blev finansieret af Welch Foundation, tildelingsnummer AT-2030-20200401 til NJD, af National Institutes of Health, tildelingsnummer R01AI116610 til K.P., og af Felecia og John Cain Chair in Women’s Health, der ejes af P.E.Z.
Equipment: | |||
Bioanalyzer 2100 | Agilent | G29398A | Optional but recommended |
Centrifuge | Eppendorf | — | Any centrifuge for spinning conicals and microcentrifuge tubes (e.g. Models 5810R/5424R) |
Electrophoresis | BioRad Laboratories | 1645070 | |
Gel Imaging System | BioRad Laboratories | ChemiDoc models | |
Incubator | ThermoFisher Scientific | — | Any CO2 Incubator (e.g. Thermo Forma model 3110) |
Magnetic Rack | New England BioLabs | S15095 | 12-tube rack |
MinION | Oxford Nanopore Technologies | — | |
Nanodrop | ThermoFisher Scientific | ND-ONE-W | |
NextSeq 500 | Illumina | SY-415-1002 | Other Illumina models are acceptable |
Plate Reader | BioTek | — | Synergy H1 |
Qubit fluorometer | ThermoFisher Scientific | Q33238 | |
Rotator | Benchmark Scientific | H2024 | |
Thermocycler | ThermoFisher Scientific | — | Any thermocycler for PCR reactions (e.g. ProFlex PCR system) |
Materials: | |||
10X Phosphate Buffered Saline (PBS) | Fisher Scientific | BP3991 | |
10X TBE buffer | — | — | 1M Tris,1M Boric Acid,0.2M EDTA (pH 8.0) |
1429R primer | Sigma Aldrich (Custom oligos) | — | GGTTACCTTGTTACGACTT |
1kb Ladder | VWR | 101228-494 | |
1M Tris-Cl (pH 7.5) | ThermoFisher Scientific | 15567027 | |
6x Loading dye | Fisher Scientific | NC0783588 | |
8F primer | Sigma Aldrich (Custom oligos) | — | AGAGTTTGATCCTGGCTCAG |
Agar | Fisher Scientific | BP1423-2 | |
Agarose | BioRad Laboratories | 63001 | |
AMPure XP Beads | Beckman Coulter | A63880 | |
Anaerobe Pouch System – GasPak EZ | BD Diagnostic Systems | B260683 | |
Boric Acid | Fisher Scientific | A73-500 | |
Brain Heart Infusion Broth | BD Diagnostic Systems | 212304 | |
CDC Anaerobe 5% Sheep Blood Agar | BD Diagnostic Systems | L007357 | |
CHROMagar Orientation | BD Diagnostic Systems | PA-257481.04 | |
DNeasy Blood & Tissue | QIAGEN | 69504 | |
DreamTaq Master Mix | ThermoFisher Scientific | K1081 | |
Dry Anaerobic Indicator Strips | BD Diagnostic Systems | 271051 | |
EDTA | Fisher Scientific | S311-500 | |
Ethanol 200 Proof | Sigma Aldrich | E7023 | For molecular biology |
Ethidium Bromide | ThermoFisher Scientific | BP130210 | |
Flow cell priming kit | Oxford Nanopore Technologies | EXP-FLP002 | |
Flow cell wash kit | Oxford Nanopore Technologies | EXP-WSH003 | |
Gel Extraction Miniprep Kit | BioBasic | BS654 | |
Ligation sequencing kit | Oxford Nanopore Technologies | SQK-LSK109 | |
Lysozyme | Research Products International Corp | L381005.05 | |
Mutanolysin | Sigma Aldrich | M9901-5KU | |
Native barcoding expansion 1-12 | Oxford Nanopore Technologies | EXP-NBD104 | |
NEB Blunt/TA Ligase Master Mix | New England BioLabs | M0367L | |
NEBNext FFPE DNA Repair Mix | New England BioLabs | M6630L | |
NEBNext quick ligation buffer | New England BioLabs | B6058S | |
NEBNext Ultra II End repair / dA-tailing module | New England BioLabs | E7546L | |
Nextera DNA CD Indexes | Illumina | 20018708 | |
Nextera DNA Flex Library Prep – (M) Tagmentation | Illumina | 20018705 | |
Nuclease-free water | Sigma Aldrich | W4502 | |
Qubit 1X dsDNA HS Assay Kit | ThermoFisher Scientific | Q33230 | |
Qubit Assay Tubes | ThermoFisher Scientific | Q32856 | |
Quick T4 DNA Ligase | New England BioLabs | E6056L | |
R9 Flow cell | Oxford Nanopore Technologies | FLO-MIN106D | |
RNase A | ThermoFisher Scientific | EN0531 | |
Sheep Blood | Hemostat Laboratories | DS13250 | |
TE buffer | — | — | 10mM Tris, 1mM EDTA (pH 8.0) |
Triton X-100 | Sigma Aldrich | T8787 | |
Tryptic Soy Broth | BD Diagnostic Systems | 211825 | |
Software & Bioinformatic Tools: | |||
Bandage | — | — | https://rrwick.github.io/Bandage/ |
Center for Genomic Epidemiology | — | — | http://www.genomicepidemiology.org/ |
CLC Genomics Workbench 12 | QIAGEN | — | |
CRISPRcasFinder | — | — | https://crisprcas.i2bc.paris-saclay.fr/ |
FastQC | — | — | https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ |
Geneious Prime | Geneious | — | |
gVolante (BUSCO) | — | — | https://gvolante.riken.jp/ |
Kbase Prokka Wrapper | — | — | https://kbase.us/applist/apps/ProkkaAnnotation/annotate_contigs/release |
Minimap2 | — | — | https://github.com/lh3/minimap2 |
MinKNOW | Oxford Nanopore Technologies | — | |
NanoFilt | — | — | https://github.com/wdecoster/nanofilt |
NanoStat | — | — | https://github.com/wdecoster/nanostat |
PHASTER | — | — | https://phaster.ca/ |
Prokka | — | — | https://github.com/tseemann/prokka |
QUAST | — | — | http://quast.sourceforge.net/quast |
Trim Galore | — | — | https://www.bioinformatics.babraham.ac.uk/projects/trim_galore/ |
Trimmomatic | — | — | http://www.usadellab.org/cms/?page=trimmomatic |
Unicycler | — | — | https://github.com/rrwick/Unicycler#necessary-read-length |