이 프로토콜은 오줌 박테리아의 배양, 시퀀싱 및 드 노보 하이브리드 게놈 조립에 대한 포괄적 인 접근 방식을 자세히 설명합니다. 그것은 오줌 식민지, 병기 발생 및 항균 저항 보급에 기여하는 염색체 및 외염색체 유전 요소 둘 다 공부에 유용한 완전하고 원형 게놈 서열의 생성을 위한 재현 가능한 절차를 제공합니다.
완전한 게놈 서열은 유전적 다양성과 오줌 미생물의 독특한 식민지 요인에 대한 이해를 위한 귀중한 데이터를 제공합니다. 이러한 데이터는 플라스미드 및 외염색체 파지와 같은 이동식 유전 적 원소를 포함할 수 있으며, 이는 항균 저항의 보급에 기여하고 요로 감염 (UTI)의 치료를 더욱 복잡하게 합니다. 게놈 구조의 미세한 분해능을 제공하는 것 외에도, 완전하고 폐쇄된 게놈은 상세한 비교 유전체학 및 진화 분석을 가능하게 합니다. 완전한 게놈 드 노보의 생성은 사용 가능한 시퀀싱 기술의 한계로 인해 오랫동안 도전적인 작업이었습니다. 페어링 엔드 차세대 염기서열 분석(NGS)은 고품질의 짧은 판독을 생성하여 정확하지만 단편화된 게놈 어셈블리를 생성합니다. 반대로, 나노포어 시퀀싱은 일반적으로 오류가 발생하기 쉬운 완전한 어셈블리로 이어지는 낮은 품질의 긴 판독을 제공합니다. 이러한 오류는 게놈 전체 협회 연구를 방해하거나 오해의 소지가 있는 변형 분석 결과를 제공할 수 있습니다. 따라서 짧고 긴 판독을 모두 결합한 하이브리드 접근법은 매우 정확한 폐쇄세균 게놈을 달성하기 위한 신뢰할 수 있는 방법으로 부상했습니다. 본 명세서에서 보고된 다양한 오줌 박테리아의 배양, 종 식별에 의한 16S rRNA 유전자 시퀀싱, 게놈 DNA(gDNA)의 추출, NGS 및 나노포어 플랫폼에 의한 짧고 긴 판독의 생성이 각각 이다. 또한,이 방법은 추가로, 추가된 완전한 게놈 서열의 생성을 위한 품질 관리, 조립 및 유전자 예측 알고리즘의 생물포계 파이프라인을 기술합니다. 생물 정보 도구의 조합은 하이브리드 게놈 조립 및 다운스트림 분석을위한 고품질 읽기 데이터의 선택을 가능하게합니다. 이 프로토콜에 기재된 하이브리드 드 노보 게놈 어셈블리에 대한 간소화된 접근법은 임의의 컬투성 박테리아에서의 사용을 위해 적응될 수 있다.
요로 미생물군유전체는 요로가 건강한 개인에게 멸균된다는 수십 년 의 긴 오해를 산산조각 난 연구의 신흥 영역입니다. 요로 미생물의 구성원은 요로 환경의 균형을 맞추고 요로 감염 (UTI)1,2를예방하는 역할을 할 수 있습니다. 비뇨기증 균은 요로를 침범하고 상주 미생물을 대체하고, 비뇨기과를 식민지화하고, 면역 반응을 회피하고, 환경 압력에 중화하기 위해 다양한 독성 메커니즘을사용한다 3,4. 소변은 높은 진동, 제한된 질소 및 탄수화물 가용성, 낮은 산소, 낮은 pH5,6,7을특징으로 상대적으로 영양 제한 매체이다. 소변은 또한 항균제로 간주되며, 인체 카플리시딘 LL-378과같은 억제 우레아 및 항균 펩티드의 고농도로 구성된다. 요로를 식민지화하기 위해 상주 박테리아와 비뇨기과 물질 모두에 의해 채택된 기계장치를 조사하는 것은 요로 건강을 더 이해하고 UTI 처리를 위한 새로운 전략을 개발하는 것이 중요합니다. 더욱이, 일선 항균요법의 실패가 보편화됨에 따라, 오줌박테리아의 집단 내에서 항균저항 결정제를 운반하는 이동식 유전적 원소의 보급을 감시하는 것이 점점 더 중요해지고 있다9,10.
요로 박테리아의 유전자형 과 표현형을 조사하기 위해 성공적인 배양과 후속 전체 게놈 시퀀싱 (WGS)이 필수적입니다. 배양의존적 방법은 소변샘플(11)에서가능한 미생물을 검출하고 식별하는 데 필요하다. 표준 임상 소변 배양은 소변을 5% 양 혈액 한천(BAP)과 맥콩키 한천에 도금하고 24h12에대해 35°C에서 항공적으로 배양하는 것을 포함한다. 그러나, ≥105 CFU/mL13의검출 임계값을 가진, 오줌 microbiota의 많은 구성원은 이 방법에 의해 보고되지 않습니다. 향상된 정량소변 배양(EQUC)(11)와 같은 향상된 배양 기술은 표준 소변 문화에 의해 일반적으로 놓친 미생물을 확인하기 위하여 다른 소변 볼륨, 잠복기, 배양 매체 및 대기 조건의 각종 조합을 채택합니다. 본 프로토콜에 기재된 EQUC의 수정된 버전은, 여기에 변형된 향상된 소변 배양 프로토콜이라고 불리는, 선택적 배지와 최적의 대기 조건을 사용하여 다양한 오줌 박테리아와 비뇨기병균을 배양할 수 있지만 본질적으로 정량적이지는 않습니다. 오줌 박테리아의 성공적인 격리는 하류 WGS 및 게놈 조립을 위한 게놈 DNA (gDNA)의 추출을 가능하게 합니다.
게놈 어셈블리, 특히 완전한 어셈블리는, 상주 미생물과 비뇨기과 박테리아 둘 다 중 식민지화, 틈새 유지 보수 및 독성에 기여할 수 있는 유전 적 요인의 발견을 가능하게 합니다. 초안 게놈 어셈블리에는 시퀀싱 오류및 방향 정보가 부족할 수 있는 다양한 수의 연속 서열(연속)이 포함되어 있습니다. 완전한 게놈 어셈블리에서 모든 베이스 쌍의 방향과 정확도가모두 14로확인되었습니다. 더욱이, 완전한 게놈 서열을 얻는 것은 게놈 구조, 유전적 다양성 및 이동성 유전원15에대한 통찰력을 제공한다. 짧은 읽기만으로는 중요한 유전자의 존재 또는 부재를 식별할 수 있지만 그들의 게놈컨텍스트(16)를정확히 찾아낼 수는 없다. 옥스포드 나노포어 및 PacBio와 같은 장시간 읽은 시퀀싱 기술을 가능하게 함으로써, 세균 게놈의 폐쇄 드 노보 어셈블리를 생성하면 더 이상 멀티플렉스 PCR17,18에의한 드 노보 어셈블리의 수동 폐쇄와 같은 격렬한 방법이 필요하지 않다. 차세대 단기 판독 시퀀싱 과 나노포어 장기 읽기 시퀀싱 기술의 조합은 상대적으로 저렴한비용으로정확하고 완전하며 폐쇄된 세균 게놈 어셈블리의 촉진 생성을 허용한다. 짧은 읽기 시퀀싱은 일반적으로 평균 40-100 개의 연속으로 구성된 정확하면서도 단편화된 게놈 어셈블리를 생성하며, Nanopore 시퀀싱은 정확도가 낮지만 연통에 가입하고 유전체 시니를 해결하는 스캐폴드로 작용할 수 있는 길이약 5-100 kb의 긴 판독을 생성합니다. 짧은 읽기 및 긴 읽기 기술을 모두 활용하는 하이브리드 접근 방식은 정확하고 완전한 세균 게놈19를생성할 수 있습니다.
여기에 설명된 것은 하이브리드 어셈블리 접근법을 이용한 인간 소변, 게놈 추출, 시퀀싱 및 완전한 게놈 조립으로부터 박테리아의 격리 및 식별을 위한 포괄적인 프로토콜이다. 이 프로토콜은 플라스미드와 같은 폐쇄된 세균 염색체 및 초염색체 원소의 정확한 조립을 위해 짧은 읽기 및 긴 읽기 시퀀싱으로 생성된 읽기를 올바르게 수정하는 데 필요한 단계에 중점을 둡니다.
여기에서 기술된 포괄적인 하이브리드 게놈 조립 프로토콜은 다양한 오줌 microbiota 및 비뇨기요법의 성공적인 배양및 그들의 게놈의 완전한 조립을 위한 능률적인 접근을 제공합니다. 세균성 게놈의 성공적인 WGS는 그들의 게놈 DNA를 추출하기 위하여 다양하고 때때로 까다로운 세균의 격리로 시작합니다. 현재까지, 기존의 소변 배양 프로토콜은 많은 오줌 종을 검출하는 데 필요한 감도가 부족하거나 연장 된 시간과 자원을 필요로하는 길고 광범위한 접근 방식을 포함(11). 설명된 수정된 향상된 소변 문화 접근은 잠재적으로 병원성 또는 유익한 성공종을 포함하여 17개의 일반적인 오줌 제네라에 속하는 박테리아의 성공적인 격리를 위한 단순화되면서도 포괄적인 프로토콜을 제안하며, 촉진및 의무유산소 또는 혐기성 박테리아. 이것은 차례차례로 세균게놈의 정확한 순서 및 조립및 오줌 건강과 질병의 이해에 기여하는 중요한 현상제 실험을 위한 필요한 시작 물질을 제공합니다. 더욱이, 이 수정된 배양 접근법은 소변 견본에서 찾아낸 실행 가능한 미생물의 보다 정의된 임상 진단을 제공하고 미래 게놈 연구를 위한 그들의 biobanking를 허용합니다. 그러나 이 프로토콜은 제한 없이 는 아닙니다. 그것은 유기체에 따라서 긴 잠복기뿐만 아니라 쉽게 사용할 수 없을 수 있습니다 저산소실 또는 제어 인큐베이터와 같은 자원의 사용을 필요로 할 수있다. 혐기성 GasPaks의 사용은 대체 솔루션을 제공하지만 비용이 많이 들고 항상 지속적이고 통제 된 환경을 생성하지는 않습니다. 마지막으로, 배양 편향뿐만 아니라 샘플 다양성은 특정 유기체와 비뇨기과균이 까다로운 박테리아를 능가하는 것을 허용할 수 있습니다. 이러한 제한에도 불구 하 고, 다양 한 오줌 박테리아의 문화는이 접근에 의해 가능.
유전체 시퀀싱은 차세대 시퀀싱 기술의 발전으로 인기를 얻고 있으며, 이는 시퀀싱 데이터14,15의수율과 정확도를 크게 증가시켰습니다. 데이터 처리 및 드 노보 어셈블리를 위한 알고리즘의 개발과 함께 완전한 게놈 서열은 초보자와 전문 과학자 모두15,45의손끝에 있습니다. 완전한 게놈에 의해 제공된 전반적인 게놈 조직의 지식은 유전자 중복, 유전자 손실 및 수평 유전자 전송14를포함하여 중요한 진화적이고 생물학 통찰력을 제공합니다. 추가적으로, 항균 저항 및 독성에 중요한 유전자는 수시로 초안 게놈 어셈블리에서 전형적으로 해결되지 않는 모바일 요소에 국한됩니다15,16.
본 명세서에서 프로토콜은 완전한 게놈 어셈블리를 생성하기 위해 짧은 읽기 및 긴 읽기 플랫폼에서 데이터를 시퀀싱하는 조합을 위한 하이브리드 접근 방식을 따릅니다. 오줌 세균게놈에 집중하는 동안, 이 절차는 각종 격리 근원에서 다양한 박테리아에 적응될 수 있습니다. 이 접근법의 중요한 단계는 적당한 살균 기술을 따르고 순수한 오줌 박테리아의 격리를 위한 적당한 매체 및 문화 조건을 이용하는 것을 포함합니다. 또한, 고수율 gDNA의 추출은 조립 성공을 저해할 수 있는 오염 판독이 없는 시퀀싱 데이터를 생성하는 데 필수적입니다. 후속 라이브러리 준비 프로토콜은 충분한 길이와 깊이의 품질 읽기 생성에 매우 중요합니다. 따라서, 이 기술의 가장 큰 장점은 이론적 상반수 제한없이 긴 읽기의 생성이기 때문에, 특히 긴 읽기 시퀀싱에 대한 라이브러리 준비 중에 주의gDNA를 처리하는 것이 매우 중요합니다. 또한 시끄러운 데이터를 제거하고 어셈블리 결과를 향상시키는 시퀀싱 읽기의 적절한 품질 관리(QC)에 대한 섹션도 설명되어 있습니다.
성공적인 DNA 격리, 라이브러리 준비 및 시퀀싱에도 불구하고, 일부 종의 게놈 아키텍처의 특성은 여전히 폐쇄 게놈 어셈블리45,46의생성에 대한 장애물을 제공 할 수 있습니다. 반복적인 시퀀스는 종종 어셈블리 계산을 복잡하게 하며 긴 읽기 데이터에도 불구하고 이러한 영역은 낮은 신뢰도로 해결되거나 전혀 해결되지 않을 수 있습니다. 따라서 긴 읽기는 게놈 또는 커버리지에서 가장 큰 반복 영역보다 평균적으로 더 길어야 한다 (>100x)19. 일부 게놈은 불완전한 상태로 남아 있으며 완료를 위해 수동 접근이 필요할 수 있습니다. 그럼에도 불구하고, 하이브리드 조립 불완전한 게놈은 일반적으로 짧은 읽기 초안 게놈 보다는 더 적은 연속으로 이루어지고 있습니다. 어셈블리 알고리즘의 기본 매개 변수를 조정하거나 읽기 QC에 대한 보다 엄격한 차단을 따르는 것이 도움이 될 수 있습니다. 또는 가장 가능성이 높은 어셈블리 경로에 대한 증거를 찾기 위해 불완전한 영역에 긴 판독을 매핑한 다음 증폭 된 영역의 PCR 및 Sanger 시퀀싱을 사용하여 경로를 확인하는 것이 좋습니다. Minimap2를 사용하여 읽기 매핑이 제안되고 붕대는 연속연결(47)에대한 증거를 제공하는 조립된 연속화를 따라 매핑된 읽기의 시각화를 위한 유용한 도구를 제공합니다.
완전한 게놈을 생성하는 추가적인 과제는 명령줄 도구를 사용하여 친숙함과 편안함에 있습니다. 많은 생물 정보 도구는 모든 사용자에게 계산 기회를 제공하기 위해 개발되었습니다. 그러나, 그들의 활용은 UNIX 및 프로그래밍의 기초와 이해에 의존. 이 프로토콜은 사전 명령줄 경험이 없는 개인이 폐쇄된 게놈 어셈블리를 생성하고 이에 대해 알수 할 수 있도록 충분히 상세한 지침을 제공하는 것을 목표로 합니다.
The authors have nothing to disclose.
우리는 이 프로토콜에 기여한 무두세 주바이다 이슬람 박사와 루크 조이스 박사에게 감사드립니다. 우리는 또한 그들의 의견과 지원을 위해 달라스 게놈 센터에 있는 텍사스 대학을 인식하고 싶습니다. 이 작품은 웰치 재단에 의해 지원되었다, 수상 번호 AT-2030-20200401 N.J.D.에, 건강의 국립 연구소에 의해, K.P.에 수여 번호 R01AI116610, 그리고 펠레시아와 존 케인 의자에 의해, P.E.Z.에 의해 개최.
Equipment: | |||
Bioanalyzer 2100 | Agilent | G29398A | Optional but recommended |
Centrifuge | Eppendorf | — | Any centrifuge for spinning conicals and microcentrifuge tubes (e.g. Models 5810R/5424R) |
Electrophoresis | BioRad Laboratories | 1645070 | |
Gel Imaging System | BioRad Laboratories | ChemiDoc models | |
Incubator | ThermoFisher Scientific | — | Any CO2 Incubator (e.g. Thermo Forma model 3110) |
Magnetic Rack | New England BioLabs | S15095 | 12-tube rack |
MinION | Oxford Nanopore Technologies | — | |
Nanodrop | ThermoFisher Scientific | ND-ONE-W | |
NextSeq 500 | Illumina | SY-415-1002 | Other Illumina models are acceptable |
Plate Reader | BioTek | — | Synergy H1 |
Qubit fluorometer | ThermoFisher Scientific | Q33238 | |
Rotator | Benchmark Scientific | H2024 | |
Thermocycler | ThermoFisher Scientific | — | Any thermocycler for PCR reactions (e.g. ProFlex PCR system) |
Materials: | |||
10X Phosphate Buffered Saline (PBS) | Fisher Scientific | BP3991 | |
10X TBE buffer | — | — | 1M Tris,1M Boric Acid,0.2M EDTA (pH 8.0) |
1429R primer | Sigma Aldrich (Custom oligos) | — | GGTTACCTTGTTACGACTT |
1kb Ladder | VWR | 101228-494 | |
1M Tris-Cl (pH 7.5) | ThermoFisher Scientific | 15567027 | |
6x Loading dye | Fisher Scientific | NC0783588 | |
8F primer | Sigma Aldrich (Custom oligos) | — | AGAGTTTGATCCTGGCTCAG |
Agar | Fisher Scientific | BP1423-2 | |
Agarose | BioRad Laboratories | 63001 | |
AMPure XP Beads | Beckman Coulter | A63880 | |
Anaerobe Pouch System – GasPak EZ | BD Diagnostic Systems | B260683 | |
Boric Acid | Fisher Scientific | A73-500 | |
Brain Heart Infusion Broth | BD Diagnostic Systems | 212304 | |
CDC Anaerobe 5% Sheep Blood Agar | BD Diagnostic Systems | L007357 | |
CHROMagar Orientation | BD Diagnostic Systems | PA-257481.04 | |
DNeasy Blood & Tissue | QIAGEN | 69504 | |
DreamTaq Master Mix | ThermoFisher Scientific | K1081 | |
Dry Anaerobic Indicator Strips | BD Diagnostic Systems | 271051 | |
EDTA | Fisher Scientific | S311-500 | |
Ethanol 200 Proof | Sigma Aldrich | E7023 | For molecular biology |
Ethidium Bromide | ThermoFisher Scientific | BP130210 | |
Flow cell priming kit | Oxford Nanopore Technologies | EXP-FLP002 | |
Flow cell wash kit | Oxford Nanopore Technologies | EXP-WSH003 | |
Gel Extraction Miniprep Kit | BioBasic | BS654 | |
Ligation sequencing kit | Oxford Nanopore Technologies | SQK-LSK109 | |
Lysozyme | Research Products International Corp | L381005.05 | |
Mutanolysin | Sigma Aldrich | M9901-5KU | |
Native barcoding expansion 1-12 | Oxford Nanopore Technologies | EXP-NBD104 | |
NEB Blunt/TA Ligase Master Mix | New England BioLabs | M0367L | |
NEBNext FFPE DNA Repair Mix | New England BioLabs | M6630L | |
NEBNext quick ligation buffer | New England BioLabs | B6058S | |
NEBNext Ultra II End repair / dA-tailing module | New England BioLabs | E7546L | |
Nextera DNA CD Indexes | Illumina | 20018708 | |
Nextera DNA Flex Library Prep – (M) Tagmentation | Illumina | 20018705 | |
Nuclease-free water | Sigma Aldrich | W4502 | |
Qubit 1X dsDNA HS Assay Kit | ThermoFisher Scientific | Q33230 | |
Qubit Assay Tubes | ThermoFisher Scientific | Q32856 | |
Quick T4 DNA Ligase | New England BioLabs | E6056L | |
R9 Flow cell | Oxford Nanopore Technologies | FLO-MIN106D | |
RNase A | ThermoFisher Scientific | EN0531 | |
Sheep Blood | Hemostat Laboratories | DS13250 | |
TE buffer | — | — | 10mM Tris, 1mM EDTA (pH 8.0) |
Triton X-100 | Sigma Aldrich | T8787 | |
Tryptic Soy Broth | BD Diagnostic Systems | 211825 | |
Software & Bioinformatic Tools: | |||
Bandage | — | — | https://rrwick.github.io/Bandage/ |
Center for Genomic Epidemiology | — | — | http://www.genomicepidemiology.org/ |
CLC Genomics Workbench 12 | QIAGEN | — | |
CRISPRcasFinder | — | — | https://crisprcas.i2bc.paris-saclay.fr/ |
FastQC | — | — | https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ |
Geneious Prime | Geneious | — | |
gVolante (BUSCO) | — | — | https://gvolante.riken.jp/ |
Kbase Prokka Wrapper | — | — | https://kbase.us/applist/apps/ProkkaAnnotation/annotate_contigs/release |
Minimap2 | — | — | https://github.com/lh3/minimap2 |
MinKNOW | Oxford Nanopore Technologies | — | |
NanoFilt | — | — | https://github.com/wdecoster/nanofilt |
NanoStat | — | — | https://github.com/wdecoster/nanostat |
PHASTER | — | — | https://phaster.ca/ |
Prokka | — | — | https://github.com/tseemann/prokka |
QUAST | — | — | http://quast.sourceforge.net/quast |
Trim Galore | — | — | https://www.bioinformatics.babraham.ac.uk/projects/trim_galore/ |
Trimmomatic | — | — | http://www.usadellab.org/cms/?page=trimmomatic |
Unicycler | — | — | https://github.com/rrwick/Unicycler#necessary-read-length |