该协议详细介绍了尿细菌培养,测序和 从头 杂交基因组组装的综合方法。它为生成完整的圆形基因组序列提供了一种可重复的程序,可用于研究有助于尿定植、发病机制和抗菌素耐药性传播的染色体和染色体外遗传元件。
完整的基因组序列为了解泌尿微生物的遗传多样性和独特定植因子提供了有价值的数据。这些数据可能包括移动遗传元件,如质粒和染色体外噬菌体,它们有助于抗菌素耐药性的传播,并使尿路感染(UTI)的治疗进一步复杂化。除了提供基因组结构的精细分辨率外,完整的闭合基因组还允许进行详细的比较基因组学和进化分析。由于现有测序技术的局限性 ,从头开始 生成完整基因组长期以来一直是一项具有挑战性的任务。配对端下一代测序(NGS)产生高质量的短读数,通常导致准确但片段化的基因组组装。相反,纳米孔测序提供质量较低的长读数,通常会导致容易出错的完整组件。这些错误可能会妨碍全基因组关联研究或提供误导性的变异分析结果。因此,结合短读和长读的混合方法已成为实现高度准确的闭合细菌基因组的可靠方法。本文报道的用于培养多种尿菌的综合方法,通过16S rRNA基因测序进行物种鉴定,提取基因组DNA(gDNA),以及分别通过NGS和Nanopore平台生成短读和长读。此外,该方法还描述了用于生成注释的完整基因组序列的质量控制,组装和基因预测算法的生物信息学管道。生物信息学工具的组合可以选择高质量的读取数据,用于杂交基因组组装和下游分析。该协议中描述的用于杂交 从头 基因组组装的简化方法可以适用于任何可培养细菌的使用。
泌尿微生物组是一个新兴的研究领域,它打破了长达数十年的误解,即尿路在健康个体中是无菌的。尿微生物群的成员可用于平衡尿液环境并预防尿路感染(UTI)1,2。泌尿致病细菌侵入尿路,并采用多种毒力机制来取代常驻微生物群,定植尿路上皮,逃避免疫反应并抵消环境压力3,4。尿液是一种营养相对有限的培养基,其特征在于高渗透压,有限的氮和碳水化合物可用性,低氧合和低pH 5,6,7。尿液也被认为是抗菌的,由高浓度的抑制性尿素和抗菌肽如人cathelicidin LL-378组成。调查常驻细菌和泌尿道病原体在尿路定植的机制对于进一步了解尿路健康和制定UTI治疗的新策略至关重要。此外,随着一线抗菌疗法的失败变得越来越普遍,监测携带抗菌素耐药性决定因素的移动遗传元件在尿细菌种群内的传播变得越来越重要9,10。
为了研究尿细菌的基因型和表型,它们的成功培养和随后的全基因组测序(WGS)势在必行。培养依赖性方法对于检测和鉴定尿液样品中的活微生物是必要的11。标准临床尿培养包括将尿液接种到5%绵羊血琼脂(BAP)和麦康基琼脂上,并在35°C下有氧孵育24小时12。然而,由于检测阈值为≥105 CFU / mL13,许多尿微生物群的成员没有通过这种方法报告。改进的培养技术,如增强定量尿培养(EQUC)11, 采用不同尿量,孵育时间,培养基和大气条件的各种组合来鉴定标准尿培养物通常遗漏的微生物。该协议中描述的是EQUC的修改版本,在这里称为改良增强尿培养方案,其能够使用选择性培养基和最佳大气条件培养各种尿细菌和尿路病原体,但不是固有的定量。尿液细菌的成功分离使得能够提取用于下游WGS和基因组组装的基因组DNA(gDNA)。
基因组组装,特别是完整的组装,能够发现可能有助于常驻微生物群和泌尿致病细菌的定植,生态位维持和毒力的遗传因素。基因组组装草案包含大量连续序列(重叠群),这些序列可能包含测序错误并且缺乏方向信息。在完整的基因组组装中,每个碱基对的方向和准确性都得到了验证14.此外,获得完整的基因组序列可以深入了解基因组结构,遗传多样性和移动遗传元件15。仅短读物可以识别重要基因的存在与否,但可能无法确定其基因组背景16。随着牛津纳米孔和PacBio等长读测序技术的实现,生成细菌基因组的闭合从头组装不再需要费力的方法,例如通过多重PCR17,18手动关闭从头组装。下一代短读测序和纳米孔长读测序技术的结合允许以相对较低的成本轻松生成准确,完整和封闭的细菌基因组组装19。短读测序产生准确但碎片化的基因组组装体,通常平均由40-100个重叠群组成,而Nanopore测序产生长度约为5-100 kb的长读数,这些读数不太准确,但可以作为支架加入重叠群并解析基因组合成。利用短读和长读技术的混合方法可以产生准确和完整的细菌基因组19。
这里描述的是一个全面的方案,用于从人尿液中分离和鉴定细菌,基因组DNA提取,测序和使用混合组装方法的完整基因组组装。该协议特别强调了正确修改由短读和长读测序生成的读数所需的步骤,以便准确组装封闭的细菌染色体和染色体外元件(如质粒)。
这里描述的综合混合基因组组装方案为成功培养各种尿液微生物群和尿路病原体以及其基因组的完整组装提供了一种简化的方法。细菌基因组的成功WGS始于分离各种有时挑剔的微生物,以提取其基因组DNA。迄今为止,现有的尿培养方案要么缺乏检测许多尿种的必要敏感性,要么涉及需要延长时间和资源的冗长而广泛的方法11。所描述的改良增强型尿培养方法为成功分离属于17种常见尿属的细菌(包括潜在致病性或有益的共生菌种,以及兼性和专性需氧或厌氧菌)提供了简化而全面的方案。这反过来又为细菌基因组的准确测序和组装以及关键的表型实验提供了必要的起始材料,这有助于了解泌尿健康和疾病。此外,这种改进的培养方法为尿液标本中发现的活微生物提供了更明确的临床诊断,并允许其生物库用于未来的基因组研究。但是,此协议并非没有限制。它可能需要较长的孵育时间,具体取决于生物体以及使用资源,例如缺氧室或可能不易获得的受控培养箱。使用厌氧气体包提供了一种替代解决方案,但这些解决方案成本高昂,并且并不总是产生持续和受控的环境。最后,培养偏倚以及样本多样性可能允许特定生物体和泌尿道病原体胜过挑剔的细菌。尽管有这些局限性,但这种方法使多种尿液细菌的培养成为可能。
随着下一代测序技术的进步,基因组测序越来越受欢迎,这大大提高了测序数据的产量和准确性14,15。再加上用于数据处理和从头组装的算法的发展,完整的基因组序列在新手和专家科学家的指尖15,45。全基因组提供的整体基因组组织知识提供了重要的进化和生物学见解,包括基因复制,基因丢失和水平基因转移14。此外,对抗菌素耐药性和毒力很重要的基因通常定位于移动元件上,这些元件通常在基因组组装草案15,16中未得到解决。
本文的方案遵循混合方法,用于组合来自短读和长读平台的测序数据,以产生完整的基因组组装。虽然专注于尿液细菌基因组,但该程序可以适应来自各种分离来源的各种细菌。该方法的关键步骤包括遵循适当的无菌技术,并利用适当的培养基和培养条件分离纯尿细菌。此外,提取完整的高产量gDNA对于生成没有污染读数的测序数据至关重要,这些读数可能会阻碍组装成功。后续的文库制备方案对于生成足够长度和深度的高质量读数至关重要。因此,在库制备长读测序期间小心处理gDNA非常重要,因为该技术的最大好处是生成没有理论长度上限的长读取。还概述了测序读数的适当质量控制(QC)部分,可消除噪声数据并改善组装结果。
尽管DNA分离,文库制备和测序成功,但某些物种的基因组结构的性质仍可能为闭合基因组组装的产生提供障碍45,46。重复序列通常使装配计算复杂化,尽管读取数据很长,但这些区域可能以低置信度解决,或者根本不解决。因此,长读取必须平均长于基因组中最大的重复区域或覆盖率必须高(>100x)19。一些基因组可能仍然不完整,需要手动方法才能完成。然而,杂交组装的不完整基因组通常由比短读草稿基因组更少的重叠群组成。调整装配算法的默认参数或遵循更严格的读取 QC 截止值可能会有所帮助。或者,一种建议的方法是将长读数映射到不完整的区域,以寻找最可能的组装路径的证据,然后利用扩增区域的PCR和Sanger测序确认路径。建议使用Minimap2进行映射读取,并且Bandage提供了一个有用的工具,用于可视化沿组合重叠群的映射读取,为重叠群链接47提供证据。
生成完整基因组的另一个挑战在于对命令行工具的熟悉程度和舒适度。许多生物信息学工具的开发旨在为任何用户提供计算机会;但是,它们的使用依赖于对 UNIX 和编程基础知识的理解。该协议旨在提供足够详细的说明,使没有命令行经验的个体能够生成封闭的基因组组装并对其进行注释。
The authors have nothing to disclose.
我们感谢Moutuse Jubaida Islam博士和Luke Joyce博士对该协议的贡献。我们还要感谢德克萨斯大学达拉斯分校基因组中心的反馈和支持。这项工作由韦尔奇基金会资助,奖项编号为AT-2030-20200401给N.J.D.,由美国国立卫生研究院资助,奖项编号R01AI116610给K.P.,以及由Felecia和John Cain妇女健康主席,由P.E.Z.持有。
Equipment: | |||
Bioanalyzer 2100 | Agilent | G29398A | Optional but recommended |
Centrifuge | Eppendorf | — | Any centrifuge for spinning conicals and microcentrifuge tubes (e.g. Models 5810R/5424R) |
Electrophoresis | BioRad Laboratories | 1645070 | |
Gel Imaging System | BioRad Laboratories | ChemiDoc models | |
Incubator | ThermoFisher Scientific | — | Any CO2 Incubator (e.g. Thermo Forma model 3110) |
Magnetic Rack | New England BioLabs | S15095 | 12-tube rack |
MinION | Oxford Nanopore Technologies | — | |
Nanodrop | ThermoFisher Scientific | ND-ONE-W | |
NextSeq 500 | Illumina | SY-415-1002 | Other Illumina models are acceptable |
Plate Reader | BioTek | — | Synergy H1 |
Qubit fluorometer | ThermoFisher Scientific | Q33238 | |
Rotator | Benchmark Scientific | H2024 | |
Thermocycler | ThermoFisher Scientific | — | Any thermocycler for PCR reactions (e.g. ProFlex PCR system) |
Materials: | |||
10X Phosphate Buffered Saline (PBS) | Fisher Scientific | BP3991 | |
10X TBE buffer | — | — | 1M Tris,1M Boric Acid,0.2M EDTA (pH 8.0) |
1429R primer | Sigma Aldrich (Custom oligos) | — | GGTTACCTTGTTACGACTT |
1kb Ladder | VWR | 101228-494 | |
1M Tris-Cl (pH 7.5) | ThermoFisher Scientific | 15567027 | |
6x Loading dye | Fisher Scientific | NC0783588 | |
8F primer | Sigma Aldrich (Custom oligos) | — | AGAGTTTGATCCTGGCTCAG |
Agar | Fisher Scientific | BP1423-2 | |
Agarose | BioRad Laboratories | 63001 | |
AMPure XP Beads | Beckman Coulter | A63880 | |
Anaerobe Pouch System – GasPak EZ | BD Diagnostic Systems | B260683 | |
Boric Acid | Fisher Scientific | A73-500 | |
Brain Heart Infusion Broth | BD Diagnostic Systems | 212304 | |
CDC Anaerobe 5% Sheep Blood Agar | BD Diagnostic Systems | L007357 | |
CHROMagar Orientation | BD Diagnostic Systems | PA-257481.04 | |
DNeasy Blood & Tissue | QIAGEN | 69504 | |
DreamTaq Master Mix | ThermoFisher Scientific | K1081 | |
Dry Anaerobic Indicator Strips | BD Diagnostic Systems | 271051 | |
EDTA | Fisher Scientific | S311-500 | |
Ethanol 200 Proof | Sigma Aldrich | E7023 | For molecular biology |
Ethidium Bromide | ThermoFisher Scientific | BP130210 | |
Flow cell priming kit | Oxford Nanopore Technologies | EXP-FLP002 | |
Flow cell wash kit | Oxford Nanopore Technologies | EXP-WSH003 | |
Gel Extraction Miniprep Kit | BioBasic | BS654 | |
Ligation sequencing kit | Oxford Nanopore Technologies | SQK-LSK109 | |
Lysozyme | Research Products International Corp | L381005.05 | |
Mutanolysin | Sigma Aldrich | M9901-5KU | |
Native barcoding expansion 1-12 | Oxford Nanopore Technologies | EXP-NBD104 | |
NEB Blunt/TA Ligase Master Mix | New England BioLabs | M0367L | |
NEBNext FFPE DNA Repair Mix | New England BioLabs | M6630L | |
NEBNext quick ligation buffer | New England BioLabs | B6058S | |
NEBNext Ultra II End repair / dA-tailing module | New England BioLabs | E7546L | |
Nextera DNA CD Indexes | Illumina | 20018708 | |
Nextera DNA Flex Library Prep – (M) Tagmentation | Illumina | 20018705 | |
Nuclease-free water | Sigma Aldrich | W4502 | |
Qubit 1X dsDNA HS Assay Kit | ThermoFisher Scientific | Q33230 | |
Qubit Assay Tubes | ThermoFisher Scientific | Q32856 | |
Quick T4 DNA Ligase | New England BioLabs | E6056L | |
R9 Flow cell | Oxford Nanopore Technologies | FLO-MIN106D | |
RNase A | ThermoFisher Scientific | EN0531 | |
Sheep Blood | Hemostat Laboratories | DS13250 | |
TE buffer | — | — | 10mM Tris, 1mM EDTA (pH 8.0) |
Triton X-100 | Sigma Aldrich | T8787 | |
Tryptic Soy Broth | BD Diagnostic Systems | 211825 | |
Software & Bioinformatic Tools: | |||
Bandage | — | — | https://rrwick.github.io/Bandage/ |
Center for Genomic Epidemiology | — | — | http://www.genomicepidemiology.org/ |
CLC Genomics Workbench 12 | QIAGEN | — | |
CRISPRcasFinder | — | — | https://crisprcas.i2bc.paris-saclay.fr/ |
FastQC | — | — | https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ |
Geneious Prime | Geneious | — | |
gVolante (BUSCO) | — | — | https://gvolante.riken.jp/ |
Kbase Prokka Wrapper | — | — | https://kbase.us/applist/apps/ProkkaAnnotation/annotate_contigs/release |
Minimap2 | — | — | https://github.com/lh3/minimap2 |
MinKNOW | Oxford Nanopore Technologies | — | |
NanoFilt | — | — | https://github.com/wdecoster/nanofilt |
NanoStat | — | — | https://github.com/wdecoster/nanostat |
PHASTER | — | — | https://phaster.ca/ |
Prokka | — | — | https://github.com/tseemann/prokka |
QUAST | — | — | http://quast.sourceforge.net/quast |
Trim Galore | — | — | https://www.bioinformatics.babraham.ac.uk/projects/trim_galore/ |
Trimmomatic | — | — | http://www.usadellab.org/cms/?page=trimmomatic |
Unicycler | — | — | https://github.com/rrwick/Unicycler#necessary-read-length |