このプロトコルは、尿細菌の培養、シーケンシング、および デノボ ハイブリッドゲノムアセンブリのための包括的なアプローチを詳述する。それは、尿中の植民地化、病原性、および抗菌性の普及に寄与する染色体および染色体外の両方の遺伝子要素を研究するのに有用な完全な、円形ゲノム配列の生成のための再現可能な手順を提供する。
完全なゲノム配列は、尿中微生物の遺伝的多様性とユニークなコロニー形成因子を理解するための貴重なデータを提供します。これらのデータには、抗菌性の普及に寄与し、尿路感染症(UTI)の治療をさらに複雑にするプラスミドや染色体外ファージなどの移動遺伝子要素が含まれる可能性があります。ゲノム構造の微細な解決を提供することに加えて、完全な閉じたゲノムは、詳細な比較ゲノムおよび進化的分析を可能にする。完全なゲノム デノボ の生成は、利用可能なシーケンシング技術の限界のために長い間困難な作業でした。ペアエンド次世代シーケンシング(NGS)は、多くの場合、正確だが断片化したゲノムアセンブリをもたらす高品質のショート読み取りを生成します。それどころか、Nanoporeシーケンシングは、通常、エラーが起こりやすい完全なアセンブリにつながる低品質の長い読み取りを提供します。このようなエラーは、ゲノム全体の関連研究を妨げたり、誤解を招く変異体解析結果を提供したりする可能性があります。したがって、短い読み取りと長い読み取りの両方を組み合わせたハイブリッドアプローチは、高精度の閉じた細菌ゲノムを達成するための信頼性の高い方法として出現しています。本明細書に報告されているのは、多様な尿細菌の培養、16S rRNA遺伝子シーケンシングによる種同定、ゲノムDNA(gDNA)の抽出、およびNGSおよびナノポアプラットフォームによる短い読み取りおよび長い読み取りの生成に関する包括的な方法である。さらに、この方法は、全ゲノム配列の生成のための品質管理、組立、および遺伝子予測アルゴリズムのバイオインフォマティクスパイプラインを記述する。バイオインフォマティクスツールの組み合わせにより、ハイブリッドゲノムアセンブリおよびダウンストリーム解析のための高品質の読み取りデータを選択できます。このプロトコルに記載されているハイブリッド ・デ・ノボゲノム アセンブリの合理化されたアプローチは、任意の可進性細菌での使用に適応され得る。
尿マイクロバイオームは、尿路が健康な個人で無菌であるという数十年にわたる誤解を打ち砕いた研究の新興分野です。尿中微生物叢のメンバーは、尿環境のバランスをとり、尿路感染症(UTI)1、2を予防するのに役立ちます。泌尿器病原性細菌は尿路に侵入し、生体内微生物叢を置き換え、尿路上皮を植民地化し、免疫応答を回避し、環境圧力3,4に対抗する多様な病原性メカニズムを採用する。尿は、高い浸透性、限られた窒素と炭水化物の可用性、低酸素化、および低pH5、6、7によって特徴づけられる比較的栄養が限られた媒体である。尿はまた、抗菌性であると考えられ、ヒトカテリシジンLL-378のような高濃度の阻害性尿素および抗菌ペプチドから構成される。尿路の健康を理解し、UTI治療のための新しい戦略を開発するためには、尿路を植民地化するために、常駐細菌と泌尿器病原体の両方で採用されているメカニズムを調査することが重要です。さらに、第一線の抗菌療法の不全がより一般的になるにつれて、尿細菌9,10の集団内で抗菌性決定基を担う移動性遺伝要素の普及を監視することがますます重要になっている。
尿細菌の遺伝子型や型を調べるには、その培養の成功とその後の全ゲノムシーケンシング(WGS)が不可欠です。培養依存的な方法は、尿サンプル11中の生き生き微生物を検出し同定するために必要である。標準的な臨床尿培養は、5%の羊の血液寒天(BAP)とマッコンキー寒天に尿をめっきし、24時間12のために35°Cで好気的にインキュベートすることを含む。しかし、検出閾値≥105 CFU/mL13では、尿中微生物叢の多くのメンバーはこの方法では報告されない。強化された定量尿培養(EQUC)11などの改善された培養技術は、標準的な尿培養によって一般的に見逃される微生物を同定するために、異なる尿量、インキュベーション時間、培養培地、大気条件の様々な組み合わせを採用しています。このプロトコルに記載されているEQUCの改変版は、ここで修正された強化尿培養プロトコルと呼ばれ、選択的培地および最適な大気条件を使用して多様な尿細菌および泌尿器病原体の培養を可能にするが、本質的には定量的ではない。尿細菌の分離に成功すると、下流のWGSおよびゲノムアセンブリのゲノムDNA(gDNA)の抽出が可能になります。
ゲノムアセンブリは、特に完全な集合体であり、居住微生物叢および泌尿病原性細菌の両方の間でコロニー形成、ニッチ維持、および病原性に寄与し得る遺伝的要因の発見を可能にする。ドラフトゲノムアセンブリには、シーケンスエラーを含み、オリエンテーション情報が不足している連続配列(コンティグ)が多様に含まれています。完全なゲノムアセンブリでは、すべてのベースペアの向きと精度の両方が14.さらに、完全なゲノム配列を得て、ゲノム構造、遺伝的多様性、および移動遺伝子要素15に関する洞察を提供する。短い読み取りだけでは重要な遺伝子の有無を特定するが、ゲノムコンテキスト16を特定できない場合がある。オックスフォードナノポアやPacBioなどの長期読み取りシーケンシング技術を可能にすることで、細菌ゲノムのクローズドノボアセンブリを生成するには、マルチプレックスPCR17、18によるデノボアセンブリの手動閉鎖などの激しい方法が必要なくなりました。次世代の短読シーケンシングとNanoporeロングリードシーケンシング技術の組み合わせは、比較的低コストで正確で完全で閉じた細菌ゲノムアセンブリのファシリティ生成を可能にします19.短読シーケンシングは、一般的に平均40〜100個のコンティグからなる正確でありながら断片化されたゲノムアセンブリを生成し、ナノポアシーケンシングは、精度が低いが、コンティグに結合し、ゲノムシンテンションを解決するための足場として役立つ長さ約5〜100kbの長い読み取りを生成します。短読と長期読み取りの両方の技術を利用したハイブリッドアプローチは、正確で完全な細菌ゲノムを生成することができます19.
ここでは、ハイブリッドアセンブリアプローチを用いたヒト尿、ゲノムDNA抽出、シーケンシング、および完全なゲノムアセンブリからの細菌の単離および同定のための包括的なプロトコルを説明する。このプロトコルは、閉じた細菌染色体およびプラスミドなどの染色体外要素の正確な組み立てのために、短読および長読のシーケンシングによって生成される読み取りを適切に変更するために必要なステップに特に重点を置きます。
ここで説明する包括的なハイブリッドゲノムアセンブリプロトコルは、多様な尿中微生物叢および泌尿器病者の培養を成功させ、そのゲノムの完全な組み立てのための合理化されたアプローチを提供する。細菌ゲノムの成功したWGSは、ゲノムDNAを抽出するために、多様で時には潔癖性の微生物の単離から始まります。現在までに、既存の尿培養プロトコルは、多くの尿種を検出するために必要な感受性を欠いているか、または長時間および資源11を必要とする長く広範なアプローチを伴う。記載されている改変性尿培養アプローチは、潜在的に病原性または有益なコメンス種を含む17の一般的な尿属に属する細菌の正常な単離のための簡素化された包括的なプロトコルを提供し、両方の好気性または嫌気性細菌を含む。これは、細菌ゲノムの正確なシーケンシングと組み立て、および尿の健康と病気の理解に貢献する重要な石体実験に必要な出発物質を提供します。さらに、この修飾された培養アプローチは、尿検体に含まれる生存微生物のより明確な臨床診断を提供し、将来のゲノム研究のためにバイオバンキングを可能にする。ただし、このプロトコルは制限がないわけではありません。生物によっては長いインキュベーション時間が必要な場合があり、低酸素室や制御インキュベーターなどのリソースを使用する必要があり、容易に入手できない場合があります。嫌気性のGasPaksの使用は代替の解決を提供するが、これらは高価であり、常に持続的で制御された環境を作り出さない。最後に、培養バイアスとサンプルの多様性は、特定の生物や泌尿器病原体が潔癖性細菌を上回ることを可能にする可能性があります。これらの制限にもかかわらず、多様な尿細菌の培養はこのアプローチによって可能になります。
ゲノムシーケンシングは、シーケンシングデータ14,15の歩留まりと精度の両方を飛躍的に向上させた次世代シーケンシング技術の進歩に伴って人気を集めています。データ処理とデノボアセンブリのためのアルゴリズムの開発と相まって、完全なゲノム配列は、初心者や専門家の科学者の指先にある15、45。完全なゲノムによって提供される全体的なゲノム組織の知識は、遺伝子の重複、遺伝子喪失、および水平遺伝子導入14を含む重要な進化的および生物学的洞察を提供する。さらに、抗菌性および毒性に重要な遺伝子は、しばしば移動要素に局在し、一般に、ゲノムドラフトアセンブリ15,16では解決されない。
本明細書のプロトコルは、完全なゲノムアセンブリを生成するための短読み取りおよび長期読み取りプラットフォームからのシーケンシングデータの組み合わせのためのハイブリッドアプローチに従う。尿細菌ゲノムに焦点を当てる一方で、この手順は、様々な分離源からの多様な細菌に適応することができる。このアプローチの重要なステップは、適切な滅菌技術に従い、純粋な尿細菌の単離のための適切な培地および培養条件を利用することを含む。さらに、無傷で高収率のgDNAの抽出は、組み立て成功を妨げる可能性のある汚染読み取りを含まないシーケンシングデータを生成するために不可欠です。その後のライブラリ準備プロトコルは、十分な長さと深さの品質読み取りの生成に不可欠です。したがって、この技術の最大の利点は理論的な上限制限のない長い読み取りの生成であるため、特に、長期読み取りシーケンシングのためのライブラリの準備中にgDNAを注意して扱うことは非常に重要です。また、騒がしいデータを排除し、アセンブリの結果を改善するシーケンシング読み取りの適切な品質管理(QC)のセクションも概説されています。
DNAの分離、ライブラリーの調製、およびシーケンシングが成功したにもかかわらず、いくつかの種のゲノムアーキテクチャの性質は、依然として閉じたゲノムアセンブリ45,46の生成に障害を与える可能性がある。繰り返しシーケンスはアセンブリの計算を複雑にする場合が多く、長い読み取りデータにもかかわらず、これらの領域は信頼度が低い場合やまったく解決されない場合があります。したがって、長い読み取りは、ゲノムまたはカバレッジの最大のリピート領域よりも平均して長くなければなりません(>100x)19 。不完全なままで、完成するために手作業でアプローチが必要なゲノムもあります。それにもかかわらず、ハイブリッド組み立てられた不完全なゲノムは、通常、短読のドラフトゲノムよりも少ないコンティグで構成される。アセンブリアルゴリズムのデフォルトパラメータを調整するか、読み取りQCのより厳しいカットオフに従うと役立つ場合があります。あるいは、推奨されるアプローチとして、最も可能性の高いアセンブリパスの証拠を求めて、長い読み取りを不完全な領域にマッピングし、増幅領域のPCRおよびサンガーシーケンシングを利用したパスを確認する方法があります。Minimap2を使用した読み取りのマッピングが推奨され、包帯は、コンティグリンケージ47の証拠を提供する組み立てられたコンティグに沿ってマッピングされた読み取りを視覚化するための便利なツールを提供します。
完全なゲノムを生成するための追加の課題は、コマンドラインツールを使った親しみやすさと快適さにあります。多くのバイオインフォマティクスツールは、あらゆるユーザーに計算の機会を提供するために開発されています。ただし、UNIX とプログラミングの基本を理解する必要があります。このプロトコルは、以前のコマンドライン経験のない個人が閉じたゲノムアセンブリを生成し、それらにアコージンを付けるための十分に詳細な指示を提供することを目的としています。
The authors have nothing to disclose.
ムウテ・ジュバイダ・イスラム博士とルーク・ジョイス博士がこの議定書に貢献してくれたことに感謝します。また、テキサス大学ダラスゲノムセンターのフィードバックとサポートを認めたいと思います。この作品は、ウェルチ財団、N.J.D.への賞番号AT-2030-20200401、国立衛生研究所、K.P.への賞番号R01AI116610、フェレシアとジョン・ケイン女性の健康の議長によって資金提供されました。
Equipment: | |||
Bioanalyzer 2100 | Agilent | G29398A | Optional but recommended |
Centrifuge | Eppendorf | — | Any centrifuge for spinning conicals and microcentrifuge tubes (e.g. Models 5810R/5424R) |
Electrophoresis | BioRad Laboratories | 1645070 | |
Gel Imaging System | BioRad Laboratories | ChemiDoc models | |
Incubator | ThermoFisher Scientific | — | Any CO2 Incubator (e.g. Thermo Forma model 3110) |
Magnetic Rack | New England BioLabs | S15095 | 12-tube rack |
MinION | Oxford Nanopore Technologies | — | |
Nanodrop | ThermoFisher Scientific | ND-ONE-W | |
NextSeq 500 | Illumina | SY-415-1002 | Other Illumina models are acceptable |
Plate Reader | BioTek | — | Synergy H1 |
Qubit fluorometer | ThermoFisher Scientific | Q33238 | |
Rotator | Benchmark Scientific | H2024 | |
Thermocycler | ThermoFisher Scientific | — | Any thermocycler for PCR reactions (e.g. ProFlex PCR system) |
Materials: | |||
10X Phosphate Buffered Saline (PBS) | Fisher Scientific | BP3991 | |
10X TBE buffer | — | — | 1M Tris,1M Boric Acid,0.2M EDTA (pH 8.0) |
1429R primer | Sigma Aldrich (Custom oligos) | — | GGTTACCTTGTTACGACTT |
1kb Ladder | VWR | 101228-494 | |
1M Tris-Cl (pH 7.5) | ThermoFisher Scientific | 15567027 | |
6x Loading dye | Fisher Scientific | NC0783588 | |
8F primer | Sigma Aldrich (Custom oligos) | — | AGAGTTTGATCCTGGCTCAG |
Agar | Fisher Scientific | BP1423-2 | |
Agarose | BioRad Laboratories | 63001 | |
AMPure XP Beads | Beckman Coulter | A63880 | |
Anaerobe Pouch System – GasPak EZ | BD Diagnostic Systems | B260683 | |
Boric Acid | Fisher Scientific | A73-500 | |
Brain Heart Infusion Broth | BD Diagnostic Systems | 212304 | |
CDC Anaerobe 5% Sheep Blood Agar | BD Diagnostic Systems | L007357 | |
CHROMagar Orientation | BD Diagnostic Systems | PA-257481.04 | |
DNeasy Blood & Tissue | QIAGEN | 69504 | |
DreamTaq Master Mix | ThermoFisher Scientific | K1081 | |
Dry Anaerobic Indicator Strips | BD Diagnostic Systems | 271051 | |
EDTA | Fisher Scientific | S311-500 | |
Ethanol 200 Proof | Sigma Aldrich | E7023 | For molecular biology |
Ethidium Bromide | ThermoFisher Scientific | BP130210 | |
Flow cell priming kit | Oxford Nanopore Technologies | EXP-FLP002 | |
Flow cell wash kit | Oxford Nanopore Technologies | EXP-WSH003 | |
Gel Extraction Miniprep Kit | BioBasic | BS654 | |
Ligation sequencing kit | Oxford Nanopore Technologies | SQK-LSK109 | |
Lysozyme | Research Products International Corp | L381005.05 | |
Mutanolysin | Sigma Aldrich | M9901-5KU | |
Native barcoding expansion 1-12 | Oxford Nanopore Technologies | EXP-NBD104 | |
NEB Blunt/TA Ligase Master Mix | New England BioLabs | M0367L | |
NEBNext FFPE DNA Repair Mix | New England BioLabs | M6630L | |
NEBNext quick ligation buffer | New England BioLabs | B6058S | |
NEBNext Ultra II End repair / dA-tailing module | New England BioLabs | E7546L | |
Nextera DNA CD Indexes | Illumina | 20018708 | |
Nextera DNA Flex Library Prep – (M) Tagmentation | Illumina | 20018705 | |
Nuclease-free water | Sigma Aldrich | W4502 | |
Qubit 1X dsDNA HS Assay Kit | ThermoFisher Scientific | Q33230 | |
Qubit Assay Tubes | ThermoFisher Scientific | Q32856 | |
Quick T4 DNA Ligase | New England BioLabs | E6056L | |
R9 Flow cell | Oxford Nanopore Technologies | FLO-MIN106D | |
RNase A | ThermoFisher Scientific | EN0531 | |
Sheep Blood | Hemostat Laboratories | DS13250 | |
TE buffer | — | — | 10mM Tris, 1mM EDTA (pH 8.0) |
Triton X-100 | Sigma Aldrich | T8787 | |
Tryptic Soy Broth | BD Diagnostic Systems | 211825 | |
Software & Bioinformatic Tools: | |||
Bandage | — | — | https://rrwick.github.io/Bandage/ |
Center for Genomic Epidemiology | — | — | http://www.genomicepidemiology.org/ |
CLC Genomics Workbench 12 | QIAGEN | — | |
CRISPRcasFinder | — | — | https://crisprcas.i2bc.paris-saclay.fr/ |
FastQC | — | — | https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ |
Geneious Prime | Geneious | — | |
gVolante (BUSCO) | — | — | https://gvolante.riken.jp/ |
Kbase Prokka Wrapper | — | — | https://kbase.us/applist/apps/ProkkaAnnotation/annotate_contigs/release |
Minimap2 | — | — | https://github.com/lh3/minimap2 |
MinKNOW | Oxford Nanopore Technologies | — | |
NanoFilt | — | — | https://github.com/wdecoster/nanofilt |
NanoStat | — | — | https://github.com/wdecoster/nanostat |
PHASTER | — | — | https://phaster.ca/ |
Prokka | — | — | https://github.com/tseemann/prokka |
QUAST | — | — | http://quast.sourceforge.net/quast |
Trim Galore | — | — | https://www.bioinformatics.babraham.ac.uk/projects/trim_galore/ |
Trimmomatic | — | — | http://www.usadellab.org/cms/?page=trimmomatic |
Unicycler | — | — | https://github.com/rrwick/Unicycler#necessary-read-length |