IDBacは、細菌コロニーから掻き取られた細胞材料に収集された、無傷のタンパク質と特殊な代謝スペクトルの両方からのデータを統合するオープンソースの質量分析ベースのバイオインフォマティクスパイプラインです。このパイプラインにより、研究者は数百から数千の細菌コロニーを種置分類群に迅速に組織し、特殊な代謝産物生産に基づいてそれらをさらに区別することができます。
栄養寒天で増殖する細菌コロニーの細菌系統と特殊な代謝産物産生との関係を可視化するために、低コストで高スループットのマトリックス支援レーザー脱着/イオン化を実現するIDBacを開発しました。飛行時間質量分析(MALDI-TOF MS)バイオインフォマティクスパイプライン。IDBacソフトウェアは、非専門家のために設計されており、自由に利用可能であり、細菌のコロニーの数〜数千を分析することができます。ここでは、MALDI-TOF MS解析、MS計測器の操作、IDBacにおけるデータ処理と可視化のための細菌コロニーの調製手順を紹介する。特に、タンパク質MS指紋に基づいて細菌をデンドログラムにクラスター化する方法をユーザーに指示し、特殊な代謝産物データから代謝物アソシエーションネットワーク(MAN)をインタラクティブに作成する方法を指示します。
細菌機能を研究する研究者の主な障壁は、微生物の分類的アイデンティティと特殊な代謝産物を生産する能力を迅速かつ同時に評価する能力です。これは、細菌の系統と環境から分離された細菌の大部分における特殊な代謝産物産生との関係を理解する上で重要な進歩を防いだ。タンパク質フィンガープリントを用いて細菌を同定するMSベースの方法は、1、2、3、4についてよく説明されているが、これらの研究は一般的に、単離物の小群で行われている。種固有の方法で。重要なのは、環境における微生物機能の主要な推進要因である特殊代謝産物産生に関する情報は、これらの研究に組み込まれないままである。Silva et al.5は最近、MALDI-TOF MSの使用不足を詳細に説明し、専門の代謝産物を分析し、現在のバイオインフォマティクスのボトルネックを解消するためのソフトウェアの不足を詳述した包括的な歴史を提供した。これらの欠点に対処するために、MALDI-TOF MS6の線形モードとリフレクトロン モードの両方を統合するバイオインフォマティクス パイプラインである IDBac を作成しました。これにより、ユーザーはタンパク質と特殊な代謝産物MS指紋の両方に基づいて細菌単離物を迅速に視覚化し、区別することができます。
IDBac は、コスト効率が高く、スループットが高く、レイ ユーザー向けに設計されています。それは自由に利用できる(chasemc.github.io/IDBac)、MALDI-TOF質量分析計へのアクセスだけを要求する(リフレクターモードは、特殊な代謝産物分析のために必要とされる)。サンプル調製は、単純な「拡張直接転写」方法7、8に依存し、データは単一のMALDIターゲットスポット上で連続した線形および反射ロンの獲得で収集される。IDBacを使用すると、サンプル調製、データ取得、データビジュアライゼーションなど、数百のコロニーの植物学および特殊な代謝産物の生産を4時間以内に分析することが可能です。これは、細菌(遺伝子シーケンシングなど)を同定し、代謝出力(液体クロマトグラフィー質量分析法[LCMS]および同様のクロマトグラフィー法)を分析する従来の方法に比べて、かなりの時間とコストの優位性を提示します。
線形モード解析で得られたデータを使用して、IDBacはタンパク質スペクトルの関連性を表すために階層クラスタリングを採用しています。スペクトルは主にイオン化リボソームタンパク質を表すので、サンプル中に存在する系統的多様性の表現を提供する。さらに、IDBacは、代謝物アソシエーションネットワーク(MAN)として特殊な代謝物指紋を表示するためにリフレクターモードデータを組み込んでいます。MANは、細菌単離物間の共有およびユニークな代謝産物産生を容易に視覚化することを可能にするバイパルティネットワークです。IDBacプラットフォームにより、研究者はタンパク質と特殊な代謝産物データの両方を並行して分析できますが、1つのデータタイプのみが取得された場合は個別に分析できます。重要なのは、IDBac は Bruker および Xiamen インストゥルメントの生データ、および txt、タブ、csv、mzXML、および mzML から生データを処理することです。これにより、データ・セットの手動変換と書式設定が不要になり、ユーザー・エラーや MS データの誤った処理のリスクが大幅に軽減されます。
IDBacプロトコルは、細菌タンパク質と特殊な代謝産物データの取得と分析を1人の研究者によって4時間で最大384の細菌単離物の詳細に説明します。IDBacを使用すると、細菌分離からDNAを抽出したり、液体発酵ブロスから特殊な代謝物抽出物を生成し、クロマトグラフィー法を使用してそれらを分析する必要はありません。代わりに、タンパク質と特殊な代謝産物データは、細菌コロニーからMALDIターゲットプレートに直接材料を広げることによって収集されます。これにより、16S rRNA遺伝子シーケンシングやLCMS 9などの代替技術に関連する時間とコストが大幅に削減されます。
MALDIプレートにマトリックスブランクとキャリブレーションスポットを追加することが重要であり、再現性と統計的な信頼性を確保するために適切な数の反復を使用することをお勧めします。反復数は実験に依存します。たとえば、ユーザーが何千ものコロニーを環境ダイバーシティプレートのコレクションから区別する場合、必要な複製数が少なくなる可能性があります(当研究室では、コロニーごとに 3 つの技術的な反復を収集します)。あるいは、ユーザーが特定の細菌タキサから株のカスタムデータベースを作成して未知の単離物の亜種分類を迅速に決定したい場合、より多くの複製が適切です(私たちの研究室は、1回あたり8つの生物学的反復を収集します)ひずみ)。
IDBacは、栄養分類情報と特殊な代謝産物生産に基づいて、関連性の高い細菌単離物を迅速に分離するためのツールです。これは、詳細な遺伝子解析、代謝物の産生と機能を含む研究、核磁気共鳴分光法による特殊な代謝物構造の特性解析などの直交法の前駆体として機能することができます。LC-MS/MS
特殊な代謝産物産生(IDBac MAN)は、細菌の増殖条件、特に異なる培地を使用して、この方法の潜在的な制限である可能性があります。しかし、IDBacは様々な成長条件下で特殊な代謝産物産生の違いを示すMANを容易に生成することができるので、これらの特性は、ユーザーによって利用される可能性があります。特殊な代謝産物の指紋は成長条件によって異なる可能性がありますが、タンパク質フィンガープリントはこれらの変数にわたって比較的安定していることを以前に示しました(Clark et al.6を参照)。環境ダイバーシティプレートを扱う場合は、近隣の細菌クロストークからの寄与を減らすために、分析前に細菌単離物を精製することをお勧めします。
最後に、タンパク質MSフィンガープリントの検索可能なパブリックデータベースの欠如は、未知の環境細菌を分類するためにこの方法を使用する上で大きな欠点です。これを念頭に置いてIDBacを作成し、コミュニティが受け入れるオープンソース形式(mzML)10、11、12へのデータの自動変換を含み、検索、共有、および作成を可能にするソフトウェアを設計しました。カスタム データベース。私たちは、大規模なパブリックデータベース(>10,000完全に特徴付けられた株)を作成中で、利用可能な場合はGenBankの加盟番号へのリンクを含む種レベルへの一部の分離物の分類を可能にします。
IDBac はオープン ソースであり、データ分析と視覚化のニーズをカスタマイズできるユーザーがコードを使用できます。我々は、ユーザーが彼らの実験目標をサポートし、設計するのを助けるために文献の広範なボディを参照することをお勧めします (Sauer et al.7, Silva et al.5)私たちは、ディスカッションのためのフォーラムを主催しています: https://groups.google.com/forum/#!forum/idbacとソフトウェアに関する問題を報告する手段: https://github.com/chasemc/IDBacApp/issues.
The authors have nothing to disclose.
この研究は、国立一般医学研究所グラントR01 GM125943、ナショナルジオグラフィックグラントCP-044R-17によってサポートされました。アイスランド研究基金助成金 152336-051;そして、シカゴのスタートアップファンドでイリノイ大学。また、以下の貢献者に感謝します: アマンダ・ブルマン博士は、MALDI-TOF MSタンパク質取得パラメータの支援を受けました。テリー・ムーア博士とアトゥル・ジャイン博士は、α-シアノ-4-ヒドロキシシナミン酸マトリックス(CHCA)を再結晶化した。
Acetonitrile | Fisher | 60-002-65 | LC-MS Ultra CHROMASOLV |
Autoflex Speed LEF MALDI-TOF instrument | Bruker Daltonics | ||
Bruker Daltonics Bacterial test standard | Fisher | NC0884024 | Bruker Daltonics 8604530 |
Bruker Peptide Calibration standard | Fisher | NC9846988 | Bruker Daltonics 8206195 |
Formic Acid | Fisher Chemical | A117-50 | 99.5+%, Optima LC/MS Grade |
MALDI-TOF target Plate | Bruker Daltonics | ||
Methanol | Fisher Chemical | A456-500 | Optima LC/MS Grade |
Toothpicks | any is ok | ||
Trifluoroacetic acid | Fisher | AC293810010 | 99.5%, for biochemistry, ACROS Organics |
Water | VWR | 7732-18-5 | LC-MS |
α-Cyano-4-hydroxycinnamic acid | Sigma | 28166-41-8 | (C2020-25G) ≥98% (TLC), powder |