XY-MetaとmetaXを統合した非標的メタボロミクスワークフローを構築しました。このプロトコルでは、XY-Metaを使用してオープンアクセススペクトルリファレンスからデコイスペクトルライブラリを生成する方法を示し、FDR制御を行い、メタボロミクススペクトルを同定した後、metaXを使用して代謝産物を定量しました。
非標的メタボロミクス技術は、近年広く使用されている。しかし、スループットとサンプル数の急速な増加は膨大な量のスペクトルを生成し、質量分析スペクトルの品質管理に課題を課しています。誤検知を減らすには、誤検出率(FDR)の品質管理が必要です。最近、我々はXY-Metaという名前のターゲット – デコイ戦略に基づく非標的メタボローム同定のFDR制御のためのソフトウェアを開発しました。ここでは、XY-Meta と metaX を統合する完全な分析パイプラインを示しました。このプロトコルは、XY-metaを使用して既存の参照データベースからおとりデータベースを生成し、オープンアクセスデータセットで大規模なメタボローム同定のためのTarget-Decoy戦略を使用してFDR制御を実行する方法を示しています。示差分析および代謝産物注釈は、代謝産物ピーク検出および定量についてmetaXを実行した後に実施した。より多くの研究者を支援するために、バイオインフォマティクスのスキルやコンピュータ言語を必要とせずに、これらの分析のためのユーザーフレンドリーなクラウドベースの分析プラットフォームも開発しました。
代謝産物は、生物学的プロセスにおいて重要な役割を果たしている。代謝産物は、多くの場合、エネルギー移動、ホルモン調節、神経伝達物質の調節、細胞通信、およびタンパク質の翻訳後修飾などの様々なプロセスの調節因子である1,2,3,4。非標的メタボロミクスは、多数の代謝産物5,6のグローバルビューを提供する。質量分析およびクロマトグラフィー技術の進歩に伴い、メタボロームMS/MSスペクトルのスループットは近年急速に増加しています7、8、9、10、11。これらの巨大なデータセットから代謝産物を同定するために、MZmine 12、MS-FINDER 13、CFM-ID 14、MetFrag15、SLAW16など、さまざまな注釈ソフトウェア11が開発されました。ただし、これらの ID には多くの場合、多くの誤検知が含まれています。その理由としては、(1)MS/MSスペクトルにはランダムノイズが含まれており、ピークマッチングを誤解させる可能性があります。(2)異性体および断片化エネルギーの違いは、複数のスペクトルフィンガープリントを引き起こし、したがって参照ライブラリの体積を増加させる。(3) 参照ライブラリの品質はさまざまです。優れたリファレンススペクトルライブラリを構築するための適切な標準が必要です。したがって、非標的メタボロミクスのための系統的偽発見率(FDR)制御は、機能的メタボローム研究に不可欠である7、8、9、17。
経験的ベイズアプローチとターゲット・デコイ戦略はどちらも、FDR制御問題全般に取り組んだ。Kerstin Scheubertらは、フラグメンテーションツリーベースの方法から生成されたおとりデータベース上のターゲット-デコイ戦略がFDR制御9のための最良の方法であることを示した。Xusheng Wangらは、化学におけるオクテット則に基づくおとり生成の方法を設計し、FDR推定の精度を向上させた17。デコイデータベースを生成するためのスペクトルライブラリは、より良いパフォーマンスのために実証されました18。ここでは、スペクトルライブラリベースの手法を改良し、FDR推定の精度をさらに向上させることができるXY-Meta19 というソフトウェアを開発しました。既存の参照スペクトルライブラリを使用して、ターゲット-デコイスキームの下でFDR制御用のデコイライブラリを生成します。XY-Metaは、独自のスペクトルマッチングアルゴリズムとコサイン類似性アルゴリズムをサポートしています。従来の検索モードと反復検索モードが可能です。FDR評価のステップでは、ターゲット – デコイ連結モードと分離モードをサポートしています。柔軟性を高めるために、XY-Meta は外部のおとりライブラリを受け入れます。
代謝産物のピーク検出および定量は、非標的メタボローム分析の重要なステップでもある。ピーク検出は、メタボローム同定の主な方法です。一般に、代謝産物のピーク検出の精度は、質量分析のノイズ信号、代謝産物の存在量の低さ、汚染物質、代謝産物の分解産物などの複数の要因によって影響を受けました20。非標的メタボロームの実験において液体クロマトグラフィーカラムを交換したか又は液体クロマトグラフィーカラムのサンプル数が多すぎると、顕著なバッチ効果が現れることがあり、これはメタボローム定量にとって大きな課題である21、22、23。現在、XCMS 24、Workflow4Metabolomic25、iMet-Q26、metaX19などのソフトウェアは、標的化されていないメタボロームのピーク検出と定量を実行できますが、metaXのパイプラインはより完全で使いやすいことを示唆しています。ここでは、XY-Metaを用いた公開データセットmsv000084112の同定とFDR制御のプロセス、およびmetaXを用いた代謝産物のピーク検出と定量を実演する。このワークフローに必要なのは 2 つのグループのみで、各グループには少なくとも 2 つのサンプルが必要です。質量分析計のプラットフォーム、イオン化モード、充電モード、サンプルタイプに関係なく、MS/MSスペクトルデータが必要であり、サンプルベースの正規化とピークベースの正規化をサポートできます。この例に続いて、研究者は扱いやすい方法でメタボロミクスの同定と定量を行うことができます。このパイプラインを使用するには、R プログラミング機能が必要です。プログラミングの知識のない研究者を支援するために、メタボロミクス分析用のクラウド分析プラットフォームも開発しました。このクラウド分析プラットフォームについては、「補足資料 5」で説明しました。
標的とならない代謝産物のFDR制御は大きな課題でした。ここでは、FDRコントロールによる大規模な非標的メタボロミクス分析(定性的および定量的)の完全なパイプラインを実証しました。これにより、MS分析で非常に一般的な誤検知が効果的に減少します。
研究に適したリファレンススペクトルライブラリを準備することは重要なポイントです。MS/MSの識別を成功させる?…
The authors have nothing to disclose.
この研究は、国家キー研究開発プログラム(2018YFC0910200/2017YFA0505001)と広東キーR&Dプログラム(2019B020226001)によってサポートされています。
GNPS | open source | n/a | https://gnps.ucsd.edu/ProteoSAFe/static/gnps-splash.jsp |
XY-Meta | open source | n/a | https://github.com/DLI-ShenZhen/XY-Meta |
metaX | open source | n/a | https://github.com/wenbostar/metaX |
ProteoWizard | Free Download | 3.0.22116.18c918b-x86_64 | https://proteowizard.sourceforge.io/download.html |
CHI.Client | Free Download | ndp48-x86-x64-allos-enu | http://www.chi-biotech.com/technology.html?ty=ypt |