Summary

FDR制御ベースの非標的メタボロームにおける同定と定量化の統合ワークフロー

Published: September 20, 2022
doi:

Summary

XY-MetaとmetaXを統合した非標的メタボロミクスワークフローを構築しました。このプロトコルでは、XY-Metaを使用してオープンアクセススペクトルリファレンスからデコイスペクトルライブラリを生成する方法を示し、FDR制御を行い、メタボロミクススペクトルを同定した後、metaXを使用して代謝産物を定量しました。

Abstract

非標的メタボロミクス技術は、近年広く使用されている。しかし、スループットとサンプル数の急速な増加は膨大な量のスペクトルを生成し、質量分析スペクトルの品質管理に課題を課しています。誤検知を減らすには、誤検出率(FDR)の品質管理が必要です。最近、我々はXY-Metaという名前のターゲット – デコイ戦略に基づく非標的メタボローム同定のFDR制御のためのソフトウェアを開発しました。ここでは、XY-Meta と metaX を統合する完全な分析パイプラインを示しました。このプロトコルは、XY-metaを使用して既存の参照データベースからおとりデータベースを生成し、オープンアクセスデータセットで大規模なメタボローム同定のためのTarget-Decoy戦略を使用してFDR制御を実行する方法を示しています。示差分析および代謝産物注釈は、代謝産物ピーク検出および定量についてmetaXを実行した後に実施した。より多くの研究者を支援するために、バイオインフォマティクスのスキルやコンピュータ言語を必要とせずに、これらの分析のためのユーザーフレンドリーなクラウドベースの分析プラットフォームも開発しました。

Introduction

代謝産物は、生物学的プロセスにおいて重要な役割を果たしている。代謝産物は、多くの場合、エネルギー移動、ホルモン調節、神経伝達物質の調節、細胞通信、およびタンパク質の翻訳後修飾などの様々なプロセスの調節因子である1,2,3,4。非標的メタボロミクスは、多数の代謝産物5,6のグローバルビューを提供する。質量分析およびクロマトグラフィー技術の進歩に伴い、メタボロームMS/MSスペクトルのスループットは近年急速に増加しています7、891011これらの巨大なデータセットから代謝産物を同定するために、MZmine 12、MS-FINDER 13、CFM-ID 14、MetFrag15、SLAW16など、さまざまな注釈ソフトウェア11が開発されました。ただし、これらの ID には多くの場合、多くの誤検知が含まれています。その理由としては、(1)MS/MSスペクトルにはランダムノイズが含まれており、ピークマッチングを誤解させる可能性があります。(2)異性体および断片化エネルギーの違いは、複数のスペクトルフィンガープリントを引き起こし、したがって参照ライブラリの体積を増加させる。(3) 参照ライブラリの品質はさまざまです。優れたリファレンススペクトルライブラリを構築するための適切な標準が必要です。したがって、非標的メタボロミクスのための系統的偽発見率(FDR)制御は、機能的メタボローム研究不可欠である7、8917

経験的ベイズアプローチとターゲット・デコイ戦略はどちらも、FDR制御問題全般に取り組んだ。Kerstin Scheubertらは、フラグメンテーションツリーベースの方法から生成されたおとりデータベース上のターゲット-デコイ戦略がFDR制御9のための最良の方法であることを示した。Xusheng Wangらは、化学におけるオクテット則に基づくおとり生成の方法を設計し、FDR推定の精度を向上させた17。デコイデータベースを生成するためのスペクトルライブラリは、より良いパフォーマンスのために実証されました18。ここでは、スペクトルライブラリベースの手法を改良し、FDR推定の精度をさらに向上させることができるXY-Meta19 というソフトウェアを開発しました。既存の参照スペクトルライブラリを使用して、ターゲット-デコイスキームの下でFDR制御用のデコイライブラリを生成します。XY-Metaは、独自のスペクトルマッチングアルゴリズムとコサイン類似性アルゴリズムをサポートしています。従来の検索モードと反復検索モードが可能です。FDR評価のステップでは、ターゲット – デコイ連結モードと分離モードをサポートしています。柔軟性を高めるために、XY-Meta は外部のおとりライブラリを受け入れます。

代謝産物のピーク検出および定量は、非標的メタボローム分析の重要なステップでもある。ピーク検出は、メタボローム同定の主な方法です。一般に、代謝産物のピーク検出の精度は、質量分析のノイズ信号、代謝産物の存在量の低さ、汚染物質、代謝産物の分解産物などの複数の要因によって影響を受けました20。非標的メタボロームの実験において液体クロマトグラフィーカラムを交換したか又は液体クロマトグラフィーカラムのサンプル数が多すぎると、顕著なバッチ効果が現れることがあり、これはメタボローム定量にとって大きな課題である212223現在、XCMS 24、Workflow4Metabolomic25、iMet-Q26、metaX19などのソフトウェアは、標的化されていないメタボロームのピーク検出と定量を実行できますが、metaXのパイプラインはより完全で使いやすいことを示唆しています。ここでは、XY-Metaを用いた公開データセットmsv000084112の同定とFDR制御のプロセス、およびmetaXを用いた代謝産物のピーク検出と定量を実演する。このワークフローに必要なのは 2 つのグループのみで、各グループには少なくとも 2 つのサンプルが必要です。質量分析計のプラットフォーム、イオン化モード、充電モード、サンプルタイプに関係なく、MS/MSスペクトルデータが必要であり、サンプルベースの正規化とピークベースの正規化をサポートできます。この例に続いて、研究者は扱いやすい方法でメタボロミクスの同定と定量を行うことができます。このパイプラインを使用するには、R プログラミング機能が必要です。プログラミングの知識のない研究者を支援するために、メタボロミクス分析用のクラウド分析プラットフォームも開発しました。このクラウド分析プラットフォームについては、「補足資料 5」で説明しました。

Protocol

1. メタボロミクスデータセットを解析用に準備する 注:このデモでは、QCサンプルなしでメタボロミクスデータセットを使用します。ケース・グループおよび制御グループのデータが必要です。デモンストレーションのために、GNPSデータベース27のパブリックデータセットを使用します。 Web ページの https://gnps.ucsd.edu/ProteoSAFe/static/gnps…

Representative Results

msv000084112の生データは、msconvert.exeによって変換され、mgfファイルが生成されました(補足資料S6)。 XY-Meta は GNPS-NIST14-MATCHES_Decoy.mgf ファイルを /database フォルダの下に生成しました。これは、元の参照スペクトルライブラリGNPS-NIST14-MATCHES.mgfから生成されたデコイライブラリです。このおとりライブラリは再利用できます。このおとりライブラリを再利用すると…

Discussion

標的とならない代謝産物のFDR制御は大きな課題でした。ここでは、FDRコントロールによる大規模な非標的メタボロミクス分析(定性的および定量的)の完全なパイプラインを実証しました。これにより、MS分析で非常に一般的な誤検知が効果的に減少します。

研究に適したリファレンススペクトルライブラリを準備することは重要なポイントです。MS/MSの識別を成功させる?…

Disclosures

The authors have nothing to disclose.

Acknowledgements

この研究は、国家キー研究開発プログラム(2018YFC0910200/2017YFA0505001)と広東キーR&Dプログラム(2019B020226001)によってサポートされています。

Materials

GNPS open source n/a https://gnps.ucsd.edu/ProteoSAFe/static/gnps-splash.jsp
XY-Meta open source n/a https://github.com/DLI-ShenZhen/XY-Meta
metaX open source n/a https://github.com/wenbostar/metaX
ProteoWizard Free Download 3.0.22116.18c918b-x86_64 https://proteowizard.sourceforge.io/download.html
CHI.Client Free Download ndp48-x86-x64-allos-enu http://www.chi-biotech.com/technology.html?ty=ypt

References

  1. Misra, B. B., Fahrmann, J. F., Grapov, D. Review of emerging metabolomic tools and resources: 2015-2016. Electrophoresis. 38 (18), 2257-2274 (2017).
  2. Idle, J. R., Gonzalez, F. J. Metabolomics. Cell Metabolism. 6 (5), 348-351 (2007).
  3. Fiehn, O., Town, C. Metabolomics — the link between genotypes and phenotypes. Functional Genomics. , 155-171 (2002).
  4. Town, C. . Functional Genomics. , (2002).
  5. Dettmer, K., Aronov, P. A., Hammock, B. D. Mass spectrometry-based metabolomics. Mass Spectrometry Reviews. 26 (1), 51-78 (2007).
  6. Vinayavekhin, N., Saghatelian, A. Untargeted metabolomics. Current Protocols in Molecular Biology. , 1-24 (2010).
  7. Chaleckis, R., Meister, I., Zhang, P., Wheelock, C. E. Challenges, progress and promises of metabolite annotation for LC-MS-based metabolomics. Current Opinion in Biotechnology. 55, 44-50 (2019).
  8. Palmer, A., et al. FDR-controlled metabolite annotation for high-resolution imaging mass spectrometry. Nature Methods. 14 (1), 57-60 (2017).
  9. Scheubert, K., et al. Significance estimation for large scale metabolomics annotations by spectral matching. Nature Communications. 8 (1), 1494 (2017).
  10. Schrimpe-Rutledge, A. C., Codreanu, S. G., Sherrod, S. D., McLean, J. A. Untargeted metabolomics strategies-challenges and emerging directions. Journal of the American Society for Mass Spectrometry. 27 (12), 1897-1905 (2016).
  11. Blaženović, I., Kind, T., Ji, J., Fiehn, O. Software tools and approaches for compound identification of LC-MS/MS data in metabolomics. Metabolites. 8 (2), (2018).
  12. Katajamaa, M., Miettinen, J., Oresic, M. MZmine: toolbox for processing and visualization of mass spectrometry based molecular profile data. Bioinformatics. 22 (5), 634-636 (2006).
  13. Tsugawa, H., et al. Hydrogen rearrangement rules: computational MS/MS fragmentation and structure elucidation using MS-FINDER software. Analytical chemistry. 88 (16), 7946-7958 (2016).
  14. Wang, F., et al. CFM-ID 4.0: More accurate ESI-MS/MS spectral prediction and compound identification. Analytical Chemistry. 93 (34), 11692-11700 (2021).
  15. Ruttkies, C., Schymanski, E. L., Wolf, S., Hollender, J., Neumann, S. MetFrag relaunched: incorporating strategies beyond in silico fragmentation. Journal of Cheminformatics. 8, 3 (2016).
  16. Delabriere, A., Warmer, P., Brennsteiner, V., Zamboni, N. SLAW: A scalable and self-optimizing processing workflow for untargeted LC-MS. Analytical chemistry. 93 (45), 15024-15032 (2021).
  17. Wang, X., et al. Target-decoy-based false discovery rate estimation for large-scale metabolite identification. Journal of Proteome Research. 17 (7), 2328-2334 (2018).
  18. Li, D., et al. XY-Meta: a high-efficiency search engine for large-scale metabolome annotation with accurate FDR estimation. Analytical Chemistry. 92 (8), 5701-5707 (2020).
  19. Wen, B., Mei, Z., Zeng, C., Liu, S. metaX: a flexible and comprehensive software for processing metabolomics data. BMC Bioinformatics. 18 (1), 183 (2017).
  20. Aberg, K. M., Torgrip, R. J. O., Kolmert, J., Schuppe-Koistinen, I., Lindberg, J. Feature detection and alignment of hyphenated chromatographic-mass spectrometric data. Extraction of pure ion chromatograms using Kalman tracking. Journal of Chromatography. A. 1192 (1), 139-146 (2008).
  21. Liu, Q., et al. Addressing the batch effect issue for LC/MS metabolomics data in data preprocessing. Scientific Reports. 10 (1), 13856 (2020).
  22. Han, W., Li, L. Evaluating and minimizing batch effects in metabolomics. Mass Spectrometry Reviews. 41 (3), 421-442 (2022).
  23. Fei, F., Bowdish, D. M. E., McCarry, B. E. Comprehensive and simultaneous coverage of lipid and polar metabolites for endogenous cellular metabolomics using HILIC-TOF-MS. Analytical and Bioanalytical Chemistry. 406 (15), 3723-3733 (2014).
  24. Smith, C. A., Want, E. J., O’Maille, G., Abagyan, R., Siuzdak, G. XCMS: processing mass spectrometry data for metabolite profiling using nonlinear peak alignment, matching, and identification. Analytical Chemistry. 78 (3), 779-787 (2006).
  25. Giacomoni, F., et al. Workflow4Metabolomics: a collaborative research infrastructure for computational metabolomics. Bioinformatics. 31 (9), 1493-1495 (2015).
  26. Chang, H. -. Y., et al. iMet-Q: A user-friendly tool for label-free metabolomics quantitation using dynamic peak-width determination. PloS One. 11 (1), 0146112 (2016).
  27. Wang, M., et al. Sharing and community curation of mass spectrometry data with Global Natural Products Social Molecular Networking. Nature Biotechnology. 34 (8), 828-837 (2016).
  28. Schmid, R., et al. Ion identity molecular networking for mass spectrometry-based metabolomics in the GNPS environment. Nature Communications. 12 (1), 3832 (2021).
  29. Kessner, D., Chambers, M., Burke, R., Agus, D., Mallick, P. ProteoWizard: open source software for rapid proteomics tools development. Bioinformatics. 24 (21), 2534-2536 (2008).
  30. Johnson, S. R., Lange, B. M. Open-access metabolomics databases for natural product research: present capabilities and future potential. Frontiers in Bioengineering and Biotechnology. 3, 22 (2015).
  31. Horai, H., et al. MassBank: a public repository for sharing mass spectral data for life sciences. Journal of Mass Spectrometry: JMS. 45 (7), 703-714 (2010).
  32. Rawlinson, C., et al. Hierarchical clustering of MS/MS spectra from the firefly metabolome identifies new lucibufagin compounds. Scientific Reports. 10 (1), 6043 (2020).

Play Video

Cite This Article
Li, D., Liang, J., Zhang, Y., Zhang, G. An Integrated Workflow of Identification and Quantification on FDR Control-Based Untargeted Metabolome. J. Vis. Exp. (187), e63625, doi:10.3791/63625 (2022).

View Video