Summary

Интегрированный рабочий процесс идентификации и количественной оценки нецелевого метаболома на основе контроля FDR

Published: September 20, 2022
doi:

Summary

Мы построили нецелевой метаболомический рабочий процесс, который объединил XY-Meta и metaX вместе. В этом протоколе мы показали, как использовать XY-Meta для генерации спектральной библиотеки приманки из ссылки на спектры открытого доступа, а затем выполнили управление FDR и использовали metaX для количественного определения метаболитов после идентификации спектров метаболомики.

Abstract

Методы нецелевой метаболомики широко используются в последние годы. Однако быстро растущая пропускная способность и количество образцов создают огромное количество спектров, создавая проблемы для контроля качества спектров масс-спектрометрии. Чтобы уменьшить количество ложных срабатываний, необходим контроль качества частоты ложных обнаружений (FDR). Недавно мы разработали программное обеспечение для контроля FDR нецелевой идентификации метаболомов, которое основано на стратегии Target-Decoy под названием XY-Meta. Здесь мы продемонстрировали полный конвейер анализа, который объединяет XY-Meta и metaX вместе. Этот протокол показывает, как использовать XY-meta для создания базы данных приманки из существующей справочной базы данных и выполнения управления FDR с использованием стратегии Target-Decoy для крупномасштабной идентификации метаболомов в наборе данных с открытым доступом. Дифференциальный анализ и аннотацию метаболитов проводили после запуска metaX для обнаружения и количественного определения пиков метаболитов. Чтобы помочь большему количеству исследователей, мы также разработали удобную облачную аналитическую платформу для этих анализов, без необходимости в навыках биоинформатики или каких-либо компьютерных языках.

Introduction

Метаболиты играют важную роль в биологических процессах. Метаболиты часто являются регуляторами различных процессов, таких как передача энергии, гормональные регуляции, регуляция нейротрансмиттеров, клеточная связь и посттрансляционные модификации белка и т. Д. 1,2,3,4. Нецелевая метаболомика дает глобальное представление о многочисленных метаболитах 5,6. С достижениями в области технологий масс-спектрометрии и хроматографии пропускная способность спектров метаболома MS / MS быстро увеличивается в последниегоды 7,8,9,10,11. Для идентификации метаболитов из этих огромных наборов данных было разработано различное программное обеспечение для аннотаций11, такое как MZmine12, MS-FINDER13, CFM-ID14, MetFrag15 и SLAW16. Однако эти идентификации часто содержат много ложных срабатываний. Причины включают в себя: (1) Спектры MS / MS содержат случайный шум, который может ввести в заблуждение пиковое соответствие. (2) Изомеры и различия в энергиях фрагментации вызывают множественные спектры отпечатков пальцев и, таким образом, увеличивают объем справочной библиотеки. (3) Качество справочных библиотек варьируется. Необходим надлежащий стандарт для создания хорошей справочной спектральной библиотеки. Таким образом, систематический контроль уровня ложных обнаружений (FDR) для нецелевой метаболомики имеет важное значение для исследования функционального метаболома 7,8,9,17.

Как эмпирический подход Байеса, так и стратегия Target-Decoy решали проблему контроля Рузвельта в целом. Kerstin Scheubert et al. показали, что стратегия Target-Decoy на базе данных приманок, сгенерированная методом фрагментации на основе дерева, является лучшим методом для контроля FDR9. Xusheng Wang et al. разработали метод генерации приманки, основанный на правиле октета в химии, и улучшили точность оценки Рузвельта17. Спектральная библиотека для генерации базы данных приманок была продемонстрирована для повышения производительности18. Здесь мы улучшили метод на основе спектральной библиотеки и разработали программное обеспечение под названием XY-Meta19 , которое может еще больше повысить точность оценки FDR. Он использует существующую справочную спектральную библиотеку для создания библиотеки приманок для управления FDR по схеме Target-Decoy. XY-Meta поддерживает собственные алгоритмы сопоставления спектров и косинуса. Он позволяет использовать обычные режимы поиска и итеративного поиска. На этапе оценки FDR он поддерживает сцепленный режим Target-Decoy и раздельный режим. Для большей гибкости XY-Meta принимает внешние библиотеки приманок.

Обнаружение пиков и количественная оценка метаболитов также является важным этапом нецелевого анализа метаболомов. Обнаружение пика является основным методом идентификации метаболомов. В целом, на точность пикового обнаружения метаболитов влияли многочисленные факторы, такие как шумовые сигналы масс-спектрометрии, низкое содержание метаболитов, загрязняющих веществ и продукты деградации метаболитов20. Когда количество образцов слишком велико или колонка жидкостной хроматографии была заменена в экспериментах с нецелевым метаболомом, могут появиться замечательные эффекты партии, что является серьезной проблемой для количественного определения метаболома 21,22,23. В настоящее время такие программы, как XCMS24, Workflow4Metabolomic25, iMet-Q26 и metaX19, могут выполнять обнаружение пиков и количественное определение нецелевого метаболома, но мы предполагаем, что конвейер metaX более полный и простой в использовании. Здесь мы демонстрируем процесс идентификации и контроля FDR для общедоступного набора данных msv000084112 с использованием XY-Meta, а также обнаружение пиков и количественную оценку метаболитов с помощью metaX. Для этого рабочего процесса требуется только две группы, и каждой группе требуется не менее двух образцов. Данные спектров MS/MS необходимы независимо от платформы масс-спектрометра, режима ионизации, режима заряда и типа образца и могут поддерживать нормализацию на основе образцов и нормализацию на основе пиков. Следуя этому примеру, исследователи могут выполнить идентификацию и количественную оценку метаболомики простым в обращении способом. Для использования этого конвейера требуется возможность программирования R. Чтобы помочь исследователю без каких-либо знаний в области программирования, мы также разработали платформу облачного анализа для анализа метаболомики. Мы продемонстрировали эту платформу облачного анализа в Дополнительном материале 5.

Protocol

1. Подготовка наборов данных метаболомики для анализа ПРИМЕЧАНИЕ: В этой демонстрации мы используем наборы данных метаболомики без образца QC. Необходимы данные для групп кейсов и контрольных групп. Для демонстрации мы используем общедоступный набор данных в баз?…

Representative Results

Необработанные данные msv000084112 были преобразованы msconvert.exe и сгенерированы mgf файлы (Дополнительный материал S6). XY-Meta сгенерировал файл GNPS-NIST14-MATCHES_Decoy.mgf в папке /database. Это библиотека приманок, сгенерированная из оригинальной справочной спектральной библиотеки GNPS-NIS…

Discussion

Контроль FDR над нецелевыми метаболитами был большой проблемой. Здесь мы продемонстрировали полный конвейер крупномасштабного нецелевого метаболомического анализа (качественного и количественного) с контролем FDR. Это эффективно снижает ложные срабатывания, которые очень распростран?…

Declarações

The authors have nothing to disclose.

Acknowledgements

Эта работа поддерживается Национальной программой ключевых исследований и разработок (2018YFC0910200/2017YFA0505001) и Программой исследований и разработок Guangdong Key (2019B020226001).

Materials

GNPS open source n/a https://gnps.ucsd.edu/ProteoSAFe/static/gnps-splash.jsp
XY-Meta open source n/a https://github.com/DLI-ShenZhen/XY-Meta
metaX open source n/a https://github.com/wenbostar/metaX
ProteoWizard Free Download 3.0.22116.18c918b-x86_64 https://proteowizard.sourceforge.io/download.html
CHI.Client Free Download ndp48-x86-x64-allos-enu http://www.chi-biotech.com/technology.html?ty=ypt

Referências

  1. Misra, B. B., Fahrmann, J. F., Grapov, D. Review of emerging metabolomic tools and resources: 2015-2016. Electrophoresis. 38 (18), 2257-2274 (2017).
  2. Idle, J. R., Gonzalez, F. J. Metabolomics. Cell Metabolism. 6 (5), 348-351 (2007).
  3. Fiehn, O., Town, C. Metabolomics — the link between genotypes and phenotypes. Functional Genomics. , 155-171 (2002).
  4. Town, C. . Functional Genomics. , (2002).
  5. Dettmer, K., Aronov, P. A., Hammock, B. D. Mass spectrometry-based metabolomics. Mass Spectrometry Reviews. 26 (1), 51-78 (2007).
  6. Vinayavekhin, N., Saghatelian, A. Untargeted metabolomics. Current Protocols in Molecular Biology. , 1-24 (2010).
  7. Chaleckis, R., Meister, I., Zhang, P., Wheelock, C. E. Challenges, progress and promises of metabolite annotation for LC-MS-based metabolomics. Current Opinion in Biotechnology. 55, 44-50 (2019).
  8. Palmer, A., et al. FDR-controlled metabolite annotation for high-resolution imaging mass spectrometry. Nature Methods. 14 (1), 57-60 (2017).
  9. Scheubert, K., et al. Significance estimation for large scale metabolomics annotations by spectral matching. Nature Communications. 8 (1), 1494 (2017).
  10. Schrimpe-Rutledge, A. C., Codreanu, S. G., Sherrod, S. D., McLean, J. A. Untargeted metabolomics strategies-challenges and emerging directions. Journal of the American Society for Mass Spectrometry. 27 (12), 1897-1905 (2016).
  11. Blaženović, I., Kind, T., Ji, J., Fiehn, O. Software tools and approaches for compound identification of LC-MS/MS data in metabolomics. Metabolites. 8 (2), (2018).
  12. Katajamaa, M., Miettinen, J., Oresic, M. MZmine: toolbox for processing and visualization of mass spectrometry based molecular profile data. Bioinformatics. 22 (5), 634-636 (2006).
  13. Tsugawa, H., et al. Hydrogen rearrangement rules: computational MS/MS fragmentation and structure elucidation using MS-FINDER software. Analytical chemistry. 88 (16), 7946-7958 (2016).
  14. Wang, F., et al. CFM-ID 4.0: More accurate ESI-MS/MS spectral prediction and compound identification. Analytical Chemistry. 93 (34), 11692-11700 (2021).
  15. Ruttkies, C., Schymanski, E. L., Wolf, S., Hollender, J., Neumann, S. MetFrag relaunched: incorporating strategies beyond in silico fragmentation. Journal of Cheminformatics. 8, 3 (2016).
  16. Delabriere, A., Warmer, P., Brennsteiner, V., Zamboni, N. SLAW: A scalable and self-optimizing processing workflow for untargeted LC-MS. Analytical chemistry. 93 (45), 15024-15032 (2021).
  17. Wang, X., et al. Target-decoy-based false discovery rate estimation for large-scale metabolite identification. Journal of Proteome Research. 17 (7), 2328-2334 (2018).
  18. Li, D., et al. XY-Meta: a high-efficiency search engine for large-scale metabolome annotation with accurate FDR estimation. Analytical Chemistry. 92 (8), 5701-5707 (2020).
  19. Wen, B., Mei, Z., Zeng, C., Liu, S. metaX: a flexible and comprehensive software for processing metabolomics data. BMC Bioinformatics. 18 (1), 183 (2017).
  20. Aberg, K. M., Torgrip, R. J. O., Kolmert, J., Schuppe-Koistinen, I., Lindberg, J. Feature detection and alignment of hyphenated chromatographic-mass spectrometric data. Extraction of pure ion chromatograms using Kalman tracking. Journal of Chromatography. A. 1192 (1), 139-146 (2008).
  21. Liu, Q., et al. Addressing the batch effect issue for LC/MS metabolomics data in data preprocessing. Scientific Reports. 10 (1), 13856 (2020).
  22. Han, W., Li, L. Evaluating and minimizing batch effects in metabolomics. Mass Spectrometry Reviews. 41 (3), 421-442 (2022).
  23. Fei, F., Bowdish, D. M. E., McCarry, B. E. Comprehensive and simultaneous coverage of lipid and polar metabolites for endogenous cellular metabolomics using HILIC-TOF-MS. Analytical and Bioanalytical Chemistry. 406 (15), 3723-3733 (2014).
  24. Smith, C. A., Want, E. J., O’Maille, G., Abagyan, R., Siuzdak, G. XCMS: processing mass spectrometry data for metabolite profiling using nonlinear peak alignment, matching, and identification. Analytical Chemistry. 78 (3), 779-787 (2006).
  25. Giacomoni, F., et al. Workflow4Metabolomics: a collaborative research infrastructure for computational metabolomics. Bioinformatics. 31 (9), 1493-1495 (2015).
  26. Chang, H. -. Y., et al. iMet-Q: A user-friendly tool for label-free metabolomics quantitation using dynamic peak-width determination. PloS One. 11 (1), 0146112 (2016).
  27. Wang, M., et al. Sharing and community curation of mass spectrometry data with Global Natural Products Social Molecular Networking. Nature Biotechnology. 34 (8), 828-837 (2016).
  28. Schmid, R., et al. Ion identity molecular networking for mass spectrometry-based metabolomics in the GNPS environment. Nature Communications. 12 (1), 3832 (2021).
  29. Kessner, D., Chambers, M., Burke, R., Agus, D., Mallick, P. ProteoWizard: open source software for rapid proteomics tools development. Bioinformatics. 24 (21), 2534-2536 (2008).
  30. Johnson, S. R., Lange, B. M. Open-access metabolomics databases for natural product research: present capabilities and future potential. Frontiers in Bioengineering and Biotechnology. 3, 22 (2015).
  31. Horai, H., et al. MassBank: a public repository for sharing mass spectral data for life sciences. Journal of Mass Spectrometry: JMS. 45 (7), 703-714 (2010).
  32. Rawlinson, C., et al. Hierarchical clustering of MS/MS spectra from the firefly metabolome identifies new lucibufagin compounds. Scientific Reports. 10 (1), 6043 (2020).

Play Video

Citar este artigo
Li, D., Liang, J., Zhang, Y., Zhang, G. An Integrated Workflow of Identification and Quantification on FDR Control-Based Untargeted Metabolome. J. Vis. Exp. (187), e63625, doi:10.3791/63625 (2022).

View Video