Мы построили нецелевой метаболомический рабочий процесс, который объединил XY-Meta и metaX вместе. В этом протоколе мы показали, как использовать XY-Meta для генерации спектральной библиотеки приманки из ссылки на спектры открытого доступа, а затем выполнили управление FDR и использовали metaX для количественного определения метаболитов после идентификации спектров метаболомики.
Методы нецелевой метаболомики широко используются в последние годы. Однако быстро растущая пропускная способность и количество образцов создают огромное количество спектров, создавая проблемы для контроля качества спектров масс-спектрометрии. Чтобы уменьшить количество ложных срабатываний, необходим контроль качества частоты ложных обнаружений (FDR). Недавно мы разработали программное обеспечение для контроля FDR нецелевой идентификации метаболомов, которое основано на стратегии Target-Decoy под названием XY-Meta. Здесь мы продемонстрировали полный конвейер анализа, который объединяет XY-Meta и metaX вместе. Этот протокол показывает, как использовать XY-meta для создания базы данных приманки из существующей справочной базы данных и выполнения управления FDR с использованием стратегии Target-Decoy для крупномасштабной идентификации метаболомов в наборе данных с открытым доступом. Дифференциальный анализ и аннотацию метаболитов проводили после запуска metaX для обнаружения и количественного определения пиков метаболитов. Чтобы помочь большему количеству исследователей, мы также разработали удобную облачную аналитическую платформу для этих анализов, без необходимости в навыках биоинформатики или каких-либо компьютерных языках.
Метаболиты играют важную роль в биологических процессах. Метаболиты часто являются регуляторами различных процессов, таких как передача энергии, гормональные регуляции, регуляция нейротрансмиттеров, клеточная связь и посттрансляционные модификации белка и т. Д. 1,2,3,4. Нецелевая метаболомика дает глобальное представление о многочисленных метаболитах 5,6. С достижениями в области технологий масс-спектрометрии и хроматографии пропускная способность спектров метаболома MS / MS быстро увеличивается в последниегоды 7,8,9,10,11. Для идентификации метаболитов из этих огромных наборов данных было разработано различное программное обеспечение для аннотаций11, такое как MZmine12, MS-FINDER13, CFM-ID14, MetFrag15 и SLAW16. Однако эти идентификации часто содержат много ложных срабатываний. Причины включают в себя: (1) Спектры MS / MS содержат случайный шум, который может ввести в заблуждение пиковое соответствие. (2) Изомеры и различия в энергиях фрагментации вызывают множественные спектры отпечатков пальцев и, таким образом, увеличивают объем справочной библиотеки. (3) Качество справочных библиотек варьируется. Необходим надлежащий стандарт для создания хорошей справочной спектральной библиотеки. Таким образом, систематический контроль уровня ложных обнаружений (FDR) для нецелевой метаболомики имеет важное значение для исследования функционального метаболома 7,8,9,17.
Как эмпирический подход Байеса, так и стратегия Target-Decoy решали проблему контроля Рузвельта в целом. Kerstin Scheubert et al. показали, что стратегия Target-Decoy на базе данных приманок, сгенерированная методом фрагментации на основе дерева, является лучшим методом для контроля FDR9. Xusheng Wang et al. разработали метод генерации приманки, основанный на правиле октета в химии, и улучшили точность оценки Рузвельта17. Спектральная библиотека для генерации базы данных приманок была продемонстрирована для повышения производительности18. Здесь мы улучшили метод на основе спектральной библиотеки и разработали программное обеспечение под названием XY-Meta19 , которое может еще больше повысить точность оценки FDR. Он использует существующую справочную спектральную библиотеку для создания библиотеки приманок для управления FDR по схеме Target-Decoy. XY-Meta поддерживает собственные алгоритмы сопоставления спектров и косинуса. Он позволяет использовать обычные режимы поиска и итеративного поиска. На этапе оценки FDR он поддерживает сцепленный режим Target-Decoy и раздельный режим. Для большей гибкости XY-Meta принимает внешние библиотеки приманок.
Обнаружение пиков и количественная оценка метаболитов также является важным этапом нецелевого анализа метаболомов. Обнаружение пика является основным методом идентификации метаболомов. В целом, на точность пикового обнаружения метаболитов влияли многочисленные факторы, такие как шумовые сигналы масс-спектрометрии, низкое содержание метаболитов, загрязняющих веществ и продукты деградации метаболитов20. Когда количество образцов слишком велико или колонка жидкостной хроматографии была заменена в экспериментах с нецелевым метаболомом, могут появиться замечательные эффекты партии, что является серьезной проблемой для количественного определения метаболома 21,22,23. В настоящее время такие программы, как XCMS24, Workflow4Metabolomic25, iMet-Q26 и metaX19, могут выполнять обнаружение пиков и количественное определение нецелевого метаболома, но мы предполагаем, что конвейер metaX более полный и простой в использовании. Здесь мы демонстрируем процесс идентификации и контроля FDR для общедоступного набора данных msv000084112 с использованием XY-Meta, а также обнаружение пиков и количественную оценку метаболитов с помощью metaX. Для этого рабочего процесса требуется только две группы, и каждой группе требуется не менее двух образцов. Данные спектров MS/MS необходимы независимо от платформы масс-спектрометра, режима ионизации, режима заряда и типа образца и могут поддерживать нормализацию на основе образцов и нормализацию на основе пиков. Следуя этому примеру, исследователи могут выполнить идентификацию и количественную оценку метаболомики простым в обращении способом. Для использования этого конвейера требуется возможность программирования R. Чтобы помочь исследователю без каких-либо знаний в области программирования, мы также разработали платформу облачного анализа для анализа метаболомики. Мы продемонстрировали эту платформу облачного анализа в Дополнительном материале 5.
Контроль FDR над нецелевыми метаболитами был большой проблемой. Здесь мы продемонстрировали полный конвейер крупномасштабного нецелевого метаболомического анализа (качественного и количественного) с контролем FDR. Это эффективно снижает ложные срабатывания, которые очень распростран?…
The authors have nothing to disclose.
Эта работа поддерживается Национальной программой ключевых исследований и разработок (2018YFC0910200/2017YFA0505001) и Программой исследований и разработок Guangdong Key (2019B020226001).
GNPS | open source | n/a | https://gnps.ucsd.edu/ProteoSAFe/static/gnps-splash.jsp |
XY-Meta | open source | n/a | https://github.com/DLI-ShenZhen/XY-Meta |
metaX | open source | n/a | https://github.com/wenbostar/metaX |
ProteoWizard | Free Download | 3.0.22116.18c918b-x86_64 | https://proteowizard.sourceforge.io/download.html |
CHI.Client | Free Download | ndp48-x86-x64-allos-enu | http://www.chi-biotech.com/technology.html?ty=ypt |