Summary

سير عمل متكامل لتحديد الأيض غير المستهدف القائم على التحكم في FDR وقياسه كميا

Published: September 20, 2022
doi:

Summary

لقد أنشأنا سير عمل استقلابي غير مستهدف قام بدمج XY-Meta و metaX معا. في هذا البروتوكول ، عرضنا كيفية استخدام XY-Meta لإنشاء مكتبة طيفية مخادعة من مرجع أطياف الوصول المفتوح ، ثم أجرينا التحكم في FDR واستخدمنا metaX لقياس المستقلبات بعد تحديد أطياف الأيض.

Abstract

يتم استخدام تقنيات الأيض غير المستهدفة على نطاق واسع في السنوات الأخيرة. ومع ذلك، فإن الزيادة السريعة في الإنتاجية وعدد العينات تخلق كمية هائلة من الأطياف، مما يضع تحديات أمام مراقبة جودة أطياف قياس الطيف الكتلي. للحد من الإيجابيات الكاذبة ، من الضروري مراقبة جودة معدل الاكتشاف الخاطئ (FDR). في الآونة الأخيرة ، قمنا بتطوير برنامج للتحكم في FDR لتحديد الأيض غير المستهدف الذي يعتمد على استراتيجية Target-Decoy المسماة XY-Meta. هنا ، أظهرنا خط أنابيب تحليل كامل يدمج XY-Meta و metaX معا. يوضح هذا البروتوكول كيفية استخدام XY-meta لإنشاء قاعدة بيانات مخادعة من قاعدة بيانات مرجعية موجودة وتنفيذ التحكم في FDR باستخدام استراتيجية Target-Decoy لتحديد الأيض على نطاق واسع على مجموعة بيانات مفتوحة الوصول. تم إجراء التحليل التفاضلي والتعليق التوضيحي للمستقلبات بعد تشغيل metaX للكشف عن قمم المستقلبات والكمية. من أجل مساعدة المزيد من الباحثين ، قمنا أيضا بتطوير منصة تحليل سحابية سهلة الاستخدام لهذه التحليلات ، دون الحاجة إلى مهارات المعلوماتية الحيوية أو أي لغات كمبيوتر.

Introduction

تلعب المستقلبات أدوارا مهمة في العمليات البيولوجية. غالبا ما تكون المستقلبات منظما لعمليات مختلفة مثل نقل الطاقة ، ولوائح الهرمونات ، وتنظيم الناقلات العصبية ، والاتصالات الخلوية ، وتعديلات البروتين بعد الترجمة ، وما إلى ذلك1،2،3،4. توفر الأيض غير المستهدفة رؤية عالمية للعديد من المستقلبات 5,6. مع التقدم في تقنيات قياس الطيف الكتلي والكروماتوغرافيا ، فإن إنتاجية أطياف MS / MS الأيضية تتزايد بسرعة في السنوات الأخيرة7،8،9،10،11. لتحديد المستقلبات من مجموعات البيانات الضخمة هذه ، تم تطوير العديد من برامج التعليقات التوضيحية 11 ، مثل MZmine12 و MS-FINDER 13 و CFM-ID14 و MetFrag 15 و SLAW 16. ومع ذلك ، غالبا ما تحتوي هذه الهويات على العديد من الإيجابيات الخاطئة. وتشمل الأسباب: (1) تحتوي أطياف MS / MS على ضوضاء عشوائية ، مما قد يضلل مطابقة الذروة. (2) تتسبب الأيزومرات والاختلافات في طاقات التجزئة في تعدد بصمات الأطياف وبالتالي زيادة حجم المكتبة المرجعية. (3) تختلف جودة المكتبات المرجعية. هناك حاجة إلى معيار مناسب لبناء مكتبة طيفية مرجعية جيدة. لذلك ، فإن التحكم المنهجي في معدل الاكتشاف الخاطئ (FDR) للاستقلاب غير المستهدف ضروري لأبحاث الأيض الوظيفية7،8،9،17.

وقد عالج كل من نهج بايز التجريبي واستراتيجية الهدف – شرك مشكلة مراقبة FDR بشكل عام. أظهر كيرستين شوبرت وآخرون أن استراتيجية Target-Decoy على قاعدة بيانات شرك تم إنشاؤها من الطريقة القائمة على شجرة التجزئة هي أفضل طريقة لتحكم FDR9. صمم Xusheng Wang et al. طريقة لتوليد الخداع استنادا إلى قاعدة الثمانية في الكيمياء وحسن دقة تقدير FDR17. تم عرض المكتبة الطيفية لتوليد قاعدة بيانات شرك لتحسين الأداء18. هنا ، قمنا بتحسين الطريقة القائمة على المكتبة الطيفية وطورنا برنامجا يسمى XY-Meta19 يمكنه تحسين دقة تقدير FDR. وهو يستخدم المكتبة الطيفية المرجعية القائمة لإنشاء مكتبة شرك لسيطرة FDR في إطار مخطط Target-Decoy. تدعم XY-Meta خوارزميات مطابقة الأطياف وتشابه جيب التمام الخاصة بها. يسمح بالبحث التقليدي وأوضاع البحث المتكررة. في خطوة تقييم FDR ، فإنه يدعم الوضع المتسلسل Target-Decoy والوضع المنفصل. للحصول على مرونة أفضل، يقبل XY-Meta مكتبات الخداع الخارجية.

يعد الكشف عن الذروة وتحديد كمية المستقلبات أيضا خطوة مهمة في تحليل الأيض غير المستهدف. الكشف عن الذروة هو الطريقة الرئيسية لتحديد الأيض. بشكل عام ، تأثرت دقة الكشف عن ذروة المستقلبات بعوامل متعددة ، مثل إشارات الضوضاء لقياس الطيف الكتلي ، وانخفاض وفرة الأيضات ، والملوثات ، ومنتجات تحلل المستقلبات20. عندما يكون عدد العينات كبيرا جدا أو تم استبدال عمود الكروماتوغرافيا السائل في تجارب الأيض غير المستهدف ، قد تظهر تأثيرات دفعية ملحوظة ، وهو ما يمثل تحديا كبيرا لكمية الأيض 21،22،23. في الوقت الحالي ، يمكن لبرامج مثل XCMS 24 و Workflow4Metabolomic25 و iMet-Q26 و metaX19 إجراء الكشف عن الذروة وتحديد كمية الأيض غير المستهدف ، لكننا نقترح أن يكون خط أنابيب metaX أكثر اكتمالا وأسهل في الاستخدام. هنا ، نوضح عملية تحديد الهوية والتحكم في FDR لمجموعة بيانات متاحة للجمهور msv000084112 باستخدام XY-Meta ، واكتشاف الذروة وتحديد كمية المستقلبات باستخدام metaX. يتطلب سير العمل هذا مجموعتين فقط، وتحتاج كل مجموعة إلى عينتين على الأقل. هناك حاجة إلى بيانات أطياف MS / MS ، بغض النظر عن منصة مقياس الطيف الكتلي ، ووضع التأين ، ووضع الشحن ، ونوع العينة ، ويمكن أن تدعم التطبيع القائم على العينة والتطبيع القائم على الذروة. باتباع هذا المثال ، يمكن للباحثين إجراء تحديد الأيض والقياس الكمي بطريقة سهلة التعامل. يتطلب استخدام خط الأنابيب هذا القدرة على برمجة R. لمساعدة الباحث دون أي معرفة بالبرمجة ، قمنا أيضا بتطوير منصة تحليل سحابية لتحليل الأيض. لقد أظهرنا منصة التحليل السحابي هذه في المادة التكميلية 5.

Protocol

1. إعداد مجموعات بيانات الأيض للتحليل ملاحظة: في هذا العرض التوضيحي ، نستخدم مجموعات بيانات الأيض بدون عينة مراقبة الجودة. هناك حاجة إلى بيانات لمجموعات الحالات والتحكم. للعرض التوضيحي ، نستخدم مجموعة بيانات عامة في قاعدة بيانات GNPS27. انتقل إلى صف?…

Representative Results

تم تحويل البيانات الخام ل msv000084112 بواسطة msconvert.exe وإنشاء ملفات mgf (المواد التكميلية S6). XY-Meta إنشاء ملف GNPS-NIST14-MATCHES_Decoy.mgf ضمن المجلد /database. هذه هي مكتبة الخداع التي تم إنشاؤها من المكتبة الطيفية المرجعية الأصلية GNPS-NIST14-MATCHES.mgf. يمكن إعادة استخدام هذه المكتبة المخادعة. عند إ…

Discussion

لقد كانت مراقبة FDR للمستقلبات غير المستهدفة تحديا كبيرا. هنا ، أظهرنا خط أنابيب كامل لتحليل الأيض غير المستهدف على نطاق واسع (النوعي والكمي) مع التحكم في FDR. هذا يقلل بشكل فعال من الإيجابيات الكاذبة ، والتي هي شائعة جدا في تحليل مرض التصلب العصبي المتعدد.

يعد إعداد مكتبة طيفية…

Declarações

The authors have nothing to disclose.

Acknowledgements

يتم دعم هذا العمل من قبل البرنامج الوطني الرئيسي للبحث والتطوير (2018YFC0910200/2017YFA0505001) وبرنامج قوانغدونغ الرئيسي للبحث والتطوير (2019B020226001).

Materials

GNPS open source n/a https://gnps.ucsd.edu/ProteoSAFe/static/gnps-splash.jsp
XY-Meta open source n/a https://github.com/DLI-ShenZhen/XY-Meta
metaX open source n/a https://github.com/wenbostar/metaX
ProteoWizard Free Download 3.0.22116.18c918b-x86_64 https://proteowizard.sourceforge.io/download.html
CHI.Client Free Download ndp48-x86-x64-allos-enu http://www.chi-biotech.com/technology.html?ty=ypt

Referências

  1. Misra, B. B., Fahrmann, J. F., Grapov, D. Review of emerging metabolomic tools and resources: 2015-2016. Electrophoresis. 38 (18), 2257-2274 (2017).
  2. Idle, J. R., Gonzalez, F. J. Metabolomics. Cell Metabolism. 6 (5), 348-351 (2007).
  3. Fiehn, O., Town, C. Metabolomics — the link between genotypes and phenotypes. Functional Genomics. , 155-171 (2002).
  4. Town, C. . Functional Genomics. , (2002).
  5. Dettmer, K., Aronov, P. A., Hammock, B. D. Mass spectrometry-based metabolomics. Mass Spectrometry Reviews. 26 (1), 51-78 (2007).
  6. Vinayavekhin, N., Saghatelian, A. Untargeted metabolomics. Current Protocols in Molecular Biology. , 1-24 (2010).
  7. Chaleckis, R., Meister, I., Zhang, P., Wheelock, C. E. Challenges, progress and promises of metabolite annotation for LC-MS-based metabolomics. Current Opinion in Biotechnology. 55, 44-50 (2019).
  8. Palmer, A., et al. FDR-controlled metabolite annotation for high-resolution imaging mass spectrometry. Nature Methods. 14 (1), 57-60 (2017).
  9. Scheubert, K., et al. Significance estimation for large scale metabolomics annotations by spectral matching. Nature Communications. 8 (1), 1494 (2017).
  10. Schrimpe-Rutledge, A. C., Codreanu, S. G., Sherrod, S. D., McLean, J. A. Untargeted metabolomics strategies-challenges and emerging directions. Journal of the American Society for Mass Spectrometry. 27 (12), 1897-1905 (2016).
  11. Blaženović, I., Kind, T., Ji, J., Fiehn, O. Software tools and approaches for compound identification of LC-MS/MS data in metabolomics. Metabolites. 8 (2), (2018).
  12. Katajamaa, M., Miettinen, J., Oresic, M. MZmine: toolbox for processing and visualization of mass spectrometry based molecular profile data. Bioinformatics. 22 (5), 634-636 (2006).
  13. Tsugawa, H., et al. Hydrogen rearrangement rules: computational MS/MS fragmentation and structure elucidation using MS-FINDER software. Analytical chemistry. 88 (16), 7946-7958 (2016).
  14. Wang, F., et al. CFM-ID 4.0: More accurate ESI-MS/MS spectral prediction and compound identification. Analytical Chemistry. 93 (34), 11692-11700 (2021).
  15. Ruttkies, C., Schymanski, E. L., Wolf, S., Hollender, J., Neumann, S. MetFrag relaunched: incorporating strategies beyond in silico fragmentation. Journal of Cheminformatics. 8, 3 (2016).
  16. Delabriere, A., Warmer, P., Brennsteiner, V., Zamboni, N. SLAW: A scalable and self-optimizing processing workflow for untargeted LC-MS. Analytical chemistry. 93 (45), 15024-15032 (2021).
  17. Wang, X., et al. Target-decoy-based false discovery rate estimation for large-scale metabolite identification. Journal of Proteome Research. 17 (7), 2328-2334 (2018).
  18. Li, D., et al. XY-Meta: a high-efficiency search engine for large-scale metabolome annotation with accurate FDR estimation. Analytical Chemistry. 92 (8), 5701-5707 (2020).
  19. Wen, B., Mei, Z., Zeng, C., Liu, S. metaX: a flexible and comprehensive software for processing metabolomics data. BMC Bioinformatics. 18 (1), 183 (2017).
  20. Aberg, K. M., Torgrip, R. J. O., Kolmert, J., Schuppe-Koistinen, I., Lindberg, J. Feature detection and alignment of hyphenated chromatographic-mass spectrometric data. Extraction of pure ion chromatograms using Kalman tracking. Journal of Chromatography. A. 1192 (1), 139-146 (2008).
  21. Liu, Q., et al. Addressing the batch effect issue for LC/MS metabolomics data in data preprocessing. Scientific Reports. 10 (1), 13856 (2020).
  22. Han, W., Li, L. Evaluating and minimizing batch effects in metabolomics. Mass Spectrometry Reviews. 41 (3), 421-442 (2022).
  23. Fei, F., Bowdish, D. M. E., McCarry, B. E. Comprehensive and simultaneous coverage of lipid and polar metabolites for endogenous cellular metabolomics using HILIC-TOF-MS. Analytical and Bioanalytical Chemistry. 406 (15), 3723-3733 (2014).
  24. Smith, C. A., Want, E. J., O’Maille, G., Abagyan, R., Siuzdak, G. XCMS: processing mass spectrometry data for metabolite profiling using nonlinear peak alignment, matching, and identification. Analytical Chemistry. 78 (3), 779-787 (2006).
  25. Giacomoni, F., et al. Workflow4Metabolomics: a collaborative research infrastructure for computational metabolomics. Bioinformatics. 31 (9), 1493-1495 (2015).
  26. Chang, H. -. Y., et al. iMet-Q: A user-friendly tool for label-free metabolomics quantitation using dynamic peak-width determination. PloS One. 11 (1), 0146112 (2016).
  27. Wang, M., et al. Sharing and community curation of mass spectrometry data with Global Natural Products Social Molecular Networking. Nature Biotechnology. 34 (8), 828-837 (2016).
  28. Schmid, R., et al. Ion identity molecular networking for mass spectrometry-based metabolomics in the GNPS environment. Nature Communications. 12 (1), 3832 (2021).
  29. Kessner, D., Chambers, M., Burke, R., Agus, D., Mallick, P. ProteoWizard: open source software for rapid proteomics tools development. Bioinformatics. 24 (21), 2534-2536 (2008).
  30. Johnson, S. R., Lange, B. M. Open-access metabolomics databases for natural product research: present capabilities and future potential. Frontiers in Bioengineering and Biotechnology. 3, 22 (2015).
  31. Horai, H., et al. MassBank: a public repository for sharing mass spectral data for life sciences. Journal of Mass Spectrometry: JMS. 45 (7), 703-714 (2010).
  32. Rawlinson, C., et al. Hierarchical clustering of MS/MS spectra from the firefly metabolome identifies new lucibufagin compounds. Scientific Reports. 10 (1), 6043 (2020).
check_url/pt/63625?article_type=t

Play Video

Citar este artigo
Li, D., Liang, J., Zhang, Y., Zhang, G. An Integrated Workflow of Identification and Quantification on FDR Control-Based Untargeted Metabolome. J. Vis. Exp. (187), e63625, doi:10.3791/63625 (2022).

View Video