Summary

זרימת עבודה משולבת של זיהוי וכימות במטבולום לא ממוקד מבוסס בקרת FDR

Published: September 20, 2022
doi:

Summary

בנינו זרימת עבודה מטבולית לא ממוקדת ששילבה את XY-Meta ו-metaX יחד. בפרוטוקול זה, הצגנו כיצד להשתמש ב- XY-Meta כדי ליצור ספרייה ספקטרלית מתוך הפניה לספקטרה בגישה פתוחה, ולאחר מכן ביצענו בקרת FDR והשתמשנו במטה-X כדי להגדיל את המטבוליטים לאחר זיהוי ספקטרום המטבולומיקה.

Abstract

טכניקות מטבוליות לא ממוקדות נמצאות בשימוש נרחב בשנים האחרונות. עם זאת, התפוקה ההולכת וגדלה במהירות ומספר הדגימות יוצרים כמות עצומה של ספקטרום, מה שמציב אתגרים לבקרת איכות של ספקטרום ספקטרומטריית המסה. כדי להפחית את התוצאות החיוביות הכוזבות, יש צורך בבקרת איכות של שיעור גילוי כוזב (FDR). לאחרונה, פיתחנו תוכנה לבקרת FDR של זיהוי מטבוליזם לא ממוקד המבוססת על אסטרטגיית Target-Decoy בשם XY-Meta. כאן הדגמנו צינור אנליזה שלם המשלב XY-Meta ו-metaX יחד. פרוטוקול זה מראה כיצד להשתמש ב- XY-meta כדי ליצור מסד נתונים של דמה ממסד נתונים קיים של ייחוס ולבצע בקרת FDR באמצעות אסטרטגיית Target-Decoy לזיהוי מטבוליזם בקנה מידה גדול בערכת נתונים בגישה פתוחה. הניתוח הדיפרנציאלי וביאור המטבוליטים בוצעו לאחר הרצת metaX לזיהוי וכמות שיאים של מטבוליטים. על מנת לסייע לחוקרים נוספים, פיתחנו גם פלטפורמת ניתוח מבוססת ענן ידידותית למשתמש עבור ניתוחים אלה, ללא צורך במיומנויות ביואינפורמטיקה או בשפות מחשב כלשהן.

Introduction

מטבוליטים ממלאים תפקידים חשובים בתהליכים ביולוגיים. מטבוליטים הם לעתים קרובות מווסתים של תהליכים שונים כמו העברת אנרגיה, ויסות הורמונים, ויסות של נוירוטרנסמיטורים, תקשורת תאית ושינויים לאחר תרגום של חלבונים וכו ‘1,2,3,4. מטבוליזם לא ממוקד מספק מבט גלובלי על מטבוליטים רבים 5,6. עם ההתקדמות בטכנולוגיות ספקטרומטריית מסה וכרומטוגרפיה, התפוקה של ספקטרום MS/MS מטבוליום עולה במהירות בשנים האחרונות 7,8,9,10,11. כדי לזהות מטבוליטים ממערכי נתונים ענקיים אלה, פותחו תוכנות ביאור שונות11, כגון MZmine12, MS-FINDER13, CFM-ID14, MetFrag15 ו- SLAW16. עם זאת, זיהויים אלה מכילים לעתים קרובות תוצאות חיוביות כוזבות רבות. הסיבות כוללות: (1) ספקטרום MS/MS מכיל רעש אקראי, שעלול להטעות את התאמת השיא. (2) איזומרים והבדלים באנרגיות הפיצול גורמים לטביעות אצבעות ספקטרום מרובות ובכך מגדילים את נפח ספריית ההפניות. (3) איכות ספריות העיון משתנה. יש צורך בתקן מתאים לבניית ספריית ייחוס ספקטרלית טובה. לכן, בקרת קצב גילוי שגוי שיטתית (FDR) עבור מטבוליקה לא ממוקדת חיונית למחקר מטבוליזם פונקציונלי 7,8,9,17.

הן גישת ה-Empirical Bayes והן אסטרטגיית ה-Target-Decoy התמודדו עם בעיית השליטה ב-FDR באופן כללי. Kerstin Scheubert et al. הראו כי אסטרטגיית Target-Decoy על מסד נתונים של דמה שנוצרה משיטה מבוססת עץ פיצול היא השיטה הטובה ביותר לבקרת FDR9. Xusheng Wang et al. תכננו שיטה ליצירת דמה המבוססת על כלל השמינייה בכימיה ושיפרו את הדיוק של הערכת FDR17. הספרייה הספקטרלית ליצירת מסד נתונים של דמה הודגמה לביצועים טובים יותר18. כאן, שיפרנו את השיטה מבוססת הספרייה הספקטרלית ופיתחנו תוכנה בשם XY-Meta19 שיכולה לשפר עוד יותר את הדיוק של הערכת FDR. הוא משתמש בספרייה הספקטרלית הקיימת של הפניות כדי ליצור ספריית דמה עבור פקד FDR תחת ערכת Target-Decoy. XY-Meta תומך באלגוריתמי התאמת ספקטרום ודמיון קוסינוס משלו. זה מאפשר חיפוש קונבנציונלי ומצבי חיפוש איטרטיביים. בשלב של הערכת FDR, הוא תומך במצב שרשור Target-Decoy ובמצב מופרד. לגמישות טובה יותר, XY-Meta מקבלת ספריות דמה חיצוניות.

זיהוי שיא וכימות של מטבוליטים הוא גם שלב חשוב בניתוח מטבוליזם לא ממוקד. זיהוי שיא הוא השיטה העיקרית לזיהוי מטבוליזם. באופן כללי, הדיוק של גילוי שיא של מטבוליטים הושפע מגורמים רבים, כגון אותות רעש של ספקטרומטריית מסה, שפע נמוך של מטבוליטים, מזהמים ותוצרי פירוק של מטבוליטים20. כאשר מספר הדגימות של גדול מדי או שעמודת הכרומטוגרפיה הנוזלית הוחלפה בניסויים של מטבוליזם לא ממוקד, עשויים להופיע אפקטים יוצאי דופן של אצווה, המהווים אתגר גדול לכמות המטבולומים 21,22,23. נכון לעכשיו, תוכנות כמו XCMS24, Workflow4Metabolomic25, iMet-Q26 ו- metaX19 יכולות לבצע זיהוי שיא וכמות של מטבוליום לא ממוקד, אך אנו מציעים שהצינור של metaX שלם יותר וקל יותר לשימוש. כאן, אנו מדגימים את תהליך הזיהוי ובקרת ה-FDR עבור מערך נתונים זמין לציבור msv000084112 באמצעות XY-Meta, ואת שיא הזיהוי והכימות של מטבוליטים באמצעות metaX. זרימת עבודה זו דורשת רק שתי קבוצות, וכל קבוצה זקוקה לפחות לשתי דוגמאות. יש צורך בנתוני ספקטרום MS/MS, ללא קשר לפלטפורמת ספקטרומטר המסה, מצב היינון, מצב הטעינה וסוג הדגימה, ויכולים לתמוך בנורמליזציה מבוססת דגימה ובנורמליזציה מבוססת שיא. בעקבות דוגמה זו, חוקרים יכולים לבצע זיהוי וכימות של מטבוליקה בצורה קלה לטיפול. שימוש בצינור זה דורש יכולת תכנות R. כדי לסייע לחוקר ללא כל ידע בתכנות, פיתחנו גם פלטפורמת ניתוח ענן לניתוח מטבוליקה. הדגמנו את פלטפורמת ניתוח הענן הזו בחומר משלים 5.

Protocol

1. הכינו מערכי נתונים של מטבוליקה לניתוח הערה: בהדגמה זו, אנו משתמשים בערכות נתונים מטבוליות ללא דגימת QC. יש צורך בנתונים עבור מקרים וקבוצות ביקורת. לצורך הדגמה, אנו משתמשים במערך נתונים ציבורי במסד נתוניםGNPS 27. עבור אל דף האינטרנט https://gnps.ucsd.edu/ProteoSAFe…

Representative Results

הנתונים הגולמיים של msv000084112 הומרו על ידי msconvert.exe ויצרו קבצי mgf (חומר משלים S6). XY-Meta יצר קובץ GNPS-NIST14-MATCHES_Decoy.mgf תחת /תיקיית מסד נתונים. זוהי ספריית ההטעיה שנוצרה מספריית הייחוס הספקטרלית המקורית GNPS-NIST14-MATCHES.mgf. ניתן לעשות שימוש חוזר בספריית דמה זו. בעת שימוש חוזר בספריית ד?…

Discussion

בקרת ה- FDR של מטבוליטים לא ממוקדים הייתה אתגר גדול. כאן, הדגמנו צינור שלם של ניתוח מטבוליקה לא ממוקדת בקנה מידה גדול (איכותי וכמותי) עם בקרת FDR. זה למעשה מפחית את התוצאות החיוביות הכוזבות, הנפוצות מאוד בניתוח טרשת נפוצה.

הכנת ספריית ייחוס ספקטרלית מתאימה למחקר שלך היא נקודת מפת…

Declarações

The authors have nothing to disclose.

Acknowledgements

עבודה זו נתמכת על ידי תוכנית המחקר והפיתוח הלאומית למפתחות (2018YFC0910200/2017YFA0505001) ותוכנית המו”פ של מפתח גואנגדונג (2019B020226001).

Materials

GNPS open source n/a https://gnps.ucsd.edu/ProteoSAFe/static/gnps-splash.jsp
XY-Meta open source n/a https://github.com/DLI-ShenZhen/XY-Meta
metaX open source n/a https://github.com/wenbostar/metaX
ProteoWizard Free Download 3.0.22116.18c918b-x86_64 https://proteowizard.sourceforge.io/download.html
CHI.Client Free Download ndp48-x86-x64-allos-enu http://www.chi-biotech.com/technology.html?ty=ypt

Referências

  1. Misra, B. B., Fahrmann, J. F., Grapov, D. Review of emerging metabolomic tools and resources: 2015-2016. Electrophoresis. 38 (18), 2257-2274 (2017).
  2. Idle, J. R., Gonzalez, F. J. Metabolomics. Cell Metabolism. 6 (5), 348-351 (2007).
  3. Fiehn, O., Town, C. Metabolomics — the link between genotypes and phenotypes. Functional Genomics. , 155-171 (2002).
  4. Town, C. . Functional Genomics. , (2002).
  5. Dettmer, K., Aronov, P. A., Hammock, B. D. Mass spectrometry-based metabolomics. Mass Spectrometry Reviews. 26 (1), 51-78 (2007).
  6. Vinayavekhin, N., Saghatelian, A. Untargeted metabolomics. Current Protocols in Molecular Biology. , 1-24 (2010).
  7. Chaleckis, R., Meister, I., Zhang, P., Wheelock, C. E. Challenges, progress and promises of metabolite annotation for LC-MS-based metabolomics. Current Opinion in Biotechnology. 55, 44-50 (2019).
  8. Palmer, A., et al. FDR-controlled metabolite annotation for high-resolution imaging mass spectrometry. Nature Methods. 14 (1), 57-60 (2017).
  9. Scheubert, K., et al. Significance estimation for large scale metabolomics annotations by spectral matching. Nature Communications. 8 (1), 1494 (2017).
  10. Schrimpe-Rutledge, A. C., Codreanu, S. G., Sherrod, S. D., McLean, J. A. Untargeted metabolomics strategies-challenges and emerging directions. Journal of the American Society for Mass Spectrometry. 27 (12), 1897-1905 (2016).
  11. Blaženović, I., Kind, T., Ji, J., Fiehn, O. Software tools and approaches for compound identification of LC-MS/MS data in metabolomics. Metabolites. 8 (2), (2018).
  12. Katajamaa, M., Miettinen, J., Oresic, M. MZmine: toolbox for processing and visualization of mass spectrometry based molecular profile data. Bioinformatics. 22 (5), 634-636 (2006).
  13. Tsugawa, H., et al. Hydrogen rearrangement rules: computational MS/MS fragmentation and structure elucidation using MS-FINDER software. Analytical chemistry. 88 (16), 7946-7958 (2016).
  14. Wang, F., et al. CFM-ID 4.0: More accurate ESI-MS/MS spectral prediction and compound identification. Analytical Chemistry. 93 (34), 11692-11700 (2021).
  15. Ruttkies, C., Schymanski, E. L., Wolf, S., Hollender, J., Neumann, S. MetFrag relaunched: incorporating strategies beyond in silico fragmentation. Journal of Cheminformatics. 8, 3 (2016).
  16. Delabriere, A., Warmer, P., Brennsteiner, V., Zamboni, N. SLAW: A scalable and self-optimizing processing workflow for untargeted LC-MS. Analytical chemistry. 93 (45), 15024-15032 (2021).
  17. Wang, X., et al. Target-decoy-based false discovery rate estimation for large-scale metabolite identification. Journal of Proteome Research. 17 (7), 2328-2334 (2018).
  18. Li, D., et al. XY-Meta: a high-efficiency search engine for large-scale metabolome annotation with accurate FDR estimation. Analytical Chemistry. 92 (8), 5701-5707 (2020).
  19. Wen, B., Mei, Z., Zeng, C., Liu, S. metaX: a flexible and comprehensive software for processing metabolomics data. BMC Bioinformatics. 18 (1), 183 (2017).
  20. Aberg, K. M., Torgrip, R. J. O., Kolmert, J., Schuppe-Koistinen, I., Lindberg, J. Feature detection and alignment of hyphenated chromatographic-mass spectrometric data. Extraction of pure ion chromatograms using Kalman tracking. Journal of Chromatography. A. 1192 (1), 139-146 (2008).
  21. Liu, Q., et al. Addressing the batch effect issue for LC/MS metabolomics data in data preprocessing. Scientific Reports. 10 (1), 13856 (2020).
  22. Han, W., Li, L. Evaluating and minimizing batch effects in metabolomics. Mass Spectrometry Reviews. 41 (3), 421-442 (2022).
  23. Fei, F., Bowdish, D. M. E., McCarry, B. E. Comprehensive and simultaneous coverage of lipid and polar metabolites for endogenous cellular metabolomics using HILIC-TOF-MS. Analytical and Bioanalytical Chemistry. 406 (15), 3723-3733 (2014).
  24. Smith, C. A., Want, E. J., O’Maille, G., Abagyan, R., Siuzdak, G. XCMS: processing mass spectrometry data for metabolite profiling using nonlinear peak alignment, matching, and identification. Analytical Chemistry. 78 (3), 779-787 (2006).
  25. Giacomoni, F., et al. Workflow4Metabolomics: a collaborative research infrastructure for computational metabolomics. Bioinformatics. 31 (9), 1493-1495 (2015).
  26. Chang, H. -. Y., et al. iMet-Q: A user-friendly tool for label-free metabolomics quantitation using dynamic peak-width determination. PloS One. 11 (1), 0146112 (2016).
  27. Wang, M., et al. Sharing and community curation of mass spectrometry data with Global Natural Products Social Molecular Networking. Nature Biotechnology. 34 (8), 828-837 (2016).
  28. Schmid, R., et al. Ion identity molecular networking for mass spectrometry-based metabolomics in the GNPS environment. Nature Communications. 12 (1), 3832 (2021).
  29. Kessner, D., Chambers, M., Burke, R., Agus, D., Mallick, P. ProteoWizard: open source software for rapid proteomics tools development. Bioinformatics. 24 (21), 2534-2536 (2008).
  30. Johnson, S. R., Lange, B. M. Open-access metabolomics databases for natural product research: present capabilities and future potential. Frontiers in Bioengineering and Biotechnology. 3, 22 (2015).
  31. Horai, H., et al. MassBank: a public repository for sharing mass spectral data for life sciences. Journal of Mass Spectrometry: JMS. 45 (7), 703-714 (2010).
  32. Rawlinson, C., et al. Hierarchical clustering of MS/MS spectra from the firefly metabolome identifies new lucibufagin compounds. Scientific Reports. 10 (1), 6043 (2020).
check_url/pt/63625?article_type=t

Play Video

Citar este artigo
Li, D., Liang, J., Zhang, Y., Zhang, G. An Integrated Workflow of Identification and Quantification on FDR Control-Based Untargeted Metabolome. J. Vis. Exp. (187), e63625, doi:10.3791/63625 (2022).

View Video