Summary

FDR Kontrol Tabanlı Hedefsiz Metabolom Üzerinde Entegre Bir Tanımlama ve Niceleme İş Akışı

Published: September 20, 2022
doi:

Summary

XY-Meta ve metaX’i birbirine entegre eden hedefsiz bir metabolomik iş akışı oluşturduk. Bu protokolde, açık erişim spektrumu referansından bir aldatmaca spektral kütüphanesi oluşturmak için XY-Meta’nın nasıl kullanılacağını gösterdik ve daha sonra FDR kontrolünü gerçekleştirdik ve metabolomik spektrumları tanımladıktan sonra metabolitleri ölçmek için metaX’i kullandık.

Abstract

Hedefsiz metabolomik teknikler son yıllarda yaygın olarak kullanılmaktadır. Bununla birlikte, hızla artan verim ve numune sayısı, kütle spektrometresi spektrumlarının kalite kontrolü için zorluklar yaratan muazzam miktarda spektrum yaratmaktadır. Yanlış pozitifleri azaltmak için, yanlış keşif oranı (FDR) kalite kontrolü gereklidir. Son zamanlarda, XY-Meta adlı bir Target-Decoy stratejisine dayanan hedefsiz metabolom tanımlamasının FDR kontrolü için bir yazılım geliştirdik. Burada, XY-Meta ve metaX’i birbirine entegre eden eksiksiz bir analiz boru hattı gösterdik. Bu protokol, mevcut bir referans veritabanından bir aldatmaca veritabanı oluşturmak ve açık erişimli bir veri kümesinde büyük ölçekli metabolom tanımlaması için Target-Decoy stratejisini kullanarak FDR denetimi gerçekleştirmek için XY-meta’nın nasıl kullanılacağını gösterir. Diferansiyel analiz ve metabolitler ek açıklaması, metabolitlerin tepe noktaları tespiti ve kantitasyonu için metaX çalıştırıldıktan sonra gerçekleştirildi. Daha fazla araştırmacıya yardımcı olmak amacıyla, biyoinformatik becerilerine veya herhangi bir bilgisayar diline ihtiyaç duymadan bu analizler için kullanıcı dostu bir bulut tabanlı analiz platformu geliştirdik.

Introduction

Metabolitler biyolojik süreçlerde önemli roller oynar. Metabolitler genellikle enerji transferi, hormon düzenlemeleri, nörotransmiterlerin düzenlenmesi, hücresel iletişim ve protein post-translasyonel modifikasyonları gibi çeşitli süreçlerin düzenleyicileridir 1,2,3,4. Hedeflenmemiş metabolomik, çok sayıda metabolitin küresel bir görünümünü sağlar 5,6. Kütle spektrometresi ve kromatografi teknolojilerindeki ilerlemelerle birlikte, metabolom MS / MS spektrumlarının verimi son yıllarda hızla artmaktadır 7,8,9,10,11. Bu büyük veri kümelerinden metabolitleri tanımlamak için, MZmine 12, MS-FINDER 13, CFM-ID14, MetFrag15 ve SLAW 16 gibi çeşitli ek açıklama yazılımlarıgeliştirildi. Bununla birlikte, bu tanımlamalar genellikle birçok yanlış pozitif içerir. Nedenleri şunlardır: (1) MS / MS spektrumları, tepe eşleşmesini yanlış yönlendirebilecek rastgele gürültü içerir. (2) İzomerler ve parçalanma enerjilerindeki farklılıklar çoklu spektrum parmak izlerine neden olur ve böylece referans kütüphanesinin hacmini arttırır. (3) Referans kütüphanelerinin kalitesi farklılık gösterir. İyi bir referans spektral kütüphanesi oluşturmak için uygun bir standarda ihtiyaç vardır. Bu nedenle, fonksiyonel metabolom araştırması için hedeflenmemiş metabolomikler için sistematik bir yanlış keşif hızı (FDR) kontrolü gereklidir 7,8,9,17.

Hem Ampirik Bayes yaklaşımı hem de Target-Decoy stratejisi genel olarak FDR kontrol problemini ele aldı. Kerstin Scheubert ve ark., parçalanma ağacı tabanlı yöntemden oluşturulan aldatmaca veritabanındaki Target-Decoy stratejisinin FDR kontrol9 için en iyi yöntem olduğunu göstermiştir. Xusheng Wang ve ark., kimyadaki sekizli kurala dayanan aldatıcı üretim için bir yöntem tasarladılar ve FDR tahmini17’nin hassasiyetini geliştirdiler. Daha iyi performans için tuzak veritabanı oluşturmak için spektral kütüphanegösterilmiştir 18. Burada, spektral kütüphane tabanlı yöntemi geliştirdik ve FDR tahmininin hassasiyetini daha da artırabilecek XY-Meta19 adlı bir yazılım geliştirdik. Target-Decoy şeması altında FDR kontrolü için bir aldatmaca kütüphanesi oluşturmak için mevcut referans spektral kütüphanesini kullanır. XY-Meta kendi spektrum eşleştirme ve kosinüs benzerlik algoritmalarını destekler. Geleneksel arama ve yinelemeli arama modlarına izin verir. FDR değerlendirmesi adımında, Target-Decoy birleştirilmiş modunu ve ayrılmış modu destekler. Daha iyi esneklik için, XY-Meta harici aldatmaca kütüphanelerini kabul eder.

Metabolitlerin pik tespiti ve nicelleştirilmesi de hedefsiz metabolom analizinin önemli bir adımıdır. Pik tespiti, metabolom tanımlaması için ana yöntemdir. Genel olarak, metabolitlerin pik tespitinin doğruluğu, kütle spektrometrisinin gürültü sinyalleri, metabolitlerin düşük bolluğu, kirleticiler ve metabolitlerin bozunma ürünleri gibi birçok faktörden etkilenmiştir20. Numune sayısı çok fazla olduğunda veya sıvı kromatografi sütunu hedefsiz metabolom deneylerinde değiştirildiğinde, metabolom kantitasyonu21,22,23 için büyük bir zorluk olan olağanüstü parti etkileri ortaya çıkabilir. Şu anda, XCMS 24, Workflow4Metabolomic25, iMet-Q26 ve metaX19 gibi yazılımlar, hedeflenmemiş metabolomun en yüksek tespitini ve niceliğini gerçekleştirebilir, ancak metaX’in boru hattının daha eksiksiz ve kullanımı daha kolay olmasını öneririz. Burada, XY-Meta kullanarak genel kullanıma açık bir veri kümesi msv000084112 için tanımlama ve FDR kontrolü sürecini ve metaX kullanarak metabolitlerin tepe noktası tespitini ve niceliğini gösteriyoruz. Bu iş akışı yalnızca iki grup gerektirir ve her grubun en az iki örneği olması gerekir. MS / MS spektrum verileri, kütle spektrometresi platformu, iyonizasyon modu, şarj modu ve numune türünden bağımsız olarak gereklidir ve numune tabanlı normalleştirmeyi ve tepe tabanlı normalleştirmeyi destekleyebilir. Bu örneği takiben, araştırmacılar metabolomik tanımlama ve nicelemeyi kullanımı kolay bir şekilde gerçekleştirebilirler. Bu işlem hattını kullanmak için R programlama yeteneği gerekir. Herhangi bir programlama bilgisi olmayan araştırmacıya yardımcı olmak için, metabolomik analiz için bir bulut analiz platformu da geliştirdik. Bu bulut analiz platformunu Ek Materyal 5’te gösterdik.

Protocol

1. Metabolomik veri kümelerini analiz için hazırlama NOT: Bu gösterimde, QC örneği olmayan metabolomik veri kümelerini kullanıyoruz. Servis talebi ve kontrol grupları için verilere ihtiyaç vardır. Gösterim için, GNPS veritabanı27’de genel bir veri kümesi kullanıyoruz. Web sayfası https://gnps.ucsd.edu/ProteoSAFe/static/gnps-splash.jsp gidin. Veri Kümelerine Gözat’a tıklayın. “msv000084112” anaht…

Representative Results

msv000084112’nin ham verileri msconvert.exe tarafından dönüştürüldü ve mgf dosyaları (Ek Malzeme S6) oluşturuldu. XY-Meta, /database klasörü altında GNPS-NIST14-MATCHES_Decoy.mgf dosyası oluşturdu. Bu, orijinal referans spektral kütüphanesi GNPS-NIST14-MATCHES.mgf’den oluşturulan aldatmaca kütüphanesidir. Bu aldatmaca kütüphanesi yeniden kullanılabilir. Bu aldatma kitaplığını yeniden kullanırken, kullanıcı parametre.default dosyasında decoy_patter…

Discussion

Hedeflenmemiş metabolitlerin FDR kontrolü büyük bir zorluk olmuştur. Burada, FDR kontrolü ile büyük ölçekli hedefsiz metabolomik analizin (nitel ve kantitatif) eksiksiz bir boru hattını gösterdik. Bu, MS analizinde çok yaygın olan yanlış pozitifleri etkili bir şekilde azaltır.

Çalışmanız için uygun bir referans spektral kütüphanesi hazırlamak kilit bir noktadır. Başarılı ve hassas bir MS/MS tanımlaması sadece uygun eşleştirme algoritmalarını değil, aynı z…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Bu çalışma, Ulusal Anahtar Araştırma ve Geliştirme Programı (2018YFC0910200/2017YFA0505001) ve Guangdong Anahtar Ar-Ge Programı (2019B020226001) tarafından desteklenmektedir.

Materials

GNPS open source n/a https://gnps.ucsd.edu/ProteoSAFe/static/gnps-splash.jsp
XY-Meta open source n/a https://github.com/DLI-ShenZhen/XY-Meta
metaX open source n/a https://github.com/wenbostar/metaX
ProteoWizard Free Download 3.0.22116.18c918b-x86_64 https://proteowizard.sourceforge.io/download.html
CHI.Client Free Download ndp48-x86-x64-allos-enu http://www.chi-biotech.com/technology.html?ty=ypt

References

  1. Misra, B. B., Fahrmann, J. F., Grapov, D. Review of emerging metabolomic tools and resources: 2015-2016. Electrophoresis. 38 (18), 2257-2274 (2017).
  2. Idle, J. R., Gonzalez, F. J. Metabolomics. Cell Metabolism. 6 (5), 348-351 (2007).
  3. Fiehn, O., Town, C. Metabolomics — the link between genotypes and phenotypes. Functional Genomics. , 155-171 (2002).
  4. Town, C. . Functional Genomics. , (2002).
  5. Dettmer, K., Aronov, P. A., Hammock, B. D. Mass spectrometry-based metabolomics. Mass Spectrometry Reviews. 26 (1), 51-78 (2007).
  6. Vinayavekhin, N., Saghatelian, A. Untargeted metabolomics. Current Protocols in Molecular Biology. , 1-24 (2010).
  7. Chaleckis, R., Meister, I., Zhang, P., Wheelock, C. E. Challenges, progress and promises of metabolite annotation for LC-MS-based metabolomics. Current Opinion in Biotechnology. 55, 44-50 (2019).
  8. Palmer, A., et al. FDR-controlled metabolite annotation for high-resolution imaging mass spectrometry. Nature Methods. 14 (1), 57-60 (2017).
  9. Scheubert, K., et al. Significance estimation for large scale metabolomics annotations by spectral matching. Nature Communications. 8 (1), 1494 (2017).
  10. Schrimpe-Rutledge, A. C., Codreanu, S. G., Sherrod, S. D., McLean, J. A. Untargeted metabolomics strategies-challenges and emerging directions. Journal of the American Society for Mass Spectrometry. 27 (12), 1897-1905 (2016).
  11. Blaženović, I., Kind, T., Ji, J., Fiehn, O. Software tools and approaches for compound identification of LC-MS/MS data in metabolomics. Metabolites. 8 (2), (2018).
  12. Katajamaa, M., Miettinen, J., Oresic, M. MZmine: toolbox for processing and visualization of mass spectrometry based molecular profile data. Bioinformatics. 22 (5), 634-636 (2006).
  13. Tsugawa, H., et al. Hydrogen rearrangement rules: computational MS/MS fragmentation and structure elucidation using MS-FINDER software. Analytical chemistry. 88 (16), 7946-7958 (2016).
  14. Wang, F., et al. CFM-ID 4.0: More accurate ESI-MS/MS spectral prediction and compound identification. Analytical Chemistry. 93 (34), 11692-11700 (2021).
  15. Ruttkies, C., Schymanski, E. L., Wolf, S., Hollender, J., Neumann, S. MetFrag relaunched: incorporating strategies beyond in silico fragmentation. Journal of Cheminformatics. 8, 3 (2016).
  16. Delabriere, A., Warmer, P., Brennsteiner, V., Zamboni, N. SLAW: A scalable and self-optimizing processing workflow for untargeted LC-MS. Analytical chemistry. 93 (45), 15024-15032 (2021).
  17. Wang, X., et al. Target-decoy-based false discovery rate estimation for large-scale metabolite identification. Journal of Proteome Research. 17 (7), 2328-2334 (2018).
  18. Li, D., et al. XY-Meta: a high-efficiency search engine for large-scale metabolome annotation with accurate FDR estimation. Analytical Chemistry. 92 (8), 5701-5707 (2020).
  19. Wen, B., Mei, Z., Zeng, C., Liu, S. metaX: a flexible and comprehensive software for processing metabolomics data. BMC Bioinformatics. 18 (1), 183 (2017).
  20. Aberg, K. M., Torgrip, R. J. O., Kolmert, J., Schuppe-Koistinen, I., Lindberg, J. Feature detection and alignment of hyphenated chromatographic-mass spectrometric data. Extraction of pure ion chromatograms using Kalman tracking. Journal of Chromatography. A. 1192 (1), 139-146 (2008).
  21. Liu, Q., et al. Addressing the batch effect issue for LC/MS metabolomics data in data preprocessing. Scientific Reports. 10 (1), 13856 (2020).
  22. Han, W., Li, L. Evaluating and minimizing batch effects in metabolomics. Mass Spectrometry Reviews. 41 (3), 421-442 (2022).
  23. Fei, F., Bowdish, D. M. E., McCarry, B. E. Comprehensive and simultaneous coverage of lipid and polar metabolites for endogenous cellular metabolomics using HILIC-TOF-MS. Analytical and Bioanalytical Chemistry. 406 (15), 3723-3733 (2014).
  24. Smith, C. A., Want, E. J., O’Maille, G., Abagyan, R., Siuzdak, G. XCMS: processing mass spectrometry data for metabolite profiling using nonlinear peak alignment, matching, and identification. Analytical Chemistry. 78 (3), 779-787 (2006).
  25. Giacomoni, F., et al. Workflow4Metabolomics: a collaborative research infrastructure for computational metabolomics. Bioinformatics. 31 (9), 1493-1495 (2015).
  26. Chang, H. -. Y., et al. iMet-Q: A user-friendly tool for label-free metabolomics quantitation using dynamic peak-width determination. PloS One. 11 (1), 0146112 (2016).
  27. Wang, M., et al. Sharing and community curation of mass spectrometry data with Global Natural Products Social Molecular Networking. Nature Biotechnology. 34 (8), 828-837 (2016).
  28. Schmid, R., et al. Ion identity molecular networking for mass spectrometry-based metabolomics in the GNPS environment. Nature Communications. 12 (1), 3832 (2021).
  29. Kessner, D., Chambers, M., Burke, R., Agus, D., Mallick, P. ProteoWizard: open source software for rapid proteomics tools development. Bioinformatics. 24 (21), 2534-2536 (2008).
  30. Johnson, S. R., Lange, B. M. Open-access metabolomics databases for natural product research: present capabilities and future potential. Frontiers in Bioengineering and Biotechnology. 3, 22 (2015).
  31. Horai, H., et al. MassBank: a public repository for sharing mass spectral data for life sciences. Journal of Mass Spectrometry: JMS. 45 (7), 703-714 (2010).
  32. Rawlinson, C., et al. Hierarchical clustering of MS/MS spectra from the firefly metabolome identifies new lucibufagin compounds. Scientific Reports. 10 (1), 6043 (2020).

Play Video

Cite This Article
Li, D., Liang, J., Zhang, Y., Zhang, G. An Integrated Workflow of Identification and Quantification on FDR Control-Based Untargeted Metabolome. J. Vis. Exp. (187), e63625, doi:10.3791/63625 (2022).

View Video