Construimos un flujo de trabajo metabolómico no dirigido que integró XY-Meta y metaX juntos. En este protocolo, mostramos cómo usar XY-Meta para generar una biblioteca espectral señuelo a partir de la referencia de espectros de acceso abierto, y luego realizamos el control FDR y usamos el metaX para cuantificar los metabolitos después de identificar los espectros metabolómicos.
Las técnicas de metabolómica no dirigidas están siendo ampliamente utilizadas en los últimos años. Sin embargo, el rápido aumento del rendimiento y el número de muestras crean una enorme cantidad de espectros, estableciendo desafíos para el control de calidad de los espectros de espectrometría de masas. Para reducir los falsos positivos, es necesario un control de calidad de la tasa de descubrimiento falso (FDR). Recientemente, desarrollamos un software para el control FDR de la identificación de metabolomas no dirigidos que se basa en una estrategia Target-Decoy llamada XY-Meta. Aquí, demostramos una canalización de análisis completa que integra XY-Meta y metaX juntos. Este protocolo muestra cómo usar XY-meta para generar una base de datos señuelo a partir de una base de datos de referencia existente y realizar el control FDR utilizando la estrategia Target-Decoy para la identificación de metabolomas a gran escala en un conjunto de datos de acceso abierto. El análisis diferencial y la anotación de metabolitos se realizaron después de ejecutar metaX para la detección y cuantificación de picos de metabolitos. Con el fin de ayudar a más investigadores, también desarrollamos una plataforma de análisis basada en la nube fácil de usar para estos análisis, sin la necesidad de habilidades bioinformáticas o lenguajes informáticos.
Los metabolitos juegan un papel importante en los procesos biológicos. Los metabolitos son a menudo reguladores de diversos procesos como la transferencia de energía, las regulaciones hormonales, la regulación de los neurotransmisores, las comunicaciones celulares y las modificaciones post-traduccionales de proteínas, etc. 1,2,3,4. La metabolómica no dirigida proporciona una visión global de numerosos metabolitos 5,6. Con los avances en las tecnologías de espectrometría de masas y cromatografía, el rendimiento de los espectros de metaboloma MS/MS está aumentando rápidamente en los últimos años 7,8,9,10,11. Para identificar metabolitos a partir de estos enormes conjuntos de datos, se desarrollaron varios software de anotación11, como MZmine12, MS-FINDER13, CFM-ID14, MetFrag15 y SLAW16. Sin embargo, estas identificaciones a menudo contienen muchos falsos positivos. Las razones incluyen: (1) Los espectros MS/MS contienen ruido aleatorio, lo que puede inducir a error a la coincidencia del pico. (2) Los isómeros y las diferencias en las energías de fragmentación causan múltiples huellas dactilares de espectros y, por lo tanto, aumentan el volumen de la biblioteca de referencia. (3) La calidad de las bibliotecas de referencia varía. Se necesita un estándar adecuado para construir una buena biblioteca espectral de referencia. Por lo tanto, un control sistemático de la tasa de falso descubrimiento (FDR) para la metabolómica no dirigida es esencial para la investigación del metaboloma funcional 7,8,9,17.
Tanto el enfoque empírico de Bayes como la estrategia Target-Decoy abordaron el problema de control de FDR en general. Kerstin Scheubert et al. demostraron que la estrategia Target-Decoy en la base de datos de señuelos generada a partir del método basado en árboles de fragmentación es el mejor método para el control FDR9. Xusheng Wang et al. diseñaron un método para la generación de señuelos basado en la regla del octeto en química y mejoraron la precisión de la estimación FDR17. La biblioteca espectral para generar la base de datos señuelo se demostró para un mejor rendimiento18. Aquí, mejoramos el método basado en la biblioteca espectral y desarrollamos un software llamado XY-Meta19 que puede mejorar aún más la precisión de la estimación de FDR. Utiliza la biblioteca espectral de referencia existente para generar una biblioteca de señuelos para el control FDR bajo el esquema Target-Decoy. XY-Meta admite sus propios algoritmos de coincidencia de espectros y similitud de coseno. Permite la búsqueda convencional y los modos de búsqueda iterativa. En el paso de la evaluación de FDR, admite el modo concatenado Target-Decoy y el modo separado. Para una mayor flexibilidad, XY-Meta acepta bibliotecas señuelo externas.
La detección y cuantificación de picos de metabolitos es también un paso importante del análisis de metabolomas no dirigidos. La detección de picos es el método principal para la identificación de metabolomas. En general, la precisión de la detección de picos de metabolitos se vio afectada por múltiples factores, como las señales de ruido de la espectrometría de masas, la baja abundancia de metabolitos, contaminantes y productos de degradación de metabolitos20. Cuando el número de muestras de es demasiado grande o la columna de cromatografía líquida fue reemplazada en experimentos de metaboloma no dirigido, pueden aparecer efectos de lote notables, lo cual es un desafío importante para la cuantificación del metaboloma 21,22,23. Actualmente, software como XCMS24, Workflow4Metabolomic25, iMet-Q26 y metaX19 puede realizar la detección y cuantificación de picos de metaboloma no dirigido, pero sugerimos que la canalización de metaX sea más completa y fácil de usar. Aquí, demostramos el proceso de identificación y control FDR para un conjunto de datos disponible públicamente msv000084112 usando XY-Meta, y la detección y cuantificación de metabolitos de pico usando metaX. Este flujo de trabajo solo requiere dos grupos y cada grupo necesita al menos dos ejemplos. Se necesitan datos de espectros MS /MS, independientemente de la plataforma del espectrómetro de masas, el modo de ionización, el modo de carga y el tipo de muestra, y pueden admitir la normalización basada en muestras y la normalización basada en picos. Siguiendo este ejemplo, los investigadores pueden realizar la identificación y cuantificación de la metabolómica de una manera fácil de manejar. El uso de esta canalización requiere la capacidad de programación de R. Para ayudar al investigador sin ningún conocimiento de programación, también desarrollamos una plataforma de análisis en la nube para el análisis metabolómico. Demostramos esta plataforma de análisis en la nube en material complementario 5.
El control FDR de metabolitos no dirigidos ha sido un gran desafío. Aquí, demostramos una cartera completa de análisis metabolómico no dirigido a gran escala (cualitativo y cuantitativo) con control FDR. Esto reduce efectivamente los falsos positivos, que son muy comunes en el análisis de EM.
Preparar una biblioteca espectral de referencia adecuada para su estudio es un punto clave. Una identificación MS/MS exitosa y sensible requiere no solo algoritmos de coincidencia adecuados, sino ta…
The authors have nothing to disclose.
Este trabajo cuenta con el apoyo del Programa Nacional de Investigación y Desarrollo Clave (2018YFC0910200/2017YFA0505001) y el Programa Clave de I + D de Guangdong (2019B020226001).
GNPS | open source | n/a | https://gnps.ucsd.edu/ProteoSAFe/static/gnps-splash.jsp |
XY-Meta | open source | n/a | https://github.com/DLI-ShenZhen/XY-Meta |
metaX | open source | n/a | https://github.com/wenbostar/metaX |
ProteoWizard | Free Download | 3.0.22116.18c918b-x86_64 | https://proteowizard.sourceforge.io/download.html |
CHI.Client | Free Download | ndp48-x86-x64-allos-enu | http://www.chi-biotech.com/technology.html?ty=ypt |