IDBac es una tubería bioinformática basada en espectrometría de masas de código abierto que integra datos de espectros de proteínas intactos y metabolitos especializados, recogidos en material celular raspado de colonias bacterianas. La tubería permite a los investigadores organizar rápidamente cientos a miles de colonias bacterianas en grupos taxonómicos putativos, y diferenciarlos aún más en función de la producción especializada de metabolitos.
Con el fin de visualizar la relación entre la filogenia bacteriana y la producción especializada de metabolitos de colonias bacterianas que crecen en agar nutritivo, desarrollamos IDBac, una desorción/ionización asistida por matriz de bajo costo y alto rendimiento bioinformática de espectrometría de masas de tiempo de vuelo (MALDI-TOF MS). El software IDBac está diseñado para no expertos, está disponible libremente y es capaz de analizar algunas o miles de colonias bacterianas. Aquí, presentamos procedimientos para la preparación de colonias bacterianas para el análisis de MS MALDI-TOF, operación de instrumentos MS y procesamiento y visualización de datos en IDBac. En particular, instruimos a los usuarios cómo agrupar bacterias en dendrogramas basados en huellas dactilares de LA proteína MS y crear interactivamente redes de asociación de metabolitos (MAN) a partir de datos de metabolitos especializados.
Una barrera importante para los investigadores que estudian la función bacteriana es la capacidad de evaluar rápida y simultáneamente la identidad taxonómica de un microorganismo y su capacidad para producir metabolitos especializados. Esto ha evitado avances significativos en la comprensión de la relación entre la filogenia bacteriana y la producción especializada de metabolitos en la mayoría de las bacterias aisladas del medio ambiente. Aunque los métodos basados en MS que utilizan huellas dactilares de proteínas para agrupar e identificar bacterias están bien descritos1,2,3,4, estos estudios se han realizado generalmente en pequeños grupos de aislados, de una manera específica de cada especie. Es importante destacar que la información sobre la producción especializada de metabolitos, un importante impulsor de la función microbiana en el medio ambiente, ha permanecido sin incorporarse en estos estudios. 5 recientemente proporcionaron una historia completa que detalla el uso bajo de MALDI-TOF MS para analizar metabolitos especializados y la escasez de software para aliviar los cuellos de botella bioinformáticos actuales. Para abordar estas deficiencias, creamos IDBac, una canalización bioinformática que integra los modos linealy reflectron de MALDI-TOF MS 6. Esto permite a los usuarios visualizar y diferenciar rápidamente los aislados bacterianos basados en las huellas dactilares de la BIÓ de proteínas y metabolitos especializados, respectivamente.
IDBac es rentable, de alto rendimiento y está diseñado para el usuario laico. Está disponible libremente (chasemc.github.io/IDBac), y sólo requiere acceso a un espectrómetro de masas MALDI-TOF (se requerirá el modo de reflejo para el análisis especializado de metabolitos). La preparación de la muestra se basa en el método simple de “transferencia directa extendida”7,8 y los datos se recopilan con adquisiciones lineales y de reflectron consecutivas en un único punto de destino maldiva. Con IDBac, es posible analizar la filogenia putativa y la producción especializada de metabolitos de cientos de colonias en menos de cuatro horas, incluyendo la preparación de muestras, la adquisición de datos y la visualización de datos. Esto presenta una ventaja significativa de tiempo y costo sobre los métodos tradicionales de identificación de bacterias (como la secuenciación de genes) y el análisis de la producción metabólica (cromatografía líquida-espectrometría de masas [LCMS] y métodos cromatográficos similares).
Utilizando datos obtenidos en el análisis en modo lineal, IDBac emplea clustering jerárquico para representar la relación de los espectros de proteínas. Dado que los espectros representan principalmente proteínas ribosomales ionizadas, proporcionan una representación de la diversidad filogenética presente en una muestra. Además, IDBac incorpora datos de modo reflectron para mostrar huellas dactilares de metabolitos especializados como redes de asociación de metabolitos (MÁN). Las MAN son redes bipartitas que permiten una fácil visualización de la producción de metabolitos compartidos y únicos entre aislados bacterianos. La plataforma IDBac permite a los investigadores analizar los datos de proteínas y metabolitos especializados en tándem, pero también individualmente si solo se adquiere un tipo de datos. Es importante destacar que IDBac procesa datos sin procesar de instrumentos Bruker y Xiamen, así como txt, tab, csv, mzXML y mzML. Esto elimina la necesidad de conversión manual y formato de conjuntos de datos, y reduce significativamente el riesgo de error del usuario o mal manejo de los datos de MS.
El protocolo IDBac detalla la adquisición y análisis de datos de proteínas bacterianas y metabolitos especializados de hasta 384 aislados bacterianos en 4 h por un solo investigador. Con IDBac no hay necesidad de extraer ADN de aislados bacterianos o generar extractos de metabolitos especializados de caldos de fermentación líquida y analizarlos utilizando métodos cromatográficos. En su lugar, los datos de proteínas y metabolitos especializados se recopilan simplemente esparciendo material de colonias bacterianas directamente en una placa diana maldi. Esto reduce en gran medida el tiempo y el costo asociados con técnicasalternativas como la secuenciación del gen 16S rRNA y LCMS 9.
Es importante añadir una matriz en blanco y puntos de calibración a la placa MALDI, y recomendamos utilizar un número adecuado de réplicas para garantizar la reproducibilidad y la confianza estadística. El número de réplicas dependerá del experimento. Por ejemplo, si un usuario tiene la intención de diferenciar miles de colonias de una colección de placas de diversidad ambiental, pueden ser necesarias menos réplicas (nuestro laboratorio recoge tres réplicas técnicas por colonia). Alternativamente, si un usuario desea crear una base de datos personalizada de cepas de taxones bacterianos específicos para determinar rápidamente las clasificaciones de subespecies de aislados desconocidos, entonces más réplicas son apropiadas (nuestro laboratorio recoge ocho réplicas biológicas por tensión).
IDBac es una herramienta para diferenciar rápidamente aislados bacterianos altamente relacionados basados en información taxonómica putativa y la producción especializada de metabolitos. Puede complementar o servir como precursor de métodos ortogonales tales como análisis genéticos en profundidad, estudios que implican la producción y función de metabolitos, o la caracterización de la estructura de metabolitos especializados por espectroscopia de Resonancia Magnética Nuclear y/o LC-MS/MS.
La producción especializada de metabolitos (IDBac MANs) es altamente susceptible a las condiciones de crecimiento bacteriano, especialmente utilizando diferentes medios, que es una limitación potencial del método. Sin embargo, estos rasgos pueden ser explotados por el usuario, como IDBac puede generar fácilmente MANs mostrando las diferencias en la producción especializada de metabolitos bajo una variedad de condiciones de crecimiento. Es importante tener en cuenta que si bien las huellas dactilares de metabolitos especializados pueden variar según la condición de crecimiento, hemos demostrado previamente que las huellas dactilares de proteínas permanecen relativamente estables en estas variables (véase Clark et al.6). Cuando se trata de placas de diversidad ambiental, recomendamos purificar los aislados bacterianos antes del análisis con el fin de reducir las posibles contribuciones de la conversación cruzada bacteriana vecina.
Por último, la falta de una base de datos pública en la que se pueden realizar búsquedas de huellas dactilares de la proteína MS es una deficiencia importante en el uso de este método para clasificar bacterias ambientales desconocidas. Creamos IDBac con esto en mente, e incluimos la conversión automatizada de datos en un formato de código abierto aceptado por la comunidad (mzML)10,11,12 y diseñamos el software para permitir la búsqueda, el intercambio y la creación de bases de datos personalizadas. Estamos en proceso de crear una gran base de datos pública (>10.000 cepas plenamente caracterizadas), lo que permitirá la clasificación de algunos aislados a nivel de especie, incluyendo enlaces a números de adhesión de GenBank cuando estén disponibles.
IDBac es de código abierto y el código está disponible para que cualquiera pueda personalizar sus necesidades de análisis y visualización de datos. Recomendamos que los usuarios consulten un amplio cuerpo de literatura (Sauer et al.7, Silva et al.5) para ayudar a apoyar y diseñar sus objetivos experimentales. Organizamos un foro de discusión en: https://groups.google.com/forum/#!forum/idbac y un medio para informar de problemas con el software en: https://github.com/chasemc/IDBacApp/issues.
The authors have nothing to disclose.
Este trabajo fue apoyado por el Instituto Nacional de Ciencias Médicas Generales Grant R01 GM125943, National Geographic Grant CP-044R-17; Subvención 152336-051 del Fondo de Investigación de Islandia; y fondos de inicio de la Universidad de Illinois en Chicago. Además, agradecemos a los siguientes contribuyentes: la Dra. Amanda Bulman por la asistencia con los parámetros de adquisición de proteínas MALDI-TOF MS; Dr. Terry Moore y Dr. Atul Jain por recristalizar la matriz de ácido alfa-ciano-4-hidroxicinnamic (CHCA).
Acetonitrile | Fisher | 60-002-65 | LC-MS Ultra CHROMASOLV |
Autoflex Speed LEF MALDI-TOF instrument | Bruker Daltonics | ||
Bruker Daltonics Bacterial test standard | Fisher | NC0884024 | Bruker Daltonics 8604530 |
Bruker Peptide Calibration standard | Fisher | NC9846988 | Bruker Daltonics 8206195 |
Formic Acid | Fisher Chemical | A117-50 | 99.5+%, Optima LC/MS Grade |
MALDI-TOF target Plate | Bruker Daltonics | ||
Methanol | Fisher Chemical | A456-500 | Optima LC/MS Grade |
Toothpicks | any is ok | ||
Trifluoroacetic acid | Fisher | AC293810010 | 99.5%, for biochemistry, ACROS Organics |
Water | VWR | 7732-18-5 | LC-MS |
α-Cyano-4-hydroxycinnamic acid | Sigma | 28166-41-8 | (C2020-25G) ≥98% (TLC), powder |