IDBac é um pipeline de Bioinformática baseado em espectrometria de massas de código aberto que integra dados de proteínas intactas e espectros metabólito especializados, coletados em material celular raspado de colônias bacterianas. O pipeline permite que os pesquisadores organizem rapidamente centenas a milhares de colônias bacterianas em grupos taxonômicos putativos e diferenciem-se ainda mais com base na produção de metabólito especializado.
A fim de visualizar a relação entre a filogenia bacteriana e a produção de metabólito especializado de colônias bacterianas que crescem em ágar nutriente, desenvolvemos IDBac — uma dessorção/ionização a laser assistida por matriz de baixo custo e alta taxa de transferência pipeline de Bioinformática de espectrometria de massas em tempo de voo (MALDI-TOF MS). IDBac software é projetado para não-especialistas, está disponível gratuitamente, e capaz de analisar alguns a milhares de colônias bacterianas. Aqui, apresentamos procedimentos para a preparação de colônias bacterianas para análise de MALDI-TOF MS, operação de instrumento MS e processamento e visualização de dados em IDBac. Em particular, Instruímos os usuários como agrupar bactérias em dendrogramas com base em impressões digitais de proteína MS e criar interativamente redes de associação de metabolito (MANs) de dados de metabólito especializados.
Uma grande barreira para pesquisadores que estudam a função bacteriana é a capacidade de avaliar rapidamente e simultaneamente a identidade taxonômica de um microrganismo e sua capacidade de produzir metabólitos especializados. Isso impediu avanços significativos na compreensão da relação entre a filogenia bacteriana e a produção de metabólito especializado na maioria das bactérias isoladas do ambiente. Embora os métodos baseados em MS que usam impressões digitais de proteínas para agrupar e identificar bactérias sejam bem descritos1,2,3,4, esses estudos geralmente foram realizados em pequenos grupos de isolados, de forma específica da espécie. É importante ressaltar que as informações sobre a produção de metabólito especializado, um dos principais condutores de função microbiana no ambiente, permaneceram não incorporadas nesses estudos. Silva et al.5 forneceram recentemente uma história abrangente detalhando o baixo uso de MALDI-TOF MS para analisar metabólitos especializados e a escassez de softwares para aliviar os gargalos atuais de Bioinformática. A fim de abordar essas deficiências, criamos IDBac, um pipeline de Bioinformática que integra os modos linear e reflectron de MALDI-TOF MS6. Isto permite que os usuários visualizem e diferenciem rapidamente os isolados bacterianos baseados na proteína e nas impressões digitais especializadas do MS do metabolito, respectivamente.
IDBac é rentável, alta taxa de transferência, e projetado para o usuário leigo. Está disponível livremente (chasemc.github.io/IDBac), e exige somente o acesso a um espectrómetro maciço de MALDI-TOF (o modo do reflectron será exigido para a análise especializada do metabolito). A preparação da amostra depende do método simples de “transferência direta estendida”7,8 e os dados são coletados com aquisições consecutivas lineares e de reflectron em um único ponto do MALDI-alvo. Com IDBac, é possível analisar a filogenia putativa e a produção de metabólito especializado de centenas de colônias em menos de quatro horas, incluindo preparação de amostras, aquisição de dados e visualização de dados. Isto apresenta uma vantagem significativa do tempo e do custo sobre métodos tradicionais de identificar as bactérias (tais como o sequenciamento do gene), e analisando a saída metabólica (cromatografia líquida-espectrometria maciça [LCMS] e métodos cromatográficos similares).
Usando dados obtidos na análise de modo linear, IDBac emprega agrupamento hierárquico para representar a parentalidade dos espectros proteicos. Uma vez que os espectros representam principalmente proteínas ribossômicas ionizadas, eles fornecem uma representação da diversidade filogenética presente em uma amostra. Além disso, o idbac incorpora dados de modo reflectron para exibir as impressões digitais especializadas do metabolito como metabolito Association Networks (Mans). Mans são redes bipartido que permitem a fácil visualização da produção de metabólito compartilhada e única entre isolados bacterianos. A plataforma IDBac permite que os pesquisadores analisem os dados de proteínas e metabólito especializados em tandem, mas também individualmente, se apenas um tipo de dados for adquirido. Importante, IDBac processa dados brutos de instrumentos de Bruker e de Xiamen, assim como o txt, a aba, o CSV, o mzXML, e o mzML. Isso elimina a necessidade de conversão manual e formatação de conjuntos de dados, e reduz significativamente o risco de erro do usuário ou manipulação incorreta de dados MS.
O protocolo IDBac detalha a proteína bacteriana e a aquisição e análise de dados metabólito especializados de até 384 isolados bacterianos em 4 h por um único pesquisador. Com IDBac não há necessidade de extrair DNA de isolados bacterianos ou gerar extratos metabólitos especializados de caldos de fermentação líquida e analisá-los usando métodos cromatográficos. Em vez disso, os dados de proteínas e metabólito especializados são recolhidos simplesmente espalhando material de colônias bacterianas diretamente sobre uma placa alvo MALDI. Isto reduz extremamente o tempo e o custo associados com as técnicas alternativas tais como o sequenciamento do gene 16S rRNA e o LCMS9.
É importante adicionar uma matriz em branco e pontos de calibração à placa MALDI, e recomendamos o uso de um número adequado de repetições para garantir a reprodutibilidade e a confiança estatística. O número de repetições será dependente do experimento. Por exemplo, se um usuário pretende diferenciar milhares de colônias de uma coleção de placas de diversidade ambiental, menos repetições podem ser necessárias (nosso laboratório coleta três repetições técnicas por colônia). Alternativamente, se um usuário deseja criar um banco de dados personalizado de cepas de táxons bacterianos específicos para determinar rapidamente classificações de subespécies de isolados desconhecidos, mais réplicas são apropriadas (nosso laboratório coleta oito repetições biológicas por tensão).
O IDBac é uma ferramenta para diferenciar rapidamente os isolados bacterianos altamente relacionados baseados na informação taxonômica putativa e na produção especializada do metabolito. Pode complementar ou servir como um precursor de métodos ortogonais, tais como análises genéticas aprofundadas, estudos envolvendo produção e função do metabolito, ou caracterização da estrutura do metabolito especializado por espectroscopia de ressonância magnética nuclear e/ou LC-MS/MS.
A produção de metabolito especializado (IDBac MANs) é altamente suscetível a condições de crescimento bacteriano, especialmente utilizando diferentes meios de comunicação, o que é uma potencial limitação do método. No entanto, essas características podem ser exploradas pelo usuário, como IDBac pode prontamente gerar MANs mostrando as diferenças na produção de metabólito especializados uma variedade de condições de crescimento. É importante notar que, embora as impressões digitais do metabolito especializado possam variar de acordo com a condição de crescimento, mostramos previamente que as impressões digitais de proteínas permanecem relativamente estáveis nessas variáveis (ver Clark et al.6). Ao lidar com as placas de diversidade ambiental, recomendamos a purificação de isolados bacterianos antes da análise, a fim de reduzir possíveis contribuições de cross-talk bacteriano vizinho.
Finalmente, a falta de uma base de dados pública pesquisável de impressões digitais da proteína MS é um lacuna principal no uso deste método para classificar bactérias ambientais desconhecidas. Criamos o idbac com isso em mente e incluímos a conversão automatizada de dados em um formato de código aberto aceito pela Comunidade (mzml)10,11,12 e projetamos o software para permitir a pesquisa, compartilhamento e criação de bancos de dados personalizados. Estamos no processo de criação de um grande banco de dados público (> 10000 cepas totalmente caracterizadas), o que permitirá a classificação de alguns isolados para o nível de espécie, incluindo links para números de adesão GenBank quando disponível.
IDBac é fonte aberta e o código está disponível para qualquer pessoa personalizar suas necessidades de análise e visualização de dados. Recomendamos que os usuários consultem um extenso corpo de literatura (Sauer et al.7, Silva et al.5) para ajudar a apoiar e projetar seus objetivos experimentais. Nós hospedamos um fórum para discussão em: https://groups.google.com/forum/#!forum/idbac e um meio para relatar problemas com o software em: https://github.com/chasemc/IDBacApp/issues.
The authors have nothing to disclose.
Este trabalho foi apoiado pelo Instituto Nacional de ciências médicas gerais Grant R01 GM125943, National Geographic Grant CP-044R-17; Concessão do fundo de pesquisa Islandês 152336-051; e da Universidade de Illinois em Chicago fundos de inicialização. Além disso, agradecemos aos seguintes contribuidores: Dr. Amanda Bulman para assistência com os parâmetros de aquisição de proteínas MALDI-TOF MS; Dr. Terry Moore e Dr. Atul Jain para recristalização Alpha-cyano-4-Hydroxycinnamic Acid Matrix (CHCA).
Acetonitrile | Fisher | 60-002-65 | LC-MS Ultra CHROMASOLV |
Autoflex Speed LEF MALDI-TOF instrument | Bruker Daltonics | ||
Bruker Daltonics Bacterial test standard | Fisher | NC0884024 | Bruker Daltonics 8604530 |
Bruker Peptide Calibration standard | Fisher | NC9846988 | Bruker Daltonics 8206195 |
Formic Acid | Fisher Chemical | A117-50 | 99.5+%, Optima LC/MS Grade |
MALDI-TOF target Plate | Bruker Daltonics | ||
Methanol | Fisher Chemical | A456-500 | Optima LC/MS Grade |
Toothpicks | any is ok | ||
Trifluoroacetic acid | Fisher | AC293810010 | 99.5%, for biochemistry, ACROS Organics |
Water | VWR | 7732-18-5 | LC-MS |
α-Cyano-4-hydroxycinnamic acid | Sigma | 28166-41-8 | (C2020-25G) ≥98% (TLC), powder |