IDBac è una pipeline di bioinformatica a base di spettrometria di massa open source che integra dati provenienti da proteine intatte e spettri di metaboliti specializzati, raccolti su materiale cellulare raschiato da colonie batteriche. La conduttura consente ai ricercatori di organizzare rapidamente centinaia di migliaia di colonie batteriche in gruppi tassonomici putativi e di differenziarle ulteriormente in base alla produzione specializzata di metaboliti.
Per visualizzare la relazione tra la filoicina batterica e la produzione specializzata di metaboliti di colonie batteriche che crescono sull’agar nutritivo, abbiamo sviluppato IDBac, un sistema di desorpizzazione/ionizzazione del laser a matrice a basso costo e ad alta produttività spettrorometria di massa a tempo di volo (MALDI-TOF MS) pipeline bioinformatica. Il software IDBac è progettato per i non esperti, è liberamente disponibile e in grado di analizzare da poche a migliaia di colonie batteriche. Qui presentiamo le procedure per la preparazione di colonie batteriche per l’analisi MALDI-TOF MS, il funzionamento dello strumento MS e l’elaborazione e la visualizzazione dei dati in IDBac. In particolare, istruiamo gli utenti su come raggruppare i batteri in dendrogrammi sulla base delle impronte digitali delle proteine MS e creare interattivamente Metabolite Association Networks (MAN) da dati specializzati sui metaboliti.
Una delle principali barriere per i ricercatori che studiano la funzione batterica è la capacità di valutare rapidamente e simultaneamente l’identità tassonomica di un microrganismo e la sua capacità di produrre metaboliti specializzati. Ciò ha impedito progressi significativi nella comprensione della relazione tra filologia batterica e produzione specializzata di metaboliti nella maggior parte dei batteri isolati dall’ambiente. Sebbene i metodi basati sulla SM che utilizzano impronte proteiche per raggruppare e identificare i batteri siano ben descritti1,2,3,4, questi studi sono stati generalmente eseguiti su piccoli gruppi di isolati, in modo specifico per le specie. È importante sottolineare che le informazioni sulla produzione di metaboliti specializzati, uno dei principali fattori della funzione microbica nell’ambiente, sono rimaste non incorporate in questi studi. Silva et al.5 ha recentemente fornito una storia completa che descrive il sottoutilizzo di MALDI-TOF MS per analizzare i metaboliti specializzati e la carenza di software per alleviare gli attuali colli di bottiglia bioinformatica. Per far fronte a queste carenze, abbiamo creato IDBac, una pipeline di bioinformatica che integra modalità lineare e riflettore di MALDI-TOF MS6. Ciò consente agli utenti di visualizzare e differenziare rapidamente gli isolati batterici in base alle impronte digitali MS sia proteiche che specializzate.
IDBac è conveniente, ad alta velocità effettiva e progettato per l’utente laico. È liberamente disponibile (chasemc.github.io/IDBac) e richiede solo l’accesso a uno spettrometro di massa MALDI-TOF (la modalità riflettore sarà necessaria per l’analisi specialized dei metaboliti). La preparazione del campione si basa sul semplice metodo di “trasferimento diretto esteso”7,8 e i dati vengono raccolti con acquisizioni lineari e di riflettore consecutive su un singolo punto MALDI-target. Con IDBac, è possibile analizzare la produzione di filo putativo e metabolita specializzata di centinaia di colonie in meno di quattro ore, tra cui la preparazione del campione, l’acquisizione dei dati e la visualizzazione dei dati. Questo presenta un significativo vantaggio in termini di tempo e costi rispetto ai metodi tradizionali di identificazione dei batteri (come il sequenziamento genico) e all’analisi della produzione metabolica (spettrometria cromatometria-massa liquida [LCMS] e metodi cromatografici simili).
Utilizzando i dati ottenuti nell’analisi in modalità lineare, IDBac impiega il clustering gerarchico per rappresentare la parentela degli spettri proteici. Poiché gli spettri rappresentano per lo più proteine ribosomiche ionizzate, forniscono una rappresentazione della diversità filogenetica presente in un campione. Inoltre, IDBac incorpora dati in modalità riflettore per visualizzare le impronte digitali dei metaboliti specializzati come Metabolite Association Networks (MAN). I MAN sono reti bipartite che consentono una facile visualizzazione della produzione di metaboliti condivisi e unici tra isolati batterici. La piattaforma IDBac consente ai ricercatori di analizzare sia i dati sulle proteine che sui metaboliti specializzati in tandem, ma anche individualmente se viene acquisito un solo tipo di dati. È importante sottolineare che IDBac elabora i dati non elaborati degli strumenti Bruker e Xiamen, nonché txt, tab, csv, mzXML e mzML. Ciò elimina la necessità di conversione manuale e formattazione dei set di dati e riduce significativamente il rischio di errore dell’utente o di gestione errata dei dati MS.
Il protocollo IDBac descrive la proteina batterica e l’acquisizione e l’analisi di dati sui metaboliti specializzati fino a 384 isolati batterici in 4 h da un singolo ricercatore. Con IDBac non è necessario estrarre il DNA dagli isolati batterici o generare estratti di metaboliti specializzati dai brodi di fermentazione liquida e analizzarli utilizzando metodi cromatografici. Invece, i dati sulle proteine e sui metaboliti specializzati vengono raccolti semplicemente diffondendo materiale dalle colonie batteriche direttamente su una piastra bersaglio MALDI. Questo riduce notevolmente il tempo e i costi associati a tecniche alternative come il sequenziamento genico 16S rRNA e LCMS9.
È importante aggiungere una matrice vuota e punti di calibrazione alla piastra MALDI, e si consiglia di utilizzare un numero appropriato di repliche per garantire la riproducibilità e la fiducia statistica. Il numero di repliche dipenderà dall’esperimento. Ad esempio, se un utente intende differenziare migliaia di colonie da una raccolta di piastre di diversità ambientale, potrebbero essere necessarie meno repliche (il nostro laboratorio raccoglie tre repliche tecniche per colonia). In alternativa, se un utente desidera creare un database personalizzato di ceppi da specifici taxa batterici per determinare rapidamente le classificazioni sottospecie di isolati sconosciuti, allora più repliche sono appropriate (il nostro laboratorio raccoglie otto repliche biologiche per ceppo).
IDBac è uno strumento per differenziare rapidamente gli isolati batterici altamente correlati sulla base di informazioni tassonomiche putative e produzione di metaboliti specializzati. Può integrare o servire come precursore di metodi ortogonali come analisi genetiche approfondite, studi che coinvolgono la produzione e la funzione dei metaboliti, o la caratterizzazione della struttura di metaboliti specializzati mediante spettroscopia a risonanza magnetica nucleare e/o LC-MS/MS.
La produzione specializzata di metaboliti (MAN IDBac) è altamente suscettibile alle condizioni di crescita batterica, in particolare utilizzando diversi supporti, che è una potenziale limitazione del metodo. Tuttavia questi tratti possono essere sfruttati dall’utente, come IDBac può facilmente generare MAN mostrando le differenze nella produzione di metaboliti specializzati in una varietà di condizioni di crescita. È importante notare che, sebbene le impronte digitali dei metaboliti specializzati possono variare a seconda della condizione di crescita, abbiamo dimostrato in precedenza che le impronte digitali delle proteine rimangono relativamente stabili in queste variabili (vedi Clark et al.6). Quando si tratta di piastre di diversità ambientale, si consiglia di purificare gli isolati batterici prima dell’analisi al fine di ridurre i possibili contributi dal cross-talk batterico vicino.
Infine, la mancanza di un database pubblico ricercabile di impronte digitali delle proteine MS è una grave carenza nell’uso di questo metodo per classificare i batteri ambientali sconosciuti. Abbiamo creato IDBac con questo in mente, e incluso la conversione automatica dei dati in un formato open source accettato dalla comunità (mzML)10,11,12 e progettato il software per consentire la ricerca, la condivisione e la creazione di database personalizzati. Stiamo creando una grande banca dati pubblica (>10,000 ceppi completamente caratterizzati), che permetterà la classificazione di alcuni isolati a livello di specie, compresi i collegamenti ai numeri di adesione genBank quando disponibili.
IDBac è open source e il codice è disponibile per chiunque per personalizzare le proprie esigenze di analisi e visualizzazione dei dati. Consigliamo agli utenti di consultare un vasto corpo di letteratura (Sauer et al.7, Silva et al.5) per aiutare a sostenere e progettare i loro obiettivi sperimentali. Ospitiamo un forum di discussione all’indirizzo: https://groups.google.com/forum/#!forum/idbac e un mezzo per segnalare problemi con il software all’indirizzo: https://github.com/chasemc/IDBacApp/issues.
The authors have nothing to disclose.
Questo lavoro è stato supportato dal National Institute of General Medical Sciences Grant R01 GM125943, National Geographic Grant CP-044R-17; Fondo di ricerca islandese sovvenzione 152336-051; e l’Università dell’Illinois presso i fondi per le startup di Chicago. Inoltre, ringraziamo i seguenti collaboratori: Dr. Amanda Bulman per l’assistenza con i parametri di acquisizione delle proteine MALDI-TOF MS; Dr. Terry Moore e Dr. Atul Jain per ricrystallizzare la matrice di acido alfa-ciano-4-idrossicininnamiche (CHCA).
Acetonitrile | Fisher | 60-002-65 | LC-MS Ultra CHROMASOLV |
Autoflex Speed LEF MALDI-TOF instrument | Bruker Daltonics | ||
Bruker Daltonics Bacterial test standard | Fisher | NC0884024 | Bruker Daltonics 8604530 |
Bruker Peptide Calibration standard | Fisher | NC9846988 | Bruker Daltonics 8206195 |
Formic Acid | Fisher Chemical | A117-50 | 99.5+%, Optima LC/MS Grade |
MALDI-TOF target Plate | Bruker Daltonics | ||
Methanol | Fisher Chemical | A456-500 | Optima LC/MS Grade |
Toothpicks | any is ok | ||
Trifluoroacetic acid | Fisher | AC293810010 | 99.5%, for biochemistry, ACROS Organics |
Water | VWR | 7732-18-5 | LC-MS |
α-Cyano-4-hydroxycinnamic acid | Sigma | 28166-41-8 | (C2020-25G) ≥98% (TLC), powder |