IDBac est un pipeline bioinformatique à base de spectrométrie de masse open source qui intègre des données provenant à la fois de protéines intactes et de spectres de métabolites spécialisés, recueillis sur des matériaux cellulaires extraits de colonies bactériennes. Le pipeline permet aux chercheurs d’organiser rapidement des centaines à des milliers de colonies bactériennes en groupes taxonomiques putatifs, et de les différencier davantage en fonction de la production spécialisée de métabolites.
Afin de visualiser la relation entre la phylogénie bactérienne et la production spécialisée de métabolites des colonies bactériennes poussant sur l’agar nutritif, nous avons développé IDBac-une desorption/ionisation laser à faible coût et à haut débit spectrométrie de masse en temps de vol (MALDI-TOF MS) pipeline bioinformatique. Le logiciel IDBac est conçu pour les non-experts, est disponible gratuitement, et capable d’analyser quelques à des milliers de colonies bactériennes. Ici, nous présentons des procédures pour la préparation des colonies bactériennes pour l’analyse mS MALDI-TOF, l’opération des instruments de SP, et le traitement et la visualisation des données dans IDBac. En particulier, nous instruisons les utilisateurs comment regrouper les bactéries en dendrogrammes à partir d’empreintes digitales protéiques de la SP et créons de manière interactive les réseaux d’associations de métabolites (MN) à partir de données spécialisées sur les métabolites.
Un obstacle majeur pour les chercheurs qui étudient la fonction bactérienne est la capacité d’évaluer rapidement et simultanément l’identité taxonomique d’un micro-organisme et sa capacité à produire des métabolites spécialisés. Cela a empêché des progrès significatifs dans la compréhension de la relation entre la phylogénie bactérienne et la production spécialisée de métabolites dans la majorité des bactéries isolées de l’environnement. Bien que les méthodes basées sur la SP qui utilisent des empreintes digitales protéiques pour regrouper et identifier les bactéries soient bien décrites1,2,3,4, ces études ont généralement été réalisées sur de petits groupes d’isolats, d’une manière spécifique à l’espèce. Fait important, l’information sur la production spécialisée de métabolites, un moteur majeur de la fonction microbienne dans l’environnement, n’a pas été incorporée dans ces études. Silva et coll.5 ont récemment fourni un historique complet détaillant la sous-utilisation de MALDI-TOF MS pour analyser les métabolites spécialisés et la pénurie de logiciels pour soulager les goulots d’étranglement actuels en bioinformatique. Afin de remédier à ces lacunes, nous avons créé IDBac, un pipeline bioinformatique qui intègre à la fois les modes linéaires et réfléchissants de MALDI-TOF MS6. Cela permet aux utilisateurs de visualiser et de différencier rapidement les isolats bactériens à partir de protéines et de métabolites spécialisés, respectivement, les empreintes digitales de la SP.
IDBac est rentable, à haut débit, et conçu pour l’utilisateur laïc. Il est disponible gratuitement (chasemc.github.io/IDBac), et ne nécessite l’accès qu’à un spectromètre de masse MALDI-TOF (le mode réflecteur sera nécessaire pour l’analyse spécialisée des métabolites). La préparation de l’échantillon repose sur la méthode simple de « transfert direct étendu »7,8 et les données sont recueillies avec des acquisitions linéaires et réfléchissantes consécutives sur un seul point MALDI-cible. Avec IDBac, il est possible d’analyser la phylogénie putative et la production spécialisée de métabolites de centaines de colonies en moins de quatre heures, y compris la préparation d’échantillons, l’acquisition de données et la visualisation des données. Ceci présente un avantage significatif de temps et de coût sur les méthodes traditionnelles d’identification des bactéries (telles que le séquençage de gène), et d’analyse de la sortie métabolique (spectrométrie de masse de chromatographie liquide [LCMS] et méthodes chromatographiques semblables).
À l’aide de données obtenues dans le cadre d’une analyse linéaire en mode, IDBac utilise un clusterhiérarchique pour représenter la parenté des spectres protéiques. Étant donné que les spectres représentent principalement des protéines ribosomal ionisées, ils fournissent une représentation de la diversité phylogénétique présente dans un échantillon. En outre, IDBac intègre des données en mode réflecteur pour afficher des empreintes digitales spécialisées métabolites sous forme de metabolite Association Networks (MANs). Les MAN sont des réseaux bipartites qui permettent une visualisation facile de la production de métabolites partagée et unique entre les isolats bactériens. La plate-forme IDBac permet aux chercheurs d’analyser à la fois les données protéiques et les métabolites spécialisés en tandem, mais aussi individuellement si un seul type de données est acquis. Fait important, IDBac traite les données brutes des instruments Bruker et Xiamen, ainsi que txt, onglet, csv, mzXML et mzML. Cela élimine le besoin de conversion manuelle et de mise en forme des ensembles de données, et réduit considérablement le risque d’erreur de l’utilisateur ou de mauvaise manipulation des données De SP.
Le protocole IDBac détaille l’acquisition et l’analyse de données de métabolites spécialisés de jusqu’à 384 isolats bactériens en 4 h par un seul chercheur. Avec IDBac il n’est pas nécessaire d’extraire l’ADN des isolats bactériens ou de générer des extraits spécialisés de métabolites à partir de bouillons de fermentation liquide et de les analyser à l’aide de méthodes chromatographiques. Au lieu de cela, les données de protéine et de métabolite spécialisés sont rassemblées en répandant simplement le matériel des colonies bactériennes directement sur une plaque cible de MALDI. Cela réduit considérablement le temps et le coût associés à des techniques alternatives telles que le séquençage du gène 16S rRNA et LCMS9.
Il est important d’ajouter une matrice vierge et des taches d’étalonnage à la plaque MALDI, et nous recommandons d’utiliser un nombre approprié de répliques pour assurer la reproductibilité et la confiance statistique. Le nombre de répliques dépendra de l’expérience. Par exemple, si un utilisateur a l’intention de différencier des milliers de colonies d’une collection de plaques de diversité environnementale, moins de répliques peuvent être nécessaires (notre laboratoire recueille trois répliques techniques par colonie). Alternativement, si un utilisateur souhaite créer une base de données personnalisée de souches de taxons bactériens spécifiques pour déterminer rapidement les classifications sous-espèces d’isolats inconnus, alors d’autres répliques sont appropriées (notre laboratoire recueille huit répliques biologiques par souche).
IDBac est un outil permettant de différencier rapidement les isolats bactériens hautement liés à partir d’informations taxonomiques présumées et de la production spécialisée de métabolites. Il peut compléter ou servir de précurseur à des méthodes orthogonales telles que des analyses génétiques approfondies, des études impliquant la production et la fonction des métabolites, ou la caractérisation de la structure spécialisée des métabolites par spectroscopie par résonance magnétique nucléaire et/ou LC-MS/MS.
La production spécialisée de métabolites (IDBac MANs) est très sensible aux conditions de croissance bactérienne, en particulier en utilisant différents médias, ce qui est une limitation potentielle de la méthode. Toutefois, ces traits peuvent être exploités par l’utilisateur, car IDBac peut facilement générer des NMA montrant les différences dans la production spécialisée de métabolites dans une variété de conditions de croissance. Il est important de noter que même si les empreintes digitales spécialisées des métabolites peuvent varier selon l’état de croissance, nous avons déjà montré que les empreintes digitales protéiques demeurent relativement stables entre ces variables (voir Clark et coll.6). Lorsqu’il s’agit de plaques de diversité environnementale, nous recommandons de purifier les isolats bactériens avant l’analyse afin de réduire les contributions possibles des cross-talk bactériens voisins.
Enfin, l’absence d’une base de données publique consultable sur les empreintes digitales protéiques de la SP est une lacune majeure dans l’utilisation de cette méthode pour classer les bactéries environnementales inconnues. Nous avons créé IDBac dans cet esprit, et inclus la conversion automatisée des données dans un format open-source accepté par la communauté (mzML)10,11,12 et conçu le logiciel pour permettre la recherche, le partage et la création de bases de données personnalisées. Nous sommes en train de créer une grande base de données publique (10 000 souches entièrement caractérisées), qui permettra la classification de certains isolats au niveau de l’espèce, y compris des liens vers les numéros d’adhésion de GenBank lorsqu’ils seront disponibles.
IDBac est open source et le code est disponible pour tout le monde pour personnaliser leurs besoins d’analyse de données et de visualisation. Nous recommandons aux utilisateurs de consulter un vaste corpus de littérature (Sauer et al.7, Silva et coll.5) pour les aider à soutenir et à concevoir leurs objectifs expérimentaux. Nous organisons un forum de discussion à: https://groups.google.com/forum/#!forum/idbac et un moyen de signaler les problèmes avec le logiciel à: https://github.com/chasemc/IDBacApp/issues.
The authors have nothing to disclose.
Ce travail a été soutenu par national Institute of General Medical Sciences Grant R01 GM125943, National Geographic Grant CP-044R-17; Subvention du Fonds islandais de recherche 152336-051; et l’Université de l’Illinois à Chicago fonds de démarrage. De plus, nous remercions les contributeurs suivants : Dr Amanda Bulman pour son aide aux paramètres d’acquisition de protéines MALDI-TOF MS; Dr Terry Moore et Dr Atul Jain pour recrystallizing alpha-cyano-4-hydroxycinnamic acid matrix (CHCA).
Acetonitrile | Fisher | 60-002-65 | LC-MS Ultra CHROMASOLV |
Autoflex Speed LEF MALDI-TOF instrument | Bruker Daltonics | ||
Bruker Daltonics Bacterial test standard | Fisher | NC0884024 | Bruker Daltonics 8604530 |
Bruker Peptide Calibration standard | Fisher | NC9846988 | Bruker Daltonics 8206195 |
Formic Acid | Fisher Chemical | A117-50 | 99.5+%, Optima LC/MS Grade |
MALDI-TOF target Plate | Bruker Daltonics | ||
Methanol | Fisher Chemical | A456-500 | Optima LC/MS Grade |
Toothpicks | any is ok | ||
Trifluoroacetic acid | Fisher | AC293810010 | 99.5%, for biochemistry, ACROS Organics |
Water | VWR | 7732-18-5 | LC-MS |
α-Cyano-4-hydroxycinnamic acid | Sigma | 28166-41-8 | (C2020-25G) ≥98% (TLC), powder |