IDBac ist eine Open-Source-Pipeline für Massenspektrometrie, die Daten sowohl aus intakten Proteinen als auch aus spezialisierten Metabolitenspektren integriert, die auf Zellmaterial gesammelt werden, das aus Bakterienkolonien abgekratzt wurde. Die Pipeline ermöglicht es Forschern, schnell Hunderte bis Tausende von Bakterienkolonien in vermeintliche taxonomische Gruppen zu organisieren und sie auf der Grundlage der spezialisierten Metabolitenproduktion weiter zu differenzieren.
Um die Beziehung zwischen bakterieller Phylogenie und spezialisierter Metabolitenproduktion von Bakterienkolonien, die auf Nährstoffagar wachsen, zu visualisieren, haben wir IDBac entwickelt – eine kostengünstige und hochdurchsatzbasierte Matrix-unterstützte Laserdesorption/Ionisierung. Zeit-des-Flug-Massenspektrometrie (MALDI-TOF MS) Bioinformatik-Pipeline. IDBac Software ist für Nicht-Experten entwickelt, ist frei verfügbar, und in der Lage, ein paar bis Tausende von Bakterienkolonien zu analysieren. Hier stellen wir Verfahren zur Vorbereitung von Bakterienkolonien für die MALDI-TOF MS-Analyse, MS-Instrumentenbedienung sowie Datenverarbeitung und Visualisierung in IDBac vor. Insbesondere weisen wir Anwender an, Bakterien auf Basis von Protein-MS-Fingerabdrücken in Dendrogramme zu gruppieren und interaktiv Metabolite Association Networks (MANs) aus spezialisierten Metabolitendaten zu erstellen.
Ein großes Hindernis für Forscher, die die bakterielle Funktion untersuchen, ist die Fähigkeit, schnell und gleichzeitig die taxonomische Identität eines Mikroorganismus und seine Fähigkeit zur Herstellung spezialisierter Metaboliten zu bewerten. Dies hat signifikante Fortschritte beim Verständnis der Beziehung zwischen bakterieller Phylogenie und spezialisierter Metabolitenproduktion in der Mehrheit der aus der Umwelt isolierten Bakterien verhindert. Obwohl MS-basierte Methoden, die Protein-Fingerabdrücke verwenden, um Bakterien zu gruppieren und zu identifizieren, gut beschrieben sind1,2,3,4, wurden diese Studien im Allgemeinen an kleinen Gruppen von Isolaten durchgeführt, artspezifisch. Wichtig ist, dass Informationen über die spezialisierte Metabolitenproduktion, ein wichtiger Treiber der mikrobiellen Funktion in der Umwelt, in diesen Studien nicht berücksichtigt wurden. Silva et al.5 lieferten vor kurzem eine umfassende Geschichte, die die Unternutzung von MALDI-TOF MS zur Analyse spezialisierter Metaboliten und den Mangel an Software zur Linderung aktueller Bioinformatik-Engpässe detailliert darlegte. Um diese Mängel zu beheben, haben wir IDBac geschaffen, eine Bioinformatik-Pipeline, die sowohl lineare als auch reflekronische Modi von MALDI-TOF MS6integriert. Dies ermöglicht es Benutzern, bakterielle Isolate schnell zu visualisieren und zu unterscheiden, die sowohl auf Protein- als auch auf spezialisierten Metaboliten-MS-Fingerabdrücken basieren.
IDBac ist kostengünstig, mit hohem Durchsatz und für den Laienbenutzer konzipiert. Es ist frei verfügbar (chasemc.github.io/IDBac) und erfordert nur Zugriff auf ein MALDI-TOF-Massenspektrometer (für die spezielle Metabolitenanalyse ist ein Reflekronmodus erforderlich). Die Probenvorbereitung basiert auf der einfachen Methode der “erweiterten direkten Übertragung”7,8 und die Daten werden mit aufeinanderfolgenden linearen und reflekronischen Erfassungen an einem einzigen MALDI-Zielpunkt gesammelt. Mit IDBac ist es möglich, die vermeintliche Phylogenie und spezialisierte Metabolitenproduktion von Hunderten von Kolonien in weniger als vier Stunden zu analysieren, einschließlich Probenvorbereitung, Datenerfassung und Datenvisualisierung. Dies stellt einen erheblichen Zeit- und Kostenvorteil gegenüber herkömmlichen Methoden zur Identifizierung von Bakterien (z. B. Gensequenzierung) und zur Analyse des metabolischen Outputs (Flüssigchromatographie-Massenspektrometrie [LCMS] und ähnliche chromatographische Methoden) dar.
Mithilfe von Daten, die in der Linearmodusanalyse gewonnen wurden, verwendet IDBac hierarchisches Clustering, um die Verwandtheit von Proteinspektren darzustellen. Da die Spektren meist ionisierte ribosomale Proteine darstellen, bieten sie eine Darstellung der phylogenetischen Vielfalt, die in einer Probe vorhanden ist. Darüber hinaus enthält IDBac Daten im Reflectron-Modus, um spezielle Metaboliten-Fingerabdrücke als Metabolit-Assoziationsnetzwerke (MANs) anzuzeigen. MANs sind zweiteilige Netzwerke, die eine einfache Visualisierung der gemeinsamen und einzigartigen Metabolitenproduktion zwischen bakteriellen Isolaten ermöglichen. Die IDBac-Plattform ermöglicht es Forschern, sowohl Protein- als auch spezialisierte Metabolitendaten im Tandem, aber auch einzeln zu analysieren, wenn nur ein Datentyp erfasst wird. Wichtig ist, dass IDBac Rohdaten von Bruker- und Xiamen-Instrumenten sowie txt, tab, csv, mzXML und mzML verarbeitet. Dadurch entfällt die manuelle Konvertierung und Formatierung von Datensätzen und das Risiko von Benutzerfehlern oder falscher Verarbeitung von MS-Daten wird erheblich reduziert.
Das IDBac-Protokoll beschreibt die Erfassung und Analyse von bis zu 384 bakteriellen Isolaten in 4 h durch einen einzigen Forscher. Mit IDBac ist es nicht notwendig, DNA aus bakteriellen Isolaten zu extrahieren oder spezielle Metabolitenextrakte aus flüssigen Fermentationsbrühen zu erzeugen und sie mit chromatographischen Methoden zu analysieren. Stattdessen werden Protein- und spezialisierte Metabolitendaten gesammelt, indem Material aus Bakterienkolonien einfach direkt auf eine MALDI-Zielplatte verteilt wird. Dies reduziert den Zeit- und Kostenaufwand für alternative Techniken wie 16S rRNA-Gensequenzierung und LCMS9erheblich.
Es ist wichtig, der MALDI-Platte einen Matrixrohling und Kalibrierflecken hinzuzufügen, und wir empfehlen die Verwendung einer geeigneten Anzahl von Replikationen, um Reproduzierbarkeit und statistisches Vertrauen zu gewährleisten. Die Anzahl der Replikationen ist experimentabhängig. Wenn ein Benutzer beispielsweise beabsichtigt, Tausende von Kolonien von einer Sammlung von Umweltdiversitätsplatten zu unterscheiden, können weniger Replikationen erforderlich sein (unser Labor sammelt drei technische Replikationen pro Kolonie). Wenn ein Benutzer eine benutzerdefinierte Datenbank mit Stämmen aus bestimmten bakteriellen Taxa erstellen möchte, um schnell Unterartenklassifikationen unbekannter Isolate zu bestimmen, dann sind weitere Replikationen angebracht (unser Labor sammelt acht biologische Replikationen pro Dehnung).
IDBac ist ein Werkzeug zur schnellen Differenzierung hochverwandter bakterienisolate auf der Grundlage vermeintlicher taxonomischer Informationen und spezialisierter Metabolitenproduktion. Es kann orthogonale Methoden wie eingehende genetische Analysen, Studien mit Metabolitenproduktion und -funktion oder die Charakterisierung der spezialisierten Metabolitenstruktur durch Kernspinresonanzspektroskopie und/oder LC-MS/MS.
Die spezialisierte Metabolitenproduktion (IDBac MANs) ist sehr anfällig für bakterielle Wachstumsbedingungen, insbesondere mit verschiedenen Medien, was eine potenzielle Einschränkung der Methode darstellt. Diese Eigenschaften können jedoch vom Benutzer ausgenutzt werden, da IDBac leicht MANs erzeugen kann, die die Unterschiede in der spezialisierten Metabolitenproduktion unter einer Vielzahl von Wachstumsbedingungen zeigen. Es ist wichtig zu beachten, dass zwar spezialisierte Metaboliten-Fingerabdrücke je nach Wachstumsbedingung variieren können, wir aber zuvor gezeigt haben, dass Protein-Fingerabdrücke über diese Variablen hinweg relativ stabil bleiben (siehe Clark et al.6). Im Umgang mit Umweltdiversitätsplatten empfehlen wir, bakterielle Isolate vor der Analyse zu reinigen, um mögliche Beiträge aus benachbarten bakteriellen Quergesprächen zu reduzieren.
Schließlich ist das Fehlen einer durchsuchbaren öffentlichen Datenbank mit Protein-MS-Fingerabdrücken ein großes Manko bei der Verwendung dieser Methode zur Klassifizierung unbekannter Umweltbakterien. Wir haben IDBac in diesem Sinne erstellt und die automatisierte Konvertierung von Daten in ein von der Community akzeptiertes Open-Source-Format (mzML)10,11,12 integriert und die Software so konzipiert, dass das Suchen, Teilen und Erstellen von benutzerdefinierte Datenbanken. Wir sind dabei, eine große öffentliche Datenbank (>10.000 voll charakterisierte Stämme) zu erstellen, die die Klassifizierung einiger Isolate auf Artenebene ermöglicht, einschließlich Links zu GenBank-Beitrittsnummern, wenn verfügbar.
IDBac ist Open Source und der Code ist für jedermann verfügbar, um seine Datenanalyse- und Visualisierungsanforderungen anzupassen. Wir empfehlen den Benutzern, eine umfangreiche Literatur (Sauer et al.7, Silva et al.5) zu konsultieren, um ihre experimentellen Ziele zu unterstützen und zu entwerfen. Wir veranstalten ein Diskussionsforum unter: https://groups.google.com/forum/#!forum/idbac und eine Möglichkeit, Probleme mit der Software zu melden unter: https://github.com/chasemc/IDBacApp/issues.
The authors have nothing to disclose.
Diese Arbeit wurde vom National Institute of General Medical Sciences Grant R01 GM125943, National Geographic Grant CP-044R-17 unterstützt; Zuschuss des isländischen Forschungsfonds 152336-051; und University of Illinois at Chicago Startup Funds. Außerdem danken wir den folgenden Mitwirkenden: Dr. Amanda Bulman für die Unterstützung bei den Parametern für den Erwerb von MALDI-TOF MS-Proteinen; Dr. Terry Moore und Dr. Atul Jain zur Rekristallisation von Alpha-Cyano-4-Hydroxycinnamic acid matrix (CHCA).
Acetonitrile | Fisher | 60-002-65 | LC-MS Ultra CHROMASOLV |
Autoflex Speed LEF MALDI-TOF instrument | Bruker Daltonics | ||
Bruker Daltonics Bacterial test standard | Fisher | NC0884024 | Bruker Daltonics 8604530 |
Bruker Peptide Calibration standard | Fisher | NC9846988 | Bruker Daltonics 8206195 |
Formic Acid | Fisher Chemical | A117-50 | 99.5+%, Optima LC/MS Grade |
MALDI-TOF target Plate | Bruker Daltonics | ||
Methanol | Fisher Chemical | A456-500 | Optima LC/MS Grade |
Toothpicks | any is ok | ||
Trifluoroacetic acid | Fisher | AC293810010 | 99.5%, for biochemistry, ACROS Organics |
Water | VWR | 7732-18-5 | LC-MS |
α-Cyano-4-hydroxycinnamic acid | Sigma | 28166-41-8 | (C2020-25G) ≥98% (TLC), powder |