IDBac is een open-source massaspectrometrie gebaseerde bioinformatica pijpleiding die gegevens van zowel intact eiwit en gespecialiseerde metaboliet spectra, verzameld op celmateriaal geschuurd uit bacteriële kolonies integreert. De pijpleiding stelt onderzoekers in staat om snel honderden tot duizenden bacteriële kolonies in putatieve taxonomische groepen te organiseren en ze verder te differentiëren op basis van gespecialiseerde metaboliet productie.
Om de relatie te visualiseren tussen bacteriële fylogenie en gespecialiseerde metaboliet productie van bacteriële kolonies die groeien op nutriënt agar, ontwikkelden we IDBac-een low-cost en high-throughput matrix-geassisteerde Laser desorptie/ionisatie time-of-flight massaspectrometrie (MALDI-TOF MS) bioinformatica pijpleiding. IDBac software is ontworpen voor niet-experts, is vrij beschikbaar, en in staat om een paar te analyseren om duizenden bacteriële kolonies. Hier presenteren we procedures voor de bereiding van bacteriële kolonies voor MALDI-TOF MS-analyse, MS-instrument bediening en gegevensverwerking en visualisatie in IDBac. In het bijzonder, we instrueren gebruikers hoe te cluster bacteriën in dendrogrammen op basis van eiwit MS vingerafdrukken en interactief maken metaboliet Association Networks (MANs) van gespecialiseerde metaboliet gegevens.
Een belangrijke barrière voor onderzoekers die bacteriële functie bestuderen, is de mogelijkheid om de taxonomische identiteit van een micro-organisme snel en gelijktijdig te beoordelen en zijn capaciteit om gespecialiseerde metabolieten te produceren. Dit heeft aanzienlijke vooruitgang in het begrijpen van de relatie tussen bacteriële fylogenie en gespecialiseerde metaboliet productie in de meeste bacteriën geïsoleerd uit de omgeving voorkomen. Hoewel MS-gebaseerde methoden die eiwit-vingerafdrukken gebruiken om bacteriën te groeperen en te identificeren, goed worden beschreven1,2,3,4, zijn deze studies over het algemeen uitgevoerd op kleine groepen isolaten, op soortspecifieke wijze. Belangrijk is dat informatie over gespecialiseerde metaboliet productie, een belangrijke driver van microbiële functie in het milieu, in deze studies is gebleven. Silva et al.5 heeft onlangs een uitgebreide geschiedenis gegeven waarin het ondergebruik van MALDI-TOF MS gedetailleerd wordt uitgelegd om gespecialiseerde metabolieten en het tekort aan software te analyseren om de huidige knelpunten in de bioinformatica te verlichten. Om deze tekortkomingen aan te pakken, creëerden we IDBac, een bioinformatica-pijpleiding die zowel lineaire als reflectieve modi van MALDI-TOF MS6integreert. Dit stelt gebruikers in staat om snel te visualiseren en differentiëren bacteriële isolaten op basis van zowel eiwit en gespecialiseerde metaboliet MS vingerafdrukken, respectievelijk.
IDBac is kosteneffectief, hoge doorvoer en ontworpen voor de leken gebruiker. Het is vrij beschikbaar (chasemc.github.io/IDBac), en vereist alleen toegang tot een MALDI-TOF massaspectrometer (reflectron-modus zal nodig zijn voor gespecialiseerde metaboliet analyse). Monstervoorbereiding berust op de eenvoudige “Extended direct Transfer” methode7,8 en gegevens worden verzameld met opeenvolgende lineaire en reflectron overnames op een enkele MALDI-target plek. Met IDBAC is het mogelijk om de vermoedelijke fylogenie en gespecialiseerde metaboliet productie van honderden kolonies in minder dan vier uur te analyseren, inclusief monstervoorbereiding, gegevensverzameling en gegevensvisualisatie. Dit biedt een aanzienlijk tijd-en kostenvoordeel ten opzichte van traditionele methoden voor het identificeren van bacteriën (zoals gensequencing) en het analyseren van metabole output (vloeistofchromatografie-massaspectrometrie [LCMS] en soortgelijke chromatografische methoden).
Met behulp van gegevens verkregen in lineaire modus analyse, maakt IDBAC gebruik van hiërarchische clustering om de verwantschap van eiwit Spectra weer te geven. Omdat de spectra meestal geïoniseerde ribosomale eiwitten vertegenwoordigen, bieden ze een representatie van de fylogenetische diversiteit in een monster. Daarnaast bevat IDBac reflectron-modus gegevens om gespecialiseerde metaboliet-vingerafdrukken als metaboliet Association Networks (MANs) weer te geven. MANs zijn bipartiete netwerken die het mogelijk maken voor een eenvoudige visualisatie van de gedeelde en unieke metaboliet productie tussen bacteriële isolaten. Het IDBac-platform stelt onderzoekers in staat om zowel eiwitten als gespecialiseerde metaboliet gegevens in tandem te analyseren, maar ook afzonderlijk als slechts één gegevenstype wordt verworven. Belangrijk is dat IDBac onbewerkte gegevens verwerkt van Bruker-en Xiamen-instrumenten, evenals txt, tab, CSV, mzXML en mzML. Dit elimineert de noodzaak voorhand matige conversie en opmaak van gegevenssets, en vermindert aanzienlijk het risico van gebruikers fouten of verkeerd gebruik van MS-gegevens.
De IDBac protocol Details bacteriële eiwitten en gespecialiseerde metaboliet data-acquisitie en analyse van maximaal 384 bacteriële isolaten in 4 h door een enkele onderzoeker. Met IDBac is het niet nodig om DNA uit bacteriële isolaten te halen of gespecialiseerde metaboliet extracten te genereren uit vloeibare fermentatie-Bouillon en ze te analyseren met behulp van chromatografische methoden. In plaats daarvan worden eiwit-en gespecialiseerde metaboliet gegevens verzameld door eenvoudigweg materiaal van bacteriële kolonies rechtstreeks op een doelplaat van MALDI te verspreiden. Dit vermindert aanzienlijk de tijd en kosten die gepaard gaan met alternatieve technieken zoals 16S rRNA gensequencing en LCMS9.
Het is belangrijk om een matrix leeg en kalibratie vlekken toevoegen aan de MALDI plaat, en we raden het gebruik van een passend aantal replicaten om te zorgen voor reproduceerbaarheid en statistisch vertrouwen. Het aantal replicaten is afhankelijk van het experiment. Als een gebruiker bijvoorbeeld duizenden kolonies wil onderscheiden van een verzameling milieudiversiteits platen, kunnen er minder replicaten nodig zijn (ons lab verzamelt drie technische replicaten per kolonie). Als alternatief, als een gebruiker wenst te maken van een aangepaste database van stammen van specifieke bacteriële taxa om snel te bepalen subspecies classificaties van onbekende isolaten, dan zijn meer replicaties geschikt (ons lab verzamelt acht biologische replicaten per stam).
IDBac is een hulpmiddel voor het snel differentiëren van hoog-gerelateerde bacteriële isolaten op basis van putatieve taxonomische informatie en gespecialiseerde metaboliet productie. Het kan een aanvulling zijn of dienen als een voorloper van orthogonale methoden zoals diepgaande genetische analyses, studies waarbij de productie en functie van de metaboliet betrokken is, of karakterisering van gespecialiseerde metaboliet structuur door nucleaire magnetische resonantie spectroscopie en/of LC-MS/MS.
Gespecialiseerde metaboliet productie (IDBac MANs) is zeer gevoelig voor bacteriële groeiomstandigheden, vooral met behulp van verschillende media, dat is een mogelijke beperking van de methode. Echter deze eigenschappen kunnen worden uitgebuit door de gebruiker, als IDBac kan gemakkelijk genereren van MANs tonen de verschillen in gespecialiseerde metaboliet productie onder een verscheidenheid van groei voorwaarden. Het is belangrijk op te merken dat terwijl gespecialiseerde metaboliet vingerafdrukken kunnen variëren door groei conditie, we hebben eerder aangetoond dat eiwit vingerafdrukken relatief stabiel over deze variabelen blijven (Zie Clark et al.6). Bij het omgaan met milieudiversiteits platen raden we aan vóór de analyse bacteriële isolaten te zuiveren om mogelijke bijdragen van naburige bacteriële cross-talk te verminderen.
Ten slotte is het ontbreken van een doorzoekbare publieke database van eiwit-MS-vingerafdrukken een belangrijke tekortkoming in het gebruik van deze methode om onbekende milieu bacteriën te classificeren. We creëerden IDBAC met dit in gedachten, en opgenomen geautomatiseerde conversie van gegevens in een community-geaccepteerde open-source Format (mzml)10,11,12 en ontwierp de software om het zoeken, delen en creëren van aangepaste databases. We zijn in het proces van het creëren van een grote openbare database (> 10000 volledig gekarakteriseerde stammen), die de indeling van sommige isolaten naar het soort niveau mogelijk maakt, inclusief links naar de toetredings nummers van GenBank indien beschikbaar.
IDBac is open source en de code is beschikbaar voor iedereen om hun gegevensanalyse en visualisatie behoeften aan te passen. We raden gebruikers aan om een uitgebreide reeks literatuur (Sauer et al.7, Silva et al.5) te raadplegen om hun experimentele doelen te helpen ondersteunen en ontwerpen. We hosten een forum voor discussie op: https://groups.Google.com/forum/#!forum/idbac en een manier om problemen met de software te rapporteren op: https://github.com/chasemc/IDBacApp/issues.
The authors have nothing to disclose.
Dit werk werd gesteund door het National Institute of General Medical Sciences Grant R01 GM125943, National Geographic Grant CP-044R-17; IJslandse onderzoeksfonds subsidie 152336-051; en University of Illinois bij Chicago Startup funds. Ook bedanken we de volgende bijdragers: Dr. Amanda Bulman voor hulp bij MALDI-TOF MS eiwit acquisitie parameters; Dr. Terry Moore en Dr. Atul Jain voor herkristalliszing alpha-cyano-4-hydroxycinnamic acid matrix (CHCA).
Acetonitrile | Fisher | 60-002-65 | LC-MS Ultra CHROMASOLV |
Autoflex Speed LEF MALDI-TOF instrument | Bruker Daltonics | ||
Bruker Daltonics Bacterial test standard | Fisher | NC0884024 | Bruker Daltonics 8604530 |
Bruker Peptide Calibration standard | Fisher | NC9846988 | Bruker Daltonics 8206195 |
Formic Acid | Fisher Chemical | A117-50 | 99.5+%, Optima LC/MS Grade |
MALDI-TOF target Plate | Bruker Daltonics | ||
Methanol | Fisher Chemical | A456-500 | Optima LC/MS Grade |
Toothpicks | any is ok | ||
Trifluoroacetic acid | Fisher | AC293810010 | 99.5%, for biochemistry, ACROS Organics |
Water | VWR | 7732-18-5 | LC-MS |
α-Cyano-4-hydroxycinnamic acid | Sigma | 28166-41-8 | (C2020-25G) ≥98% (TLC), powder |