Die offene Suche ermöglicht die Identifizierung von Glykopeptiden, die mit bisher unbekannten Glykanzusammensetzungen verziert sind. In diesem Artikel wird ein optimierter Ansatz für die Durchführung einer offenen Suche und anschließende Glykan-fokussierte Glykopeptidsuche für Bakterienproben unter Verwendung von Acinetobacter baumannii als Modell vorgestellt.
Die Proteinglykosylierung wird zunehmend als häufige Modifikation in bakteriellen Organismen anerkannt, die zur prokaryotischen Physiologie und optimalen Infektiosität pathogener Spezies beiträgt. Aus diesem Grund steigt das Interesse an der Charakterisierung der bakteriellen Glykosylierung und der Bedarf an Hochdurchsatz-Analysewerkzeugen zur Identifizierung dieser Ereignisse. Obwohl die Bottom-up-Proteomik leicht die Generierung reichhaltiger Glykopeptiddaten ermöglicht, machen die Breite und Vielfalt der in prokaryotischen Spezies beobachteten Glykane die Identifizierung bakterieller Glykosylierungsereignisse äußerst schwierig.
Traditionell machte die manuelle Bestimmung von Glykanzusammensetzungen in bakteriellen Proteomdatensätzen dies zu einer weitgehend maßgeschneiderten Analyse, die auf feldspezifische Experten beschränkt war. In jüngster Zeit haben sich offene suchbasierte Ansätze als leistungsfähige Alternative zur Identifizierung unbekannter Modifikationen herauskristallisiert. Durch die Analyse der Häufigkeit einzigartiger Modifikationen, die an Peptidsequenzen beobachtet wurden, ermöglichen offene Suchtechniken die Identifizierung von gewöhnlichen Glykanen, die an Peptide in komplexen Proben gebunden sind. Dieser Artikel stellt einen optimierten Workflow für die Interpretation und Analyse von glykoproteomischen Daten vor und zeigt, wie offene Suchtechniken verwendet werden können, um bakterielle Glykopeptide ohne Vorkenntnisse der Glykanzusammensetzungen zu identifizieren.
Mit diesem Ansatz können Glykopeptide in Proben schnell identifiziert werden, um Glykosylierungsunterschiede zu verstehen. Am Beispiel von Acinetobacter baumannii ermöglichen diese Ansätze den Vergleich von Glykanzusammensetzungen zwischen Stämmen und die Identifizierung neuartiger Glykoproteine. Zusammengenommen demonstriert diese Arbeit die Vielseitigkeit offener Datenbanksuchtechniken zur Identifizierung der bakteriellen Glykosylierung, wodurch die Charakterisierung dieser sehr unterschiedlichen Glykoproteome einfacher als je zuvor ist.
Die Proteinglykosylierung, der Prozess der Bindung von Kohlenhydraten an Proteinmoleküle, ist eine der häufigsten posttranslationalen Modifikationen (PTMs) in der Natur 1,2. In allen Bereichen des Lebens hat sich eine Reihe komplexer Maschinen entwickelt, die sich der Erzeugung von Glykoproteinen widmen, die eine Vielzahl von zellulären Funktionen beeinflussen 1,3,4,5. Während die Proteinglykosylierung auf einer Reihe von Aminosäuren6,7 auftritt, sind N-verknüpfte und O-verknüpfte Glykosylierungsereignisse zwei dominante Formen, die in der Natur beobachtet werden. Bei der N-verknüpften Glykosylierung werden Glykane an ein Stickstoffatom von Asparaginresten (Asn) gebunden, während bei der O-verknüpften Glykosylierung Glykane an ein Sauerstoffatom aus Serin (Ser), Threonin (Thr) oder Tyrosin (Tyr) -Rückständengebunden sind 7. Trotz der Ähnlichkeiten in den Rückständen, auf die Glykosylierungssysteme abzielen, führen die Unterschiede innerhalb der an Proteine gebundenen Glykane dazu, dass die Glykosylierung die chemisch vielfältigste Klasse von PTMs ist, die in der Natur vorkommen.
Während eukaryotische Glykosylierungssysteme eine Glykandiversität besitzen, sind diese Systeme typischerweise in der Anzahl der verwendeten einzigartigen Kohlenhydrate begrenzt. Die resultierende Vielfalt ergibt sich aus der Art und Weise, wie diese Kohlenhydrate in Glykanen 8,9,10,11,12 angeordnet sind. Im Gegensatz dazu besitzen bakterielle und archaeale Arten aufgrund der schieren Auswahl an einzigartigen Zuckern, die in diesen Systemen erzeugt werden, eine praktisch unbegrenzte Glykanvielfalt 2,10,13,14,15,16,17. Diese Unterschiede in der Glykandiversität, die über Lebensbereiche hinweg beobachtet werden, stellen eine bedeutende analytische Herausforderung für die Charakterisierung und Identifizierung von Glykosylierungsereignissen dar. Für die eukaryotische Glykosylierung hat die Fähigkeit, Glykanzusammensetzungen zu antizipieren, das wachsende Interesse an der Glykobiologie erleichtert; Gleiches gilt jedoch nicht für die bakterielle Glykosylierung, die immer noch weitgehend auf die Untersuchung durch spezialisierte Labors beschränkt ist. Da die Zugänglichkeit von Instrumenten der Massenspektrometrie (MS) in den Biowissenschaften zugenommen hat, sind MS-basierte Ansätze heute die primäre Methode für die glykoproteomische Analyse.
MS hat sich als das wichtigste Werkzeug für die Charakterisierung der Glykosylierung herausgestellt, wobei sowohl Top-down- als auch Bottom-up-Ansätze heute häufig zur Charakterisierung von Glykoproteinenverwendet werden 6. Während Top-down-Proteomik verwendet wird, um globale Glykosylierungsmuster spezifischer Proteine18,19 zu bewerten, werden Bottom-up-Ansätze verwendet, um die glykanspezifische Charakterisierung von Glykopeptiden zu ermöglichen, selbst aus komplexen Mischungen6,20,21,22,23. Für die Analyse von Glykopeptiden ist die Generierung von informativen Fragmentierungsinformationen für die Charakterisierung von Glykosylierungsereignissenessentiell 24,25. Eine Reihe von Fragmentierungsansätzen ist jetzt routinemäßig auf Instrumenten zugänglich, darunter die auf Resonanzionenfallen basierende kollisionsinduzierte Dissoziation (IT-CID), die kollisionsinduzierte Dissoziation vom Strahltyp (CID) und die Elektronentransferdissoziation (ETD). Jeder Ansatz besitzt unterschiedliche Stärken und Schwächen für die Glykopeptidanalyse 25,26, mit signifikanten Fortschritten in den letzten zehn Jahren bei der Anwendung dieser Fragmentierungsansätze zur Analyse der Glykosylierung 6,20. Für die bakterielle Glykosylierungsanalyse war die entscheidende Einschränkung jedoch nicht die Fähigkeit, Glykopeptide zu fragmentieren, sondern die Unfähigkeit, die potenziellen Glykanzusammensetzungen in Proben vorherzusagen. Innerhalb dieser Systeme schränkt die unbekannte Natur verschiedener bakterieller Glykane die Identifizierung von Glykopeptiden ein, selbst mit Glykosylierungs-fokussierten Suchwerkzeugen, die heute für die Analyse eukaryotischer Glykopeptide wie O-Pair27, GlycopeptideGraphMS 28 und GlycReSoft29 üblich sind. Um dieses Problem zu lösen, ist eine alternative Suchmethode erforderlich, wobei sich der Einsatz offener Suchwerkzeuge als leistungsfähiger Ansatz für die Untersuchung der bakteriellen Glykosylierungherausstellt 30.
Die offene Suche, auch Blind- oder Wildcard-Suche genannt, ermöglicht die Identifizierung von Peptiden mit unbekannten oder unerwarteten PTMs 21,30,31,32. Offene Suchen verwenden eine Vielzahl von Berechnungstechniken, einschließlich kuratierter Modifikationssuchen, mehrstufiger Datenbanksuchen oder massentoleranter Suche 33,34,35,36,37. Obwohl die offene Suche ein großes Potenzial hat, wurde ihre Verwendung typischerweise durch die signifikante Zunahme der Analysezeiten und den Verlust der Empfindlichkeit des Nachweises von unmodifizierten Peptiden im Vergleich zu eingeschränkten Suchenbehindert 31,32. Die Abnahme des Nachweises von unmodifizierten Peptid-Spektral-Matches (PSMs) ist ein Ergebnis der erhöhten falsch-positiven PSM-Raten, die mit diesen Techniken verbunden sind, was eine erhöhte strenge Filterung erfordert, um die gewünschten Falscherkennungsraten (FDRs) aufrechtzuerhalten 33,34,35,36,37 . In letzter Zeit sind mehrere Tools verfügbar, die die Zugänglichkeit der offenen Suche erheblich verbessern, darunter Byonic 31,38, Open-pFind 39, ANN-SoLo 40 und MSFragger21,41. Diese Werkzeuge ermöglichen die robuste Identifizierung von Glykosylierungsereignissen, indem sie die Analysezeiten erheblich reduzieren und Ansätze zur Handhabung heterogener Glykanzusammensetzungen implementieren.
Dieser Artikel stellt eine optimierte Methode zur Identifizierung bakterieller Glykopeptide durch offene Suche am Beispiel des gramnegativen nosokomialen Erregers Acinetobacter baumannii vor. A. baumannii besitzt ein konserviertes O-verknüpftes Glykosylierungssystem, das für die Modifikation mehrerer Proteinsubstrate verantwortlich ist, bekannt als das PglL-Proteinglykosylierungssystem42,43,44. Während ähnliche Proteine auf die Glykosylierung zwischen Stämmen abzielen, ist das PglL-Glykosylierungssystem aufgrund der Biosynthese des Glykans, das für die Proteinglykosylierung verwendet wird, sehr variabel, da es vom Kapselort (bekannt als K-Locus) abgeleitet ist44,45,46. Dies führt dazu, dass verschiedene Glykane (auch bekannt als K-Einheit), die aus einzelnen oder begrenzten polymerisierten K-Einheiten abgeleitet sind, zu Proteinsubstraten 30,44,46 hinzugefügt werden. Innerhalb dieser Arbeit wird die Verwendung des offenen Suchwerkzeugs MSfragger innerhalb der Software FragPipe verwendet, um Glykane über A. baumannii-Stämme zu identifizieren. Durch die Kombination von offener Suche und manueller Kuration können “glykanfokussierte Suchen” durchgeführt werden, um die Identifizierung bakterieller Glykopeptide weiter zu verbessern. Zusammen ermöglicht dieser mehrstufige Identifikationsansatz die Identifizierung von Glykopeptiden ohne umfangreiche Erfahrung in der Charakterisierung neuartiger Glykosylierungsereignisse.
Open Search ist eine effektive und systematische Methode zur Identifizierung unbekannter Modifikationen. Während die Identifizierung unbekannter Glykane in bakteriellen Proteomproben traditionell ein zeitaufwendiges und technisch spezialisiertes Unterfangen war, ermöglichen die jüngsten Entwicklungen von Werkzeugen wie MSfragger 21,41 und Byonic 31,38 nun die schnelle und effektive Identifizierung von Deltamassen zur weiteren Charakterisierung als potenzielle Glykane<sup…
The authors have nothing to disclose.
N.E.S wird durch ein Australian Research Council Future Fellowship (FT200100270) und ein ARC Discovery Project Grant (DP210100362) unterstützt. Wir danken der Melbourne Mass Spectrometry and Proteomics Facility des Bio21 Molecular Science and Biotechnology Institute für den Zugang zu MS-Instrumenten.
14 G Kel-F Hub point style 3 | Hamilton company | hanc90514 | |
2-Chloroacetamide | Sigma Aldrich Pty Ltd | C0267-100G | |
Acetonitrile | Sigma Aldrich Pty Ltd | 34851-4L | |
Ammonium hydroxide (28%) | Sigma Aldrich Pty Ltd | 338818-100ML | |
BCA Protein Assay Reagent A | Pierce | 23228 | |
BCA Protein Assay Reagent B | Pierce | 23224 | |
C8 Empore SPE | Sigma Aldrich Pty Ltd | 66882-U | An alterative vendor for C8 material is Affinisep (https://www.affinisep.com/about-us/) |
Formic acid | Sigma Aldrich Pty Ltd | 5.33002 | |
Isopropanol | Sigma Aldrich Pty Ltd | 650447-2.5L | |
Methanol | Fisher Chemical | M/4058/17 | |
SDB-RPS Empore SPE (Reversed-Phase Sulfonate) | Sigma Aldrich Pty Ltd | 66886-U | An alterative vendor for SDB-RPS is Affinisep (https://www.affinisep.com/about-us/) |
Sodium Deoxycholate | Sigma Aldrich Pty Ltd | D6750-100G | |
ThermoMixer C | Eppendorf | 2232000083 | |
trifluoroacetic acid | Sigma Aldrich Pty Ltd | 302031-10X1ML | |
Tris 2-carboxyethyl phosphine hydrochloride | Sigma Aldrich Pty Ltd | C4706-2G | |
Tris(hydroxymethyl)aminomethane | Sigma Aldrich Pty Ltd | 252859-500G | |
Trypsin/Lys-C protease mixture | Promega | V5073 | |
Vacuum concentrator | Labconco | 7810040 | |
ZIC-HILIC material | Merck | 1504580001 | Resin for use in single use SPE columns can be obtain by emptying a larger form column and using the free resin |