Open zoeken maakt de identificatie van glycopeptiden versierd met voorheen onbekende glycaansamenstellingen mogelijk. In dit artikel wordt een gestroomlijnde aanpak voor het uitvoeren van open zoekopdrachten en daaropvolgende glycaangerichte glycopeptide-zoekopdrachten gepresenteerd voor bacteriële monsters met behulp van Acinetobacter baumannii als model.
Eiwitglycosylatie wordt steeds meer erkend als een veel voorkomende modificatie binnen bacteriële organismen, die bijdraagt aan prokaryote fysiologie en optimale infectiviteit van pathogene soorten. Hierdoor is er een toenemende interesse in het karakteriseren van bacteriële glycosylatie en een behoefte aan analytische hulpmiddelen met hoge doorvoer om deze gebeurtenissen te identificeren. Hoewel bottom-up proteomics gemakkelijk de generatie van rijke glycopeptidegegevens mogelijk maakt, maken de breedte en diversiteit van glycanen waargenomen in prokaryote soorten de identificatie van bacteriële glycosylatiegebeurtenissen uiterst uitdagend.
Traditioneel maakte de handmatige bepaling van glycaansamenstellingen in bacteriële proteomische datasets dit een grotendeels op maat gemaakte analyse die beperkt was tot veldspecifieke experts. Onlangs zijn op open zoeken gebaseerde benaderingen naar voren gekomen als een krachtig alternatief voor de identificatie van onbekende wijzigingen. Door de frequentie van unieke modificaties die op peptidesequenties worden waargenomen te analyseren, maken open zoektechnieken de identificatie mogelijk van gemeenschappelijke glycanen die aan peptiden zijn bevestigd in complexe monsters. Dit artikel presenteert een gestroomlijnde workflow voor de interpretatie en analyse van glycoproteomische gegevens, die aantoont hoe open zoektechnieken kunnen worden gebruikt om bacteriële glycopeptiden te identificeren zonder voorafgaande kennis van de glycaansamenstellingen.
Met behulp van deze aanpak kunnen glycopeptiden in monsters snel worden geïdentificeerd om glycosylatieverschillen te begrijpen. Met behulp van Acinetobacter baumannii als model, maken deze benaderingen de vergelijking van glycaansamenstellingen tussen stammen en de identificatie van nieuwe glycoproteïnen mogelijk. Alles bij elkaar toont dit werk de veelzijdigheid van open database-zoektechnieken voor de identificatie van bacteriële glycosylatie, waardoor de karakterisering van deze zeer diverse glycoproteïnen eenvoudiger dan ooit tevoren is.
Eiwitglycosylatie, het proces van het hechten van koolhydraten aan eiwitmoleculen, is een van de meest voorkomende posttranslationele modificaties (PTM’s) in de natuur 1,2. In alle domeinen van het leven is een reeks complexe machines geëvolueerd die zijn gewijd aan het genereren van glycoproteïnen die een groot aantal cellulaire functies beïnvloeden 1,3,4,5. Terwijl eiwitglycosylatie optreedt op een reeks aminozuren 6,7, zijn N-gebonden en O-gebonden glycosylatiegebeurtenissen twee dominante vormen die in de natuur worden waargenomen. N-gebonden glycosylering omvat de hechting van glycanen aan een stikstofatoom van asparagine (Asn) residuen, terwijl bij O-gebonden glycosylatie glycanen worden bevestigd aan een zuurstofatoom van serine (Ser), threonine (Thr) of tyrosine (Tyr) residuen7. Ondanks de overeenkomsten in residuen die het doelwit zijn van glycosylatiesystemen, resulteren de verschillen in de glycanen die aan eiwitten zijn gehecht, ertoe dat glycosylatie de meest chemisch diverse klasse ptm’s is die in de natuur wordt aangetroffen.
Hoewel eukaryote glycosylatiesystemen glycaandiversiteit bezitten, zijn deze systemen meestal beperkt in het aantal gebruikte unieke koolhydraten. De resulterende diversiteit komt voort uit hoe deze koolhydraten zijn gerangschikt in glycanen 8,9,10,11,12. Daarentegen bezitten bacteriële en archaeale soorten vrijwel onbeperkte glycaandiversiteit vanwege de enorme reeks unieke suikers die binnen deze systemen worden gegenereerd 2,10,13,14,15,16,17. Deze verschillen in de glycaandiversiteit waargenomen tussen domeinen van het leven vormen een belangrijke analytische uitdaging voor de karakterisering en identificatie van glycosylatiegebeurtenissen. Voor eukaryote glycosylatie heeft het vermogen om te anticiperen op glycaansamenstellingen de groeiende interesse in glycobiologie vergemakkelijkt; hetzelfde geldt echter niet voor bacteriële glycosylatie, die nog steeds grotendeels beperkt is tot studie door gespecialiseerde laboratoria. Naarmate de toegankelijkheid van massaspectrometrie (MS) instrumentatie in de biowetenschappen is toegenomen, zijn ms-gebaseerde benaderingen nu de primaire methode voor glycoproteomische analyse.
MS is naar voren gekomen als het ultieme hulpmiddel voor de karakterisering van glycosylatie, met zowel top-down als bottom-up benaderingen die nu vaak worden gebruikt om glycoproteïnen te karakteriseren6. Terwijl top-down proteomics wordt gebruikt om globale glycosylatiepatronen van specifieke eiwitten te beoordelen18,19, worden bottom-up benaderingen gebruikt om de glycaanspecifieke karakterisering van glycopeptiden mogelijk te maken, zelfs uit complexe mengsels 6,20,21,22,23. Voor de analyse van glycopeptiden is het genereren van informatieve fragmentatie-informatie essentieel voor de karakterisering van glycosylatiegebeurtenissen24,25. Een reeks fragmentatiebenaderingen is nu routinematig toegankelijk op instrumenten, waaronder resonantie-ionenval-gebaseerde collision-induced dissociation (IT-CID), beam-type collision-induced dissociation (CID) en electron transfer dissociation (ETD). Elke benadering heeft verschillende sterke en zwakke punten voor glycopeptide-analyse25,26, met aanzienlijke vooruitgang in het afgelopen decennium bij het toepassen van deze fragmentatiebenaderingen om glycosylatie te analyseren 6,20. Voor bacteriële glycosylatieanalyse was de kritische beperking echter niet het vermogen om glycopeptiden te fragmenteren, maar eerder het onvermogen om de potentiële glycaansamenstellingen in monsters te voorspellen. Binnen deze systemen beperkt de onbekende aard van diverse bacteriële glycanen de identificatie van glycopeptiden, zelfs met glycosylatiegerichte zoekhulpmiddelen die nu gemeengoed zijn voor de analyse van eukaryote glycopeptiden, zoals O-Pair27, GlycopeptideGraphMS28 en GlycReSoft29. Om dit probleem op te lossen, is een alternatieve zoekmethode vereist, waarbij het gebruik van open zoekhulpmiddelen naar voren komt als een krachtige benadering voor de studie van bacteriële glycosylatie30.
Open zoeken, ook bekend als blind of wildcard zoeken, maakt de identificatie van peptiden met onbekende of onverwachte PTM’s 21,30,31,32 mogelijk. Open zoekopdrachten maken gebruik van een verscheidenheid aan computationele technieken, waaronder samengestelde wijzigingszoekopdrachten, zoekopdrachten met meerdere stappendatabases of breed-massatolerant zoeken 33,34,35,36,37. Hoewel open zoeken een groot potentieel heeft, wordt het gebruik ervan meestal belemmerd door de aanzienlijke toename van analysetijden en verlies in gevoeligheid van de detectie van ongewijzigde peptiden in vergelijking met beperkte zoekopdrachten 31,32. De afname van de detectie van ongewijzigde peptide-spectrale matches (PSM’s) is een gevolg van de verhoogde fout-positieve PSM-snelheden geassocieerd met deze technieken, die een verhoogde strenge filtering vereisen om de gewenste false discovery rates (FDR’s) te behouden33,34,35,36,37 . Onlangs zijn er verschillende tools beschikbaar gekomen die de toegankelijkheid van open zoeken aanzienlijk verbeteren, waaronder Byonic 31,38, Open-pFind39, ANN-SoLo40 en MSFragger21,41. Deze tools maken de robuuste identificatie van glycosylatiegebeurtenissen mogelijk door de analysetijden aanzienlijk te verkorten en benaderingen te implementeren om heterogene glycaansamenstellingen te verwerken.
Dit artikel presenteert een gestroomlijnde methode voor de identificatie van bacteriële glycopeptiden door open zoeken, met behulp van de Gram-negatieve nosocomiale pathogeen, Acinetobacter baumannii, als model. A. baumannii bezit een geconserveerd O-gebonden glycosyleringssysteem dat verantwoordelijk is voor de modificatie van meerdere eiwitsubstraten, bekend als het PglL-eiwitglycosyleringssysteem 42,43,44. Hoewel vergelijkbare eiwitten gericht zijn op glycosylering tussen stammen, is het PglL-glycosyleringssysteem zeer variabel vanwege de biosynthese van het glycaan dat wordt gebruikt voor eiwitglycosylatie en wordt afgeleid van de capsulelocus (bekend als de K-locus)44,45,46. Dit resulteert in diverse glycanen (ook bekend als een K-eenheid), afgeleid van enkele of beperkte gepolymeriseerde K-eenheden, die worden toegevoegd aan eiwitsubstraten 30,44,46. Binnen dit werk wordt het gebruik van de open zoekfunctie, MSfragger, binnen de software FragPipe, gebruikt om glycanen over A. baumannii-stammen te identificeren. Door open zoeken en handmatige curatie te combineren, kunnen “glycaangerichte zoekopdrachten” worden uitgevoerd om de identificatie van bacteriële glycopeptiden verder te verbeteren. Samen maakt deze meerstapsidentificatiebenadering de identificatie van glycopeptiden mogelijk zonder uitgebreide ervaring in de karakterisering van nieuwe glycosylatiegebeurtenissen.
Open searching is een effectieve en systematische methode voor het identificeren van onbekende modificaties. Hoewel de identificatie van onbekende glycanen in bacteriële proteoommonsters van oudsher een tijdrovende en technisch gespecialiseerde onderneming is, maken de recente ontwikkelingen van hulpmiddelen zoals MSfragger 21,41 en Byonic31,38 nu de snelle en effectieve identificatie van deltamassa’s mo…
The authors have nothing to disclose.
N.E.S wordt ondersteund door een Australian Research Council Future Fellowship (FT200100270) en een ARC Discovery Project Grant (DP210100362). We bedanken de Melbourne Mass Spectrometry and Proteomics Facility van het Bio21 Molecular Science and Biotechnology Institute voor toegang tot MS-instrumentatie.
14 G Kel-F Hub point style 3 | Hamilton company | hanc90514 | |
2-Chloroacetamide | Sigma Aldrich Pty Ltd | C0267-100G | |
Acetonitrile | Sigma Aldrich Pty Ltd | 34851-4L | |
Ammonium hydroxide (28%) | Sigma Aldrich Pty Ltd | 338818-100ML | |
BCA Protein Assay Reagent A | Pierce | 23228 | |
BCA Protein Assay Reagent B | Pierce | 23224 | |
C8 Empore SPE | Sigma Aldrich Pty Ltd | 66882-U | An alterative vendor for C8 material is Affinisep (https://www.affinisep.com/about-us/) |
Formic acid | Sigma Aldrich Pty Ltd | 5.33002 | |
Isopropanol | Sigma Aldrich Pty Ltd | 650447-2.5L | |
Methanol | Fisher Chemical | M/4058/17 | |
SDB-RPS Empore SPE (Reversed-Phase Sulfonate) | Sigma Aldrich Pty Ltd | 66886-U | An alterative vendor for SDB-RPS is Affinisep (https://www.affinisep.com/about-us/) |
Sodium Deoxycholate | Sigma Aldrich Pty Ltd | D6750-100G | |
ThermoMixer C | Eppendorf | 2232000083 | |
trifluoroacetic acid | Sigma Aldrich Pty Ltd | 302031-10X1ML | |
Tris 2-carboxyethyl phosphine hydrochloride | Sigma Aldrich Pty Ltd | C4706-2G | |
Tris(hydroxymethyl)aminomethane | Sigma Aldrich Pty Ltd | 252859-500G | |
Trypsin/Lys-C protease mixture | Promega | V5073 | |
Vacuum concentrator | Labconco | 7810040 | |
ZIC-HILIC material | Merck | 1504580001 | Resin for use in single use SPE columns can be obtain by emptying a larger form column and using the free resin |