La ricerca aperta consente l’identificazione di glicopeptidi decorati con composizioni di glicani precedentemente sconosciute. All’interno di questo articolo, viene presentato un approccio semplificato per intraprendere la ricerca aperta e le successive ricerche di glicopeptidi focalizzate sul glicano per campioni batterici utilizzando Acinetobacter baumannii come modello.
La glicosilazione proteica è sempre più riconosciuta come una modifica comune all’interno degli organismi batterici, contribuendo alla fisiologia procariotica e all’infettività ottimale delle specie patogene. A causa di ciò, vi è un crescente interesse per la caratterizzazione della glicosilazione batterica e la necessità di strumenti analitici ad alto rendimento per identificare questi eventi. Sebbene la proteomica bottom-up consenta prontamente la generazione di ricchi dati glicopeptidici, l’ampiezza e la diversità dei glicani osservati nelle specie procariotiche rendono estremamente difficile l’identificazione degli eventi di glicosilazione batterica.
Tradizionalmente, la determinazione manuale delle composizioni glicani all’interno di set di dati proteomici batterici ha reso questa analisi in gran parte su misura limitata agli esperti specifici del campo. Recentemente, gli approcci aperti basati sulla ricerca sono emersi come una potente alternativa per l’identificazione di modifiche sconosciute. Analizzando la frequenza delle modifiche uniche osservate sulle sequenze peptidiche, le tecniche di ricerca aperta consentono l’identificazione di glicani comuni attaccati ai peptidi all’interno di campioni complessi. Questo articolo presenta un flusso di lavoro semplificato per l’interpretazione e l’analisi dei dati glicoproteomici, dimostrando come le tecniche di ricerca aperta possono essere utilizzate per identificare i glicopeptidi batterici senza una precedente conoscenza delle composizioni glicaniche.
Utilizzando questo approccio, i glicopeptidi all’interno dei campioni possono essere rapidamente identificati per comprendere le differenze di glicosilazione. Utilizzando Acinetobacter baumannii come modello, questi approcci consentono il confronto delle composizioni glicaniche tra ceppi e l’identificazione di nuove glicoproteine. Nel complesso, questo lavoro dimostra la versatilità delle tecniche di ricerca di database aperti per l’identificazione della glicosilazione batterica, rendendo la caratterizzazione di questi glicoproteomi altamente diversi più facile che mai.
La glicosilazione proteica, il processo di attaccamento dei carboidrati alle molecole proteiche, è una delle modificazioni post-traduzionali (PTM) più comuni in natura 1,2. In tutti i domini della vita, si è evoluta una gamma di macchinari complessi dedicati alla generazione di glicoproteine che influenzano una miriade di funzioni cellulari 1,3,4,5. Mentre la glicosilazione proteica si verifica su una gamma di amminoacidi 6,7, gli eventi di glicosilazione legata all’N e all’O sono due forme dominanti osservate in natura. La glicosilazione legata all’N comporta l’attaccamento dei glicani a un atomo di azoto di residui di asparagina (Asn), mentre nella glicosilazione legata all’O, i glicani sono attaccati a un atomo di ossigeno di serina (Ser), treonina (Thr) o tirosina (Tyr) residui7. Nonostante le somiglianze nei residui presi di mira dai sistemi di glicosilazione, le differenze all’interno dei glicani attaccati alle proteine fanno sì che la glicosilazione sia la classe chimicamente più diversificata di PTM presenti in natura.
Mentre i sistemi di glicosilazione eucariotica possiedono la diversità dei glicani, questi sistemi sono in genere limitati nel numero di carboidrati unici utilizzati. La diversità risultante deriva da come questi carboidrati sono disposti in glicani 8,9,10,11,12. Al contrario, le specie batteriche e arcaiche possiedono una diversità glicana praticamente illimitata a causa della vasta gamma di zuccheri unici generati all’interno di questi sistemi 2,10,13,14,15,16,17. Queste differenze nella diversità glicanica osservata tra i domini della vita rappresentano una sfida analitica significativa per la caratterizzazione e l’identificazione degli eventi di glicosilazione. Per la glicosilazione eucariotica, la capacità di anticipare le composizioni glicaniche ha facilitato il crescente interesse per la glicobiologia; tuttavia, lo stesso non è vero per la glicosilazione batterica, che è ancora in gran parte limitata allo studio da parte di laboratori specializzati. Poiché l’accessibilità della strumentazione di spettrometria di massa (MS) è aumentata nelle bioscienze, gli approcci basati sulla SM sono ora il metodo principale per l’analisi glicoproteomica.
La SM è emersa come lo strumento per eccellenza per la caratterizzazione della glicosilazione, con approcci sia top-down che bottom-up ora comunemente usati per caratterizzare le glicoproteine6. Mentre la proteomica top-down viene utilizzata per valutare i modelli di glicosilazione globale di proteine specifiche18,19, vengono utilizzati approcci bottom-up per consentire la caratterizzazione glicano-specifica dei glicopeptidi, anche da miscele complesse 6,20,21,22,23. Per l’analisi dei glicopeptidi, la generazione di informazioni informative sulla frammentazione è essenziale per la caratterizzazione degli eventi di glicosilazione24,25. Una serie di approcci di frammentazione è ora abitualmente accessibile sugli strumenti, tra cui la dissociazione indotta da collisioni basata sulla trappola ionica di risonanza (IT-CID), la dissociazione indotta da collisioni di tipo fascio (CID) e la dissociazione a trasferimento di elettroni (ETD). Ogni approccio possiede diversi punti di forza e di debolezza per l’analisi dei glicopeptidi25,26, con progressi significativi nell’ultimo decennio nell’applicazione di questi approcci di frammentazione per analizzare la glicosilazione 6,20. Tuttavia, per l’analisi della glicosilazione batterica, la limitazione critica non è stata la capacità di frammentare i glicopeptidi, ma piuttosto l’incapacità di prevedere le potenziali composizioni di glicani all’interno dei campioni. All’interno di questi sistemi, la natura sconosciuta di diversi glicani batterici limita l’identificazione dei glicopeptidi, anche con strumenti di ricerca focalizzati sulla glicosilazione ormai comuni per l’analisi dei glicopeptidi eucariotici, come O-Pair27, GlycopeptideGraphMS28 e GlycReSoft29. Per superare questo problema, è necessario un metodo di ricerca alternativo, con l’uso di strumenti di ricerca aperti che emergono come un potente approccio per lo studio della glicosilazione batterica30.
La ricerca aperta, nota anche come ricerca cieca o jolly, consente l’identificazione di peptidi con PTMsconosciuti o inaspettati 21,30,31,32. Le ricerche aperte utilizzano una varietà di tecniche computazionali, tra cui ricerche di modifica curate, ricerche di database in più passaggi o ricerche tolleranti ad ampia massa 33,34,35,36,37. Sebbene la ricerca aperta abbia un grande potenziale, il suo uso è stato tipicamente ostacolato dal significativo aumento dei tempi di analisi e dalla perdita di sensibilità del rilevamento di peptidi non modificati rispetto alle ricerche limitate31,32. La diminuzione del rilevamento di corrispondenze peptidico-spettrali non modificate (PSM) è il risultato dell’aumento dei tassi di PSM falsi positivi associati a queste tecniche, che richiede un maggiore filtraggio rigoroso per mantenere i tassi di falsa scoperta (FDR) desiderati)33,34,35,36,37 . Recentemente, sono stati resi disponibili diversi strumenti che migliorano significativamente l’accessibilità della ricerca aperta, tra cui Byonic 31,38, Open-pFind39, ANN-SoLo40 e MSFragger21,41. Questi strumenti consentono la robusta identificazione degli eventi di glicosilazione riducendo significativamente i tempi di analisi e implementando approcci per gestire composizioni glicane eterogenee.
Questo articolo presenta un metodo semplificato per l’identificazione dei glicopeptidi batterici mediante ricerca aperta, utilizzando come modello il patogeno nosocomiale Gram-negativo, Acinetobacter baumannii. A. baumannii possiede un sistema di glicosilazione legato all’O conservato responsabile della modifica di più substrati proteici, noto come sistema di glicosilazione della proteina PglL 42,43,44. Mentre proteine simili sono mirate per la glicosilazione tra ceppi, il sistema di glicosilazione PglL è altamente variabile a causa della biosintesi del glicano utilizzato per la glicosilazione proteica derivata dal locus della capsula (noto come K-locus)44,45,46. Ciò si traduce in diversi glicani (noti anche come unità K), derivati da unità K polimerizzate singole o limitate, aggiunti ai substrati proteici 30,44,46. All’interno di questo lavoro, l’uso dello strumento di ricerca aperto, MSfragger, all’interno del software FragPipe, viene utilizzato per identificare i glicani attraverso i ceppi di A. baumannii. Combinando la ricerca aperta e la cura manuale, è possibile intraprendere “ricerche focalizzate sui glicani” per migliorare ulteriormente l’identificazione dei glicopeptidi batterici. Insieme, questo approccio di identificazione in più fasi consente l’identificazione di glicopeptidi senza una vasta esperienza nella caratterizzazione di nuovi eventi di glicosilazione.
La ricerca aperta è un metodo efficace e sistematico per l’identificazione di modifiche sconosciute. Mentre l’identificazione di glicani sconosciuti all’interno di campioni di proteoma batterico è stata tradizionalmente un’impresa dispendiosa in termini di tempo e tecnicamente specializzata, i recenti sviluppi di strumenti come MSfragger21,41 e Byonic 31,38 ora consentono l’identificazione rapida ed eff…
The authors have nothing to disclose.
N.E.S è supportato da una Future Fellowship dell’Australian Research Council (FT200100270) e da una ARC Discovery Project Grant (DP210100362). Ringraziamo la Melbourne Mass Spectrometry and Proteomics Facility del Bio21 Molecular Science and Biotechnology Institute per l’accesso alla strumentazione MS.
14 G Kel-F Hub point style 3 | Hamilton company | hanc90514 | |
2-Chloroacetamide | Sigma Aldrich Pty Ltd | C0267-100G | |
Acetonitrile | Sigma Aldrich Pty Ltd | 34851-4L | |
Ammonium hydroxide (28%) | Sigma Aldrich Pty Ltd | 338818-100ML | |
BCA Protein Assay Reagent A | Pierce | 23228 | |
BCA Protein Assay Reagent B | Pierce | 23224 | |
C8 Empore SPE | Sigma Aldrich Pty Ltd | 66882-U | An alterative vendor for C8 material is Affinisep (https://www.affinisep.com/about-us/) |
Formic acid | Sigma Aldrich Pty Ltd | 5.33002 | |
Isopropanol | Sigma Aldrich Pty Ltd | 650447-2.5L | |
Methanol | Fisher Chemical | M/4058/17 | |
SDB-RPS Empore SPE (Reversed-Phase Sulfonate) | Sigma Aldrich Pty Ltd | 66886-U | An alterative vendor for SDB-RPS is Affinisep (https://www.affinisep.com/about-us/) |
Sodium Deoxycholate | Sigma Aldrich Pty Ltd | D6750-100G | |
ThermoMixer C | Eppendorf | 2232000083 | |
trifluoroacetic acid | Sigma Aldrich Pty Ltd | 302031-10X1ML | |
Tris 2-carboxyethyl phosphine hydrochloride | Sigma Aldrich Pty Ltd | C4706-2G | |
Tris(hydroxymethyl)aminomethane | Sigma Aldrich Pty Ltd | 252859-500G | |
Trypsin/Lys-C protease mixture | Promega | V5073 | |
Vacuum concentrator | Labconco | 7810040 | |
ZIC-HILIC material | Merck | 1504580001 | Resin for use in single use SPE columns can be obtain by emptying a larger form column and using the free resin |