La recherche ouverte permet d’identifier des glycopeptides décorés avec des compositions de glycanes jusque-là inconnues. Dans cet article, une approche simplifiée pour entreprendre une recherche ouverte et des recherches ultérieures de glycopeptides axées sur le glycane est présentée pour des échantillons bactériens en utilisant Acinetobacter baumannii comme modèle.
La glycosylation des protéines est de plus en plus reconnue comme une modification courante au sein des organismes bactériens, contribuant à la physiologie procaryote et à l’infectiosité optimale des espèces pathogènes. Pour cette raison, il existe un intérêt croissant pour la caractérisation de la glycosylation bactérienne et un besoin d’outils analytiques à haut débit pour identifier ces événements. Bien que la protéomique ascendante permette facilement la génération de riches données sur les glycopeptides, l’étendue et la diversité des glycanes observés chez les espèces procaryotes rendent l’identification des événements de glycosylation bactérienne extrêmement difficile.
Traditionnellement, la détermination manuelle des compositions de glycanes dans les ensembles de données protéomiques bactériennes en faisait une analyse largement sur mesure réservée aux experts spécifiques au domaine. Récemment, les approches ouvertes basées sur la recherche sont apparues comme une alternative puissante pour l’identification de modifications inconnues. En analysant la fréquence des modifications uniques observées sur les séquences peptidiques, les techniques de recherche ouverte permettent d’identifier les glycanes communs attachés aux peptides dans des échantillons complexes. Cet article présente un flux de travail rationalisé pour l’interprétation et l’analyse des données glycoprotéomiques, démontrant comment des techniques de recherche ouvertes peuvent être utilisées pour identifier les glycopeptides bactériens sans connaissance préalable des compositions de glycanes.
En utilisant cette approche, les glycopeptides dans les échantillons peuvent rapidement être identifiés pour comprendre les différences de glycosylation. En utilisant Acinetobacter baumannii comme modèle, ces approches permettent de comparer les compositions de glycanes entre les souches et d’identifier de nouvelles glycoprotéines. Pris ensemble, ces travaux démontrent la polyvalence des techniques de recherche dans des bases de données ouvertes pour l’identification de la glycosylation bactérienne, ce qui rend la caractérisation de ces glycoprotéomes très divers plus facile que jamais.
La glycosylation des protéines, le processus de fixation des glucides aux molécules de protéines, est l’une des modifications post-traductionnelles (PTM) les plus courantes dans la nature 1,2. Dans tous les domaines de la vie, une gamme de machines complexes a évolué dédiée à la génération de glycoprotéines qui ont un impact sur une myriade de fonctions cellulaires 1,3,4,5. Alors que la glycosylation des protéines se produit sur une gamme d’acides aminés 6,7, les événements de glycosylation liés à l’azote et à l’O sont deux formes dominantes observées dans la nature. La glycosylation liée à l’azote implique la fixation des glycanes à un atome d’azote de résidus d’asparagine (Asn), tandis que dans la glycosylation liée à l’O, les glycanes sont attachés à un atome d’oxygène de résidus de sérine (Ser), de thréonine (Thr) ou de tyrosine (Tyr)7. Malgré les similitudes dans les résidus ciblés par les systèmes de glycosylation, les différences au sein des glycanes attachés aux protéines font de la glycosylation la classe de PTM la plus chimiquement diversifiée trouvée dans la nature.
Alors que les systèmes de glycosylation eucaryotes possèdent une diversité de glycanes, ces systèmes sont généralement limités dans le nombre de glucides uniques utilisés. La diversité résultante provient de la façon dont ces glucides sont disposés en glycanes 8,9,10,11,12. En revanche, les espèces bactériennes et archéales possèdent une diversité de glycanes pratiquement illimitée en raison de la vaste gamme de sucres uniques générés dans ces systèmes 2,10,13,14,15,16,17. Ces différences dans la diversité des glycanes observées dans les domaines de la vie représentent un défi analytique important pour la caractérisation et l’identification des événements de glycosylation. Pour la glycosylation eucaryote, la capacité d’anticiper les compositions de glycanes a facilité l’intérêt croissant pour la glycobiologie; pourtant, il n’en va pas de même pour la glycosylation bactérienne, qui est encore largement limitée à l’étude par des laboratoires spécialisés. Comme l’accessibilité de l’instrumentation de spectrométrie de masse (SEP) a augmenté dans les biosciences, les approches basées sur la SEP sont maintenant la principale méthode d’analyse glycoprotéomique.
La SEP est devenue l’outil par excellence pour la caractérisation de la glycosylation, avec des approches descendantes et ascendantes maintenant couramment utilisées pour caractériser les glycoprotéines6. Alors que la protéomique descendante est utilisée pour évaluer les modèles globaux de glycosylation de protéines spécifiques18,19, des approches ascendantes sont utilisées pour permettre la caractérisation spécifique des glycanes des glycopeptides, même à partir de mélanges complexes 6,20,21,22,23. Pour l’analyse des glycopeptides, la génération d’informations de fragmentation informatives est essentielle pour la caractérisation des événements de glycosylation24,25. Une gamme d’approches de fragmentation est maintenant couramment accessible sur les instruments, y compris la dissociation induite par collision basée sur un piège à ions de résonance (IT-CID), la dissociation induite par collision de type faisceau (CID) et la dissociation par transfert d’électrons (ETD). Chaque approche possède des forces et des faiblesses différentes pour l’analyse des glycopeptides25,26, avec des progrès significatifs au cours de la dernière décennie dans l’application de ces approches de fragmentation pour analyser la glycosylation 6,20. Cependant, pour l’analyse de la glycosylation bactérienne, la limitation critique n’a pas été la capacité de fragmenter les glycopeptides, mais plutôt l’incapacité de prédire les compositions potentielles de glycanes dans les échantillons. Au sein de ces systèmes, la nature inconnue de divers glycanes bactériens limite l’identification des glycopeptides, même avec des outils de recherche axés sur la glycosylation maintenant courants pour l’analyse des glycopeptides eucaryotes, tels que O-Pair27, GlycopeptideGraphMS28 et GlycReSoft29. Pour surmonter ce problème, une méthode de recherche alternative est nécessaire, l’utilisation d’outils de recherche ouverts émergeant comme une approche puissante pour l’étude de la glycosylation bactérienne30.
La recherche ouverte, également connue sous le nom de recherche à l’aveugle ou à caractère générique, permet d’identifier des peptides avec des PTM inconnus ou inattendus 21,30,31,32. Les recherches ouvertes utilisent une variété de techniques de calcul, y compris les recherches de modification organisées, les recherches dans les bases de données en plusieurs étapes ou la recherche tolérante à grande masse 33,34,35,36,37. Bien que la recherche ouverte ait un grand potentiel, son utilisation a généralement été entravée par l’augmentation significative des temps d’analyse et la perte de sensibilité de la détection de peptides non modifiés par rapport aux recherches restreintes31,32. La diminution de la détection des correspondances peptide-spectrales (MSP) non modifiées est le résultat de l’augmentation des taux de PSM faussement positifs associés à ces techniques, ce qui nécessite un filtrage rigoureux accru pour maintenir les taux de fausse découverte (FDR) souhaités 33,34,35,36,37 . Récemment, plusieurs outils sont devenus disponibles qui améliorent considérablement l’accessibilité de la recherche ouverte, notamment Byonic 31,38, Open-pFind39, ANN-SoLo40 et MSFragger21,41. Ces outils permettent l’identification robuste des événements de glycosylation en réduisant considérablement les temps d’analyse et en mettant en œuvre des approches pour gérer les compositions de glycanes hétérogènes.
Cet article présente une méthode simplifiée pour l’identification des glycopeptides bactériens par recherche ouverte, en utilisant l’agent pathogène nosocomial à Gram négatif, Acinetobacter baumannii, comme modèle. A. baumannii possède un système de glycosylation lié à l’O conservé responsable de la modification de multiples substrats protéiques, connu sous le nom de système de glycosylation de la protéine PglL 42,43,44. Alors que des protéines similaires sont ciblées pour la glycosylation entre les souches, le système de glycosylation PglL est très variable en raison de la biosynthèse du glycane utilisé pour la glycosylation des protéines dérivé du locus de la capsule (connu sous le nom de K-locus)44,45,46. Il en résulte que divers glycanes (également connus sous le nom d’unité K), dérivés d’unités K polymérisées simples ou limitées, sont ajoutés aux substrats protéiques 30,44,46. Dans ce travail, l’utilisation de l’outil de recherche ouvert, MSfragger, dans le logiciel FragPipe, est utilisée pour identifier les glycanes à travers les souches d’A. baumannii. En combinant la recherche ouverte et la curation manuelle, des « recherches axées sur le glycane » peuvent être entreprises pour améliorer davantage l’identification des glycopeptides bactériens. Ensemble, cette approche d’identification en plusieurs étapes permet l’identification de glycopeptides sans expérience approfondie dans la caractérisation de nouveaux événements de glycosylation.
La recherche ouverte est une méthode efficace et systématique pour identifier les modifications inconnues. Alors que l’identification de glycanes inconnus dans des échantillons de protéome bactérien a toujours été une entreprise longue et techniquement spécialisée, les récents développements d’outils tels que MSfragger21,41 et Byonic31,38 permettent maintenant l’identification rapide et e…
The authors have nothing to disclose.
N.E.S est soutenu par une bourse d’avenir du Conseil australien de la recherche (FT200100270) et une subvention de projet de découverte ARC (DP210100362). Nous remercions le Melbourne Mass Spectrometry and Proteomics Facility du Bio21 Molecular Science and Biotechnology Institute pour son accès à l’instrumentation MS.
14 G Kel-F Hub point style 3 | Hamilton company | hanc90514 | |
2-Chloroacetamide | Sigma Aldrich Pty Ltd | C0267-100G | |
Acetonitrile | Sigma Aldrich Pty Ltd | 34851-4L | |
Ammonium hydroxide (28%) | Sigma Aldrich Pty Ltd | 338818-100ML | |
BCA Protein Assay Reagent A | Pierce | 23228 | |
BCA Protein Assay Reagent B | Pierce | 23224 | |
C8 Empore SPE | Sigma Aldrich Pty Ltd | 66882-U | An alterative vendor for C8 material is Affinisep (https://www.affinisep.com/about-us/) |
Formic acid | Sigma Aldrich Pty Ltd | 5.33002 | |
Isopropanol | Sigma Aldrich Pty Ltd | 650447-2.5L | |
Methanol | Fisher Chemical | M/4058/17 | |
SDB-RPS Empore SPE (Reversed-Phase Sulfonate) | Sigma Aldrich Pty Ltd | 66886-U | An alterative vendor for SDB-RPS is Affinisep (https://www.affinisep.com/about-us/) |
Sodium Deoxycholate | Sigma Aldrich Pty Ltd | D6750-100G | |
ThermoMixer C | Eppendorf | 2232000083 | |
trifluoroacetic acid | Sigma Aldrich Pty Ltd | 302031-10X1ML | |
Tris 2-carboxyethyl phosphine hydrochloride | Sigma Aldrich Pty Ltd | C4706-2G | |
Tris(hydroxymethyl)aminomethane | Sigma Aldrich Pty Ltd | 252859-500G | |
Trypsin/Lys-C protease mixture | Promega | V5073 | |
Vacuum concentrator | Labconco | 7810040 | |
ZIC-HILIC material | Merck | 1504580001 | Resin for use in single use SPE columns can be obtain by emptying a larger form column and using the free resin |