La búsqueda abierta permite la identificación de glicopéptidos decorados con composiciones de glicanos previamente desconocidas. Dentro de este artículo, se presenta un enfoque simplificado para realizar búsquedas abiertas y posteriores búsquedas de glicopéptidos centrados en glicotecos para muestras bacterianas utilizando Acinetobacter baumannii como modelo.
La glicosilación de proteínas se reconoce cada vez más como una modificación común dentro de los organismos bacterianos, que contribuye a la fisiología procariota y la infectividad óptima de las especies patógenas. Debido a esto, existe un creciente interés en caracterizar la glicosilación bacteriana y la necesidad de herramientas analíticas de alto rendimiento para identificar estos eventos. Aunque la proteómica de abajo hacia arriba permite fácilmente la generación de datos de glicopéptidos ricos, la amplitud y diversidad de glicanos observados en especies procariotas hacen que la identificación de eventos de glicosilación bacteriana sea extremadamente desafiante.
Tradicionalmente, la determinación manual de las composiciones de glicanos dentro de los conjuntos de datos proteómicos bacterianos hizo de este un análisis en gran medida restringido a expertos específicos del campo. Recientemente, los enfoques abiertos basados en la búsqueda han surgido como una alternativa poderosa para la identificación de modificaciones desconocidas. Al analizar la frecuencia de las modificaciones únicas observadas en las secuencias de péptidos, las técnicas de búsqueda abierta permiten la identificación de glicanos comunes unidos a péptidos dentro de muestras complejas. Este artículo presenta un flujo de trabajo simplificado para la interpretación y el análisis de datos glicoproteómicos, demostrando cómo se pueden utilizar técnicas de búsqueda abiertas para identificar glicopéptidos bacterianos sin conocimiento previo de las composiciones de glicanos.
Usando este enfoque, los glicopéptidos dentro de las muestras se pueden identificar rápidamente para comprender las diferencias de glicosilación. Utilizando Acinetobacter baumannii como modelo, estos enfoques permiten la comparación de composiciones de glicanos entre cepas y la identificación de nuevas glicoproteínas. En conjunto, este trabajo demuestra la versatilidad de las técnicas de búsqueda de bases de datos abiertas para la identificación de la glicosilación bacteriana, lo que hace que la caracterización de estos glicoproteomas altamente diversos sea más fácil que nunca.
La glicosilación proteica, el proceso de unión de carbohidratos a moléculas de proteínas, es una de las modificaciones post-traduccionales (PTM) más comunes en la naturaleza 1,2. En todos los dominios de la vida, ha evolucionado una gama de maquinaria compleja dedicada a la generación de glicoproteínas que afectan a una miríada de funciones celulares 1,3,4,5. Mientras que la glicosilación de proteínas ocurre en una gama de aminoácidos 6,7, los eventos de glicosilación ligados a N y O son dos formas dominantes observadas en la naturaleza. La glicosilación ligada a N implica la unión de glicanos a un átomo de nitrógeno de residuos de asparagina (Asn), mientras que en la glicosilación ligada a O, los glicanos se unen a un átomo de oxígeno de residuos de serina (Ser), treonina (Thr) o tirosina (Tyr)7. A pesar de las similitudes en los residuos dirigidos por los sistemas de glicosilación, las diferencias dentro de los glicanos unidos a las proteínas dan como resultado que la glicosilación sea la clase químicamente más diversa de PTM que se encuentra en la naturaleza.
Mientras que los sistemas de glicosilación eucariota poseen diversidad de glicanos, estos sistemas suelen estar restringidos en el número de carbohidratos únicos utilizados. La diversidad resultante se deriva de cómo estos carbohidratos se organizan en glicanos 8,9,10,11,12. En contraste, las especies bacterianas y arqueas poseen una diversidad de glicanos prácticamente ilimitada debido a la gran variedad de azúcares únicos generados dentro de estos sistemas 2,10,13,14,15,16,17. Estas diferencias en la diversidad de glicanos observadas en todos los dominios de la vida representan un desafío analítico significativo para la caracterización e identificación de eventos de glicosilación. Para la glicosilación eucariota, la capacidad de anticipar las composiciones de glicanos ha facilitado el creciente interés en la glicobiología; sin embargo, no ocurre lo mismo con la glicosilación bacteriana, que todavía está restringida en gran medida al estudio por parte de laboratorios especializados. A medida que la accesibilidad de la instrumentación de espectrometría de masas (EM) ha aumentado en las biociencias, los enfoques basados en la EM son ahora el método principal para el análisis glicoproteómico.
La EM se ha convertido en la herramienta por excelencia para la caracterización de la glicosilación, con enfoques de arriba hacia abajo y de abajo hacia arriba que ahora se usan comúnmente para caracterizar las glicoproteínas6. Mientras que la proteómica de arriba hacia abajo se utiliza para evaluar los patrones globales de glicosilación de proteínas específicas18,19, los enfoques de abajo hacia arriba se utilizan para permitir la caracterización específica de glicopéptidos glicocunos, incluso a partir de mezclas complejas 6,20,21,22,23. Para el análisis de glicopéptidos, la generación de información informativa de fragmentación es esencial para la caracterización de eventos de glicosilación24,25. Una gama de enfoques de fragmentación es ahora rutinariamente accesible en los instrumentos, incluida la disociación inducida por colisión basada en trampas de iones de resonancia (IT-CID), la disociación inducida por colisión de tipo haz (CID) y la disociación por transferencia de electrones (ETD). Cada enfoque posee diferentes fortalezas y debilidades para el análisis de glicopéptidos25,26, con un progreso significativo en la última década en la aplicación de estos enfoques de fragmentación para analizar la glicosilación 6,20. Sin embargo, para el análisis de glicosilación bacteriana, la limitación crítica no ha sido la capacidad de fragmentar glicopéptidos, sino más bien la incapacidad de predecir las posibles composiciones de glicanos dentro de las muestras. Dentro de estos sistemas, la naturaleza desconocida de diversos glicanos bacterianos limita la identificación de glicopéptidos, incluso con herramientas de búsqueda centradas en la glicosilación ahora comunes para el análisis de glicopéptidos eucariotas, como O-Pair27, GlycopeptideGraphMS28 y GlycReSoft29. Para superar este problema, se requiere un método de búsqueda alternativo, con el uso de herramientas de búsqueda abiertas que emergen como un enfoque poderoso para el estudio de la glicosilación bacteriana30.
La búsqueda abierta, también conocida como búsqueda ciega o comodín, permite la identificación de péptidos con PTM desconocidos o inesperados 21,30,31,32. Las búsquedas abiertas utilizan una variedad de técnicas computacionales, incluidas búsquedas de modificación seleccionadas, búsquedas en bases de datos de varios pasos o búsquedas tolerantes de masa amplia 33,34,35,36,37. Aunque la búsqueda abierta tiene un gran potencial, su uso se ha visto obstaculizado típicamente por el aumento significativo de los tiempos de análisis y la pérdida de sensibilidad de la detección de péptidos no modificados en comparación con las búsquedas restringidas31,32. La disminución en la detección de coincidencias péptido-espectrales (PSM) no modificadas es el resultado del aumento de las tasas de PSM falsos positivos asociadas con estas técnicas, lo que requiere un filtrado más estricto para mantener las tasas de falso descubrimiento (FDR) deseadas33,34,35,36,37 . Recientemente, varias herramientas han estado disponibles que mejoran significativamente la accesibilidad de la búsqueda abierta, incluyendo Byonic 31,38, Open-pFind39, ANN-SoLo40 y MSFragger21,41. Estas herramientas permiten la identificación robusta de eventos de glicosilación al reducir significativamente los tiempos de análisis e implementar enfoques para manejar composiciones heterogéneas de glicanos.
Este artículo presenta un método simplificado para la identificación de glicopéptidos bacterianos mediante búsqueda abierta, utilizando como modelo el patógeno nosocomial Gram-negativo, Acinetobacter baumannii. A. baumannii posee un sistema de glicosilación ligado a O conservado responsable de la modificación de múltiples sustratos proteicos, conocido como sistema de glicosilación de la proteína PglL 42,43,44. Mientras que proteínas similares son dirigidas para la glicosilación entre cepas, el sistema de glicosilación PglL es muy variable debido a la biosíntesis del glicano utilizado para la glicosilación de proteínas que se deriva del locus de la cápsula (conocido como K-locus)44,45,46. Esto da como resultado diversos glicanos (también conocidos como unidad K), derivados de unidades K polimerizadas únicas o limitadas, que se agregan a sustratos proteicos 30,44,46. Dentro de este trabajo, se utiliza el uso de la herramienta de búsqueda abierta, MSfragger, dentro del software FragPipe, para identificar glicanos a través de cepas de A. baumannii. Al combinar la búsqueda abierta y la curación manual, se pueden realizar “búsquedas centradas en los glicanos” para mejorar aún más la identificación de glicopéptidos bacterianos. En conjunto, este enfoque de identificación de múltiples pasos permite la identificación de glicopéptidos sin una amplia experiencia en la caracterización de nuevos eventos de glicosilación.
La búsqueda abierta es un método eficaz y sistemático para la identificación de modificaciones desconocidas. Si bien la identificación de glicanos desconocidos dentro de muestras de proteoma bacteriano ha sido tradicionalmente una tarea que requiere mucho tiempo y está técnicamente especializada, los desarrollos recientes de herramientas como MSfragger21,41 y Byonic 31,38 ahora permiten la identifi…
The authors have nothing to disclose.
N.E.S cuenta con el apoyo de una beca futura del Consejo Australiano de Investigación (FT200100270) y una subvención arc Discovery Project (DP210100362). Agradecemos a la Instalación de Espectrometría de Masas y Proteómica de Melbourne del Instituto de Ciencia Molecular y Biotecnología Bio21 por el acceso a la instrumentación de EM.
14 G Kel-F Hub point style 3 | Hamilton company | hanc90514 | |
2-Chloroacetamide | Sigma Aldrich Pty Ltd | C0267-100G | |
Acetonitrile | Sigma Aldrich Pty Ltd | 34851-4L | |
Ammonium hydroxide (28%) | Sigma Aldrich Pty Ltd | 338818-100ML | |
BCA Protein Assay Reagent A | Pierce | 23228 | |
BCA Protein Assay Reagent B | Pierce | 23224 | |
C8 Empore SPE | Sigma Aldrich Pty Ltd | 66882-U | An alterative vendor for C8 material is Affinisep (https://www.affinisep.com/about-us/) |
Formic acid | Sigma Aldrich Pty Ltd | 5.33002 | |
Isopropanol | Sigma Aldrich Pty Ltd | 650447-2.5L | |
Methanol | Fisher Chemical | M/4058/17 | |
SDB-RPS Empore SPE (Reversed-Phase Sulfonate) | Sigma Aldrich Pty Ltd | 66886-U | An alterative vendor for SDB-RPS is Affinisep (https://www.affinisep.com/about-us/) |
Sodium Deoxycholate | Sigma Aldrich Pty Ltd | D6750-100G | |
ThermoMixer C | Eppendorf | 2232000083 | |
trifluoroacetic acid | Sigma Aldrich Pty Ltd | 302031-10X1ML | |
Tris 2-carboxyethyl phosphine hydrochloride | Sigma Aldrich Pty Ltd | C4706-2G | |
Tris(hydroxymethyl)aminomethane | Sigma Aldrich Pty Ltd | 252859-500G | |
Trypsin/Lys-C protease mixture | Promega | V5073 | |
Vacuum concentrator | Labconco | 7810040 | |
ZIC-HILIC material | Merck | 1504580001 | Resin for use in single use SPE columns can be obtain by emptying a larger form column and using the free resin |