Aquí se establece y se describe un protocolo de minería del genoma guiado por espectrometría de masas. Se basa en la información de la secuencia del genoma y el análisis LC-MS/MS y tiene como objetivo facilitar la identificación de moléculas a partir de extractos microbianos y vegetales complejos.
El espacio químico cubierto por productos naturales es inmenso y ampliamente no reconocido. Por lo tanto, se desean metodologías convenientes para realizar una evaluación amplia de sus funciones en la naturaleza y beneficios humanos potenciales (por ejemplo, para aplicaciones de descubrimiento de fármacos). Este protocolo describe la combinación de la minería del genoma (GM) y la red molecular (MN), dos enfoques contemporáneos que coinciden con las anotaciones codificadas por grupos genéticos en la secuenciación del genoma completo con las firmas de la estructura química de extractos metabólicos crudos. Este es el primer paso hacia el descubrimiento de nuevas entidades naturales. Estos conceptos, cuando se aplican juntos, se definen aquí como minería del genoma guiada por MS. En este método, los componentes principales se designan previamente (utilizando MN), y los nuevos candidatos relacionados estructuralmente se asocian con anotaciones de secuencia del genoma (mediante GM). La combinación de GM y MN es una estrategia rentable para apuntar a nuevas redes troncales de moléculas o cosechar perfiles metabólicos con el fin de identificar análogos de compuestos ya conocidos.
Las investigaciones del metabolismo secundario a menudo consisten en el cribado de extractos crudos para actividades biológicas específicas seguidos de purificación, identificación y caracterización de los componentes pertenecientes a fracciones activas. Este proceso ha demostrado ser eficiente, promoviendo el aislamiento de varias entidades químicas. Sin embargo, hoy en día esto es visto como inviable, principalmente debido a las altas tasas de redescubrimiento. A medida que la industria farmacéutica revolucionó sin conocer las funciones y funciones de los metabolitos especializados, su identificación se llevó a cabo en condiciones de laboratorio que no representaban con precisión la naturaleza1. Hoy en día, hay una mejor comprensión de las influencias de señalización natural, secreción, y la presencia de la mayoría de los objetivos en concentraciones indetectablemente bajas. Además, la regulación del proceso ayudará a la comunidad académica y a la industria farmacéutica a aprovechar este conocimiento. También beneficiará la investigación que implica el aislamiento directo de metabolitos relacionados con los grupos de genes biosintéticos silenciosos (BGC)2.
En este contexto, los avances en la secuenciación genómica han renovado el interés por el cribado de metabolitos de microorganismos. Esto se debe a que el análisis de la información genómica de los cúmulos biosintéticos descubiertos puede revelar genes que codifican nuevos compuestos no observados o producidos en condiciones de laboratorio. Muchos proyectos o borradores de genoma completo microbiano están disponibles hoy en día, y el número está creciendo cada año, proporcionando perspectivas masivas para descubrir nuevas moléculas bioactivas a través de la minería del genoma3,4.
El Atlas of Biosynthetic Gene Clusters es la mayor colección actual de cúmulos de genes extraídos automáticamente como componente de la Plataforma Integrada de Genomas Microbianos del Instituto Conjunto del Genoma (JGI IMG-ABC)2. Más recientemente, la Iniciativa de Normalización de la Información Mínima para Clústeres de Gen Biosintéticos (MIBiG) ha promovido la reanotación manual de los BGC, proporcionando un conjunto de datos de referencia altamente seleccionado5. Hoy en día, hay muchas herramientas disponibles para permitir la minería computacional de datos genéticos y su conexión con metabolitos secundarios conocidos. También se han desarrollado diferentes estrategias para acceder a nuevos productos naturales bioactivos (es decir, expresión heteróloga, eliminación de genes diana, reconstitución in vitro, secuencia genómica, cribado guiado por isótopos [enfoque genomisotópico], manipulación de reguladores locales y globales, minería basada en objetivos de resistencia, minería independiente del cultivo y, más recientemente, enfoques guiados por MS/código2,6,7,8,9, 10,11,12,13,14,15).
La minería del genoma como estrategia singular requiere esfuerzos para anotar un grupo único o pequeño de moléculas; por lo tanto, siguen existiendo lagunas en el proceso en el que se priorizan nuevos compuestos para el aislamiento y el esclarecimiento de la estructura. En principio, estos enfoques se dirigen a una sola vía biosintética por experimento, lo que resulta en una tasa de descubrimiento lenta. En este sentido, el uso de GM junto con un enfoque de redes moleculares representa un avance importante para la investigación de productos naturales14,,15.
La versatilidad, precisión y alta sensibilidad de la cromatografía líquida-espectrometría de masas (LC-MS) lo convierten en un buen método para la identificación de compuestos. Actualmente, varias plataformas han invertido algoritmos y conjuntos de software para metabolómicas no dirigidas16,,17,18,19,20. El núcleo de estos programas incluye la detección de características (selección de picos)21 y la alineación de picos, lo que permite la coincidencia de entidades idénticas en un lote de muestras y la búsqueda de patrones. Los algoritmos basados en patrones de MS22,23 comparan patrones de fragmentación característicos y coinciden con las similitudes de MS2 que generan familias moleculares que comparten características estructurales. Estas características pueden ser resaltadas y agrupadas, confiriendo la capacidad de descubrir rápidamente moléculas conocidas y desconocidas de un extracto biológico complejo por tándem MS2,24,25. Por lo tanto, la MUS en tándem es un método versátil para obtener información estructural de varios quimiotipos contenidos en una gran cantidad de datos simultáneamente.
El algoritmo Global Natural Products Social Molecular Networking (GNPS)26 utiliza la intensidad de los iones de fragmentos normalizados para construir vectores multidimensionales, en los que las similitudes se comparan utilizando una función de coseno. La relación entre los diferentes iones primarios se traza en una representación de diagrama, en la que cada fragmentación se visualiza como un nodo (círculos) y la relación de cada nodo se define mediante una arista (líneas). La visualización global de moléculas de una sola fuente se define como una red molecular. Las moléculas estructuralmente divergentes que se fragmentan de forma única formarán su propio cúmulo o constelación específico, mientras que las moléculas relacionadas se agrupan. La agrupación de quimiotipos permite la conexión hipotética de características estructurales similares a sus orígenes biosintéticos.
La combinación de enfoques quimiotipo a genotipo y genotipo a quimiotipo es poderosa cuando se crean vínculos bioinformáticos entre los BGC y sus pequeños productos de moléculas27. Por lo tanto, la minería del genoma guiada por MS es un método rápido y una estrategia de bajo consumo de materiales, y ayuda a salvar los iones padres y las vías biosintéticas reveladas por WGS de una o más cepas bajo diversas condiciones metabólicas y ambientales.
El flujo de trabajo de este protocolo(Figura 1) consiste en alimentar los datos wgS en una plataforma de anotación de clúster de genes biosintéticos como antiSMASH28,,29,30. Ayuda a estimar la variedad de compuestos y la clase de compuestos codificados por el genoma. Se debe adoptar una estrategia para atacar un grupo genético biosintético que codifica una entidad química de interés, y se pueden analizar extractos de cultivo de una cepa de tipo silvestre y/o cepa heteróloga que contenga el BGC para generar iones agrupados basados en similitudes utilizando GNPS26,,31. Por lo tanto, es posible identificar nuevas moléculas que se asocian con el BGC objetivo y no están disponibles en la base de datos (principalmente análogos desconocidos, a veces producidos en títulos bajos). Es relevante tener en cuenta que los usuarios pueden contribuir a estas plataformas y que la disponibilidad de datos bioinformáticos y MS/MS está aumentando rápidamente, impulsando a un desarrollo constante y actualización de herramientas y algoritmos computacionales eficaces para guiar conexiones eficientes de extractos complejos con moléculas.
Figura 1: Información general de todo el flujo de trabajo. Se muestra una ilustración de los pasos bioinformáticos, de clonación y redes moleculares implicados en el enfoque de minería del genoma guiado por la EM para identificar nuevos metabolitos. Haga clic aquí para ver una versión más grande de esta figura.
Este protocolo describe un flujo de trabajo rápido y eficiente para combinar la minería del genoma y las redes moleculares como punto de partida para la canalización de descubrimiento de productos naturales. Aunque muchas aplicaciones son capaces de visualizar la composición y relación de moléculas detectables por MS en una red, aquí se adoptan varias para visualizar moléculas agrupadas estructuralmente similares. Usando esta estrategia, nuevos productos de ciclodepsipéptidos observados en extractos metabólicos de Streptomyces sp. CBMAI 2042 se identifican con éxito. Guiado por la minería del genoma, todo el cúmulo de genes biosintéticos que codifican valinomicinas es reconocido y clonado en la cepa productora Streptomyces coelicolor M1146. Por último, tras una red molecular basada en patrones de EP, las moléculas detectadas por la EM están correlacionadas con los BGC responsables de su biogénesis32.
La mayor ventaja de este protocolo es su capacidad para desreplicar rápidamente los perfiles metabólicos y salvar la información genómica con datos de MS con el fin de dilucidar las estructuras de las nuevas moléculas, especialmente los análogos estructurales2. Sobre la base de información genómica, se pueden investigar diferentes productos naturales quimiotipos, tales como poliketidas (PK), péptidos nonribosomales (NRP) y productos naturales glucosilados (GNP), así como BGCcrígos críp…
The authors have nothing to disclose.
El apoyo financiero para este estudio fue proporcionado por la Fundación de Investigación de Sao Paulo – FAPESP (2019/10564-5, 2014/12727-5 y 2014/50249-8 a L.G.O; 2013/12598-8 y 2015/01013-4 a R.S.; y 2019/08853-9 a C.F.F.A). B.S.P, C.F.F.A. y L.G.O. recibieron becas del Consejo Nacional de Desarrollo Científico y Tecnológico – CNPq (205729/2018-5, 162191/2015-4 y 313492/2017-4). L.G.O. también agradece el apoyo de la subvención proporcionado por el programa Para mujeres en la ciencia (2008, Edición Brasileña). Todos los autores reconocen capeS (Coordinación para la mejora del personal de educación superior) por apoyar los programas de post-graduación en Brasil.
Acetonitrile | Tedia | AA1120-048 | HPLC grade |
Agar | Oxoid | LP0011 | NA |
Apramycin | Sigma Aldrich | A2024 | NA |
Carbenicillin | Sigma Aldrich | C9231 | NA |
Centrifuge | Eppendorf | NA | 5804 |
Chloramphenicol | Sigma Aldrich | C3175 | NA |
Column C18 | Agilent Technologies | NA | ZORBAX RRHD Extend-C18, 80Å, 2.1 x 50 mm, 1.8 µm, 1200 bar pressure limit P/N 757700-902 |
Kanamycin | Sigma Aldrich | K1377 | NA |
Manitol P.A.- A.C.S. | Synth | NA | NA |
Microcentrifuge | Eppendorf | NA | 5418 |
Nalidixic acid | Sigma Aldrich | N4382 | NA |
Phusion Flash High-Fidelity PCR Master Mix | ThermoFisher Scientific | F548S | NA |
Q-TOF mass spectrometer | Agilent technologies | NA | 6550 iFunnel Q-TOF LC/MS |
Sacarose P.A.- A.C.S. | Synth | NA | NA |
Shaker/Incubator | Marconi | MA420 | NA |
Sodium Chloride | Synth | NA | P. A. – ACS |
Soy extract | NA | NA | NA |
Sucrose | Synth | NA | P. A. – ACS |
Thermal Cycles | Eppendorf | NA | Mastercycler Nexus Gradient |
Thiostrepton | Sigma Aldrich | T8902 | NA |
Tryptone | Oxoid | LP0042 | NA |
Tryptone Soy Broth | Oxoid | CM0129 | NA |
UPLC | Agilent Technologies | NA | 1290 Infinity LC System |
Yeast extract | Oxoid | LP0021 | NA |