Summary

La minería del genoma guiada por espectrometría de masas como herramienta para descubrir nuevos productos naturales

Published: March 12, 2020
doi:

Summary

Aquí se establece y se describe un protocolo de minería del genoma guiado por espectrometría de masas. Se basa en la información de la secuencia del genoma y el análisis LC-MS/MS y tiene como objetivo facilitar la identificación de moléculas a partir de extractos microbianos y vegetales complejos.

Abstract

El espacio químico cubierto por productos naturales es inmenso y ampliamente no reconocido. Por lo tanto, se desean metodologías convenientes para realizar una evaluación amplia de sus funciones en la naturaleza y beneficios humanos potenciales (por ejemplo, para aplicaciones de descubrimiento de fármacos). Este protocolo describe la combinación de la minería del genoma (GM) y la red molecular (MN), dos enfoques contemporáneos que coinciden con las anotaciones codificadas por grupos genéticos en la secuenciación del genoma completo con las firmas de la estructura química de extractos metabólicos crudos. Este es el primer paso hacia el descubrimiento de nuevas entidades naturales. Estos conceptos, cuando se aplican juntos, se definen aquí como minería del genoma guiada por MS. En este método, los componentes principales se designan previamente (utilizando MN), y los nuevos candidatos relacionados estructuralmente se asocian con anotaciones de secuencia del genoma (mediante GM). La combinación de GM y MN es una estrategia rentable para apuntar a nuevas redes troncales de moléculas o cosechar perfiles metabólicos con el fin de identificar análogos de compuestos ya conocidos.

Introduction

Las investigaciones del metabolismo secundario a menudo consisten en el cribado de extractos crudos para actividades biológicas específicas seguidos de purificación, identificación y caracterización de los componentes pertenecientes a fracciones activas. Este proceso ha demostrado ser eficiente, promoviendo el aislamiento de varias entidades químicas. Sin embargo, hoy en día esto es visto como inviable, principalmente debido a las altas tasas de redescubrimiento. A medida que la industria farmacéutica revolucionó sin conocer las funciones y funciones de los metabolitos especializados, su identificación se llevó a cabo en condiciones de laboratorio que no representaban con precisión la naturaleza1. Hoy en día, hay una mejor comprensión de las influencias de señalización natural, secreción, y la presencia de la mayoría de los objetivos en concentraciones indetectablemente bajas. Además, la regulación del proceso ayudará a la comunidad académica y a la industria farmacéutica a aprovechar este conocimiento. También beneficiará la investigación que implica el aislamiento directo de metabolitos relacionados con los grupos de genes biosintéticos silenciosos (BGC)2.

En este contexto, los avances en la secuenciación genómica han renovado el interés por el cribado de metabolitos de microorganismos. Esto se debe a que el análisis de la información genómica de los cúmulos biosintéticos descubiertos puede revelar genes que codifican nuevos compuestos no observados o producidos en condiciones de laboratorio. Muchos proyectos o borradores de genoma completo microbiano están disponibles hoy en día, y el número está creciendo cada año, proporcionando perspectivas masivas para descubrir nuevas moléculas bioactivas a través de la minería del genoma3,4.

El Atlas of Biosynthetic Gene Clusters es la mayor colección actual de cúmulos de genes extraídos automáticamente como componente de la Plataforma Integrada de Genomas Microbianos del Instituto Conjunto del Genoma (JGI IMG-ABC)2. Más recientemente, la Iniciativa de Normalización de la Información Mínima para Clústeres de Gen Biosintéticos (MIBiG) ha promovido la reanotación manual de los BGC, proporcionando un conjunto de datos de referencia altamente seleccionado5. Hoy en día, hay muchas herramientas disponibles para permitir la minería computacional de datos genéticos y su conexión con metabolitos secundarios conocidos. También se han desarrollado diferentes estrategias para acceder a nuevos productos naturales bioactivos (es decir, expresión heteróloga, eliminación de genes diana, reconstitución in vitro, secuencia genómica, cribado guiado por isótopos [enfoque genomisotópico], manipulación de reguladores locales y globales, minería basada en objetivos de resistencia, minería independiente del cultivo y, más recientemente, enfoques guiados por MS/código2,6,7,8,9, 10,11,12,13,14,15).

La minería del genoma como estrategia singular requiere esfuerzos para anotar un grupo único o pequeño de moléculas; por lo tanto, siguen existiendo lagunas en el proceso en el que se priorizan nuevos compuestos para el aislamiento y el esclarecimiento de la estructura. En principio, estos enfoques se dirigen a una sola vía biosintética por experimento, lo que resulta en una tasa de descubrimiento lenta. En este sentido, el uso de GM junto con un enfoque de redes moleculares representa un avance importante para la investigación de productos naturales14,,15.

La versatilidad, precisión y alta sensibilidad de la cromatografía líquida-espectrometría de masas (LC-MS) lo convierten en un buen método para la identificación de compuestos. Actualmente, varias plataformas han invertido algoritmos y conjuntos de software para metabolómicas no dirigidas16,,17,18,19,20. El núcleo de estos programas incluye la detección de características (selección de picos)21 y la alineación de picos, lo que permite la coincidencia de entidades idénticas en un lote de muestras y la búsqueda de patrones. Los algoritmos basados en patrones de MS22,23 comparan patrones de fragmentación característicos y coinciden con las similitudes de MS2 que generan familias moleculares que comparten características estructurales. Estas características pueden ser resaltadas y agrupadas, confiriendo la capacidad de descubrir rápidamente moléculas conocidas y desconocidas de un extracto biológico complejo por tándem MS2,24,25. Por lo tanto, la MUS en tándem es un método versátil para obtener información estructural de varios quimiotipos contenidos en una gran cantidad de datos simultáneamente.

El algoritmo Global Natural Products Social Molecular Networking (GNPS)26 utiliza la intensidad de los iones de fragmentos normalizados para construir vectores multidimensionales, en los que las similitudes se comparan utilizando una función de coseno. La relación entre los diferentes iones primarios se traza en una representación de diagrama, en la que cada fragmentación se visualiza como un nodo (círculos) y la relación de cada nodo se define mediante una arista (líneas). La visualización global de moléculas de una sola fuente se define como una red molecular. Las moléculas estructuralmente divergentes que se fragmentan de forma única formarán su propio cúmulo o constelación específico, mientras que las moléculas relacionadas se agrupan. La agrupación de quimiotipos permite la conexión hipotética de características estructurales similares a sus orígenes biosintéticos.

La combinación de enfoques quimiotipo a genotipo y genotipo a quimiotipo es poderosa cuando se crean vínculos bioinformáticos entre los BGC y sus pequeños productos de moléculas27. Por lo tanto, la minería del genoma guiada por MS es un método rápido y una estrategia de bajo consumo de materiales, y ayuda a salvar los iones padres y las vías biosintéticas reveladas por WGS de una o más cepas bajo diversas condiciones metabólicas y ambientales.

El flujo de trabajo de este protocolo(Figura 1) consiste en alimentar los datos wgS en una plataforma de anotación de clúster de genes biosintéticos como antiSMASH28,,29,30. Ayuda a estimar la variedad de compuestos y la clase de compuestos codificados por el genoma. Se debe adoptar una estrategia para atacar un grupo genético biosintético que codifica una entidad química de interés, y se pueden analizar extractos de cultivo de una cepa de tipo silvestre y/o cepa heteróloga que contenga el BGC para generar iones agrupados basados en similitudes utilizando GNPS26,,31. Por lo tanto, es posible identificar nuevas moléculas que se asocian con el BGC objetivo y no están disponibles en la base de datos (principalmente análogos desconocidos, a veces producidos en títulos bajos). Es relevante tener en cuenta que los usuarios pueden contribuir a estas plataformas y que la disponibilidad de datos bioinformáticos y MS/MS está aumentando rápidamente, impulsando a un desarrollo constante y actualización de herramientas y algoritmos computacionales eficaces para guiar conexiones eficientes de extractos complejos con moléculas.

Figure 1
Figura 1: Información general de todo el flujo de trabajo. Se muestra una ilustración de los pasos bioinformáticos, de clonación y redes moleculares implicados en el enfoque de minería del genoma guiado por la EM para identificar nuevos metabolitos. Haga clic aquí para ver una versión más grande de esta figura.

Este protocolo describe un flujo de trabajo rápido y eficiente para combinar la minería del genoma y las redes moleculares como punto de partida para la canalización de descubrimiento de productos naturales. Aunque muchas aplicaciones son capaces de visualizar la composición y relación de moléculas detectables por MS en una red, aquí se adoptan varias para visualizar moléculas agrupadas estructuralmente similares. Usando esta estrategia, nuevos productos de ciclodepsipéptidos observados en extractos metabólicos de Streptomyces sp. CBMAI 2042 se identifican con éxito. Guiado por la minería del genoma, todo el cúmulo de genes biosintéticos que codifican valinomicinas es reconocido y clonado en la cepa productora Streptomyces coelicolor M1146. Por último, tras una red molecular basada en patrones de EP, las moléculas detectadas por la EM están correlacionadas con los BGC responsables de su biogénesis32.

Protocol

1. Minería del genoma para grupos genéticos biosintéticos Realizar la secuenciación del genoma completo (WGS) como el primer paso para elegir un cúmulo de genes biosintéticos (BCG) para la minería del genoma guiado por EM. Todo el borrador del genoma de la cepa de interés (bacterias) se puede obtener mediante la tecnología Illumina MiSeq utilizando lo siguiente con ADN genómico de alta calidad: escopeta TruSeq PCR-Free library prep y Nextera Mate Pair Library Preparation Kit33….

Representative Results

El protocolo se ejemplificó con éxito utilizando una combinación de minería del genoma, expresión hetróloga y enfoques guiados por MS/código para acceder a nuevas moléculas análogas especializadas en valinomicina. El flujo de trabajo genoma-molécula para el objetivo, valinomicina (VLM), se representa en la Figura 8. El genoma del borrador CBMAI 2042 se analizó en silico, y el grupo genético VLM fue identificado y transferido a un huésped hetrólogo. Las cepas de tipo he…

Discussion

La mayor ventaja de este protocolo es su capacidad para desreplicar rápidamente los perfiles metabólicos y salvar la información genómica con datos de MS con el fin de dilucidar las estructuras de las nuevas moléculas, especialmente los análogos estructurales2. Sobre la base de información genómica, se pueden investigar diferentes productos naturales quimiotipos, tales como poliketidas (PK), péptidos nonribosomales (NRP) y productos naturales glucosilados (GNP), así como BGCcrígos críp…

Disclosures

The authors have nothing to disclose.

Acknowledgements

El apoyo financiero para este estudio fue proporcionado por la Fundación de Investigación de Sao Paulo – FAPESP (2019/10564-5, 2014/12727-5 y 2014/50249-8 a L.G.O; 2013/12598-8 y 2015/01013-4 a R.S.; y 2019/08853-9 a C.F.F.A). B.S.P, C.F.F.A. y L.G.O. recibieron becas del Consejo Nacional de Desarrollo Científico y Tecnológico – CNPq (205729/2018-5, 162191/2015-4 y 313492/2017-4). L.G.O. también agradece el apoyo de la subvención proporcionado por el programa Para mujeres en la ciencia (2008, Edición Brasileña). Todos los autores reconocen capeS (Coordinación para la mejora del personal de educación superior) por apoyar los programas de post-graduación en Brasil.

Materials

Acetonitrile Tedia AA1120-048 HPLC grade
Agar Oxoid LP0011 NA
Apramycin Sigma Aldrich A2024 NA
Carbenicillin Sigma Aldrich C9231 NA
Centrifuge Eppendorf NA 5804
Chloramphenicol Sigma Aldrich C3175 NA
Column C18 Agilent Technologies NA ZORBAX RRHD Extend-C18, 80Å, 2.1 x 50 mm, 1.8 µm, 1200 bar pressure limit P/N 757700-902
Kanamycin Sigma Aldrich K1377 NA
Manitol P.A.- A.C.S. Synth NA NA
Microcentrifuge Eppendorf NA 5418
Nalidixic acid Sigma Aldrich N4382 NA
Phusion Flash High-Fidelity PCR Master Mix ThermoFisher Scientific F548S NA
Q-TOF mass spectrometer Agilent technologies NA 6550 iFunnel Q-TOF LC/MS
Sacarose P.A.- A.C.S. Synth NA NA
Shaker/Incubator Marconi MA420 NA
Sodium Chloride Synth NA P. A. – ACS
Soy extract NA NA NA
Sucrose Synth NA P. A. – ACS
Thermal Cycles Eppendorf NA Mastercycler Nexus Gradient
Thiostrepton Sigma Aldrich T8902 NA
Tryptone Oxoid LP0042 NA
Tryptone Soy Broth Oxoid CM0129 NA
UPLC Agilent Technologies NA 1290 Infinity LC System
Yeast extract Oxoid LP0021 NA

References

  1. Davies, J. Specialized microbial metabolites: functions and origins. The Journal of Antibiotics. 66 (7), 361-364 (2013).
  2. Ziemert, N., Alanjary, M., Weber, T. The evolution of genome mining in microbes – a review. Natural Product Reports. 33 (8), 988-1005 (2016).
  3. Zerikly, M., Challis, G. L. Strategies for the Discovery of New Natural Products by Genome Mining. ChemBioChem. 10 (4), 625-633 (2009).
  4. Gomez-Escribano, J. P., Bibb, M. J. Heterologous expression of natural product biosynthetic gene clusters in Streptomyces coelicolor: from genome mining to manipulation of biosynthetic pathways. Journal of Industrial Microbiology & Biotechnology. 41 (2), 425-431 (2014).
  5. Medema, M. H., et al. Minimum Information about a Biosynthetic Gene cluster. Nature Chemical Biology. 11 (9), 625-631 (2015).
  6. Lautru, S., Deeth, R. J., Bailey, L. M., Challis, G. L. Discovery of a new peptide natural product by Streptomyces coelicolor genome mining. Nature Chemical Biology. 1 (5), 265-269 (2005).
  7. Chiang, Y. -. M., et al. Molecular Genetic Mining of the Aspergillus Secondary Metabolome: Discovery of the Emericellamide Biosynthetic Pathway. Chemistry & Biology. 15 (6), 527-532 (2008).
  8. Huang, T., et al. Identification and Characterization of the Pyridomycin Biosynthetic Gene Cluster of Streptomyces pyridomyceticus NRRL B-2517. Journal of Biological Chemistry. 286 (23), 20648-20657 (2011).
  9. Udwary, D. W., et al. Genome sequencing reveals complex secondary metabolome in the marine actinomycete Salinispora tropica. Proceedings of the National Academy of Sciences. 104 (25), 10376-10381 (2007).
  10. Gross, H., et al. The Genomisotopic Approach: A Systematic Method to Isolate Products of Orphan Biosynthetic Gene Clusters. Chemistry & Biology. 14 (1), 53-63 (2007).
  11. Spohn, M., Wohlleben, W., Stegmann, E. Elucidation of the zinc-dependent regulation in Amycolatopsis japonicum enabled the identification of the ethylenediamine-disuccinate ([S,S ]-EDDS) genes. Environmental Microbiology. 18 (4), 1249-1263 (2016).
  12. Thaker, M. N., Waglechner, N., Wright, G. D. Antibiotic resistance-mediated isolation of scaffold-specific natural product producers. Nature Protocols. 9 (6), 1469-1479 (2014).
  13. Katz, M., Hover, B. M., Brady, S. F. Culture-independent discovery of natural products from soil metagenomes. Journal of Industrial Microbiology & Biotechnology. 43, 129-141 (2016).
  14. Quinn, R. A., et al. Molecular Networking as a Drug Discovery, Drug Metabolism, and Precision Medicine Strategy. Trends in Pharmacological Sciences. 38 (2), 143-154 (2017).
  15. Yang, J. Y., et al. Molecular Networking as a Dereplication Strategy. Journal of Natural Products. 76 (9), 1686-1699 (2013).
  16. Lommen, A. MetAlign: Interface-Driven, Versatile Metabolomics Tool for Hyphenated Full-Scan Mass Spectrometry Data Preprocessing. Analytical Chemistry. 81 (8), 3079-3086 (2009).
  17. Katajamaa, M., Miettinen, J., Oresic, M. MZmine: toolbox for processing and visualization of mass spectrometry based molecular profile data. Bioinformatics. 22 (5), 634-636 (2006).
  18. Pluskal, T., Castillo, S., Villar-Briones, A., Orešič, M. MZmine 2: Modular framework for processing, visualizing, and analyzing mass spectrometry-based molecular profile data. BMC Bioinformatics. 11 (1), 395 (2010).
  19. Tautenhahn, R., Patti, G. J., Rinehart, D., Siuzdak, G. XCMS Online: A Web-Based Platform to Process Untargeted Metabolomic Data. Analytical Chemistry. 84 (11), 5035-5039 (2012).
  20. Kuhl, C., Tautenhahn, R., Böttcher, C., Larson, T. R., Neumann, S. CAMERA: An Integrated Strategy for Compound Spectra Extraction and Annotation of Liquid Chromatography/Mass Spectrometry Data Sets. Analytical Chemistry. 84 (1), 283-289 (2012).
  21. Katajamaa, M., Orešič, M. Data processing for mass spectrometry-based metabolomics. Journal of Chromatography A. 1158, 318-328 (2007).
  22. Liu, W. -. T., et al. Interpretation of Tandem Mass Spectra Obtained from Cyclic Nonribosomal Peptides. Analytical Chemistry. 81 (11), 4200-4209 (2009).
  23. Ng, J., et al. Dereplication and de novo sequencing of nonribosomal peptides. Nature Methods. 6 (8), 596-599 (2009).
  24. Liaw, C., et al. Vitroprocines, new antibiotics against Acinetobacter baumannii, discovered from marine Vibrio sp. QWI-06 using mass-spectrometry-based metabolomics approach. Scientific Reports. 5 (1), 1-11 (2015).
  25. Kang, K. B., et al. Targeted Isolation of Neuroprotective Dicoumaroyl Neolignans and Lignans from Sageretia theezans Using in Silico Molecular Network Annotation Propagation-Based Dereplication. Journal of Natural Products. 81 (8), 1819-1828 (2018).
  26. Wang, M., et al. Sharing and community curation of mass spectrometry data with Global Natural Products Social Molecular Networking. Nature Biotechnology. 34 (8), 828-837 (2016).
  27. Doroghazi, J. R., et al. A roadmap for natural product discovery based on large-scale genomics and metabolomics. Nature Chemical Biology. 10 (11), 963-968 (2014).
  28. Medema, M. H., et al. antiSMASH: rapid identification, annotation and analysis of secondary metabolite biosynthesis gene clusters in bacterial and fungal genome sequences. Nucleic Acids Research. 39, 339-346 (2011).
  29. Weber, T., et al. antiSMASH 3.0-a comprehensive resource for the genome mining of biosynthetic gene clusters. Nucleic Acids Research. 43, 237-243 (2015).
  30. Blin, K., et al. antiSMASH 5.0: updates to the secondary metabolite genome mining pipeline. Nucleic Acids Research. 47, 81-87 (2019).
  31. Watrous, J., et al. Mass spectral molecular networking of living microbial colonies. Proceedings of the National Academy of Sciences. 109 (26), 1743-1752 (2012).
  32. Paulo, B. S., Sigrist, R., Angolini, C. F. F., De Oliveira, L. G. New Cyclodepsipeptide Derivatives Revealed by Genome Mining and Molecular Networking. ChemistrySelect. 4 (27), 7785-7790 (2019).
  33. Gonzaga de Oliveira, L., Sigrist, R., Sachetto Paulo, B., Samborskyy, M. Whole-Genome Sequence of the Endophytic Streptomyces sp. Strain CBMAI 2042, Isolated from Citrus sinensis. Microbiology Resource Announcements. 8 (2), 1-2 (2019).
  34. Aziz, R. K., et al. The RAST Server: Rapid Annotations using Subsystems Technology. BMC Genomics. 9 (1), 75 (2008).
  35. Nah, H. -. J., Pyeon, H. -. R., Kang, S. -. H., Choi, S. -. S., Kim, E. -. S. Cloning and Heterologous Expression of a Large-sized Natural Product Biosynthetic Gene Cluster in Streptomyces Species. Frontiers in Microbiology. 8, 1-10 (2017).
  36. Zhang, J. J., Tang, X., Moore, B. S. Genetic platforms for heterologous expression of microbial natural products. Natural Product Reports. 36 (9), 1313-1332 (2019).
  37. Alduina, R., et al. Artificial chromosome libraries of Streptomyces coelicolor A3(2) and Planobispora rosea. FEMS Microbiology Letters. 218 (1), 181-186 (2003).
  38. Jones, A. C., et al. Phage P1-Derived Artificial Chromosomes Facilitate Heterologous Expression of the FK506 Gene Cluster. PLoS One. 8 (7), 69319 (2013).
  39. Gomez-Escribano, J. P., Bibb, M. J. Engineering Streptomyces coelicolor for heterologous expression of secondary metabolite gene clusters. Microbial Biotechnology. 4 (2), 207-215 (2011).
  40. Cannell, R. J. P. . Natural Products Isolation. , (1998).
  41. Kersten, R. D., et al. A mass spectrometry-guided genome mining approach for natural product peptidogenomics. Nature Chemical Biology. 7 (11), 794-802 (2011).
  42. Kersten, R. D., et al. Glycogenomics as a mass spectrometry-guided genome-mining method for microbial glycosylated molecules. Proceedings of the National Academy of Sciences. 110 (47), 4407-4416 (2013).
  43. Liu, W., et al. MS/MS-based networking and peptidogenomics guided genome mining revealed the stenothricin gene cluster in Streptomyces roseosporus. The Journal of Antibiotics. 67 (1), 99-104 (2014).
  44. Duncan, K. R., et al. Molecular Networking and Pattern-Based Genome Mining Improves Discovery of Biosynthetic Gene Clusters and their Products from Salinispora Species. Chemistry & Biology. 22 (4), 460-471 (2015).
  45. Cao, L., et al. MetaMiner: A Scalable Peptidogenomics Approach for Discovery of Ribosomal Peptide Natural Products with Blind Modifications from Microbial Communities. Cell Systems. , (2019).
  46. Chen, L. -. Y., Cui, H. -. T., Su, C., Bai, F. -. W., Zhao, X. -. Q. Analysis of the complete genome sequence of a marine-derived strain Streptomyces sp. S063 CGMCC 14582 reveals its biosynthetic potential to produce novel anti-complement agents and peptides. PeerJ. 7 (1), 6122 (2019).
  47. Kim Tiam, S., et al. Insights into the Diversity of Secondary Metabolites of Planktothrix Using a Biphasic Approach Combining Global Genomics and Metabolomics. Toxins. 11 (9), 498 (2019).
  48. Özakin, S., Ince, E. Genome and metabolome mining of marine obligate Salinispora strains to discover new natural products. Turkish Journal of Biology. 43 (1), 28-36 (2019).
  49. Trivella, D. B. B., de Felicio, R. The Tripod for Bacterial Natural Product Discovery: Genome Mining, Silent Pathway Induction, and Mass Spectrometry-Based Molecular Networking. mSystems. 3 (2), 00160 (2018).
  50. Maansson, M., et al. An Integrated Metabolomic and Genomic Mining Workflow To Uncover the Biosynthetic Potential of Bacteria. mSystems. 1 (3), 1-14 (2016).
  51. Blin, K., Kim, H. U., Medema, M. H., Weber, T. Recent development of antiSMASH and other computational approaches to mine secondary metabolite biosynthetic gene clusters. Briefings in Bioinformatics. 20 (4), 1103-1113 (2019).
  52. Fisch, K. M. Biosynthesis of natural products by microbial iterative hybrid PKS-NRPS. RSC Advances. 3 (40), 18228-18247 (2013).
  53. Tatsuno, S., Arakawa, K., Kinashi, H. Analysis of Modular-iterative Mixed Biosynthesis of Lankacidin by Heterologous Expression and Gene Fusion. The Journal of Antibiotics. 60 (11), 700-708 (2007).
  54. Helfrich, E. J. N., Piel, J. Biosynthesis of polyketides by trans-AT polyketide synthases. Natural Product Reports. 33 (2), 231-316 (2016).

Play Video

Cite This Article
Sigrist, R., Paulo, B. S., Angolini, C. F. F., De Oliveira, L. G. Mass Spectrometry-Guided Genome Mining as a Tool to Uncover Novel Natural Products. J. Vis. Exp. (157), e60825, doi:10.3791/60825 (2020).

View Video