Здесь создан и описан протокол добычи генома, направленного масс-спектрометрией. Он основан на информации о последовательности генома и анализе LC-MS/MS и направлен на облегчение идентификации молекул из сложных микробных и растительных экстрактов.
Химическое пространство, покрытое натуральными продуктами, огромно и широко не признано. Поэтому необходимы удобные методологии для проведения широкомасштабной оценки их функций в природе и потенциальных благ человека (например, для применения лекарственных средств). Этот протокол описывает сочетание добычи генома (ГМ) и молекулярных сетей (MN), двух современных подходов, которые соответствуют генно-кодированным аннотациям во секвенировании всего генома с химическими сигнатурами структуры из грубых метаболических экстрактов. Это первый шаг на пути к открытию новых природных образований. Эти понятия, при применении вместе, определяются здесь как MS-управляемый геном добычи. В этом методе основные компоненты ранее обозначены (с использованием MN), а связанные структурно новые кандидаты связаны с аннотациями последовательности генома (с использованием ГМ). Объединение ГМ и MN является выгодной стратегией для целевой новой молекулы позвоночника или сбора метаболических профилей для того, чтобы определить аналоги из уже известных соединений.
Исследования вторичного метаболизма часто состоят из скрининга сырых экстрактов для конкретных биологических видов деятельности с последующим очищением, идентификацией и характеристикой составляющих, принадлежащих к активным фракциям. Этот процесс оказался эффективным, способствуя изоляции нескольких химических организаций. Тем не менее, в настоящее время это рассматривается как неосуществимый, в основном из-за высоких темпов повторного открытия. Поскольку фармацевтическая промышленность произвела революцию, не зная о роли и функциях специализированных метаболитов, их идентификация проводилась в лабораторных условиях, которые не точно представляли природу1. Сегодня лучше понять естественные сигнальные влияния, секрецию и наличие большинства целей при неопределимо низких концентрациях. Кроме того, регулирование этого процесса поможет академическому сообществу и фармацевтической промышленности воспользоваться этими знаниями. Это также пойдет на пользу исследованиям, связанным с прямой изоляцией метаболитов, связанных с молчаливыми биосинтетическими генными кластерами (BGCs)2.
В этом контексте прогресс в области геномного секвенирования возродил интерес к скринингу метаболитов микроорганизмов. Это связано с тем, что анализ геномной информации нераскрытых биосинтетических кластеров может выявить гены, кодирующих новые соединения, не соблюдаемые и не производимые в лабораторных условиях. Многие микробные проекты всего генома или проекты доступны сегодня, и их число растет с каждым годом, обеспечивая огромные перспективы для раскрытия новых биологически активных молекул через геном добычи3,4.
Атлас биосинтетических генных кластеров является текущей крупнейшей коллекцией автоматически добытых генных кластеров в качестве компонента интегрированной платформы микробных геномов Объединенного института генома (JGI IMG-ABC)2. Совсем недавно, Минимальная информация для биосинтетических генных кластеров (MIBiG) Инициатива по стандартизации способствовала ручной реаннотации BGCs, обеспечивая высоко куратором набор справочных данных5. В настоящее время имеется множество инструментов, позволяющих осуществлять вычислительный анализ генетических данных и их связь с известными вторичными метаболитами. Различные стратегии были также разработаны для доступа к новым биологически активным натуральным продуктам (т.е. гетерологическое выражение, удаление целевых генов, восстановление в пробирке, геномная последовательность, изотоп-управляемый скрининг «геномисотемный подход», манипуляции с местными и глобальными регуляторами, добыча на основе сопротивления, культурная независимая добыча полезных ископаемых, и, в последнее время, MS-руководство/код подходы2,6,9,9,9, , 10,11,,12,,13,,14,,15).
Добыча генома как особая стратегия требует усилий по аннотатам одной или небольшой группы молекул; таким образом, сохраняются пробелы в этом процессе, в которых новые соединения отдают приоритет изоляции и разослать структуру. В принципе, эти подходы нацелены только на один биосинтетический путь в эксперимент, что приводит к медленному показателю открытия. В этом смысле использование Gm наряду с молекулярным подходом сетей представляет собой важный шаг для исследования природного продукта14,15.
Универсальность, точность и высокая чувствительность жидкой хроматографии-масс-спектрометрии (LC-MS) делают его хорошим методом для комплексной идентификации. В настоящее время несколько платформ инвестировали алгоритмы и пакеты программного обеспечения для нецелевых метаболомики16,,17,,18,,19,,20. Ядро этих программ включает в себя обнаружение функций (пиковый сбор)21 и пиковое выравнивание, что позволяет совпадать с идентичными функциями по пакету образцов и поиску шаблонов. MS шаблон на основе алгоритмов22,23 сравнить характерные модели фрагментации и матч MS2 сходства генерации молекулярных семейств обмена структурными особенностями. Эти функции могут быть выделены и сгруппированы, предоставляя возможность быстро обнаружить известные и неизвестные молекулы из сложного биологического экстракта тандемом MS2,24,25. Таким образом, тандем MS является универсальным методом получения структурной информации о нескольких хемотипов, содержащихся в большом объеме данных одновременно.
Алгоритм Глобальной естественной молекулярной сети (GNPS)26 использует нормализованную интенсивность ионов фрагментов для построения многомерных векторов, в которых сходства сравниваются с помощью косиновых функций. Взаимосвязь между различными родительскими ионами построена в представлении диаграммы, в котором каждая фрагментация визуализируется как узло (круги), а родственность каждого узла определяется краем (линиями). Глобальная визуализация молекул из одного источника определяется как молекулярная сеть. Структурно расходящиеся молекулы, которые фрагментируют однозначно, образуют свое собственное конкретное скопление или созвездие, в то время как связанные молекулы сгруппируются вместе. Кластеризация хемотипов позволяет гипотетическое соединение аналогичных структурных особенностей с их биосинтетическим происхождением.
Сочетание как хемотипа к генотипу, так и подходов к генотипу к хемотипу является мощным при создании биоинформатичных связей между BGCs и их небольшими молекулярными продуктами27. Таким образом, добыча генома с MS-наведением является быстрым методом и низкой потребляющей материал стратегией, и она помогает преодолеть родительские ионы и биосинтетические пути, выявленные WGS одного или нескольких штаммов в различных метаболических и экологических условиях.
Рабочий процесс этого протокола(рисунок 1) состоит из подачи данных WGS в биосинтетическую платформу аннотации генного кластера, такую как antiSMASH28,,29,30. Это помогает оценить разнообразие соединений и класс соединений, кодируется геномом. Стратегия для целевой биосинтетического генного кластера кодирования химической сущности, представляющие интерес, должны быть приняты, и культура экстракты из штамма дикого типа и / или гетерологовой штамм, содержащий BGC могут быть проанализированы для создания кластерных ионов на основе сходства с помощью GNPS26,31. Следовательно, можно определить новые молекулы, которые ассоциируются с целевым BGC и недоступны в базе данных (в основном неизвестные аналоги, иногда производимые в низких титрах). Уместно учитывать, что пользователи могут вносить свой вклад в эти платформы и что доступность биоинформатики и данных MS/MS быстро растет, что ведет к постоянному развитию и модернизации эффективных вычислительных инструментов и алгоритмов для руководства эффективными соединениями сложных экстрактов с молекулами.
Рисунок 1: Обзор всего рабочего процесса. Показано иллюстрация биоинформатических, клонирующих и молекулярных сетей, участвующих в описанном подходе к добыче генома с гидом MS для выявления новых метаболитов. Пожалуйста, нажмите здесь, чтобы просмотреть большую версию этой цифры.
Этот протокол описывает быстрый и эффективный рабочий процесс для объединения добычи генома и молекулярных сетей в качестве отправной точки для конвейера по открытию природных продуктов. Хотя многие приложения способны визуализировать состав и родственность MS-обнаруживаемых молекул в одной сети, некоторые из них приняты здесь, чтобы визуализировать структурно похожие кластерные молекулы. Используя эту стратегию, успешно идентифицируются новые циклодепсипептидные продукты, наблюдаемые в метаболических экстрактах streptomyces sp. CBMAI 2042. Руководствуясь добычей генома, весь биосинтетический ген кластер, кодируя для валиномицинов, распознается и клонируется в штамм производителя Streptomyces coelicolor M1146. Наконец, после MS шаблон на основе молекулярной сети, молекулы, обнаруженные MS коррелируют с BGCs ответственность за их биогенеза32.
Самым сильным преимуществом этого протокола является его способность быстро дереплицировать метаболические профили и мост геномной информации с MS данных для того, чтобы выяснить структуры новых молекул, особенно структурные аналоги2. На основе геномной информации можно …
The authors have nothing to disclose.
Финансовая поддержка этого исследования была оказана Сан-Паулу исследовательский фонд – FAPESP (2019/10564-5, 2014/12727-5 и 2014/50249-8 до L.G.O; 2013/12598-8 и 2015/01013-4 до R.S.; и 2019/08853-9 до C.F.F.A). B.S.P., C.F.F.A. и L.G.O. получили стипендии от Национального совета по научно-техническому развитию – CNPq (205729/2018-5, 162191/2015-4 и 313492/2017-4). L.G.O. также благодарна за грантовую поддержку, предоставленную программой для женщин в науке (2008, Бразильское издание). Все авторы признают CAPES (Координация по улучшению высшего образования персонала) для поддержки после окончания программы в Бразилии.
Acetonitrile | Tedia | AA1120-048 | HPLC grade |
Agar | Oxoid | LP0011 | NA |
Apramycin | Sigma Aldrich | A2024 | NA |
Carbenicillin | Sigma Aldrich | C9231 | NA |
Centrifuge | Eppendorf | NA | 5804 |
Chloramphenicol | Sigma Aldrich | C3175 | NA |
Column C18 | Agilent Technologies | NA | ZORBAX RRHD Extend-C18, 80Å, 2.1 x 50 mm, 1.8 µm, 1200 bar pressure limit P/N 757700-902 |
Kanamycin | Sigma Aldrich | K1377 | NA |
Manitol P.A.- A.C.S. | Synth | NA | NA |
Microcentrifuge | Eppendorf | NA | 5418 |
Nalidixic acid | Sigma Aldrich | N4382 | NA |
Phusion Flash High-Fidelity PCR Master Mix | ThermoFisher Scientific | F548S | NA |
Q-TOF mass spectrometer | Agilent technologies | NA | 6550 iFunnel Q-TOF LC/MS |
Sacarose P.A.- A.C.S. | Synth | NA | NA |
Shaker/Incubator | Marconi | MA420 | NA |
Sodium Chloride | Synth | NA | P. A. – ACS |
Soy extract | NA | NA | NA |
Sucrose | Synth | NA | P. A. – ACS |
Thermal Cycles | Eppendorf | NA | Mastercycler Nexus Gradient |
Thiostrepton | Sigma Aldrich | T8902 | NA |
Tryptone | Oxoid | LP0042 | NA |
Tryptone Soy Broth | Oxoid | CM0129 | NA |
UPLC | Agilent Technologies | NA | 1290 Infinity LC System |
Yeast extract | Oxoid | LP0021 | NA |