Summary

Аннотация завод функции генов с помощью комбинированного Genomics, метаболомики и информатики

Published: June 17, 2012
doi:

Summary

Сочетание геномики, со-анализ экспрессии генов и идентификации целевых соединений через метаболизм дать генов функциональной аннотации.

Abstract

Учитывая постоянно растущее число моделей растений, для которых полная последовательность генома доступны и обилие биологических ресурсов, таких как нокаут мутанты, дикие присоединениях и передовые размножающихся популяций, есть рост бремени для функциональной аннотации генов. В этом протоколе аннотации генов растений функции, используя комбинированные совместного анализа экспрессии генов, метаболомики и информатики осуществляется (рис. 1). Этот подход основан на теории использования целевых генов известна функция позволит определить, не аннотированных генов могут быть вовлечены в процесс определенных метаболических, с определением целевых соединений через метаболомики. Стратегии выдвигаются для применения этой информации о населении порожденных прямом и обратном подходы генетики, несмотря ни один из этих усилий. В следствие такого подхода может также использоваться в качестве подхода к характеризуют неизвестные пики представляют новые или специальные себеcondary метаболитов в ограниченном тканей, растений или стресса лечение, которое в настоящее время является важным для понимания суда метаболизм растений.

Protocol

1. Подготовка образцов Завод материалы собраны и заморожены сразу. Замороженные материалов растений присыпают смесителя мельница (или смесь) и хранят в Соколе трубы или трубы Эппендорф при температуре -80 ° C. 2. Добыча для метаболитов профилирования Алиготе заморожены растительного материала в 2 мл трубку Эппендорф. Добавьте 5 мкл экстракционного буфера на миллиграмм веса свежих замороженных растительного материала. Добавить один металл (или gilconia) мяч и гомогенизации замороженных порошок с Вибрационная мельница в течение 2 мин при 25 Ls 1. Центрифуга 10 мин при 12000 оборотах в минуту. Перенести супернатант в NANOSEP центробежный фильтр. Центрифуга 2 мин при 4000 оборотах в минуту. Перенести супернатант в новую трубку Eppendorf и хранить при температуре -20 ° C до использования. 3. Метаболитов профилирования на LC-MS Настройка ВЭЖХ и проверить температуру духовки колонны и образец лоток. Настройка MS состоянии и проверять состояние вакуума и нагрева капилляра. Выполните м / з калибровки детекторов рассеянного склероза. Передача 50 мкл экстракта на стеклянный флакон для LC-MS. Вводите 5 мкл экстракта на LC-MS. 4. Анализ данных Настройка Xcalibur или Metalign 4 и выбрать анализа данных, подлежащих обработке. Подготовьте таблицу обнаруженных пиков интерес в соответствии с соединением класса в таблице. Определить пики совместно элюирования стандартных соединений. Аннотирование обнаружены пики использованием MS 2 анализ, обзор литературы, метаболит поиск по базе данных (рис. 2, 12,13). 5. Прогнозирование метаболический путь Построить возможные пути с выявленными соединений. Прогнозирование путей использования пик аннотации должна быть основана на химической структуре обнаружены соединенияс предсказанием связи ферментативной функции на метаболический путь 13. Структурирование шаги биосинтетических должны проводиться с точной аннотацией пик. Но определение подробную химическую структуру, например, часть сахара, не является необходимым на данном этапе, потому что предсказание часть сахара и нахождения гипотетически позиция очень трудно определить с помощью анализа MS. Определение сахара, такие как тип hexoside и pentoside будут определены путем ферментативного анализа сахара доноров на последнем этапе проекта. Основном построения прогноза путей следует проводить как небольшие молекулы промежуточных больших молекул, за исключением некоторых случаев, например, реакции дегидратации. Список атомной молекулярной массой, например, 16 м / г на разницу между-H и OH-фрагмент (окисление), 14 м / г (атом углерода) на разницу между-ОН и-OMe (метилирование) и 162 т / г ( MW-H 2 O) для гексозы (гликозилирование), полезно для прогнозирования. Определениеизменение типа корреляционный анализ тканей особенностей помогает прогнозирования метаболизма. База данных общих метаболических путей, таких как KEGG базы данных ( http://www.genome.jp/kegg/ ) и PlantCyc ( http://plantcyc.org/~~V ), является очень эффективным для прогнозирования метаболизма вашего интереса. 6. Подготовка генов Arabidopsis Список с ортологичных ID гена Скачать список генов ID из геномной базы данных. Добавить Arabidopsis ID гена ортологичных гена, в случае вашей целевой растение не Arabidopsis. Подготовьте список генов в пути, из интереса. Аннотация Arabidopsis данные пути и данных семейства генов доступны в ТАИР сайте ( http://www.arabidopsis.org/~~V ). Если вы подготовили список генов Arabidopsis ортологичных, вы можете впоследствии комбинированныепе их. 7. Сотрудничество выражается генный анализ Проверку при помощи подготовленного списка ID гена искать лучшей базой данных для пути по проверке корреляции с использованием хорошо известных пар генов в путь интересов, (см. таблицу II). Если коэкспрессией базы данных или базы данных генной экспрессии не доступны в завод интерес, Arabidopsis коэкспрессией базы данных должны быть использованы с перечнем Arabidopsis ортологичных генов. В случае, ячменя, риса, тополя, пшеница, люцерна и сои, коэкспрессией анализ видов растений могут быть использованы (см. таблицу II). Построить основу для вашей целевой коэкспрессией сети на основе соединений известных генов в пути, из интереса. Добавить взаимосвязанных генов-кандидатов (г <0,4 ~ 0,90, в приближенное значение величины коэффициента между связями известных генов в путь-в-ставки) и проверить их аннотации генов в прedicted семей в связи этой сети для поиска лучших генов-кандидатов (рис. 3). Пороговое значение коэффициента должно быть согласовано в соответствии со структурой сети и плотность взаимосвязанных генов. Сделать список генов, которые вы сможете сузить как специализированные для вашей целевой путь. Проверьте экспрессии генов органа особенностей и реакции на стресс ваших генов-кандидатов. 8. Интеграция всей информации для прогнозирования новых путей Добавить хорошо изученных генов, которые были использованы для запроса коэкспрессией анализ предсказал метаболизма. Проверьте неохарактеризованной части этого пути, например неохарактеризованной ферментативных реакций, транспорт белков и факторов транскрипции. Прогнозировать наиболее подходящий ген аннотацию к этим отсутствует неохарактеризованной шаги. Объединение результатов метаболит профилирования и генов-кандидатов в кремнии GEпе выражение на основании предсказать пути. Организуйте генов-кандидатов на предсказать пути по функции генов, например, для ацетилтрансферазы ацетилированного метаболита, гликозилтрансферазы для гликозид, P450 для окисленные соединения. Филогенетических деревьев анализ аминокислотных последовательностей является полезным для некоторых широкого семейства генов, таких как P450 и гликозилтрансферазы. Проверьте целостность тканей и особенности реакции на стресс между метаболитов накопления и уровня экспрессии генов генов-кандидатов. Проверьте подключение к другой обмен веществ для обеспечения субстрата и стресс реагировать генов. 9. Эксперименты по генной идентификации с использованием биоресурсов Проверить наличие биоресурсов для облегчения эксперимент кандидата идентификации генов. Выполнить эксперимент для определения функций генов использования биологических ресурсов, таких как KO библиотеке мутантов и полной кДНК библиотеки. ТОн экспериментов по функциональной идентификации генов с подготовкой гиперэкспрессия растений и нокаутом мутантов, ферментативный анализ и промоутер обязательного анализа, должны быть выполнены в лучших генов-кандидатов в прогнозе. Рекомбинантного белка для анализа характеристик свойств белков и подготовка гиперэкспрессия растений лучше проводить после подтверждения метаболит профиль с помощью КО мутант, поскольку она занимает значительно больше времени, чтобы подготовиться рекомбинантного белка и клонирование генов для трансформации. 10. Представитель Результаты Процедура комплексного анализа описанных в этом протоколе есть много возможностей в зависимости от указанных экспериментальных целей и выбора биологических и аналитических комбинаций. Выбор процедур и опытно-конструкторских должна осуществляться должным образом на основе целевой путь, соединений и растений. Интеграция стратегии, описанные в этом протокол ВОК используется на аннотации завод функции гена и открытие новых функций генов с эффективным использованием нескольких био-и данными ресурсами. Ожидаемый результат обещает обеспечить только в случае убедительных предсказаний. Этот факт свидетельствует о том, что если достаточное количество доказательств не может быть предоставлена ​​по комбинации профилей, эксперимент не должен быть запущен. По этой причине, в любом случае, дополнительные предварительные эксперименты, такие как целевые профилирования экспрессии генов ОТ-ПЦР, может поддерживать ваше предсказание функции гена. Точность и достоверность прогнозирования коррелирует выше в зависимости от качественных различий и номер изменения комбинации. Кроме того, хорошие кандидаты и действительные результаты могут исходить только от точного предсказания путей. Пик аннотации должны проводиться сочетание нескольких подходов, например, обзор литературы, справочных растительных экстрактов, MS н анализ, орган специфику и мутант анализ 13. 1 "SRC =" / files/ftp_upload/3487/3487fig1.jpg "/> Рисунок 1. Обзор экспериментальных поток генов через аннотацию комбинированный подход. В некоторых случаях проекты начинаются с открытием нового пика, который обнаруживается в особых условиях или тканей, а также желание понять свою роль в его метаболизме. В других случаях целью проекта является выявление гена или открытия ключевых регуляторных факторов, таких как факторы транскрипции. Планирование эксперимента следует планируется с набором данных, который показывает четкие различия в уровнях метаболитов в целевой путь, используя широкий спектр образцов тканей различных органов, а также для дифференциальной выращиваемых растений или растений в условиях стресса, а также подвергать материал метаболит профилирования. Мутанты и трансгенных растений, а также QTL селекционного материала укрывательство также представляют подходящий генетический материал для этих исследований. Прогнозирование новых путей должны быть выполнены тщательно с точнымПик аннотации и комбинированный подход с различными типами metabolotype такие как орган ценных бумаг и реакции на стресс в зависимости от экспрессии генов данные вашего пути, из интереса. На последнем этапе, метаболитов и запись профиля должны быть выполнены которые в конечном итоге, в сочетании с в кремнии анализ веб-ресурсов и в пробирке характеристика экспрессии генов посредством экспрессии гетерологичных, приводят к утверждению кандидатов генов и выяснение его функции и положение в метаболический путь. Сокращения: QTL, локусов количественных признаков. Рисунок 2. Работа потока комбинационный подход пик аннотации. Процедура идентификации пиков и аннотации стандартных соединений, сравнение дикого типа и выбить мутантов, многомерная масс-спектрометрии целевой пик ссылкой на масс-спектры чистых комфунтов из базы данных 12. Сокращения: DB, базы данных; KO, нокаут, 1-D, одномерный, 2-D, двумерной, ЯМР, ядерного магнитного резонанса, ИК-порт, инфракрасный, MS л, масса массы спектрометрии. Рисунок 3. Пример совместного регулирования сети анализ путей антоцианов. Коэкспрессия анализ проводили с использованием простых ( http://prime.psc.riken.jp/?action=coexpression_index ) на основе набора данных версий ATTEDII 3 8,2 с Pajek программы ( http://vlado.fmf.uni-lj.si/pub/networks/pajek/ ). Положительные корреляции (р <0,5) используются для подключения к сети. Красный узел: двенадцать антоцианов ферментативные гены (At5g13930, CHS, TT4, халкон синтазы; At3g55120, CHI, TT5, халкон isomerise; At3g51240, F3H, TT6, флаванонов 3-гидроксилазы; At5g07990, F3'H, TT7, флавоноидов 3'-гидроксилазы; At5g17050, Fd3GT, UGT78D2, флавоноидов 3 – O-glucosyltransferase; At5g17220, AtGSTF12, TT19 ; At5g42800, DFR, TT3, dihydroflavonol редуктазы; At4g22880, ANS / LDOX, TT18, антоцианидинового Synthese; At4g14090, A5GT, антоцианов 5 – О-glucosyltransferase; At5g54060, A3G2 "XT, предполагаемый антоцианов 3 – O-глюкозид 2" – O – xylosyltransferase; At3g29590, A5GMaT, антоцианов 5 – O-глюкозид 6'' '- О-malonyltransferase; At1g03940, A3GCouT, антоцианов 3 – O-глюкозид 6 "- O – р-coumaroyltransferase) и двух транскрипционных факторов производства антоцианов (At1g56650, PAP1; At1g66390, PAP2) был использован для поиска генов-кандидатов, кандидат гены были найдены «пересечение множеств" поиск с пороговым значением с коэффициентом г <./ EM >> 0,50 запрос на пересечение множеств всех генов запрос (Четырнадцать генов биосинтетических антоцианов). Коэкспрессией сети, в том числе взаимосвязанных генов-кандидатов (68 генов) и запрос генов (14 генов), был вновь построен "взаимосвязи множества" поиск с р> 0,50 помощью ПРАЙМ базе данных. Выходные файлы, которые были отформатированы с файлами. Сети "от премьер-базы данных и сети были привлечены использованием Pajek программного обеспечения. Синий узел указывает генов-кандидатов, которые связаны с антоцианов генов. вид Основные вторичных метаболитов Arabidopsis THALIANA Glucosinolate, флавонолов, антоцианов, sinapoyl производная Populus trichocarpa Флавонолов, антоцианов, салицилат производная Европейского винограда Флавонолов, антоцианов, дубильные вещества, стильбена Solanum Lycopersicum Флавонолов, антоцианов, гликоалкалоид, chrologenate связанных, Nicotiana Tabacum Флавонолов, антоцианов, nicotianamide, связанных chrologenate, acylsugar Oryza сатива Glycoflavone, антоцианов, стирол производные Zea мая Glycoflavone, антоцианов, бензоксазинона, стирол производные Medicago прудовик Изофлавоны, антоцианов, сапонины, Лотос японская Изофлавоны, флавонолов, антоцианов, сапонины, Таблица I. Основные вторичные метаболиты в виде модели завода. Со-выражение базы данных Адрес Завод крест спецификациих годов КС http://webs2.kazusa.or.jp/kagiana/cop0911/~~V Планета http://aranet.mpimp-golm.mpg.de/ Виды растений ATEED-II http://atted.jp/ BAR http://142.150.214.117/welcome.htm КС http://webs2.kazusa.or.jp/kagiana/cop GeneCAT http://genecat.mpg.de/ Arabidopsis ДЕЙСТВОВАТЬ http://www.arabidopsis.leeds.ac.uk/act/coexpanalyser AthCoR@CSB.DB http://csbdb.mpimp-golm.mpg.de/csbdb/dbcor/ath.html CressExpress http://cressexpress.org/~~V Премьер- http://prime.psc.riken.jp/?action=coexpression_index Oryza сатива RiceArrayNet http://arraynet.mju.ac.kr/arraynet/~~V База данных Райс массива http://www.ricearray.org/coexpression/coexpression.shtml Таблица II. Доступные базы данных генной экспрессии в кремнии для совместного анализа экспрессии.

Discussion

Учитывая, что транскриптомику и метаболомики технологии были использованы в течение нескольких лет, процесс интеграции данных для метаболомики помощью генной аннотации обычно начинается с определения нового пика представляющий неизвестный метаболит. Этот факт приводит к следующему этапу, который должен оценить количественные различия в метаболита пики или новых генов кандидат считается ответственным за их биосинтеза. Стратегии, описанные в этом протоколе, однако, имеет три основные проблемы, я) трудности пик аннотации, II), сложность пути предсказания, в) разрешение информация гена и качество данных генной экспрессии. Для борьбы с первой проблемой, пик аннотации должна проводиться совместно с элюирования стандартных соединений или комбинаторный подход с использованием информации от MS н анализа, ссылки экстракт, мутант анализа метаболитов поиска базы данных и обзор литературы (рис. 2, 12). Для сecond проблемы, пути предсказания могут быть получены только путем правильного аннотации пик. Тем не менее, метаболит профилирования тканевой специфичности также может быть аннотация поддержки пик, так как накопление метаболитов должны быть связаны с геном выражения генов. Поэтому сочетание профилей различных тканей и условий роста могут быть полезны для этой второй задачи. Третья проблема, касающаяся разрешения ген информации зависит от прогресса в последовательности данных. В случае модели завода без завершения последовательности генома, со-анализа с использованием выражения ортологичных генов в другие растения модель полезна. Детальное сравнение выравнивания и анализ филогенетического древа аминокислотной последовательности могут поддерживать подключение модельных организмов других видов.

Этот протокол подходит для всех обменов. Он является наиболее эффективным для анализа промежуточных и средних метаболизма, которые также характеризуются быть подвержены сильным транскрипционных сКОНТРОЛЯ 1,5,11,16. В некоторых примерах, со-анализ экспрессии удалось быть выполнены в серой ассимиляции, гены β-окисления, с разветвленной цепью аминокислот деградации кислота, хлорофилл срыв, и лизин катаболизма 3, метаболизм клеточной стенки 10,7 и световой сигнализации каскада 14. Аннотация функции гена с помощью комбинированных геномики, метаболомики и информатики не только для генов биосинтетических и прямым регулятором транскрипционный фактор, но и для понимания физиологических процессов и реагирования (см. пример на рисунке 3. 14).

Чтобы развивать этот подход от модели растений сельскохозяйственных культур, метаболические сравнение по видам растений является мощным подход в некоторых общих метаболизма. Например, если же соединение обнаружено у разных видов растений, а некоторые ортологичных гены находятся в этих видов растений, крест видов совместного анализа с использованием выражения ортологичных генов может обеспечить стронг поддержку вашего прогноза. Этот подход может быть выполнена в Arabidopsis, тополь, люцерна, помимо важных культур, таких как ячмень, рис, пшеница и соя, путем совместного анализа экспрессии видов растений (6, Planet: http://aranet.mpimp-golm.mpg . де / ,, 9, КС: http://webs2.kazusa.or.jp/kagiana/cop0911/ , см., например, 15).

Offenlegungen

The authors have nothing to disclose.

Acknowledgements

Мы благодарим профессора Сайто Казуки в RIKEN PSC и доктор Бьорн Узаделя в MPIMP за полезные обсуждения. TT поддерживает общение с Александра фон Гумбольдта.

Materials

Name of the reagent Company Catalogue number
Distilled water ULC/MS grad BIOSOLVE 23214102
Acetonitrile (ACN) ULC/MS grade BIOSOLVE 01204102
Methanol (MeOH) ULC/MS grade BIOSOLVE 13684102
Formic acid (HCOOH) ULC/MS grade for liquid chromatography BIOSOLVE 06914131
Standard compounds EXTRASYNTHESE  
Linear ion trap (IT) ESI-MS system FINNIGAN-LTQ Thermo Finnigan  
HPLC system Surveyor Thermo Finnigan  
Analytical column Luna C18(2), 2.0 mm diameter, 150 mm length, 100 Å pore size and spherical particles of 3 mm Phenomenex 00F-4251-B0
Xcalibur software Thermo Finnigan  

Referenzen

  1. Aharoni, A., Keizer, L. C. P., Bouwmeester, H. J., Sun, Z. K., Alvarez-Huerta, M., Verhoeven, H. A., Blaas, J., van Houwelingen, A., De Vos, R. C. H., van der Voet, H. SAAT gene involved in strawberry flavor biogenesis by use of DNA microarrays. Plant Cell. 12, 647-661 (2000).
  2. Akiyama, K., Chikayama, E., Yuasa, H., Shimada, Y., Tohge, T., Shinozaki, K., Hirai, M. Y., Sakurai, T., Kikuchi, J., Saito, K. PRIMe: a Web site that assembles tools for metabolomics and transcriptomics. In Silico Biol. 8, 339-345 (2008).
  3. Araujo, W. L., Ishizaki, K., Nunes-Nesi, A., Larson, T. R., Tohge, T., Krahnert, I., Witt, S., Obata, T., Schauer, N., Graham, I. A., Leaver, C. J., Fernie, A. R. Identification of the 2-Hydroxyglutarate and Isovaleryl-CoA Dehydrogenases as Alternative Electron Donors Linking Lysine Catabolism to the Electron Transport Chain of Arabidopsis Mitochondria. Plant Cell. 22, 1549-1563 (2010).
  4. De Vos, R. C. H., Moco, S., Lommen, A., Keurentjes, J. J. B., Bino, R. J., Hall, R. D. Untargeted large-scale plant metabolomics using liquid chromatography coupled to mass spectrometry. Nat. Protoc. 2, (2007).
  5. Hirai, M. Y., Sugiyama, K., Sawada, Y., Tohge, T., Obayashi, T., Suzuki, A., Araki, R., Sakurai, N., Suzuki, H., Aoki, K., Goda, H., Nishizawa, O. I., Shibata, D., Saito, K. Omics-based identification of Arabidopsis Myb transcription factors regulating aliphatic glucosinolate biosynthesis. Proceedings of the National Academy of Sciences of the United States of America. 104, 6478-6483 (2007).
  6. Mutwil, M., Klie, S., Tohge, T., Giorgi, F. M., Wilkins, O., Campbell, M. M., Fernie, A. R., Usadel, B., Nikoloski, Z., Persson, S. PlaNet: Combined Sequence and Expression Comparisons across Plant Networks Derived from Seven Species. Plant Cell. 23, 895-910 (2011).
  7. Mutwil, M., Ruprecht, C., Giorgi, F. M., Bringmann, M., Usadel, B., Persson, S. Transcriptional Wiring of Cell Wall-Related Genes in Arabidopsis. Molecular Plant. 2, 1015-1024 (2009).
  8. Obayashi, T., Kinoshita, K., Nakai, K., Shibaoka, M., Hayashi, S., Saeki, M., Shibata, D., Saito, K., Ohta, H. ATTED-II: a database of co-expressed genes and cis elements for identifying co-regulated gene groups in Arabidopsis. Nucleic Acids Research. 35, D863-D869 (2007).
  9. Ogata, Y., Suzuki, H., Sakurai, N., Shibata, D. CoP: a database for characterizing co-expressed gene modules with biological information in plants. Bioinformatics. 26, 1267-1268 (2010).
  10. Persson, S., Wei, H. R., Milne, J., Page, G. P., Somerville, C. R. Identification of genes required for cellulose synthesis by regression analysis of public microarray data sets. Proceedings of the National Academy of Sciences of the United States of America. 102, 8633-8638 (2005).
  11. Tohge, T., Yonekura-Sakakibara, K., Niida, R., Watanabe-Takahashi, A., Saito, K. Phytochemical genomics in Arabidopsis thaliana: A case study for functional identification of flavonoid biosynthesis genes. Pure and Applied Chemistry. 79, 811-823 (2007).
  12. Tohge, T., Fernie, A. R. Web-based resources for mass-spectrometry-based metabolomics: A user’s guide. Phytochemistry. 70, 450-456 (2009).
  13. Tohge, T., Fernie, A. R. Combining genetic diversity, informatics and metabolomics to facilitate annotation of plant gene function. Nature Protocols. 5, 1210-1227 (2010).
  14. Tohge, T., Kusano, M., Fukushima, A., Saito, K., Fernie, A. R. Transcriptional and metabolic programs following exposure of plants to UV-B irradiation. Plant Signal Behav. 6, (2011).
  15. Tohge, T., Ramos, M. S., Nunes-Nesi, A., Mutwil, M., Giavalisco, P., Steinhauser, D., Schellenberg, M., Willmitzer, L., Persson, S., Martinoia, E., Fernie, A. R. Towards the storage metabolome: profiling the barley vacuole. Plant Physiol. , (2011).
  16. Yonekura-Sakakibara, K., Tohge, T., Matsuda, F., Nakabayashi, R., Takayama, H., Niida, R., Watanabe-Takahashi, A., Inoue, E., Saito, K. Comprehensive flavonol profiling and transcriptome coexpression analysis leading to decoding gene-metabolite correlations in Arabidopsis. Plant Cell. 20, 2160-2176 (2008).

Play Video

Diesen Artikel zitieren
Tohge, T., Fernie, A. R. Annotation of Plant Gene Function via Combined Genomics, Metabolomics and Informatics. J. Vis. Exp. (64), e3487, doi:10.3791/3487 (2012).

View Video