Summary

Annotation of Plant Gene-Funktion über Kombinierte Genomics, Metabolomik und Informatik

Published: June 17, 2012
doi:

Summary

Kombination von Genomics, Co-Expression Gen-Analyse und die Identifizierung von Zielverbindungen über Stoffwechsel-Gen geben funktionellen Annotation.

Abstract

Angesichts der stetig wachsenden Anzahl von Pflanzenarten Modell, für das vollständige Genom-Sequenzen zur Verfügung und die Fülle der Bio-Ressourcen wie Knockout-Mutanten, wilde Beitritte und Fortgeschrittene Populationen gibt es eine steigende Belastung für die Gen-funktionellen Annotation. In diesem Protokoll Annotation von Pflanzen-Gen-Funktion mit kombinierten Co-Expression Genanalyse wird Metabolomik und Informatik zur Verfügung gestellt (Abbildung 1). Dieser Ansatz basiert auf der Theorie der Verwendung von Ziel-Genen bekannter Funktion, damit die Kennzeichnung von nicht-annotierte Gene wahrscheinlich in einem bestimmten Stoffwechsel-Prozess eingebunden werden, mit der Identifizierung von Zielverbindungen über Metabolomics basiert. Strategien freuen für die Anwendung dieser Informationen auf die Bevölkerung von beiden Forward-und Reverse Genetik Ansätze trotz keiner von ihnen erzeugten setzen sind mühelos. Nach Korollar Dieser Ansatz kann auch als ein Ansatz verwendet werden, um unbekannte Peaks für neue oder spezifische se charakterisierendäre Metaboliten in den Geweben begrenzt, Pflanzenart oder Stress-Behandlung, die derzeit die wichtigste Studie zum Verständnis der pflanzlichen Stoffwechsel.

Protocol

1. Probenvorbereitung Pflanzenmaterialien werden geerntet und sofort eingefroren. Gefrorene pflanzlichen Materialien werden von Schwingmühle pulverisiert (oder Mörtel) und in Falcon-Röhrchen oder Eppendorf-Röhrchen bei -80 ° C 2. Extraction für Metabolite Profiling Aliquot gefrorene Pflanzenmaterial in einem 2 ml Eppendorf-Röhrchen. 5 l der Extraktionspuffer pro Milligramm Frischgewicht von gefrorenem Pflanzenmaterial. Fügen Sie ein Metall (oder gilconia) Kugel und homogenisieren von gefrorenen Pulver mit dem Mixer Mill für 2 min bei 25 ls -1. Zentrifuge 10 min bei 12.000 Umdrehungen pro Minute. Den Überstand in Zentrifugalfilter Nanosep. 2 min zentrifugieren bei 4.000 min. Den Überstand in neues Eppendorf-Röhrchen, und bei -20 ° C bis zum Gebrauch. 3. Metabolite Profiling mittels LC-MS Richten Sie HPLC und prüfen Temperatur von Säulenofen und Probenteller. Richten Sie MS Zustand und überprüfen Sie den Zustand des Vakuums und Heizung Kapillare. Führen m / z Kalibrierung von MS-Detektor. Übertragen von 50 ul von Extrakten zu Glasfläschchen für LC-MS. Injizieren Sie 5 ul der Extrakte zu LC-MS. 4. Datenanalyse Konfigurieren Sie Xcalibur oder Metalign 4 und wählen Sie die Datenanalyse verarbeitet werden sollen. Bereiten Sie eine Tabelle der detektierten Peaks, die Sie interessieren in Übereinstimmung mit Verbindungsklasse in Tabelle I. Ursache von Spitzen, die durch Co-Elution von Standard-Compounds. Anmerken detektierten Peaks mit MS-Analyse 2, Literaturrecherche, Metabolit-Datenbank suchen (Abbildung 2, 12,13). 5. Vorhersage von Stoffwechselwegen Konstruieren Sie einen möglichen Weg mit Verbindungen erkannt. Vorhersage des Pfades mit Anmerkungen Peak sollte von der chemischen Struktur der erkannten Verbindung beruhens durch die Vorhersage Verknüpfung enzymatischen Funktionen auf dem Stoffwechselweg 13. Strukturierung Biosyntheseschritte sollte mit präzisen Peak-Annotation durchgeführt werden. Aber Bestimmung detaillierte chemische Struktur, zum Beispiel Zucker-Einheit, ist in diesem Schritt nicht unverzichtbar, da Vorhersage Zuckereinheit und adduziert nur sehr schwer von MS-Analyse identifiziert. Bestimmung von Zucker-Typ, wie hexoside und pentoside wird durch enzymatische Assay Zuckerdonor im letzten Schritt des Projekts identifiziert werden. Teilweise Konstruktion der Vorhersage des Pfades ist als kleines Molekül Zwischenprodukt der größeren Molekül außer in den einigen Fällen, wie Dehydratisierungsreaktion durchgeführt werden. Liste der atomaren Molekulargewicht, zum Beispiel 16 m / z-Differenz zwischen H und-OH-Gruppe (Oxidation), 14 m / z (C-Atom) für den Unterschied zwischen-OH und-OMe (Methylierung) und 162 m / z ( MW-H 2 O) Hexose (Glykosylierung), ist nützlich für die Vorhersage. Bestimmung derModifikation Typ mit Korrelationsanalyse von Geweben Besonderheiten hilft Vorhersage der Stoffwechselweg. Datenbank der allgemeinen Stoffwechselweg wie KEGG Datenbank ( http://www.genome.jp/kegg/ ) und PlantCyc ( http://plantcyc.org/~~V ), ist sehr effektiv für die Vorhersage von Stoffwechselwegen, die Sie interessieren. 6. Vorbereitung der Gene-Liste mit Arabidopsis orthologen Gen-ID Download-Gen-ID-Liste aus genomischen Datenbank. In Arabidopsis-Gen-ID des orthologen Gens, bei Ihrer Zielgruppe Pflanze ist nicht Arabidopsis. Bereiten Sie eine Liste von Genen, die in Ihrem Pfad-of-Interest. Annotation von Arabidopsis-Weg-Daten und Daten-Gen-Familie sind in TAIR Website (verfügbar http://www.arabidopsis.org/~~V ). Wenn Sie eine Liste von Arabidopsis orthologen Genen vorbereitet haben, können Sie anschließend Kombine ihnen. 7. Co-exprimiert Gene Analysis Testen Sie mit dem vorbereiteten Gen-ID-Liste, um beste Datenbank für Ihren Weg durch die Überprüfung der Korrelation mit bekannten Gen-Paare in Ihrem Pfad-of-Interest (Tabelle II) zu suchen. Wenn die Co-Expression Datenbank oder Genexpression Datenbank nicht verfügbar sind in der Anlage, die Sie interessieren, sollten Arabidopsis Coexpression Datenbank mit einer Liste von Arabidopsis orthologen Genen verwendet werden. Bei Gerste, Reis kann, Pappel, Weizen, Medicago und Soja, Co-Expression Analyse verwendeten Pflanzenspezies (Tabelle II). Konstruieren Sie den Rahmen für Ihre Zielgruppe Koexpression Netzwerk auf die Verbindungen von den bekannten Genen in Ihrem Pfad-of-Interest basiert. Fügen Sie korrelierten Kandidatengene (r <0,4 ~ 0,90, innerhalb ungefähre Wert des Koeffizienten-Wert zwischen den Anschlüssen der bekannten Gene, die in Ihrem Pfad-of-Interest) und überprüfen Sie ihre Gen-Annotation in Ihre PRedicted Familien zu den Verbindungen dieses Netzwerks für die Suche nach besten Kandidaten-Gene (Abbildung 3). Threshold of Koeffizientenwert sollte nach Netzwerk Struktur und Dichte von korrelierten Genen koordiniert werden. Machen Liste von Genen, die Sie in der Lage zu verengen als spezialisierter Weg zu Ihrem Ziel. Überprüfen Sie Genexpression der Orgel Besonderheiten und Stressreaktionen Ihrer Kandidatengene. 8. Integration aller Informationen, neue Wege zu Predict In gut charakterisierte Gene, die für die Abfrage von Co-Expressions-Analyse wurden vorhergesagt Stoffwechselweg verwendet. Prüfen uncharakterisierten Teile in diesem Weg, zum Beispiel enzymatischer Schritte, Transportproteine ​​und Transkriptionsfaktoren charakterisierte. Predict am besten geeigneten Gen-Annotation für diese fehlende uncharakterisierte Schritte. Kombinieren Sie die Ergebnisse der Metaboliten-Profiling und Kandidatengene der In-silico-GEne Ausdruck auf der Basis von prognostizierten Pfad. Ordnen Sie Kandidatengene auf der vorhergesagten Weg nach Anspruch Genfunktion, beispielsweise für Acetyltransferase acetylierten Metaboliten, Glycosyltransferase für Glycosid, P450 für oxidierten Verbindung. Phylogenetischen Baum Analyse der Aminosäure-Sequenzen ist für einige große Genfamilie wie P450 und Glycosyltransferase nützlich. Überprüfen Sie die Konsistenz des Gewebes Besonderheiten oder Stress-Reaktionen zwischen Metabolit Akkumulation und Genexpression Niveau von Kandidatengenen. Überprüfen Sie die Verbindungen zu anderen Stoffwechsel für die Bereitstellung von Substrat-und Stress-responsive Gene. 9. Experimente für Genidentifikation Verwendung von Bio-Ressourcen Prüfen Sie die Verfügbarkeit von Bioressourcen zur Erleichterung des Experiments zur Identifikation Kandidatengen. Führen Sie ein Experiment zur Identifizierung der Genfunktion mit Bio-Ressourcen, wie KO Mutanten-Bibliothek und in voller Länge cDNA-Bibliothek. Texperimentiert er für die funktionelle Identifizierung von Genen mit der Vorbereitung der Überexpression Pflanzen und Knockout-Mutanten, enzymatischen Assays und Förderer Bindungsassay, müssen nach den besten Kandidaten-Gene in Ihre Vorhersage durchgeführt werden. Rekombinantes Protein Assay zur Charakterisierung von Protein-Eigenschaften und die Herstellung von Überexpression Pflanzen besser, sich nach Bestätigung der Metaboliten-Profil mit KO-Mutante, da es wesentlich länger dauert, bis rekombinanten Proteins und Klonierung von Genen für die Transformation vorzubereiten durchgeführt werden. 10. Repräsentative Ergebnisse Das Verfahren der integrierten Analyse in diesem Protokoll beschrieben ist, hat viele Möglichkeiten, je nach angegebenen experimentellen Zweck und die Wahl der biologischen und analytischen Kombinationen. Auswahl der Verfahren und experimentellen Designs sollte ordnungsgemäß auf der Grundlage Ihrer Zielgruppe Weg, Verbindungen und Pflanzenarten durchgeführt. Die Integrationsstrategie in diesem Protokoll beschriebenen ist foc Verwendung an Annotation von Pflanzen-Gen-Funktion und die Entdeckung neuer Genfunktionen mit einer effizienten Nutzung von mehreren Bio-und Daten-Ressource. Erwartetes Ergebnis wird versprochen, mit dem einzigen Fall von schlüssige Vorhersage liefern. Diese Tatsache zeigt, dass, wenn genügend Beweise können nicht durch Kombination Profile gegeben werden, Experiment nicht gestartet werden soll. Aus diesem Grund ist in allen Fällen können zusätzliche Vorversuchen wie gezielte Genexpressionsanalysen mittels RT-PCR, unterstützen Ihre Vorhersagen von Genfunktionen. Fehlerfreiheit und Genauigkeit der Vorhersage korreliert höher je nach qualitativen Unterschied und die Anzahl der Variation der Kombination. Darüber hinaus können gute Kandidaten und gültige Ergebnisse nur genaue Vorhersage der Wege kommen. Peak-Annotation sollte durch Kombination mehrerer Ansätze durchgeführt werden, zum Beispiel Literaturstudie, Referenz Pflanzenextrakt, MS n Analyse, Organspezifität und Mutanten-Analyse 13. 1 "src =" / files/ftp_upload/3487/3487fig1.jpg "/> Abbildung 1. Übersicht über die experimentellen Strömung von Gen-Annotation über kombinierten Ansatz. In einigen Fällen beginnen Projekte mit der Entdeckung einer neuen Spitze, die im besonderen Bedingungen oder Gewebe erkannt wird, und dem Wunsch, ihre Rolle innerhalb ihres Stoffwechsels zu verstehen. In anderen Fällen der Zweck des Projektes ist die Identifizierung Gen oder Entdeckung von wichtigen regulatorischen Faktoren wie Transkriptionsfaktoren. Design of Experiment sollte mit einem Datensatz, der deutliche Unterschiede von Metaboliten in Ihrem Ziel-Weg, über eine breite Palette von Gewebeproben aus verschiedenen Organen zeigt gehobelt werden, und für unterschiedlich aufgewachsenen Pflanzen oder Pflanzen, die Stress ausgesetzt Bedingungen, und das Material einer Metabolite Profiling. Mutant und transgenen Pflanzen sowie QTL Beherbergung Zuchtmaterial stellen auch geeignete genetische Material für diese Studien. Vorhersage neuer Weg sollte sorgfältig durchgeführt werden, mit genauenHöhepunkt Annotation und Kombination Ansatz mit unterschiedlichen Art der metabolotype wie Orgel Wertpapiere und Stressreaktionen nach Genexpressionsdaten Ihrer Weg-of-Interest. Im letzten Schritt sollte Metabolit und Transkript-Profiling durchgeführt, welche schließlich, wenn sie mit In-silico-Analyse von Web-Ressourcen und In-vitro-Charakterisierung der Genexpression über heterologe Expression kombiniert, um die Bestätigung des Kandidaten-Gens und die Aufklärung ihrer Funktion führen werden und die Position innerhalb eines Stoffwechselweges. Abkürzungen: QTL, Quantitative Trait Loci. Abbildung 2. Arbeitsablauf der kombinatorischen Ansatz zur Spitze Kommentierung bereitgestellt. Ein Verfahren für die Identifizierung der Peaks und Kommentierung durch den Standard-Verbindung, Vergleich von Wildtyp-und Knockout-Mutanten unter Berufung mehrdimensionale Massenspektrometrie des Ziel-Gipfel, um Massenspektren der reinen comPfund aus den Datenbanken 12. Abkürzungen: DB, Datenbank, KO, Knock-out, 1-D, eindimensional, 2-D, zweidimensionale, NMR-, Kernresonanz-, IR-, Infrarot-, MS n, Masse-Masse spectrometries. Abbildung 3. Beispiel Ko-Regulierung Netzwerk Analyse der Anthocyan-Weg. Koexpression Analysen wurden mit dem PRIME ( http://prime.psc.riken.jp/?action=coexpression_index ) auf den Daten der Basis-Version eingestellt ATTEDII 3 8,2 mit der Pajek Programm ( http://vlado.fmf.uni-lj.si/pub/networks/pajek/ ). Positive Korrelationen (r <0,5) werden verwendet, um Netzwerk-Verbindungen herzustellen. Red Knoten: Zwölf Anthocyan enzymatischen Gene (At5g13930, CHS, TT4, Chalkonsynthase; At3g55120, CHALLO, TT5, Chalkon isomerisieren, At3g51240, F3H, TT6, Flavanon 3-Hydroxylase; At5g07990, F3'H, TT7, Flavonoid 3'-Hydroxylase; At5g17050, Fd3GT, UGT78D2, Flavonoid-3 – O-Glucosyltransferase; At5g17220, AtGSTF12, TT19 ; At5g42800, DFR, TT3, Dihydroflavonolreduktase; At4g22880, ANS / LDOX, TT18, Anthocyanidin synthese; At4g14090, A5GT, Anthocyan 5 – O-Glucosyltransferase, At5g54060, A3G2 "XT, vermeintliche Anthocyan 3 – O-Glucosid 2" – O – Xylosyltransferase; At3g29590, A5GMaT, Anthocyan 5 – O-glucosid 6'' '- O-malonyltransferase; At1g03940, A3GCouT, Anthocyan 3 – O-glucosid 6 "- O – p-coumaroyltransferase) und zwei Transkriptionsfaktoren für die Anthocyan-Produktion (At1g56650, PAP1; At1g66390, PAP2) wurde für Benutzer Kandidatengene verwendet Kandidatengene wurden durch einen "Durchschnitt von Mengen" found Suche mit einem Schwellenwert mit einem Koeffizienten von r <./ Em >> 0,50 durch Kreuzung der Sätze von allen abgefragten Gene (Vierzehn Anthocyan Biosynthesegene) abgefragt. Eine Co-Expression Netzwerk, einschließlich korrelierten Kandidatengene (68 Gene) und abgefragt Gene (14 Gene), war von einer "Verknüpfung der Sätze" re-konstruiert Suche mit r> 0,50 mit dem PRIME-Datenbank. Die Ausgabe-Dateien, die mit einem '. Net' Datei aus dem Prime-Datenbank und Netzwerke formatiert wurden gezeichnet wurden mit Pajek Software. Blau zeigt an Knoten Kandidatengene, die mit Anthocyan-Gene korreliert. Spezies Dominierenden Sekundärstoffe Arabidopsis thaliana Glucosinolate, Flavonol, Anthocyan, sinapoyl derivativen Populus trichocarpa Flavonol, Anthocyan, Salicylat derivativen Vitis vinifera Flavonol, Anthocyan, Tannin, Stilben Solanum lycopersicum Flavonol, Anthocyan, Glycoalkaloid, chrologenate verwandten, Nicotiana tabacum Flavonol, Anthocyan, nicotianamide, chrologenate verwandten, acylsugar Oryza sativa Glycoflavone, Anthocyan, Sterolderivate Zea may Glycoflavone, Anthocyan, Benzoxazinon, Sterolderivate Medicago truncatula Isoflavone, Anthocyane, Saponin, Lotus japonica Isoflavone, Flavonol, Anthocyan, Saponin, Tabelle I. Wichtige sekundäre Pflanzenstoffe im Modell Pflanzenarten. Die Co-Expression Datenbank Adresse Anlagenbau Kreuz species COP http://webs2.kazusa.or.jp/kagiana/cop0911/~~V PlaNet http://aranet.mpimp-golm.mpg.de/ Pflanzenarten ATEED-II http://atted.jp/ BAR http://142.150.214.117/welcome.htm COP http://webs2.kazusa.or.jp/kagiana/cop GeneCAT http://genecat.mpg.de/ Arabidopsis HANDELN http://www.arabidopsis.leeds.ac.uk/act/coexpanalyser AthCoR@CSB.DB http://csbdb.mpimp-golm.mpg.de/csbdb/dbcor/ath.html CressExpress http://cressexpress.org/~~V PRIME http://prime.psc.riken.jp/?action=coexpression_index Oryza sativa RiceArrayNet http://arraynet.mju.ac.kr/arraynet/~~V Reis Reihe Datenbank http://www.ricearray.org/coexpression/coexpression.shtml Tabelle II. Erhältlich Genexpression Datenbank für In-silico-Co-Expression-Analyse.

Discussion

Da Transcriptomics und Metabolomics-Technologien für mehrere Jahre verwendet worden, der Prozess der Datenintegration für Metabolomik unterstützt Gen Annotation beginnt in der Regel mit der Identifizierung eines neuen Peak entspricht einer unbekannten Metaboliten. Diese Tatsache führt zu der nächsten Stufe, die quantitative Varianz in Metabolit Gipfel oder die neuartige Kandidatengene als verantwortlich für ihre Biosynthese zu bewerten ist. Die Strategie in diesem Protokoll beschrieben, jedoch hat drei große Probleme i) Schwierigkeiten bei der Peak-Annotation, ii) Komplexität der Weg Vorhersage, iii) Auflösung von Gen-Informationen und die Qualität der Genexpressionsdaten. Um das erste Problem zu begegnen, sollte Gipfel Annotation mit Co-Elution von Standard-Verbindungen oder kombinatorische Ansatz unter Verwendung von Informationen aus MS n Analyse, Referenz-Extrakt, mutierte Analyse, Metabolit-Datenbank suchen und Literaturstudie (Abbildung 2, 12) durchgeführt werden. Für die sZWEITEN Problem kann nur durch Weg Vorhersage richtig Peak Annotation erreicht werden. Allerdings Metabolite Profiling von Gewebsspezifität auch Unterstützung Gipfel Annotation sein, denn mit den Metaboliten Anhäufung Genexpression von Genen korreliert werden sollte. Daher Kombinationsprofile verschiedener Gewebe und Wachstumsbedingungen kann hilfreich sein für dieses zweite Problem. Das dritte Problem bezüglich der Auflösung von Gen-Informationen hängt von den Fortschritten der Sequenzdaten. Bei der Modellpflanze ohne Abschluss der Genomsequenz, ist Co-Expression-Analyse mit orthologen Genen in anderen Modell Pflanzen nützlich. Detaillierte Ausrichtung Vergleich und Stammbaum-Analyse der Aminosäuresequenz unterstützen können, um Modell-Organismen auf andere Arten zu verbinden.

Dieses Protokoll eignet sich für alle Stoffwechsel. Am effektivsten ist es in der Analyse von Zwischen-und sekundären Stoffwechsel, die gut charakterisiert sind, dass die starken transkriptionellen controlle 1,5,11,16. In einigen Beispielen, die Co-Expression-Analyse gelang es, in Schwefel-Assimilation durchgeführt werden, Gene für die β-Oxidation, verzweigtkettige Aminosäure Abbau, Chlorophyll-Abbau und die Lysin-Katabolismus 3, Zellwand 10,7 Stoffwechsel und Licht Signalkaskade 14. Annotation von Genfunktion über kombinierte Genomik, Metabolomik und Informatik ist nicht nur für Biosynthesegencluster und direkter Regulator der Transkriptionsfaktor, sondern auch für das Verständnis physiologischer Vorgang und Response (siehe Beispiel Abbildung 3. 14).

Um diesen Ansatz von Modell-Anlagen zu entwickeln Kulturpflanzen, ist Stoffwechsel-Vergleich von über Pflanzenarten, leistungsfähigste Ansatz in einigen allgemeinen Stoffwechsel. Zum Beispiel, wenn dieselbe Verbindung in verschiedenen Pflanzenarten nachgewiesen wird, und einige orthologen Genen in diesen Pflanzenarten gefunden werden, können von Spezies Co-Expression-Analyse mit orthologen Gene liefern strong Unterstützung für Ihre Vorhersage. Dieser Ansatz kann in Arabidopsis durchgeführt werden, Pappel, Medicago, neben wichtigen Kulturen wie Gerste, Reis, Weizen und Soja, durch Co-Expressions-Analyse von Pflanzenarten (6, PlaNet: http://aranet.mpimp-golm.mpg . de / ,, 9, COP: http://webs2.kazusa.or.jp/kagiana/cop0911/ ; sehen Sie ein Beispiel, 15).

Disclosures

The authors have nothing to disclose.

Acknowledgements

Wir danken Prof. Kazuki Saito in Riken PSC und Dr. Björn Usadel in MPIMP für hilfreiche Diskussionen. TT wird durch ein Stipendium der Alexander von Humboldt-Stiftung unterstützt.

Materials

Name of the reagent Company Catalogue number
Distilled water ULC/MS grad BIOSOLVE 23214102
Acetonitrile (ACN) ULC/MS grade BIOSOLVE 01204102
Methanol (MeOH) ULC/MS grade BIOSOLVE 13684102
Formic acid (HCOOH) ULC/MS grade for liquid chromatography BIOSOLVE 06914131
Standard compounds EXTRASYNTHESE  
Linear ion trap (IT) ESI-MS system FINNIGAN-LTQ Thermo Finnigan  
HPLC system Surveyor Thermo Finnigan  
Analytical column Luna C18(2), 2.0 mm diameter, 150 mm length, 100 Å pore size and spherical particles of 3 mm Phenomenex 00F-4251-B0
Xcalibur software Thermo Finnigan  

References

  1. Aharoni, A., Keizer, L. C. P., Bouwmeester, H. J., Sun, Z. K., Alvarez-Huerta, M., Verhoeven, H. A., Blaas, J., van Houwelingen, A., De Vos, R. C. H., van der Voet, H. SAAT gene involved in strawberry flavor biogenesis by use of DNA microarrays. Plant Cell. 12, 647-661 (2000).
  2. Akiyama, K., Chikayama, E., Yuasa, H., Shimada, Y., Tohge, T., Shinozaki, K., Hirai, M. Y., Sakurai, T., Kikuchi, J., Saito, K. PRIMe: a Web site that assembles tools for metabolomics and transcriptomics. In Silico Biol. 8, 339-345 (2008).
  3. Araujo, W. L., Ishizaki, K., Nunes-Nesi, A., Larson, T. R., Tohge, T., Krahnert, I., Witt, S., Obata, T., Schauer, N., Graham, I. A., Leaver, C. J., Fernie, A. R. Identification of the 2-Hydroxyglutarate and Isovaleryl-CoA Dehydrogenases as Alternative Electron Donors Linking Lysine Catabolism to the Electron Transport Chain of Arabidopsis Mitochondria. Plant Cell. 22, 1549-1563 (2010).
  4. De Vos, R. C. H., Moco, S., Lommen, A., Keurentjes, J. J. B., Bino, R. J., Hall, R. D. Untargeted large-scale plant metabolomics using liquid chromatography coupled to mass spectrometry. Nat. Protoc. 2, (2007).
  5. Hirai, M. Y., Sugiyama, K., Sawada, Y., Tohge, T., Obayashi, T., Suzuki, A., Araki, R., Sakurai, N., Suzuki, H., Aoki, K., Goda, H., Nishizawa, O. I., Shibata, D., Saito, K. Omics-based identification of Arabidopsis Myb transcription factors regulating aliphatic glucosinolate biosynthesis. Proceedings of the National Academy of Sciences of the United States of America. 104, 6478-6483 (2007).
  6. Mutwil, M., Klie, S., Tohge, T., Giorgi, F. M., Wilkins, O., Campbell, M. M., Fernie, A. R., Usadel, B., Nikoloski, Z., Persson, S. PlaNet: Combined Sequence and Expression Comparisons across Plant Networks Derived from Seven Species. Plant Cell. 23, 895-910 (2011).
  7. Mutwil, M., Ruprecht, C., Giorgi, F. M., Bringmann, M., Usadel, B., Persson, S. Transcriptional Wiring of Cell Wall-Related Genes in Arabidopsis. Molecular Plant. 2, 1015-1024 (2009).
  8. Obayashi, T., Kinoshita, K., Nakai, K., Shibaoka, M., Hayashi, S., Saeki, M., Shibata, D., Saito, K., Ohta, H. ATTED-II: a database of co-expressed genes and cis elements for identifying co-regulated gene groups in Arabidopsis. Nucleic Acids Research. 35, D863-D869 (2007).
  9. Ogata, Y., Suzuki, H., Sakurai, N., Shibata, D. CoP: a database for characterizing co-expressed gene modules with biological information in plants. Bioinformatics. 26, 1267-1268 (2010).
  10. Persson, S., Wei, H. R., Milne, J., Page, G. P., Somerville, C. R. Identification of genes required for cellulose synthesis by regression analysis of public microarray data sets. Proceedings of the National Academy of Sciences of the United States of America. 102, 8633-8638 (2005).
  11. Tohge, T., Yonekura-Sakakibara, K., Niida, R., Watanabe-Takahashi, A., Saito, K. Phytochemical genomics in Arabidopsis thaliana: A case study for functional identification of flavonoid biosynthesis genes. Pure and Applied Chemistry. 79, 811-823 (2007).
  12. Tohge, T., Fernie, A. R. Web-based resources for mass-spectrometry-based metabolomics: A user’s guide. Phytochemistry. 70, 450-456 (2009).
  13. Tohge, T., Fernie, A. R. Combining genetic diversity, informatics and metabolomics to facilitate annotation of plant gene function. Nature Protocols. 5, 1210-1227 (2010).
  14. Tohge, T., Kusano, M., Fukushima, A., Saito, K., Fernie, A. R. Transcriptional and metabolic programs following exposure of plants to UV-B irradiation. Plant Signal Behav. 6, (2011).
  15. Tohge, T., Ramos, M. S., Nunes-Nesi, A., Mutwil, M., Giavalisco, P., Steinhauser, D., Schellenberg, M., Willmitzer, L., Persson, S., Martinoia, E., Fernie, A. R. Towards the storage metabolome: profiling the barley vacuole. Plant Physiol. , (2011).
  16. Yonekura-Sakakibara, K., Tohge, T., Matsuda, F., Nakabayashi, R., Takayama, H., Niida, R., Watanabe-Takahashi, A., Inoue, E., Saito, K. Comprehensive flavonol profiling and transcriptome coexpression analysis leading to decoding gene-metabolite correlations in Arabidopsis. Plant Cell. 20, 2160-2176 (2008).

Play Video

Cite This Article
Tohge, T., Fernie, A. R. Annotation of Plant Gene Function via Combined Genomics, Metabolomics and Informatics. J. Vis. Exp. (64), e3487, doi:10.3791/3487 (2012).

View Video