1. Préparation de l'échantillon Les matières végétales sont récoltés et congelés immédiatement. Matières végétales congelées sont pulvérisés par vibro-broyeur (ou mortier) et stockées dans Falcon tube ou tube Eppendorf à -80 ° C. 2. Extraction pour le profilage des métabolites Aliquote congelée matériel végétal dans un tube Eppendorf de 2 ml. Ajouter 5 pi de tampon d'extraction par milligramme de poids frais de matériel végétal congelé. Ajouter un métal (ou gilconia), le ballon et homogénéiser la poudre de gelée avec le Mixer Mill pendant 2 min à 25 ls -1. Centrifuger 10 min à 12000 rpm. Transférer le surnageant dans un filtre centrifuge Nanosep. Centrifuger 2 min à 4000 rpm. Transférer le surnageant dans de nouveaux tube Eppendorf, et conserver à -20 ° C jusqu'à son utilisation. 3. Profilage des métabolites par LC-MS Mettre en place HPLC et vérifier la température du four à colonne et plateau d'échantillons. Mettre en place l'état de SP et de vérifier l'état de vide et de chauffage capillaire. Effectuer m / z d'étalonnage du détecteur MS. Transfert de 50 ul d'extraits de flacon en verre pour LC-MS. Injecter 5 ul d'extraits de la LC-MS. 4. Analyse des données Configurer Xcalibur ou Metalign 4 et sélectionnez l'analyse des données à traiter. Préparer une table des pics détectés de votre intérêt en conformité avec classe de composés dans le Tableau I. L'identification des pics par la co-élution de composés standard. Annoter détecté des pics en utilisant MS 2 analyse, étude de la littérature, la recherche de base de données métabolite (figure 2, 12,13). 5. Prédiction de la voie métabolique Construire une voie possible avec des composés détectés. Prédiction de la voie en utilisant les annotations de pointe devrait être basée sur la structure chimique du composé détectés en prédisant lien entre les fonctions enzymatiques sur la voie métabolique 13. Étapes de biosynthèse de structuration devraient être menées avec l'annotation de pointe précis. Mais la détermination de la structure chimique détaillée, pour les fragment de sucre par exemple, n'est pas indispensable dans cette étape, parce que la prédiction de la fraction de sucre et de la position adduction est très difficile d'identifier par analyse MS. Détermination du type de sucre tels que hexoside et pentoside seront identifiés par un test enzymatique de donneur de sucre à la dernière étape du projet. La plupart du temps la construction de la prédiction de la voie doivent être effectués que petite molécule est intermédiaire de molécule plus grande, sauf dans les cas certains comme une réaction de déshydratation. Liste des poids moléculaire atomique, par exemple 16 m / z pour la différence entre-H et-OH fraction (oxydation), 14 m / z (l'atome de carbone) pour la différence entre-OH et-OMe (méthylation) et 162 m / z ( MW-H 2 O) pour hexose (glycosylation), est utile pour la prédiction. Détermination de laType de modification avec l'analyse de corrélation des spécificités des tissus aide de prédiction de la voie métabolique. Base de données de la voie métabolique général comme base de données KEGG ( http://www.genome.jp/kegg/ ) et PlantCyc ( http://plantcyc.org/~~V ), est très efficace pour la prédiction de la voie métabolique de votre intérêt. 6. Préparation de la liste des gènes avec l'ID gène d'Arabidopsis orthologues Télécharger la liste des ID du gène de la base de données génomique. Ajouter ID du gène d'Arabidopsis gène orthologue, dans le cas de votre plante cible n'est pas Arabidopsis. Préparez une liste de gènes dans votre voie d'intérêt. Annotation des données de la voie d'Arabidopsis et de données de familles de gènes sont disponibles dans le site Web TAIR ( http://www.arabidopsis.org/~~V ). Si vous avez préparé une liste de gènes orthologues Arabidopsis, vous pouvez ensuite combine eux. 7. Co-exprimés analyse génétique Testez l'aide de la liste de gènes préparée ID pour rechercher la meilleure base de données pour votre voie en vérifiant la corrélation en utilisant des paires de gènes bien connus dans votre voie d'intérêt (tableau II). Si la co-expression de base de données ou base de données l'expression des gènes ne sont pas disponibles dans l'installation de votre intérêt, Arabidopsis co-expression de base de données doit être utilisé avec une liste de gènes orthologues d'Arabidopsis. Dans le cas de l'orge, le riz, le peuplier, le blé, le soja et Medicago, la co-expression analyse des espèces végétales peuvent être utilisées (tableau II). Construire le cadre de votre cible co-expression de réseau basée sur les connexions des gènes bien connus dans votre voie d'intérêt. Ajouter gènes candidats corrélation (r <0,4 ~ 0,90, au sein de valeur approximative de la valeur du coefficient entre les connexions des gènes bien connus dans votre voie d'intérêt) et de vérifier leur annotation des gènes dans votre prfamilles édictées aux connexions de ce réseau pour trouver des gènes meilleur candidat (Figure 3). Seuil de valeur de coefficient doivent être coordonnées selon l'une structure de réseau et la densité de gènes corrélés. Faire une liste de gènes dont vous êtes en mesure d'affiner comme étant spécialisée à votre voie cible. Vérifiez l'expression des gènes des spécificités d'organes et les réponses au stress de vos gènes candidats. 8. L'intégration de toutes les informations pour prédire Nouveaux Sentiers Ajouter gènes bien caractérisés qui ont été utilisés pour la requête de la co-expression de l'analyse à la voie métabolique prédit. Vérifier les pièces non caractérisées dans cette voie, par exemple non caractérisés étapes enzymatiques, des protéines de transport et les facteurs de transcription. Prédire l'annotation des gènes les plus adaptés à ces étapes manquantes non caractérisés. Combiner les résultats de profilage des métabolites et des gènes candidats de in silico gel'expression ne basée sur la voie prévue. Organisez vos gènes candidats sur la voie prédite selon la fonction des gènes, par exemple, pour acétyltransférase acétylé métabolite, glycosyltransférase pour glycoside, P450 pour le composé oxydé. Analyse de l'arbre phylogénétique des séquences d'acides aminés est utile pour une famille de gènes gamme tels que P450 et glycosyltransférase. Vérifier la cohérence des spécificités des tissus ou des réactions de stress entre l'accumulation de métabolites et niveau d'expression génique de gènes candidats. Vérifiez les connexions au métabolisme d'autres pour fournir des gènes substrat et le stress sensibles. 9. Des expériences pour l'identification de gènes grâce aux bio-ressources Vérifiez la disponibilité de ressources biologiques pour la facilitation de l'expérience pour l'identification de gènes candidats. Effectuer une expérience pour l'identification de la fonction des gènes en utilisant des bio-ressources, telles que KO mutant bibliothèque et pleine longueur banque d'ADNc. Til expérimente pour l'identification fonctionnelle des gènes avec la préparation des plantes et la surexpression de mutants knock-out, le dosage enzymatique et dosage promoteur contraignant, doivent être effectuées pour les meilleurs gènes candidats dans votre prédiction. Dosage protéine recombinante pour la caractérisation des propriétés de protéines et de préparation de plantes surexpression mieux être effectuée après la confirmation de profil métabolite utilisant KO mutante étant donné qu'il est considérablement plus long à préparer une protéine recombinante et le clonage du gène pour la transformation. 10. Les résultats représentatifs La procédure d'analyse intégrée décrite dans ce protocole offre de nombreuses possibilités en fonction de fins expérimentales spécifié et le choix des combinaisons biologiques et analytiques. Choix des procédures et la conception expérimentale doit être effectuée correctement sur la base de votre voie cible, composés et les espèces végétales. La stratégie d'intégration décrites dans le présent protocole est foc utilisé sur l'annotation de la fonction des gènes des plantes et la découverte des fonctions des gènes nouveaux avec un usage efficace de plusieurs bio-et les données des ressources. Résultat escompté est promis de fournir avec le seul cas de la prédiction concluante. Ce fait indique que si des preuves suffisantes ne peut être donnée par les profils de combinaison, l'expérience ne devrait pas être démarré. Pour cette raison, dans tous les cas, d'autres expériences préliminaires telles que le profilage d'expression génique ciblée par RT-PCR, peuvent soutenir votre prédiction de la fonction des gènes. Précision et exactitude de la prédiction est en corrélation plus élevée en fonction de la différence qualitative et le numéro de la variation de la combinaison. En outre, les bons candidats et les résultats valides ne peut venir que de la prédiction précise des voies. Annotation de pointe devrait être menée par la combinaison de plusieurs approches, pour étude de la littérature, par exemple, extrait de plante de référence, MS n analyse, spécificité d'organe et de l'analyse mutant 13. 1 "src =" / files/ftp_upload/3487/3487fig1.jpg "/> Figure 1. Vue d'ensemble de l'écoulement expérimental de l'annotation des gènes par approche combinée. Dans certains cas, les projets commencent par la découverte d'un pic de roman qui est détecté dans des conditions particulières ou des tissus, et le désir de comprendre son rôle au sein de son métabolisme. Dans d'autres cas le but du projet est l'identification des gènes ou la découverte des principaux facteurs de régulation tels que les facteurs de transcription. Conception de l'expérience devrait être raboté avec un ensemble de données qui montre des différences claires de niveaux de métabolites dans votre voie cible, en utilisant un large éventail d'échantillons de tissus provenant de différents organes, et pour les plantes cultivées de façon différentielle ou des plantes exposées à des conditions de stress, et en soumettant le matériau à profilage des métabolites. Plantes mutantes et transgéniques ainsi que QTL matériel de reproduction hébergement représentent également appropriée le matériel génétique de ces études. Prédiction de la nouvelle voie doit être effectuée avec soin préciseannotation de pointe et une approche combinaison avec différents types de metabolotype tels que les titres d'organes et les réponses au stress en fonction de données d'expression génique de votre voie d'intérêt. Dans la dernière étape, le profilage et la transcription métabolite doit être effectuée qui sera par la suite, lorsqu'il est combiné avec une analyse in silico des web-ressources et dans la caractérisation in vitro de l'expression des gènes par l'intermédiaire d'expression hétérologue, conduire à la confirmation de la gène candidat et l'élucidation de sa fonction et la position dans une voie métabolique. Abréviations: QTL, Quantitative Trait Loci. Figure 2. Le flux de travail de l'approche combinatoire pour l'annotation de pointe. Une procédure d'identification de pointe et l'annotation par le composé standard, la comparaison de type sauvage et mutants knock out, la spectrométrie de masse multi-dimensionnelle de la crête cible se référant à des spectres de masse de la com purlivres des 12 bases de données. Abréviations: DB, bases de données; KO, knock-out; 1-D, une dimension; 2-D, à deux dimensions; RMN, résonance magnétique nucléaire; IR, infra-rouge; MS n, la masse-masse spectrométries. Figure 3. Exemple d'analyse de réseau de co-régulation de la voie des anthocyanes. Analyses de co-expression ont été réalisées en utilisant l'amorce ( http://prime.psc.riken.jp/?action=coexpression_index ) sur la base des données établies de la version 3 ATTEDII 8,2 avec le Programme Pajek ( http://vlado.fmf.uni-lj.si/pub/networks/pajek/ ). Des corrélations positives (r <0,5) sont utilisés pour établir des connexions réseau. Rouge noeud: douze gènes enzymatiques (anthocyanes At5g13930, CHS, TT4, chalcone synthase; At3g55120, CHI, TT5, chalcone isomérisation; At3g51240, F3H, TT6, flavanone 3-hydroxylase; At5g07990, F3'H, TT7, flavonoïde 3'-hydroxylase; At5g17050, Fd3GT, UGT78D2, flavinoïde 3 – O-glucosyltransférase; At5g17220, AtGSTF12, TT19 ; At5g42800, DFR, TT3, dihydroflavonol réductase; At4g22880, SNA / LDOX, TT18, anthocyanidine synthese; At4g14090, A5GT, anthocyanes 5 – O-glucosyltransférase; At5g54060, A3G2 "XT, putative anthocyanine 3 – O-glucoside 2" – O – xylosyltransferase; At3g29590, A5GMaT, anthocyanes 5 – O-glucoside 6'' '- O-malonyltransferase; At1g03940, A3GCouT, anthocyanine 3 – O-glucoside 6 "- O – p-coumaroyltransferase) et deux facteurs de transcription pour la production d'anthocyanine (At1g56650, PAP1; At1g66390, PAP2) a été utilisé pour la recherche des gènes candidats gènes candidats ont été trouvés par une «intersection des ensembles" de recherche avec une valeur seuil avec un coefficient de r <./ Em >> 0,50 interrogé par l'intersection des ensembles de tous les gènes interrogées (Quatorze gènes de biosynthèse de anthocyanes). Un réseau de co-expression, y compris les gènes candidats corrélés (68 gènes) et des gènes interrogées (14 gènes), a été re-construit par une «interconnexion des ensembles" recherche avec r> 0,50 en utilisant la base de données PRIME. Les fichiers de sortie qui ont été formatés avec un fichier '. Net »de la base de données PRIME et réseaux ont été établis en utilisant le logiciel Pajek. Noeud bleu indique des gènes candidats qui sont corrélés avec des gènes d'anthocyanine. espèce Major métabolite secondaire Arabidopsis thaliana Glucosinolates, les flavonols, anthocyanes, dérivé sinapoyl Populus trichocarpa Flavonols, anthocyanes, dérivé de salicylate Vitis vinifera Flavonols, anthocyanes, tanins, stilbène Solanum lycopersicum Flavonols, anthocyanes, glycoalcaloïde, chrologenate connexe, Nicotiana tabacum Flavonols, anthocyanes, nicotianamide, chrologenate connexe, acylsugar Oryza sativa Glycoflavone, anthocyanes, les dérivés de stérols Zea mai Glycoflavone, anthocyanes, benzoxazinone, dérivés du stérol Medicago truncatula Isoflavones, anthocyanes, la saponine, Japonica Lotus Isoflavones, flavonols, anthocyanes, la saponine, Tableau I. Principales métabolites secondaires des espèces végétales modèles. La co-expression de base de données Adresse Plante de croix specs Conférence des Parties http://webs2.kazusa.or.jp/kagiana/cop0911/~~V PlaNet http://aranet.mpimp-golm.mpg.de/ Les espèces végétales ATEED-II http://atted.jp/ BAR http://142.150.214.117/welcome.htm Conférence des Parties http://webs2.kazusa.or.jp/kagiana/cop GeneCAT http://genecat.mpg.de/ Arabidopsis AGIR http://www.arabidopsis.leeds.ac.uk/act/coexpanalyser AthCoR@CSB.DB http://csbdb.mpimp-golm.mpg.de/csbdb/dbcor/ath.html CressExpress http://cressexpress.org/~~V PRIMe http://prime.psc.riken.jp/?action=coexpression_index Oryza sativa RiceArrayNet http://arraynet.mju.ac.kr/arraynet/~~V Base de données array riz http://www.ricearray.org/coexpression/coexpression.shtml Tableau II. Disponible base de données d'expression génique pour in silico la co-expression d'analyse.