1. Preparación de la muestra Los materiales vegetales se cosechan y se congela inmediatamente. Materiales congelados vegetales en polvo por el molino mezclador (o mortero) y se almacena en Falcon tubo o tubos Eppendorf a -80 ° C. 2. La extracción de perfiles de metabolitos Alícuota congelada material vegetal en un tubo Eppendorf de 2 ml. Añadir 5 l de tampón de extracción por miligramo de peso fresco de material vegetal congelado. Añadir un metal (o gilconia) pelota y homogeneizar de polvo congelado con el molino mezclador de 2 min a 25 ls-1. Centrifugar 10 min a 12.000 rpm. Transferir el sobrenadante a NANOSEP filtro centrífugo. Centrifugar 2 min a 4.000 rpm. Transferir el sobrenadante a un tubo Eppendorf nuevo y almacenar a -20 ° C hasta su uso. 3. Metabolito de perfiles por LC-MS Establecer HPLC y compruebe la temperatura del horno de la columna y la bandeja de la muestra. Establecer condiciones de MS y comprobar el estado de vacío y calefacción capilar. Realizar m / z calibración del detector de MS. La transferencia de 50 l de los extractos de vial de vidrio para LC-MS. Inyectar 5 ml de los extractos de LC-MS. 4. Análisis de Datos Configurar Xcalibur o Metalign 4 y seleccione el análisis de datos para ser procesados. Preparar una tabla de los picos detectados de su interés, de acuerdo con la clase de compuesto en la Tabla I. Identificar picos por la co-elución de compuestos estándar. Anotar detectado picos utilizando MS 2 análisis, estudio de la literatura, la búsqueda de base de datos metabolito (Figura 2, 12,13). 5. Predicción de la vía metabólica Construir un camino posible con compuestos detectados. Predicción de la vía el uso de anotaciones de pico debe basarse en la estructura química del compuesto detectados mediante la predicción de que une las funciones enzimáticas de la vía metabólica 13. Estructuración de la biosíntesis de los pasos deben llevarse a cabo con la anotación máxima precisión. Pero la determinación de la estructura química detallada, por ejemplo resto de azúcar, no es indispensable en este paso, porque la predicción de resto de azúcar y la posición de aducción es muy difícil de identificar por análisis EM. Determinación del tipo de azúcar, tal como hexoside y pentoside serán identificados mediante un ensayo enzimático de donante de azúcar en el último paso del proyecto. Sobre todo la construcción de la predicción de la vía debe realizarse lo más pequeña molécula es más grande intermedio de la molécula, excepto en los casos de algunos, como reacción de deshidratación. Lista de peso molecular atómica, por ejemplo 16 m / z para la diferencia entre-H y-OH resto (oxidación), 14 m / z (el átomo de carbono) por la diferencia entre-OH y-OMe (metilación) y 162 m / z ( MW-H 2 O) para hexosa (glicosilación), es útil para la predicción. Determinación deltipo de modificación con el análisis de correlación de las especificidades de los tejidos ayuda a la predicción de la vía metabólica. Base de datos de la vía metabólica general, como base de datos KEGG ( http://www.genome.jp/kegg/ ) y PlantCyc ( http://plantcyc.org/~~V ), es muy eficaz para la predicción de la vía metabólica de su interés. 6. Preparación de la lista de genes de Arabidopsis con la identificación de genes ortólogos Descargar lista de genes de identificación de la base de datos genómica. Añadir Identificación de genes de Arabidopsis genes ortólogos, en el caso de la planta de destino no es la Arabidopsis. Prepare una lista de los genes en la vía de interés. Anotación de los datos de la vía de Arabidopsis y los datos de la familia de genes están disponibles en el sitio web TAIR ( http://www.arabidopsis.org/~~V ). Si prepara una lista de genes de Arabidopsis ortólogos, que posteriormente pueden combine ellos. 7. Co-expresó Gene Análisis Pruebe con la lista de genes ID preparado para buscar la mejor base de datos para el control de la vía por la relación con los pares de genes bien conocidos en la vía de interés (Tabla II). Si la co-expresión base de datos o base de datos de expresión de los genes no están disponibles en la planta de su interés, Arabidopsis co-expresión de base de datos se debe utilizar con una lista de Arabidopsis genes ortólogos. En el caso de la cebada, arroz, álamo, trigo, soja y Medicago, co-expresión análisis de las especies de plantas se puede utilizar (Tabla II). Construir el marco de su objetivo de co-expresión de red basado en las conexiones de los genes conocidos en su camino de intereses. Añadir genes correlacionados candidatos (r <0,4 ~ 0,90, en el valor aproximado del valor de coeficiente de correlación entre las conexiones de los genes conocidos en su camino de intereses) y comprobar su anotación de genes en su prfamilias edicted a las conexiones de esta red para encontrar las mejores genes candidatos (Figura 3). Umbral de valor del coeficiente debe ser coordinado de acuerdo con la estructura de red y la densidad de genes correlacionados. Haga una lista de genes que son capaces de reducir el número como especializada para su camino de destino. Compruebe la expresión génica de las especificidades de órganos y respuestas de estrés de los genes de sus candidatos. 8. Integración de toda la información para predecir Nuevos Caminos Añadir los genes bien caracterizados que se han utilizado para la consulta de análisis co-expresión de la vía metabólica predicho. Revise las partes no caracterizados en esta vía, por ejemplo, no caracterizado pasos enzimáticos, proteínas de transporte y los factores de transcripción. Predecir la anotación de genes más adecuados para estos pasos que faltan no caracterizados. Combinar los resultados de perfiles metabólicos y genes candidatos de la in silico de GEne expresión basada en la vía prevista. Arregle sus genes candidatos en la vía prevista de acuerdo con la función del gen, por ejemplo, para acetiltransferasa acetilado glicosiltransferasa metabolito, por glicósido, P450 para el compuesto oxidado. El análisis filogenético árbol de secuencias de aminoácidos es útil para algunos familia de genes de ancho como P450 y glicosiltransferasa. Compruebe la consistencia de las especificidades del tejido o las respuestas de estrés entre la acumulación de metabolitos y la expresión génica de los genes candidatos. Verifique las conexiones con el metabolismo de otros genes para proporcionar el sustrato y el estrés de respuesta. 9. Los experimentos para la identificación genética mediante el uso de Bio-recursos Verifique la disponibilidad de los recursos biológicos para la facilitación de la experimentación para la identificación de genes candidatos. Lleve a cabo un experimento para la identificación de la función de genes usando los recursos biológicos, tales como KO biblioteca de mutantes y de larga duración biblioteca de cDNA. Texperimenta para la identificación funcional de los genes con la preparación de las plantas de la sobreexpresión y mutantes knock-out, ensayo enzimático de ensayo y promotor de unión, tienen que llevar a cabo para los genes mejores candidatos en su predicción. Ensayo de proteínas recombinantes para la caracterización de las propiedades de la proteína y la preparación de las plantas sobreexpresión mejor para llevar a cabo después de la confirmación de perfil metabolito utilizando KO mutante ya que toma mucho más tiempo para preparar la proteína recombinante y la clonación de genes para la transformación. 10. Los resultados representativos El procedimiento de análisis integrado se describe en este protocolo tiene muchas posibilidades dependiendo del propósito específico experimental y elección de las combinaciones biológicas y analíticas. Elección del procedimiento y el diseño experimental se llevó a cabo correctamente sobre la base de su vía de destino, los compuestos y las especies de plantas. La estrategia de integración descrito en este protocolo es foc utilizada en la anotación de la función de genes de plantas y el descubrimiento de nuevas funciones génicas con un uso eficiente de varios bio-y los datos de los recursos. Resultado esperado se comprometió a proporcionar el único caso de la predicción concluyente. Este hecho indica que si suficientes evidencias no se pueden dar por los perfiles de la combinación, el experimento no se debe iniciar. Por esta razón, en cualquier caso, los experimentos preliminares adicionales, tales como perfiles de expresión génica dirigida por RT-PCR, se puede apoyar a su predicción de la función del gen. La precisión y la exactitud de la predicción se correlaciona más alto dependiendo de la diferencia cualitativa y número de la variación de la combinación. Además, los buenos candidatos y los resultados son válidos sólo puede venir de una predicción precisa de las vías. Anotación de pico debe llevarse a cabo mediante la combinación de varios enfoques, por ejemplo, la encuesta la literatura, el extracto de la planta de referencia, el análisis de MS n, la especificidad de órgano y el análisis de mutantes 13. 1 "src =" / files/ftp_upload/3487/3487fig1.jpg "/> Figura 1. Descripción del flujo experimental de la anotación de genes a través de enfoque combinado. En algunos casos, los proyectos comienzan con el descubrimiento de un pico de la novela que se detecta en condiciones especiales o tejidos, y el deseo de comprender su papel dentro de su metabolismo. En otros casos, el objetivo del proyecto es la identificación de genes o el descubrimiento de los principales factores de regulación, tales como factores de transcripción. Diseño de experimento debe ser cepillada con un conjunto de datos que muestra claras diferencias de los niveles de metabolitos en la vía de destino, utilizando una amplia gama de muestras de tejidos de diferentes órganos, y para las plantas que crecen diferencialmente o plantas expuestas a condiciones de estrés, y sometiendo el material a perfiles de metabolitos. Las plantas mutantes y transgénicas, así como material de reproducción QTL acogida también representan un material adecuado para estos estudios genéticos. Predicción de la nueva vía se debe realizar con cuidado con precisiónanotación de pico y acercamiento de la combinación con diferentes tipos de metabolotype como los valores de órganos y respuestas de estrés de acuerdo a los datos de expresión génica de la vía de interés. En la última etapa, perfiles de metabolitos y la transcripción se debe realizar que a la larga, cuando se combina con análisis in silico de los recursos web y caracterización in vitro de la expresión génica a través de la expresión heteróloga, conducir a la confirmación del candidato de genes y la elucidación de su función y la posición dentro de una vía metabólica. Abreviaturas: Loci QTL, rasgo cuantitativo. Figura 2. El flujo de trabajo de aproximación mixta para la anotación del pico. Un procedimiento para la identificación de los picos y la anotación por el compuesto estándar, la comparación de tipo salvaje y mutantes knock out, multi-dimensional de espectrometría de masas del pico de destino se refiere a los espectros de masas de la comunidad purade libras de las 12 bases de datos. Abreviaturas: DB, base de datos; KO, knock-out, 1-D, de una dimensión; 2-D, de dos dimensiones, RMN, la resonancia magnética nuclear, IR, infrarrojo, MS n, de comunicación de masas spectrometries. Figura 3. Ejemplo de análisis de co-regulación de la red de la vía de antocianina. Análisis de co-expresión se realizaron con el principal ( http://prime.psc.riken.jp/?action=coexpression_index ), basado en el conjunto de datos de la versión 3 ATTEDII 8,2 con la Pajek programa ( http://vlado.fmf.uni-lj.si/pub/networks/pajek/ ). Las correlaciones positivas (r <0,5) se utilizan para hacer las conexiones de red. Red de nodos: doce genes de antocianina enzimáticos (At5g13930, CHS, T4T, la sintasa de chalcona, At3g55120, CHI, TT5, chalcona isomerise; At3g51240, F3H, TT6, flavanona 3-hidroxilasa; At5g07990, F3'H, TT7, flavonoide 3'-hidroxilasa; At5g17050, Fd3GT, UGT78D2, flavonoide 3 – O-glucosiltransferasa, At5g17220, AtGSTF12, TT19 ; At5g42800, DFR, TT3, dihidroflavonol reductasa; At4g22880, ANS / LDOX, TT18, antocianidina synthése; At4g14090, A5GT, antocianinas 5 – O-glucosiltransferasa, At5g54060, A3G2 "XT, supuesta antocianina 3 – O-glucósido 2" – O – xilosiltransferasa; At3g29590, A5GMaT, antocianinas 5 – O-glucósido 6'' '- O-malonyltransferase; At1g03940, A3GCouT, antocianina 3 – O-glucósido 6 "- O – P-coumaroyltransferase) y dos factores de transcripción para la producción de antocianinas (At1g56650, PAP1; At1g66390, PAP2) se utilizó para la búsqueda de genes candidatos genes candidatos fueron encontrados por una "intersección de conjuntos" de búsqueda con un valor umbral, con un coeficiente de r <./ Em >> 0,50 preguntó por la intersección de los conjuntos de todos los genes buscado (catorce genes de biosíntesis de antocianinas). Una red de co-expresión, incluida la correlación de los genes candidatos (68 genes) y los genes consultados (14 genes), fue reconstruido por una "interconexión de los conjuntos de" búsqueda con r> 0,50 con la base de datos PRIME. Los archivos de salida que se ha dado formato con un archivo '.' Red de la base de PRIME y las redes se extrajeron utilizando el software Pajek. Nodo de color azul indica los genes candidatos que se correlacionaban con los genes de antocianina. especies Mayor metabolito secundario Arabidopsis thaliana Glucosinolatos, flavonoides, antocianinas, derivado de sinapoyl Populus trichocarpa Flavonoles, antocianinas, derivado de salicilato de Vitis vinifera Flavonoles, antocianinas, taninos, estilbeno Solanum lycopersicum Flavonoles, antocianinas, glicoalcaloides, chrologenate relacionados, Nicotiana tabacum Flavonoles, antocianinas, nicotianamide, chrologenate relacionado, acylsugar Oryza sativa Glycoflavone, antocianinas, derivados de esteroles Zea mayo Glycoflavone, antocianinas, benzoxazinona, derivados de esteroles Medicago truncatula Isoflavonas, antocianos, saponina, Lotus japonica Isoflavonas, flavonoides, antocianinas, saponina, Tabla I. Los principales metabolitos secundarios en especies de plantas modelo. Co-expresión de base de datos Dirección Planta de cruz especificacioness Conferencia de las Partes http://webs2.kazusa.or.jp/kagiana/cop0911/~~V PlaNet http://aranet.mpimp-golm.mpg.de/ Las especies de plantas ATEED-II http://atted.jp/ BAR http://142.150.214.117/welcome.htm Conferencia de las Partes http://webs2.kazusa.or.jp/kagiana/cop GeneCAT http://genecat.mpg.de/ Arabidopsis ACT http://www.arabidopsis.leeds.ac.uk/act/coexpanalyser AthCoR@CSB.DB http://csbdb.mpimp-golm.mpg.de/csbdb/dbcor/ath.html CressExpress http://cressexpress.org/~~V PRIME http://prime.psc.riken.jp/?action=coexpression_index Oryza sativa RiceArrayNet http://arraynet.mju.ac.kr/arraynet/~~V Arroz de base de datos de matriz http://www.ricearray.org/coexpression/coexpression.shtml Tabla II. Base de datos disponible para la expresión génica en silico co-expresión de análisis.