En este protocolo, presentamos un flujo de trabajo optimizado, que combina una preparación de muestras eficiente y rápida de muchas muestras. Además, proporcionamos una guía paso a paso para reducir las variaciones analíticas para la evaluación de alto rendimiento de los estudios metabólicos GWAS.
Tanto la cromatografía de gases-espectrometría de masas (GC-MS) como la cromatografía líquida-espectrometría de masas (LC-MS) son enfoques metabolómicos ampliamente utilizados para detectar y cuantificar cientos de miles de características de metabolitos. Sin embargo, la aplicación de estas técnicas a un gran número de muestras está sujeta a interacciones más complejas, particularmente para estudios de asociación de todo el genoma (GWAS). Este protocolo describe un flujo de trabajo metabólico optimizado, que combina una preparación de muestras eficiente y rápida con el análisis de un gran número de muestras para especies de cultivos de leguminosas. Este método de extracción ligeramente modificado se desarrolló inicialmente para el análisis de tejidos vegetales y animales y se basa en la extracción en metil terc-butil éter: disolvente de metanol para permitir la captura de metabolitos polares y lipídicos. Además, proporcionamos una guía paso a paso para reducir las variaciones analíticas, que son esenciales para la evaluación de alto rendimiento de la varianza metabólica en GWAS.
Los enfoques “ómicos” a gran escala han permitido el análisis de sistemas biológicos complejos 1,2,3 y una mayor comprensión del vínculo entre los genotipos y los fenotipos resultantes4. La metabolómica utilizando cromatografía líquida de ultra alto rendimiento-espectrometría de masas (UHPLC-MS) y GC-MS permitió la detección de una gran cantidad de características de metabolitos, de las cuales solo algunas están anotadas hasta cierto punto, lo que resulta en una alta proporción de metabolitos desconocidos. Las interacciones complejas se pueden explorar combinando la metabolómica a gran escala con la variación genotípica subyacente de una población diversa5. Sin embargo, el manejo de grandes conjuntos de muestras está inherentemente asociado con variaciones analíticas, distorsionando la evaluación de la varianza metabólica para procesos posteriores. Específicamente, los principales problemas que conducen a variaciones analíticas se basan en el rendimiento de la máquina y la deriva instrumental a lo largo del tiempo6. La integración de la variación de lote a lote es desafiante y especialmente problemática cuando se analizan poblaciones de plantas estructuradas a gran escala. Se sugirieron múltiples procedimientos de normalización para corregir las variaciones no biológicas, por ejemplo, el uso de estándares internos, externos e internos marcados con isótopos para corregir errores analíticos, de los cuales cada uno está inherentemente asociado con problemas y trampas conocidos 7,8,9,10.
Además de la variación analítica, la elección de los protocolos de extracción generalmente varía según el método analítico. En última instancia, se desea reducir los costos de material y mano de obra, así como la necesidad de utilizar varias alícuotas de la misma muestra para diversos procesos analíticos mediante la realización de métodos de extracción basados en la separación de fases. Estos métodos se introdujeron por primera vez utilizando cloroformo: disolventes de metanol/agua para fraccionar compuestos polares e hidrófobos11.
Este protocolo describe una tubería rápida de alto rendimiento para una plataforma multiómica para perfilar tanto metabolitos polares como lípidos en especies de leguminosas. Además, muestra cómo esos conjuntos de datos pueden corregirse adecuadamente para la variación analítica y normalizarse antes de integrar información genotípica para detectar loci de rasgos cuantitativos de metabolitos (QTL) mediante la realización de GWAS.
Tanto GC-MS como LC-MS son herramientas ampliamente utilizadas para perfilar mezclas complejas de varias clases de metabolitos. El manejo de grandes conjuntos de datos con estas herramientas está inherentemente asociado con una variación no biológica, por ejemplo, la variación analítica, que interfiere y sesga la interpretación de los resultados. Este protocolo presenta una tubería de extracción robusta y de alto rendimiento para perfiles metabólicos integrales para eliminar la variación del origen no biológico y realizar estudios “ómicos” a gran escala. Los volúmenes y concentraciones utilizados en este protocolo se ajustaron para las especies de leguminosas en diferentes tejidos. Sin embargo, estos parámetros también pueden modificarse ligeramente y utilizarse para muestras metabólicas a gran escala de otras especies de plantas.
Las15 extracciones basadas en MTBE descritas anteriormente se pueden usar para analizar metabolitos derivados, metabolitos semipolares y lípidos. Esto se puede ampliar para las extracciones de proteínas y hormonas vegetales39, que estaban fuera del alcance de este protocolo. Otros protocolos de extracción se basan en mezclas diclorometano:etanol40,41. De estos protocolos de extracción, el protocolo de extracción MTBE:metanol proporciona una alternativa favorable y menos peligrosa a los protocolos de extracción existentes a base de cloroformo42 y no da como resultado un pellet de proteína como interfase entre las fases polar y lipídica. Además, los métodos MTBE ya se han utilizado en varios estudios para diversas muestras biológicas 43,44,45.
Este protocolo discute varios pasos cruciales que podrían conducir a una variación potencial mientras se maneja una gran cantidad de muestras, por ejemplo, durante la cosecha12,13, la extracción14, así como la aleatorización46. Además, hay cuestiones adicionales que no se han discutido en este protocolo que deben considerarse para garantizar datos metabolómicos de alta calidad, por ejemplo, el efecto de matriz y la supresión de iones14.
El poder de los métodos de normalización basados en el control de calidad depende inherentemente del número de muestras de control de calidad en cada lote. Como se mencionó anteriormente, aunque aumentar el número aumentaría la potencia, la variación intra-lote de los QC es relativamente marginal en comparación con la variación entre lotes en estos sistemas analíticos, como se ilustra en la Figura 3. En general, existen otros métodos de normalización basados en el control de calidad, como la eliminación de errores sistémicos mediante bosque aleatorio (SERRF), que han demostrado superar a la mayoría de los otros métodos de normalización, como la relación por lotes, la normalización mediante una selección óptima de múltiples estándares internos (NOMIS) y la normalización probabilística del cociente (PQN)47 . Sin embargo, SERRF se basa en múltiples muestras de control de calidad en cada lote, por ejemplo, cada décima muestra, lo que no es factible mientras se maneja un gran número de muestras. La principal ventaja de la normalización basada en el control de calidad sobre otros métodos basados en datos o basados en estándares internos es que conserva la variación biológica esencial al tiempo que acomoda la variación técnica no deseada28. Los lectores pueden consultar esta revisión sobre el manejo de la variación28.
Un problema principal en GWAS es la tasa de falsos positivos, que se originan principalmente debido a la vinculación de sitios causales y no causales48,49. En segundo lugar, los enfoques conservadores de corrección estadística, por ejemplo, Bonferroni y FDR, corrigen el número de pruebas independientes, que no es igual al número de SNP ensayados en GWAS debido a la vinculación entre SNP próximos50,51 Por lo tanto, el número real de pruebas independientes es a menudo menor. Otra forma de reducir el umbral estadístico conservador sería reducir el número de SNP probados utilizados para GWAS basados en la desintegración de enlaces en regiones genómicas definidas52. La plataforma de metabolómica de alto rendimiento integrada en GWAS descrita en este protocolo tiene una amplia gama de aplicaciones. En particular, facilitará las mejoras en el mejoramiento de cultivos al cambiar la composición de metabolitos / lípidos para los niveles deseados industrial y nutricionalmente. En general, la metabolómica ha proporcionado una visión profunda de la arquitectura genética de una gran cantidad de metabolitos y diversificación metabólica que ocurrieron durante la domesticación de cultivos en las últimas décadas, lo que indica el vasto potencial de la reproducción asociada a la metabolómica53. Los enfoques biológicos moleculares para la validación QTL aguas abajo incluyen la generación de líneas mutantes CRISPR/Cas954, líneas de inserción de ADN-T55, líneas de sobreexpresión estables y/o transitorias56, VIGS, enfoques metabolómicos ex vivo 57 junto al enfoque convencional en la generación de poblaciones F2 cruzadas, así como validación cruzada en diferentes poblaciones.
Al realizar la corrección necesaria para las variaciones analíticas descritas anteriormente, se pueden realizar varios enfoques integrados además de GWAS, como el análisis de correlación metabolito-metabolito, metabolito-lípido, el análisis de correlación con datos fenómicos para arrojar luz sobre rasgos más complejos y / o el análisis de coexpresión para desentrañar aún más la base de los sistemas biológicos58.
The authors have nothing to disclose.
M.B. cuenta con el apoyo del IMPRS-PMPG ‘Metabolismo Primario y Crecimiento de las Plantas’. A.R.F. y S.A. reconocen el apoyo financiero del Programa de Investigación e Innovación Horizonte 2020 de la UE, el proyecto PlantaSYST (SGA-CSA No. 739582 bajo FPA No. 664620) y el proyecto INCREASE (GA 862862).
Reagents and standards | |||
1,2-diheptadecanoyl-sn-glycero-3- phosphocholine (17:0 PC) | Avanti Polar Lipids | 850360P | Internal standard for lipids |
Chloroform | Supleco | 67-66-3 | FAME solvent |
Isovitexin | Sigma Aldrich | 38953-85-4 | Internal standard for metabolites |
Lignoceric Acid Methylester | Sigma Aldrich | 2442-49-1 | FAME |
Methanol (MeOH) | Biosolve Chemicals | 13684102 | ULC-MS grade |
Methoxyamin -hydrochlorid | Sigma Aldrich | 593-56-6 | Metabolite deriviatization |
Methyl laurate | Sigma Aldrich | 111-82-0 | FAME |
Methyl myristate | Sigma Aldrich | 124-10-7 | FAME |
Methyl palmitate | Sigma Aldrich | 112-39-0 | FAME |
Methyl stearate | Sigma Aldrich | 112-61-8 | FAME |
Methyl tert-butyl ether (MTBE) | Biosolve Chemicals | 13890602 | HPLC grade |
Methyl-caprat | Sigma Aldrich | 110-42-9 | FAME |
Methylcaprylat | Sigma Aldrich | 111-11-5 | FAME |
Methyldocosanoat | Sigma Aldrich | 929-77-1 | FAME |
Methyleicosanoat | Sigma Aldrich | 1120-28-1 | FAME |
Methyl-hexacosanoat | Sigma Aldrich | 5802-82-4 | FAME |
Methyl-octacosanoat | Sigma Aldrich | 55682-92-3 | FAME |
Methyl-pelargonate | Sigma Aldrich | 1731-84-6 | FAME |
N-Methyl-N-(trimethylsilyl)trifluoracetamid (MSTFA) | Macherey-Nagel | 24589-78-4 | Metabolite deriviatization |
Pyridine | Supleco | 110-86-1 | Metabolite deriviatization |
Ribitol | Supleco | 22566-17-2 | Internal standard for derivatized metabolites |
Triacontanoic Acid Methyl Ester | TCI Chemicals | 629-83-4 | FAME |
Water | Biosolve Chemicals | 23214102 | ULC-MS grade |
Equipment | |||
1.5 mL Safe-lock microcentrifuge tubes | Eppendorf | 3120086 | |
2 mL Safe-lock microcentrifuge tubes | Eppendorf | 3120094 | |
Balance | Sartorius Corporation | 14 557 572 | |
DB-35ms, 30 m, 0,25 mm, 0,25 µm | Aglient | 123-3832 | Analysis of derivatized metabolites |
GC-MS system | Leco Pegasus HT TOF-MS (LECO Corporation) | Analysis of derivatized metabolites | |
Grinding Balls, Stainless Steel | OPS DIAGNOSTICS | GBSS 196-2500-10 | |
MS system | Exactive, Orbitrap-type, MS (Exactive, Thermo Fisher Scientific) | Analysis of lipids | |
MS system | Q Exactive Focus (Q Exactive™ Focus Hybrid Quadrupol-Orbitrap™ Massenspektrometer, Thermo Fisher Scientific) |
Analysis of metabolites | |
Refrigerated microcentrifuge | Eppendorf, model 5427R | 22620701 | |
Reversed Phase (RP) Bridged Ethyl Hybrid (BEH) C8 column (100 mm × 2.1 mm containing 1.7 μm diameter particles) |
Waters | 186002878 | Analysis of lipids |
RP High Strength Silica (HSS) T3 column (100 mm × 2.1 mm containing 1.8 μm diameter particles) |
Waters | 186003539 | Analysis of metabolites |
Shaker | Eppendorf Thermomixer 5436 | 2050-100-05 | |
Sonicator | USC 300 TH | 142-0084 | |
Tissue grinding mixer mill | Retsch, Mixer Mill MM 300 | 20.746.0001 | |
UPLC system | Waters Acquity UPLC system (Waters) | ||
Vacuum concentrator | Scan Speed Maxi Vac Alpha Evaporators | 7.008.500.002 | |
Vortex mixer | Vortex-Genie 2, Model G560 | SI-0236 | |
Software | |||
MetAlign | Chromatogram processing | ||
MzMine | Chromatogram processing | ||
R package "data.table" | |||
R package "fujiplot" | pleiotrpoic map | ||
R package "genetics" | |||
R package "Ime4" | BLUPs calculation | ||
R package "LDheatmap" | LD plots | ||
R package "MASS" | transformation | ||
R package "rMVP" | GWAS | ||
R version 4.0.4 | |||
RefinerMS | Chromatogram processing | ||
RefinerMS Genedata | Expressionist | Chromatogram processing | |
Tassel 5 | Genotype filtering | ||
Xcalibur | Thermo Fisher Scientific | OPTON-30965 | Chromatogram processing |