Neste protocolo, apresentamos um fluxo de trabalho otimizado, que combina uma preparação eficiente e rápida de amostras de muitas amostras. Além disso, fornecemos um guia passo-a-passo para reduzir as variações analíticas para avaliação de alto rendimento de estudos metabólicos de GWAS.
Tanto a espectrometria de massa da cromatografia gasosa -masstrometria (GC-MS) quanto a espectrometria de massa cromatografia líquida (LC-MS) são abordagens metabolômicas amplamente utilizadas para detectar e quantificar centenas de milhares de características metabólicas. No entanto, a aplicação dessas técnicas a um grande número de amostras está sujeita a interações mais complexas, particularmente para estudos de associação genoma (GWAS). Este protocolo descreve um fluxo de trabalho metabólico otimizado, que combina uma preparação eficiente e rápida da amostra com a análise de um grande número de amostras para espécies de culturas de leguminosas. Este método de extração ligeiramente modificado foi inicialmente desenvolvido para a análise de tecidos vegetais e animais e é baseado na extração em éter de tert-butil metil: solvente de metanol para permitir a captura de metabólitos polares e lipídicos. Além disso, fornecemos um guia passo-a-passo para a redução das variações analíticas, essenciais para a avaliação de alto rendimento da variância metabólica no GWAS.
Abordagens “omics” em larga escala permitiram a análise de sistemas biológicos complexos 1,2,3 e maior compreensão da ligação entre genótipos e os fenótipos4 resultantes. Metabolômica usando espectrometria de massa líquida de alto desempenho (UHPLC-MS) e GC-MS permitiu a detecção de uma infinidade de características metabólicas, das quais apenas algumas estão anotadas em um certo grau, resultando em uma alta proporção de metabólitos desconhecidos. Interações complexas podem ser exploradas combinando metabolômicas em larga escala com a variação genotipica subjacente de uma população diversificada5. No entanto, o manuseio de grandes conjuntos amostrais está inerentemente associado a variações analíticas, distorcendo a avaliação da variância metabólica para outros processos a jusante. Especificamente, as principais questões que levam a variações analíticas são baseadas no desempenho da máquina e na deriva instrumental ao longo do tempo6. A integração da variação em lote a lote é desafiadora e especialmente problemática ao analisar populações estruturadas de plantas em larga escala. Foram sugeridos múltiplos procedimentos de normalização para corrigir para variações não biológicas, por exemplo, o uso de normas internas, externas e isótopos rotuladas para corrigir erros analíticos, dos quais cada um está inerentemente associado a problemas e armadilhas conhecidos 7,8,9,10.
Além da variação analítica, a escolha dos protocolos de extração geralmente varia dependendo do método analítico. Em última análise, deseja-se reduzir os custos materiais e trabalhistas, bem como a necessidade de utilizar várias alíquotas da mesma amostra para vários processos analíticos, realizando métodos de extração baseados em separação de fases. Estes métodos foram introduzidos pela primeira vez usando clorofórmio: solventes de metanol/água para fracionar compostos polares e hidrofóbicos11.
Este protocolo descreve um rápido pipeline de alto rendimento para uma plataforma multi-omics para traçar o perfil tanto metabólitos polares quanto lipídios em espécies de leguminosas. Além disso, mostra como esses conjuntos de dados podem ser adequadamente corrigidos para variação analítica e normalizados antes de integrar informações genotípicas para detectar loci de traço quantitativo metabólico (QTL) realizando GWAS.
Tanto o GC-MS quanto o LC-MS são ferramentas amplamente utilizadas para traçar misturas complexas de várias classes metabólicas. O manuseio de grandes conjuntos de dados com essas ferramentas está inerentemente associado a uma variação não biológica, por exemplo, variação analítica, que interfere e viese a interpretação dos resultados. Este protocolo apresenta um robusto e de alto rendimento de extração de gasodutos de extração para perfis metabólicos abrangentes para eliminar a variação de origem não biológica e realizar estudos de “omics” em larga escala. Os volumes e concentrações utilizados neste protocolo foram ajustados para espécies de leguminosas em diferentes tecidos. No entanto, esses parâmetros podem ser ligeiramente modificados e usados para amostras metabólicas em larga escala de outras espécies vegetais também.
As15 extrações descritas anteriormente baseadas em MTBE podem ser usadas para analisar metabólitos derivatizados, metabólitos semipolares e lipídios. Isso pode ser expandido para extrações de proteínas e hormônios vegetais39, que estavam fora do escopo deste protocolo. Outros protocolos de extração dependem de diclorometano: misturas de etanol40,41. Desses protocolos de extração, o protocolo de extração de metanol MTBE:fornece uma alternativa favorável e menos perigosa aos protocolos de extração baseados em clorofórmioexistentes 42 e não resulta em uma pelota de proteína como uma interfase entre as fases polar e lipídica. Além disso, os métodos MTBE já foram utilizados em diversos estudos para diversas amostras biológicas 43,44,45.
Este protocolo discute várias etapas cruciais que podem levar a uma potencial variação ao manusear um grande número de amostras, por exemplo, durante a colheitade 12,13, extração14, bem como randomização46. Além disso, há questões adicionais que não foram discutidas neste protocolo que devem ser consideradas para garantir dados metabolômicos de alta qualidade, por exemplo, efeito matricial e supressão deíons 14.
O poder dos métodos de normalização baseados em QC depende inerentemente do número de amostras de QC em cada lote. Como mencionado anteriormente, embora o aumento do número aumente a potência, a variação intra-lote dos QCs é relativamente marginal em comparação com a variação entre lotes nesses sistemas analíticos, como ilustrado na Figura 3. No geral, existem outros métodos de normalização baseados em QC, como a remoção de erros sistêmicos usando a floresta aleatória (SERRF), que têm sido mostrados para superar a maioria dos outros métodos de normalização, como a relação em lote-wise, a normalização usando uma seleção ideal de vários padrões internos (NOMIS) e a normalização probabilística (PQN)47 . No entanto, a SERRF conta com várias amostras de QC em cada lote, por exemplo, cada décima amostra, o que não é viável durante o manuseio de um grande número de amostras. A principal vantagem da normalização baseada em QC em relação a outros métodos baseados em padrões baseados em dados ou internos é que ela retém a variação biológica essencial, ao mesmo tempo em que acomoda a variação técnica indesejada28. Os leitores podem consultar esta revisão sobre o manuseio da variação28.
Uma questão principal no GWAS é a taxa de falsos positivos, que se originam principalmente devido à ligação de sítios causais e não causais 48,49. Em segundo lugar, as abordagens conservadoras de correção estatística, por exemplo, Bonferroni e FDR, corrijam para o número de testes independentes, o que não é igual ao número de SNPs testados no GWAS devido à ligação entre os SNPspróximos 50,51 Portanto, o número real de testes independentes é muitas vezes menor. Outra forma de reduzir o limiar estatístico conservador seria reduzir o número de SNPs testados usados para GWAS com base na decadência de ligação sobre as regiões genômicasdefinidas 52. A plataforma de metabolômica de alto rendimento integrada pela GWAS descrita neste protocolo tem uma ampla gama de aplicações. Em particular, facilitará melhorias na criação de culturas, alterando a composição metabólito/lipída para níveis industrial e nutricionalmente desejados. No geral, a metabolômica forneceu uma visão aprofundada da arquitetura genética de uma infinidade de metabólitos e diversificação metabólica que ocorreu durante a domesticação das culturas nas últimas décadas, indicando o vasto potencial de reprodução associada à metabolômica53. As abordagens biológicas moleculares para validação de QTL a jusante incluem a geração de linhas mutantes CRISPR/Cas954, linhas de inserção T-DNA55, linhas de superexpressão estável e/ou transitória56, VIGS, ex vivo metabolômica se aproxima57 ao lado da abordagem convencional na geração de populações transversais F2, bem como validação cruzada em diferentes populações.
Ao realizar a correção necessária para as variações analíticas descritas acima, várias abordagens integradas podem ser realizadas além do GWAS, como metabólito-metabólito, análise de correlação metabólica-lipídica, análise de correlação com dados fenomicos para esclarecer traços mais complexos e/ou análise de co-expressão para desvendar ainda mais a base dos sistemas biológicos58.
The authors have nothing to disclose.
O M.B. é apoiado pelo IMPRS-PMPG ‘Metabolismo Primário e Crescimento Vegetal’. A A.R.F. e a S.A. reconhecem o apoio financeiro do Programa de Pesquisa e Inovação da EU Horizon 2020, do projeto PlantaSYST (SGA-CSA No. 739582 sob o FPA nº 664620) e do projeto INCREASE (GA 862862).
Reagents and standards | |||
1,2-diheptadecanoyl-sn-glycero-3- phosphocholine (17:0 PC) | Avanti Polar Lipids | 850360P | Internal standard for lipids |
Chloroform | Supleco | 67-66-3 | FAME solvent |
Isovitexin | Sigma Aldrich | 38953-85-4 | Internal standard for metabolites |
Lignoceric Acid Methylester | Sigma Aldrich | 2442-49-1 | FAME |
Methanol (MeOH) | Biosolve Chemicals | 13684102 | ULC-MS grade |
Methoxyamin -hydrochlorid | Sigma Aldrich | 593-56-6 | Metabolite deriviatization |
Methyl laurate | Sigma Aldrich | 111-82-0 | FAME |
Methyl myristate | Sigma Aldrich | 124-10-7 | FAME |
Methyl palmitate | Sigma Aldrich | 112-39-0 | FAME |
Methyl stearate | Sigma Aldrich | 112-61-8 | FAME |
Methyl tert-butyl ether (MTBE) | Biosolve Chemicals | 13890602 | HPLC grade |
Methyl-caprat | Sigma Aldrich | 110-42-9 | FAME |
Methylcaprylat | Sigma Aldrich | 111-11-5 | FAME |
Methyldocosanoat | Sigma Aldrich | 929-77-1 | FAME |
Methyleicosanoat | Sigma Aldrich | 1120-28-1 | FAME |
Methyl-hexacosanoat | Sigma Aldrich | 5802-82-4 | FAME |
Methyl-octacosanoat | Sigma Aldrich | 55682-92-3 | FAME |
Methyl-pelargonate | Sigma Aldrich | 1731-84-6 | FAME |
N-Methyl-N-(trimethylsilyl)trifluoracetamid (MSTFA) | Macherey-Nagel | 24589-78-4 | Metabolite deriviatization |
Pyridine | Supleco | 110-86-1 | Metabolite deriviatization |
Ribitol | Supleco | 22566-17-2 | Internal standard for derivatized metabolites |
Triacontanoic Acid Methyl Ester | TCI Chemicals | 629-83-4 | FAME |
Water | Biosolve Chemicals | 23214102 | ULC-MS grade |
Equipment | |||
1.5 mL Safe-lock microcentrifuge tubes | Eppendorf | 3120086 | |
2 mL Safe-lock microcentrifuge tubes | Eppendorf | 3120094 | |
Balance | Sartorius Corporation | 14 557 572 | |
DB-35ms, 30 m, 0,25 mm, 0,25 µm | Aglient | 123-3832 | Analysis of derivatized metabolites |
GC-MS system | Leco Pegasus HT TOF-MS (LECO Corporation) | Analysis of derivatized metabolites | |
Grinding Balls, Stainless Steel | OPS DIAGNOSTICS | GBSS 196-2500-10 | |
MS system | Exactive, Orbitrap-type, MS (Exactive, Thermo Fisher Scientific) | Analysis of lipids | |
MS system | Q Exactive Focus (Q Exactive™ Focus Hybrid Quadrupol-Orbitrap™ Massenspektrometer, Thermo Fisher Scientific) |
Analysis of metabolites | |
Refrigerated microcentrifuge | Eppendorf, model 5427R | 22620701 | |
Reversed Phase (RP) Bridged Ethyl Hybrid (BEH) C8 column (100 mm × 2.1 mm containing 1.7 μm diameter particles) |
Waters | 186002878 | Analysis of lipids |
RP High Strength Silica (HSS) T3 column (100 mm × 2.1 mm containing 1.8 μm diameter particles) |
Waters | 186003539 | Analysis of metabolites |
Shaker | Eppendorf Thermomixer 5436 | 2050-100-05 | |
Sonicator | USC 300 TH | 142-0084 | |
Tissue grinding mixer mill | Retsch, Mixer Mill MM 300 | 20.746.0001 | |
UPLC system | Waters Acquity UPLC system (Waters) | ||
Vacuum concentrator | Scan Speed Maxi Vac Alpha Evaporators | 7.008.500.002 | |
Vortex mixer | Vortex-Genie 2, Model G560 | SI-0236 | |
Software | |||
MetAlign | Chromatogram processing | ||
MzMine | Chromatogram processing | ||
R package "data.table" | |||
R package "fujiplot" | pleiotrpoic map | ||
R package "genetics" | |||
R package "Ime4" | BLUPs calculation | ||
R package "LDheatmap" | LD plots | ||
R package "MASS" | transformation | ||
R package "rMVP" | GWAS | ||
R version 4.0.4 | |||
RefinerMS | Chromatogram processing | ||
RefinerMS Genedata | Expressionist | Chromatogram processing | |
Tassel 5 | Genotype filtering | ||
Xcalibur | Thermo Fisher Scientific | OPTON-30965 | Chromatogram processing |