In questo protocollo, presentiamo un flusso di lavoro ottimizzato, che combina una preparazione efficiente e veloce del campione di molti campioni. Inoltre, forniamo una guida passo-passo per ridurre le variazioni analitiche per la valutazione ad alto rendimento degli studi GWAS metabolici.
Sia la gascromatografia-spettrometria di massa (GC-MS) che la cromatografia liquida-spettrometria di massa (LC-MS) sono approcci metabolomici ampiamente utilizzati per rilevare e quantificare centinaia di migliaia di caratteristiche metaboliche. Tuttavia, l’applicazione di queste tecniche a un gran numero di campioni è soggetta a interazioni più complesse, in particolare per gli studi di associazione genome-wide (GWAS). Questo protocollo descrive un flusso di lavoro metabolico ottimizzato, che combina una preparazione efficiente e veloce del campione con l’analisi di un gran numero di campioni per le specie di leguminose. Questo metodo di estrazione leggermente modificato è stato inizialmente sviluppato per l’analisi di tessuti vegetali e animali e si basa sull’estrazione in etere metil-terz-butilico: solvente metanolo per consentire la cattura di metaboliti polari e lipidici. Inoltre, forniamo una guida passo-passo per ridurre le variazioni analitiche, che sono essenziali per la valutazione ad alto rendimento della varianza metabolica nei GWAS.
Approcci “omici” su larga scala hanno permesso l’analisi di sistemi biologici complessi 1,2,3 e un’ulteriore comprensione del legame tra genotipi e fenotipi risultanti4. La metabolomica che utilizza la cromatografia liquida ad altissime prestazioni-spettrometria di massa (UHPLC-MS) e GC-MS ha permesso il rilevamento di una pletora di caratteristiche metaboliche, di cui solo alcune sono annotate in una certa misura, risultando in un’alta percentuale di metaboliti sconosciuti. Le interazioni complesse possono essere esplorate combinando la metabolomica su larga scala con la variazione genotipica sottostante di una popolazione diversificata5. Tuttavia, la gestione di grandi set di campioni è intrinsecamente associata a variazioni analitiche, distorcendo la valutazione della varianza metabolica per ulteriori processi a valle. In particolare, i principali problemi che portano a variazioni analitiche si basano sulle prestazioni della macchina e sulla deriva strumentale nel tempo6. L’integrazione della variazione da lotto a lotto è impegnativa e particolarmente problematica quando si analizzano popolazioni di piante strutturate su larga scala. Sono state suggerite molteplici procedure di normalizzazione per correggere variazioni non biologiche, ad esempio l’uso di standard interni, esterni e isotopici per correggere errori analitici, di cui ciascuno è intrinsecamente associato a problemi e insidie noti 7,8,9,10.
Oltre alla variazione analitica, la scelta dei protocolli di estrazione varia generalmente a seconda del metodo analitico. In definitiva, si desidera ridurre i costi di materiale e manodopera, nonché la necessità di utilizzare più aliquote dello stesso campione per vari processi analitici eseguendo metodi di estrazione basati sulla separazione di fase. Questi metodi sono stati introdotti per la prima volta utilizzando cloroformio: metanolo / solventi acquosi per frazionare composti polari e idrofobici11.
Questo protocollo descrive una pipeline veloce ad alto rendimento per una piattaforma multi-omica per profilare sia i metaboliti polari che i lipidi nelle specie di legumi. Inoltre, mostra come tali set di dati possono essere opportunamente corretti per la variazione analitica e normalizzati prima di integrare informazioni genotipiche per rilevare i loci dei tratti quantitativi del metabolita (QTL) eseguendo GWAS.
Sia GC-MS che LC-MS sono strumenti ampiamente utilizzati per profilare miscele complesse di varie classi di metaboliti. La gestione di set di dati di grandi dimensioni con questi strumenti è intrinsecamente associata a una variazione non biologica, ad esempio la variazione analitica, che interferisce e distorce l’interpretazione dei risultati. Questo protocollo presenta una pipeline di estrazione robusta e ad alto rendimento per una profilazione metabolica completa per eliminare la variazione di origine non biologica e condurre studi “omici” su larga scala. I volumi e le concentrazioni utilizzati in questo protocollo sono stati aggiustati per le specie di leguminose in diversi tessuti. Tuttavia, questi parametri possono essere leggermente modificati e utilizzati anche per campioni metabolici su larga scala di altre specie vegetali.
Le15 estrazioni basate su MTBE precedentemente descritte possono essere utilizzate per analizzare metaboliti derivati, metaboliti semipolari e lipidi. Questo può essere ampliato per le estrazioni di proteine eormoni vegetali 39, che erano fuori dall’ambito di questo protocollo. Altri protocolli di estrazione si basano su miscele di diclorometano:etanolo40,41. Di questi protocolli di estrazione, il protocollo di estrazione MTBE:metanolo fornisce un’alternativa favorevole e meno pericolosa ai protocolli di estrazione esistenti a base di cloroformio42 e non si traduce in un pellet proteico come interfase tra la fase polare e lipidica. Inoltre, i metodi MTBE sono già stati utilizzati in diversi studi per vari campioni biologici 43,44,45.
Questo protocollo discute diversi passaggi cruciali che potrebbero portare a potenziali variazioni durante la gestione di un gran numero di campioni, ad esempio durante la raccolta12,13, l’estrazione14 e la randomizzazione46. Inoltre, ci sono ulteriori questioni che non sono state discusse in questo protocollo che devono essere considerate per garantire dati metabolomici di alta qualità, ad esempio l’effetto matrice e la soppressione degli ioni14.
La potenza dei metodi di normalizzazione basati su QC dipende intrinsecamente dal numero di campioni QC in ciascun lotto. Come accennato in precedenza, sebbene l’aumento del numero aumenterebbe la potenza, la variazione intra-batch dei QC è relativamente marginale rispetto alla variazione tra lotti in questi sistemi analitici, come illustrato nella Figura 3. Nel complesso, ci sono altri metodi di normalizzazione basati su QC, come la rimozione degli errori sistemici utilizzando la foresta casuale (SERRF), che hanno dimostrato di superare la maggior parte degli altri metodi di normalizzazione come il rapporto batch-wise, la normalizzazione utilizzando una selezione ottimale di più standard interni (NOMIS) e la normalizzazione probabilistica del quoziente (PQN)47 . Tuttavia, SERRF si basa su più campioni QC in ogni lotto, ad esempio ogni decimo campione, il che non è fattibile durante la gestione di un gran numero di campioni. Il vantaggio principale della normalizzazione basata sul controllo di qualità rispetto ad altri metodi basati su dati o interni basati su standard è che mantiene la variazione biologica essenziale mentre accoglie la variazione tecnica indesiderata28. I lettori possono fare riferimento a questa recensione sulla gestione della variazione28.
Un problema principale in GWAS è il tasso di falsi positivi, che hanno origine principalmente a causa del collegamento di siti causali e non causali 48,49. In secondo luogo, gli approcci conservativi di correzione statistica, ad esempio Bonferroni e FDR, sono corretti per il numero di test indipendenti, che non è uguale al numero di SNP analizzati in GWAS a causa del collegamento tra SNP prossimi50,51 Pertanto, il numero effettivo di test indipendenti è spesso inferiore. Un altro modo per ridurre la soglia statistica conservativa sarebbe quello di ridurre il numero di SNP testati utilizzati per GWAS in base al decadimento del linkage su regioni genomiche definite52. La piattaforma metabolomica ad alto throughput integrata GWAS descritta in questo protocollo ha una vasta gamma di applicazioni. In particolare, faciliterà i miglioramenti nell’allevamento delle colture modificando la composizione metabolita/lipidica per i livelli desiderati industrialmente e nutrizionalmente. Nel complesso, la metabolomica ha fornito una visione approfondita dell’architettura genetica di una pletora di metaboliti e della diversificazione metabolica che si è verificata durante l’addomesticamento delle colture negli ultimi decenni, indicando il vasto potenziale dell’allevamento associato alla metabolomica53. Gli approcci biologici molecolari per la validazione QTL a valle includono la generazione di linee mutanti CRISPR/Cas954, linee di inserzione T-DNA55, linee di sovraespressione stabili e/o transitorie56, VIGS, approcci metabolomici ex vivo 57 accanto all’approccio convenzionale nella generazione di popolazioni F2 incrociate e convalida incrociata in diverse popolazioni.
Eseguendo la correzione necessaria per le variazioni analitiche come descritto sopra, oltre al GWAS possono essere eseguiti diversi approcci integrati, come metabolita-metabolita, analisi di correlazione metabolita-lipide, analisi di correlazione con dati fenomici per far luce su tratti più complessi e / o analisi di co-espressione per svelare ulteriormente le basi dei sistemi biologici58.
The authors have nothing to disclose.
M.B. è supportato dall’IMPRS-PMPG “Metabolismo primario e crescita delle piante”. A.R.F. e S.A. riconoscono il sostegno finanziario del programma di ricerca e innovazione Horizon 2020 dell’UE, del progetto PlantaSYST (SGA-CSA n. 739582 nell’ambito dell’FPA n. 664620) e del progetto INCREASE (GA 862862).
Reagents and standards | |||
1,2-diheptadecanoyl-sn-glycero-3- phosphocholine (17:0 PC) | Avanti Polar Lipids | 850360P | Internal standard for lipids |
Chloroform | Supleco | 67-66-3 | FAME solvent |
Isovitexin | Sigma Aldrich | 38953-85-4 | Internal standard for metabolites |
Lignoceric Acid Methylester | Sigma Aldrich | 2442-49-1 | FAME |
Methanol (MeOH) | Biosolve Chemicals | 13684102 | ULC-MS grade |
Methoxyamin -hydrochlorid | Sigma Aldrich | 593-56-6 | Metabolite deriviatization |
Methyl laurate | Sigma Aldrich | 111-82-0 | FAME |
Methyl myristate | Sigma Aldrich | 124-10-7 | FAME |
Methyl palmitate | Sigma Aldrich | 112-39-0 | FAME |
Methyl stearate | Sigma Aldrich | 112-61-8 | FAME |
Methyl tert-butyl ether (MTBE) | Biosolve Chemicals | 13890602 | HPLC grade |
Methyl-caprat | Sigma Aldrich | 110-42-9 | FAME |
Methylcaprylat | Sigma Aldrich | 111-11-5 | FAME |
Methyldocosanoat | Sigma Aldrich | 929-77-1 | FAME |
Methyleicosanoat | Sigma Aldrich | 1120-28-1 | FAME |
Methyl-hexacosanoat | Sigma Aldrich | 5802-82-4 | FAME |
Methyl-octacosanoat | Sigma Aldrich | 55682-92-3 | FAME |
Methyl-pelargonate | Sigma Aldrich | 1731-84-6 | FAME |
N-Methyl-N-(trimethylsilyl)trifluoracetamid (MSTFA) | Macherey-Nagel | 24589-78-4 | Metabolite deriviatization |
Pyridine | Supleco | 110-86-1 | Metabolite deriviatization |
Ribitol | Supleco | 22566-17-2 | Internal standard for derivatized metabolites |
Triacontanoic Acid Methyl Ester | TCI Chemicals | 629-83-4 | FAME |
Water | Biosolve Chemicals | 23214102 | ULC-MS grade |
Equipment | |||
1.5 mL Safe-lock microcentrifuge tubes | Eppendorf | 3120086 | |
2 mL Safe-lock microcentrifuge tubes | Eppendorf | 3120094 | |
Balance | Sartorius Corporation | 14 557 572 | |
DB-35ms, 30 m, 0,25 mm, 0,25 µm | Aglient | 123-3832 | Analysis of derivatized metabolites |
GC-MS system | Leco Pegasus HT TOF-MS (LECO Corporation) | Analysis of derivatized metabolites | |
Grinding Balls, Stainless Steel | OPS DIAGNOSTICS | GBSS 196-2500-10 | |
MS system | Exactive, Orbitrap-type, MS (Exactive, Thermo Fisher Scientific) | Analysis of lipids | |
MS system | Q Exactive Focus (Q Exactive™ Focus Hybrid Quadrupol-Orbitrap™ Massenspektrometer, Thermo Fisher Scientific) |
Analysis of metabolites | |
Refrigerated microcentrifuge | Eppendorf, model 5427R | 22620701 | |
Reversed Phase (RP) Bridged Ethyl Hybrid (BEH) C8 column (100 mm × 2.1 mm containing 1.7 μm diameter particles) |
Waters | 186002878 | Analysis of lipids |
RP High Strength Silica (HSS) T3 column (100 mm × 2.1 mm containing 1.8 μm diameter particles) |
Waters | 186003539 | Analysis of metabolites |
Shaker | Eppendorf Thermomixer 5436 | 2050-100-05 | |
Sonicator | USC 300 TH | 142-0084 | |
Tissue grinding mixer mill | Retsch, Mixer Mill MM 300 | 20.746.0001 | |
UPLC system | Waters Acquity UPLC system (Waters) | ||
Vacuum concentrator | Scan Speed Maxi Vac Alpha Evaporators | 7.008.500.002 | |
Vortex mixer | Vortex-Genie 2, Model G560 | SI-0236 | |
Software | |||
MetAlign | Chromatogram processing | ||
MzMine | Chromatogram processing | ||
R package "data.table" | |||
R package "fujiplot" | pleiotrpoic map | ||
R package "genetics" | |||
R package "Ime4" | BLUPs calculation | ||
R package "LDheatmap" | LD plots | ||
R package "MASS" | transformation | ||
R package "rMVP" | GWAS | ||
R version 4.0.4 | |||
RefinerMS | Chromatogram processing | ||
RefinerMS Genedata | Expressionist | Chromatogram processing | |
Tassel 5 | Genotype filtering | ||
Xcalibur | Thermo Fisher Scientific | OPTON-30965 | Chromatogram processing |