In dit protocol presenteren we een geoptimaliseerde workflow, die een efficiënte en snelle monstervoorbereiding van veel monsters combineert. Daarnaast bieden we een stapsgewijze handleiding om analytische variaties te verminderen voor high-throughput evaluatie van metabole GWAS-studies.
Zowel gaschromatografie-massaspectrometrie (GC-MS) als vloeistofchromatografie-massaspectrometrie (LC-MS) zijn veelgebruikte metabolomics-benaderingen om honderdduizenden metabolietkenmerken te detecteren en te kwantificeren. De toepassing van deze technieken op een groot aantal monsters is echter onderhevig aan complexere interacties, met name voor genoombrede associatiestudies (GWAS). Dit protocol beschrijft een geoptimaliseerde metabole workflow, die een efficiënte en snelle monstervoorbereiding combineert met de analyse van een groot aantal monsters voor peulvruchten. Deze licht gewijzigde extractiemethode is in eerste instantie ontwikkeld voor de analyse van plantaardige en dierlijke weefsels en is gebaseerd op extractie in methyltert-butylether: methanoloplosmiddel om polaire en lipidemetabolieten te kunnen vangen. Daarnaast bieden we een stapsgewijze handleiding voor het verminderen van analytische variaties, die essentieel zijn voor de high-throughput evaluatie van metabole variantie in GWAS.
Grootschalige “omics”-benaderingen hebben de analyse van complexe biologische systemen 1,2,3 en verder begrip van het verband tussen genotypen en de resulterende fenotypen mogelijk gemaakt4. Metabolomics met behulp van ultra-high-performance vloeistofchromatografie-massaspectrometrie (UHPLC-MS) en GC-MS maakten de detectie mogelijk van een overvloed aan metabolietkenmerken, waarvan slechts enkele tot op zekere hoogte zijn geannoteerd, wat resulteert in een hoog percentage onbekende metabolieten. Complexe interacties kunnen worden onderzocht door grootschalige metabolomica te combineren met de onderliggende genotypische variatie van een diverse populatie5. Het hanteren van grote monstersets is echter inherent geassocieerd met analytische variaties, waardoor de evaluatie van metabole variantie voor verdere downstreamprocessen wordt verstoord. In het bijzonder zijn belangrijke problemen die leiden tot analytische variaties gebaseerd op machineprestaties en instrumentele drift in de loop van tijd6. De integratie van batch-to-batch variatie is een uitdaging en vooral problematisch bij het analyseren van grootschalige gestructureerde plantenpopulaties. Meerdere normalisatieprocedures werden voorgesteld om te corrigeren voor niet-biologische variaties, bijvoorbeeld het gebruik van interne, externe en isotoop-gelabelde interne normen om te corrigeren voor analytische fouten, waarvan elk inherent geassocieerd is met bekende problemen en valkuilen 7,8,9,10.
Naast analytische variatie varieert de keuze van extractieprotocollen over het algemeen afhankelijk van de analysemethode. Uiteindelijk is het gewenst om materiaal- en arbeidskosten te verlagen, evenals de noodzaak om meerdere aliquots van hetzelfde monster te gebruiken voor verschillende analytische processen door op fasescheiding gebaseerde extractiemethoden uit te voeren. Deze methoden werden voor het eerst geïntroduceerd met behulp van chloroform: methanol/ wateroplosmiddelen om polaire en hydrofobe verbindingen te fractioneren11.
Dit protocol beschrijft een snelle high-throughput pijplijn voor een multi-omics platform om zowel polaire metabolieten als lipiden in peulvruchtensoorten te profileren. Verder laat het zien hoe die datasets op de juiste manier kunnen worden gecorrigeerd voor analytische variatie en genormaliseerd voordat genotypische informatie wordt geïntegreerd om metaboliet kwantitatieve eigenschap loci (QTL) te detecteren door GWAS uit te voeren.
Zowel GC-MS als LC-MS zijn veelgebruikte hulpmiddelen voor het profileren van complexe mengsels van verschillende metabolietklassen. Het verwerken van grote datasets met deze tools is inherent geassocieerd met een niet-biologische variatie, bijvoorbeeld analytische variatie, die de interpretatie van de resultaten verstoort en vertekent. Dit protocol presenteert een robuuste en high-throughput extractiepijplijn voor uitgebreide metabole profilering om variatie van niet-biologische oorsprong te elimineren en grootschalige “omics” -studies uit te voeren. De volumes en concentraties die in dit protocol worden gebruikt, zijn aangepast voor peulvruchtensoorten in verschillende weefsels. Deze parameters kunnen echter enigszins worden gewijzigd en ook worden gebruikt voor grootschalige metabole monsters van andere plantensoorten.
De eerder15 beschreven MTBE-gebaseerde extracties kunnen worden gebruikt om gederivatiseerde metabolieten, semipolaire metabolieten en lipiden te analyseren. Dit kan worden uitgebreid voor eiwit- en plantenhormoonextracties39, die buiten het toepassingsgebied van dit protocol vielen. Andere extractieprotocollen zijn gebaseerd op dichloormethaan:ethanolmengsels40,41. Van deze extractieprotocollen biedt het MTBE:methanol extractieprotocol een gunstig en minder gevaarlijk alternatief voor de bestaande op chloroform gebaseerde extractieprotocollen42 en resulteert het niet in een eiwitpellet als interfase tussen de polaire en lipidefase. Bovendien zijn MTBE-methoden al gebruikt in verschillende studies voor verschillende biologische monsters 43,44,45.
Dit protocol bespreekt verschillende cruciale stappen die kunnen leiden tot potentiële variatie bij het verwerken van een groot aantal monsters, bijvoorbeeld tijdens het oogstenvan 12,13, extractie14 en randomisatie46. Bovendien zijn er aanvullende kwesties die niet in dit protocol zijn besproken en waarmee rekening moet worden gehouden om metabolomische gegevens van hoge kwaliteit te garanderen, bijvoorbeeld matrixeffect en ionenonderdrukking14.
De kracht van op QC gebaseerde normalisatiemethoden is inherent afhankelijk van het aantal QC-monsters in elke batch. Zoals eerder vermeld, hoewel het verhogen van het aantal het vermogen zou vergroten, is de intra-batchvariatie van de QC’s relatief marginaal in vergelijking met inter-batchvariatie in deze analytische systemen, zoals geïllustreerd in figuur 3. Over het algemeen zijn er andere op QC gebaseerde normalisatiemethoden, zoals systemische foutverwijdering met behulp van random forest (SERRF), waarvan is aangetoond dat ze beter presteren dan de meeste andere normalisatiemethoden, zoals batch-wise-ratio, normalisatie met behulp van een optimale selectie van meerdere interne standaarden (NOMIS) en probabilistische quotiëntnormalisatie (PQN)47 . SERRF vertrouwt echter op meerdere QC-monsters in elke batch, bijvoorbeeld elk tiende monster, wat niet haalbaar is bij het verwerken van grote aantallen monsters. Het belangrijkste voordeel van QC-gebaseerde normalisatie ten opzichte van andere datagestuurde of interne standaardgebaseerde methoden is dat het de essentiële biologische variatie behoudt en tegelijkertijd ongewenste technische variatie opvangt28. Lezers kunnen verwijzen naar deze recensie over de omgang met variatie28.
Een belangrijk probleem in GWAS is het aantal fout-positieven, die voornamelijk voortkomen uit de koppeling van causale en niet-causale sites48,49. Ten tweede corrigeren de conservatieve statistische correctiebenaderingen, bijvoorbeeld Bonferroni en FDR, correct voor het aantal onafhankelijke tests, dat niet gelijk is aan het aantal geteste SNP’s in GWAS vanwege de koppeling tussen nabije SNP’s50,51 Daarom is het werkelijke aantal onafhankelijke tests vaak lager. Een andere manier om de conservatieve statistische drempel te verlagen, zou zijn om het aantal geteste SNP’s dat wordt gebruikt voor GWAS te verminderen op basis van koppelingsverval over gedefinieerde genomische regio’s52. Het GWAS-geïntegreerde high-throughput metabolomics-platform dat in dit protocol wordt beschreven, heeft een breed scala aan toepassingen. In het bijzonder zal het verbeteringen in de gewasveredeling vergemakkelijken door de metaboliet / lipidesamenstelling te veranderen voor industrieel en nutritioneel gewenste niveaus. Over het algemeen heeft metabolomics een diepgaand inzicht gegeven in de genetische architectuur van een overvloed aan metabolieten en metabole diversificatie die plaatsvond tijdens de domesticatie van gewassen in de afgelopen decennia, wat wijst op het enorme potentieel van metabolomics-geassocieerde veredeling53. De moleculair biologische benaderingen voor downstream QTL-validatie omvatten de generatie van CRISPR/Cas9-mutantlijnen54, T-DNA-insertielijnen55, stabiele en/of transiënte overexpressielijnen56, VIGS, ex vivo metabolomics-benaderingen57 naast de conventionele benadering bij het genereren van cross F2-populaties en kruisvalidatie in verschillende populaties.
Door de noodzakelijke correctie uit te voeren voor de analytische variaties zoals hierboven beschreven, kunnen naast GWAS verschillende geïntegreerde benaderingen worden uitgevoerd, zoals metaboliet-metaboliet, metaboliet-lipidencorrelatieanalyse, correlatieanalyse tot fenomische gegevens om licht te werpen op complexere eigenschappen, en /of co-expressieanalyse om de basis van biologische systemen verder te ontrafelen58.
The authors have nothing to disclose.
M.B. wordt ondersteund door de IMPRS-PMPG ‘Primary Metabolism and Plant Growth’. A.R.F. en S.A. erkennen de financiële steun van het HORIZON 2020 Onderzoeks- en Innovatieprogramma van de EU, project PlantaSYST (SGA-CSA nr. 739582 onder FPA nr. 664620) en project INCREASE (GA 862862).
Reagents and standards | |||
1,2-diheptadecanoyl-sn-glycero-3- phosphocholine (17:0 PC) | Avanti Polar Lipids | 850360P | Internal standard for lipids |
Chloroform | Supleco | 67-66-3 | FAME solvent |
Isovitexin | Sigma Aldrich | 38953-85-4 | Internal standard for metabolites |
Lignoceric Acid Methylester | Sigma Aldrich | 2442-49-1 | FAME |
Methanol (MeOH) | Biosolve Chemicals | 13684102 | ULC-MS grade |
Methoxyamin -hydrochlorid | Sigma Aldrich | 593-56-6 | Metabolite deriviatization |
Methyl laurate | Sigma Aldrich | 111-82-0 | FAME |
Methyl myristate | Sigma Aldrich | 124-10-7 | FAME |
Methyl palmitate | Sigma Aldrich | 112-39-0 | FAME |
Methyl stearate | Sigma Aldrich | 112-61-8 | FAME |
Methyl tert-butyl ether (MTBE) | Biosolve Chemicals | 13890602 | HPLC grade |
Methyl-caprat | Sigma Aldrich | 110-42-9 | FAME |
Methylcaprylat | Sigma Aldrich | 111-11-5 | FAME |
Methyldocosanoat | Sigma Aldrich | 929-77-1 | FAME |
Methyleicosanoat | Sigma Aldrich | 1120-28-1 | FAME |
Methyl-hexacosanoat | Sigma Aldrich | 5802-82-4 | FAME |
Methyl-octacosanoat | Sigma Aldrich | 55682-92-3 | FAME |
Methyl-pelargonate | Sigma Aldrich | 1731-84-6 | FAME |
N-Methyl-N-(trimethylsilyl)trifluoracetamid (MSTFA) | Macherey-Nagel | 24589-78-4 | Metabolite deriviatization |
Pyridine | Supleco | 110-86-1 | Metabolite deriviatization |
Ribitol | Supleco | 22566-17-2 | Internal standard for derivatized metabolites |
Triacontanoic Acid Methyl Ester | TCI Chemicals | 629-83-4 | FAME |
Water | Biosolve Chemicals | 23214102 | ULC-MS grade |
Equipment | |||
1.5 mL Safe-lock microcentrifuge tubes | Eppendorf | 3120086 | |
2 mL Safe-lock microcentrifuge tubes | Eppendorf | 3120094 | |
Balance | Sartorius Corporation | 14 557 572 | |
DB-35ms, 30 m, 0,25 mm, 0,25 µm | Aglient | 123-3832 | Analysis of derivatized metabolites |
GC-MS system | Leco Pegasus HT TOF-MS (LECO Corporation) | Analysis of derivatized metabolites | |
Grinding Balls, Stainless Steel | OPS DIAGNOSTICS | GBSS 196-2500-10 | |
MS system | Exactive, Orbitrap-type, MS (Exactive, Thermo Fisher Scientific) | Analysis of lipids | |
MS system | Q Exactive Focus (Q Exactive™ Focus Hybrid Quadrupol-Orbitrap™ Massenspektrometer, Thermo Fisher Scientific) |
Analysis of metabolites | |
Refrigerated microcentrifuge | Eppendorf, model 5427R | 22620701 | |
Reversed Phase (RP) Bridged Ethyl Hybrid (BEH) C8 column (100 mm × 2.1 mm containing 1.7 μm diameter particles) |
Waters | 186002878 | Analysis of lipids |
RP High Strength Silica (HSS) T3 column (100 mm × 2.1 mm containing 1.8 μm diameter particles) |
Waters | 186003539 | Analysis of metabolites |
Shaker | Eppendorf Thermomixer 5436 | 2050-100-05 | |
Sonicator | USC 300 TH | 142-0084 | |
Tissue grinding mixer mill | Retsch, Mixer Mill MM 300 | 20.746.0001 | |
UPLC system | Waters Acquity UPLC system (Waters) | ||
Vacuum concentrator | Scan Speed Maxi Vac Alpha Evaporators | 7.008.500.002 | |
Vortex mixer | Vortex-Genie 2, Model G560 | SI-0236 | |
Software | |||
MetAlign | Chromatogram processing | ||
MzMine | Chromatogram processing | ||
R package "data.table" | |||
R package "fujiplot" | pleiotrpoic map | ||
R package "genetics" | |||
R package "Ime4" | BLUPs calculation | ||
R package "LDheatmap" | LD plots | ||
R package "MASS" | transformation | ||
R package "rMVP" | GWAS | ||
R version 4.0.4 | |||
RefinerMS | Chromatogram processing | ||
RefinerMS Genedata | Expressionist | Chromatogram processing | |
Tassel 5 | Genotype filtering | ||
Xcalibur | Thermo Fisher Scientific | OPTON-30965 | Chromatogram processing |