I detta protokoll presenterar vi ett optimerat arbetsflöde som kombinerar en effektiv och snabb provberedning av många prover. Dessutom tillhandahåller vi en steg-för-steg-guide för att minska analytiska variationer för utvärdering med hög genomströmning av metaboliska GWAS-studier.
Både gaskromatografi-masspektrometri (GC-MS) och vätskekromatografi-masspektrometri (LC-MS) används ofta metabolomikmetoder för att detektera och kvantifiera hundratusentals metabolitfunktioner. Tillämpningen av dessa tekniker på ett stort antal prover är dock föremål för mer komplexa interaktioner, särskilt för genomomfattande associeringsstudier (GWAS). Detta protokoll beskriver ett optimerat metaboliskt arbetsflöde, som kombinerar en effektiv och snabb provberedning med analys av ett stort antal prover för baljväxtgrödor. Denna något modifierade extraktionsmetod utvecklades ursprungligen för analys av växt- och djurvävnader och är baserad på extraktion i metyltert-butyleter: metanollösningsmedel för att möjliggöra infångning av polära och lipidmetaboliter. Dessutom tillhandahåller vi en steg-för-steg-guide för att minska analytiska variationer, vilket är viktigt för utvärdering av metabolisk varians med hög genomströmning i GWAS.
Storskaliga “omics” -metoder har möjliggjort analys av komplexa biologiska system 1,2,3 och ytterligare förståelse av kopplingen mellan genotyper och de resulterande fenotyperna4. Metabolomik med ultrahögprestanda flytande kromatografi-masspektrometri (UHPLC-MS) och GC-MS möjliggjorde detektion av en uppsjö av metabolitfunktioner, varav endast vissa kommenteras till en viss grad, vilket resulterar i en hög andel okända metaboliter. Komplexa interaktioner kan utforskas genom att kombinera storskalig metabolomik med den underliggande genotypiska variationen hos en mångfaldig population5. Hantering av stora provuppsättningar är emellertid i sig förknippad med analytiska variationer, vilket snedvrider utvärderingen av metabolisk varians för ytterligare nedströmsprocesser. Specifikt baseras stora frågor som leder till analytiska variationer på maskinprestanda och instrumentell drift över tid6. Integrationen av batch-till-batch-variation är utmanande och särskilt problematisk när man analyserar storskaliga strukturerade växtpopulationer. Flera normaliseringsprocedurer föreslogs för att korrigera för icke-biologiska variationer, t.ex. användningen av interna, externa och isotopmärkta interna standarder för att korrigera för analytiska fel, varav var och en i sig är förknippad med kända problem och fallgropar 7,8,9,10.
Förutom analytisk variation varierar valet av extraktionsprotokoll i allmänhet beroende på analysmetoden. I slutändan är det önskvärt att minska material- och arbetskraftskostnaderna samt nödvändigheten av att använda flera alikvoter av samma prov för olika analytiska processer genom att utföra fasseparationsbaserade extraktionsmetoder. Dessa metoder introducerades först med användning av kloroform: metanol / vattenlösningsmedel för att fraktionera polära och hydrofoba föreningar11.
Detta protokoll beskriver en snabb pipeline med hög genomströmning för en multi-omics-plattform för att profilera både polära metaboliter och lipider i baljväxtarter. Vidare visar den hur dessa datamängder kan korrigeras på lämpligt sätt för analytisk variation och normaliseras innan genotypisk information integreras för att detektera metabolit quantitative trait loci (QTL) genom att utföra GWAS.
Både GC-MS och LC-MS är allmänt använda verktyg för profilering av komplexa blandningar av olika metabolitklasser. Att hantera stora datamängder med dessa verktyg är i sig förknippat med en icke-biologisk variation, t.ex. analytisk variation, som stör och snedvrider tolkningen av resultaten. Detta protokoll presenterar en robust extraktionspipeline med hög genomströmning för omfattande metabolisk profilering för att eliminera variation av icke-biologiskt ursprung och genomföra storskaliga “omics” -studier. Volymerna och koncentrationerna som användes i detta protokoll justerades för baljväxtarter i olika vävnader. Dessa parametrar kan dock modifieras något och användas för storskaliga metaboliska prover från andra växtarter också.
De tidigare15 beskrivna MTBE-baserade extraktionerna kan användas för att analysera derivatiserade metaboliter, halvpolära metaboliter och lipider. Detta kan utökas för protein- och växthormonextraktioner39, som inte omfattades av detta protokoll. Andra extraktionsprotokoll bygger på diklormetan:etanolblandningar40,41. Av dessa extraktionsprotokoll ger MTBE: metanolextraktionsprotokollet ett gynnsamt och mindre farligt alternativ till de befintliga kloroformbaserade extraktionsprotokollen42 och resulterar inte i en proteinpellets som en interfas mellan polar- och lipidfaserna. Vidare har MTBE-metoder redan använts i flera studier för olika biologiska prover 43,44,45.
Detta protokoll diskuterar flera viktiga steg som kan leda till potentiell variation vid hantering av ett stort antal prover, t.ex. under skördav 12,13, extraktion14 samt randomisering46. Dessutom finns det ytterligare frågor som inte har diskuterats i detta protokoll som måste beaktas för att säkerställa högkvalitativa metabolomiska data, t.ex. matriseffekt och jonundertryckning14.
Kraften hos QC-baserade normaliseringsmetoder beror i sig på antalet QC-prover i varje sats. Som tidigare nämnts, även om en ökning av antalet skulle öka effekten, är variationen inom batchen av QC: erna relativt marginell jämfört med variationen mellan satser i dessa analytiska system, vilket illustreras i figur 3. Sammantaget finns det andra QC-baserade normaliseringsmetoder, såsom systemisk felborttagning med slumpmässig skog (SERRF), som har visat sig överträffa de flesta andra normaliseringsmetoder som batch-wise-ratio, normalisering med ett optimalt urval av flera interna standarder (NOMIS) och probabilistisk kvotnormalisering (PQN)47 . SERRF förlitar sig dock på flera QC-prover i varje sats, t.ex. vart tionde prov, vilket inte är möjligt vid hantering av ett stort antal prover. Den största fördelen med QC-baserad normalisering jämfört med andra datadrivna eller interna standardbaserade metoder är att den behåller den väsentliga biologiska variationen samtidigt som den tillgodoser oönskad teknisk variation28. Läsarna kan hänvisa till denna recension om hanteringen av variant28.
Ett huvudproblem i GWAS är frekvensen av falska positiva resultat, som främst härrör från kopplingen mellan kausala och icke-kausala platser48,49. För det andra korrigerar de konservativa statistiska korrigeringsmetoderna, t.ex. Bonferroni och FDR, för antalet oberoende tester, vilket inte är lika med antalet analyserade SNP i GWAS på grund av kopplingen mellan närliggande SNP50,51 Därför är det faktiska antalet oberoende tester ofta lägre. Ett annat sätt att minska den konservativa statistiska tröskeln skulle vara att minska antalet testade SNP som används för GWAS baserat på länkningsförfall över definierade genomiska regioner52. Den GWAS-integrerade metabolomikplattformen med hög genomströmning som beskrivs i detta protokoll har ett brett spektrum av applikationer. I synnerhet kommer det att underlätta förbättringar i växtförädling genom att ändra metabolit/ lipidkompositionen för industriellt och näringsmässigt önskade nivåer. Sammantaget har metabolomik gett en djupgående inblick i den genetiska arkitekturen hos en uppsjö av metaboliter och metabolisk diversifiering som inträffade under grödans domesticering under de senaste decennierna, vilket indikerar den stora potentialen för metabolomikassocierad avel53. De molekylärbiologiska metoderna för nedströms QTL-validering inkluderar generering av CRISPR / Cas9-mutantlinjer54, T-DNA-insättningslinjer55, stabila och / eller övergående överuttryckslinjer56, VIGS, ex vivo metabolomikmetoder57 bredvid det konventionella tillvägagångssättet för att generera kors F2-populationer samt korsvalidering i olika populationer.
Genom att utföra den nödvändiga korrigeringen för de analytiska variationerna som beskrivs ovan kan flera integrerade tillvägagångssätt utföras utöver GWAS, såsom metabolit-metabolit, metabolit-lipidkorrelationsanalys, korrelationsanalys till fenomeniska data för att belysa mer komplexa egenskaper och / eller samuttrycksanalys för att ytterligare riva upp grunden för biologiska system58.
The authors have nothing to disclose.
MB stöds av IMPRS-PMPG “Primary Metabolism and Plant Growth”. A.R.F. och S.A. erkänner det ekonomiska stödet från EU:s forsknings- och innovationsprogram Horisont 2020, projektet PlantaSYST (SGA-CSA nr 739582 enligt FPA nr 664620) och projektet INCREASE (GA 862862).
Reagents and standards | |||
1,2-diheptadecanoyl-sn-glycero-3- phosphocholine (17:0 PC) | Avanti Polar Lipids | 850360P | Internal standard for lipids |
Chloroform | Supleco | 67-66-3 | FAME solvent |
Isovitexin | Sigma Aldrich | 38953-85-4 | Internal standard for metabolites |
Lignoceric Acid Methylester | Sigma Aldrich | 2442-49-1 | FAME |
Methanol (MeOH) | Biosolve Chemicals | 13684102 | ULC-MS grade |
Methoxyamin -hydrochlorid | Sigma Aldrich | 593-56-6 | Metabolite deriviatization |
Methyl laurate | Sigma Aldrich | 111-82-0 | FAME |
Methyl myristate | Sigma Aldrich | 124-10-7 | FAME |
Methyl palmitate | Sigma Aldrich | 112-39-0 | FAME |
Methyl stearate | Sigma Aldrich | 112-61-8 | FAME |
Methyl tert-butyl ether (MTBE) | Biosolve Chemicals | 13890602 | HPLC grade |
Methyl-caprat | Sigma Aldrich | 110-42-9 | FAME |
Methylcaprylat | Sigma Aldrich | 111-11-5 | FAME |
Methyldocosanoat | Sigma Aldrich | 929-77-1 | FAME |
Methyleicosanoat | Sigma Aldrich | 1120-28-1 | FAME |
Methyl-hexacosanoat | Sigma Aldrich | 5802-82-4 | FAME |
Methyl-octacosanoat | Sigma Aldrich | 55682-92-3 | FAME |
Methyl-pelargonate | Sigma Aldrich | 1731-84-6 | FAME |
N-Methyl-N-(trimethylsilyl)trifluoracetamid (MSTFA) | Macherey-Nagel | 24589-78-4 | Metabolite deriviatization |
Pyridine | Supleco | 110-86-1 | Metabolite deriviatization |
Ribitol | Supleco | 22566-17-2 | Internal standard for derivatized metabolites |
Triacontanoic Acid Methyl Ester | TCI Chemicals | 629-83-4 | FAME |
Water | Biosolve Chemicals | 23214102 | ULC-MS grade |
Equipment | |||
1.5 mL Safe-lock microcentrifuge tubes | Eppendorf | 3120086 | |
2 mL Safe-lock microcentrifuge tubes | Eppendorf | 3120094 | |
Balance | Sartorius Corporation | 14 557 572 | |
DB-35ms, 30 m, 0,25 mm, 0,25 µm | Aglient | 123-3832 | Analysis of derivatized metabolites |
GC-MS system | Leco Pegasus HT TOF-MS (LECO Corporation) | Analysis of derivatized metabolites | |
Grinding Balls, Stainless Steel | OPS DIAGNOSTICS | GBSS 196-2500-10 | |
MS system | Exactive, Orbitrap-type, MS (Exactive, Thermo Fisher Scientific) | Analysis of lipids | |
MS system | Q Exactive Focus (Q Exactive™ Focus Hybrid Quadrupol-Orbitrap™ Massenspektrometer, Thermo Fisher Scientific) |
Analysis of metabolites | |
Refrigerated microcentrifuge | Eppendorf, model 5427R | 22620701 | |
Reversed Phase (RP) Bridged Ethyl Hybrid (BEH) C8 column (100 mm × 2.1 mm containing 1.7 μm diameter particles) |
Waters | 186002878 | Analysis of lipids |
RP High Strength Silica (HSS) T3 column (100 mm × 2.1 mm containing 1.8 μm diameter particles) |
Waters | 186003539 | Analysis of metabolites |
Shaker | Eppendorf Thermomixer 5436 | 2050-100-05 | |
Sonicator | USC 300 TH | 142-0084 | |
Tissue grinding mixer mill | Retsch, Mixer Mill MM 300 | 20.746.0001 | |
UPLC system | Waters Acquity UPLC system (Waters) | ||
Vacuum concentrator | Scan Speed Maxi Vac Alpha Evaporators | 7.008.500.002 | |
Vortex mixer | Vortex-Genie 2, Model G560 | SI-0236 | |
Software | |||
MetAlign | Chromatogram processing | ||
MzMine | Chromatogram processing | ||
R package "data.table" | |||
R package "fujiplot" | pleiotrpoic map | ||
R package "genetics" | |||
R package "Ime4" | BLUPs calculation | ||
R package "LDheatmap" | LD plots | ||
R package "MASS" | transformation | ||
R package "rMVP" | GWAS | ||
R version 4.0.4 | |||
RefinerMS | Chromatogram processing | ||
RefinerMS Genedata | Expressionist | Chromatogram processing | |
Tassel 5 | Genotype filtering | ||
Xcalibur | Thermo Fisher Scientific | OPTON-30965 | Chromatogram processing |