Summary

Grootschalige multi-omics Genome-wide Association Studies (Mo-GWAS): richtlijnen voor monstervoorbereiding en normalisatie

Published: July 27, 2021
doi:

Summary

In dit protocol presenteren we een geoptimaliseerde workflow, die een efficiënte en snelle monstervoorbereiding van veel monsters combineert. Daarnaast bieden we een stapsgewijze handleiding om analytische variaties te verminderen voor high-throughput evaluatie van metabole GWAS-studies.

Abstract

Zowel gaschromatografie-massaspectrometrie (GC-MS) als vloeistofchromatografie-massaspectrometrie (LC-MS) zijn veelgebruikte metabolomics-benaderingen om honderdduizenden metabolietkenmerken te detecteren en te kwantificeren. De toepassing van deze technieken op een groot aantal monsters is echter onderhevig aan complexere interacties, met name voor genoombrede associatiestudies (GWAS). Dit protocol beschrijft een geoptimaliseerde metabole workflow, die een efficiënte en snelle monstervoorbereiding combineert met de analyse van een groot aantal monsters voor peulvruchten. Deze licht gewijzigde extractiemethode is in eerste instantie ontwikkeld voor de analyse van plantaardige en dierlijke weefsels en is gebaseerd op extractie in methyltert-butylether: methanoloplosmiddel om polaire en lipidemetabolieten te kunnen vangen. Daarnaast bieden we een stapsgewijze handleiding voor het verminderen van analytische variaties, die essentieel zijn voor de high-throughput evaluatie van metabole variantie in GWAS.

Introduction

Grootschalige “omics”-benaderingen hebben de analyse van complexe biologische systemen 1,2,3 en verder begrip van het verband tussen genotypen en de resulterende fenotypen mogelijk gemaakt4. Metabolomics met behulp van ultra-high-performance vloeistofchromatografie-massaspectrometrie (UHPLC-MS) en GC-MS maakten de detectie mogelijk van een overvloed aan metabolietkenmerken, waarvan slechts enkele tot op zekere hoogte zijn geannoteerd, wat resulteert in een hoog percentage onbekende metabolieten. Complexe interacties kunnen worden onderzocht door grootschalige metabolomica te combineren met de onderliggende genotypische variatie van een diverse populatie5. Het hanteren van grote monstersets is echter inherent geassocieerd met analytische variaties, waardoor de evaluatie van metabole variantie voor verdere downstreamprocessen wordt verstoord. In het bijzonder zijn belangrijke problemen die leiden tot analytische variaties gebaseerd op machineprestaties en instrumentele drift in de loop van tijd6. De integratie van batch-to-batch variatie is een uitdaging en vooral problematisch bij het analyseren van grootschalige gestructureerde plantenpopulaties. Meerdere normalisatieprocedures werden voorgesteld om te corrigeren voor niet-biologische variaties, bijvoorbeeld het gebruik van interne, externe en isotoop-gelabelde interne normen om te corrigeren voor analytische fouten, waarvan elk inherent geassocieerd is met bekende problemen en valkuilen 7,8,9,10.

Naast analytische variatie varieert de keuze van extractieprotocollen over het algemeen afhankelijk van de analysemethode. Uiteindelijk is het gewenst om materiaal- en arbeidskosten te verlagen, evenals de noodzaak om meerdere aliquots van hetzelfde monster te gebruiken voor verschillende analytische processen door op fasescheiding gebaseerde extractiemethoden uit te voeren. Deze methoden werden voor het eerst geïntroduceerd met behulp van chloroform: methanol/ wateroplosmiddelen om polaire en hydrofobe verbindingen te fractioneren11.

Dit protocol beschrijft een snelle high-throughput pijplijn voor een multi-omics platform om zowel polaire metabolieten als lipiden in peulvruchtensoorten te profileren. Verder laat het zien hoe die datasets op de juiste manier kunnen worden gecorrigeerd voor analytische variatie en genormaliseerd voordat genotypische informatie wordt geïntegreerd om metaboliet kwantitatieve eigenschap loci (QTL) te detecteren door GWAS uit te voeren.

Protocol

1. Experimenteel ontwerp en plantenteelt OPMERKING: Het opzetten van het experiment afhankelijk van de experimentele hypothese, bijvoorbeeld, het gebruik van een grootschalige GWAS-populatie vermindert de noodzaak van meerdere replicaties, omdat statistische tests zullen worden uitgevoerd op basis van de haplotypen van alle individuele SNP’s in plaats van de toetreding. Daarentegen zijn meerdere replicaties onmisbaar in andere experimentele benaderingen. Bij de voorbereiding van het experiment moet rekening worden gehouden met de volgende punten. Neem voldoende biologische replicaties op, afhankelijk van de experimentele hypothese. Randomiseer de biologische replicaties blokgewijs om lokale milieubias tijdens de teelt te verminderen, bijvoorbeeld kas, veld. Zorg voor een goed onderhoud van de plant tijdens de groei. Behandel planten homogeen om bias te verminderen. 2. Bereiding van biologisch plantaardig materiaal Oogstvoorbereiding Label oogstbuizen (20 ml) met twee metalen kralen met een diameter van 5 mm en 8 mm voor homogeniseren. Vul een dewar met vloeibare stikstof.OPMERKING: Planten moeten zich in de vegetatieve fase bevinden voor het oogsten van vers blad- en wortelweefsel. Oogst biologische monsters door flash-freezing in vloeibare stikstof. Oogst zo snel mogelijk om de invloed van circadiane oscillatie op het metabolisme tijdens langdurige oogstduur uit te sluiten 12,13. Bewaar de geoogste verse blad- en wortelweefsels voor verdere bewerking bij -80 °C.OPMERKING: Het snijden van bladeren tot flash-freezing mag niet langer dan een paar seconden duren, omdat actieve biologische processen na bladsplitsing de metabole profielen als gevolg van verwonding zouden veranderen. Voor wortels, reinig de wortels door te wassen met water voordat ze flash-bevriezing in vloeibare stikstof. Overtollig water op het worteloppervlak moet worden opgenomen met papieren zakdoekjes. Gedroogde zaden kunnen bij kamertemperatuur worden bewaard; er hoeft geen vloeibare stikstof te worden ingevroren. Maal het weefsel met behulp van een weefselmixermolen. Koel de buishouders een paar minuten voor in vloeibare stikstof om een lage temperatuur te behouden tijdens het malen van het weefsel. Transporteer de biologische monsters in een stikstofhoudende dewar nadat ze uit de vriezer van -80 °C zijn gehaald. Maal de weefsels om homogeen poeder te verkrijgen; gebruik 25 Hz gedurende 1 min en herhaal dit na het invriezen in vloeibare stikstof als het weefsel niet homogeen is gemalen. Voor het malen van gedroogde zaden, plaats de zaden in een maalpot met een metalen kraal met een diameter van 15 mm. Gebruik dezelfde frequentie en tijd als vermeld in 2.3.3.OPMERKING: Schone en voorgekoelde vijzels en stampers kunnen worden gebruikt als een weefselmixermolen niet beschikbaar is. Voorkoel gelabelde 2 ml safe-lock microcentrifugebuizen. Weeg 50 mg met een fout van ±5 mg vers plantaardig materiaal af met behulp van een analytische weegschaal. Koel de gereedschappen die worden gebruikt voor het overbrengen van plantmateriaal in vloeibare stikstof voor. Zorg ervoor dat plantmateriaal bevroren blijft tijdens het weegproces.OPMERKING: Stel vers plantmateriaal niet te lang bloot aan kamertemperatuur, omdat biologische processen worden geactiveerd door de temperatuur te verhogen, waardoor metabole profielen veranderen14. Genereer aanvullende kwaliteitscontrolemonsters (QC) door een deel van elk monster te poolen en 50 mg te wegen met een fout van ±5 mg gepoold vers plantmateriaal in voorgekoelde 2 ml safe-lock microcentrifugebuizen.OPMERKING: Ten minste drie QC-monsters worden geadviseerd voor elke 60 monsters. De QC-monsters zijn essentieel voor de downstream-correctie, normalisatie en analyses. 3. Extractiereagentia Vers weefsel, bijvoorbeeld bladeren en wortelsOPMERKING: Monsterextractie is gebaseerd op een eerder beschreven protocol15. Dit protocol is aangepast op basis van de huidige behoeften, bijvoorbeeld meerdere weefsels, verschillende interne normen en grootschalige experimenten. Bovendien worden alle hieronder genoemde volumes en instrumentinstellingen aangepast aan interne analytische eenheden. Protocolgebruikers moeten deze aanpassen aan hun analytische eenheid en biologische monsters, op basis van testmonsters. Extractiemengsel 1 (EM1): methyltert-butylether (MTBE)/methanol (MeOH) (3:1 v/v) Bereid een mengsel van MTBE/MeOH in een verhouding van 3:1. Meng voor 100 ml extractieoplosmiddel 75 ml MTBE met 25 ml MeOH in een schone glazen fles.OPMERKING: Oplosmiddelen moeten zorgvuldig worden behandeld in de zuurkast met de juiste veiligheidsuitrusting. Voeg 45 μL 1,2-diheptadecanoyl-sn-glycero-3-fosfocholine (1 mg/ml in chloroform) toe als interne standaard voor de op UHPLC-MS gebaseerde lipidenanalyse, 400 μL ribitol (1 mg/ml in water) als interne standaard voor de op GC-MS gebaseerde analyse en 125 μL isovitexine (1 mg/ml in MeOH/water (1:1 v/v)) voor UHPLC-MS-gebaseerde metabolietanalyse.OPMERKING: De toevoeging van interne normen is noodzakelijk voor de normalisatie na de analyse volgens analytische behoeften. Aangezien 1 ml EM1 nodig is voor elk monster, bereidt u een stamoplossing volgens de experimentele steekproefgrootte, die voor het hele experiment moet worden gebruikt. EM1 moet worden bewaard bij -20 °C. Controleer op de afwezigheid van de gebruikte interne standaard en overlapping met andere verbindingen in de onderzochte soort. Er kunnen verschillende standaarden worden gebruikt; de selectie van de interne normen in dit protocol was gebaseerd op eerdere tests met gemeenschappelijke bonenextracten16. Extractiemengsel 2 (EM2) water/ methanol (MeOH) (3:1 v/v) Voeg voor 100 ml EM2 75 ml dubbel gedestilleerd water en 25 ml MeOH toe in een schone glazen fles. Voeg 500 μL EM2 per monster toe en bereid een stamoplossing volgens de experimentele steekproefgrootte, die voor het hele experiment moet worden gebruikt. Bewaar EM2 bij 4 °C. Gedroogde zaden Extractiemengsel 3 (EM3) methanol (MeOH)/ water (7:3 v/v) Voeg voor 100 ml EM3 70 ml MeOH en 30 ml dubbel gedestilleerd water toe in een schone glazen fles. Bereid 1 ml EM3 voor elk monster. Voeg 400 μL ribitol (1 mg/ml in water) toe als interne normen voor de op GC-MS gebaseerde analyse en 125 μL isovitexine (1 mg/ml in MeOH/water (1:1 v/v)) voor UHPLC-MS-gebaseerde metabolietanalyse.OPMERKING: Bereid een stamoplossing voor op basis van de experimentele steekproefgrootte en gebruik deze voor het hele experiment. Bewaar EM3 bij 4 °C. 4. Monster extractie Vers weefsel, bijvoorbeeld bladeren en wortels Bereid drie 1,5 ml safe-lock microcentrifugebuizen voor elk monster voor. Bewaar EM1 in een vloeistofkoelsysteem van -20 °C. Breng de verse monsters van de -80 °C vriezer over naar droogijs of vloeibare stikstof voor transport. Voeg 1 ml voorgekoelde EM1 toe aan elke 50 mg aliquot en vortex kort voordat u op ijs blijft. Incubeer de monsters op een orbitale schudder bij 800 × g gedurende 10 minuten bij 4 °C. Soniceer de monsters in een ijsgekoeld ultrasoonapparaatbad gedurende 10 minuten. Voeg 500 μL EM2 toe met een meerkanaals pipet om variatie in toegevoegde volumes te voorkomen. Vortex de monsters kort om de extractiemengsels te mengen voordat ze worden gecentrifugeerd bij 11.200 × g gedurende 5 minuten bij 4 °C. Nadat fasescheiding is opgetreden, brengt u 500 μL van de bovenste lipidebevattende fase over naar een vooraf gelabelde 1,5 ml safe-lock microcentrifugebuis. Verwijder de rest van de bovenste fase.OPMERKING: Wees voorzichtig tijdens het overbrengen, want deze bovenste fase heeft een hoge dampdruk en heeft de neiging om uit de pipet te lekken. Breng 150 μL en 300 μL van de lagere polaire en semipolaire metabolietbevattende fasen over in twee 1,5 ml safe-lock microcentrifugebuizen die worden gebruikt voor respectievelijk GC-MS- en UHPLC-MS-analyse. Concentreer alle geëxtraheerde fracties door de oplosmiddelen te laten verdampen zonder verhitting met behulp van een vacuümconcentrator en bewaar bij -80 °C. Gedroogde zaden Bereid twee 1,5 ml safe-lock microcentrifugebuizen voor elk monster voor. Houd EM3 op ijs. Plaats een metalen kraal met een diameter van 5 mm in de aliquots van het monster. Voeg 1 ml EM3 toe aan elke 50 mg aliquot en homogeniseer de monsters op 25 Hz gedurende 2-3 minuten voordat je ze in de ijskast zet. Soniceer de monsters in een ijsgekoeld ultrasoonapparaatbad gedurende 10 minuten. Vortex de monsters kort voordat ze worden gecentrifugeerd bij 11.200 × g gedurende 5 minuten bij 4 °C. Breng 150 μL en 300 μL van het supernatant over in twee 1,5 ml safe-lock microcentrifugebuizen die worden gebruikt voor respectievelijk GC-MS- en UHPLC-MS-analyse. Concentreer alle geëxtraheerde fracties door de oplosmiddelen te laten verdampen zonder verhitting met behulp van een vacuümconcentrator en bewaar bij -80 °C.OPMERKING: Op basis van ervaring wordt gebruikers geadviseerd om stap 4.2 uit te voeren voor semipolaire metabolieten en gederivatiseerde metabolietanalyse in gedroogde zaden. Voer extractiestap 4.1 uit voor lipidenanalyse van gedroogd zaad. 5. Analyse van lipiden met behulp van UHPLC-MS Suspensie de gedroogde lipidefracties opnieuw in 250 μL acetonitril:2-propanol (7:3, vol/vol). Sonicateer de lipidefase gedurende 5 minuten, centrifugeer op 11.200 × g gedurende 1 min. Breng 90 μL van het supernatant over in een glazen injectieflacon voor LC-MS. Injecteer 2 μL van de extracten in de LC-MS. Voer lipidedacctionering uit op een omgekeerde fase C8-kolom op 60 °C met een stroom van 400 μL/min met geleidelijke veranderingen van eluent A en B zoals weergegeven in tabel 1. Verkrijg de massaspectra in positieve ionisatiemodus met een massabereik van 150-1.500 m/z. Neem verschillende QC-monsters op in alle dagelijkse batches en een blanco om correctie voor analytische variatie te garanderen. Randomiseer monsters blokgewijs in opeenvolgende volgorde. 6. Analyse van polaire en semipolaire metabolieten met behulp van UHPLC-MS De gedroogde polaire fase opnieuw suspensie in 180 μL UHPLC-methanol: water (1:1 v/v). Soniceer de polaire fase gedurende 2 min, centrifugeer op 11.200 × g gedurende 1 min. Breng 90 μL van het supernatant over in een glazen injectieflacon voor LC-MS. Injecteer 3 μL van de extracten in de LC-MS. Voer metabolietfractionering uit op een omgekeerde fase C18-kolom op 40 °C met een stroom van 400 μL/min met geleidelijke veranderingen van eluent A en B zoals weergegeven in tabel 1. Verkrijg de massaspectra in een massabereik van 100-1.500 m/z in een volledige MS-scan en alle ionfragmentatie (AIF) geïnduceerd door hoogenergetische botsingsdissociatie (HCD) van 40 keV.OPMERKING: Gebruik beide ionisatiemodi. Vanwege de beperkte capaciteit tijdens het uitvoeren van grote aantallen monsters, voert u echter testmonsters uit in beide ionisatiemodi om de gewenste ionisatiemodus te bepalen. Neem verschillende QC-monsters op in alle dagelijkse batches en een blanco om correctie voor analytische variatie te garanderen. Randomiseer monsters blokgewijs in opeenvolgende volgorde. Voer een gepoolde QC uit in gegevensafhankelijke MS2 in zowel negatieve als positieve ionisatiemodi. Gebruik de verkregen massaspectra in een latere stap (8.5) voor annotatie. 7. Analyse van gederivatiseerde metabolieten met behulp van GC-MS 17,18 OPMERKING: De analyse van gederivatiseerde metabolieten is gebaseerd op een eerder beschreven protocol17. Behandel alle derivatisatiereagentia in de zuurkast. Zorg ervoor dat N-methyl-N-(trimethylsilyl)trifluoracetamide (MSTFA) niet in contact komt met water en vochtigheid. Derivatisatiereagens 1 (DR1) Los methoxyaminehydrochloride op in pyridine om een concentratie van 30 mg/ml DR1 te verkrijgen. Gebruik 40 μL DR1 voor elk monster. Bereid een voorraadoplossing op basis van de monstergrootte en bewaar bij kamertemperatuur. Derivatisatiereagens 2 (DR2) Los MSTFA op met 20 μL vetzuurmethylesters (FAME’s) per 1 ml MSTFA. Gebruik 70 μL DR2 voor elk monster. Bereid een voorraadoplossing op basis van de steekproefgrootte. Bewaar MSTFA bij 4 °C en de FAME’s bij -20 °C.OPMERKING: FAME’s omvatten methylcaprylaat, methylpelargonaat, methylcapraat, methyllauraat, methylmyristaat, methylpalmitaat, methylstearaat, methyleicosanoaat, methyldocosanoaat, lignocerinezuurmethylester, methylhexacosanoaat, methyloctacosanoaat en triataanzuurmethylester, die zijn opgelost in CHCl3 in een concentratie van respectievelijk 0,8 μL / ml of 0, 4 mg / ml voor vloeibare of vaste normen. Droog de pellet opnieuw uit de polaire fase (bewaard bij -80 °C) met behulp van een vacuümconcentrator gedurende 30 minuten om interferentie van H2O tijdens de opslag met de oplosmiddelen die worden gebruikt voor de downstream derivatisatie te voorkomen. Voeg 40 μL DR1 toe. Schud de monsters op 950 × g gedurende 2 uur bij 37 °C met behulp van een orbitale schudder, gevolgd door een korte spin-down van de vloeistof. Voeg 70 μL DR2 toe. Schud opnieuw op 950 × g gedurende 30 minuten bij 37 °C met behulp van een orbitale schudder. Centrifugeer kort bij kamertemperatuur voordat u 90 μL overbrengt in glazen injectieflacons voor GC-MS-analyse. Injecteer 1 μL in de splitless modus van GC-MS, afhankelijk van de metabolietconcentraties, met een constante heliumdragergasstroom van 2 ml/min. De injectietemperatuur wordt ingesteld op 230 °C met behulp van een MDN-35 capillaire kolom van 30 m.OPMERKING: Aanvullende informatie, bijvoorbeeld temperatuurgradiënt, is te vinden in tabel 1. Het massabereik is ingesteld op 70-600 m/z met 20 scans/min. Neem gesplitste modi op om de kwantificering van vermeende overbelastingsverbindingen mogelijk te maken, waardoor kosten en tijd worden bespaard voor re-derivatisatie van extracten in dergelijke gevallen. Neem verschillende QC-monsters op in alle dagelijkse batches en een blanco om correctie voor analytische variatie te garanderen. Randomiseer monsters goed blokgewijs in opeenvolgende volgorde. 8. Chromatogramverwerking en samengestelde annotatie Filter chemische ruis door intensiteitsdrempels te definiëren. Neem alle QC-monsters op tijdens het verwerken van de chromatogrammen.OPMERKING: Voor grootschalige gegevens is ruisfiltering cruciaal om de computertijd en verwerkingskracht te verminderen. Lijn de chromatogrammen uit door een retentietijdverschuivingsvenster te definiëren. Controleer de chromatogrammen van elke batch om de intra- en inter-batch variatie te beoordelen. Voer piekdetectie uit afhankelijk van de piekvorm, bijvoorbeeld hoogte en breedte voor volledige breedte bij half-maximum (FWHM) berekeningen. Clusterisotopen om redundante signalen te verminderen en singletons uit te filteren.OPMERKING: Zie de tabel met materialen voor meer informatie over software die wordt gebruikt voor chromatogramverwerking. Diepgaande protocollen over het verwerken van chromatogrammen met behulp van verschillende vrij beschikbare softwaretools, bijvoorbeeld MS-DIAL, MetAlign, MzMine en Xcalibur 19,20,21, worden verstrekt. Gebruik de ddMS2-gegevens van een gepoold QC-monster voor samengestelde annotatie. Beoordeel de moleculaire structuur door de mono-isotoopmassa te bepalen en gemeenschappelijke neutrale verliezen, bekende geladen aglyconen en verschillende soorten splitsingen, bijvoorbeeld homolytisch of heterolytisch16,22, waar te nemen. Volg voor het rapporteren van metabolietgegevens de aanbeveling beschreven in Fernie et al. 201123.OPMERKING: Verschillende computationele metabolomics-benaderingen kunnen worden gebruikt om metabolomics-gegevens te analyseren 24,25,26. 9. Normalisatie van grootschalige metabolomics dataset Controleer de verdeling van de interne standaard(s) en normaliseer door te corrigeren voor de respons van enkele of meerdere interne standaarden. Corrigeer de piekintensiteiten verkregen uit het chromatogram over het exacte monstergewicht door de piekintensiteiten te delen door het aliquote gehomogeniseerde monstergewicht uit stap 2.5. Correct voor intensiteitsdrift over multi-batch series. Voer op QC gebaseerde correctiemethoden uit, zoals loess (local estimated scatterplot smoothing)27 met R.OPMERKING: Er zijn verschillende tools en pakketten beschikbaar om de afwijking van de MS-prestaties tijdens de acquisitie van de hele batches 28,29 aan te pakken. Zorg voor een normale verdeling van eigenschappen door gegevenstransformatie, bijvoorbeeld Box-Cox-transformatie30 met behulp van de boxcox () -functie van het R-pakket MASS voor het uitvoeren van GWAS. Voer gegevensschaling uit, bijvoorbeeld Pareto-schaling, voor multivariate analyse om een juiste weging van laag overvloedige verbindingen te garanderen31.OPMERKING: Voer indien mogelijk een hersteltest uit om matrixeffecten te voorkomen, bijvoorbeeld ionenonderdrukking14. 10. Genoombrede associatiestudies (GWAS)32 Noem single nucleotide polymorphism (SNP) of structurele varianten (SV) uit de sequencinggegevens33,34. Filter genotypische gegevens voor minor allel frequency (MAF) 10% om laagfrequente bias met Tassel35 te voorkomen. Bereken de beste lineaire onbevooroordeelde voorspellingen (BLUP’s) voor elk genormaliseerd kenmerk over de experimentele herhalingen om vertekening afkomstig van omgevingsfactoren (willekeurige effecten) te elimineren met behulp van het R-pakket Ime436. Gebruik BLUP’s van elke functie afzonderlijk om GWAS uit te voeren met behulp van het rMVP-pakket in R37.OPMERKING: Elke metabolomics-functie wordt hier gezien als een individueel op zichzelf staand fenotype. Tijdens het uitvoeren van GWAS, correct voor populatiestructuur met behulp van principal component analysis (PCA) en identiteit per staat (IBS) of vanRaden om verstorende effecten te minimaliseren. Overweeg bovendien om een gemengd lineair model (MLM) of een multi-locus gemengd model (MLMM) te gebruiken, omdat gemengde modellen vaste en willekeurige effecten bevatten. 11. QTL-detectie Controleer de SNP’s die een significante associatie vertonen, rekening houdend met de Manhattan-plots, voor linkage disequilibrium (LD) -berekeningen om de onderliggende genetische regio te bepalen. Voer LD-berekeningen uit met behulp van de R-pakket LD-heatmap of Tassel 5. Controleer de geassocieerde SNP’s op de effectgrootte ten opzichte van de eigenschap door de eigenschapsniveaus te onderzoeken op statistische veranderingen tussen haplotypen om potentiële causale SNP’s te vinden, bijvoorbeeld SNP’s die leiden tot een aminozuurverandering in de eiwitcoderende sequentie, wat de fenotypische variatie zou kunnen verklaren.OPMERKING: Aangezien SNP-eigenschap associaties niet noodzakelijkerwijs causale associatie opleveren, is het cruciaal om het genomische gebied te bepalen. Samengestelde identiteit door kenmerkannotatie kan enorm helpen bij het vinden van de juiste kandidaatgenen in een specifiek genomisch gebied. We stellen voor om alle gedetecteerde QTL geassocieerd met bepaalde verbindingen in een pleiotrope kaart te combineren om de genetische regio’s38 te onderstrepen, zoals weergegeven in figuur 4. Voor validatie van kandidaatgenen kunnen verschillende benaderingen worden uitgevoerd (zie de discussie).

Representative Results

Succesvolle metabolomics GWAS-experimenten moeten beginnen met een goed experimenteel ontwerp, gevolgd door monsterverzameling, extractie, gegevensverzameling en verwerking, zoals geïllustreerd in figuur 1. In dit protocol werd de MTBE-methode15 gebruikt om honderden metabolieten te extraheren en te analyseren die tot verschillende samengestelde klassen behoren. Chromatografie is sterk afhankelijk van de eigenschappen van de gebruikte kolom en van elutiebuffermengsels. Figuur 2 toont chromatogrammen van QC-monsters, wat het elutiepatroon van enkele belangrijke lipidenklassen in dit analysesysteem aangeeft. De toegepaste gradiënten voor elk platform zijn weergegeven in tabel 1. Sterke nadruk werd gelegd op het omgaan met systeemfouten in grootschalige experimenten. Het uitvoeren van grootschalige metabolomics is inherent geassocieerd met systemische fouten. Voor demonstratie analyseerden we lipidomische gegevens over verschillende veel voorkomende bonensoorten. Aanvullende tabel 1 bevat de geëxtraheerde ruwe lipidomische gegevens die zijn verkregen na chromatogramverwerking met behulp van de software die is aangegeven in de tabel met materialen. Het volgen van dit protocol stelde ons in staat om grote problemen bij het omgaan met omics-gegevens te omzeilen, vooral tijdens het verwerken van grote steekproefsets. De normalisatieprocedure levert een nauwkeurige correctie op van batchgewijze analytische fouten, zoals aangetoond in figuur 3. Hoewel het verhogen van het aantal QC-monsters de kracht van de normalisatie zou vergroten, is dit niet altijd haalbaar vanwege kosten- en tijdsbeperkingen. Voor high-throughput metabolomics GWAS met niet-gerichte metabole kenmerken is het essentieel om hogere aantallen trait-marker associatie op de juiste manier te illustreren. Een pleiotrope kaart38 die meerdere GWAS-resultaten combineert, kan worden gebruikt om de genomische regio’s te markeren waaraan verschillende kenmerken zijn gekoppeld (figuur 4). Figuur 1: Stroomdiagram van de op metabolomica gebaseerde GWAS in planten. Verschillende stappen vanaf het experimentele ontwerp tot de detectie van QTL worden weergegeven in het linkerdeelvenster. In het rechterdeelvenster worden meerdere figuren weergegeven die verschillende stappen ondersteunen die in het linkerdeelvenster worden genoemd. Vanaf de rechterboven wordt (1) een voorgestelde reeks monsters getoond voor LC-MS, (2) pre- en post-genormaliseerde scoreplots van PCA, inclusief een representatieve functieverdeling voor- en nabewerking, met rood dat QC-monsterintensiteiten aangeeft, en (3) een Manhattan-plot met significante associaties waarnaar LD- en haplotypeverdelingen werden gegenereerd. Afkortingen: GWAS = genoombrede associatiestudies; QTL = kwantitatieve eigenschap loci; PCA = analyse van de hoofdcomponenten; QC = kwaliteitscontrole; LD = koppelingsdisequilibrium; MS = massaspectrometrie; LC-MS = vloeistofchromatografie-massaspectrometrie; GC-MS = gaschromatografie-massaspectrometrie; LOESS = lokaal geschatte scatterplot smoothing; MLM/MLMM = gemengd lineair model/multi-locus gemengd-model. Klik hier om een grotere versie van deze figuur te bekijken. Figuur 2: Chromatogramverwerking. Twee QC-chromatogrammen (base peak; lipidegegevens) uit verschillende batches tonen de batchgewijze variatie voor bepaalde lipideklassen in de gepoolde QC-monsters. Vier belangrijke lipidenklassen worden aangegeven met hun respectieve elutievensters in het interne LC-MS-systeem. De chromatogrammen werden geëxporteerd uit MzMine21. Afkortingen: QC = kwaliteitscontrole; LC-MS = vloeistofchromatografie-massaspectrometrie. Klik hier om een grotere versie van deze figuur te bekijken. Figuur 3: Correctie van systematische fouten. Belangrijkste componentanalyse van verworven lipidomische gegevens, pre- (links, ruwe gegevens) en postcorrectie voor systemische fouten (rechts, batch löss). De onderste panelen illustreren de functieverdeling (Cluster_00005) over de monsters (n = 650) en batches (n = 10) pre- (links) en post (rechts) correctie voor analytische variatie. Afkortingen: PCA = principal component analysis; QC = kwaliteitscontrole; LOESS = lokaal geschatte scatterplot smoothing. Klik hier om een grotere versie van deze figuur te bekijken. Figuur 4: Pleiotrope kaart die de gecombineerde GWAS-resultaten illustreert. De pleiotrope kaart markeert regio’s in het hele genoom die geassocieerd zijn met verschillende eigenschappen. De getallen op de buitenste ringen geven de overeenkomstige chromosomen aan. Elke circlet vertegenwoordigt een individuele eigenschap met zijn significant geassocieerde SNP’s. De kleuren vertegenwoordigen verschillende samengestelde klassen (grijs = samengestelde klasse 1; groen = samengestelde klasse 2; paars = samengestelde klasse 3; geel = samengestelde klasse 4). In het geval van inter-samengestelde klasse associaties met hetzelfde genomische gebied, worden genen gemarkeerd. De binnenste grijze cirkel toont de som van alle significante SNP’s geassocieerd met een specifieke genomische positie. De associaties die in deze figuur worden weergegeven, worden alleen kunstmatig gegenereerd ter illustratie. Afkortingen: GWAS = genoombrede associatiestudies; SNP’s = single-nucleotide polymorfismen. Klik hier om een grotere versie van deze figuur te bekijken. UHPLC-MS-instellingen voor lipiden Tijd [min] Eluent A tot B [%]* Informatie 0 – 1.00 45% A Eluent A: 1% 1M NH 4-Acetaat, 0,1% azijnzuur in water (UHPLC-kwaliteit) 1.00 – 4.00 LG 45% – 25% A Eluent B: 1% 1M NH 4-Acetaat, 0,1% azijnzuur in acetonitril/2-propanol 7:3 (UHPLC-kwaliteit) 4.00 – 12.00 LG 25% – 11% A Debiet: 400 μL/min 12.00 – 15.00 LG 11% – 0% A Injectievolume: 2 μL 15.00 – 19.50 cw 0% A 19.50-19.51 0% – 45% A 19.51-24.00 EQ 45% UHPLC-MS/MS-instellingen voor polaire en semipolaire metabolieten Tijd [min] Eluent A en B [%]* Informatie 0 – 1.00 99% A Eluent A: 0,1% mierenzuur in water (UHPLC-kwaliteit) 1.00 – 11.00 LG 99% -60% A Eluent B: 0,1% mierenzuur in acetonitril (UHPLC-kwaliteit) 11.00 – 13.00 LG 60% – 30% A Debiet: 400 μL/min 13.00 – 15.00 LG 30% – 1% A Injectievolume: 3 μL 15.00 – 16.00 cw 1% A 16.00 – 17.00 LG 1% – 99% A 17.00 – 20.00 eq 99% A GC-MS-instellingen voor gederivatiseerde metabolieten Tijd [min] Temperatuur [°C] Informatie 0 – 2.00 85 Draaggas: Helium 2.00 – 18.66 LG 80 – 330 Debiet: 2 ml/min 18.66 – 24.66 CW 330 Temperatuurgradiënt: 15 °C/min 24.66 snelle koeling Injectievolume: 1 μL Tabel 1: Verloopinstellingen voor elk van de analyseplatforms7. Afkortingen: lg = lineaire gradiënt; cw = kolom wassen; eq = evenwicht; UHPLC-MS = ultra-high-performance vloeistofchromatografie-massaspectrometrie; UHPLC-MS/MS = ultra-high-performance vloeistofchromatografie-tandem massaspectrometrie; GC-MS = gaschromatografie-massaspectrometrie. * = procentuele waarde komt overeen met eluent A; de resterende procentuele waarde komt overeen met eluent B. Aanvullende tabel 1: Ruwe lipidomics-gegevens. Geeft de piekintensiteiten aan voor elk van de gedetecteerde clusters over elk monster. Klik hier om deze tabel te downloaden.

Discussion

Zowel GC-MS als LC-MS zijn veelgebruikte hulpmiddelen voor het profileren van complexe mengsels van verschillende metabolietklassen. Het verwerken van grote datasets met deze tools is inherent geassocieerd met een niet-biologische variatie, bijvoorbeeld analytische variatie, die de interpretatie van de resultaten verstoort en vertekent. Dit protocol presenteert een robuuste en high-throughput extractiepijplijn voor uitgebreide metabole profilering om variatie van niet-biologische oorsprong te elimineren en grootschalige “omics” -studies uit te voeren. De volumes en concentraties die in dit protocol worden gebruikt, zijn aangepast voor peulvruchtensoorten in verschillende weefsels. Deze parameters kunnen echter enigszins worden gewijzigd en ook worden gebruikt voor grootschalige metabole monsters van andere plantensoorten.

De eerder15 beschreven MTBE-gebaseerde extracties kunnen worden gebruikt om gederivatiseerde metabolieten, semipolaire metabolieten en lipiden te analyseren. Dit kan worden uitgebreid voor eiwit- en plantenhormoonextracties39, die buiten het toepassingsgebied van dit protocol vielen. Andere extractieprotocollen zijn gebaseerd op dichloormethaan:ethanolmengsels40,41. Van deze extractieprotocollen biedt het MTBE:methanol extractieprotocol een gunstig en minder gevaarlijk alternatief voor de bestaande op chloroform gebaseerde extractieprotocollen42 en resulteert het niet in een eiwitpellet als interfase tussen de polaire en lipidefase. Bovendien zijn MTBE-methoden al gebruikt in verschillende studies voor verschillende biologische monsters 43,44,45.

Dit protocol bespreekt verschillende cruciale stappen die kunnen leiden tot potentiële variatie bij het verwerken van een groot aantal monsters, bijvoorbeeld tijdens het oogstenvan 12,13, extractie14 en randomisatie46. Bovendien zijn er aanvullende kwesties die niet in dit protocol zijn besproken en waarmee rekening moet worden gehouden om metabolomische gegevens van hoge kwaliteit te garanderen, bijvoorbeeld matrixeffect en ionenonderdrukking14.

De kracht van op QC gebaseerde normalisatiemethoden is inherent afhankelijk van het aantal QC-monsters in elke batch. Zoals eerder vermeld, hoewel het verhogen van het aantal het vermogen zou vergroten, is de intra-batchvariatie van de QC’s relatief marginaal in vergelijking met inter-batchvariatie in deze analytische systemen, zoals geïllustreerd in figuur 3. Over het algemeen zijn er andere op QC gebaseerde normalisatiemethoden, zoals systemische foutverwijdering met behulp van random forest (SERRF), waarvan is aangetoond dat ze beter presteren dan de meeste andere normalisatiemethoden, zoals batch-wise-ratio, normalisatie met behulp van een optimale selectie van meerdere interne standaarden (NOMIS) en probabilistische quotiëntnormalisatie (PQN)47 . SERRF vertrouwt echter op meerdere QC-monsters in elke batch, bijvoorbeeld elk tiende monster, wat niet haalbaar is bij het verwerken van grote aantallen monsters. Het belangrijkste voordeel van QC-gebaseerde normalisatie ten opzichte van andere datagestuurde of interne standaardgebaseerde methoden is dat het de essentiële biologische variatie behoudt en tegelijkertijd ongewenste technische variatie opvangt28. Lezers kunnen verwijzen naar deze recensie over de omgang met variatie28.

Een belangrijk probleem in GWAS is het aantal fout-positieven, die voornamelijk voortkomen uit de koppeling van causale en niet-causale sites48,49. Ten tweede corrigeren de conservatieve statistische correctiebenaderingen, bijvoorbeeld Bonferroni en FDR, correct voor het aantal onafhankelijke tests, dat niet gelijk is aan het aantal geteste SNP’s in GWAS vanwege de koppeling tussen nabije SNP’s50,51 Daarom is het werkelijke aantal onafhankelijke tests vaak lager. Een andere manier om de conservatieve statistische drempel te verlagen, zou zijn om het aantal geteste SNP’s dat wordt gebruikt voor GWAS te verminderen op basis van koppelingsverval over gedefinieerde genomische regio’s52. Het GWAS-geïntegreerde high-throughput metabolomics-platform dat in dit protocol wordt beschreven, heeft een breed scala aan toepassingen. In het bijzonder zal het verbeteringen in de gewasveredeling vergemakkelijken door de metaboliet / lipidesamenstelling te veranderen voor industrieel en nutritioneel gewenste niveaus. Over het algemeen heeft metabolomics een diepgaand inzicht gegeven in de genetische architectuur van een overvloed aan metabolieten en metabole diversificatie die plaatsvond tijdens de domesticatie van gewassen in de afgelopen decennia, wat wijst op het enorme potentieel van metabolomics-geassocieerde veredeling53. De moleculair biologische benaderingen voor downstream QTL-validatie omvatten de generatie van CRISPR/Cas9-mutantlijnen54, T-DNA-insertielijnen55, stabiele en/of transiënte overexpressielijnen56, VIGS, ex vivo metabolomics-benaderingen57 naast de conventionele benadering bij het genereren van cross F2-populaties en kruisvalidatie in verschillende populaties.

Door de noodzakelijke correctie uit te voeren voor de analytische variaties zoals hierboven beschreven, kunnen naast GWAS verschillende geïntegreerde benaderingen worden uitgevoerd, zoals metaboliet-metaboliet, metaboliet-lipidencorrelatieanalyse, correlatieanalyse tot fenomische gegevens om licht te werpen op complexere eigenschappen, en /of co-expressieanalyse om de basis van biologische systemen verder te ontrafelen58.

Disclosures

The authors have nothing to disclose.

Acknowledgements

M.B. wordt ondersteund door de IMPRS-PMPG ‘Primary Metabolism and Plant Growth’. A.R.F. en S.A. erkennen de financiële steun van het HORIZON 2020 Onderzoeks- en Innovatieprogramma van de EU, project PlantaSYST (SGA-CSA nr. 739582 onder FPA nr. 664620) en project INCREASE (GA 862862).

Materials

Reagents and standards
1,2-diheptadecanoyl-sn-glycero-3- phosphocholine (17:0 PC) Avanti Polar Lipids 850360P Internal standard for lipids
Chloroform Supleco 67-66-3 FAME solvent
Isovitexin Sigma Aldrich 38953-85-4 Internal standard for metabolites
Lignoceric Acid Methylester Sigma Aldrich 2442-49-1 FAME
Methanol (MeOH) Biosolve Chemicals 13684102 ULC-MS grade
Methoxyamin -hydrochlorid Sigma Aldrich 593-56-6 Metabolite deriviatization
Methyl laurate Sigma Aldrich 111-82-0 FAME
Methyl myristate Sigma Aldrich 124-10-7 FAME
Methyl palmitate Sigma Aldrich 112-39-0 FAME
Methyl stearate Sigma Aldrich 112-61-8 FAME
Methyl tert-butyl ether (MTBE) Biosolve Chemicals 13890602 HPLC grade
Methyl-caprat Sigma Aldrich 110-42-9 FAME
Methylcaprylat Sigma Aldrich 111-11-5 FAME
Methyldocosanoat Sigma Aldrich 929-77-1 FAME
Methyleicosanoat Sigma Aldrich 1120-28-1 FAME
Methyl-hexacosanoat Sigma Aldrich 5802-82-4 FAME
Methyl-octacosanoat Sigma Aldrich 55682-92-3 FAME
Methyl-pelargonate Sigma Aldrich 1731-84-6 FAME
N-Methyl-N-(trimethylsilyl)trifluoracetamid (MSTFA) Macherey-Nagel 24589-78-4 Metabolite deriviatization
Pyridine Supleco 110-86-1 Metabolite deriviatization
Ribitol Supleco 22566-17-2 Internal standard for derivatized metabolites
Triacontanoic Acid Methyl Ester TCI Chemicals 629-83-4 FAME
Water Biosolve Chemicals 23214102 ULC-MS grade
Equipment
1.5 mL Safe-lock microcentrifuge tubes Eppendorf 3120086
2 mL Safe-lock microcentrifuge tubes Eppendorf 3120094
Balance Sartorius Corporation 14 557 572
DB-35ms, 30 m, 0,25 mm, 0,25 µm Aglient 123-3832 Analysis of derivatized metabolites
GC-MS system Leco Pegasus HT TOF-MS (LECO Corporation) Analysis of derivatized metabolites
Grinding Balls, Stainless Steel OPS DIAGNOSTICS GBSS 196-2500-10
MS system Exactive, Orbitrap-type, MS (Exactive, Thermo Fisher Scientific) Analysis of lipids
MS system Q Exactive Focus (Q Exactive™ Focus Hybrid Quadrupol-Orbitrap™
Massenspektrometer, Thermo Fisher Scientific)
Analysis of metabolites
Refrigerated microcentrifuge Eppendorf, model 5427R 22620701
Reversed Phase (RP) Bridged Ethyl Hybrid (BEH) C8 column
(100 mm × 2.1 mm containing 1.7 μm diameter particles)
Waters 186002878 Analysis of lipids
RP High Strength Silica (HSS) T3 column
(100 mm × 2.1 mm containing 1.8 μm diameter particles)
Waters 186003539 Analysis of metabolites
Shaker Eppendorf Thermomixer 5436 2050-100-05
Sonicator USC 300 TH 142-0084
Tissue grinding mixer mill Retsch, Mixer Mill MM 300 20.746.0001
UPLC system Waters Acquity UPLC system (Waters)
Vacuum concentrator Scan Speed Maxi Vac Alpha Evaporators 7.008.500.002
Vortex mixer Vortex-Genie 2, Model G560 SI-0236
Software
MetAlign Chromatogram processing
MzMine Chromatogram processing
R package "data.table"
R package "fujiplot" pleiotrpoic map
R package "genetics"
R package "Ime4" BLUPs calculation
R package "LDheatmap" LD plots
R package "MASS" transformation
R package "rMVP" GWAS
R version 4.0.4
RefinerMS Chromatogram processing
RefinerMS Genedata Expressionist Chromatogram processing
Tassel 5 Genotype filtering
Xcalibur Thermo Fisher Scientific OPTON-30965 Chromatogram processing

References

  1. Doerr, A. Global metabolomics. Nature Methods. 14 (1), 32 (2017).
  2. Fessenden, M. Metabolomics: Small molecules, single cells. Nature. 540 (7631), 153-155 (2016).
  3. Oliver, S. G., Winson, M. K., Kell, D. B., Baganz, F. Systematic functional analysis of the yeast genome. Trends in Biotechnology. 16 (9), 373-378 (1998).
  4. Fiehn, O. Metabolomics-the link between genotypes and phenotypes. Plant Molecular Biology. 48 (1), 155-171 (2002).
  5. Wu, S., et al. Mapping the Arabidopsis metabolic landscape by untargeted metabolomics at different environmental conditions. Molecular Plant. 11 (1), 118-134 (2018).
  6. Sysi-Aho, M., Katajamaa, M., Yetukuri, L., Orešič, M. Normalization method for metabolomics data using optimal selection of multiple internal standards. BMC Bioinformatics. 8 (1), 93 (2007).
  7. Chen, M., Rao, R. S. P., Zhang, Y., Zhong, C. X., Thelen, J. J. A modified data normalization method for GC-MS-based metabolomics to minimize batch variation. SpringerPlus. 3 (1), 439 (2014).
  8. Dunn, W. B., et al. Metabolic profiling of serum using Ultra Performance Liquid Chromatography and the LTQ-Orbitrap mass spectrometry system. Journal of Chromatography B. 871 (2), 288-298 (2008).
  9. Fiehn, O., et al. Metabolite profiling for plant functional genomics. Nature Biotechnology. 18 (11), 1157-1161 (2000).
  10. vander Kloet, F. M., Bobeldijk, I., Verheij, E. R., Jellema, R. H. Analytical error reduction using single point calibration for accurate and precise metabolomic phenotyping. Journal of Proteome Research. 8 (11), 5132-5141 (2009).
  11. Folch, J., Lees, M., Stanley, G. H. S. A simple method for the isolation and purification of total lipides from animal tissues. Journal of Biological Chemistry. 226 (1), 497-509 (1957).
  12. Fukushima, A., et al. Impact of clock-associated Arabidopsis pseudo-response regulators in metabolic coordination. Proceedings of the National Academy of Sciences of the United States of America. 106 (17), 7251-7256 (2009).
  13. Kerwin, R. E., et al. Network quantitative trait loci mapping of circadian clock outputs identifies metabolic pathway-to-clock linkages in Arabidopsis. The Plant Cell. 23 (2), 471-485 (2011).
  14. Tohge, T., et al. From models to crop species: Caveats and solutions for translational metabolomics. Frontiers in Plant Sciences. 2, 61 (2011).
  15. Salem, M., Bernach, M., Bajdzienko, K., Giavalisco, P. A simple fractionated extraction method for the comprehensive analysis of metabolites, lipids, and proteins from a single sample. Journal of Visualized Experiments:JoVE. (124), e55802 (2017).
  16. Tohge, T., Fernie, A. R. Combining genetic diversity, informatics and metabolomics to facilitate annotation of plant gene function. Nature Protocols. 5 (6), 1210-1227 (2010).
  17. Lisec, J., Schauer, N., Kopka, J., Willmitzer, L., Fernie, A. R. Gas chromatography mass spectrometry-based metabolite profiling in plants. Nature Protocols. 1 (1), 387-396 (2006).
  18. Osorio, S., Do, P. T., Fernie, A. R., Hardy, N. W., Hall, R. D. . Plant Metabolomics: Methods and Protocols. , 101-109 (2012).
  19. De Vos, R. C. H., et al. Untargeted large-scale plant metabolomics using liquid chromatography coupled to mass spectrometry. Nature Protocols. 2 (4), 778-791 (2007).
  20. Perez de Souza, ., Alseekh, L., Naake, S., Fernie, T., A, Mass spectrometry-based untargeted plant metabolomics. Current Protocols in Plant Biology. 4 (4), 20100 (2019).
  21. Pluskal, T., Castillo, S., Villar-Briones, A., Orešič, M. MZmine 2: Modular framework for processing, visualizing, and analyzing mass spectrometry-based molecular profile data. BMC Bioinformatics. 11 (1), 395 (2010).
  22. Watson, J. T., Sparkman, D. O. Electron Ionization. Introduction to mass spectrometry: Instrumentation, applications and strategies for data interpretation. , 315 (2007).
  23. Fernie, A. R., et al. Recommendations for reporting metabolite data. The Plant Cell. 23 (7), 2477 (2011).
  24. Treutler, H., et al. Discovering regulated metabolite families in untargeted metabolomics studies. Analytical Chemistry. 88 (16), 8082-8090 (2016).
  25. Wang, M., et al. Sharing and community curation of mass spectrometry data with Global Natural Products Social Molecular Networking. Nature Biotechnology. 34 (8), 828-837 (2016).
  26. Naake, T., Fernie, A. R. MetNet: Metabolite network prediction from high-resolution mass spectrometry data in R aiding metabolite annotation. Analytical Chemistry. 91 (3), 1768-1772 (2019).
  27. Chambers, J. M. . Statistical models in S. , (1991).
  28. Misra, B. B. Data normalization strategies in metabolomics: Current challenges, approaches, and tools. European Journal of Mass Spectrometry. 26 (3), 165-174 (2020).
  29. Livera, A. M. D., et al. Statistical methods for handling unwanted variation in metabolomics data. Analytical Chemistry. 87 (7), 3606-3615 (2015).
  30. Sakia, R. M. . The Box-Cox transformation technique: a review. 41 (2), 169-178 (1992).
  31. vanden Berg, R. A., Hoefsloot, H. C. J., Westerhuis, J. A., Smilde, A. K., vander Werf, M. J. Centering, scaling, and transformations: improving the biological information content of metabolomics data. BMC Genomics. 7, 142 (2006).
  32. Marees, A. T., et al. A tutorial on conducting genome-wide association studies: Quality control and statistical analysis. International Journal of Methods in Psychiatric Research. 27 (2), 1608 (2018).
  33. Torkamaneh, D., Laroche, J., Bastien, M., Abed, A., Belzile, F. Fast-GBS: a new pipeline for the efficient and highly accurate calling of SNPs from genotyping-by-sequencing data. BMC Bioinformatics. 18 (1), 5 (2017).
  34. Zhao, S., Agafonov, O., Azab, A., Stokowy, T., Hovig, E. Accuracy and efficiency of germline variant calling pipelines for human genome data. Scientific Reports. 10 (1), 20222 (2020).
  35. Bradbury, P. J., et al. TASSEL: software for association mapping of complex traits in diverse samples. Bioinformatics. 23 (19), 2633-2635 (2007).
  36. Bates, D., Mächler, M., Bolker, B., Walker, S. Fitting linear mixed-effects models using lme4. Journal of Statistical Software. 67 (1), (2015).
  37. Yin, L., et al. rMVP: A memory-efficient, visualization-enhanced, and parallel-accelerated tool for genome-wide association study. Genomics, Proteomics & Bioinformatics. , (2021).
  38. Kanai, M., et al. Genetic analysis of quantitative traits in the Japanese population links cell types to complex human diseases. Nature Genetics. 50 (3), 390-400 (2018).
  39. Salem, M. A., et al. An improved extraction method enables the comprehensive analysis of lipids, proteins, metabolites and phytohormones from a single sample of leaf tissue under water-deficit stress. Plant Journal: for Cell and Molecular Biology. 103 (4), 1614-1632 (2020).
  40. Balcke, G. U., et al. Multi-omics of tomato glandular trichomes reveals distinct features of central carbon metabolism supporting high productivity of specialized metabolites. The Plant Cell. 29 (5), 960-983 (2017).
  41. Leonova, T., et al. Does protein glycation impact on the drought-related changes in metabolism and nutritional properties of mature pea (Pisum sativum L.) seeds. International Journal of Molecular Sciences. 21 (2), 567 (2020).
  42. Alfonsi, K., et al. chemistry tools to influence a medicinal chemistry and research chemistry based organisation. Green Chemistry. 10 (1), 31-36 (2008).
  43. Bozek, K., et al. Organization and evolution of brain lipidome revealed by large-scale analysis of human, chimpanzee, macaque, and mouse tissues. Neuron. 85 (4), 695-702 (2015).
  44. Delgado, R., Muñoz, Y., Peña-Cortés, H., Giavalisco, P., Bacigalupo, J. Diacylglycerol activates the light-dependent channel TRP in the photosensitive microvilli of Drosophila melanogaster photoreceptors. The Journal of Neuroscience. 34 (19), 6679 (2014).
  45. Sharma, D. K., et al. UPLC-MS analysis of Chlamydomonas reinhardtii and Scenedesmus obliquus lipid extracts and their possible metabolic roles. Journal of Applied Phycology. 27 (3), 1149-1159 (2015).
  46. Dunn, W. B., Wilson, I. D., Nicholls, A. W., Broadhurst, D. The importance of experimental design and QC samples in large-scale and MS-driven untargeted metabolomic studies of humans. Bioanalysis. 4 (18), 2249-2264 (2012).
  47. Fan, S., et al. Systematic error removal using random forest for normalizing large-scale untargeted lipidomics data. Analytical Chemistry. 91 (5), 3590-3596 (2019).
  48. Larsson, S. J., Lipka, A. E., Buckler, E. S. Lessons from Dwarf8 on the strengths and weaknesses of structured association mapping. PLOS Genetics. 9 (2), 1003246 (2013).
  49. Platt, A., Vilhjálmsson, B. J., Nordborg, M. Conditions under which genome-wide association studies will be positively misleading. Genetics. 186 (3), 1045-1052 (2010).
  50. Nyholt, D. R. A simple correction for multiple testing for single-nucleotide polymorphisms in linkage disequilibrium with each other. American Journal of Human Genetics. 74 (4), 765-769 (2004).
  51. Teo, Y. Y. Common statistical issues in genome-wide association studies: a review on power, data quality control, genotype calling and population structure. Current Opinion in Lipidology. 19 (2), 133-143 (2008).
  52. Privé, F., Aschard, H., Ziyatdinov, A., Blum, M. G. B. Efficient analysis of large-scale genome-wide data with two R packages: bigstatsr and bigsnpr. Bioinformatics. 34 (16), 2781-2787 (2018).
  53. Alseekh, S., et al. Domestication of crop metabolomes: desired and unintended consequences. Trends in Plant Science. 26 (6), 650-661 (2021).
  54. Yano, K., et al. GWAS with principal component analysis identifies a gene comprehensively controlling rice architecture. Proceedings of the National Academy of Sciences of the United States of America. 116 (42), 21262 (2019).
  55. Wu, S., et al. Mapping the Arabidopsis metabolic landscape by untargeted metabolomics at different environmental conditions. Molecular Plant. 11 (1), 118-134 (2018).
  56. Ye, J., et al. An InDel in the promoter of Al-ACTIVATED MALATE TRANSPORTER9 selected during tomato domestication determines fruit malate contents and aluminum tolerance. The Plant Cell. 29 (9), 2249-2268 (2017).
  57. Zhang, W., et al. Genome assembly of wild tea tree DASZ reveals pedigree and selection history of tea varieties. Nature Communications. 11 (1), 3719 (2020).
  58. Tohge, T., Fernie, A. R. Annotation of plant gene function via combined genomics, metabolomics and informatics. Journal of Visualized Experiments: JoVE. (64), e3487 (2012).

Play Video

Cite This Article
Bulut, M., Fernie, A. R., Alseekh, S. Large-Scale Multi-Omics Genome-Wide Association Studies (Mo-GWAS): Guidelines for Sample Preparation and Normalization. J. Vis. Exp. (173), e62732, doi:10.3791/62732 (2021).

View Video