In diesem Protokoll stellen wir einen optimierten Workflow vor, der eine effiziente und schnelle Probenvorbereitung vieler Proben kombiniert. Darüber hinaus bieten wir eine Schritt-für-Schritt-Anleitung zur Reduzierung analytischer Variationen für die Hochdurchsatzbewertung metabolischer GWAS-Studien.
Sowohl die Gaschromatographie-Massenspektrometrie (GC-MS) als auch die Flüssigkeitschromatographie-Massenspektrometrie (LC-MS) sind weit verbreitete Metabolomik-Ansätze zum Nachweis und zur Quantifizierung von Hunderttausenden von Metabolitenmerkmalen. Die Anwendung dieser Techniken auf eine große Anzahl von Proben unterliegt jedoch komplexeren Wechselwirkungen, insbesondere bei genomweiten Assoziationsstudien (GWAS). Dieses Protokoll beschreibt einen optimierten Stoffwechselablauf, der eine effiziente und schnelle Probenvorbereitung mit der Analyse einer großen Anzahl von Proben für Hülsenfrüchtearten kombiniert. Diese leicht modifizierte Extraktionsmethode wurde ursprünglich für die Analyse von pflanzlichen und tierischen Geweben entwickelt und basiert auf der Extraktion in Methyl-tert-butylether: Methanollösungsmittel, um den Einfang von polaren und Lipidmetaboliten zu ermöglichen. Darüber hinaus bieten wir eine Schritt-für-Schritt-Anleitung zur Reduzierung analytischer Variationen, die für die Hochdurchsatzbewertung der metabolischen Varianz in GWAS unerlässlich sind.
Groß angelegte “Omics”-Ansätze haben die Analyse komplexer biologischer Systeme 1,2,3 und ein besseres Verständnis der Verbindung zwischen Genotypen und den resultierenden Phänotypen 4 ermöglicht. Die Metabolomik mit ultrahochleistungsfähiger Flüssigkeitschromatographie-Massenspektrometrie (UHPLC-MS) und GC-MS ermöglichte den Nachweis einer Vielzahl von Metabolitenmerkmalen, von denen nur einige bis zu einem gewissen Grad annotiert sind, was zu einem hohen Anteil unbekannter Metaboliten führte. Komplexe Wechselwirkungen können untersucht werden, indem großflächige Metabolomik mit der zugrunde liegenden genotypischen Variation einer vielfältigen Populationkombiniert wird 5. Die Handhabung großer Probensätze ist jedoch inhärent mit analytischen Variationen verbunden, was die Bewertung der metabolischen Varianz für weitere nachgelagerte Prozesse verzerrt. Insbesondere basieren die Hauptprobleme, die zu analytischen Variationen führen, auf der Maschinenleistung und der instrumentellen Drift im Laufe der Zeit6. Die Integration von Batch-to-Batch-Variationen ist eine Herausforderung und besonders problematisch bei der Analyse großflächiger strukturierter Pflanzenpopulationen. Es wurden mehrere Normalisierungsverfahren vorgeschlagen, um nicht-biologische Variationen zu korrigieren, z. B. die Verwendung interner, externer und isotopenmarkierter interner Standards, um analytische Fehler zu korrigieren, von denen jeder von Natur aus mit bekannten Problemen und Fallstricken verbunden ist 7,8,9,10.
Neben der analytischen Variation variiert die Wahl der Extraktionsprotokolle im Allgemeinen je nach Analysemethode. Letztendlich ist es wünschenswert, die Material- und Arbeitskosten sowie die Notwendigkeit, mehrere Aliquots derselben Probe für verschiedene analytische Prozesse zu verwenden, durch die Durchführung von phasentrennungsbasierten Extraktionsmethoden zu reduzieren. Diese Methoden wurden zuerst unter Verwendung von Chloroform eingeführt: Methanol / Wasserlösungsmittel zur Fraktionierung polarer und hydrophober Verbindungen11.
Dieses Protokoll beschreibt eine schnelle Hochdurchsatzpipeline für eine Multi-Omics-Plattform, um sowohl polare Metaboliten als auch Lipide in Hülsenfrüchten zu profilieren. Darüber hinaus wird gezeigt, wie diese Datensätze für analytische Variationen angemessen korrigiert und normalisiert werden können, bevor genotypische Informationen integriert werden, um quantitative Merkmalsloci (QTL) von Metaboliten durch die Durchführung von GWAS zu erkennen.
Sowohl GC-MS als auch LC-MS sind weit verbreitete Werkzeuge zur Profilierung komplexer Mischungen verschiedener Metabolitenklassen. Der Umgang mit großen Datensätzen mit diesen Werkzeugen ist inhärent mit einer nicht-biologischen Variation verbunden, z. B. analytischer Variation, die die Interpretation der Ergebnisse stört und verzerrt. Dieses Protokoll stellt eine robuste Hochdurchsatz-Extraktionspipeline für eine umfassende metabolische Profilierung dar, um Variationen nicht-biologischen Ursprungs zu eliminieren und groß angelegte “Omics” -Studien durchzuführen. Die in diesem Protokoll verwendeten Volumina und Konzentrationen wurden für Hülsenfruchtarten in verschiedenen Geweben angepasst. Diese Parameter können jedoch leicht modifiziert und auch für großflächige Stoffwechselproben anderer Pflanzenarten verwendet werden.
Die zuvor15 beschriebenen MTBE-basierten Extraktionen können verwendet werden, um derivatisierte Metaboliten, semipolare Metaboliten und Lipide zu analysieren. Dies kann für Protein- und Pflanzenhormonextraktionen39 erweitert werden, die außerhalb des Geltungsbereichs dieses Protokolls lagen. Andere Extraktionsprotokolle beruhen auf Dichlormethan:Ethanol-Gemischen40,41. Von diesen Extraktionsprotokollen bietet das MTBE:methanol-Extraktionsprotokoll eine günstige und weniger gefährliche Alternative zu den bestehenden Chloroform-basierten Extraktionsprotokollen42 und führt nicht zu einem Proteinpellet als Interphase zwischen der polaren und der Lipidphase. Darüber hinaus wurden MTBE-Methoden bereits in mehreren Studien für verschiedene biologische Probenverwendet 43,44,45.
Dieses Protokoll diskutiert mehrere entscheidende Schritte, die bei der Handhabung einer großen Anzahl von Proben zu potenziellen Variationen führen können, z. B. während der Ernte 12,13, der Extraktion 14 sowie der Randomisierung46. Darüber hinaus gibt es zusätzliche Fragen, die in diesem Protokoll nicht diskutiert wurden, die berücksichtigt werden müssen, um qualitativ hochwertige metabolomische Daten zu gewährleisten, z. B. Matrixeffekt und Ionensuppression14.
Die Leistungsfähigkeit von QC-basierten Normalisierungsmethoden hängt von Natur aus von der Anzahl der QC-Proben in jeder Charge ab. Wie bereits erwähnt, ist die Intra-Batch-Variation der QCs im Vergleich zur Inter-Batch-Variation in diesen Analysesystemen relativ marginal, obwohl eine Erhöhung der Anzahl die Leistung erhöhen würde, wie in Abbildung 3 dargestellt. Insgesamt gibt es andere QC-basierte Normalisierungsmethoden, wie z. B. die systemische Fehlerbeseitigung mit Random Forest (SERRF), von denen gezeigt wurde, dass sie die meisten anderen Normalisierungsmethoden übertreffen, wie z. B. das Batch-Wise-Ratio, die Normalisierung mit einer optimalen Auswahl mehrerer interner Standards (NOMIS) und die probabilistische Quotientennormalisierung (PQN)47. . SERRF stützt sich jedoch auf mehrere QC-Proben in jeder Charge, z. B. jede zehnte Probe, was bei der Handhabung einer großen Anzahl von Proben nicht möglich ist. Der Hauptvorteil der QC-basierten Normalisierung gegenüber anderen datengesteuerten oder internen standardbasierten Methoden besteht darin, dass sie die wesentliche biologische Variation beibehält und gleichzeitig unerwünschte technische Variationen berücksichtigt28. Leser können sich auf diese Rezension zum Umgang mit Variation28 beziehen.
Ein Hauptproblem in GWAS ist die Rate der falsch positiven Ergebnisse, die hauptsächlich auf die Verknüpfung von kausalen und nicht-kausalen Stellen zurückzuführen sind48,49. Zweitens korrigieren die konservativen statistischen Korrekturansätze, z. B. Bonferroni und FDR, die Anzahl der unabhängigen Tests, die aufgrund der Verknüpfung zwischen benachbarten SNPs nicht gleich der Anzahl der untersuchten SNPs in GWAS ist50,51 Daher ist die tatsächliche Anzahl der unabhängigen Tests oft geringer. Eine andere Möglichkeit, den konservativen statistischen Schwellenwert zu reduzieren, wäre die Verringerung der Anzahl der getesteten SNPs, die für GWAS verwendet werden, basierend auf dem Linkage-Zerfall über definierte genomische Regionen52. Die in diesem Protokoll beschriebene GWAS-integrierte Hochdurchsatz-Metabolomik-Plattform bietet ein breites Anwendungsspektrum. Insbesondere wird es Verbesserungen in der Pflanzenzüchtung erleichtern, indem die Metaboliten-Lipid-Zusammensetzung für industriell und ernährungsphysiologisch gewünschte Werte verändert wird. Insgesamt hat die Metabolomik einen tiefen Einblick in die genetische Architektur einer Vielzahl von Metaboliten und die metabolische Diversifizierung gegeben, die während der Domestizierung von Pflanzen in den letzten Jahrzehnten aufgetreten sind, was auf das enorme Potenzial der Metabolomik-assoziierten Züchtung hinweist53. Die molekularbiologischen Ansätze für die nachgelagerte QTL-Validierung umfassen die Generierung von CRISPR/Cas9-Mutantenlinien54, T-DNA-Insertionslinien 55, stabilen und/oder transienten Überexpressionslinien 56, VIGS, Ex-vivo-Metabolomik-Ansätzen 57 neben dem konventionellen Ansatz zur Generierung von Cross-F2-Populationen sowie Kreuzvalidierung in verschiedenen Populationen.
Durch die Durchführung der notwendigen Korrektur für die analytischen Variationen wie oben beschrieben, können neben GWAS mehrere integrierte Ansätze durchgeführt werden, wie z.B. Metabolit-Metabolit-, Metabolit-Lipid-Korrelationsanalyse, Korrelationsanalyse zu phänomischen Daten, um Licht auf komplexere Merkmale zu werfen, und/oder Co-Expressionsanalyse, um die Grundlage biologischer Systeme weiter zu entschlüsseln58.
The authors have nothing to disclose.
M.B. wird durch das IMPRS-PMPG ‘Primary Metabolism and Plant Growth’ unterstützt. A.R.F. und S.A. würdigen die finanzielle Unterstützung des EU-Forschungs- und Innovationsprogramms Horizon 2020, des Projekts PlantaSYST (SGA-CSA Nr. 739582 unter FPA Nr. 664620) und des Projekts INCREASE (GA 862862).
Reagents and standards | |||
1,2-diheptadecanoyl-sn-glycero-3- phosphocholine (17:0 PC) | Avanti Polar Lipids | 850360P | Internal standard for lipids |
Chloroform | Supleco | 67-66-3 | FAME solvent |
Isovitexin | Sigma Aldrich | 38953-85-4 | Internal standard for metabolites |
Lignoceric Acid Methylester | Sigma Aldrich | 2442-49-1 | FAME |
Methanol (MeOH) | Biosolve Chemicals | 13684102 | ULC-MS grade |
Methoxyamin -hydrochlorid | Sigma Aldrich | 593-56-6 | Metabolite deriviatization |
Methyl laurate | Sigma Aldrich | 111-82-0 | FAME |
Methyl myristate | Sigma Aldrich | 124-10-7 | FAME |
Methyl palmitate | Sigma Aldrich | 112-39-0 | FAME |
Methyl stearate | Sigma Aldrich | 112-61-8 | FAME |
Methyl tert-butyl ether (MTBE) | Biosolve Chemicals | 13890602 | HPLC grade |
Methyl-caprat | Sigma Aldrich | 110-42-9 | FAME |
Methylcaprylat | Sigma Aldrich | 111-11-5 | FAME |
Methyldocosanoat | Sigma Aldrich | 929-77-1 | FAME |
Methyleicosanoat | Sigma Aldrich | 1120-28-1 | FAME |
Methyl-hexacosanoat | Sigma Aldrich | 5802-82-4 | FAME |
Methyl-octacosanoat | Sigma Aldrich | 55682-92-3 | FAME |
Methyl-pelargonate | Sigma Aldrich | 1731-84-6 | FAME |
N-Methyl-N-(trimethylsilyl)trifluoracetamid (MSTFA) | Macherey-Nagel | 24589-78-4 | Metabolite deriviatization |
Pyridine | Supleco | 110-86-1 | Metabolite deriviatization |
Ribitol | Supleco | 22566-17-2 | Internal standard for derivatized metabolites |
Triacontanoic Acid Methyl Ester | TCI Chemicals | 629-83-4 | FAME |
Water | Biosolve Chemicals | 23214102 | ULC-MS grade |
Equipment | |||
1.5 mL Safe-lock microcentrifuge tubes | Eppendorf | 3120086 | |
2 mL Safe-lock microcentrifuge tubes | Eppendorf | 3120094 | |
Balance | Sartorius Corporation | 14 557 572 | |
DB-35ms, 30 m, 0,25 mm, 0,25 µm | Aglient | 123-3832 | Analysis of derivatized metabolites |
GC-MS system | Leco Pegasus HT TOF-MS (LECO Corporation) | Analysis of derivatized metabolites | |
Grinding Balls, Stainless Steel | OPS DIAGNOSTICS | GBSS 196-2500-10 | |
MS system | Exactive, Orbitrap-type, MS (Exactive, Thermo Fisher Scientific) | Analysis of lipids | |
MS system | Q Exactive Focus (Q Exactive™ Focus Hybrid Quadrupol-Orbitrap™ Massenspektrometer, Thermo Fisher Scientific) |
Analysis of metabolites | |
Refrigerated microcentrifuge | Eppendorf, model 5427R | 22620701 | |
Reversed Phase (RP) Bridged Ethyl Hybrid (BEH) C8 column (100 mm × 2.1 mm containing 1.7 μm diameter particles) |
Waters | 186002878 | Analysis of lipids |
RP High Strength Silica (HSS) T3 column (100 mm × 2.1 mm containing 1.8 μm diameter particles) |
Waters | 186003539 | Analysis of metabolites |
Shaker | Eppendorf Thermomixer 5436 | 2050-100-05 | |
Sonicator | USC 300 TH | 142-0084 | |
Tissue grinding mixer mill | Retsch, Mixer Mill MM 300 | 20.746.0001 | |
UPLC system | Waters Acquity UPLC system (Waters) | ||
Vacuum concentrator | Scan Speed Maxi Vac Alpha Evaporators | 7.008.500.002 | |
Vortex mixer | Vortex-Genie 2, Model G560 | SI-0236 | |
Software | |||
MetAlign | Chromatogram processing | ||
MzMine | Chromatogram processing | ||
R package "data.table" | |||
R package "fujiplot" | pleiotrpoic map | ||
R package "genetics" | |||
R package "Ime4" | BLUPs calculation | ||
R package "LDheatmap" | LD plots | ||
R package "MASS" | transformation | ||
R package "rMVP" | GWAS | ||
R version 4.0.4 | |||
RefinerMS | Chromatogram processing | ||
RefinerMS Genedata | Expressionist | Chromatogram processing | |
Tassel 5 | Genotype filtering | ||
Xcalibur | Thermo Fisher Scientific | OPTON-30965 | Chromatogram processing |