このプロトコルでは、多くのサンプルの効率的で迅速なサンプル調製を組み合わせた最適化されたワークフローを紹介します。さらに、代謝GWAS研究のハイスループット評価のための分析変動を減らすためのステップバイステップガイドを提供します。
ガスクロマトグラフィー質量分析(GC-MS)と液体クロマトグラフィー質量分析(LC-MS)はどちらも、何十万もの代謝産物の特徴を検出および定量するために広く使用されているメタボロミクスアプローチです。しかし、これらの技術を多数のサンプルに適用すると、特にゲノムワイド関連研究(GWAS)の場合、より複雑な相互作用の影響を受けます。このプロトコルは、効率的で迅速なサンプル調製とマメ科植物種の多数のサンプルの分析を組み合わせた、最適化された代謝ワークフローを記述します。このわずかに変更された抽出方法は、当初、植物および動物組織の分析のために開発され、極性および脂質代謝産物の捕捉を可能にするメチルtert-ブチルエーテル:メタノール溶媒中での抽出に基づいている。さらに、GWASにおける代謝分散のハイスループット評価に不可欠な分析変動を低減するためのステップバイステップガイドを提供します。
大規模な「オミクス」アプローチは、複雑な生物学的システム1,2,3の分析を可能にし、遺伝子型と結果として生じる表現型との間のリンクのさらなる理解を可能にした4。超高速液体クロマトグラフィー質量分析(UHPLC-MS)とGC-MSを用いたメタボロミクスは、代謝産物の特徴の莫大な数の検出を可能にしたが、そのうち一部のみがある程度注釈が付けられており、その結果、未知の代謝産物の割合が高い。複雑な相互作用は、大規模なメタボロミクスと多様な集団の根底にある遺伝子型変動を組み合わせることによって探索することができる5。しかし、大きなサンプルセットを処理することは本質的に分析的変動に関連しており、さらなる下流プロセスに対する代謝分散の評価を歪めます。具体的には、分析の変動につながる主な問題は、機械の性能と時間の経過に伴う機器のドリフトに基づいています6。バッチ間の変動の統合は困難であり、大規模に構造化されたプラント集団を分析する際に特に問題になります。非生物学的変動、例えば、分析エラーを補正するための内部、外部、および同位体標識内部標準の使用を補正するために複数の正規化手順が提案され、それぞれが本質的に既知の問題および落とし穴と関連している7,8,9,10。
分析上の変動に加えて、抽出プロトコルの選択は、一般に、分析方法に応じて変化する。最終的には、相分離ベースの抽出方法を実行することにより、材料コストと人件費を削減し、さまざまな分析プロセスに同じサンプルの複数のアリコートを使用する必要性を減らすことが望まれています。これらの方法は、クロロホルム(極性および疎水性化合物11を分画するためのメタノール/水溶媒)を使用して最初に導入されました。
このプロトコルは、マメ科植物種の極性代謝産物と脂質の両方をプロファイリングするためのマルチオミクスプラットフォームのための高速ハイスループットパイプラインを記述しています。さらに、GWASを実行して代謝産物定量形質遺伝子座(QTL)を検出するために遺伝子型情報を統合する前に、これらのデータセットを分析的変動に対して適切に補正し、正規化する方法を示します。
GC-MSとLC-MSはどちらも、さまざまな代謝産物クラスの複雑な混合物をプロファイリングするために広く使用されているツールです。これらのツールで大規模なデータセットを処理することは、本質的に非生物学的変動、例えば分析的変動と関連しており、結果の解釈を妨げ、偏らせる。このプロトコルは、非生物学的起源の変動を排除し、大規模な「オミックス」研究を実施するための包括的な代謝プロファイリングのための堅牢でハイスループットな抽出パイプラインを提供します。このプロトコールで使用した体積および濃度を、異なる組織におけるマメ科植物種について調整した。しかし、これらのパラメータはわずかに変更することができ、他の植物種からの大規模な代謝サンプルにも使用することができる。
前述の15のMTBEベースの抽出は、誘導体化代謝産物、半極性代謝産物、および脂質を分析するために使用することができる。これは、このプロトコールの範囲外であったタンパク質および植物ホルモン抽出39について拡張することができる。他の抽出プロトコルは、ジクロロメタンに依存しています:エタノール混合物40,41。これらの抽出プロトコルのうち、MTBE:メタノール抽出プロトコルは、既存のクロロホルムベースの抽出プロトコル42に代わる有利で危険性の低い代替手段を提供し、極性相と脂質相の間の中間相としてタンパク質ペレットを生じさせない。さらに、MTBE法は、様々な生物学的試料43、44、45についてのいくつかの研究において既に使用されている。
このプロトコルは、例えば、収穫12、13、抽出14、および無作為化46の間など、多数のサンプルを処理している間に潜在的な変動につながる可能性のあるいくつかの重要なステップについて議論する。さらに、高品質のメタボロミクスデータ、例えば、マトリックス効果およびイオン抑制14を確実にするために考慮されなければならない、このプロトコルでは議論されていない追加の問題がある。
QC ベースの正規化方法の検出力は、本質的に各バッチ内の QC サンプルの数に依存します。前述のように、数値を増やすと検出力は増加しますが、 図 3 に示すように、QC のバッチ内変動は、これらの分析システムのバッチ間変動と比較して比較的ごくわずかです。全体として、ランダムフォレスト(SERRF)を使用した全身エラー除去など、他のQCベースの正規化方法があり、バッチごとの比率、複数の内部標準の最適な選択を使用した正規化(NOMIS)、確率的商正規化(PQN)などの他の正規化方法のほとんどを上回ることが示されています47.しかし、SERRFは各バッチの複数のQCサンプル、例えば10分の1サンプルに依存しており、多数のサンプルを処理している間は実現不可能です。他のデータ駆動型または内部標準ベースの方法に対するQCベースの正規化の主な利点は、望ましくない技術的変動28に対応しながら、本質的な生物学的変動を保持することである。読者は、バリエーション28の取り扱いに関するこのレビューを参照することができます。
GWASの主な問題の1つは偽陽性の割合であり、これは主に因果関係サイトと非因果関係サイトの連鎖に起因する48,49。第2に、保存的統計的補正アプローチ、例えば、ボンフェローニおよびFDRは、近接SNPs間の結合に起因するGWASにおけるアッセイされたSNPsの数と等しくない独立試験の数について補正する50,51したがって、独立試験の実際の数は、しばしばより低くなる。保存的統計的閾値を減少させる別の方法は、定義されたゲノム領域52にわたる連鎖崩壊に基づいてGWASに使用される試験SNPの数を減らすことであろう。このプロトコルに記載されているGWAS統合ハイスループットメタボロミクスプラットフォームには、幅広いアプリケーションがあります。特に、代謝産物/脂質組成を工業的および栄養的に望ましいレベルに変更することにより、作物育種の改善を促進する。全体として、メタボロミクスは、過去数十年にわたって作物の家畜化中に起こった多数の代謝産物の遺伝的構造と代謝の多様化に関する深い洞察を提供しており、メタボロミクス関連の育種の広大な可能性を示しています53。下流QTL検証のための分子生物学的アプローチには、CRISPR/Cas9変異株54、T-DNA挿入ライン55、安定および/または一過性過剰発現ライン56、VIGS、エキソビボメタボロミクスアプローチ57の生成が含まれ、クロスF2集団の生成における従来のアプローチならびに異なる集団における交差バリデーションに類似している。
上記のような分析的変動に対して必要な補正を行うことによって、GWASに加えて、代謝物−代謝産物、代謝産物−脂質相関分析、より複雑な形質に光を当てるための現象データへの相関分析、および/または生物学的系の基礎をさらに解明するための共発現分析など、いくつかの統合的アプローチを行うことができる58。
The authors have nothing to disclose.
M.B.はIMPRS-PMPG「一次代謝と植物成長」によってサポートされています。A.R.F.とSAは、EU Horizon 2020 Research and Innovation Programme、Project PlantaSYST(SGA-CSA NO. 739582 UNDER FPA No. 664620)、およびProject INCREASE(GA 862862)の財政的支援を認める。
Reagents and standards | |||
1,2-diheptadecanoyl-sn-glycero-3- phosphocholine (17:0 PC) | Avanti Polar Lipids | 850360P | Internal standard for lipids |
Chloroform | Supleco | 67-66-3 | FAME solvent |
Isovitexin | Sigma Aldrich | 38953-85-4 | Internal standard for metabolites |
Lignoceric Acid Methylester | Sigma Aldrich | 2442-49-1 | FAME |
Methanol (MeOH) | Biosolve Chemicals | 13684102 | ULC-MS grade |
Methoxyamin -hydrochlorid | Sigma Aldrich | 593-56-6 | Metabolite deriviatization |
Methyl laurate | Sigma Aldrich | 111-82-0 | FAME |
Methyl myristate | Sigma Aldrich | 124-10-7 | FAME |
Methyl palmitate | Sigma Aldrich | 112-39-0 | FAME |
Methyl stearate | Sigma Aldrich | 112-61-8 | FAME |
Methyl tert-butyl ether (MTBE) | Biosolve Chemicals | 13890602 | HPLC grade |
Methyl-caprat | Sigma Aldrich | 110-42-9 | FAME |
Methylcaprylat | Sigma Aldrich | 111-11-5 | FAME |
Methyldocosanoat | Sigma Aldrich | 929-77-1 | FAME |
Methyleicosanoat | Sigma Aldrich | 1120-28-1 | FAME |
Methyl-hexacosanoat | Sigma Aldrich | 5802-82-4 | FAME |
Methyl-octacosanoat | Sigma Aldrich | 55682-92-3 | FAME |
Methyl-pelargonate | Sigma Aldrich | 1731-84-6 | FAME |
N-Methyl-N-(trimethylsilyl)trifluoracetamid (MSTFA) | Macherey-Nagel | 24589-78-4 | Metabolite deriviatization |
Pyridine | Supleco | 110-86-1 | Metabolite deriviatization |
Ribitol | Supleco | 22566-17-2 | Internal standard for derivatized metabolites |
Triacontanoic Acid Methyl Ester | TCI Chemicals | 629-83-4 | FAME |
Water | Biosolve Chemicals | 23214102 | ULC-MS grade |
Equipment | |||
1.5 mL Safe-lock microcentrifuge tubes | Eppendorf | 3120086 | |
2 mL Safe-lock microcentrifuge tubes | Eppendorf | 3120094 | |
Balance | Sartorius Corporation | 14 557 572 | |
DB-35ms, 30 m, 0,25 mm, 0,25 µm | Aglient | 123-3832 | Analysis of derivatized metabolites |
GC-MS system | Leco Pegasus HT TOF-MS (LECO Corporation) | Analysis of derivatized metabolites | |
Grinding Balls, Stainless Steel | OPS DIAGNOSTICS | GBSS 196-2500-10 | |
MS system | Exactive, Orbitrap-type, MS (Exactive, Thermo Fisher Scientific) | Analysis of lipids | |
MS system | Q Exactive Focus (Q Exactive™ Focus Hybrid Quadrupol-Orbitrap™ Massenspektrometer, Thermo Fisher Scientific) |
Analysis of metabolites | |
Refrigerated microcentrifuge | Eppendorf, model 5427R | 22620701 | |
Reversed Phase (RP) Bridged Ethyl Hybrid (BEH) C8 column (100 mm × 2.1 mm containing 1.7 μm diameter particles) |
Waters | 186002878 | Analysis of lipids |
RP High Strength Silica (HSS) T3 column (100 mm × 2.1 mm containing 1.8 μm diameter particles) |
Waters | 186003539 | Analysis of metabolites |
Shaker | Eppendorf Thermomixer 5436 | 2050-100-05 | |
Sonicator | USC 300 TH | 142-0084 | |
Tissue grinding mixer mill | Retsch, Mixer Mill MM 300 | 20.746.0001 | |
UPLC system | Waters Acquity UPLC system (Waters) | ||
Vacuum concentrator | Scan Speed Maxi Vac Alpha Evaporators | 7.008.500.002 | |
Vortex mixer | Vortex-Genie 2, Model G560 | SI-0236 | |
Software | |||
MetAlign | Chromatogram processing | ||
MzMine | Chromatogram processing | ||
R package "data.table" | |||
R package "fujiplot" | pleiotrpoic map | ||
R package "genetics" | |||
R package "Ime4" | BLUPs calculation | ||
R package "LDheatmap" | LD plots | ||
R package "MASS" | transformation | ||
R package "rMVP" | GWAS | ||
R version 4.0.4 | |||
RefinerMS | Chromatogram processing | ||
RefinerMS Genedata | Expressionist | Chromatogram processing | |
Tassel 5 | Genotype filtering | ||
Xcalibur | Thermo Fisher Scientific | OPTON-30965 | Chromatogram processing |