이 프로토콜에서는 많은 샘플의 효율적이고 빠른 샘플 준비를 결합한 최적화된 워크플로를 제시합니다. 또한, 대사 GWAS 연구의 고처리량 평가를 위한 분석 변형을 줄이기 위한 단계별 가이드를 제공합니다.
가스 크로마토그래피-질량 분광법(GC-MS) 및 액체 크로마토그래피-질량 분광법(LC-MS)은 수십만 개의 대사산물 특징을 검출하고 정량화하기 위해 널리 사용되는 대사체학 접근법입니다. 그러나, 다수의 샘플에 이러한 기술을 적용하는 것은 특히 게놈 전체 연관 연구 (GWAS)에 대해보다 복잡한 상호 작용의 대상이됩니다. 이 프로토콜은 효율적이고 빠른 샘플 준비와 콩과 식물 작물 종에 대한 많은 수의 샘플 분석을 결합하는 최적화 된 대사 워크 플로우를 설명합니다. 이 약간 변형 된 추출 방법은 처음에는 식물 및 동물 조직의 분석을 위해 개발되었으며 극성 및 지질 대사 산물의 포획을 허용하는 메틸 tert-butyl 에테르 : 메탄올 용매에서의 추출을 기반으로합니다. 또한 GWAS의 대사 분산에 대한 고처리량 평가에 필수적인 분석 변형을 줄이기위한 단계별 가이드를 제공합니다.
대규모 “omics” 접근법 은 복잡한 생물학적 시스템(1,2,3)의 분석과 유전자형과 결과적인 표현형(4) 사이의 연관성에 대한 더 깊은 이해를 가능하게 하였다. 초고성능 액체 크로마토그래피-질량 분광분석법(UHPLC-MS) 및 GC-MS를 사용한 대사체학은 과다한 대사산물 특징의 검출을 가능하게 하였으며, 그 중 일부만이 어느 정도 주석이 첨부되어 알려지지 않은 대사산물의 비율이 높아졌다. 복잡한 상호 작용은 대규모 대사체학을 다양한 집단의 근본적인 유전자형 변이와 결합하여 탐구 할 수 있습니다5. 그러나 대규모 샘플 세트를 처리하는 것은 본질적으로 분석 변형과 관련이 있으며, 추가 하류 공정에 대한 대사 분산 평가를 왜곡합니다. 특히, 분석 변동으로 이어지는 주요 문제는 시간 경과에 따른 기계 성능 및 기기 드리프트를 기반으로합니다6. 배치 간 변동의 통합은 어렵고 대규모 구조화 된 식물 개체군을 분석 할 때 특히 문제가됩니다. 분석 오류를 수정하기 위해 내부, 외부 및 동위원소 표지 된 내부 표준의 사용과 같은 비 생물학적 변이를 수정하기 위해 여러 정규화 절차가 제안되었으며, 그 중 각각은 본질적으로 알려진 문제 및 함정 7,8,9,10과 관련이 있습니다.
분석 변형 외에도 추출 프로토콜의 선택은 일반적으로 분석 방법에 따라 다릅니다. 궁극적으로, 재료 및 인건비를 절감할 뿐만 아니라 상 분리 기반 추출 방법을 수행하여 다양한 분석 공정에 동일한 샘플의 여러 분취량을 사용할 필요성을 줄이는 것이 바람직합니다. 이러한 방법은 극성 및 소수성 화합물11을 분별하기 위해 클로로포름: 메탄올/물 용매를 사용하여 처음 도입되었다.
이 프로토콜은 콩과 식물 종의 극성 대사 산물과 지질을 프로파일 링하는 다중 오믹스 플랫폼을위한 빠른 고 처리량 파이프 라인을 설명합니다. 또한, GWAS를 수행하여 대사산물 정량적 형질 유전자좌(QTL)를 검출하기 위해 유전자형 정보를 통합하기 전에 분석 변이에 대해 이러한 데이터 세트를 적절하게 보정하고 정규화할 수 있는 방법을 보여줍니다.
GC-MS와 LC-MS는 모두 다양한 대사 산물 클래스의 복잡한 혼합물을 프로파일 링하는 데 널리 사용되는 도구입니다. 이러한 도구로 대규모 데이터 세트를 처리하는 것은 본질적으로 비 생물학적 변이, 예를 들어 결과의 해석을 방해하고 편향시키는 분석 변형과 관련이 있습니다. 이 프로토콜은 비생물학적 기원의 변이를 제거하고 대규모 “omics”연구를 수행하기 위해 포괄적 인 대사 프로파일 링을위한 강력하고 높은 처리량의 추출 파이프 라인을 제공합니다. 이 프로토콜에 사용 된 부피 및 농도는 다른 조직의 콩과 식물 종에 대해 조정되었습니다. 그러나, 이들 파라미터는 약간 변형될 수 있고 다른 식물 종으로부터의 대규모 대사 샘플에도 사용될 수 있다.
앞서 기술한 15개의 MTBE-기반 추출은 유도체화된 대사산물, 반극성 대사산물 및 지질을 분석하는데 사용될 수 있다. 이것은 단백질 및 식물 호르몬 추출(39)을 위해 확장될 수 있으며, 이는 이 프로토콜의 범위를 벗어났다. 다른 추출 프로토콜은 디클로로메탄:에탄올 혼합물40,41에 의존한다. 이러한 추출 프로토콜 중 MTBE:메탄올 추출 프로토콜은 기존의 클로로포름 기반 추출 프로토콜(42)에 유리하고 덜 위험한 대안을 제공하며, 극성과 지질 단계 사이의 상으로 단백질 펠릿을 생성하지 않는다. 더욱이, MTBE 방법은 이미 다양한 생물학적 샘플(43,44,45)에 대한 몇몇 연구에서 사용되어 왔다.
이 프로토콜은 많은 수의 샘플들을 처리하면서 잠재적 변동으로 이어질 수 있는 몇 가지 중요한 단계들, 예를 들어, 수확(12,13), 추출(14) 및 랜덤화(46) 동안에 논의한다. 더욱이, 고품질의 대사체 데이터, 예를 들어, 매트릭스 효과 및 이온 억제(14)를 보장하기 위해 고려되어야 하는 이 프로토콜에서 논의되지 않은 추가적인 문제들이 있다.
QC 기반 정규화 방법의 힘은 본질적으로 각 배치의 QC 샘플 수에 따라 달라집니다. 앞서 언급한 바와 같이, 수를 늘리면 검정력이 증가하겠지만, QC의 배치내 변동은 그림 3에 예시된 바와 같이 이들 분석 시스템의 배치 간 변동에 비해 상대적으로 미미하다. 전반적으로, 무작위 포리스트(SERRF)를 사용한 전신 오류 제거와 같은 다른 QC 기반 정규화 방법이 있는데, 이는 배치 단위 비율, 다중 내부 표준(NOMIS)의 최적 선택을 이용한 정규화, 확률적 지수 정규화(PQN)47와 같은 다른 정규화 방법의 대부분을 능가하는 것으로 나타났습니다. . 그러나 SERRF는 각 배치의 여러 QC 샘플, 예를 들어 열 번째 샘플마다 의존하며, 이는 많은 수의 샘플을 처리하는 동안 실현 가능하지 않습니다. 다른 데이터 기반 또는 내부 표준 기반 방법에 비해 QC 기반 정규화의 주요 이점은 원치 않는 기술적 변동(28)을 수용하면서 필수적인 생물학적 변이를 유지한다는 것이다. 독자는 변동28의 처리에 관한 이 검토를 참조할 수 있다.
GIS의 주요 쟁점 중 하나는 오탐의 비율이며, 이는 주로 인과 관계 및 비 인과 관계 사이트48,49의 연관성으로 인해 발생합니다. 둘째, 보수적 통계적 보정 접근법, 예를 들어, Bonferroni 및 FDR은, 독립적인 시험의 수에 대해 정확하며, 이는 근접한 SNPs(50,51) 사이의 연계로 인해 GIS에서 분석된 SNP의 수와 동일하지 않기 때문에, 실제 독립적인 시험의 수는 종종 더 낮다. 보존적 통계적 역치를 감소시키는 또 다른 방법은 정의된 게놈 영역(52)에 대한 결합 붕괴에 기초하여 GIS에 사용되는 시험된 SNP의 수를 감소시키는 것이다. 이 프로토콜에 설명된 GWAS-통합 고처리량 대사체학 플랫폼은 광범위한 응용 분야를 가지고 있습니다. 특히, 대사 산물 / 지질 조성을 산업적으로나 영양적으로 원하는 수준으로 변경함으로써 작물 육종의 개선을 촉진 할 것입니다. 전반적으로, 대사체학은 지난 수십 년 동안 작물 가축화 과정에서 발생한 과다한 대사 산물의 유전 구조와 대사 다양화에 대한 심층적 인 통찰력을 제공하여 대사체학 관련 육종53의 광대 한 잠재력을 나타냅니다. 하류 QTL 검증을 위한 분자생물학적 접근법은 CRISPR/Cas9 돌연변이 라인(54), T-DNA 삽입 라인(55), 안정 및/또는 일시적 과발현 라인(56), VIGS, 생체외 대사체학 접근법(57)의 생성뿐만 아니라 상이한 집단에서의 교차 검증뿐만 아니라 교차 F2 집단을 생성하는 종래의 접근법 옆에 포함된다.
상기와 같은 분석 변이에 대해 필요한 보정을 수행함으로써, 대사산물-대사산물, 대사산물-지질 상관관계 분석, 보다 복잡한 형질을 밝히기 위한 현상 데이터에 대한 상관관계 분석, 및/또는 생물학적 시스템(58)의 기초를 더욱 풀기 위한 공동발현 분석과 같은 GIS 이외에 몇 가지 통합된 접근법이 수행될 수 있다.
The authors have nothing to disclose.
M.B.는 IMPRS-PMPG ‘일차 대사 및 식물 성장’에 의해 지원됩니다. A.R.F.와 S.A.는 EU Horizon 2020 연구 및 혁신 프로그램, 프로젝트 PlantaSYST (SGA-CSA No. 739582 under FPA No. 664620) 및 Project INCREASE (GA 862862)의 재정적 지원을 인정합니다.
Reagents and standards | |||
1,2-diheptadecanoyl-sn-glycero-3- phosphocholine (17:0 PC) | Avanti Polar Lipids | 850360P | Internal standard for lipids |
Chloroform | Supleco | 67-66-3 | FAME solvent |
Isovitexin | Sigma Aldrich | 38953-85-4 | Internal standard for metabolites |
Lignoceric Acid Methylester | Sigma Aldrich | 2442-49-1 | FAME |
Methanol (MeOH) | Biosolve Chemicals | 13684102 | ULC-MS grade |
Methoxyamin -hydrochlorid | Sigma Aldrich | 593-56-6 | Metabolite deriviatization |
Methyl laurate | Sigma Aldrich | 111-82-0 | FAME |
Methyl myristate | Sigma Aldrich | 124-10-7 | FAME |
Methyl palmitate | Sigma Aldrich | 112-39-0 | FAME |
Methyl stearate | Sigma Aldrich | 112-61-8 | FAME |
Methyl tert-butyl ether (MTBE) | Biosolve Chemicals | 13890602 | HPLC grade |
Methyl-caprat | Sigma Aldrich | 110-42-9 | FAME |
Methylcaprylat | Sigma Aldrich | 111-11-5 | FAME |
Methyldocosanoat | Sigma Aldrich | 929-77-1 | FAME |
Methyleicosanoat | Sigma Aldrich | 1120-28-1 | FAME |
Methyl-hexacosanoat | Sigma Aldrich | 5802-82-4 | FAME |
Methyl-octacosanoat | Sigma Aldrich | 55682-92-3 | FAME |
Methyl-pelargonate | Sigma Aldrich | 1731-84-6 | FAME |
N-Methyl-N-(trimethylsilyl)trifluoracetamid (MSTFA) | Macherey-Nagel | 24589-78-4 | Metabolite deriviatization |
Pyridine | Supleco | 110-86-1 | Metabolite deriviatization |
Ribitol | Supleco | 22566-17-2 | Internal standard for derivatized metabolites |
Triacontanoic Acid Methyl Ester | TCI Chemicals | 629-83-4 | FAME |
Water | Biosolve Chemicals | 23214102 | ULC-MS grade |
Equipment | |||
1.5 mL Safe-lock microcentrifuge tubes | Eppendorf | 3120086 | |
2 mL Safe-lock microcentrifuge tubes | Eppendorf | 3120094 | |
Balance | Sartorius Corporation | 14 557 572 | |
DB-35ms, 30 m, 0,25 mm, 0,25 µm | Aglient | 123-3832 | Analysis of derivatized metabolites |
GC-MS system | Leco Pegasus HT TOF-MS (LECO Corporation) | Analysis of derivatized metabolites | |
Grinding Balls, Stainless Steel | OPS DIAGNOSTICS | GBSS 196-2500-10 | |
MS system | Exactive, Orbitrap-type, MS (Exactive, Thermo Fisher Scientific) | Analysis of lipids | |
MS system | Q Exactive Focus (Q Exactive™ Focus Hybrid Quadrupol-Orbitrap™ Massenspektrometer, Thermo Fisher Scientific) |
Analysis of metabolites | |
Refrigerated microcentrifuge | Eppendorf, model 5427R | 22620701 | |
Reversed Phase (RP) Bridged Ethyl Hybrid (BEH) C8 column (100 mm × 2.1 mm containing 1.7 μm diameter particles) |
Waters | 186002878 | Analysis of lipids |
RP High Strength Silica (HSS) T3 column (100 mm × 2.1 mm containing 1.8 μm diameter particles) |
Waters | 186003539 | Analysis of metabolites |
Shaker | Eppendorf Thermomixer 5436 | 2050-100-05 | |
Sonicator | USC 300 TH | 142-0084 | |
Tissue grinding mixer mill | Retsch, Mixer Mill MM 300 | 20.746.0001 | |
UPLC system | Waters Acquity UPLC system (Waters) | ||
Vacuum concentrator | Scan Speed Maxi Vac Alpha Evaporators | 7.008.500.002 | |
Vortex mixer | Vortex-Genie 2, Model G560 | SI-0236 | |
Software | |||
MetAlign | Chromatogram processing | ||
MzMine | Chromatogram processing | ||
R package "data.table" | |||
R package "fujiplot" | pleiotrpoic map | ||
R package "genetics" | |||
R package "Ime4" | BLUPs calculation | ||
R package "LDheatmap" | LD plots | ||
R package "MASS" | transformation | ||
R package "rMVP" | GWAS | ||
R version 4.0.4 | |||
RefinerMS | Chromatogram processing | ||
RefinerMS Genedata | Expressionist | Chromatogram processing | |
Tassel 5 | Genotype filtering | ||
Xcalibur | Thermo Fisher Scientific | OPTON-30965 | Chromatogram processing |