В этом протоколе мы представляем оптимизированный рабочий процесс, который сочетает в себе эффективную и быструю пробоподготовку многих образцов. Кроме того, мы предоставляем пошаговое руководство по сокращению аналитических вариаций для высокопроизводительной оценки метаболических исследований GWAS.
Как газовая хроматография-масс-спектрометрия (GC-MS), так и жидкостная хроматография-масс-спектрометрия (LC-MS) являются широко используемыми метаболомическими подходами для обнаружения и количественной оценки сотен тысяч признаков метаболитов. Однако применение этих методов к большому количеству образцов подвержено более сложным взаимодействиям, особенно для общегеномных ассоциативных исследований (GWAS). Этот протокол описывает оптимизированный метаболический рабочий процесс, который сочетает в себе эффективную и быструю пробоподготовку с анализом большого количества образцов на бобовые культуры. Этот слегка модифицированный метод экстракции был первоначально разработан для анализа тканей растений и животных и основан на экстракции в метил-трет-бутиловый эфир: растворитель метанола, позволяющий захватывать полярные и липидные метаболиты. Кроме того, мы предоставляем пошаговое руководство по сокращению аналитических вариаций, которые необходимы для высокопроизводительной оценки метаболической дисперсии в GWAS.
Крупномасштабные «омические» подходы позволили проанализировать сложные биологические системы 1,2,3 и понять связь между генотипами и результирующими фенотипами4. Метаболомика с использованием сверхвысокоэффективной жидкостной хроматографии-масс-спектрометрии (UHPLC-MS) и GC-MS позволила обнаружить множество признаков метаболитов, из которых только некоторые аннотированы в определенной степени, что приводит к высокой доле неизвестных метаболитов. Сложные взаимодействия могут быть изучены путем объединения крупномасштабной метаболомики с лежащей в основе генотипической вариацией разнообразной популяции5. Однако обработка больших наборов образцов по своей сути связана с аналитическими вариациями, искажающими оценку метаболической дисперсии для дальнейших последующих процессов. В частности, основные проблемы, приводящие к аналитическим изменениям, основаны на производительности машины и инструментальном дрейфе во времени6. Интеграция вариантов от партии к партии является сложной и особенно проблематичной при анализе крупномасштабных структурированных популяций растений. Было предложено несколько процедур нормализации для исправления небиологических вариаций, например, использование внутренних, внешних и изотопных внутренних стандартов для исправления аналитических ошибок, каждая из которых по своей сути связана с известными проблемами и подводными камнями 7,8,9,10.
В дополнение к аналитическим вариациям, выбор протоколов экстракции обычно варьируется в зависимости от аналитического метода. В конечном счете, желательно снизить материальные и трудовые затраты, а также необходимость использования нескольких аликвот одного и того же образца для различных аналитических процессов путем выполнения методов экстракции на основе разделения фаз. Эти методы были впервые введены с использованием хлороформа: метанола/водных растворителей для фракционирования полярных и гидрофобных соединений11.
Этот протокол описывает быстрый высокопроизводительный конвейер для мультиомической платформы для профилирования как полярных метаболитов, так и липидов в бобовых видах. Кроме того, он показывает, как эти наборы данных могут быть соответствующим образом скорректированы для аналитического изменения и нормализованы перед интеграцией генотипической информации для обнаружения локусов количественных признаков метаболитов (QTL) путем выполнения GWAS.
Как GC-MS, так и LC-MS являются широко используемыми инструментами для профилирования сложных смесей различных классов метаболитов. Обработка больших наборов данных с помощью этих инструментов по своей сути связана с небиологической вариацией, например, аналитической вариацией, которая мешает и искажает интерпретацию результатов. Этот протокол представляет собой надежный и высокопроизводительный экстракционный конвейер для всестороннего метаболического профилирования для устранения вариаций небиологического происхождения и проведения крупномасштабных исследований «омики». Объемы и концентрации, используемые в этом протоколе, были скорректированы для видов бобовых в различных тканях. Однако эти параметры могут быть слегка изменены и использованы для крупномасштабных метаболических образцов других видов растений.
Ранее15 описанных экстракций на основе МТБЭ могут быть использованы для анализа дериватизированных метаболитов, полуполярных метаболитов и липидов. Это может быть расширено для экстракции белка и растительных гормонов39, которые были вне сферы действия этого протокола. Другие протоколы экстракции основаны на смесях дихлорметана:этанола40,41. Из этих протоколов экстракции протокол МТБЭ:метанол обеспечивает благоприятную и менее опасную альтернативу существующим протоколам экстракции42 на основе хлороформа и не приводит к образованию белковой гранулы в виде интерфазы между полярной и липидной фазами. Кроме того, методы МТБЭ уже использовались в нескольких исследованиях для различных биологических образцов 43,44,45.
В этом протоколе обсуждается несколько важных шагов, которые могут привести к потенциальному изменению при обработке большого количества образцов, например, во время сбора12,13, экстракции14, а также рандомизации46. Кроме того, существуют дополнительные вопросы, которые не обсуждались в настоящем протоколе, которые должны быть рассмотрены для обеспечения высококачественных метаболомных данных, например, матричный эффект и подавление ионов14.
Мощность методов нормализации на основе КК по своей сути зависит от количества образцов КК в каждой партии. Как упоминалось ранее, хотя увеличение числа увеличит мощность, внутрисерийное изменение КК относительно незначительно по сравнению с межсерийным изменением в этих аналитических системах, как показано на рисунке 3. В целом, существуют и другие методы нормализации на основе контроля качества, такие как системное удаление ошибок с использованием случайного леса (SERRF), которые, как было показано, превосходят большинство других методов нормализации, таких как пакетное соотношение, нормализация с использованием оптимального выбора нескольких внутренних стандартов (NOMIS) и вероятностная нормализация коэффициентов (PQN)47. . Тем не менее, SERRF полагается на несколько образцов QC в каждой партии, например, каждый десятый образец, что неосуществимо при обработке большого количества образцов. Основное преимущество нормализации на основе КК по сравнению с другими методами, основанными на данных или внутренними стандартами, заключается в том, что она сохраняет существенные биологические вариации, приспосабливаясь к нежелательным техническим вариациям28. Читатели могут обратиться к этому обзору по обращению с вариантом28.
Одной из основных проблем в GWAS является частота ложных срабатываний, которые возникают в основном из-за связи причинно-следственных и непричинных сайтов48,49. Во-вторых, консервативные подходы статистической коррекции, например, Бонферрони и Рузвельта, корректируют количество независимых тестов, которое не равно количеству анализируемых SNP в GWAS из-за связи между ближайшими SNP 50,51 Поэтому фактическое количество независимых тестов часто ниже. Другим способом снижения консервативного статистического порога могло бы стать уменьшение числа тестируемых SNP, используемых для GWAS, на основе распада связей над определенными геномнымиобластями 52. GwAS-интегрированная высокопроизводительная метаболомическая платформа, описанная в этом протоколе, имеет широкий спектр применений. В частности, это будет способствовать улучшению селекции сельскохозяйственных культур путем изменения состава метаболитов/липидов в соответствии с промышленными и питательными потребностями. В целом, метаболомика дала глубокое понимание генетической архитектуры множества метаболитов и метаболической диверсификации, которые произошли во время одомашнивания сельскохозяйственных культур за последние десятилетия, что указывает на огромный потенциал метаболомики-ассоциированной селекции53. Молекулярно-биологические подходы к последующей валидации QTL включают генерацию мутантных линий54 CRISPR/Cas9, линий вставкиТ-ДНК 55, стабильных и/или преходящих линий сверхэкспрессии56, VIGS, подходов ex vivo метаболомики57 рядом с традиционным подходом к генерации кросс-популяций F2, а также перекрестную валидацию в разных популяциях.
Выполняя необходимую коррекцию аналитических вариаций, как описано выше, в дополнение к GWAS может быть выполнено несколько интегрированных подходов, таких как метаболит-метаболит, метаболит-липидный корреляционный анализ, корреляционный анализ к феномическим данным, чтобы пролить свет на более сложные признаки, и/или анализ коэкспрессии для дальнейшего разгадывания основы биологических систем58.
The authors have nothing to disclose.
M.B. поддерживается IMPRS-PMPG «Первичный метаболизм и рост растений». A.R.F. и S.A. признают финансовую поддержку Программы исследований и инноваций ЕС Horizon 2020, проекта PlantaSYST (SGA-CSA No 739582 под FPA No 664620) и проекта INCREASE (GA 862862).
Reagents and standards | |||
1,2-diheptadecanoyl-sn-glycero-3- phosphocholine (17:0 PC) | Avanti Polar Lipids | 850360P | Internal standard for lipids |
Chloroform | Supleco | 67-66-3 | FAME solvent |
Isovitexin | Sigma Aldrich | 38953-85-4 | Internal standard for metabolites |
Lignoceric Acid Methylester | Sigma Aldrich | 2442-49-1 | FAME |
Methanol (MeOH) | Biosolve Chemicals | 13684102 | ULC-MS grade |
Methoxyamin -hydrochlorid | Sigma Aldrich | 593-56-6 | Metabolite deriviatization |
Methyl laurate | Sigma Aldrich | 111-82-0 | FAME |
Methyl myristate | Sigma Aldrich | 124-10-7 | FAME |
Methyl palmitate | Sigma Aldrich | 112-39-0 | FAME |
Methyl stearate | Sigma Aldrich | 112-61-8 | FAME |
Methyl tert-butyl ether (MTBE) | Biosolve Chemicals | 13890602 | HPLC grade |
Methyl-caprat | Sigma Aldrich | 110-42-9 | FAME |
Methylcaprylat | Sigma Aldrich | 111-11-5 | FAME |
Methyldocosanoat | Sigma Aldrich | 929-77-1 | FAME |
Methyleicosanoat | Sigma Aldrich | 1120-28-1 | FAME |
Methyl-hexacosanoat | Sigma Aldrich | 5802-82-4 | FAME |
Methyl-octacosanoat | Sigma Aldrich | 55682-92-3 | FAME |
Methyl-pelargonate | Sigma Aldrich | 1731-84-6 | FAME |
N-Methyl-N-(trimethylsilyl)trifluoracetamid (MSTFA) | Macherey-Nagel | 24589-78-4 | Metabolite deriviatization |
Pyridine | Supleco | 110-86-1 | Metabolite deriviatization |
Ribitol | Supleco | 22566-17-2 | Internal standard for derivatized metabolites |
Triacontanoic Acid Methyl Ester | TCI Chemicals | 629-83-4 | FAME |
Water | Biosolve Chemicals | 23214102 | ULC-MS grade |
Equipment | |||
1.5 mL Safe-lock microcentrifuge tubes | Eppendorf | 3120086 | |
2 mL Safe-lock microcentrifuge tubes | Eppendorf | 3120094 | |
Balance | Sartorius Corporation | 14 557 572 | |
DB-35ms, 30 m, 0,25 mm, 0,25 µm | Aglient | 123-3832 | Analysis of derivatized metabolites |
GC-MS system | Leco Pegasus HT TOF-MS (LECO Corporation) | Analysis of derivatized metabolites | |
Grinding Balls, Stainless Steel | OPS DIAGNOSTICS | GBSS 196-2500-10 | |
MS system | Exactive, Orbitrap-type, MS (Exactive, Thermo Fisher Scientific) | Analysis of lipids | |
MS system | Q Exactive Focus (Q Exactive™ Focus Hybrid Quadrupol-Orbitrap™ Massenspektrometer, Thermo Fisher Scientific) |
Analysis of metabolites | |
Refrigerated microcentrifuge | Eppendorf, model 5427R | 22620701 | |
Reversed Phase (RP) Bridged Ethyl Hybrid (BEH) C8 column (100 mm × 2.1 mm containing 1.7 μm diameter particles) |
Waters | 186002878 | Analysis of lipids |
RP High Strength Silica (HSS) T3 column (100 mm × 2.1 mm containing 1.8 μm diameter particles) |
Waters | 186003539 | Analysis of metabolites |
Shaker | Eppendorf Thermomixer 5436 | 2050-100-05 | |
Sonicator | USC 300 TH | 142-0084 | |
Tissue grinding mixer mill | Retsch, Mixer Mill MM 300 | 20.746.0001 | |
UPLC system | Waters Acquity UPLC system (Waters) | ||
Vacuum concentrator | Scan Speed Maxi Vac Alpha Evaporators | 7.008.500.002 | |
Vortex mixer | Vortex-Genie 2, Model G560 | SI-0236 | |
Software | |||
MetAlign | Chromatogram processing | ||
MzMine | Chromatogram processing | ||
R package "data.table" | |||
R package "fujiplot" | pleiotrpoic map | ||
R package "genetics" | |||
R package "Ime4" | BLUPs calculation | ||
R package "LDheatmap" | LD plots | ||
R package "MASS" | transformation | ||
R package "rMVP" | GWAS | ||
R version 4.0.4 | |||
RefinerMS | Chromatogram processing | ||
RefinerMS Genedata | Expressionist | Chromatogram processing | |
Tassel 5 | Genotype filtering | ||
Xcalibur | Thermo Fisher Scientific | OPTON-30965 | Chromatogram processing |