Summary

دراسات الارتباط واسعة النطاق متعددة الأوميكس على نطاق الجينوم (Mo-GWAS): مبادئ توجيهية لإعداد العينات وتطبيعها

Published: July 27, 2021
doi:

Summary

في هذا البروتوكول ، نقدم سير عمل محسن ، يجمع بين إعداد عينة فعالة وسريعة للعديد من العينات. بالإضافة إلى ذلك ، نقدم دليلا خطوة بخطوة لتقليل الاختلافات التحليلية لتقييم الإنتاجية العالية لدراسات GWAS الأيضية.

Abstract

يستخدم كل من كروماتوغرافيا الغاز – مطياف الكتلة (GC-MS) والكروماتوغرافيا السائلة – مطياف الكتلة (LC-MS) على نطاق واسع في أساليب الأيض للكشف عن مئات الآلاف من ميزات الأيض وتحديدها كميا. ومع ذلك، فإن تطبيق هذه التقنيات على عدد كبير من العينات يخضع لتفاعلات أكثر تعقيدا، خاصة بالنسبة لدراسات الارتباط على نطاق الجينوم (GWAS). يصف هذا البروتوكول سير عمل استقلابي محسن ، يجمع بين إعداد عينة فعالة وسريعة مع تحليل عدد كبير من العينات لأنواع المحاصيل البقولية. تم تطوير طريقة الاستخراج المعدلة قليلا هذه في البداية لتحليل الأنسجة النباتية والحيوانية وتستند إلى الاستخراج في ميثيل تيرت بوتيل الأثير: مذيب الميثانول للسماح بالتقاط الأيضات القطبية والدهنية. بالإضافة إلى ذلك ، نقدم دليلا خطوة بخطوة للحد من الاختلافات التحليلية ، والتي تعد ضرورية لتقييم الإنتاجية العالية للتباين الأيضي في GWAS.

Introduction

وقد مكنت نهج “omics” واسعة النطاق من تحليل النظم البيولوجية المعقدة1،2،3 وزيادة فهم العلاقة بين الأنماط الجينية والأنماط الظاهرية الناتجة4. مكنت الأيضات التي تستخدم قياس الطيف الكتلي الكروماتوغرافي السائل فائق الأداء (UHPLC-MS) و GC-MS من اكتشاف عدد كبير من ميزات الأيض ، والتي يتم تعليق بعضها فقط إلى درجة معينة ، مما يؤدي إلى نسبة عالية من المستقلبات غير المعروفة. يمكن استكشاف التفاعلات المعقدة من خلال الجمع بين الأيض على نطاق واسع مع التباين الجيني الأساسي لمجموعة متنوعة من السكان5. ومع ذلك ، فإن التعامل مع مجموعات العينات الكبيرة يرتبط بطبيعته بالاختلافات التحليلية ، مما يشوه تقييم التباين الأيضي لمزيد من العمليات النهائية. على وجه التحديد ، تستند المشكلات الرئيسية التي تؤدي إلى اختلافات تحليلية إلى أداء الماكينة والانجراف الآلي بمرور الوقت6. إن دمج التباين من دفعة إلى دفعة يمثل تحديا وإشكالية خاصة عند تحليل مجموعات النباتات الهيكلية واسعة النطاق. واقترحت إجراءات تطبيع متعددة لتصحيح الاختلافات غير البيولوجية، مثل استخدام المعايير الداخلية والخارجية والمعايير الداخلية الموسومة بالنظائر لتصحيح الأخطاء التحليلية، والتي يرتبط كل منها بطبيعته بالمشاكل والمزالق المعروفة7،8،9،10.

بالإضافة إلى التباين التحليلي ، يختلف اختيار بروتوكولات الاستخراج بشكل عام اعتمادا على الطريقة التحليلية. في نهاية المطاف ، من المرغوب فيه تقليل تكاليف المواد والعمالة بالإضافة إلى ضرورة استخدام عدة أليكوتات من نفس العينة لمختلف العمليات التحليلية من خلال تنفيذ طرق الاستخراج القائمة على فصل الطور. تم إدخال هذه الطرق لأول مرة باستخدام الكلوروفورم: مذيبات الميثانول / الماء لتجزئة المركبات القطبية والكارهة للماء11.

يصف هذا البروتوكول خط أنابيب سريع عالي الإنتاجية لمنصة متعددة الأوميكس لتحديد ملامح كل من المستقلبات القطبية والدهون في أنواع البقوليات. علاوة على ذلك ، فإنه يوضح كيف يمكن تصحيح مجموعات البيانات هذه بشكل مناسب للتباين التحليلي وتطبيعها قبل دمج معلومات النمط الجيني للكشف عن مواقع السمات الكمية للمستقلب (QTL) عن طريق إجراء GWAS.

Protocol

1. التصميم التجريبي وزراعة النباتات ملاحظة: قم بإعداد التجربة اعتمادا على الفرضية التجريبية ، على سبيل المثال ، يقلل استخدام مجموعة GWAS واسعة النطاق من ضرورة النسخ المتماثلة المتعددة ، حيث سيتم إجراء اختبار إحصائي بناء على الأنماط الفردية لجميع SNPs الفردية بدلا من الانضمام. في المقابل ، لا غنى عن النسخ المتماثلة المتعددة في المناهج التجريبية الأخرى. يجب مراعاة النقاط التالية أثناء إعداد التجربة. تضمين ما يكفي من النسخ المتماثلة البيولوجية ، اعتمادا على الفرضية التجريبية. قم بتوزيع التكرارات البيولوجية عشوائيا على الكتلة لتقليل التحيز البيئي المحلي أثناء الزراعة ، على سبيل المثال ، الدفيئة ، الحقل. ضمان الصيانة المناسبة للنبات أثناء النمو. تعامل مع النباتات بشكل متجانس للحد من التحيز. 2. إعداد المواد النباتية البيولوجية إعداد الحصاد أنابيب حصاد الملصقات (20 مل) التي تحتوي على خرزتين معدنيتين قطرهما 5 مم وخرزتان بقطر 8 مم للتجانس. املأ ديوار بالنيتروجين السائل.ملاحظة: يجب أن تكون النباتات في المرحلة الخضرية لحصاد الأوراق الطازجة والأنسجة الجذرية. حصاد العينات البيولوجية عن طريق التجميد السريع في النيتروجين السائل. الحصاد في أسرع وقت ممكن لاستبعاد تأثير التذبذب اليومي على التمثيل الغذائي خلال فترات الحصاد المطولة12,13. قم بتخزين الأوراق الطازجة وأنسجة الجذر التي تم حصادها لمزيد من المعالجة عند -80 درجة مئوية.ملاحظة: يجب ألا يستغرق قطع الأوراق إلى التجميد المفاجئ أكثر من بضع ثوان لأنه بعد انقسام الأوراق ، ستغير العمليات البيولوجية النشطة ملامح التمثيل الغذائي بسبب الجرح. بالنسبة للجذور ، قم بتنظيف الجذور مسبقا عن طريق الغسيل بالماء قبل التجميد السريع في النيتروجين السائل. يجب امتصاص الماء الزائد على سطح الجذر بمناديل ورقية. يمكن تخزين البذور المجففة في درجة حرارة الغرفة ؛ لا يلزم تجميد النيتروجين السائل. طحن الأنسجة باستخدام مطحنة خلاط الأنسجة. قم بتبريد حاملات الأنابيب في النيتروجين السائل لبضع دقائق للحفاظ على درجة حرارة منخفضة أثناء طحن الأنسجة. انقل العينات البيولوجية في ديوار يحتوي على النيتروجين بعد إخراجها من الفريزر -80 درجة مئوية. طحن الأنسجة للحصول على مسحوق متجانس. استخدم 25 هرتز لمدة 1 دقيقة وكرر بعد التجميد في النيتروجين السائل إذا لم يكن النسيج مطحونا بشكل متجانس. لطحن البذور المجففة ، ضع البذور في جرة طحن مع حبة معدنية قطرها 15 مم. استخدم نفس التردد والوقت كما هو مذكور في 2.3.3.ملاحظة: يمكن استخدام مدافع الهاون والمدقة النظيفة والمبردة مسبقا في حالة عدم توفر مطحنة خلاط الأنسجة. تبريد مسبق المسمى 2 مل آمنة قفل أنابيب الطرد المركزي الدقيق. يزن 50 ملغ مع خطأ قدره ±5 ملغ من المواد النباتية الطازجة باستخدام مقياس تحليلي. قم بتبريد الأدوات المستخدمة لنقل المواد النباتية في النيتروجين السائل. تأكد من بقاء المواد النباتية مجمدة أثناء عملية الوزن.ملاحظة: لا تعرض المواد النباتية الطازجة لفترة طويلة جدا لدرجة حرارة الغرفة حيث يتم تنشيط العمليات البيولوجية عن طريق زيادة درجة الحرارة ، وتغيير ملامح التمثيل الغذائي14. قم بإنشاء عينات إضافية لمراقبة الجودة (QC) عن طريق تجميع نسبة من كل عينة ووزن 50 ملغ مع خطأ قدره ±5 ملغ من المواد النباتية الطازجة المجمعة في أنابيب الطرد المركزي الدقيقة المبردة مسبقا 2 مل الآمنة.ملاحظة: ينصح بما لا يقل عن ثلاث عينات لمراقبة الجودة لكل 60 عينة. تعتبر عينات مراقبة الجودة ضرورية لتصحيح المصب وتطبيعه وتحليله. 3. كواشف الاستخراج الأنسجة الطازجة، على سبيل المثال، الأوراق والجذورملاحظة: يستند استخراج العينة إلى بروتوكول15 الموصوف مسبقا. تم تعديل هذا البروتوكول بناء على الاحتياجات الحالية ، على سبيل المثال ، الأنسجة المتعددة ، والمعايير الداخلية المختلفة ، والتجارب واسعة النطاق. بالإضافة إلى ذلك، يتم ضبط جميع وحدات التخزين وإعدادات الأدوات المذكورة أدناه إلى وحدات تحليلية داخلية. يجب على مستخدمي البروتوكول ضبط هذه وفقا لوحدتهم التحليلية والعينات البيولوجية ، بناء على عينات الاختبار. خليط الاستخراج 1 (EM1): ميثيل ثلاثي بوتيل الأثير (MTBE)/الميثانول (MeOH) (3:1 v/v) تحضير مزيج من MTBE / MeOH بنسبة 3: 1. للحصول على 100 مل من مذيب الاستخراج ، امزج 75 مل من MTBE مع 25 مل من MeOH في زجاجة زجاجية نظيفة.ملاحظة: يجب التعامل مع المذيبات بعناية في غطاء الدخان باستخدام معدات السلامة المناسبة. أضف 45 ميكرولتر من 1,2-diheptadecanoyl-sn-glycero-3-phosphocholine (1 mg/mL in chloroform) كمعيار داخلي لتحليل الدهون القائم على UHPLC-MS ، و 400 ميكرولتر من الريبيتول (1 ملغ / مل في الماء) كمعيار داخلي للتحليل القائم على GC-MS ، و 125 ميكرولتر من isovitexin (1 mg / mL في MeOH / water (1: 1 v / v)) لتحليل الأيض القائم على UHPLC-MS.ملاحظة: إضافة معايير داخلية ضرورية لتطبيع ما بعد التحليل وفقا للاحتياجات التحليلية. نظرا لأن هناك حاجة إلى 1 مل من EM1 لكل عينة ، قم بإعداد محلول مخزون وفقا لحجم العينة التجريبية ، والذي يجب استخدامه للتجربة بأكملها. يجب تخزين EM1 عند -20 درجة مئوية. تحقق من عدم وجود المعيار الداخلي المستخدم والتداخل مع المركبات الأخرى في الأنواع التي تم التحقيق فيها. يمكن استخدام العديد من المعايير. استند اختيار المعايير الداخلية في هذا البروتوكول إلى اختبارات سابقة باستخدام مستخلصات الفاصوليا الشائعة16. خليط الاستخراج 2 (EM2) الماء / الميثانول (MeOH) (3: 1 v / v) بالنسبة إلى 100 مل EM2 ، أضف 75 مل من الماء المقطر المزدوج و 25 مل من MeOH في زجاجة زجاجية نظيفة. أضف 500 ميكرولتر من EM2 لكل عينة ، وقم بإعداد محلول مخزون وفقا لحجم العينة التجريبية ، والذي يجب استخدامه للتجربة بأكملها. تخزين EM2 في 4 درجة مئوية. البذور المجففة خليط استخراج 3 (EM3) الميثانول (MeOH) / الماء (7: 3 v / v) للحصول على 100 مل من EM3 ، أضف 70 مل من MeOH و 30 مل من الماء المقطر المزدوج في زجاجة زجاجية نظيفة. تحضير 1 مل من EM3 لكل عينة. أضف 400 ميكرولتر من الريبيتول (1 ملغم/مل في الماء) كمعايير داخلية للتحليل القائم على GC-MS و 125 ميكرولتر من الأيزوفيتكسين (1 ملغم/مل في MeOH/water (1:1 v/v)) لتحليل الأيض القائم على UHPLC-MS.ملاحظة: قم بإعداد حل مخزون وفقا لحجم العينة التجريبية واستخدمه للتجربة بأكملها. تخزين EM3 في 4 درجة مئوية. 4. استخراج العينات الأنسجة الطازجة، على سبيل المثال، الأوراق والجذور قم بإعداد ثلاثة أنابيب طرد مركزي دقيق آمنة بسعة 1.5 مل لكل عينة. احتفظ ب EM1 في نظام تبريد سائل -20 درجة مئوية. انقل العينات الطازجة من الفريزر -80 درجة مئوية إلى الثلج الجاف أو النيتروجين السائل لنقلها. أضف 1 مل من EM1 المبرد مسبقا إلى كل 50 ملغ أليكوت ودوامة لفترة وجيزة قبل الاحتفاظ بها على الجليد. احتضن العينات على شاكر مداري عند 800 × جم لمدة 10 دقائق عند 4 درجات مئوية. قم بسونيك العينات في حمام صوتنة مبرد بالثلج لمدة 10 دقائق. أضف 500 ميكرولتر من EM2 باستخدام ماصة متعددة القنوات لتجنب الاختلاف في وحدات التخزين المضافة. دوامة العينات لفترة وجيزة لخلط مخاليط الاستخراج قبل الطرد المركزي في 11200 × غرام لمدة 5 دقائق عند 4 درجات مئوية. بعد حدوث فصل الطور ، قم بنقل 500 ميكرولتر من المرحلة العلوية المحتوية على الدهون إلى أنبوب طرد مركزي صغير 1.5 مل مغلق مسبقا بأمان. إزالة بقية المرحلة العليا.ملاحظة: انتبه أثناء النقل لأن هذه المرحلة العليا لديها ضغط بخار مرتفع وتميل إلى التسرب من الماصة. نقل 150 ميكرولتر و 300 ميكرولتر من المرحلتين المحتويتين على الأيض القطبي وشبه القطبي السفلي في أنبوبين لأجهزة الطرد المركزي الدقيقة ذات القفل الآمن سعة 1.5 مل يستخدمان في تحليل GC-MS و UHPLC-MS ، على التوالي. ركز جميع الكسور المستخرجة عن طريق ترك المذيبات تتبخر دون تسخين باستخدام مكثف فراغ وتخزينها عند -80 درجة مئوية. البذور المجففة قم بإعداد أنبوبين لأجهزة الطرد المركزي الدقيقة ذات القفل الآمن سعة 1.5 مل لكل عينة. حافظ على EM3 على الجليد. ضع حبة معدنية قطرها 5 مم في عينة الأليكوت. أضف 1 مل من EM3 في كل 50 ملغ أليكوت وقم بتجانس العينات عند 25 هرتز لمدة 2-3 دقائق قبل وضعها على الجليد. قم بسونيك العينات في حمام صوتنة مبرد بالثلج لمدة 10 دقائق. دوامة العينات لفترة وجيزة قبل الطرد المركزي في 11200 × غرام لمدة 5 دقائق عند 4 درجات مئوية. نقل 150 ميكرولتر و 300 ميكرولتر من السوبرنات في أنبوبين لأجهزة الطرد المركزي الدقيقة ذات القفل الآمن سعة 1.5 مل المستخدمة في تحليل GC-MS و UHPLC-MS ، على التوالي. ركز جميع الكسور المستخرجة عن طريق ترك المذيبات تتبخر دون تسخين باستخدام مكثف فراغ وتخزينها عند -80 درجة مئوية.ملاحظة: استنادا إلى التجربة، ينصح المستخدمون بإجراء الخطوة 4.2 للمستقلبات شبه القطبية وتحليل المستقلب المشتق في البذور المجففة. قم بإجراء خطوة الاستخراج 4.1 لتحليل دهون البذور المجففة. 5. تحليل الدهون باستخدام UHPLC-MS أعد تعليق أجزاء الدهون المجففة في 250 ميكرولتر من الأسيتونيتريل: 2-بروبانول (7: 3 ، المجلد / المجلد). سونيك مرحلة الدهون لمدة 5 دقائق، وأجهزة الطرد المركزي في 11200 × غرام لمدة 1 دقيقة. نقل 90 ميكرولتر من supernatant إلى قارورة زجاجية ل LC-MS. حقن 2 ميكرولتر من المستخلصات في LC-MS. قم بإجراء تجزئة الدهون على عمودC 8 معكوس الطور الذي يتم الاحتفاظ به عند 60 درجة مئوية مع تدفق 400 ميكرولتر / دقيقة مع تغييرات تدريجية في A و B كما هو موضح في الجدول 1. احصل على أطياف الكتلة في وضع التأين الإيجابي مع نطاق كتلة يتراوح بين 150-1500 m/z. قم بتضمين العديد من عينات مراقبة الجودة في جميع الدفعات اليومية وفارغة لضمان تصحيح التباين التحليلي. عشوائيا العينات كتلة الحكمة في ترتيب تسلسلي. 6. تحليل المستقلبات القطبية وشبه القطبية باستخدام UHPLC-MS أعد تعليق الطور القطبي المجفف في 180 ميكرولتر من الميثانول من الدرجة UHPLC: الماء (1: 1 v / v). سونيك الطور القطبي لمدة 2 دقيقة ، جهاز طرد مركزي في 11200 × غرام لمدة 1 دقيقة. نقل 90 ميكرولتر من supernatant إلى قارورة زجاجية ل LC-MS. حقن 3 ميكرولتر من المستخلصات في LC-MS. قم بإجراء تجزئة الأيض على عمود عكس المرحلة C18 الذي يتم الاحتفاظ به عند 40 درجة مئوية مع تدفق 400 ميكرولتر / دقيقة مع تغييرات تدريجية في الانحراف A و B كما هو موضح في الجدول 1. احصل على أطياف الكتلة في نطاق كتلة يتراوح بين 100 و 1500 m/z في فحص MS كامل وجميع أجزاء الأيونات (AIF) الناتجة عن التفكك التصادمي عالي الطاقة (HCD) البالغ 40 كيلو فولت.ملاحظة: استخدم وضعي التأين. ومع ذلك ، نظرا لمحدودية السعة أثناء تشغيل أعداد كبيرة من العينات ، قم بتشغيل عينات الاختبار في كلا وضعي التأين لتحديد وضع التأين المفضل. قم بتضمين العديد من عينات مراقبة الجودة في جميع الدفعات اليومية وفارغة لضمان تصحيح التباين التحليلي. عشوائيا العينات كتلة الحكمة في ترتيب تسلسلي. قم بتشغيل مراقبة الجودة المجمعة في MS2 المعتمد على البيانات في كل من وضعي التأين السلبي والإيجابي. استخدم أطياف الكتلة التي تم الحصول عليها في خطوة لاحقة (8.5) للتعليق التوضيحي. 7. تحليل المستقلبات المشتقة باستخدام GC-MS17,18 ملاحظة: يستند تحليل المستقلبات المشتقة إلى البروتوكول17 الموصوف سابقا. التعامل مع جميع كواشف الاشتقاق في غطاء الدخان. تأكد من أن N-methyl-N-(trimethylsilyl) trifluoracetamide (MSTFA) لا يتلامس مع الماء والرطوبة. كاشف الاشتقاق 1 (DR1) قم بإذابة هيدروكلوريد الميثوكسيامين في البيريدين للحصول على تركيز 30 ملغم / مل من DR1. استخدم 40 ميكرولتر من DR1 لكل عينة. قم بإعداد محلول مخزون وفقا لحجم العينة ، وخزنه في درجة حرارة الغرفة. كاشف الاشتقاق 2 (DR2) قم بإذابة MSTFA مع 20 ميكرولتر من استرات ميثيل الأحماض الدهنية (FAMEs) لكل 1 مل من MSTFA. استخدم 70 ميكرولتر من DR2 لكل عينة. قم بإعداد محلول مخزون وفقا لحجم العينة. تخزين MSTFA في 4 درجة مئوية و FAMEs في -20 درجة مئوية.ملاحظة: تشمل الفيمات ميثيل كابريلات، وميثيل بيلارجونات، وميثيل كابرات، وميثيل لورات، وميثيل ميريستات، وميثيل بالميتات، وميثيل ستيرات، وميثيل إيكوسانوات، وميثيل دوكوسانوات، وميثيل إستر حمض الليغنوسيريك، وميثيل هيكساكوزانوات، وميثيل أوكتاكوزانوات، وميثيل استر حمض الترياكونتانويك، التي تذوب في CHCl3 بتركيز 0.8 ميكرولتر/مل أو 0.4 ملغم/مل للمعايير السائلة أو الصلبة، على التوالي. أعد تجفيف الكريات من الطور القطبي (المخزنة عند -80 درجة مئوية) باستخدام مكثف فراغ لمدة 30 دقيقة لتجنب أي تداخل من H2O ينشأ أثناء التخزين مع المذيبات المستخدمة في اشتقاق المصب. أضف 40 ميكرولتر من DR1. رج العينات عند 950 × جم لمدة 2 ساعة عند 37 درجة مئوية باستخدام اهتزاز مداري ، متبوعا بدوران قصير للسائل. أضف 70 ميكرولتر من DR2. رج المزيج مرة أخرى على ارتفاع 950 × جم لمدة 30 دقيقة عند 37 درجة مئوية باستخدام شاكر مداري. جهاز طرد مركزي لفترة وجيزة في درجة حرارة الغرفة قبل نقل 90 ميكرولتر إلى قوارير زجاجية لتحليل GC-MS. حقن 1 ميكرولتر في وضع GC-MS غير المنقسم ، اعتمادا على تركيزات المستقلب ، مع تدفق غاز ناقل الهيليوم المستمر من 2 مل / دقيقة. يتم ضبط درجة حرارة الحقن على 230 درجة مئوية باستخدام عمود شعري MDN-35 بطول 30 مترا.ملاحظة: يمكن الاطلاع على معلومات إضافية، مثل تدرج درجة الحرارة، في الجدول 1. يتم تعيين نطاق الكتلة إلى 70-600 م / ز مع 20 عملية مسح / دقيقة. قم بتضمين أوضاع الانقسام لتمكين التحديد الكمي لمركبات التحميل الزائد المفترضة ، مما يوفر التكاليف والوقت لإعادة اشتقاق المستخلص في مثل هذه الحالات. قم بتضمين العديد من عينات مراقبة الجودة في جميع الدفعات اليومية وفارغة لضمان تصحيح التباين التحليلي. قم بتوزيع العينات عشوائيا بشكل صحيح من حيث الكتلة بترتيب تسلسلي. 8. معالجة الكروماتوجرام والتعليق التوضيحي المركب قم بتصفية الضوضاء الكيميائية عن طريق تحديد عتبات الكثافة. قم بتضمين جميع عينات مراقبة الجودة أثناء معالجة الكروماتوغرامات.ملاحظة: بالنسبة للبيانات واسعة النطاق، تعد تصفية الضوضاء أمرا بالغ الأهمية لتقليل وقت الحوسبة وقوة المعالجة. قم بمحاذاة الكروماتوغرام عن طريق تعريف نافذة إزاحة وقت الاستبقاء. تحقق من الكروماتوغرام من كل دفعة لتقييم التباين داخل الدفعات وفيما بينها. قم بإجراء الكشف عن الذروة اعتمادا على شكل الذروة، على سبيل المثال، الارتفاع والعرض للعرض الكامل عند حسابات نصف الحد الأقصى (FWHM). النظائر العنقودية لتقليل الإشارات الزائدة عن الحاجة وتصفية الأطنان المفردة.ملاحظة: راجع جدول المواد للحصول على تفاصيل حول البرامج المستخدمة لمعالجة الكروماتوجرام. يتم توفير بروتوكولات متعمقة حول كيفية معالجة الكروماتوغرام باستخدام العديد من أدوات البرامج المتاحة مجانا ، على سبيل المثال ، MS-DIAL و MetAlign و MzMine و Xcalibur 19,20,21. استخدم بيانات ddMS2 لعينة مراقبة الجودة المجمعة للتعليق التوضيحي المركب. تقييم التركيب الجزيئي من خلال تحديد الكتلة النظيرية الأحادية ومراقبة الخسائر المحايدة الشائعة ، والجلايكونات المشحونة المعروفة ، وأنواع مختلفة من الانقسامات ، على سبيل المثال ، متجانسة أو غير متجانسة16,22. للإبلاغ عن بيانات الأيض ، اتبع التوصية الموضحة في Fernie et al. 201123.ملاحظة: يمكن استخدام أساليب الأيض الحسابية المختلفة لتحليل بيانات الأيض24،25،26. 9. تطبيع مجموعة بيانات الأيض على نطاق واسع تحقق من توزيع المعيار (المعايير) الداخلية وقم بتطبيعه عن طريق التصحيح لاستجابة معايير داخلية واحدة أو متعددة. صحح شدة الذروة التي تم الحصول عليها من الكروماتوجرام على وزن العينة الدقيق بقسمة شدة الذروة على وزن العينة المتجانسة المقتبس من الخطوة 2.5. صحيح لانحراف الكثافة عبر سلسلة الدفعات المتعددة. قم بإجراء طرق تصحيح تستند إلى مراقبة الجودة مثل تجانس مخطط التشتت المقدر محليا (LOESS)27 باستخدام R.ملاحظة: تتوفر العديد من الأدوات والحزم لمعالجة انحراف أداء MS أثناء الحصول على الدفعات بأكملها28,29. ضمان التوزيع الطبيعي للسمات عن طريق تحويل البيانات، على سبيل المثال، تحويل Box-Cox30 باستخدام وظيفة boxcox () من حزمة R MASS لتنفيذ GWAS. قم بإجراء قياس البيانات، على سبيل المثال، قياس باريتو، لتحليل المتغيرات المتعددة لضمان الوزن السليم للمركبات منخفضة الوفرة31.ملاحظة: إذا كان ذلك ممكنا، قم بإجراء فحص الاسترداد لتجنب تأثيرات المصفوفة، على سبيل المثال، قمع الأيونات14. 10. دراسات الارتباط على نطاق الجينوم (GWAS)32 استدعاء تعدد أشكال النيوكليوتيدات المفردة (SNP) أو المتغيرات الهيكلية (SV) من بيانات التسلسل33,34. تصفية بيانات النمط الجيني لتردد الأليل البسيط (MAF) 10٪ لتجنب التحيز منخفض التردد باستخدام Tassel35. احسب أفضل التنبؤات الخطية غير المتحيزة (BLUPs) لكل ميزة طبيعية على التكرار التجريبي للقضاء على التحيز الناشئ عن العوامل البيئية (التأثيرات العشوائية) باستخدام حزمة R Ime436. استخدم BLUPs لكل ميزة على حدة لإجراء GWAS باستخدام حزمة rMVP في R37.ملاحظة: يتم عرض كل ميزة من ميزات الأيض هنا كنمط ظاهري فردي مستقل. أثناء إجراء GWAS، صحيح للبنية السكانية باستخدام تحليل المكون الرئيسي (PCA) والهوية حسب الولاية (IBS) أو vanRaden لتقليل الآثار المربكة. علاوة على ذلك ، فكر في استخدام نموذج خطي مختلط (MLM) أو نموذج مختلط متعدد المواقع (MLMM) ، حيث تحتوي النماذج المختلطة على تأثيرات ثابتة وعشوائية. 11. الكشف عن QTL تحقق من SNPs التي تظهر ارتباطا كبيرا ، مع الأخذ في الاعتبار مخططات مانهاتن ، لحسابات عدم توازن الارتباط (LD) لتحديد المنطقة الوراثية الأساسية. قم بإجراء حسابات LD باستخدام الخريطة الحرارية LD لحزمة R أو Tassel 5. تحقق من SNPs المرتبطة بحجم التأثير على السمة من خلال فحص مستويات السمات للتغيرات الإحصائية بين الأنماط الفردية للعثور على SNPs السببية المحتملة ، على سبيل المثال ، SNPs مما يؤدي إلى تغيير الأحماض الأمينية في تسلسل ترميز البروتين ، والذي يمكن أن يفسر التباين الظاهري.ملاحظة: بما أن ارتباطات سمات SNP لا تسفر بالضرورة عن ارتباط سببي ، فمن الأهمية بمكان تحديد المنطقة الجينومية. يمكن أن تساعد الهوية المركبة حسب التعليق التوضيحي المميز بشكل كبير في العثور على الجينات المرشحة المناسبة في منطقة جينومية محددة. نقترح الجمع بين جميع QTL المكتشفة المرتبطة بمركبات معينة في خريطة متعددة الأضلاع للتأكيد على المناطق الوراثية38 ، كما هو موضح في الشكل 4. للتحقق من صحة الجينات المرشحة ، يمكن إجراء العديد من الأساليب (انظر المناقشة).

Representative Results

يجب أن تبدأ تجارب GWAS الناجحة في مجال التمثيل الغذائي بتصميم تجريبي مناسب ، يليه جمع العينات واستخراجها والحصول على البيانات ومعالجتها ، كما هو موضح في الشكل 1. في هذا البروتوكول ، تم استخدام طريقة MTBE15 لاستخراج وتحليل مئات المستقلبات التي تنتمي إلى عدة فئات مركبة. تعتمد الكروماتوغرافيا بشكل كبير على خصائص العمود المستخدم بالإضافة إلى مخاليط المخزن المؤقت للاستخراج. ويبين الشكل 2 كروماتوغرام عينات مراقبة الجودة، مما يشير إلى نمط الاستخلاص لبعض فئات الدهون الرئيسية في هذا النظام التحليلي. وترد في الجدول 1 التدرجات المطبقة لكل منصة. تم التركيز بشدة على معالجة الأخطاء النظامية في التجارب واسعة النطاق. يرتبط إجراء عمليات التمثيل الغذائي على نطاق واسع بطبيعته بالأخطاء الجهازية. للتوضيح ، قمنا بتحليل البيانات الدهنية عبر العديد من أنواع الفاصوليا الشائعة. يوفر الجدول التكميلي 1 البيانات الدهنية الخام المستخرجة التي تم الحصول عليها بعد معالجة الكروماتوجرام باستخدام البرنامج الموضح في جدول المواد. مكننا اتباع هذا البروتوكول من التحايل على المشكلات الرئيسية في التعامل مع بيانات omics ، خاصة أثناء التعامل مع مجموعات العينات الكبيرة. وينتج عن إجراء التطبيع تصحيح دقيق للأخطاء التحليلية الحكيمة دفعا، كما هو موضح في الشكل 3. على الرغم من أن زيادة أعداد عينات مراقبة الجودة من شأنها أن تزيد من قوة التطبيع ، إلا أن هذا ليس ممكنا دائما بسبب قيود التكلفة والوقت. بالنسبة للاستقلاب عالي الإنتاجية GWAS مع ميزات التمثيل الغذائي غير المستهدفة ، من الضروري توضيح أعداد أكبر من ارتباط علامة السمات بشكل مناسب. يمكن استخدام خريطة متعددة الأضلاع38 تجمع بين نتائج GWAS متعددة لتسليط الضوء على المناطق الجينومية التي ترتبط بها العديد من السمات (الشكل 4). الشكل 1: مخطط انسيابي لنظام GWAS القائم على الأيض في النباتات. يتم عرض عدة خطوات بدءا من التصميم التجريبي وحتى اكتشاف QTL في اللوحة اليسرى. في اللوحة اليمنى ، تظهر أرقام متعددة لدعم العديد من الخطوات المذكورة في اللوحة اليمنى. بدءا من الجزء العلوي الأيمن ، (1) يتم عرض تسلسل مقترح من العينات ل LC-MS ، (2) مخططات درجات ما قبل وبعد التطبيع ل PCA ، بما في ذلك توزيع المعالم التمثيلية قبل المعالجة وبعدها ، مع إشارة حمراء إلى كثافة عينة مراقبة الجودة ، و (3) مخطط مانهاتن مع ارتباطات كبيرة تم إنشاء توزيعات LD والنمط الفرداني لها. الاختصارات: GWAS = دراسات الارتباط على نطاق الجينوم. QTL = موقع السمة الكمية; PCA = تحليل المكون الرئيسي; مراقبة الجودة = مراقبة الجودة; LD = اختلال توازن الروابط; MS = قياس الطيف الكتلي; LC-MS = كروماتوغرافيا سائلة – مطياف الكتلة ؛ GC-MS = كروماتوغرافيا الغاز – مطياف الكتلة ؛ LOESS = تجانس مخطط التشتت المقدر محليا ؛ MLM / MLMM = نموذج خطي مختلط / نموذج مختلط متعدد المواقع. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم. الشكل 2: معالجة الكروماتوجرام. يوضح اثنان من كروماتوغرام مراقبة الجودة (الذروة الأساسية ؛ بيانات الدهون) من دفعات مختلفة التباين الحكيم للدفعات لبعض فئات الدهون في عينات مراقبة الجودة المجمعة. يشار إلى أربع فئات رئيسية من الدهون مع نوافذ التفريغ الخاصة بها في نظام LC-MS الداخلي. تم تصدير الكروماتوغرام من MzMine21. الاختصارات: مراقبة الجودة = مراقبة الجودة; LC-MS = كروماتوغرافيا سائلة-قياس الطيف الكتلي. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم. الشكل 3: تصحيح الخطأ المنهجي. تحليل المكون الرئيسي للبيانات الدهنية المكتسبة ، قبل (يسار ، البيانات الخام) وبعد التصحيح للأخطاء النظامية (اليمين ، الدفعة loess). توضح اللوحات السفلية توزيع المعالم (Cluster_00005) على العينات (n = 650) والدفعات (n = 10) قبل (يسار) وبعد (يمين) – تصحيح للتباين التحليلي. الاختصارات: PCA = تحليل المكون الرئيسي; مراقبة الجودة = مراقبة الجودة; LOESS = تجانس مخطط التشتت المقدر محليا. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم. الشكل 4: خريطة متعددة الأضلاع توضح النتائج المجمعة لنظام GWAS. تسلط الخريطة متعددة الأضلاع الضوء على المناطق في الجينوم بأكمله المرتبطة بالعديد من السمات. تشير الأرقام الموجودة على الحلقات الخارجية إلى الكروموسومات المقابلة. تمثل كل دائرة سمة فردية مع SNPs المرتبطة بها بشكل كبير. تمثل الألوان فئات مركبة مختلفة (الرمادي = الفئة المركبة 1 ؛ الأخضر = الفئة المركبة 2 ؛ الأرجواني = الفئة المركبة 3 ؛ الأصفر = الفئة المركبة 4). في حالة الارتباطات بين الطبقات المركبة مع نفس المنطقة الجينومية ، يتم تسليط الضوء على الجينات. تظهر الدائرة الرمادية الداخلية مجموع جميع SNPs الهامة المرتبطة بموقع جينومي محدد. يتم إنشاء الارتباطات الموضحة في هذا الشكل بشكل مصطنع فقط للتوضيح. الاختصارات: GWAS = دراسات الارتباط على نطاق الجينوم. SNPs = تعدد الأشكال أحادية النوكليوتيد. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم. إعدادات UHPLC-MS للدهون الوقت [دقيقة] من A إلى B [٪]* معلومات 0 – 1.00 45٪ أ Eluent A: 1٪ 1M NH 4-Acetate ، 0.1٪ حمض الخليك في الماء (درجة UHPLC) 1.00 – 4.00 إل جي 45٪ – 25٪ أمبير Eluent B: 1٪ 1M NH 4-Acetate ، 0.1٪ حمض الخليك في الأسيتونيتريل / 2-بروبانول 7: 3 (درجة UHPLC) 4.00 – 12.00 إل جي 25٪ – 11٪ A معدل التدفق: 400 ميكرولتر / دقيقة 12.00 – 15.00 إل جي 11٪ – 0٪ A حجم الحقن: 2 ميكرولتر 15.00 – 19.50 cw 0٪ A 19.50-19.51 0٪ – 45٪ أمبير 19.51-24.00 eq 45٪ إعدادات UHPLC-MS/MS للمستقلبات القطبية وشبه القطبية الوقت [دقيقة] Eluent A و B [٪]* معلومات 0 – 1.00 99٪ أ Eluent A: 0.1٪ حمض الفورميك في الماء (درجة UHPLC) 1.00 – 11.00 إل جي 99٪ -60٪ A Eluent B: 0.1٪ حمض الفورميك في الأسيتونيتريل (الصف UHPLC) 11.00 – 13.00 إل جي 60٪ – 30٪ أمبير معدل التدفق: 400 ميكرولتر / دقيقة 13.00 – 15.00 إل جي 30٪ – 1٪ A حجم الحقن: 3 ميكرولتر 15.00 – 16.00 cw 1٪ A 16.00 – 17.00 إل جي 1٪ – 99٪ A 17.00 – 20.00 eq 99٪ A إعدادات GC-MS للمستقلبات المشتقة الوقت [دقيقة] درجة الحرارة [°C] معلومات 0 – 2.00 85 الغاز الناقل: هيليوم 2.00 – 18.66 إل جي 80 – 330 معدل التدفق: 2 مل / دقيقة 18.66 – 24.66 سي دبليو 330 تدرج درجة الحرارة: 15 درجة مئوية / دقيقة 24.66 تبريد سريع حجم الحقن: 1 ميكرولتر الجدول 1: إعدادات التدرج لكل منصة من المنصات التحليلية7. الاختصارات: lg = التدرج الخطي ؛ cw = غسل الأعمدة. eq = التوازن; UHPLC-MS = كروماتوغرافيا سائلة فائقة الأداء – مطياف الكتلة ؛ UHPLC-MS/MS = كروماتوغرافيا سائلة فائقة الأداء – قياس الطيف الكتلي الترادفي ؛ GC-MS = كروماتوغرافيا الغاز – مطياف الكتلة. * = قيمة النسبة المئوية تتوافق مع A؛ قيمة النسبة المئوية المتبقية تتوافق مع B. الجدول التكميلي 1: بيانات الدهون الخام. يشير إلى شدة الذروة لكل مجموعة من المجموعات المكتشفة على كل عينة. يرجى النقر هنا لتنزيل هذا الجدول.

Discussion

كل من GC-MS و LC-MS هي أدوات تستخدم على نطاق واسع لتحديد ملامح المخاليط المعقدة من فئات الأيض المختلفة. يرتبط التعامل مع مجموعات البيانات الكبيرة باستخدام هذه الأدوات بطبيعته بتباين غير بيولوجي ، على سبيل المثال ، التباين التحليلي ، الذي يتداخل مع تفسير النتائج ويحيد إليه. يقدم هذا البروتوكول خط أنابيب استخراج قوي وعالي الإنتاجية للتنميط الأيضي الشامل للقضاء على التباين في المنشأ غير البيولوجي وإجراء دراسات “omics” واسعة النطاق. تم تعديل الأحجام والتركيزات المستخدمة في هذا البروتوكول لأنواع البقوليات في الأنسجة المختلفة. ومع ذلك ، يمكن تعديل هذه المعلمات قليلا واستخدامها لعينات التمثيل الغذائي على نطاق واسع من الأنواع النباتية الأخرى أيضا.

يمكن استخدام المقتطفات ال15 الموصوفة سابقا القائمة على MTBE لتحليل الأيضات المشتقة والأيضات شبه القطبية والدهون. يمكن توسيع هذا لاستخراج البروتين والهرمونات النباتية39 ، والتي كانت خارج نطاق هذا البروتوكول. تعتمد بروتوكولات الاستخراج الأخرى على ثنائي كلورو الميثان: مخاليط الإيثانول40,41. من بين بروتوكولات الاستخراج هذه ، يوفر بروتوكول استخراج الميثانول MTBE:methanol بديلا مواتيا وأقل خطورة لبروتوكولات الاستخراج القائمة على الكلوروفورم42 ولا ينتج عنه بيليه بروتين كطور بيني بين المرحلتين القطبية والدهنية. علاوة على ذلك ، تم بالفعل استخدام طرق MTBE في العديد من الدراسات لمختلف العينات البيولوجية43،44،45.

يناقش هذا البروتوكول العديد من الخطوات الحاسمة التي قد تؤدي إلى اختلاف محتمل أثناء التعامل مع عدد كبير من العينات ، على سبيل المثال ، أثناء حصاد12،13 ، واستخراج14 ، وكذلك التوزيع العشوائي46. وعلاوة على ذلك، هناك مسائل إضافية لم تناقش في هذا البروتوكول يجب النظر فيها لضمان بيانات استقلابية عالية الجودة، مثل تأثير المصفوفة وقمع الأيونات14.

تعتمد قوة طرق التطبيع القائمة على مراقبة الجودة بطبيعتها على عدد عينات مراقبة الجودة في كل دفعة. وكما ذكر سابقا، على الرغم من أن زيادة العدد من شأنه أن يزيد من الطاقة، فإن التباين داخل الدفعات لمراكز مراقبة الجودة هامشي نسبيا مقارنة بالتباين بين الدفعات في هذه النظم التحليلية، كما هو موضح في الشكل 3. بشكل عام، هناك طرق تطبيع أخرى قائمة على مراقبة الجودة، مثل إزالة الأخطاء النظامية باستخدام الغابات العشوائية (SERRF)، والتي ثبت أنها تتفوق على معظم طرق التطبيع الأخرى مثل النسبة الجزائية، والتطبيع باستخدام الاختيار الأمثل للمعايير الداخلية المتعددة (NOMIS)، وتطبيع الحاصل الاحتمالي (PQN)47 . ومع ذلك، تعتمد SERRF على عينات مراقبة الجودة المتعددة في كل دفعة، على سبيل المثال، كل عينة عاشرة، وهو أمر غير ممكن أثناء التعامل مع أعداد كبيرة من العينات. الميزة الرئيسية للتطبيع القائم على مراقبة الجودة على الطرق الأخرى القائمة على البيانات أو الداخلية القائمة على المعايير هي أنها تحتفظ بالتباين البيولوجي الأساسي مع استيعاب التباين التقني غير المرغوب فيه28. قد يشير القراء إلى هذه المراجعة حول معالجة الاختلاف28.

إحدى القضايا الرئيسية في GWAS هي معدل الإيجابيات الكاذبة ، والتي تنشأ في الغالب بسبب ارتباط المواقع السببية وغير السببية48,49. ثانيا ، نهج التصحيح الإحصائي المحافظ ، على سبيل المثال ، Bonferroni و FDR ، صحيحة لعدد الاختبارات المستقلة ، والتي لا تساوي عدد SNPs التي تم فحصها في GWAS بسبب الارتباط بين SNPs القريبة50,51 لذلك ، فإن العدد الفعلي للاختبارات المستقلة غالبا ما يكون أقل. وهناك طريقة أخرى لتقليل العتبة الإحصائية المتحفظة تتمثل في تقليل عدد SNPs التي تم اختبارها والمستخدمة في GWAS على أساس اضمحلال الروابط على المناطق الجينومية المحددة52. تحتوي منصة الأيض عالية الإنتاجية المدمجة في GWAS، الموضحة في هذا البروتوكول، على مجموعة واسعة من التطبيقات. وعلى وجه الخصوص، سوف يسهل إدخال تحسينات على تربية المحاصيل عن طريق تغيير تركيبة الأيض/الدهون للمستويات المرغوبة صناعيا وتغذويا. بشكل عام ، قدمت الأيض نظرة متعمقة على البنية الوراثية لعدد كبير من المستقلبات والتنويع الأيضي الذي حدث أثناء تدجين المحاصيل على مدى العقود الماضية ، مما يشير إلى الإمكانات الهائلة للتربية المرتبطة بالأيض53. تشمل النهج البيولوجية الجزيئية للتحقق من صحة QTL في المصب توليد خطوط CRISPR / Cas9 المتحولة54 ، وخطوط إدخال T-DNA55 ، وخطوط التعبير الزائد المستقرة و / أو العابرة56 ، و VIGS ، ونهج الأيض خارج الجسم الحي 57 بجانب النهج التقليدي في توليد مجموعات F2 المتقاطعة وكذلك التحقق المتبادل في مجموعات سكانية مختلفة.

من خلال إجراء التصحيح اللازم للاختلافات التحليلية كما هو موضح أعلاه ، يمكن إجراء العديد من النهج المتكاملة بالإضافة إلى GWAS، مثل مستقلب الأيض ، وتحليل ارتباط الأيض والدهون ، وتحليل الارتباط بالبيانات الفينومية لإلقاء الضوء على السمات الأكثر تعقيدا ، و / أو تحليل التعبير المشترك لزيادة كشف أساس النظم البيولوجية58.

Disclosures

The authors have nothing to disclose.

Acknowledgements

يتم دعم M.B. من قبل IMPRS-PMPG “التمثيل الغذائي الأولي ونمو النبات”. تقر A.R.F. و S.A. بالدعم المالي لبرنامج البحث والابتكار في أفق الاتحاد الأوروبي لعام 2020 ، ومشروع PlantaSYST (رقم SGA-CSA رقم 739582 بموجب FPA رقم 664620) ، وزيادة المشروع (GA 862862).

Materials

Reagents and standards
1,2-diheptadecanoyl-sn-glycero-3- phosphocholine (17:0 PC) Avanti Polar Lipids 850360P Internal standard for lipids
Chloroform Supleco 67-66-3 FAME solvent
Isovitexin Sigma Aldrich 38953-85-4 Internal standard for metabolites
Lignoceric Acid Methylester Sigma Aldrich 2442-49-1 FAME
Methanol (MeOH) Biosolve Chemicals 13684102 ULC-MS grade
Methoxyamin -hydrochlorid Sigma Aldrich 593-56-6 Metabolite deriviatization
Methyl laurate Sigma Aldrich 111-82-0 FAME
Methyl myristate Sigma Aldrich 124-10-7 FAME
Methyl palmitate Sigma Aldrich 112-39-0 FAME
Methyl stearate Sigma Aldrich 112-61-8 FAME
Methyl tert-butyl ether (MTBE) Biosolve Chemicals 13890602 HPLC grade
Methyl-caprat Sigma Aldrich 110-42-9 FAME
Methylcaprylat Sigma Aldrich 111-11-5 FAME
Methyldocosanoat Sigma Aldrich 929-77-1 FAME
Methyleicosanoat Sigma Aldrich 1120-28-1 FAME
Methyl-hexacosanoat Sigma Aldrich 5802-82-4 FAME
Methyl-octacosanoat Sigma Aldrich 55682-92-3 FAME
Methyl-pelargonate Sigma Aldrich 1731-84-6 FAME
N-Methyl-N-(trimethylsilyl)trifluoracetamid (MSTFA) Macherey-Nagel 24589-78-4 Metabolite deriviatization
Pyridine Supleco 110-86-1 Metabolite deriviatization
Ribitol Supleco 22566-17-2 Internal standard for derivatized metabolites
Triacontanoic Acid Methyl Ester TCI Chemicals 629-83-4 FAME
Water Biosolve Chemicals 23214102 ULC-MS grade
Equipment
1.5 mL Safe-lock microcentrifuge tubes Eppendorf 3120086
2 mL Safe-lock microcentrifuge tubes Eppendorf 3120094
Balance Sartorius Corporation 14 557 572
DB-35ms, 30 m, 0,25 mm, 0,25 µm Aglient 123-3832 Analysis of derivatized metabolites
GC-MS system Leco Pegasus HT TOF-MS (LECO Corporation) Analysis of derivatized metabolites
Grinding Balls, Stainless Steel OPS DIAGNOSTICS GBSS 196-2500-10
MS system Exactive, Orbitrap-type, MS (Exactive, Thermo Fisher Scientific) Analysis of lipids
MS system Q Exactive Focus (Q Exactive™ Focus Hybrid Quadrupol-Orbitrap™
Massenspektrometer, Thermo Fisher Scientific)
Analysis of metabolites
Refrigerated microcentrifuge Eppendorf, model 5427R 22620701
Reversed Phase (RP) Bridged Ethyl Hybrid (BEH) C8 column
(100 mm × 2.1 mm containing 1.7 μm diameter particles)
Waters 186002878 Analysis of lipids
RP High Strength Silica (HSS) T3 column
(100 mm × 2.1 mm containing 1.8 μm diameter particles)
Waters 186003539 Analysis of metabolites
Shaker Eppendorf Thermomixer 5436 2050-100-05
Sonicator USC 300 TH 142-0084
Tissue grinding mixer mill Retsch, Mixer Mill MM 300 20.746.0001
UPLC system Waters Acquity UPLC system (Waters)
Vacuum concentrator Scan Speed Maxi Vac Alpha Evaporators 7.008.500.002
Vortex mixer Vortex-Genie 2, Model G560 SI-0236
Software
MetAlign Chromatogram processing
MzMine Chromatogram processing
R package "data.table"
R package "fujiplot" pleiotrpoic map
R package "genetics"
R package "Ime4" BLUPs calculation
R package "LDheatmap" LD plots
R package "MASS" transformation
R package "rMVP" GWAS
R version 4.0.4
RefinerMS Chromatogram processing
RefinerMS Genedata Expressionist Chromatogram processing
Tassel 5 Genotype filtering
Xcalibur Thermo Fisher Scientific OPTON-30965 Chromatogram processing

References

  1. Doerr, A. Global metabolomics. Nature Methods. 14 (1), 32 (2017).
  2. Fessenden, M. Metabolomics: Small molecules, single cells. Nature. 540 (7631), 153-155 (2016).
  3. Oliver, S. G., Winson, M. K., Kell, D. B., Baganz, F. Systematic functional analysis of the yeast genome. Trends in Biotechnology. 16 (9), 373-378 (1998).
  4. Fiehn, O. Metabolomics-the link between genotypes and phenotypes. Plant Molecular Biology. 48 (1), 155-171 (2002).
  5. Wu, S., et al. Mapping the Arabidopsis metabolic landscape by untargeted metabolomics at different environmental conditions. Molecular Plant. 11 (1), 118-134 (2018).
  6. Sysi-Aho, M., Katajamaa, M., Yetukuri, L., Orešič, M. Normalization method for metabolomics data using optimal selection of multiple internal standards. BMC Bioinformatics. 8 (1), 93 (2007).
  7. Chen, M., Rao, R. S. P., Zhang, Y., Zhong, C. X., Thelen, J. J. A modified data normalization method for GC-MS-based metabolomics to minimize batch variation. SpringerPlus. 3 (1), 439 (2014).
  8. Dunn, W. B., et al. Metabolic profiling of serum using Ultra Performance Liquid Chromatography and the LTQ-Orbitrap mass spectrometry system. Journal of Chromatography B. 871 (2), 288-298 (2008).
  9. Fiehn, O., et al. Metabolite profiling for plant functional genomics. Nature Biotechnology. 18 (11), 1157-1161 (2000).
  10. vander Kloet, F. M., Bobeldijk, I., Verheij, E. R., Jellema, R. H. Analytical error reduction using single point calibration for accurate and precise metabolomic phenotyping. Journal of Proteome Research. 8 (11), 5132-5141 (2009).
  11. Folch, J., Lees, M., Stanley, G. H. S. A simple method for the isolation and purification of total lipides from animal tissues. Journal of Biological Chemistry. 226 (1), 497-509 (1957).
  12. Fukushima, A., et al. Impact of clock-associated Arabidopsis pseudo-response regulators in metabolic coordination. Proceedings of the National Academy of Sciences of the United States of America. 106 (17), 7251-7256 (2009).
  13. Kerwin, R. E., et al. Network quantitative trait loci mapping of circadian clock outputs identifies metabolic pathway-to-clock linkages in Arabidopsis. The Plant Cell. 23 (2), 471-485 (2011).
  14. Tohge, T., et al. From models to crop species: Caveats and solutions for translational metabolomics. Frontiers in Plant Sciences. 2, 61 (2011).
  15. Salem, M., Bernach, M., Bajdzienko, K., Giavalisco, P. A simple fractionated extraction method for the comprehensive analysis of metabolites, lipids, and proteins from a single sample. Journal of Visualized Experiments:JoVE. (124), e55802 (2017).
  16. Tohge, T., Fernie, A. R. Combining genetic diversity, informatics and metabolomics to facilitate annotation of plant gene function. Nature Protocols. 5 (6), 1210-1227 (2010).
  17. Lisec, J., Schauer, N., Kopka, J., Willmitzer, L., Fernie, A. R. Gas chromatography mass spectrometry-based metabolite profiling in plants. Nature Protocols. 1 (1), 387-396 (2006).
  18. Osorio, S., Do, P. T., Fernie, A. R., Hardy, N. W., Hall, R. D. . Plant Metabolomics: Methods and Protocols. , 101-109 (2012).
  19. De Vos, R. C. H., et al. Untargeted large-scale plant metabolomics using liquid chromatography coupled to mass spectrometry. Nature Protocols. 2 (4), 778-791 (2007).
  20. Perez de Souza, ., Alseekh, L., Naake, S., Fernie, T., A, Mass spectrometry-based untargeted plant metabolomics. Current Protocols in Plant Biology. 4 (4), 20100 (2019).
  21. Pluskal, T., Castillo, S., Villar-Briones, A., Orešič, M. MZmine 2: Modular framework for processing, visualizing, and analyzing mass spectrometry-based molecular profile data. BMC Bioinformatics. 11 (1), 395 (2010).
  22. Watson, J. T., Sparkman, D. O. Electron Ionization. Introduction to mass spectrometry: Instrumentation, applications and strategies for data interpretation. , 315 (2007).
  23. Fernie, A. R., et al. Recommendations for reporting metabolite data. The Plant Cell. 23 (7), 2477 (2011).
  24. Treutler, H., et al. Discovering regulated metabolite families in untargeted metabolomics studies. Analytical Chemistry. 88 (16), 8082-8090 (2016).
  25. Wang, M., et al. Sharing and community curation of mass spectrometry data with Global Natural Products Social Molecular Networking. Nature Biotechnology. 34 (8), 828-837 (2016).
  26. Naake, T., Fernie, A. R. MetNet: Metabolite network prediction from high-resolution mass spectrometry data in R aiding metabolite annotation. Analytical Chemistry. 91 (3), 1768-1772 (2019).
  27. Chambers, J. M. . Statistical models in S. , (1991).
  28. Misra, B. B. Data normalization strategies in metabolomics: Current challenges, approaches, and tools. European Journal of Mass Spectrometry. 26 (3), 165-174 (2020).
  29. Livera, A. M. D., et al. Statistical methods for handling unwanted variation in metabolomics data. Analytical Chemistry. 87 (7), 3606-3615 (2015).
  30. Sakia, R. M. . The Box-Cox transformation technique: a review. 41 (2), 169-178 (1992).
  31. vanden Berg, R. A., Hoefsloot, H. C. J., Westerhuis, J. A., Smilde, A. K., vander Werf, M. J. Centering, scaling, and transformations: improving the biological information content of metabolomics data. BMC Genomics. 7, 142 (2006).
  32. Marees, A. T., et al. A tutorial on conducting genome-wide association studies: Quality control and statistical analysis. International Journal of Methods in Psychiatric Research. 27 (2), 1608 (2018).
  33. Torkamaneh, D., Laroche, J., Bastien, M., Abed, A., Belzile, F. Fast-GBS: a new pipeline for the efficient and highly accurate calling of SNPs from genotyping-by-sequencing data. BMC Bioinformatics. 18 (1), 5 (2017).
  34. Zhao, S., Agafonov, O., Azab, A., Stokowy, T., Hovig, E. Accuracy and efficiency of germline variant calling pipelines for human genome data. Scientific Reports. 10 (1), 20222 (2020).
  35. Bradbury, P. J., et al. TASSEL: software for association mapping of complex traits in diverse samples. Bioinformatics. 23 (19), 2633-2635 (2007).
  36. Bates, D., Mächler, M., Bolker, B., Walker, S. Fitting linear mixed-effects models using lme4. Journal of Statistical Software. 67 (1), (2015).
  37. Yin, L., et al. rMVP: A memory-efficient, visualization-enhanced, and parallel-accelerated tool for genome-wide association study. Genomics, Proteomics & Bioinformatics. , (2021).
  38. Kanai, M., et al. Genetic analysis of quantitative traits in the Japanese population links cell types to complex human diseases. Nature Genetics. 50 (3), 390-400 (2018).
  39. Salem, M. A., et al. An improved extraction method enables the comprehensive analysis of lipids, proteins, metabolites and phytohormones from a single sample of leaf tissue under water-deficit stress. Plant Journal: for Cell and Molecular Biology. 103 (4), 1614-1632 (2020).
  40. Balcke, G. U., et al. Multi-omics of tomato glandular trichomes reveals distinct features of central carbon metabolism supporting high productivity of specialized metabolites. The Plant Cell. 29 (5), 960-983 (2017).
  41. Leonova, T., et al. Does protein glycation impact on the drought-related changes in metabolism and nutritional properties of mature pea (Pisum sativum L.) seeds. International Journal of Molecular Sciences. 21 (2), 567 (2020).
  42. Alfonsi, K., et al. chemistry tools to influence a medicinal chemistry and research chemistry based organisation. Green Chemistry. 10 (1), 31-36 (2008).
  43. Bozek, K., et al. Organization and evolution of brain lipidome revealed by large-scale analysis of human, chimpanzee, macaque, and mouse tissues. Neuron. 85 (4), 695-702 (2015).
  44. Delgado, R., Muñoz, Y., Peña-Cortés, H., Giavalisco, P., Bacigalupo, J. Diacylglycerol activates the light-dependent channel TRP in the photosensitive microvilli of Drosophila melanogaster photoreceptors. The Journal of Neuroscience. 34 (19), 6679 (2014).
  45. Sharma, D. K., et al. UPLC-MS analysis of Chlamydomonas reinhardtii and Scenedesmus obliquus lipid extracts and their possible metabolic roles. Journal of Applied Phycology. 27 (3), 1149-1159 (2015).
  46. Dunn, W. B., Wilson, I. D., Nicholls, A. W., Broadhurst, D. The importance of experimental design and QC samples in large-scale and MS-driven untargeted metabolomic studies of humans. Bioanalysis. 4 (18), 2249-2264 (2012).
  47. Fan, S., et al. Systematic error removal using random forest for normalizing large-scale untargeted lipidomics data. Analytical Chemistry. 91 (5), 3590-3596 (2019).
  48. Larsson, S. J., Lipka, A. E., Buckler, E. S. Lessons from Dwarf8 on the strengths and weaknesses of structured association mapping. PLOS Genetics. 9 (2), 1003246 (2013).
  49. Platt, A., Vilhjálmsson, B. J., Nordborg, M. Conditions under which genome-wide association studies will be positively misleading. Genetics. 186 (3), 1045-1052 (2010).
  50. Nyholt, D. R. A simple correction for multiple testing for single-nucleotide polymorphisms in linkage disequilibrium with each other. American Journal of Human Genetics. 74 (4), 765-769 (2004).
  51. Teo, Y. Y. Common statistical issues in genome-wide association studies: a review on power, data quality control, genotype calling and population structure. Current Opinion in Lipidology. 19 (2), 133-143 (2008).
  52. Privé, F., Aschard, H., Ziyatdinov, A., Blum, M. G. B. Efficient analysis of large-scale genome-wide data with two R packages: bigstatsr and bigsnpr. Bioinformatics. 34 (16), 2781-2787 (2018).
  53. Alseekh, S., et al. Domestication of crop metabolomes: desired and unintended consequences. Trends in Plant Science. 26 (6), 650-661 (2021).
  54. Yano, K., et al. GWAS with principal component analysis identifies a gene comprehensively controlling rice architecture. Proceedings of the National Academy of Sciences of the United States of America. 116 (42), 21262 (2019).
  55. Wu, S., et al. Mapping the Arabidopsis metabolic landscape by untargeted metabolomics at different environmental conditions. Molecular Plant. 11 (1), 118-134 (2018).
  56. Ye, J., et al. An InDel in the promoter of Al-ACTIVATED MALATE TRANSPORTER9 selected during tomato domestication determines fruit malate contents and aluminum tolerance. The Plant Cell. 29 (9), 2249-2268 (2017).
  57. Zhang, W., et al. Genome assembly of wild tea tree DASZ reveals pedigree and selection history of tea varieties. Nature Communications. 11 (1), 3719 (2020).
  58. Tohge, T., Fernie, A. R. Annotation of plant gene function via combined genomics, metabolomics and informatics. Journal of Visualized Experiments: JoVE. (64), e3487 (2012).

Play Video

Cite This Article
Bulut, M., Fernie, A. R., Alseekh, S. Large-Scale Multi-Omics Genome-Wide Association Studies (Mo-GWAS): Guidelines for Sample Preparation and Normalization. J. Vis. Exp. (173), e62732, doi:10.3791/62732 (2021).

View Video