Summary

מחקרי אסוציאציה רב-גנומית בקנה מידה גדול (Mo-GWAS): קווים מנחים להכנת דגימות ונורמליזציה

Published: July 27, 2021
doi:

Summary

בפרוטוקול זה אנו מציגים זרימת עבודה ממוטבת, המשלבת הכנת דגימות יעילה ומהירה של דגימות רבות. בנוסף, אנו מספקים מדריך שלב אחר שלב להפחתת וריאציות אנליטיות להערכת תפוקה גבוהה של מחקרי GWAS מטבוליים.

Abstract

הן ספקטרומטריית כרומטומטריית מסה-כרומטוגרפיית גז (GC-MS) והן ספקטרומטריית מסה-כרומטוגרפיה נוזלית (LC-MS) הן גישות מטבוליות הנמצאות בשימוש נרחב כדי לזהות ולכמת מאות אלפי תכונות מטבוליט. עם זאת, היישום של טכניקות אלה על מספר רב של דגימות נתון לאינטראקציות מורכבות יותר, במיוחד עבור מחקרי אסוציאציה כלל-גנומיים (GWAS). פרוטוקול זה מתאר זרימת עבודה מטבולית אופטימלית, המשלבת הכנת דגימות יעילה ומהירה עם ניתוח של מספר רב של דגימות עבור מיני יבול קטניות. שיטת מיצוי שונה במקצת זו פותחה בתחילה לניתוח רקמות צמחים ובעלי חיים ומבוססת על מיצוי באתר מתיל טרט-בוטיל: ממס מתנול כדי לאפשר לכידה של מטבוליטים קוטביים ושומנים. בנוסף, אנו מספקים מדריך שלב אחר שלב להפחתת וריאציות אנליטיות, החיוניות להערכת התפוקה הגבוהה של שונות מטבולית ב- GWAS.

Introduction

גישות “אומיקה” בקנה מידה גדול אפשרו ניתוח של מערכות ביולוגיות מורכבות 1,2,3 והבנה נוספת של הקשר בין גנוטיפים לבין הפנוטיפים שהתקבלו4. מטבוליקה באמצעות ספקטרומטריית מסה כרומטוגרפית נוזלית בעלת ביצועים גבוהים במיוחד (UHPLC-MS) ו- GC-MS אפשרה זיהוי של שפע של תכונות מטבוליט, שרק חלקן מבוארות במידה מסוימת, וכתוצאה מכך שיעור גבוה של מטבוליטים לא ידועים. ניתן לחקור אינטראקציות מורכבות על ידי שילוב של מטבוליקה בקנה מידה גדול עם השונות הגנוטיפית הבסיסית של אוכלוסייה מגוונת5. עם זאת, טיפול בערכות מדגמים גדולות קשור מטבעו לווריאציות אנליטיות, המעוותות את ההערכה של שונות מטבולית לתהליכים נוספים במורד הזרם. באופן ספציפי, בעיות מרכזיות המובילות לווריאציות אנליטיות מבוססות על ביצועי מכונה וסחף אינסטרומנטלי לאורך זמן6. השילוב של שונות בין אצווה לאצווה הוא מאתגר ובעייתי במיוחד כאשר מנתחים אוכלוסיות צמחים מובנות בקנה מידה גדול. הליכי נורמליזציה מרובים הוצעו כדי לתקן עבור וריאציות לא ביולוגיות, למשל, שימוש בתקנים פנימיים, חיצוניים ובעלי תווית איזוטופית כדי לתקן שגיאות אנליטיות, שכל אחת מהן קשורה מטבעה לבעיות ידועות ולמלכודות 7,8,9,10.

בנוסף לשונות אנליטית, הבחירה בפרוטוקולי חילוץ משתנה בדרך כלל בהתאם לשיטה האנליטית. בסופו של דבר, הוא רוצה להפחית את עלויות החומר והעבודה, כמו גם את הצורך להשתמש במספר aliquots של אותו מדגם עבור תהליכים אנליטיים שונים על ידי ביצוע שיטות מיצוי מבוססות הפרדת פאזה. שיטות אלה הוצגו לראשונה באמצעות כלורופורם: ממיסי מתנול/מים כדי לפצל תרכובות קוטביות והידרופוביות11.

פרוטוקול זה מתאר צינור מהיר בעל תפוקה גבוהה עבור פלטפורמה מרובת אומיקות כדי ליצור פרופיל הן של מטבוליטים קוטביים והן של שומנים במינים של קטניות. יתר על כן, הוא מראה כיצד ניתן לתקן את מערכי הנתונים הללו כראוי לשונות אנליטית ולנרמל אותם לפני שילוב מידע גנוטיפי כדי לזהות מוקדי תכונות כמותיות מטבוליטים (QTL) על ידי ביצוע GWAS.

Protocol

1. תכנון ניסיוני וטיפוח צמחים הערה: הגדרת הניסוי בהתאם להשערה הניסויית, למשל, שימוש באוכלוסיית GWAS בקנה מידה גדול מקטין את הצורך בשכפולים מרובים, שכן בדיקות סטטיסטיות יבוצעו על סמך ההפלוטיפים של כל ה- SNPs הבודדים במקום ההצטרפות. לעומת זאת, שכפולים מרובים הם הכרחיים בגישות ניסיוניות אחרות. יש לקחת בחשבון את הנקודות הבאות בעת הכנת הניסוי. כלול מספיק שכפולים ביולוגיים, בהתאם להשערה הניסויית. הפוך את השכפולים הביולוגיים באופן אקראי מבחינת בלוקים כדי להפחית את ההטיה הסביבתית המקומית במהלך הטיפוח, למשל, חממה, שדה. להבטיח תחזוקה נכונה של הצמח במהלך הצמיחה. טפל בצמחים באופן הומוגני כדי להפחית את ההטיה. 2. הכנת חומר צמחי ביולוגי הכנת קציר צינורות קציר תוויות (20 מ”ל) המכילים שני חרוזי מתכת בקוטר 5 מ”מ ושני חרוזי מתכת בקוטר 8 מ”מ להומוגניזציה. מלאו דיואר בחנקן נוזלי.הערה: הצמחים צריכים להיות בשלב הווגטטיבי לקצירת עלים ורקמות שורש טריים. קציר דגימות ביולוגיות על ידי הקפאת הבזק בחנקן נוזלי. לקצור מהר ככל האפשר כדי למנוע את ההשפעה של תנודה צירקדיאנית על חילוף החומרים במהלך משכי קציר ממושכים12,13. אחסנו את העלים הטריים שנקטפו ואת רקמות השורש לעיבוד נוסף בטמפרטורה של -80 מעלות צלזיוס.הערה: חיתוך עלים להקפאת הבזק לא אמור להימשך יותר מכמה שניות, שכן לאחר ביקוע העלים, תהליכים ביולוגיים פעילים ישנו את הפרופילים המטבוליים עקב פציעה. עבור שורשים, נקה מראש את השורשים על ידי שטיפה במים לפני הקפאת הבזק בחנקן נוזלי. עודפי מים על פני השורש צריכים להיות ספוגים ברקמת נייר. זרעים יבשים ניתן לאחסן בטמפרטורת החדר; אין צורך בהקפאה בחנקן נוזלי. לטחון את הרקמה באמצעות טחנת מערבל רקמות. Precool את מחזיקי הצינורות בחנקן נוזלי במשך כמה דקות כדי לשמור על טמפרטורה נמוכה בעת שחיקת הרקמה. העבירו את הדגימות הביולוגיות בדואר המכיל חנקן לאחר הוצאתן מהמקפיא בטמפרטורה של 80 מעלות צלזיוס. לטחון את הרקמות כדי לקבל אבקה הומוגנית; השתמש ב-25 הרץ למשך דקה אחת וחזור על הפעולה לאחר הקפאה בחנקן נוזלי אם הרקמה אינה טחונה באופן הומוגני. לטחינת זרעים מיובשים, מניחים את הזרעים בצנצנת טחינה עם חרוז מתכת בקוטר 15 מ”מ. השתמש באותו תדר וזמן כפי שצוין ב- 2.3.3.הערה: ניתן להשתמש בטיט ומזיקים נקיים ומעודנים מראש אם טחנת מערבל רקמות אינה זמינה. Precool מסומן 2 מ”ל צינורות microcentrifuge מנעול בטוח. שקלו 50 מ”ג עם שגיאה של ±5 מ”ג של חומר צמחי טרי באמצעות סולם אנליטי. Precool את הכלים המשמשים להעברת חומר צמחי בחנקן נוזלי. יש לוודא שהחומר הצמחי נשאר קפוא במהלך תהליך השקילה.הערה: אל תחשוף חומר צמחי טרי זמן רב מדי לטמפרטורת החדר מכיוון שתהליכים ביולוגיים מופעלים על ידי עליית הטמפרטורה, תוך שינוי פרופילים מטבוליים14. הפק דגימות נוספות של בקרת איכות (QC) על ידי איגום חלק מהדגימה ומשקל של 50 מ”ג עם שגיאה של ±5 מ”ג של חומר צמחי טרי מרוכז לתוך צינורות מיקרו-סנטריפוג’ עם נעילה בטוחה של 2 מ”ל.הערה: לפחות שלוש דגימות QC מומלצות לכל 60 דגימות. דגימות ה-QC חיוניות לתיקון, לנורמליזציה ולניתוח במורד הזרם. 3. ריאגנטים לחילוץ רקמה טרייה, למשל, עלים ושורשיםהערה: חילוץ לדוגמה מבוסס על פרוטוקול15 שתואר קודם לכן. פרוטוקול זה שונה בהתאם לצרכים הנוכחיים, למשל, רקמות מרובות, סטנדרטים פנימיים שונים וניסויים בקנה מידה גדול. בנוסף, כל הכרכים והגדרות המכשירים המוזכרים להלן מותאמים ליחידות אנליטיות פנימיות. משתמשי הפרוטוקול צריכים להתאים אותם בהתאם ליחידה האנליטית ולדגימות הביולוגיות שלהם, בהתבסס על דגימות בדיקה. תערובת מיצוי 1 (EM1): אתר מתיל טרט-בוטיל (MTBE)/מתנול (MeOH) (3:1 v/v) הכינו תערובת של MTBE/MeOH ביחס של 3:1. עבור 100 מ”ל של ממס מיצוי, יש לערבב 75 מ”ל של MTBE עם 25 מ”ל של MeOH בבקבוק זכוכית נקי.הערה: יש לטפל בזהירות בממסים במכסה האדים עם ציוד בטיחות מתאים. הוסף 45 μL של 1,2-diheptadecanoyl-sn-glycero-3-phosphocholine (1 מ”ג/מ”ל בכלורופורם) כתקן פנימי לניתוח שומנים מבוססי UHPLC-MS, 400 μL של ריביטול (1 מ”ג/מ”ל במים) כסטנדרט פנימי לניתוח מבוסס GC-MS, ו-125 μL של איזוביטקסין (1 מ”ג/מ”ל ב-MeOH/water (1:1 v/v)) עבור ניתוח מטבוליט מבוסס UHPLC-MS.הערה: הוספת תקנים פנימיים נחוצה לנורמליזציה שלאחר הניתוח בהתאם לצרכים אנליטיים. מכיוון שיש צורך ב-1 מ”ל של EM1 עבור כל דגימה, הכינו תמיסת מלאי בהתאם לגודל המדגם הניסיוני, שיש להשתמש בו לכל הניסוי. יש לאחסן את EM1 בטמפרטורה של -20 מעלות צלזיוס. בדוק את היעדר התקן הפנימי המשמש וחפיפה עם תרכובות אחרות במינים הנחקרים. ניתן להשתמש במספר תקנים; בחירת התקנים הפנימיים בפרוטוקול זה התבססה על בדיקות קודמות באמצעות תמציות שעועית נפוצות16. תערובת מיצוי 2 (EM2) מים/ מתנול (MeOH) (3:1 v/v) לקבלת 100 מ”ל EM2, הוסף 75 מ”ל של מים מזוקקים כפולים ו-25 מ”ל של MeOH בבקבוק זכוכית נקי. הוסף 500 μL של EM2 לכל דגימה, והכן תמיסת מלאי בהתאם לגודל המדגם הניסיוני, אשר אמור לשמש לניסוי כולו. אחסן EM2 ב 4 °C (74 °F). זרעים יבשים תערובת מיצוי 3 (EM3) מתנול (MeOH)/ מים (7:3 v/v) לקבלת 100 מ”ל של EM3, הוסף 70 מ”ל של MeOH ו-30 מ”ל של מים מזוקקים כפולים בבקבוק זכוכית נקי. הכן 1 מ”ל של EM3 עבור כל דגימה. הוסיפו 400 μL של ריביטול (1 מ”ג/מ”ל במים) כתקנים פנימיים לניתוח מבוסס GC-MS ו-125 μL של איזוביטקסין (1 מ”ג/מ”ל ב-MeOH/מים (1:1 v/v)) עבור ניתוח מטבוליטים מבוסס UHPLC-MS.הערה: הכינו תמיסת מלאי בהתאם לגודל המדגם הניסיוני והשתמשו בה לניסוי כולו. אחסן EM3 בטמפרטורה של 4 מעלות צלזיוס. 4. מיצוי לדוגמה רקמה טרייה, למשל, עלים ושורשים הכינו שלושה צינורות מיקרו-סנטריפוג’ עם נעילה בטוחה של 1.5 מ”ל עבור כל דגימה. שמור את EM1 במערכת קירור נוזלית של -20 מעלות צלזיוס. העבר את הדגימות הטריות מהמקפיא בטמפרטורה של -80 מעלות צלזיוס לקרח יבש או לחנקן נוזלי להובלה. הוסיפו 1 מ”ל של EM1 מקדים לכל 50 מ”ג אליקוט ומערבולת לזמן קצר לפני שתמשיכו לקרח. דגירה של הדגימות על שייקר מסלולי ב-800 × גרם למשך 10 דקות בטמפרטורה של 4 מעלות צלזיוס. סניק את הדגימות באמבט סוניציה מקורר קרח למשך 10 דקות. הוסף 500 μL של EM2 באמצעות פיפטה רב-ערוצית כדי למנוע שונות בנפחים שנוספו. מערבולת את הדגימות לזמן קצר כדי לערבב את תערובות המיצוי לפני צנטריפוגה ב 11,200 × גרם במשך 5 דקות ב 4 °C (64 °F). לאחר הפרדת פאזה מתרחשת, העבר 500 μL של הפאזה המכילה שומנים עליונים לצינור מיקרו-סנטריפוג’ עם נעילה בטוחה של 1.5 מ”ל עם תווית מוקדמת. הסר את שאר הפאזה העליונה.הערה: היזהר בעת העברה מכיוון שלפאזה עליונה זו יש לחץ אדים גבוה ונוטה לדלוף החוצה מהפיפטה. העברת 150 μL ו- 300 μL של הפאזות המכילות מטבוליט בקוטב התחתון ובקוטב למחצה בשני צינורות מיקרו-סנטריפוג’ עם נעילה בטוחה של 1.5 מ”ל המשמשים לניתוח GC-MS ו- UHPLC-MS, בהתאמה. מרכזים את כל השברים המופקים על ידי מתן אפשרות לממסים להתאדות ללא חימום באמצעות רכז ואקום ולאחסן בטמפרטורה של -80 מעלות צלזיוס. זרעים יבשים הכינו שני צינורות מיקרו-סנטריפוג עם נעילה בטוחה של 1.5 מ”ל עבור כל דגימה. שמור את EM3 על קרח. מניחים חרוז מתכת בקוטר 5 מ”מ באליקוטים לדוגמה. מוסיפים 1 מ”ל של EM3 בכל 50 מ”ג aliquot והומוגניזציה של הדגימות ב-25 הרץ למשך 2-3 דקות לפני שאתם שמים אותן על הקרח. סניק את הדגימות באמבט סוניציה מקורר קרח למשך 10 דקות. מערבולת הדגימות זמן קצר לפני צנטריפוגה ב 11,200 × גרם במשך 5 דקות ב 4 °C (64 °F). העבר 150 μL ו- 300 μL של הסופרנטנט בשני צינורות מיקרו-צנטריפוגה עם נעילה בטוחה של 1.5 מ”ל המשמשים לניתוח GC-MS ו- UHPLC-MS, בהתאמה. רכזו את כל השברים שחולצו על ידי מתן אפשרות לממסים להתאדות ללא חימום באמצעות רכז ואקום ולאחסן בטמפרטורה של -80 מעלות צלזיוס.הערה: בהתבסס על ניסיון, מומלץ למשתמשים לבצע שלב 4.2 עבור מטבוליטים קוטביים למחצה וניתוח מטבוליטים נגזרים בזרעים יבשים. בצע שלב מיצוי 4.1 לניתוח שומנים בזרעים יבשים. 5. ניתוח שומנים באמצעות UHPLC-MS השעיה מחדש את שברי השומנים המיובשים ב-250 μL של אצטוניטריל:2-פרופנול (7:3, vol/vol). Sonicate את שלב השומנים במשך 5 דקות, צנטריפוגה ב 11,200 × g למשך דקה אחת. העבר 90 μL של הסופרנאטנט לבקבוקון זכוכית עבור LC-MS. הזריקו 2 μL של התמציות לתוך LC-MS. בצעו פיצול שומנים בעמודה C 8 בעלת פאזההפוכה המוחזקת ב-60 מעלות צלזיוס בריצה עם זרימה של 400 μL/min עם שינויים הדרגתיים של A ו-B, כפי שמוצג בטבלה 1. רכוש את ספקטרום המסה במצב יינון חיובי עם טווח מסה של 150-1,500 m/z. כלול מספר דגימות QC בכל האצוות היומיות וריק כדי להבטיח תיקון לשונות אנליטית. ערוך אקראי של דגימות מבחינת בלוקים בסדר רציף. 6. ניתוח מטבוליטים קוטביים וחצי קוטביים באמצעות UHPLC-MS השעיה מחדש את שלב הקוטב המיובש ב-180 מיקרול’ של מתנול ברמת UHPLC: מים (1:1 v/v). Sonicate את שלב הקוטב במשך 2 דקות, צנטריפוגה ב 11,200 × g במשך דקה אחת. העבר 90 μL של הסופרנאטנט לבקבוקון זכוכית עבור LC-MS. להזריק 3 μL של התמציות לתוך LC-MS. בצע פיצול מטבוליט בעמודה פאזה הפוכה C18 המוחזקת ב- 40 °C בריצה עם זרימה של 400 μL/min עם שינויים הדרגתיים של eluent A ו- B כפי שמוצג בטבלה 1. רכוש את ספקטרום המסה בטווח מסה של 100-1,500 m/z בסריקת MS מלאה ואת כל פיצול היונים (AIF) המושרה על ידי דיסוציאציה התנגשות באנרגיה גבוהה (HCD) של 40 keV.הערה: השתמש בשני מצבי היינון. עם זאת, בשל קיבולת מוגבלת בעת הפעלת מספר רב של דגימות, הפעל דגימות בדיקה בשני מצבי היינון כדי לקבוע את מצב היינון המועדף. כלול מספר דגימות QC בכל האצוות היומיות וריק כדי להבטיח תיקון לשונות אנליטית. ערוך אקראי של דגימות מבחינת בלוקים בסדר רציף. הפעל QC מרוכז ב- MS2 תלוי נתונים במצבי יינון שליליים וחיוביים כאחד. השתמש בספקטרום המסה המתקבל בשלב מאוחר יותר (8.5) לביאור. 7. ניתוח מטבוליטים נגזרים באמצעות GC-MS17,18 הערה: הניתוח של מטבוליטים נגזרים מבוסס על פרוטוקול17 שתואר קודם לכן. טפל בכל ריאגנטים נגזרים במכסה האדים. ודא ש-N-מתיל-N-(טרימתיל-סיליל)טריפלואורצטמיד (MSTFA) אינו בא במגע עם מים ולחות. מגיב נגזרת 1 (DR1) ממיסים מתוקסיאמין הידרוכלוריד בפירידין כדי להשיג ריכוז של 30 מ”ג/מ”ל של DR1. השתמש ב- 40 μL של DR1 עבור כל דגימה. הכינו תמיסת מלאי בהתאם לגודל המדגם, ואחסנו בטמפרטורת החדר. מגיב נגזרת 2 (DR2) להמיס MSTFA עם 20 μL של חומצת שומן אסטרים מתיל (FAMEs) לכל 1 מ”ל של MSTFA. השתמש ב- 70 μL של DR2 עבור כל דגימה. הכן פתרון מלאי בהתאם לגודל המדגם. אחסן את MSTFA בטמפרטורה של 4 °C ואת FAMEs בטמפרטורה של -20 °C (75 °F).הערה: FAMEs כוללים מתילקפריל-קפרילט, מתיל פלרגונאט, מתילקפרט, מתיל-לוראט, מתילמיריסטאט, מתיל-פלמיטאט, מתיל-סטארט, מתילי-קוסנואט, מתילדוקוסנואט, מתיל-קרוסנואט, חומצה לינינוצרית מתיל-אסטר, מתיל-הקסקוסנואט, מתיל-טקקוסנואט וחומצה טריאקונטנואית מתילסטר, אשר מומסים ב-CHCl3 בריכוז של 0.8 μL/mL או 0.4 מ”ג/מ”ל לתקנים נוזליים או מוצקים, בהתאמה. ייבשו מחדש את הכדור משלב הקוטב (המאוחסן בטמפרטורה של -80 מעלות צלזיוס) באמצעות מרכז ואקום למשך 30 דקות כדי למנוע כל הפרעה של H2O שמקורה במהלך האחסון עם הממסים המשמשים לנגזרת במורד הזרם. הוסף 40 μL של DR1. לנער את הדגימות ב 950 × גרם במשך 2 שעות ב 37 °C באמצעות שייקר מסלול, ואחריו ספין-דאון קצר של הנוזל. הוסף 70 μL של DR2. יש לנער שוב ב-950 × גרם למשך 30 דקות בטמפרטורה של 37 מעלות צלזיוס באמצעות שייקר מסלולי. צנטריפוגה לזמן קצר בטמפרטורת החדר לפני העברת 90 μL לבקבוקוני זכוכית לניתוח GC-MS. הזריקו 1 μL למצב GC-MS מפוצל, בהתאם לריכוזי המטבוליטים, עם זרימת גז קבועה של נשא הליום של 2 מ”ל לדקה. טמפרטורת ההזרקה מוגדרת ל-230 מעלות צלזיוס באמצעות עמודת נימים MDN-35 באורך 30 מ’.הערה: מידע נוסף, לדוגמה, שיפוע טמפרטורה, ניתן למצוא בטבלה 1. טווח המסה מוגדר ל-70-600 מ”ק/z עם 20 סריקות לדקה. כלול מצבי פיצול כדי לאפשר כימות של תרכובות עומס יתר פוטטיביות, חיסכון בעלויות וזמן לנגזרת מחדש של תמצית במקרים כאלה. כלול מספר דגימות QC בכל האצוות היומיות וריק כדי להבטיח תיקון לשונות אנליטית. הפוך דגימות לאקראיות כראוי מבחינת חסימות בסדר רציף. 8. עיבוד כרומטוגרמה וביאור מורכב סנן רעש כימי על ידי הגדרת ספי העוצמה. כלול את כל דגימות ה- QC בעת עיבוד הכרומטוגרמות.הערה: עבור נתונים בקנה מידה גדול, סינון רעשים הוא חיוני כדי להפחית את זמן המחשוב ואת כוח העיבוד. יישר את הכרומטוגרמות על-ידי הגדרת חלון הזזת זמן שמירה. בדוק את הכרומטוגרמות מכל אצווה כדי להעריך את השונות התוך-אצווה והבין-אצווה. בצע זיהוי שיא בהתאם לצורת השיא, לדוגמה, גובה ורוחב עבור רוחב מלא בחישובים של חצי מקסימום (FWHM). איזוטופים של צבירת כדי להפחית אותות יתירים ולסנן סינגלטונים.הערה: עיין בטבלת החומרים לקבלת פרטים על תוכנה המשמשת לעיבוד כרומטוגרמה. פרוטוקולים מעמיקים כיצד לעבד כרומטוגרמות באמצעות כלי תוכנה שונים הזמינים באופן חופשי, למשל, MS-DIAL, MetAlign, MzMine ו- Xcalibur 19,20,21, מסופקים. השתמש בנתוני ddMS2 של דגימת QC מרוכזת לביאור מורכב. הערך את המבנה המולקולרי על-ידי קביעת המסה המונואיזוטופית והתבוננות בהפסדים ניטרליים נפוצים, אגליקונים טעונים ידועים וסוגים שונים של מחשוף, למשל, הומוליטיים או הטרוליטיים16,22. לדיווח על נתוני מטבוליטים, עקוב אחר ההמלצה המתוארת ב- Fernie et al. 201123.הערה: ניתן להשתמש בגישות מטבוליות חישוביות שונות כדי לנתח נתוני מטבוליקה 24,25,26. 9. נורמליזציה של מערך נתונים רחב היקף של מטבוליקה בדוק את התפלגות התקנים הפנימיים ונרמל על-ידי תיקון לתגובה של תקנים פנימיים בודדים או מרובים. תקן את עוצמות השיא המתקבלות מהכרומטוגרמה על פני משקל הדגימה המדויק על ידי חלוקת עוצמות השיא במשקל הדגימה ההומוגנית האליקוטית משלב 2.5. נכון להיסחף בעוצמה על פני סדרות מרובות אצווה. בצע שיטות תיקון מבוססות QC כגון החלקת פיזור משוערת מקומית (LOESS)27 באמצעות R.הערה: מספר כלים וחבילות זמינים כדי לטפל בסחף של ביצועי MS במהלך רכישת כל האצוות28,29. הבטח התפלגות נורמלית של תכונות על ידי המרת נתונים, לדוגמה, טרנספורמציית Box-Cox30 באמצעות פונקציית boxcox () מחבילת R MASS לביצוע GWAS. בצע שינוי קנה מידה של נתונים, לדוגמה, קנה מידה של Pareto, עבור ניתוח רב משתני כדי להבטיח שקילה נכונה של תרכובות בעלות שפע נמוך31.הערה: במידת האפשר, בצע בדיקת שחזור כדי למנוע השפעות מטריצה, למשל, דיכוי יונים14. 10. מחקרי אסוציאציה כלל-גנומית (GWAS)32 קרא פולימורפיזם נוקלאוטיד יחיד (SNP) או וריאנטים מבניים (SV) מנתוני הריצוף33,34. סנן נתונים גנוטיפיים עבור תדר אלל מינורי (MAF) 10% כדי למנוע הטיה בתדר נמוך באמצעות Tassel35. חשב את התחזיות הבלתי משוחדות הליניאריות הטובות ביותר (BLUPs) עבור כל תכונה מנורמלת על פני החזרות הניסיוניות כדי למנוע הטיה שמקורה בגורמים סביבתיים (אפקטים אקראיים) באמצעות חבילת R Ime436. השתמש ב- BLUPs של כל תכונה בנפרד כדי לבצע GWAS באמצעות חבילת rMVP ב- R37.הערה: כל תכונת מטבוליקה נתפסת כאן כפנוטיפ עצמאי אינדיבידואלי. בעת ביצוע GWAS, נכון עבור מבנה האוכלוסייה באמצעות ניתוח רכיבים עיקריים (PCA) וזהות לפי מדינה (IBS) או vanRaden כדי למזער את ההשפעות המבלבלות. יתר על כן, שקול להשתמש במודל ליניארי מעורב (MLM) או במודל מעורב מרובה לוקוסים (MLMM), מכיוון שמודלים מעורבים מכילים אפקטים קבועים ואקראיים. 11. זיהוי QTL בדוק את ה- SNPs המציגים קשר משמעותי, תוך התחשבות בחלקות מנהטן, עבור חישובי אי-שיווי משקל הצמדה (LD) כדי לקבוע את האזור הגנטי הבסיסי. בצע חישובי LD באמצעות מפת החום LD של חבילת R או ציצית 5. בדוק את ה- SNPs הקשורים לגבי גודל ההשפעה על התכונה על-ידי בחינת רמות התכונות לשינויים סטטיסטיים בין ההפלוטיפים כדי למצוא SNPs סיבתיים פוטנציאליים, למשל, SNPs המובילים לשינוי בחומצות אמינו ברצף קידוד החלבונים, מה שיכול להסביר את השונות הפנוטיפית.הערה: מכיוון שקשרים של תכונות NP Sאינם מניבים בהכרח קשר סיבתי, חיוני לקבוע את האזור הגנומי. זהות מורכבת על ידי ביאור תכונה יכולה לעזור מאוד במציאת הגנים המועמדים הנכונים באזור גנומי מסוים. אנו מציעים לשלב את כל ה-QTL שזוהה הקשור לתרכובות מסוימות במפה פליאוטרופית כדי להדגיש את האזורים הגנטיים38, כפי שמוצג באיור 4. לצורך אימות של גנים מועמדים, ניתן לבצע מספר גישות (ראו דיון).

Representative Results

ניסויי GWAS מוצלחים במטבולומיקה צריכים להתחיל בתכנון ניסויי נכון, ולאחר מכן באיסוף דגימות, חילוץ, איסוף נתונים ועיבודם, כפי שמודגם באיור 1. בפרוטוקול זה, שיטת MTBE15 שימשה לחילוץ וניתוח של מאות מטבוליטים השייכים למספר מחלקות מורכבות. הכרומטוגרפיה תלויה מאוד בתכונות של העמודה המנוצלת, כמו גם בתערובות של מאגרי אלוטיון. איור 2 מראה כרומטוגרמות של דגימות QC, מה שמצביע על דפוס האלוטציה של כמה מחלקות ליפידים עיקריות במערכת אנליטית זו. מעברי הצבע החלים עבור כל פלטפורמה מופיעים בטבלה 1. דגש רב הושם על טיפול בטעויות מערכתיות בניסויים רחבי היקף. ביצוע מטבוליזם בקנה מידה גדול קשור מטבעו לשגיאות מערכתיות. לצורך הדגמה, ניתחנו נתונים ליפידומיים על פני כמה מיני שעועית נפוצים. טבלה משלימה 1 מספקת את הנתונים הליפידומיים הגולמיים שחולצו לאחר עיבוד הכרומטוגרמה באמצעות התוכנה המצוינת בטבלת החומרים. בעקבות פרוטוקול זה אפשרה לנו לעקוף בעיות מרכזיות בהתמודדות עם נתוני omics, במיוחד תוך טיפול בערכות דגימה גדולות. הליך הנורמליזציה מניב תיקון מדויק של שגיאות אנליטיות מבחינת אצווה, כפי שהודגם באיור 3. למרות שהגדלת מספר דגימות ה- QC תגדיל את עוצמת הנורמליזציה, זה לא תמיד אפשרי בשל אילוצי עלות וזמן. עבור מטבוליקה בתפוקה גבוהה GWAS עם תכונות מטבוליות לא ממוקדות, חיוני להמחיש מספר גבוה יותר של קשר בין סמן תכונות כראוי. מפה פליאוטרופית38 המשלבת תוצאות GWAS מרובות יכולה לשמש כדי להדגיש את האזורים הגנומיים שאליהם מקושרות מספר תכונות (איור 4). איור 1: תרשים זרימה של GWAS מבוסס מטבוליקה בצמחים. מספר שלבים החל מתכנון הניסוי ועד לזיהוי QTL מוצגים בלוח השמאלי. בחלונית הימנית, מוצגים איורים מרובים התומכים במספר שלבים המוזכרים בחלונית השמאלית. החל מהחלק העליון הימני, (1) מוצג רצף מוצע של דגימות עבור LC-MS, (2) חלקות ניקוד לפני ואחרי מנורמל של PCA, כולל התפלגות תכונה מייצגת לפני ואחרי עיבוד, עם אדום המציין את עוצמות דגימת QC, ו-(3) מגרש במנהטן עם אסוציאציות משמעותיות שאליהן נוצרו התפלגויות LD והפלוטיפ. קיצורים: GWAS = מחקרי אסוציאציה כלל-גנומיים; QTL = תכונה כמותית loci; PCA = ניתוח רכיבים עיקריים; QC = בקרת איכות; LD = אי-שיווי משקל קישור; MS = ספקטרומטריית מסות; LC-MS = כרומטוגרפיה נוזלית-ספקטרומטריית מסה; GC-MS = כרומטוגרפיית גז-ספקטרומטריית מסה; LOESS = החלקת פיזור משוערת מקומית; MLM/MLMM = מודל ליניארי מעורב/מודל מעורב מרובה לוקוסים. אנא לחץ כאן כדי להציג גרסה גדולה יותר של נתון זה. איור 2: עיבוד כרומטוגרמה. שתי כרומטוגרמות QC (שיא בסיס; נתוני שומנים) מאצוות שונות מדגימות את השונות מבחינת האצווה עבור מחלקות שומנים מסוימות בדגימות QC המאוגדות. ארבעה סוגי שומנים עיקריים מסומנים עם חלונות האלוטיון המתאימים שלהם במערכת LC-MS הפנימית. הכרומטוגרמות יוצאו מ-MzMine21. קיצורים: QC = בקרת איכות; LC-MS = כרומטוגרפיה נוזלית-ספקטרומטריית מסה. אנא לחץ כאן כדי להציג גרסה גדולה יותר של נתון זה. איור 3: תיקון טעות שיטתית. ניתוח רכיבים עיקריים של נתונים ליפידומיים נרכשים, טרום- (שמאל, נתונים גולמיים) ולאחר תיקון עבור שגיאות מערכתיות (מימין, אצווה loess). הלוחות התחתונים ממחישים את התפלגות התכונה (Cluster_00005) על פני הדגימות (n=650) והאצוות (n=10) לפני התיקון (משמאל) ולאחר (ימין) לצורך וריאציה אנליטית. קיצורים: PCA = ניתוח רכיבים עיקריים; QC = בקרת איכות; LOESS = החלקת פיזור משוערת מקומית. אנא לחץ כאן כדי להציג גרסה גדולה יותר של נתון זה. איור 4: מפה פליאוטרופית הממחישה את התוצאות המשולבות של GWAS. המפה הפליאוטרופית מדגישה אזורים בגנום כולו הקשורים למספר תכונות. המספרים בטבעות החיצוניות מציינים את הכרומוזומים המתאימים. כל עיגול מייצג תכונה אינדיבידואלית עם ה- SNPs הקשורים אליה באופן משמעותי. הצבעים מייצגים מחלקות מורכבות שונות (אפור = מחלקה מורכבת 1; ירוק = מחלקה מורכבת 2; סגול = תרכובת מחלקה 3; צהוב = מחלקה מורכבת 4). במקרה של אסוציאציות בין-מורכבות עם אותו אזור גנומי, מודגשים גנים. העיגול האפור הפנימי מציג את סכום כל ה- SNPs המשמעותיים הקשורים למיקום גנומי מסוים. האסוציאציות המוצגות באיור זה נוצרות באופן מלאכותי רק להמחשה. קיצורים: GWAS = מחקרי אסוציאציה כלל-גנומיים; SNPs = פולימורפיזמים של נוקלאוטידים בודדים. אנא לחץ כאן כדי להציג גרסה גדולה יותר של נתון זה. הגדרות UHPLC-MS עבור שומנים זמן [מינימום] Eluent A עד B [%]* מידע 0 – 1.00 45% א Eluent A: 1% 1M NH4-אצטט, 0.1% חומצה אצטית במים (ציון UHPLC) 1.00 – 4.00 lg 45% – 25% A Eluent B: 1% 1M NH4-אצטט, 0.1% חומצה אצטית באצטוניטריל/2-פרופנול 7:3 (ציון UHPLC) 4.00 – 12.00 lg 25% – 11% A קצב זרימה: 400 μL/min 12.00 – 15.00 lg 11% – 0% A נפח הזרקה: 2 μL 15.00 – 19.50 cw 0% A 19.50-19.51 0% – 45% א 19.51-24.00 eq 45% הגדרות UHPLC-MS/MS עבור מטבוליטים קוטביים וחצי-קוטביים זמן [מינימום] Eluent A ו-B [%]* מידע 0 – 1.00 99% א Eluent A: 0.1% חומצה פורמית במים (ציון UHPLC) 1.00 – 11.00 lg 99% -60% A Eluent B: 0.1% חומצה פורמית באצטוניטריל (ציון UHPLC) 11.00 – 13.00 lg 60% – 30% A קצב זרימה: 400 μL/min 13.00 – 15.00 lg 30% – 1% A נפח הזרקה: 3 μL 15.00 – 16.00 cw 1% A 16.00 – 17.00 lg 1% – 99% A 17.00 – 20.00 eq 99% A הגדרות GC-MS עבור מטבוליטים נגזרים זמן [מינימום] טמפרטורה [°C] מידע 0 – 2.00 85 גז מוביל: הליום 2.00 – 18.66 lg 80 – 330 קצב זרימה: 2 מ”ל לדקה 18.66 – 24.66 cw 330 שיפוע טמפרטורה: 15 °C /min 24.66 קירור מהיר נפח הזרקה: 1 μL טבלה 1: הגדרות מעבר צבע עבור כל אחת מהפלטפורמות האנליטיות7. קיצורים: lg = גרדיאנט ליניארי; cw = שטיפת עמודים; eq = שיווי משקל; UHPLC-MS = ספקטרומטריית כרומטוגרפיה נוזלית-מסה בעלת ביצועים גבוהים במיוחד; UHPLC-MS/MS = כרומטוגרפיה נוזלית בעלת ביצועים גבוהים במיוחד- ספקטרומטריית מסה טנדם; GC-MS = כרומטוגרפיית גז-ספקטרומטריית מסה. * = ערך האחוז מתאים לאלוף A; ערך האחוז הנותר מתאים ל- B eluent. טבלה משלימה 1: נתוני ליפידומיקה גולמית. מציין את עוצמות השיא עבור כל אחד מהאשכולות שזוהו מעל כל דגימה. אנא לחץ כאן כדי להוריד טבלה זו.

Discussion

הן GC-MS והן LC-MS הם כלים הנמצאים בשימוש נרחב ליצירת פרופילים של תערובות מורכבות של מחלקות מטבוליט שונות. טיפול במערכי נתונים גדולים באמצעות כלים אלה קשור מטבעו לווריאציה לא ביולוגית, למשל, שונות אנליטית, אשר מפריעה ומוטה את הפרשנות של התוצאות. פרוטוקול זה מציג צינור מיצוי חזק ותפוקה גבוהה ליצירת פרופיל מטבולי מקיף כדי למנוע וריאציות של מקור לא ביולוגי ולערוך מחקרי “אומיקה” בקנה מידה גדול. הנפחים והריכוזים המשמשים בפרוטוקול זה הותאמו למיני קטניות ברקמות שונות. עם זאת, ניתן לשנות מעט פרמטרים אלה ולהשתמש בהם גם לדגימות מטבוליות בקנה מידה גדול ממיני צמחים אחרים.

ניתן להשתמש ב-15 המיצויים המבוססים על MTBE שתוארו קודם לכן כדי לנתח מטבוליטים נגזרים, מטבוליטים קוטביים למחצה וליפידים. ניתן להרחיב זאת עבור מיצויי חלבונים והורמונים צמחיים39, שהיו מחוץ לתחום פרוטוקול זה. פרוטוקולי מיצוי אחרים מסתמכים על תערובות דיכלורומתאן:אתנול40,41. מבין פרוטוקולי המיצוי הללו, פרוטוקול מיצוי MTBE:methanol מספק חלופה חיובית ופחות מסוכנת לפרוטוקולי המיצוי הקיימים המבוססים על כלורופורם42 ואינו גורם לכדור חלבון כאינטרפאזה בין שלב הקוטב לשלב השומנים. יתר על כן, שיטות MTBE כבר שימשו במספר מחקרים עבור דגימות ביולוגיות שונות 43,44,45.

פרוטוקול זה דן במספר שלבים חיוניים שעשויים להוביל לשונות פוטנציאלית תוך כדי טיפול במספר רב של דגימות, למשל, במהלךקצירת 12,13, מיצוי14, כמו גם אקראיות46. יתר על כן, ישנם נושאים נוספים שלא נדונו בפרוטוקול זה שיש לקחת בחשבון כדי להבטיח נתונים מטבוליים באיכות גבוהה, למשל, אפקט מטריצה ודיכוי יונים14.

העוצמה של שיטות נורמליזציה מבוססות QC תלויה מטבעה במספר דגימות QC בכל אצווה. כפי שצוין קודם לכן, למרות שהגדלת המספר תגדיל את ההספק, השונות התוך-אצווה של ה-QCs היא שולית יחסית בהשוואה לשונות בין-אצווה במערכות אנליטיות אלה, כפי שמודגם באיור 3. בסך הכל, ישנן שיטות נורמליזציה אחרות המבוססות על QC, כגון הסרת שגיאות מערכתית באמצעות יער אקראי (SERRF), אשר הוכחו כבעלות ביצועים טובים יותר מרוב שיטות הנורמליזציה האחרות כגון יחס מבחינת אצווה, נורמליזציה באמצעות בחירה אופטימלית של תקנים פנימיים מרובים (NOMIS), ונורמליזציה של מניין הסתברותי (PQN)47 . עם זאת, SERRF מסתמך על מספר דגימות QC בכל אצווה, למשל, כל דגימה עשירית, דבר שאינו אפשרי בעת טיפול במספר רב של דגימות. היתרון העיקרי של נורמליזציה מבוססת QC על פני שיטות מבוססות נתונים או מבוססות תקן פנימיות אחרות הוא שהיא שומרת על השונות הביולוגית החיונית תוך התאמה לשונות טכנית לא רצויה28. הקוראים יכולים להתייחס לסקירה זו על הטיפול בווריאציה28.

אחת הבעיות העיקריות ב-GWAS היא שיעור התוצאות החיוביות הכוזבות, שמקורן בעיקר בשל קישור של אתרים סיבתיים ולא סיבתיים 48,49. שנית, גישות התיקון הסטטיסטי השמרניות, למשל, Bonferroni ו- FDR, נכונות למספר הבדיקות הבלתי תלויות, שאינו שווה למספר ה- SNPs שנבדקו ב- GWAS בשל הקישור בין SNPs קרובים50,51 לכן, המספר בפועל של בדיקות עצמאיות הוא לעתים קרובות נמוך יותר. דרך נוספת להפחית את הסף הסטטיסטי השמרני תהיה להפחית את מספר ה-SNPs שנבדקו המשמשים ל-GWAS בהתבסס על דעיכת קישור על פני אזורים גנומיים מוגדרים52. לפלטפורמת המטבולומיקה המשולבת בתפוקה גבוהה של GWAS המתוארת בפרוטוקול זה יש מגוון רחב של יישומים. בפרט, זה יקל על שיפורים בגידול יבולים על ידי שינוי הרכב המטבוליט/שומנים לרמות הרצויות מבחינה תעשייתית ותזונתית. באופן כללי, המטבולומיקה סיפקה תובנה מעמיקה לגבי הארכיטקטורה הגנטית של שפע של מטבוליטים וגיוון מטבולי שהתרחשו במהלך ביות היבולים בעשורים האחרונים, מה שמצביע על הפוטנציאל העצום של רבייה הקשורה למטבולומיקה53. הגישות הביולוגיות המולקולריות לאימות QTL במורד הזרם כוללות יצירת קווים מוטנטיים של CRISPR/Cas954, קווי החדרת T-DNA55, קווי ביטוי יתר יציבים ו/או ארעיים56, VIGS, מטבוליזם ex vivo מתקרב57 לצד הגישה המקובלת ביצירת אוכלוסיות F2 צולבות וכן אימות צולב באוכלוסיות שונות.

על ידי ביצוע התיקון הדרוש עבור הווריאציות האנליטיות כפי שתוארו לעיל, ניתן לבצע מספר גישות משולבות בנוסף ל- GWAS, כגון מטבוליט-מטבוליט, ניתוח מתאם מטבוליט-ליפידים, ניתוח מתאם לנתונים פנומיים כדי לשפוך אור על תכונות מורכבות יותר, ו / או ניתוח ביטויים משותפים כדי לפענח עוד יותר את הבסיס של מערכות ביולוגיות58.

Disclosures

The authors have nothing to disclose.

Acknowledgements

M.B. נתמך על ידי IMPRS-PMPG ‘חילוף חומרים ראשוני וגידול צמחים’. A.R.F. ו- S.A. מכירים בתמיכה הכספית של תוכנית המחקר והחדשנות של האיחוד האירופי Horizon 2020, פרויקט PlantaSYST (מס ‘ SGA-CSA מס ‘739582 תחת FPA מס ‘ 664620), ופרויקט הגדלת (GA 862862).

Materials

Reagents and standards
1,2-diheptadecanoyl-sn-glycero-3- phosphocholine (17:0 PC) Avanti Polar Lipids 850360P Internal standard for lipids
Chloroform Supleco 67-66-3 FAME solvent
Isovitexin Sigma Aldrich 38953-85-4 Internal standard for metabolites
Lignoceric Acid Methylester Sigma Aldrich 2442-49-1 FAME
Methanol (MeOH) Biosolve Chemicals 13684102 ULC-MS grade
Methoxyamin -hydrochlorid Sigma Aldrich 593-56-6 Metabolite deriviatization
Methyl laurate Sigma Aldrich 111-82-0 FAME
Methyl myristate Sigma Aldrich 124-10-7 FAME
Methyl palmitate Sigma Aldrich 112-39-0 FAME
Methyl stearate Sigma Aldrich 112-61-8 FAME
Methyl tert-butyl ether (MTBE) Biosolve Chemicals 13890602 HPLC grade
Methyl-caprat Sigma Aldrich 110-42-9 FAME
Methylcaprylat Sigma Aldrich 111-11-5 FAME
Methyldocosanoat Sigma Aldrich 929-77-1 FAME
Methyleicosanoat Sigma Aldrich 1120-28-1 FAME
Methyl-hexacosanoat Sigma Aldrich 5802-82-4 FAME
Methyl-octacosanoat Sigma Aldrich 55682-92-3 FAME
Methyl-pelargonate Sigma Aldrich 1731-84-6 FAME
N-Methyl-N-(trimethylsilyl)trifluoracetamid (MSTFA) Macherey-Nagel 24589-78-4 Metabolite deriviatization
Pyridine Supleco 110-86-1 Metabolite deriviatization
Ribitol Supleco 22566-17-2 Internal standard for derivatized metabolites
Triacontanoic Acid Methyl Ester TCI Chemicals 629-83-4 FAME
Water Biosolve Chemicals 23214102 ULC-MS grade
Equipment
1.5 mL Safe-lock microcentrifuge tubes Eppendorf 3120086
2 mL Safe-lock microcentrifuge tubes Eppendorf 3120094
Balance Sartorius Corporation 14 557 572
DB-35ms, 30 m, 0,25 mm, 0,25 µm Aglient 123-3832 Analysis of derivatized metabolites
GC-MS system Leco Pegasus HT TOF-MS (LECO Corporation) Analysis of derivatized metabolites
Grinding Balls, Stainless Steel OPS DIAGNOSTICS GBSS 196-2500-10
MS system Exactive, Orbitrap-type, MS (Exactive, Thermo Fisher Scientific) Analysis of lipids
MS system Q Exactive Focus (Q Exactive™ Focus Hybrid Quadrupol-Orbitrap™
Massenspektrometer, Thermo Fisher Scientific)
Analysis of metabolites
Refrigerated microcentrifuge Eppendorf, model 5427R 22620701
Reversed Phase (RP) Bridged Ethyl Hybrid (BEH) C8 column
(100 mm × 2.1 mm containing 1.7 μm diameter particles)
Waters 186002878 Analysis of lipids
RP High Strength Silica (HSS) T3 column
(100 mm × 2.1 mm containing 1.8 μm diameter particles)
Waters 186003539 Analysis of metabolites
Shaker Eppendorf Thermomixer 5436 2050-100-05
Sonicator USC 300 TH 142-0084
Tissue grinding mixer mill Retsch, Mixer Mill MM 300 20.746.0001
UPLC system Waters Acquity UPLC system (Waters)
Vacuum concentrator Scan Speed Maxi Vac Alpha Evaporators 7.008.500.002
Vortex mixer Vortex-Genie 2, Model G560 SI-0236
Software
MetAlign Chromatogram processing
MzMine Chromatogram processing
R package "data.table"
R package "fujiplot" pleiotrpoic map
R package "genetics"
R package "Ime4" BLUPs calculation
R package "LDheatmap" LD plots
R package "MASS" transformation
R package "rMVP" GWAS
R version 4.0.4
RefinerMS Chromatogram processing
RefinerMS Genedata Expressionist Chromatogram processing
Tassel 5 Genotype filtering
Xcalibur Thermo Fisher Scientific OPTON-30965 Chromatogram processing

References

  1. Doerr, A. Global metabolomics. Nature Methods. 14 (1), 32 (2017).
  2. Fessenden, M. Metabolomics: Small molecules, single cells. Nature. 540 (7631), 153-155 (2016).
  3. Oliver, S. G., Winson, M. K., Kell, D. B., Baganz, F. Systematic functional analysis of the yeast genome. Trends in Biotechnology. 16 (9), 373-378 (1998).
  4. Fiehn, O. Metabolomics-the link between genotypes and phenotypes. Plant Molecular Biology. 48 (1), 155-171 (2002).
  5. Wu, S., et al. Mapping the Arabidopsis metabolic landscape by untargeted metabolomics at different environmental conditions. Molecular Plant. 11 (1), 118-134 (2018).
  6. Sysi-Aho, M., Katajamaa, M., Yetukuri, L., Orešič, M. Normalization method for metabolomics data using optimal selection of multiple internal standards. BMC Bioinformatics. 8 (1), 93 (2007).
  7. Chen, M., Rao, R. S. P., Zhang, Y., Zhong, C. X., Thelen, J. J. A modified data normalization method for GC-MS-based metabolomics to minimize batch variation. SpringerPlus. 3 (1), 439 (2014).
  8. Dunn, W. B., et al. Metabolic profiling of serum using Ultra Performance Liquid Chromatography and the LTQ-Orbitrap mass spectrometry system. Journal of Chromatography B. 871 (2), 288-298 (2008).
  9. Fiehn, O., et al. Metabolite profiling for plant functional genomics. Nature Biotechnology. 18 (11), 1157-1161 (2000).
  10. vander Kloet, F. M., Bobeldijk, I., Verheij, E. R., Jellema, R. H. Analytical error reduction using single point calibration for accurate and precise metabolomic phenotyping. Journal of Proteome Research. 8 (11), 5132-5141 (2009).
  11. Folch, J., Lees, M., Stanley, G. H. S. A simple method for the isolation and purification of total lipides from animal tissues. Journal of Biological Chemistry. 226 (1), 497-509 (1957).
  12. Fukushima, A., et al. Impact of clock-associated Arabidopsis pseudo-response regulators in metabolic coordination. Proceedings of the National Academy of Sciences of the United States of America. 106 (17), 7251-7256 (2009).
  13. Kerwin, R. E., et al. Network quantitative trait loci mapping of circadian clock outputs identifies metabolic pathway-to-clock linkages in Arabidopsis. The Plant Cell. 23 (2), 471-485 (2011).
  14. Tohge, T., et al. From models to crop species: Caveats and solutions for translational metabolomics. Frontiers in Plant Sciences. 2, 61 (2011).
  15. Salem, M., Bernach, M., Bajdzienko, K., Giavalisco, P. A simple fractionated extraction method for the comprehensive analysis of metabolites, lipids, and proteins from a single sample. Journal of Visualized Experiments:JoVE. (124), e55802 (2017).
  16. Tohge, T., Fernie, A. R. Combining genetic diversity, informatics and metabolomics to facilitate annotation of plant gene function. Nature Protocols. 5 (6), 1210-1227 (2010).
  17. Lisec, J., Schauer, N., Kopka, J., Willmitzer, L., Fernie, A. R. Gas chromatography mass spectrometry-based metabolite profiling in plants. Nature Protocols. 1 (1), 387-396 (2006).
  18. Osorio, S., Do, P. T., Fernie, A. R., Hardy, N. W., Hall, R. D. . Plant Metabolomics: Methods and Protocols. , 101-109 (2012).
  19. De Vos, R. C. H., et al. Untargeted large-scale plant metabolomics using liquid chromatography coupled to mass spectrometry. Nature Protocols. 2 (4), 778-791 (2007).
  20. Perez de Souza, ., Alseekh, L., Naake, S., Fernie, T., A, Mass spectrometry-based untargeted plant metabolomics. Current Protocols in Plant Biology. 4 (4), 20100 (2019).
  21. Pluskal, T., Castillo, S., Villar-Briones, A., Orešič, M. MZmine 2: Modular framework for processing, visualizing, and analyzing mass spectrometry-based molecular profile data. BMC Bioinformatics. 11 (1), 395 (2010).
  22. Watson, J. T., Sparkman, D. O. Electron Ionization. Introduction to mass spectrometry: Instrumentation, applications and strategies for data interpretation. , 315 (2007).
  23. Fernie, A. R., et al. Recommendations for reporting metabolite data. The Plant Cell. 23 (7), 2477 (2011).
  24. Treutler, H., et al. Discovering regulated metabolite families in untargeted metabolomics studies. Analytical Chemistry. 88 (16), 8082-8090 (2016).
  25. Wang, M., et al. Sharing and community curation of mass spectrometry data with Global Natural Products Social Molecular Networking. Nature Biotechnology. 34 (8), 828-837 (2016).
  26. Naake, T., Fernie, A. R. MetNet: Metabolite network prediction from high-resolution mass spectrometry data in R aiding metabolite annotation. Analytical Chemistry. 91 (3), 1768-1772 (2019).
  27. Chambers, J. M. . Statistical models in S. , (1991).
  28. Misra, B. B. Data normalization strategies in metabolomics: Current challenges, approaches, and tools. European Journal of Mass Spectrometry. 26 (3), 165-174 (2020).
  29. Livera, A. M. D., et al. Statistical methods for handling unwanted variation in metabolomics data. Analytical Chemistry. 87 (7), 3606-3615 (2015).
  30. Sakia, R. M. . The Box-Cox transformation technique: a review. 41 (2), 169-178 (1992).
  31. vanden Berg, R. A., Hoefsloot, H. C. J., Westerhuis, J. A., Smilde, A. K., vander Werf, M. J. Centering, scaling, and transformations: improving the biological information content of metabolomics data. BMC Genomics. 7, 142 (2006).
  32. Marees, A. T., et al. A tutorial on conducting genome-wide association studies: Quality control and statistical analysis. International Journal of Methods in Psychiatric Research. 27 (2), 1608 (2018).
  33. Torkamaneh, D., Laroche, J., Bastien, M., Abed, A., Belzile, F. Fast-GBS: a new pipeline for the efficient and highly accurate calling of SNPs from genotyping-by-sequencing data. BMC Bioinformatics. 18 (1), 5 (2017).
  34. Zhao, S., Agafonov, O., Azab, A., Stokowy, T., Hovig, E. Accuracy and efficiency of germline variant calling pipelines for human genome data. Scientific Reports. 10 (1), 20222 (2020).
  35. Bradbury, P. J., et al. TASSEL: software for association mapping of complex traits in diverse samples. Bioinformatics. 23 (19), 2633-2635 (2007).
  36. Bates, D., Mächler, M., Bolker, B., Walker, S. Fitting linear mixed-effects models using lme4. Journal of Statistical Software. 67 (1), (2015).
  37. Yin, L., et al. rMVP: A memory-efficient, visualization-enhanced, and parallel-accelerated tool for genome-wide association study. Genomics, Proteomics & Bioinformatics. , (2021).
  38. Kanai, M., et al. Genetic analysis of quantitative traits in the Japanese population links cell types to complex human diseases. Nature Genetics. 50 (3), 390-400 (2018).
  39. Salem, M. A., et al. An improved extraction method enables the comprehensive analysis of lipids, proteins, metabolites and phytohormones from a single sample of leaf tissue under water-deficit stress. Plant Journal: for Cell and Molecular Biology. 103 (4), 1614-1632 (2020).
  40. Balcke, G. U., et al. Multi-omics of tomato glandular trichomes reveals distinct features of central carbon metabolism supporting high productivity of specialized metabolites. The Plant Cell. 29 (5), 960-983 (2017).
  41. Leonova, T., et al. Does protein glycation impact on the drought-related changes in metabolism and nutritional properties of mature pea (Pisum sativum L.) seeds. International Journal of Molecular Sciences. 21 (2), 567 (2020).
  42. Alfonsi, K., et al. chemistry tools to influence a medicinal chemistry and research chemistry based organisation. Green Chemistry. 10 (1), 31-36 (2008).
  43. Bozek, K., et al. Organization and evolution of brain lipidome revealed by large-scale analysis of human, chimpanzee, macaque, and mouse tissues. Neuron. 85 (4), 695-702 (2015).
  44. Delgado, R., Muñoz, Y., Peña-Cortés, H., Giavalisco, P., Bacigalupo, J. Diacylglycerol activates the light-dependent channel TRP in the photosensitive microvilli of Drosophila melanogaster photoreceptors. The Journal of Neuroscience. 34 (19), 6679 (2014).
  45. Sharma, D. K., et al. UPLC-MS analysis of Chlamydomonas reinhardtii and Scenedesmus obliquus lipid extracts and their possible metabolic roles. Journal of Applied Phycology. 27 (3), 1149-1159 (2015).
  46. Dunn, W. B., Wilson, I. D., Nicholls, A. W., Broadhurst, D. The importance of experimental design and QC samples in large-scale and MS-driven untargeted metabolomic studies of humans. Bioanalysis. 4 (18), 2249-2264 (2012).
  47. Fan, S., et al. Systematic error removal using random forest for normalizing large-scale untargeted lipidomics data. Analytical Chemistry. 91 (5), 3590-3596 (2019).
  48. Larsson, S. J., Lipka, A. E., Buckler, E. S. Lessons from Dwarf8 on the strengths and weaknesses of structured association mapping. PLOS Genetics. 9 (2), 1003246 (2013).
  49. Platt, A., Vilhjálmsson, B. J., Nordborg, M. Conditions under which genome-wide association studies will be positively misleading. Genetics. 186 (3), 1045-1052 (2010).
  50. Nyholt, D. R. A simple correction for multiple testing for single-nucleotide polymorphisms in linkage disequilibrium with each other. American Journal of Human Genetics. 74 (4), 765-769 (2004).
  51. Teo, Y. Y. Common statistical issues in genome-wide association studies: a review on power, data quality control, genotype calling and population structure. Current Opinion in Lipidology. 19 (2), 133-143 (2008).
  52. Privé, F., Aschard, H., Ziyatdinov, A., Blum, M. G. B. Efficient analysis of large-scale genome-wide data with two R packages: bigstatsr and bigsnpr. Bioinformatics. 34 (16), 2781-2787 (2018).
  53. Alseekh, S., et al. Domestication of crop metabolomes: desired and unintended consequences. Trends in Plant Science. 26 (6), 650-661 (2021).
  54. Yano, K., et al. GWAS with principal component analysis identifies a gene comprehensively controlling rice architecture. Proceedings of the National Academy of Sciences of the United States of America. 116 (42), 21262 (2019).
  55. Wu, S., et al. Mapping the Arabidopsis metabolic landscape by untargeted metabolomics at different environmental conditions. Molecular Plant. 11 (1), 118-134 (2018).
  56. Ye, J., et al. An InDel in the promoter of Al-ACTIVATED MALATE TRANSPORTER9 selected during tomato domestication determines fruit malate contents and aluminum tolerance. The Plant Cell. 29 (9), 2249-2268 (2017).
  57. Zhang, W., et al. Genome assembly of wild tea tree DASZ reveals pedigree and selection history of tea varieties. Nature Communications. 11 (1), 3719 (2020).
  58. Tohge, T., Fernie, A. R. Annotation of plant gene function via combined genomics, metabolomics and informatics. Journal of Visualized Experiments: JoVE. (64), e3487 (2012).

Play Video

Cite This Article
Bulut, M., Fernie, A. R., Alseekh, S. Large-Scale Multi-Omics Genome-Wide Association Studies (Mo-GWAS): Guidelines for Sample Preparation and Normalization. J. Vis. Exp. (173), e62732, doi:10.3791/62732 (2021).

View Video