Summary

Büyük Ölçekli Multi-omik Genom Çapında İlişkilendirme Çalışmaları (Mo-GWAS): Numune Hazırlama ve Normalleştirme Kılavuzları

Published: July 27, 2021
doi:

Summary

Bu protokolde, birçok numunenin verimli ve hızlı bir şekilde numune hazırlamasını birleştiren optimize edilmiş bir iş akışı sunuyoruz. Ek olarak, metabolik GWAS çalışmalarının yüksek verimli değerlendirilmesi için analitik varyasyonları azaltmak için adım adım bir kılavuz sunuyoruz.

Abstract

Hem gaz kromatografisi-kütle spektrometresi (GC-MS) hem de sıvı kromatografisi-kütle spektrometresi (LC-MS), yüz binlerce metabolit özelliğini tespit etmek ve ölçmek için yaygın olarak kullanılan metabolomik yaklaşımlardır. Bununla birlikte, bu tekniklerin çok sayıda örneğe uygulanması, özellikle genom çapında ilişkilendirme çalışmaları (GWAS) için daha karmaşık etkileşimlere tabidir. Bu protokol, verimli ve hızlı bir numune hazırlamayı baklagil mahsulü türleri için çok sayıda numunenin analizi ile birleştiren optimize edilmiş bir metabolik iş akışını açıklamaktadır. Bu hafifçe modifiye edilmiş ekstraksiyon yöntemi başlangıçta bitki ve hayvan dokularının analizi için geliştirilmiştir ve metil tert-bütil eterde ekstraksiyona dayanmaktadır: polar ve lipit metabolitlerinin yakalanmasına izin vermek için metanol çözücü. Ek olarak, GWAS’taki metabolik varyansın yüksek verimli değerlendirilmesi için gerekli olan analitik varyasyonları azaltmak için adım adım bir kılavuz sunuyoruz.

Introduction

Büyük ölçekli “omik” yaklaşımlar, karmaşık biyolojik sistemlerinanalizini 1,2,3 ve genotipler ile ortaya çıkan fenotipler arasındaki bağlantının daha iyi anlaşılmasını sağlamıştır4. Ultra yüksek performanslı sıvı kromatografisi-kütle spektrometresi (UHPLC-MS) ve GC-MS kullanan metabolomikler, yalnızca bazılarına belirli bir dereceye kadar açıklama eklenmiş olan çok sayıda metabolit özelliğinin tespit edilmesini sağladı ve bu da bilinmeyen metabolitlerin yüksek oranda ortaya çıkmasına neden oldu. Karmaşık etkileşimler, büyük ölçekli metabolomiklerin farklı bir popülasyonun altta yatan genotipik varyasyonu ile birleştirilmesiyle araştırılabilir5. Bununla birlikte, büyük numune setlerinin işlenmesi doğal olarak analitik varyasyonlarla ilişkilidir ve daha sonraki aşağı akış prosesleri için metabolik varyansın değerlendirilmesini bozar. Özellikle, analitik değişikliklere yol açan başlıca sorunlar, makine performansına ve zaman içindeki enstrümantal sapmaya dayanmaktadır6. Partiden partiye varyasyonun entegrasyonu, büyük ölçekli yapılandırılmış bitki popülasyonlarını analiz ederken zorlu ve özellikle sorunludur. Biyolojik olmayan varyasyonları düzeltmek için çoklu normalleştirme prosedürleri önerilmiştir, örneğin, her biri doğal olarak bilinen problemler ve tuzaklarla ilişkili olan analitik hataları düzeltmek için iç, dış ve izotop etiketli iç standartların kullanılması 7,8,9,10.

Analitik varyasyona ek olarak, ekstraksiyon protokollerinin seçimi genellikle analitik yönteme bağlı olarak değişir. Nihayetinde, faz ayırma tabanlı ekstraksiyon yöntemleri uygulanarak malzeme ve işçilik maliyetlerinin yanı sıra çeşitli analitik prosesler için aynı numunenin birkaç alikotunun kullanılması gerekliliğinin azaltılması istenmektedir. Bu yöntemler ilk olarak kloroform kullanılarak tanıtıldı: polar ve hidrofobik bileşikleri fraksiyone etmek için metanol / su çözücüleri11.

Bu protokol, baklagil türlerinde hem kutupsal metabolitlerin hem de lipitlerin profilini çıkarmak için çok omik bir platform için hızlı bir yüksek verimli boru hattını tanımlar. Ayrıca, bu veri kümelerinin analitik varyasyon için uygun şekilde nasıl düzeltilebileceğini ve GWAS gerçekleştirerek metabolit kantitatif özellik lokuslarını (QTL) tespit etmek için genotipik bilgileri entegre etmeden önce normalleştirilebileceğini gösterir.

Protocol

1. Deneysel tasarım ve bitki yetiştiriciliği NOT: Deneyi deneysel hipoteze bağlı olarak kurun, örneğin, büyük ölçekli bir GWAS popülasyonu kullanmak, çoklu çoğaltmaların gerekliliğini azaltır, çünkü istatistiksel testler katılım yerine tüm bireysel SNP’lerin haplotiplerine dayanarak yapılacaktır. Buna karşılık, çoklu replikalar diğer deneysel yaklaşımlarda vazgeçilmezdir. Deney hazırlanırken aşağıdaki noktalar göz önünde bulundurulmalıdır. Deneysel hipoteze bağlı olarak yeterli biyolojik replikasyon ekleyin. Yetiştirme sırasında, örneğin sera, tarla gibi yerel çevresel önyargıyı azaltmak için biyolojik replikaları blok bazında randomize edin. Büyüme sırasında bitkinin uygun şekilde korunmasını sağlayın. Önyargıyı azaltmak için bitkilere homojen davranın. 2. Biyolojik bitki materyalinin hazırlanması Hasat hazırlığı Homojenizasyon için iki adet 5 mm ve iki adet 8 mm çapında metal boncuk içeren etiket hasat boruları (20 mL). Bir dewar’ı sıvı azotla doldurun.NOT: Bitkiler taze yaprak ve kök dokusu hasadı için vejetatif aşamada olmalıdır. Sıvı azotta flaş dondurma ile biyolojik numuneleri toplayın. Uzun hasat süreleri boyunca sirkadiyen salınımın metabolizma üzerindeki etkisini dışlamak için mümkün olduğunca çabuk hasatedin 12,13. Hasat edilen taze yaprak ve kök dokularını -80 ° C’de daha fazla işlem için saklayın.NOT: Yaprak kesiminden flaş dondurmaya kadar birkaç saniyeden uzun sürmemelidir, çünkü yaprak bölünmesinden sonra, aktif biyolojik işlemler yaralanma nedeniyle metabolik profilleri değiştirecektir. Kökler için, sıvı azotta flaş dondurmadan önce kökleri suyla yıkayarak önceden temizleyin. Kök yüzeyindeki fazla su kağıt mendille ıslatılmalıdır. Kurutulmuş tohumlar oda sıcaklığında saklanabilir; sıvı azotta dondurmaya gerek yoktur. Bir doku karıştırıcı değirmeni kullanarak dokuyu öğütün. Dokuyu öğütürken düşük bir sıcaklığı korumak için tüp tutucuları sıvı azotta birkaç dakika önceden soğutun. Biyolojik numuneleri -80 °C dondurucudan çıkardıktan sonra azot içeren bir dewarda taşıyın. Homojen toz elde etmek için dokuları öğütün; 1 dakika boyunca 25 Hz kullanın ve doku homojen olarak öğütülmemişse sıvı azotta dondurulduktan sonra tekrarlayın. Kurutulmuş tohumları öğütmek için, tohumları 15 mm çapında metal boncuklu bir öğütme kavanozuna yerleştirin. 2.3.3’te belirtildiği gibi aynı frekans ve zamanı kullanın.NOT: Temizlik kağıdı karıştırıcı değirmeni mevcut değilse, temiz ve önceden soğutulmuş harçlar ve havaneler kullanılabilir. Precool etiketli 2 mL güvenli kilitli mikrosantrifüj tüpleri. Analitik bir terazi kullanarak ±5 mg taze bitki materyali hatasıyla 50 mg tartın. Bitki materyalini sıvı azot içinde aktarmak için kullanılan aletleri önceden soğutun. Tartım işlemi sırasında bitki materyalinin donmuş kalmasını sağlayın.NOT: Taze bitki materyalini oda sıcaklığına çok uzun süre maruz bırakmayın, çünkü biyolojik prosesler sıcaklığın arttırılması, metabolik profillerin değiştirilmesiyle aktive edilir14. Her numunenin bir kısmını bir araya getirerek ve önceden soğutulmuş 2 mL güvenli kilitli mikrosantrifüj tüplerinde ±5 mg havuzlanmış taze bitki materyali hatasıyla 50 mg tartarak ek kalite kontrol (QC) numuneleri oluşturun.NOT: Her 60 numune için en az üç QC numunesi önerilir. QC numuneleri, aşağı akış düzeltme, normalleştirme ve analizler için gereklidir. 3. Ekstraksiyon reaktifleri Taze doku, örneğin yapraklar ve köklerNOT: Örnek ayıklama, daha önce açıklanan15 numaralı protokolü temel alır. Bu protokol, mevcut ihtiyaçlara, örneğin çoklu dokulara, farklı iç standartlara ve büyük ölçekli deneylere dayanarak değiştirilmiştir. Ek olarak, aşağıda belirtilen tüm hacimler ve cihaz ayarları şirket içi analitik birimlere göre ayarlanır. Protokol kullanıcıları, bunları test numunelerine dayanarak analitik birimlerine ve biyolojik numunelerine göre ayarlamalıdır. Ekstraksiyon karışımı 1 (EM1): metil tert-bütil eter (MTBE)/metanol (MeOH) (3:1 v/v) 3: 1 oranında bir MTBE / MeOH karışımı hazırlayın. 100 mL ekstraksiyon çözücüsü için, temiz bir cam şişede 75 mL MTBE ile 25 mL MeOH karıştırın.NOT: Solventler, uygun güvenlik ekipmanı ile davlumbazda dikkatli bir şekilde kullanılmalıdır. UHPLC-MS bazlı lipit analizi için dahili standart olarak 45 μL 1,2-diheptadecanoyl-sn-glycero-3-phosphocholine (kloroformda 1 mg / mL), GC-MS bazlı analiz için dahili standart olarak 400 μL ribitol (suda 1 mg / mL) ve UHPLC-MS bazlı metabolit analizi için 125 μL izoviteksin (MeOH / suda 1 mg / mL (1: 1 v / v)) ekleyin.NOT: Analitik ihtiyaçlara göre analiz sonrası normalizasyon için dahili standartların eklenmesi gereklidir. Her numune için 1 mL EM1 gerektiğinden, tüm deney için kullanılması gereken deneysel numune boyutuna göre bir stok çözeltisi hazırlayın. EM1 -20 °C’de saklanmalıdır. Kullanılan iç standardın bulunmadığını ve araştırılan türlerdeki diğer bileşiklerle örtüşüp örtüşmediğini kontrol edin. Çeşitli standartlar kullanılabilir; Bu protokoldeki iç standartların seçimi, ortak fasulye özleri kullanılarak yapılan önceki testlere dayanıyordu16. Ekstraksiyon karışımı 2 (EM2) su/metanol (MeOH) (3:1 v/v) 100 mL EM2 için, temiz bir cam şişeye 75 mL çift damıtılmış su ve 25 mL MeOH ekleyin. Numune başına 500 μL EM2 ekleyin ve tüm deney için kullanılması gereken deneysel numune boyutuna göre bir stok çözeltisi hazırlayın. EM2’yi 4 °C’de saklayın. Kurutulmuş tohumlar Ekstraksiyon karışımı 3 (EM3) metanol (MeOH)/ su (7:3 v/v) 100 mL EM3 için, temiz bir cam şişeye 70 mL MeOH ve 30 mL çift damıtılmış su ekleyin. Her numune için 1 mL EM3 hazırlayın. GC-MS bazlı analiz için dahili standartlar olarak 400 μL ribitol (suda 1 mg / mL) ve UHPLC-MS tabanlı metabolit analizi için 125 μL İzoviteksin (MeOH / suda 1 mg / mL (1: 1 v / v)) ekleyin.NOT: Deneysel numune büyüklüğüne göre bir stok çözeltisi hazırlayın ve tüm deney için kullanın. EM3’ü 4 °C’de saklayın. 4. Numune çıkarma Taze doku, örneğin yapraklar ve kökler Her numune için üç adet 1,5 mL güvenli kilitli mikrosantrifüj tüpü hazırlayın. EM1’i -20 °C sıvı soğutma sisteminde tutun. Taze numuneleri -80 °C dondurucudan nakliye için kuru buz veya sıvı nitrojene aktarın. Buzda tutmadan önce her 50 mg aliquot ve vortekse 1 mL önceden soğutulmuş EM1 ekleyin. Numuneleri 800 × g’da bir yörüngesel çalkalayıcıda 4 ° C’de 10 dakika boyunca inkübe edin. Örnekleri 10 dakika boyunca buz soğutmalı bir sonikasyon banyosunda sonikleştirin. Eklenen hacimlerde değişiklik olmasını önlemek için çok kanallı pipet kullanarak 500 μL EM2 ekleyin. 4 °C’de 5 dakika boyunca 11.200 × g’de santrifüj yapmadan önce ekstraksiyon karışımlarını karıştırmak için numuneleri kısaca vorteksleyin. Faz ayrımı gerçekleştikten sonra, üst lipit içeren fazın 500 μL’sini önceden etiketlenmiş 1.5 mL güvenli kilitli mikrosantrifüj tüpüne aktarın. Üst fazın geri kalanını çıkarın.NOT: Bu üst faz yüksek buhar basıncına sahip olduğundan ve pipetten sızma eğiliminde olduğundan aktarım sırasında dikkatli olun. GC-MS ve UHPLC-MS analizi için kullanılan iki adet 1,5 mL güvenli kilitli mikrosantrifüj tüpünde sırasıyla alt polar ve yarı polar metabolit içeren fazların 150 μL ve 300 μL’sini aktarın. Solventlerin bir vakum yoğunlaştırıcı kullanarak ısınmadan buharlaşmasına izin vererek ekstrakte edilen tüm fraksiyonları konsantre edin ve -80 ° C’de saklayın. Kurutulmuş tohumlar Her numune için iki adet 1,5 mL emniyetli kilitli mikrosantrifüj tüpü hazırlayın. EM3’ü buz üzerinde tutun. Örnek alikotlara 5 mm çapında bir metal boncuk yerleştirin. Her 50 mg alikotta 1 mL EM3 ekleyin ve numuneleri buza koymadan önce 2-3 dakika boyunca 25 Hz’de homojenize edin. Örnekleri 10 dakika boyunca buz soğutmalı bir sonikasyon banyosunda sonikleştirin. 4 °C’de 5 dakika boyunca 11.200 × g’de santrifüj yapmadan önce numuneleri kısaca vorteksleyin. GC-MS ve UHPLC-MS analizi için kullanılan iki adet 1,5 mL güvenli kilitli mikrosantrifüj tüpünde süpernatantın 150 μL ve 300 μL’sini aktarın. Solventlerin bir vakum yoğunlaştırıcı kullanarak ısınmadan buharlaşmasına izin vererek ekstrakte edilen tüm fraksiyonları konsantre edin ve -80 ° C’de saklayın.NOT: Deneyimlere dayanarak, kullanıcıların yarı kutupsal metabolitler için adım 4.2’yi ve kurutulmuş tohumlarda türevlenmiş metabolit analizini gerçekleştirmeleri önerilir. Kurutulmuş tohum lipit analizi için ekstraksiyon adım 4.1’i gerçekleştirin. 5. UHPLC-MS kullanarak lipitlerin analizi Kurutulmuş lipit fraksiyonlarını 250 μL asetonitril:2-propanol (7:3, hacim/hacim) içinde tekrar askıya alın. Lipid fazını 5 dakika boyunca sonikleştirin, 1 dakika boyunca 11.200 × g’de santrifüj yapın. Süpernatantın 90 μL’sini LC-MS için bir cam şişeye aktarın. Ekstraktların 2 μL’sini LC-MS’ye enjekte edin. Tablo 1’de gösterildiği gibi eluent A ve B’nin kademeli değişimleri ile 400 μL / dak’lık bir akışla çalışan 60 ° C’de tutulan ters fazlı bir C8 sütununda lipit fraksiyonasyonu gerçekleştirin. Kütle spektrumlarını 150-1.500 m / z kütle aralığına sahip pozitif iyonizasyon modunda elde edin. Tüm günlük partilere birkaç QC numunesi ve analitik varyasyonun düzeltilmesini sağlamak için bir boşluk ekleyin. Örnekleri sıralı sırayla blok halinde randomize edin. 6. UHPLC-MS kullanarak polar ve yarı polar metabolitlerin analizi Kurutulmuş polar fazı 180 μL UHPLC sınıfı metanol içinde yeniden askıya alın: su (1:1 v / v). 2 dakika boyunca kutupsal fazı sonikleştirin, 11.200 × g’de 1 dakika boyunca santrifüj yapın. Süpernatantın 90 μL’sini LC-MS için bir cam şişeye aktarın. Ekstraktların 3 μL’sini LC-MS’ye enjekte edin. Tablo 1’de gösterildiği gibi 400 μL/dak akışla çalışan 40 °C’de tutulan ters faz C18 sütunu üzerinde, Tablo 1’de gösterildiği gibi elüent A ve B’nin kademeli olarak değişmesiyle metabolit fraksiyonasyonu gerçekleştirin. Tam bir MS taramasında 100-1.500 m / z kütle aralığında kütle spektrumlarını ve 40 keV’lik yüksek enerjili çarpışma ayrışması (HCD) ile indüklenen tüm iyon parçalanmasını (AIF) elde edin.NOT: Her iki iyonizasyon modunu da kullanın. Bununla birlikte, çok sayıda numune çalıştırırken sınırlı kapasite nedeniyle, tercih edilen iyonizasyon modunu belirlemek için test numunelerini her iki iyonizasyon modunda da çalıştırın. Tüm günlük partilere birkaç QC numunesi ve analitik varyasyonun düzeltilmesini sağlamak için bir boşluk ekleyin. Örnekleri sıralı sırayla blok halinde randomize edin. Veriye bağımlı MS2’de havuza alınmış bir QC’yi hem negatif hem de pozitif iyonizasyon modlarında çalıştırın. Ek açıklama için elde edilen kütle spektrumlarını sonraki bir adımda (8.5) kullanın. 7. GC-MS17,18 kullanılarak türetilmiş Metabolitlerin analizi NOT: Türevlenmiş metabolitlerin analizi, daha önce açıklanan17 numaralı protokole dayanmaktadır. Duman davlumbazındaki tüm türevlendirme reaktiflerini kullanın. N-metil-N-(trimetilsilil) triflorasetamidin (MSTFA) su ve nemle temas etmediğinden emin olun. Türevlendirme reaktifi 1 (DR1) 30 mg / mL DR1 konsantrasyonu elde etmek için metoksiamin hidroklorürü piridin içinde çözün. Her numune için 40 μL DR1 kullanın. Örnek boyutuna göre bir stok çözeltisi hazırlayın ve oda sıcaklığında saklayın. Türevlendirme reaktifi 2 (DR2) MSTFA’yı 1 mL MSTFA başına 20 μL yağ asidi metil esterleri (FAME’ler) ile çözün. Her numune için 70 μL DR2 kullanın. Örnek boyutuna göre bir stok çözeltisi hazırlayın. MSTFA’yı 4 °C’de ve FAME’leri -20 °C’de saklayın.NOT: FAME’ler, sıvı veya katı standartlar için sırasıyla 0.8 μL / mL veya 0.4 mg / mL konsantrasyonunda CHCl3’te çözünen metilkaprilat, metil pelargonat, metilkaprat, metilmiristat, metilpalmitat, metilpalmitat, metilstearat, metilyokerik asit metil ester, metilheksasanoat, metiloktakosanoat ve triacontanoik asit metilesteri içerir. Aşağı akış türevlendirmesi için kullanılan çözücülerle depolama sırasında ortaya çıkanH2O parazitini önlemek için bir vakum yoğunlaştırıcı kullanarak peleti polar fazdan (-80 ° C’de saklanır) 30 dakika boyunca tekrar kurutun. 40 μL DR1 ekleyin. Numuneleri 950 × g’da 37 ° C’de 2 saat boyunca yörüngesel bir çalkalayıcı kullanarak çalkalayın, ardından sıvının kısa bir spin-down’u izleyin. 70 μL DR2 ekleyin. Yörüngesel bir çalkalayıcı kullanarak 37 ° C’de 30 dakika boyunca 950 × g’de tekrar çalkalayın. GC-MS analizi için 90 μL’yi cam şişelere aktarmadan önce oda sıcaklığında kısa bir süre santrifüj yapın. Metabolit konsantrasyonlarına bağlı olarak, 2 mL/dak sabit helyum taşıyıcı gaz akışı ile GC-MS bölünmez moduna 1 μL enjekte edin. Enjeksiyon sıcaklığı, 30 m MDN-35 kılcal kolon kullanılarak 230 ° C’ye ayarlanır.NOT: Ek bilgiler, örneğin sıcaklık gradyanı, Tablo 1’de bulunabilir. Kütle aralığı 20 tarama/dk ile 70-600 m/z’ye ayarlanmıştır. Varsayılan aşırı yükleme bileşiklerinin miktarını sağlamak için bölme modlarını dahil edin, bu gibi durumlarda ekstraktın yeniden türemesi için maliyet ve zamandan tasarruf edin. Tüm günlük partilere birkaç QC numunesi ve analitik varyasyonun düzeltilmesini sağlamak için bir boşluk ekleyin. Örnekleri sıralı sırayla blok bazında düzgün bir şekilde randomize edin. 8. Kromatogram işleme ve bileşik ek açıklama Yoğunluk eşiklerini tanımlayarak kimyasal gürültüyü filtreleyin. Kromatogramları işlerken tüm QC örneklerini dahil edin.NOT: Büyük ölçekli verilerde, gürültü filtreleme, bilgi işlem süresini ve işlem gücünü azaltmak için çok önemlidir. Bir bekletme zaman kaydırma penceresi tanımlayarak kromatogramları hizalayın. Parti içi ve partiler arası varyasyonu değerlendirmek için her partiden kromatogramları kontrol edin. Tepe şekline bağlı olarak tepe algılaması gerçekleştirin, örneğin yarı maksimum (FWHM) hesaplamalarında tam genişlik için yükseklik ve genişlik. Gereksiz sinyalleri azaltmak ve singletonları filtrelemek için küme izotopları.NOT: Kromatogram işleme için kullanılan yazılımlarla ilgili ayrıntılar için Malzeme Tablosu’na bakın. MS-DIAL, MetAlign, MzMine ve Xcalibur 19,20,21 gibi serbestçe kullanılabilen çeşitli yazılım araçlarını kullanarak kromatogramların nasıl işleneceğine dair derinlemesine protokoller sağlanmaktadır. Bileşik ek açıklama için havuza alınmış bir QC örneğinin ddMS2 verilerini kullanın. Monoizotopik kütleyi belirleyerek ve ortak nötr kayıpları, bilinen yüklü aglikonları ve farklı bölünme türlerini, örneğin homolitik veya heterolitik 16,22’yi gözlemleyerek moleküler yapıyı değerlendirin. Metabolit verilerini raporlamak için, Fernie et al. 201123’te açıklanan tavsiyeyi izleyin.NOT: Metabolomik verileri analiz etmek için farklı hesaplamalı metabolomik yaklaşımlar kullanılabilir24,25,26. 9. Büyük ölçekli metabolomik veri kümesinin normalleştirilmesi Dahili standartların dağılımını kontrol edin ve tek veya birden fazla dahili standardın yanıtını düzelterek normalleştirin. Adım 2.5’ten itibaren pik yoğunlukları aliquoted homojenize numune ağırlığına bölerek kromatogramdan elde edilen pik yoğunluklarını tam numune ağırlığı üzerinden düzeltin. Çok partili serilerde yoğunluk kayması için doğru. R kullanarak yerel olarak tahmin edilen dağılım grafiği yumuşatma (LOESS)27 gibi QC tabanlı düzeltme yöntemleri gerçekleştirin.NOT:28,29 partilerinin tamamının alınması sırasında MS performansının sürüklenmesini ele almak için çeşitli araçlar ve paketler mevcuttur. Veri dönüşümü ile özelliklerin normal dağılımını sağlayın, örneğin, GWAS’ı gerçekleştirmek için R paketi MASS’tan boxcox () işlevini kullanarak Box-Cox dönüşümü30. Düşük miktarda bulunan bileşiklerin doğru şekilde tartılmasını sağlamak amacıyla çok değişkenli analiz için Pareto ölçeklendirme gibi veri ölçeklendirme gerçekleştirin31.NOT: Mümkünse, matris etkilerinden kaçınmak için bir kurtarma testi yapın, örneğin, iyon bastırma14. 10. Genom çapında ilişkilendirme çalışmaları (GWAS)32 Sıralama verilerinden tek nükleotid polimorfizmi (SNP) veya yapısal varyantları (SV)33,34 olarak adlandırın. Püskül35 kullanarak düşük frekanslı önyargıyı önlemek için genotipik verileri minör alel frekansı (MAF) için% 5 10’luk eksik oran için filtreleyin. R paketi Ime436’yı kullanarak çevresel faktörlerden (rastgele etkiler) kaynaklanan önyargıları ortadan kaldırmak için deneysel tekrarlar üzerinden normalleştirilmiş her özellik için en iyi doğrusal tarafsız tahminleri (BLOP’lar) hesaplayın. R37’deki rMVP paketini kullanarak GWAS gerçekleştirmek için her özelliğin BLOP’larını ayrı ayrı kullanın.NOT: Her metabolomik özellik burada ayrı bir bağımsız fenotip olarak görülmektedir. GWAS gerçekleştirilirken, kafa karıştırıcı etkileri en aza indirmek için ana bileşen analizi (PCA) ve devlete göre kimlik (IBS) veya vanRaden kullanarak popülasyon yapısı için düzeltin. Ayrıca, karışık modeller sabit ve rastgele efektler içerdiğinden, karışık doğrusal bir model (MLM) veya çok merkezli bir karma model (MLMM) kullanmayı düşünün. 11. QTL algılama Altta yatan genetik bölgeyi belirlemek için bağlantı dengesizliği (LD) hesaplamaları için Manhattan grafiklerini dikkate alarak önemli bir ilişki gösteren SNP’leri kontrol edin. R paketi LD ısı haritasını veya Püskül 5’i kullanarak LD hesaplamaları yapın. Potansiyel nedensel SNP’leri bulmak için haplotipler arasındaki istatistiksel değişiklikler için özellik seviyelerini inceleyerek özellik üzerindeki etki boyutu için ilişkili SNP’leri kontrol edin, örneğin, protein kodlama dizisinde fenotipik varyasyonu açıklayabilecek bir amino asit değişikliğine yol açan SNP’ler.NOT: SNP-özellik ilişkileri mutlaka nedensel ilişki vermediğinden, genomik bölgeyi belirlemek çok önemlidir. Özellik ek açıklamasına göre bileşik kimlik, belirli bir genomik bölgede doğru aday genleri bulmada son derece yardımcı olabilir. Şekil 4’te gösterildiği gibi, genetik bölgeler38’in altını çizmek için belirli bileşiklerle ilişkili tespit edilen tüm QTL’yi pleiotropik bir haritada birleştirmeyi öneriyoruz. Aday genlerin doğrulanması için çeşitli yaklaşımlar uygulanabilir (tartışmaya bakınız).

Representative Results

Başarılı metabolomik GWAS deneyleri, uygun bir deneysel tasarımla başlamalı, ardından Şekil 1’de gösterildiği gibi örnek toplama, ekstraksiyon, veri toplama ve işleme ile devam etmelidir. Bu protokolde, MTBE yöntem15, çeşitli bileşik sınıflarına ait yüzlerce metaboliti çıkarmak ve analiz etmek için kullanılmıştır. Kromatografi, kullanılan kolonun özelliklerine ve elüsyon tampon karışımlarına büyük ölçüde bağlıdır. Şekil 2, QC örneklerinin kromatogramlarını göstererek, bu analitik sistemdeki bazı ana lipit sınıflarının elüsyon paternini göstermektedir. Her platform için uygulanan gradyanlar Tablo 1’de verilmiştir. Büyük ölçekli deneylerde sistemik hataların ele alınmasına güçlü bir vurgu yapıldı. Büyük ölçekli metabolomiklerin gerçekleştirilmesi doğal olarak sistemik hatalarla ilişkilidir. Gösterim için, birkaç yaygın fasulye türündeki lipidomik verileri analiz ettik. Ek Tablo 1, Malzeme Tablosunda belirtilen yazılım kullanılarak kromatogram işleminden sonra elde edilen ekstrakte edilmiş ham lipidomik verileri sağlar. Bu protokolü takip etmek, özellikle büyük örnek kümelerini işlerken, omik verilerle uğraşırken önemli sorunları aşmamızı sağladı. Normalleştirme prosedürü, Şekil 3’te gösterildiği gibi, toplu analitik hataların doğru bir şekilde düzeltilmesini sağlar. QC numunelerinin sayısının arttırılması normalleştirmenin gücünü artıracak olsa da, maliyet ve zaman kısıtlamaları nedeniyle bu her zaman mümkün değildir. Hedeflenmemiş metabolik özelliklere sahip yüksek verimli metabolomik GWAS için, daha fazla sayıda özellik-belirteç ilişkisini uygun şekilde göstermek önemlidir. Çoklu GWAS sonuçlarını birleştiren bir pleiotropik harita38, çeşitli özelliklerin bağlantılı olduğu genomik bölgeleri vurgulamak için kullanılabilir (Şekil 4). Şekil 1: Bitkilerde metabolomik tabanlı GWAS’ın akış şeması. Deneysel tasarımdan başlayarak QTL’nin tespitine kadar olan birkaç adım sol panelde gösterilmektedir. Sağ panelde, sol panelde belirtilen birkaç adımı desteklemek için birden fazla şekil gösterilmiştir. Sağ üstten başlayarak, (1) LC-MS için önerilen bir örnek dizisi, (2) PCA’nın normalleştirilme öncesi ve sonrası skor grafikleri, temsili bir özellik dağılımı ön ve son işlem dahil, QC örnek yoğunluklarını gösteren kırmızı ve (3) LD ve haplotip dağılımlarının oluşturulduğu önemli ilişkilere sahip bir Manhattan grafiği. Kısaltmalar: GWAS = genom çapında ilişkilendirme çalışmaları; QTL = nicel özellik lokusları; PCA = ana bileşen analizi; QC = kalite kontrol; LD = bağlantı dengesizliği; MS = kütle spektrometrisi; LC-MS = sıvı kromatografisi-kütle spektrometrisi; GC-MS = gaz kromatografisi-kütle spektrometrisi; LOESS = yerel olarak tahmin edilen dağılım grafiği yumuşatma; MLM/MLMM = karışık doğrusal model/çok merkezli karma model. Bu şeklin daha büyük bir versiyonunu görüntülemek için lütfen buraya tıklayın. Şekil 2: Kromatogram işleme. Farklı partilerden iki QC kromatogramı (baz pik; lipit verileri), havuza alınmış QC numunelerindeki belirli lipit sınıfları için parti bazında varyasyonu göstermektedir. Dört ana lipid sınıfı, şirket içi LC-MS sistemindeki ilgili elüsyon pencereleri ile belirtilmiştir. Kromatogramlar MzMine21’den ihraç edildi. Kısaltmalar: QC = kalite kontrol; LC-MS = sıvı kromatografisi-kütle spektrometrisi. Bu şeklin daha büyük bir versiyonunu görüntülemek için lütfen buraya tıklayın. Şekil 3: Sistematik hatanın düzeltilmesi. Edinilmiş lipidomik verilerin temel bileşen analizi, sistemik hatalar için ön (sol, ham veriler) ve düzeltme sonrası (sağ, toplu loess). Alt paneller, analitik varyasyon için numuneler (n = 650) ve partiler (n = 10) öncesi (solda) ve sonrası (sağda) düzeltmeler üzerindeki özellik (Cluster_00005) dağılımını gösterir. Kısaltmalar: PCA = ana bileşen analizi; QC = kalite kontrol; LOESS = yerel olarak tahmin edilen dağılım grafiği yumuşatma. Bu şeklin daha büyük bir versiyonunu görüntülemek için lütfen buraya tıklayın. Şekil 4: Kombine GWAS sonuçlarını gösteren pleiotropik harita. Pleiotropik harita, tüm genomda çeşitli özelliklerle ilişkili bölgeleri vurgulamaktadır. Dış halkalardaki sayılar karşılık gelen kromozomları gösterir. Her çember, önemli ölçüde ilişkili SNP’leri ile bireysel bir özelliği temsil eder. Renkler farklı bileşik sınıflarını temsil eder (gri = bileşik sınıf 1; yeşil = bileşik sınıf 2; mor = bileşik sınıf 3; sarı = bileşik sınıf 4). Aynı genomik bölgeye sahip bileşikler arası sınıf ilişkileri durumunda, genler vurgulanır. İç gri daire, belirli bir genomik pozisyonla ilişkili tüm önemli SNP’lerin toplamını gösterir. Bu şekilde gösterilen ilişkilendirmeler yapay olarak yalnızca örnek olarak oluşturulmuştur. Kısaltmalar: GWAS = genom çapında ilişkilendirme çalışmaları; SNP’ler = tek nükleotid polimorfizmleri. Bu şeklin daha büyük bir versiyonunu görüntülemek için lütfen buraya tıklayın. Lipitler için UHPLC-MS ayarları Zaman [min] Eluent A’dan B’ye [%]* Bilgi 0 – 1.00 A Eluent A: %1 1M NH4-Asetat, suda %0,1 asetik asit (UHPLC sınıfı) 1.00 – 4.00 lg – A Elüent B: %1 1M NH4-Asetat, asetonitril/2-propanol 7:3 içinde %0,1 asetik asit (UHPLC sınıfı) 4.00 – 12.00 lg – A Akış hızı: 400 μL/dak 12.00 – 15.00 lg – %0 A Enjeksiyon hacmi: 2 μL 15.00 – 19.50 cw %0 A 19.50-19.51 %0 – A 19.51-24.00 eq Polar ve yarı kutupsal metabolitler için UHPLC-MS/MS ayarları Zaman [min] Eluent A ve B [%]* Bilgi 0 – 1.00 A Elüent A: Suda% 0.1 formik asit (UHPLC sınıfı) 1.00 – 11.00 lg – A Eluent B: Asetonitrilde% 0.1 formik asit (UHPLC sınıfı) 11.00 – 13.00 lg – A Akış hızı: 400 μL/dak 13.00 – 15.00 lg – %1 A Enjeksiyon hacmi: 3 μL 15.00 – 16.00 cw %1 A 16.00 – 17.00 lg %1 – A 17.00 – 20.00 eq A Türevlenmiş metabolitler için GC-MS ayarları Zaman [min] Sıcaklık [°C] Bilgi 0 – 2.00 85 Taşıyıcı gaz: Helyum 2.00 – 18.66 lg 80 – 330 Akış hızı: 2 mL/dak 18.66 – 24.66 cw 330 Sıcaklık gradyanı: 15 °C/dak 24.66 hızlı soğutma Enjeksiyon hacmi: 1 μL Tablo 1: Analitik platformların her biri için gradyan ayarları7. Kısaltmalar: lg = doğrusal gradyan; cw = sütun yıkama; eq = denge; UHPLC-MS = ultra yüksek performanslı sıvı kromatografisi-kütle spektrometrisi; UHPLC-MS/MS = ultra yüksek performanslı sıvı kromatografisi-tandem kütle spektrometrisi; GC-MS = gaz kromatografisi-kütle spektrometrisi. * = yüzde değeri eluent A’ya karşılık gelir; kalan yüzde değeri, B elüentine karşılık gelir. Ek Tablo 1: Ham lipidomik veriler. Her örnek üzerinde algılanan kümelerin her biri için tepe yoğunluklarını gösterir. Bu tabloyu indirmek için lütfen tıklayınız.

Discussion

Hem GC-MS hem de LC-MS, çeşitli metabolit sınıflarının karmaşık karışımlarının profilini çıkarmak için yaygın olarak kullanılan araçlardır. Büyük veri kümelerinin bu araçlarla işlenmesi, doğal olarak, sonuçların yorumlanmasına müdahale eden ve önyargılı olan analitik varyasyon gibi biyolojik olmayan bir varyasyonla ilişkilidir. Bu protokol, biyolojik olmayan kökenin varyasyonunu ortadan kaldırmak ve büyük ölçekli “omik” çalışmaları yürütmek için kapsamlı metabolik profilleme için sağlam ve yüksek verimli bir ekstraksiyon boru hattı sunmaktadır. Bu protokolde kullanılan hacimler ve konsantrasyonlar, farklı dokulardaki baklagil türleri için ayarlanmıştır. Bununla birlikte, bu parametreler biraz değiştirilebilir ve diğer bitki türlerinden büyük ölçekli metabolik örnekler için de kullanılabilir.

Daha önce açıklanan15 MTBE bazlı ekstraksiyon, türevlenmiş metabolitleri, yarı polar metabolitleri ve lipitleri analiz etmek için kullanılabilir. Bu, bu protokolün kapsamı dışında kalan protein ve bitki hormonu ekstraksiyonları39 için genişletilebilir. Diğer ekstraksiyon protokolleri diklorometan: etanol karışımları40,41’e dayanır. Bu ekstraksiyon protokollerinden MTBE: metanol ekstraksiyon protokolü, mevcut kloroform bazlı ekstraksiyon protokolleri42’ye uygun ve daha az tehlikeli bir alternatif sağlar ve polar ve lipit fazları arasında bir interfaz olarak bir protein peleti ile sonuçlanmaz. Ayrıca, MTBE yöntemleri çeşitli biyolojik örnekler için çeşitli çalışmalarda zaten kullanılmıştır43,44,45.

Bu protokol, çok sayıda numuneyi işlerken potansiyel varyasyona yol açabilecek birkaç önemli adımı tartışmaktadır, örneğin, hasatsırasında 12,13, ekstraksiyon14 ve randomizasyon46. Ayrıca, bu protokolde tartışılmamış olan ve yüksek kaliteli metabolomik veriler sağlamak için göz önünde bulundurulması gereken ek konular vardır, örneğin, matris etkisi ve iyon bastırma14.

QC tabanlı normalleştirme yöntemlerinin gücü, doğal olarak her partideki QC numunelerinin sayısına bağlıdır. Daha önce de belirtildiği gibi, sayının arttırılması gücü artıracak olsa da, QC’lerin parti içi varyasyonu, Şekil 3’te gösterildiği gibi, bu analitik sistemlerdeki partiler arası varyasyona kıyasla nispeten marjinaldir. Genel olarak, rastgele orman (SERRF) kullanarak sistemik hata giderme gibi diğer QC tabanlı normalleştirme yöntemleri de vardır; bunların, toplu olarak oran, çoklu iç standartların (NOMIS) optimal seçimi kullanılarak normalleştirme ve olasılıksal bölüm normalleştirme (PQN)47 gibi diğer normalleştirme yöntemlerinden daha iyi performans gösterdiği gösterilmiştir. . Bununla birlikte, SERRF her partide birden fazla QC örneğine dayanır, örneğin, her onuncu numune, bu da çok sayıda numuneyi işlerken mümkün değildir. QC tabanlı normalleştirmenin diğer veri odaklı veya dahili standart tabanlı yöntemlere göre temel avantajı, istenmeyen teknik varyasyonları barındırırken temel biyolojik varyasyonu korumasıdır28. Okuyucular,varyasyon 28’in ele alınmasıyla ilgili bu incelemeye başvurabilirler.

GWAS’daki ana sorunlardan biri, çoğunlukla nedensel ve nedensel olmayan sitelerin bağlantısından kaynaklanan yanlış pozitiflerin oranıdır48,49. İkincisi, muhafazakar istatistiksel düzeltme yaklaşımları, örneğin Bonferroni ve FDR, bağımsız testlerin sayısı için doğrudur, bu da yakın SNP’ler arasındaki bağlantı nedeniyle GWAS’taki tahlil edilmiş SNP’lerin sayısına eşit değildir50,51 Bu nedenle, bağımsız testlerin gerçek sayısı genellikle daha düşüktür. Konservatif istatistiksel eşiği azaltmanın bir başka yolu, tanımlanmış genomik bölgeler üzerindeki bağlantı bozunumuna dayanarak GWAS için kullanılan test edilmiş SNP’lerin sayısını azaltmak olacaktır52. Bu protokolde açıklanan GWAS ile entegre yüksek verimli metabolomik platformu çok çeşitli uygulamalara sahiptir. Özellikle, metabolit / lipit bileşimini endüstriyel ve besleyici olarak istenen seviyeler için değiştirerek mahsul ıslahındaki gelişmeleri kolaylaştıracaktır. Genel olarak, metabolomik, son on yıllarda mahsulün evcilleştirilmesi sırasında meydana gelen çok sayıda metabolitin ve metabolik çeşitliliğin genetik mimarisi hakkında derinlemesine bir fikir vermiş ve metabolomikle ilişkili ıslahın engin potansiyelini göstermiştir53. Aşağı akış QTL doğrulaması için moleküler biyolojik yaklaşımlar, CRISPR / Cas9 mutant hatlarının 54, T-DNA yerleştirme hatlarının 55, kararlı ve / veya geçici aşırı ekspresyon hatlarının56, VIGS, ex vivo metabolomik yaklaşımların57 üretilmesini, çapraz F2 popülasyonlarının üretilmesinde geleneksel yaklaşımın yanı sıra farklı popülasyonlarda çapraz doğrulamayı içerir.

Yukarıda tarif edildiği gibi analitik varyasyonlar için gerekli düzeltmeyi yaparak, GWAS’a ek olarak, metabolit-metabolit, metabolit-lipid korelasyon analizi, daha karmaşık özelliklere ışık tutmak için fenomik verilere korelasyon analizi ve / veya biyolojik sistemlerin temelini daha da çözmek için birlikte ekspresyon analizi gibi çeşitli entegre yaklaşımlar gerçekleştirilebilir58.

Disclosures

The authors have nothing to disclose.

Acknowledgements

M.B., IMPRS-PPG ‘Birincil Metabolizma ve Bitki Büyümesi’ tarafından desteklenmektedir. A.R.F. ve S.A., AB Horizon 2020 Araştırma ve İnovasyon Programı, proje PlantaSYST (SGA-CSA No. 739582 FPA No. 664620) ve proje INCREASE (GA 862862) finansal desteğini kabul eder.

Materials

Reagents and standards
1,2-diheptadecanoyl-sn-glycero-3- phosphocholine (17:0 PC) Avanti Polar Lipids 850360P Internal standard for lipids
Chloroform Supleco 67-66-3 FAME solvent
Isovitexin Sigma Aldrich 38953-85-4 Internal standard for metabolites
Lignoceric Acid Methylester Sigma Aldrich 2442-49-1 FAME
Methanol (MeOH) Biosolve Chemicals 13684102 ULC-MS grade
Methoxyamin -hydrochlorid Sigma Aldrich 593-56-6 Metabolite deriviatization
Methyl laurate Sigma Aldrich 111-82-0 FAME
Methyl myristate Sigma Aldrich 124-10-7 FAME
Methyl palmitate Sigma Aldrich 112-39-0 FAME
Methyl stearate Sigma Aldrich 112-61-8 FAME
Methyl tert-butyl ether (MTBE) Biosolve Chemicals 13890602 HPLC grade
Methyl-caprat Sigma Aldrich 110-42-9 FAME
Methylcaprylat Sigma Aldrich 111-11-5 FAME
Methyldocosanoat Sigma Aldrich 929-77-1 FAME
Methyleicosanoat Sigma Aldrich 1120-28-1 FAME
Methyl-hexacosanoat Sigma Aldrich 5802-82-4 FAME
Methyl-octacosanoat Sigma Aldrich 55682-92-3 FAME
Methyl-pelargonate Sigma Aldrich 1731-84-6 FAME
N-Methyl-N-(trimethylsilyl)trifluoracetamid (MSTFA) Macherey-Nagel 24589-78-4 Metabolite deriviatization
Pyridine Supleco 110-86-1 Metabolite deriviatization
Ribitol Supleco 22566-17-2 Internal standard for derivatized metabolites
Triacontanoic Acid Methyl Ester TCI Chemicals 629-83-4 FAME
Water Biosolve Chemicals 23214102 ULC-MS grade
Equipment
1.5 mL Safe-lock microcentrifuge tubes Eppendorf 3120086
2 mL Safe-lock microcentrifuge tubes Eppendorf 3120094
Balance Sartorius Corporation 14 557 572
DB-35ms, 30 m, 0,25 mm, 0,25 µm Aglient 123-3832 Analysis of derivatized metabolites
GC-MS system Leco Pegasus HT TOF-MS (LECO Corporation) Analysis of derivatized metabolites
Grinding Balls, Stainless Steel OPS DIAGNOSTICS GBSS 196-2500-10
MS system Exactive, Orbitrap-type, MS (Exactive, Thermo Fisher Scientific) Analysis of lipids
MS system Q Exactive Focus (Q Exactive™ Focus Hybrid Quadrupol-Orbitrap™
Massenspektrometer, Thermo Fisher Scientific)
Analysis of metabolites
Refrigerated microcentrifuge Eppendorf, model 5427R 22620701
Reversed Phase (RP) Bridged Ethyl Hybrid (BEH) C8 column
(100 mm × 2.1 mm containing 1.7 μm diameter particles)
Waters 186002878 Analysis of lipids
RP High Strength Silica (HSS) T3 column
(100 mm × 2.1 mm containing 1.8 μm diameter particles)
Waters 186003539 Analysis of metabolites
Shaker Eppendorf Thermomixer 5436 2050-100-05
Sonicator USC 300 TH 142-0084
Tissue grinding mixer mill Retsch, Mixer Mill MM 300 20.746.0001
UPLC system Waters Acquity UPLC system (Waters)
Vacuum concentrator Scan Speed Maxi Vac Alpha Evaporators 7.008.500.002
Vortex mixer Vortex-Genie 2, Model G560 SI-0236
Software
MetAlign Chromatogram processing
MzMine Chromatogram processing
R package "data.table"
R package "fujiplot" pleiotrpoic map
R package "genetics"
R package "Ime4" BLUPs calculation
R package "LDheatmap" LD plots
R package "MASS" transformation
R package "rMVP" GWAS
R version 4.0.4
RefinerMS Chromatogram processing
RefinerMS Genedata Expressionist Chromatogram processing
Tassel 5 Genotype filtering
Xcalibur Thermo Fisher Scientific OPTON-30965 Chromatogram processing

References

  1. Doerr, A. Global metabolomics. Nature Methods. 14 (1), 32 (2017).
  2. Fessenden, M. Metabolomics: Small molecules, single cells. Nature. 540 (7631), 153-155 (2016).
  3. Oliver, S. G., Winson, M. K., Kell, D. B., Baganz, F. Systematic functional analysis of the yeast genome. Trends in Biotechnology. 16 (9), 373-378 (1998).
  4. Fiehn, O. Metabolomics-the link between genotypes and phenotypes. Plant Molecular Biology. 48 (1), 155-171 (2002).
  5. Wu, S., et al. Mapping the Arabidopsis metabolic landscape by untargeted metabolomics at different environmental conditions. Molecular Plant. 11 (1), 118-134 (2018).
  6. Sysi-Aho, M., Katajamaa, M., Yetukuri, L., Orešič, M. Normalization method for metabolomics data using optimal selection of multiple internal standards. BMC Bioinformatics. 8 (1), 93 (2007).
  7. Chen, M., Rao, R. S. P., Zhang, Y., Zhong, C. X., Thelen, J. J. A modified data normalization method for GC-MS-based metabolomics to minimize batch variation. SpringerPlus. 3 (1), 439 (2014).
  8. Dunn, W. B., et al. Metabolic profiling of serum using Ultra Performance Liquid Chromatography and the LTQ-Orbitrap mass spectrometry system. Journal of Chromatography B. 871 (2), 288-298 (2008).
  9. Fiehn, O., et al. Metabolite profiling for plant functional genomics. Nature Biotechnology. 18 (11), 1157-1161 (2000).
  10. vander Kloet, F. M., Bobeldijk, I., Verheij, E. R., Jellema, R. H. Analytical error reduction using single point calibration for accurate and precise metabolomic phenotyping. Journal of Proteome Research. 8 (11), 5132-5141 (2009).
  11. Folch, J., Lees, M., Stanley, G. H. S. A simple method for the isolation and purification of total lipides from animal tissues. Journal of Biological Chemistry. 226 (1), 497-509 (1957).
  12. Fukushima, A., et al. Impact of clock-associated Arabidopsis pseudo-response regulators in metabolic coordination. Proceedings of the National Academy of Sciences of the United States of America. 106 (17), 7251-7256 (2009).
  13. Kerwin, R. E., et al. Network quantitative trait loci mapping of circadian clock outputs identifies metabolic pathway-to-clock linkages in Arabidopsis. The Plant Cell. 23 (2), 471-485 (2011).
  14. Tohge, T., et al. From models to crop species: Caveats and solutions for translational metabolomics. Frontiers in Plant Sciences. 2, 61 (2011).
  15. Salem, M., Bernach, M., Bajdzienko, K., Giavalisco, P. A simple fractionated extraction method for the comprehensive analysis of metabolites, lipids, and proteins from a single sample. Journal of Visualized Experiments:JoVE. (124), e55802 (2017).
  16. Tohge, T., Fernie, A. R. Combining genetic diversity, informatics and metabolomics to facilitate annotation of plant gene function. Nature Protocols. 5 (6), 1210-1227 (2010).
  17. Lisec, J., Schauer, N., Kopka, J., Willmitzer, L., Fernie, A. R. Gas chromatography mass spectrometry-based metabolite profiling in plants. Nature Protocols. 1 (1), 387-396 (2006).
  18. Osorio, S., Do, P. T., Fernie, A. R., Hardy, N. W., Hall, R. D. . Plant Metabolomics: Methods and Protocols. , 101-109 (2012).
  19. De Vos, R. C. H., et al. Untargeted large-scale plant metabolomics using liquid chromatography coupled to mass spectrometry. Nature Protocols. 2 (4), 778-791 (2007).
  20. Perez de Souza, ., Alseekh, L., Naake, S., Fernie, T., A, Mass spectrometry-based untargeted plant metabolomics. Current Protocols in Plant Biology. 4 (4), 20100 (2019).
  21. Pluskal, T., Castillo, S., Villar-Briones, A., Orešič, M. MZmine 2: Modular framework for processing, visualizing, and analyzing mass spectrometry-based molecular profile data. BMC Bioinformatics. 11 (1), 395 (2010).
  22. Watson, J. T., Sparkman, D. O. Electron Ionization. Introduction to mass spectrometry: Instrumentation, applications and strategies for data interpretation. , 315 (2007).
  23. Fernie, A. R., et al. Recommendations for reporting metabolite data. The Plant Cell. 23 (7), 2477 (2011).
  24. Treutler, H., et al. Discovering regulated metabolite families in untargeted metabolomics studies. Analytical Chemistry. 88 (16), 8082-8090 (2016).
  25. Wang, M., et al. Sharing and community curation of mass spectrometry data with Global Natural Products Social Molecular Networking. Nature Biotechnology. 34 (8), 828-837 (2016).
  26. Naake, T., Fernie, A. R. MetNet: Metabolite network prediction from high-resolution mass spectrometry data in R aiding metabolite annotation. Analytical Chemistry. 91 (3), 1768-1772 (2019).
  27. Chambers, J. M. . Statistical models in S. , (1991).
  28. Misra, B. B. Data normalization strategies in metabolomics: Current challenges, approaches, and tools. European Journal of Mass Spectrometry. 26 (3), 165-174 (2020).
  29. Livera, A. M. D., et al. Statistical methods for handling unwanted variation in metabolomics data. Analytical Chemistry. 87 (7), 3606-3615 (2015).
  30. Sakia, R. M. . The Box-Cox transformation technique: a review. 41 (2), 169-178 (1992).
  31. vanden Berg, R. A., Hoefsloot, H. C. J., Westerhuis, J. A., Smilde, A. K., vander Werf, M. J. Centering, scaling, and transformations: improving the biological information content of metabolomics data. BMC Genomics. 7, 142 (2006).
  32. Marees, A. T., et al. A tutorial on conducting genome-wide association studies: Quality control and statistical analysis. International Journal of Methods in Psychiatric Research. 27 (2), 1608 (2018).
  33. Torkamaneh, D., Laroche, J., Bastien, M., Abed, A., Belzile, F. Fast-GBS: a new pipeline for the efficient and highly accurate calling of SNPs from genotyping-by-sequencing data. BMC Bioinformatics. 18 (1), 5 (2017).
  34. Zhao, S., Agafonov, O., Azab, A., Stokowy, T., Hovig, E. Accuracy and efficiency of germline variant calling pipelines for human genome data. Scientific Reports. 10 (1), 20222 (2020).
  35. Bradbury, P. J., et al. TASSEL: software for association mapping of complex traits in diverse samples. Bioinformatics. 23 (19), 2633-2635 (2007).
  36. Bates, D., Mächler, M., Bolker, B., Walker, S. Fitting linear mixed-effects models using lme4. Journal of Statistical Software. 67 (1), (2015).
  37. Yin, L., et al. rMVP: A memory-efficient, visualization-enhanced, and parallel-accelerated tool for genome-wide association study. Genomics, Proteomics & Bioinformatics. , (2021).
  38. Kanai, M., et al. Genetic analysis of quantitative traits in the Japanese population links cell types to complex human diseases. Nature Genetics. 50 (3), 390-400 (2018).
  39. Salem, M. A., et al. An improved extraction method enables the comprehensive analysis of lipids, proteins, metabolites and phytohormones from a single sample of leaf tissue under water-deficit stress. Plant Journal: for Cell and Molecular Biology. 103 (4), 1614-1632 (2020).
  40. Balcke, G. U., et al. Multi-omics of tomato glandular trichomes reveals distinct features of central carbon metabolism supporting high productivity of specialized metabolites. The Plant Cell. 29 (5), 960-983 (2017).
  41. Leonova, T., et al. Does protein glycation impact on the drought-related changes in metabolism and nutritional properties of mature pea (Pisum sativum L.) seeds. International Journal of Molecular Sciences. 21 (2), 567 (2020).
  42. Alfonsi, K., et al. chemistry tools to influence a medicinal chemistry and research chemistry based organisation. Green Chemistry. 10 (1), 31-36 (2008).
  43. Bozek, K., et al. Organization and evolution of brain lipidome revealed by large-scale analysis of human, chimpanzee, macaque, and mouse tissues. Neuron. 85 (4), 695-702 (2015).
  44. Delgado, R., Muñoz, Y., Peña-Cortés, H., Giavalisco, P., Bacigalupo, J. Diacylglycerol activates the light-dependent channel TRP in the photosensitive microvilli of Drosophila melanogaster photoreceptors. The Journal of Neuroscience. 34 (19), 6679 (2014).
  45. Sharma, D. K., et al. UPLC-MS analysis of Chlamydomonas reinhardtii and Scenedesmus obliquus lipid extracts and their possible metabolic roles. Journal of Applied Phycology. 27 (3), 1149-1159 (2015).
  46. Dunn, W. B., Wilson, I. D., Nicholls, A. W., Broadhurst, D. The importance of experimental design and QC samples in large-scale and MS-driven untargeted metabolomic studies of humans. Bioanalysis. 4 (18), 2249-2264 (2012).
  47. Fan, S., et al. Systematic error removal using random forest for normalizing large-scale untargeted lipidomics data. Analytical Chemistry. 91 (5), 3590-3596 (2019).
  48. Larsson, S. J., Lipka, A. E., Buckler, E. S. Lessons from Dwarf8 on the strengths and weaknesses of structured association mapping. PLOS Genetics. 9 (2), 1003246 (2013).
  49. Platt, A., Vilhjálmsson, B. J., Nordborg, M. Conditions under which genome-wide association studies will be positively misleading. Genetics. 186 (3), 1045-1052 (2010).
  50. Nyholt, D. R. A simple correction for multiple testing for single-nucleotide polymorphisms in linkage disequilibrium with each other. American Journal of Human Genetics. 74 (4), 765-769 (2004).
  51. Teo, Y. Y. Common statistical issues in genome-wide association studies: a review on power, data quality control, genotype calling and population structure. Current Opinion in Lipidology. 19 (2), 133-143 (2008).
  52. Privé, F., Aschard, H., Ziyatdinov, A., Blum, M. G. B. Efficient analysis of large-scale genome-wide data with two R packages: bigstatsr and bigsnpr. Bioinformatics. 34 (16), 2781-2787 (2018).
  53. Alseekh, S., et al. Domestication of crop metabolomes: desired and unintended consequences. Trends in Plant Science. 26 (6), 650-661 (2021).
  54. Yano, K., et al. GWAS with principal component analysis identifies a gene comprehensively controlling rice architecture. Proceedings of the National Academy of Sciences of the United States of America. 116 (42), 21262 (2019).
  55. Wu, S., et al. Mapping the Arabidopsis metabolic landscape by untargeted metabolomics at different environmental conditions. Molecular Plant. 11 (1), 118-134 (2018).
  56. Ye, J., et al. An InDel in the promoter of Al-ACTIVATED MALATE TRANSPORTER9 selected during tomato domestication determines fruit malate contents and aluminum tolerance. The Plant Cell. 29 (9), 2249-2268 (2017).
  57. Zhang, W., et al. Genome assembly of wild tea tree DASZ reveals pedigree and selection history of tea varieties. Nature Communications. 11 (1), 3719 (2020).
  58. Tohge, T., Fernie, A. R. Annotation of plant gene function via combined genomics, metabolomics and informatics. Journal of Visualized Experiments: JoVE. (64), e3487 (2012).

Play Video

Cite This Article
Bulut, M., Fernie, A. R., Alseekh, S. Large-Scale Multi-Omics Genome-Wide Association Studies (Mo-GWAS): Guidelines for Sample Preparation and Normalization. J. Vis. Exp. (173), e62732, doi:10.3791/62732 (2021).

View Video