Summary

Metabolik Yol Bilgilerinin GWAS Analizleri için Bir Pathway Association Çalışma Aracı

Published: July 01, 2020
doi:

Summary

Araştırmacılar, Pathway Association Çalışma Aracı’nı (PAST) parlak uygulama veya R konsolu aracılığıyla çalıştırarak, ilgili metabolik yolları araştırarak genom çapındaki ilişki çalışmalarının (GWAS) sonuçlarının biyolojik anlamı hakkında daha derin bir anlayış kazanabilirler.

Abstract

Son zamanlarda, metabolik yol analizi kullanılarak genom çapındaki ilişkilendirme çalışması (GWAS) verilerini yorumlamak için daha önce tanımlanmış bir yöntemin yeni bir uygulaması geliştirilmiş ve piyasaya salmıştır. Pathway Association Çalışma Aracı (PAST), kullanıcı dostu ve yavaş çalışan analizlerle ilgili endişeleri gidermek için geliştirilmiştir. Bu yeni kullanıcı dostu araç Bioconductor ve Github’da piyasaya sürüldü. Testlerde PAST, daha önce yirmi dört veya daha fazla saat gerektiren analizleri bir saatten kısa bir sürede yaptı. Bu makalede, PAST’i çalıştırmak için Parlak uygulamayı veya R konsolunu kullanma protokolünü sunuyoruz.

Introduction

Genom çapındaki ilişki çalışmaları (GWAS), karmaşık özellikleri ve bunlarla ilişkili genomik bölgeleri incelemek için popüler bir yöntemdir1,2,3. Bu tür bir çalışmada, yüz binlerce tek nükleotid polimorfizm (SNP) belirteci, özellik ile ilişkileri açısından test edilir ve derneklerin önemi değerlendirilir. Çalışma için yanlış bulma oranı (FDR) eşiğini (veya başka bir önem eşiğini) karşılayan işaretleyici özellik ilişkilendirmeleri korunur, ancak gerçek ilişkilendirmeler filtrelenebilir. Karmaşık, polijenik özellikler için, her genin etkisi küçük olabilir (ve böylece filtrelenebilir) ve bazı aleller sadece çalışmada bulunmayan belirli koşullarla ifade edilir3. Bu nedenle, birçok SNP özellik ile ilişkili olarak korunabilir, ancak her biri çok küçük bir etkiye sahip olabilir. Çok fazla SNP çağrısı eksik olacak ve özelliğin biyolojik anlamının ve genetik mimarisinin bir yorumu eksik ve kafa karıştırıcı olabilir. Metabolik yol analizi, biyolojik işlevlerine göre gruplanmış genlerin kombine etkilerine odaklanarak bu sorunların bazılarını ele almaya yardımcı olabilir4,5,6.

Bu makalede açıklanan yöntemin önceki bir uygulaması kullanılarak çeşitli çalışmalar tamamlanmıştır. Aflatoksin birikimi7, mısır kulak kurdu direnci8ve yağ biyosentezi9 önceki uygulama ile çalışılmıştır. Bu analizler başarılı olsa da, analiz araçları R, Perl ve Bash’in bir kombinasyonuyla yazıldığı ve işlem hattı otomatik olmadığı için analiz süreci karmaşık, zaman alıcı ve hantaldı. Her analiz için bu yöntemi değiştirmek için gereken özel bilgi nedeniyle, şimdi diğer araştırmacılarla paylaşılabilen yeni bir yöntem geliştirilmiştir.

Pathway Association Çalışma Aracı (PAST)10, programlama dilleri hakkında daha az bilgi gerektirerek ve analizleri daha kısa sürede çalıştırarak önceki yöntemin eksikliklerini gidermek için tasarlanmıştır. Yöntem mısırla test edilirken, PAST türe özgü varsayımlarda bulunmiyor. PAST, Parlak bir uygulama olarak R konsolu üzerinden çalıştırılabilir ve çevrimiçi bir sürümün yakında MaizeGDB’de kullanıma sunulması bekleniyor.

Protocol

1. Kurulum Henüz yüklenmemişse R’yi yükleyin.NOT: PAST R ile yazılmıştır ve bu nedenle kullanıcılarının R yüklü olduğunu gerektirir. Bu yazının yazıldığı sırada, PAST’ı doğrudan Bioconductor’dan yüklemek R4.0 gerektirir.  PAST’in eski sürümleri R3.6 için Bioconductor’dan, PAST ise R3.5’li kullanıcılar için Github’dan yüklenebilir. R kurulum talimatları aşağıdaki bağlantıdan indirilebilir: https://www.r-project.org/. RStudio Desktop’ın en son sürümünü yükleyin veya RStudio’yu güncelleyin (isteğe bağlı).NOT: RStudio, R diliyle çalışmak için yararlı bir ortamdır. Kurulumu, özellikle PARLAK GUI uygulaması yerine komut satırında PAST çalıştırmayı seçenler için önerilir. RStudio ve kurulum talimatları aşağıdaki bağlantıda bulunabilir: https://rstudio.com/products/rstudio/. Bioconductor11’den PAST’ı Biyoikondüktör ile ilgili talimatları izleyerek yükleyin.NOT: Bioconductor aracılığıyla kurulum, PAST’in bağımlılıklarının yüklenmesini işlemelidir. Ayrıca, PAST Github12′ den yüklenebilir, ancak Github’dan yüklemek bağımlılıkları otomatik olarak yüklemez. PAST Shiny’yi yükleyin (isteğe bağlı). “app” dosyasını indirin. R” github deposunun Sürümler sayfasından: https://github.com/IGBB/PAST/releases/ ve indirilen dosyanın nerede olduğunu unutmayın.NOT: PAST, yöntemlerini doğrudan R ile çağırarak kullanılabilir, ancak R’ye daha az aşina olan kullanıcılar, rehberli bir kullanıcı arabirimi sağlayan PAST Shiny uygulamasını çalıştırabilir. PAST Shiny, PAST Github deposunun shiny_app dalında bulunan bir R komut dosyasıdır. PAST Shiny ilk çalıştırma sırasında bağımlılıklarını yüklemeye çalışacaktır. Uygulamayı aşağıda açıklanan üç yoldan biriyle başlatarak analize başlayın. RStudio ile PAST Parlak RStudio’yu kullanarak, uygulamanın bulunduğu klasörde yeni bir proje oluşturun. R bulunur. Dosya |’nı tıklatın Yeni Proje ve bu klasörü seçin. Yeni bir proje oluşturulduktan sonra uygulamayı açın. R dosyası daha önce indirildi. RStudio bu uygulamayı tanır. R parlak bir uygulamadır ve görüntülenen kaynak kodunun üstündeki çubukta bir Uygulama Çalıştır düğmesi oluşturur. Uygulamayı Çalıştır ‘ıtıklatın. RStudio daha sonra PAST Shiny uygulamasını görüntüleyen bir pencere başlatacak. R Konsollu PAST Shiny R’yi başlatın ve PAST Shiny uygulamasını başlatmak için aşağıdaki kodu çalıştırın: shiny::runApp(‘yol/klasör/ile/parlak/uygulama. R’. Tırnak işaretleri metnini uygulamanın bulunduğu klasörle değiştirin. R indirildi ve alıntılar sakla. R Shiny olmadan GEÇMİş PAST’i yüklemek için R Console’da kitaplığı (PAST) çalıştırın. 2. Parlak analizi özelleştirin (isteğe bağlı) Analiz başlığını “Yeni Analiz”den, birden çok analizin izlenmesine yardımcı olan çalıştırılma türünü daha iyi yansıtan bir şeyle değiştirin (bkz. Şekil 1). Şekil 1. Bu rakamın daha büyük bir versiyonunu görüntülemek için lütfen buraya tıklayın. Çekirdek sayısını ve modu değiştirin. Çekirdek sayısını makinedeki toplam sayıyla 1 arasında herhangi bir sayıya ayarlayın, ancak GEÇMIŞ’e daha fazla kaynak ayırmanın makinedeki diğer işlemleri yavaşlatabileceğini unutmayın. Modu bölüm 6’daki açıklamaya göre ayarlayın. 3. GWAS verilerini yükleyin NOT: GWAS verilerinin sekmeyle sınırlandırılmış olduğunu doğrulayın. İlişkilendirme dosyasının aşağıdaki sütunları içerdiğinden emin olun: özellik, işaret adı, lokus veya kromozom, kromozom üzerindeki konum, p değeri ve işaretleyici için R2 değeri. Efekt dosyasının aşağıdaki sütunları içerdiğinden emin olun: özellik, işaret adı, locus veya kromozom, kromozom üzerindeki konum ve efekt. Kullanıcı verileri yüklerken sütunların adlarını belirtebileceğinden, bu sütunların sırası önemli değildir. Ek sütunlar yoksayılır. TASSEL13 bu dosyaları üretmek için kullanılabilir. GWAS verilerini PAST Shiny ile yükleyin. İlişkilendirme Dosyası ve Efekt dosyası seçim kutularını kullanarak bir ilişkilendirlik dosyası ve efekt dosyası seçin. Dosya seçim kutularının altındaki İlişkilendirme Sütunu Adı ve Efekt Sütunları Adı giriş kutularındaki sütun adlarını verilerdeki sütun adlarını yansıtacak şekilde değiştirin. Şekil 2. Bu rakamın daha büyük bir versiyonunu görüntülemek için lütfen buraya tıklayın. GWAS verilerini R Konsolu’na PAST ile yükleyin. Aşağıdaki kodu değiştirin ve çalıştırın:gwas_data = load_GWAS_data(“yol/association_file.tsv”, “yol/yol/effects_file.tsv”, association_columns = c(“Özellik”, “İşaretçi”, “Locus”, “Site”, “p”, “marker_R2”), effects_columns = c(“Özellik”, “İşaretçi”, “Locus”, “Site”, “Efekt”) NOT: GWAS dosyalarının gerçek konumunun yollarını değiştirin. association_columns ve effects_columns için sağlanan değerler varsayılan değerlerdir. Adlar varsayılan değerlerle eşleşmezse, sütun adlarını belirtin. Aksi takdirde, bunlar atlanabilir. 4. Yük bağlantı dengesi (LD) verileri NOT: Bağlantı dengesi (LD) verilerinin sekmeyle sınırlandırılmış olduğunu ve aşağıdaki veri türlerini içerdiğini doğrulayın: Locus, Position1, Site1, Position2, Site2, Position1 ve Position2 arasındaki temel çiftler halinde mesafe ve R2 değeri. LD verilerini PAST Shiny ile yükleyin. LD verilerini içeren dosyayı seçin. Gerekirse, dosya seçim kutusunun altındaki LD Sütun Adları giriş kutularındaki sütun adlarını LD verilerindeki sütun adlarıyla eşleşecek şekilde değiştirin. Şekil 3. Bu rakamın daha büyük bir versiyonunu görüntülemek için lütfen buraya tıklayın. R Konsolu’na GEÇMIŞle LD Verileri Yükleyin. LD verilerini yüklemek için aşağıdaki kodu değiştirin ve çalıştırın:LD = load_LD(“yol//LD.tsv”, LD_columns = c(“Locus1”, “Konum1”, “Site1”, “Konum2”, “Site2”, “Dist_bp”, “R.2”)NOT: Yolu LD dosyasının gerçek konumuna değiştirin. LD_columns için sağlanan değerler varsayılan değerlerdir. Adlar bu varsayılanlarla eşleşmezse, sütunların doğru adlarını belirtin; aksi takdirde, bunlar atlanabilir. 5. Genlere SNP’ler atayın NOT: Ek açıklamaları GFF biçiminde indirin veya başka bir şekilde bulun. Bu ek açıklamalar genellikle belirli organizmalar için çevrimiçi veritabanlarında bulunabilir. Ek açıklamalar verilerinin kalitesi yol analizinin kalitesini etkileyeceğinden, düşük kaliteli ek açıklamalar konusunda dikkatli olun. Bu ek açıklamaların ilk sütununun (kromozom) ilişkilendirilmez, efektler ve LD verilerindeki locus/kromozomun biçimiyle eşleştiğini onaylayın. Örneğin, GWAS ve LD veri dosyaları ilk kromozomu “1” olarak adlandırıyorsa, ek açıklamalar ilk kromozomu “chr1” olarak adlandırmamalıdır. PAST Shiny ile genlere SNP’ler atayın.NOT: Uygun bir R2 kesmesinin belirlenmesi hakkında daha fazla bilgi Tang ve ark.6’da , “YOL analizi için SNP’den gen algoritmasına” adlı bölümde bulunabilir. GFF ek açıklamalarını içeren dosyayı seçin. Hangi pencere boyutunun ve R2 kesmesinin düşünülen türler için en uygun olduğunu düşünün ve varsayılanlar yüklenen verilere uymuyorsa değiştirin.NOT: PAST’deki varsayılan değerler öncelikle mısır için uygun değerleri yansıtır. Bu adımda, GEÇMİş Parlak analizin başında ayarlanan çekirdek sayısı (Adım 2.2) kullanılır. Şekil 4. Bu rakamın daha büyük bir versiyonunu görüntülemek için lütfen buraya tıklayın. R Konsolu’nda GEÇMIŞ olan genlere SNP’ler atayın. Genlere SNP atamak için aşağıdaki kodu değiştirin ve çalıştırın:gen = assign_SNPs_to_genes(gwas_data, LD, “yol/anotations.gff”, c(“gen”), 1000, 0,8, 2)NOT: Bu örnek kodda, birkaç varsayılan öneri sağlanır: 1000, genleri aramak için SNP’nin etrafındaki pencerenin boyutudur; 0.8, R2için kesme değeridir; 2, paralel işleme için kullanılan çekirdek sayısıdır. Ek açıklamaların yolu da ek açıklamalar dosyasının gerçek konumuna değiştirilmelidir. 6. Önemli yolları keşfedin NOT: Pathways dosyasının, her yoldaki her gen için bir satırla birlikte sekmeyle ayrılmış biçimde aşağıdaki verileri içerdiğini doğrulayın: yol kimliği – “PWY-6475-1” gibi bir tanımlayıcı; yol açıklaması – yolların “trans-likopen biyosentezi” gibi ne yaptığının daha uzun bir açıklaması; gen – ek açıklamalarda verilen isimlerle eşleşmesi gereken yoldaki bir gen. Yol bilgileri büyük olasılıkla MaizeGDB gibi belirli organizmalar için çevrimiçi veritabanlarında bulunabilir. Kullanıcı tarafından belirtilen ikinci seçenek moddur. “Artan”, verim gibi ölçülen özelliğin artan bir değeri istendiğinde yansıtan fenotipleri ifade ederken, “azalan”, böcek hasar derecelendirmeleri gibi ölçülen değerlerde bir düşüşün faydalı olduğu bir özelliği ifade eder. Yolların önemi daha önce açıklananyöntemler 4, 6,14kullanılarak test edilir. PAST Shiny ile önemli yolları keşfedin. Yol verilerini içeren dosyayı seçin ve çözümleme seçeneklerinde modun seçili olduğundan emin olun. Gerekirse, analiz için onu korumak için bir yolda olması gereken genlerin sayısını ve etkinin önemini test etmek için boş dağılımı oluşturmak için kullanılan permütasyonların sayısını değiştirin. Şekil 5. Bu rakamın daha büyük bir sürümünü görüntülemek için lütfen buraya tıklayın. NOT: Bu adımda, GEÇMIŞ Parlak analizinin (Adım 2.2) başında ayarlanan çekirdek sayısı ve mod kullanılır. Varsayılan gen sayısı şu anda 5 gen olarak belirlenmiştir, bu nedenle daha az bilinen genlere sahip yollar çıkarılacaktır. Kullanıcı, daha kısa yollar eklemek için bu değeri 4 veya 3’e düşürebilir, ancak bunu yapmak yanlış olumlu sonuçlar riskiyle karşı karşıya kalacaktır. Bu değerin artırılması analizin gücünü artırabilir, ancak analizden daha fazla yol kaldıracaktır. Kullanılan permütasyon sayısını değiştirmek testin gücünü arttırır ve azaltır. R Console’da PAST ile önemli yolları keşfedin. Önemli yolları bulmak için aşağıdaki kodu değiştirin ve çalıştırın:rugplots_data <- find_pathway_significance(genler, "yol/yol/yollar.tsv", 5, "artan", 1000, 2)NOT: Bu örnek kodda, önerilen birkaç varsayılan değer sağlanır. 5, yolu analizde tutmak için bir yolda olması gereken minimum gen sayısıdır, artan ölçülen özelliğin artan bir miktarını ifade eder (kullanıcının özellikten bağımsız olarak hem artan hem de azalan çalışması önerilir; veri yorumlama ikisi için farklılık gösterir, ancak), 1000, boş dağılımı belirlemek için etkileri örnekleme sayısıdır, ve 2 paralel işleme için kullanılan çekirdek sayısıdır. Yolu, yollar dosyasının gerçek konumuna değiştirin. 7. Rugplots’ı Görüntüleyin PAST Parlak ile Rugplots görüntüleyin. Tüm girişler yüklendikten ve ayarlandıktan sonra Analize Başla ‘yıtıklatın. Bir ilerleme çubuğu görüntülenir ve analizin en son hangi adımının tamamlandığını gösterir. Analiz tamamlandığında, PAST Shiny Sonuçlar sekmesine geçer. Sol sütunda bir sonuç tablosu (“yollar” olarak etiketlenmiştir) ve Rugplots sağ sütunda (“çizimler” olarak etiketlenmiş) görüntülenir. Filtreleme parametrelerini denetlemek için kaydırıcıyı kullanın. Filtreleme düzeyi tatmin edici olduğunda, tüm görüntüleri ve tabloları analiz başlığıyla adlandırılan bir ZIP dosyasına tek tek indirmek için sol alttaki Sonuçları İndir düğmesini tıklatın. Bu ZIP dosyası filtre uygulanmış tabloyu, filtrelenmemiş tabloyu ve filtre uygulanmış tablodaki yol başına bir görüntü içerir. Şekil 6. Bu rakamın daha büyük bir versiyonunu görüntülemek için lütfen buraya tıklayın. Şekil 7. Bu rakamın daha büyük bir versiyonunu görüntülemek için lütfen buraya tıklayın. R Konsolunda GEÇMIŞle Rugplots’ı Görüntüleme Sonuçları kaydetmek için aşağıdaki kodu değiştirin ve çalıştırın:plot_pathways(rugplots_data, “pvalue”, 0,02, “artan”, “output_folder”)NOT: Bu örnek kodda, önerilen birkaç varsayılan değer sağlanır. pvalue, kullanıcı tarafından bir önem eşiği seçildikten sonra önemsiz yolları filtrelemek için kullanılabilecek verileri sağlar; 0.02, filtrelemede kullanılan varsayılan değerdir ve artan, ölçülen özelliğin artan bir miktarını ifade eder (kullanıcının özelliğinden bağımsız olarak hem artan hem de azalan çalışması önerilir; veri yorumlama ikisi için farklılık gösterecektir); output_folder, görüntülerin ve tabloların yazılacağı klasördür (bu klasör işlevi çalıştırmadan önce bulunmalıdır). Filtre uygulanmış sonuçlar, filtre uygulanmamış sonuçlar ve filtre uygulanmış sonuçlardaki her yol için tek tek görüntüler tablosu bu klasöre yazılır.

Representative Results

Sonuçlar GEÇMIŞ yazılım aracının çalıştırılmasından sonra üretilmezse, tüm giriş dosyalarının doğru biçimlendirildiğinden emin olun. Tahıl rengindeki bir mısır GWAS’ını temel alan PAST paketindeki örnek veriler kullanılarak yapılan başarılı bir çalışma Şekil 8’de gösterilmiştir. Bu tablo ve elde edilen görüntü, Sonuçları İndir düğmesi kullanılarak indirilebilir. İndirilen görüntünün bir örneği Şekil 210’da gösterilmiştir. Yanlış ayarlar biyolojik olarak mantıklı olmayan sonuçlara yol açabilir, ancak yanlışlığı belirlemek, seçilen ayarların geçerliliğini iki kez kontrol etmesi ve ilgi çekicilik özelliği ile ilgili bilinen tüm kanıtları göz önünde bulundurması gereken araştırmacıya bağlı olmalıdır. Şekil 910, tahıl rengi için fenotiplenmiş 288 inbred çizgiden oluşan bir mısır paneli ile oluşturulan GWAS sonuçlarının yol analizinden üretilen rugplot’unu göstermektedir. Fenotiplerin “beyaz” veya “sarı” olduğu bu basit örnek, parlak sarı karotenoid pigmentlerin oluşturulmasından sorumlu yolun bilinmesi ve fenotipin çoğundan sorumlu olması gerektiği için kullanılmıştır. Böylece, trans likopen biyosentez yolunun (karotenoid üreten) tahıl rengi ile önemli ölçüde ilişkili olduğunu görmeyi bekliyorduk, ki öyle. Yol kimliği ve adı grafiğin en üstünde listelenir. Grafiğin yatay ekseni, analize dahil edilen tüm genleri, özellik üzerindeki en büyük etkiden en küçüğe doğru sıralanmış olarak soldan sağa sıralar. Bununla birlikte, sadece trans likopen biyosentez yolundaki genler işaretlenir (grafiğin üst kısmında, tarama izleri olarak, analizdeki diğer tüm genlere kıyasla etkilerinin gen sıralamasında görünür). Bu yolda 7 gen var. Çalışan zenginleştirme puanı (ES) dikey eksen boyunca çizilir. Her gen için ES, etki sırasına göre çalışan toplama eklenir ve toplam analiz edilen gen sayısına ayarlanır. Böylece, biri yatay eksen boyunca hareket ettikçe puan değişir ve daha büyük etki genleri dahil edildikçe artmaya eğilimlidir, ancak bir noktada, etkideki artış başka bir gen eklemiş olmanın ayarından daha küçüktür ve tüm puan azalmaya başlar. Çalışan ES çizgisinin tepe noktası noktalı dikey çizgi ile işaretlenir; Bu, tüm yol için ES’dir ve program tarafından yolun seçilip bir rugplot olarak sunulup sunulmamasını belirlemek için kullanılır. Şekil 8: PAST Shiny’nin tamamlanan çalışması. Şekil 9: PAST’in tamamlanmış çalışmasından (veya Shiny’den indirilen) yol görüntüsü. Bu rakam Thrash ve ark.10’dan alıntılanmıştır. Bu rakamın daha büyük bir sürümünü görüntülemek için lütfen buraya tıklayın.

Discussion

PAST’ın birincil hedefi, GWAS verilerinin metabolik yol analizlerini, özellikle insan olmayan ve hayvan olmayan organizmalar için daha geniş bir kitleye ulaştırmaktır. GEÇMIŞe alternatif yöntemler genellikle insanlara veya hayvanlara odaklanan komut satırı programlarıdır. Kullanıcı dostu olmak, HEM Parlak bir uygulama geliştirmeyi seçmede hem de uygulamayı serbest bırakmak için R ve Bioconductor’ı kullanmayı seçmede PAST’in gelişiminde birincil hedefti. Kullanıcıların PAST’ı kullanmak için programları nasıl derleyeceklerini öğrenmeleri gerekmez.

Çoğu analiz yazılımı türünde olduğu gibi, PAST sonuçları yalnızca giriş verileri kadar iyidir; giriş verilerinde hatalar varsa veya yanlış biçimlendirilmişse, PAST başarısız olur veya bilgisiz sonuçlar üretemez. GWAS verilerinin, LD verilerinin, ek açıklamaların ve yol dosyalarının doğru biçimlendirildiğinden emin olmak, PAST’den doğru çıktı almak için kritik öneme sahiptir. PAST yalnızca iki alelik işaretleyicileri analiz eder ve her giriş verisi kümesi için yalnızca bir özellik çalıştırabilir. Buna ek olarak, zayıf genotipleme veya yanlış veya kesin olmayan fenotipleme tarafından üretilen GWAS verilerinin de net veya tekrarlanabilir sonuçlar üretmesi olası değildir. PAST, GWAS sonuçlarının biyolojik olarak yorumlanmasına yardımcı olabilir, ancak çevresel varyasyon, deneysel hata veya nüfus yapısı düzgün bir şekilde hesaba katılmadıysa kaotik veri kümelerini açıklığa kavuşturma olasılığı düşüktür.

Kullanıcılar, hem Parlak uygulamada hem de bu parametreleri GEÇMIŞ’in R konsolundaki işlevlerine geçirerek analizin bazı parametrelerini değiştirmeyi seçebilir. Bu parametreler PAST tarafından bildirilen sonuçları değiştirebilir ve kullanıcılar bunları varsayılanlardan değiştirirken dikkatli olmalıdır. LD kullanıcılar tarafından ölçüldüğünden, genellikle GWAS’ta da kullanılan aynı işaretleyici veri kümesi kullanılarak, LD ölçümleri popülasyona özgüdür. Tüm çalışmalar için, özellikle mısır dışındaki türler için (özellikle kendi kendine tozlaşan, poliploid veya yüksek heterojen türler), varsayılanlardaki değişiklikler garanti edilebilir.

Disclosures

The authors have nothing to disclose.

Acknowledgements

Hiç kimse.

Materials

Computer NA NA Any computer with 8GB RAM should be sufficient
R R Project NA R 3.6 or greater is required to install from Bioconductor

References

  1. Rafalski, J. Association genetics in crop improvement. Current Opinion in Plant Biology. 13 (2), 174-180 (2010).
  2. Yan, J., Warburton, M., Crouch, J. Association Mapping for Enhancing Maize (Zea mays L.) Genetic Improvement. Crop Science. 51 (2), 433-449 (2011).
  3. Xiao, Y., Liu, H., Wu, L., Warburton, M., Yan, J. Genome-wide Association Studies in Maize: Praise and Stargaze. Molecular Plant. 10 (3), 359-374 (2017).
  4. Wang, K., Li, M., Bucan, M. Pathway-Based Approaches for Analysis of Genomewide Association Studies. The American Journal of Human Genetics. 81 (6), 1278-1283 (2007).
  5. Weng, L., et al. SNP-based pathway enrichment analysis for genome-wide association studies. BMC Bioinformatics. 12 (1), 99 (2011).
  6. Tang, J., Perkins, A., Williams, W., Warburton, M. Using genome-wide associations to identify metabolic pathways involved in maize aflatoxin accumulation resistance. BMC Genomics. 16 (1), 673 (2015).
  7. Warburton, M., et al. Genome-Wide Association Mapping of Aspergillus flavus and Aflatoxin Accumulation Resistance in Maize. Crop Science. 55 (5), 1857-1867 (2015).
  8. Warburton, M., et al. Genome-Wide Association and Metabolic Pathway Analysis of Corn Earworm Resistance in Maize. The Plant Genome. 11 (1), 170069 (2018).
  9. Li, H., Thrash, A., Tang, J., He, L., Yan, J., Warburton, M. Leveraging GWAS data to identify metabolic pathways and networks involved in maize lipid biosynthesis. The Plant Journal. 98 (5), 853-863 (2019).
  10. Thrash, A., Tang, J., DeOrnellis, M., Peterson, D., Warburton, M. PAST: The Pathway Association Studies Tool to Infer Biological Meaning from GWAS Datasets. Plants. 9 (1), 58 (2020).
  11. Adam, T., Mason, D. . PAST: Pathway Association Study Tool (PAST). Bioconductor version: Release (3.10). , (2020).
  12. Thrash, A., DeOrnellis, M. . IGBB/PAST. , (2019).
  13. Bradbury, P., et al. TASSEL: software for association mapping of complex traits in diverse samples. Bioinformatics. 23 (19), 2633-2635 (2007).
  14. Subramanian, A., et al. Gene set enrichment analysis: A knowledge-based approach for interpreting genome-wide expression profiles. Proceedings of the National Academy of Sciences U.S.A. 102, 15545-15550 (2005).

Play Video

Cite This Article
Thrash, A., Warburton, M. L. A Pathway Association Study Tool for GWAS Analyses of Metabolic Pathway Information. J. Vis. Exp. (161), e61268, doi:10.3791/61268 (2020).

View Video