LEfSe (LDA Etki Boyutu), mikrobiyom verilerinde iki veya daha fazla grubu önemli ölçüde karakterize eden genomik özellikleri (genler, yollar ve taksonomiler gibi) tanımlamak için yüksek boyutlu biyobelirteç madenciliği için bir araçtır.
Çevrede ve sağlıkta kapalı biyolojik genomlara yönelik artan bir ilgi var. Farklı örnekler veya ortamlar arasındaki gruplar arası farklılıkları keşfetmek ve ortaya çıkarmak için, gruplar arasında istatistiksel farklılıklar olan biyobelirteçleri keşfetmek çok önemlidir. Doğrusal diskriminant analizi Etki Boyutu (LEfSe) uygulaması, iyi biyobelirteçlerin bulunmasına yardımcı olabilir. Orijinal genom verilerine dayanarak, kalite kontrolü ve taksonlara veya genlere dayalı farklı dizilerin nicelleştirilmesi gerçekleştirilir. İlk olarak, Kruskal-Wallis sıralama testi, istatistiksel ve biyolojik gruplar arasındaki spesifik farklılıkları ayırt etmek için kullanıldı. Daha sonra, farklılıkların tutarlı olup olmadığını değerlendirmek için önceki adımda elde edilen iki grup arasında Wilcoxon rütbe testi yapıldı. Son olarak, biyobelirteçlerin LDA skorlarına göre anlamlı derecede farklı gruplar üzerindeki etkisini değerlendirmek için doğrusal bir diskriminant analizi (LDA) yapılmıştır. Özetlemek gerekirse, LEfSe, biyolojik gruplar arasındaki istatistiksel farklılıkları karakterize eden genomik biyobelirteçleri tanımlamak için kolaylık sağlamıştır.
Biyobelirteçler, ölçülebilen biyolojik özelliklerdir ve enfeksiyon, hastalık veya çevre gibi bazı fenomenleri gösterebilir. Bunlar arasında, fonksiyonel biyobelirteçler, tek bir türün spesifik biyolojik fonksiyonları olabilir veya gen, protein, metabolit ve yollar gibi bazı türler için ortak olabilir. Ayrıca, taksonomik biyobelirteçler alışılmadık bir türü, bir grup organizmayı (krallık, filum, sınıf, düzen, aile, cins, tür), Amplikon Dizisi Varyansı (ASV)1 veya Operasyonel Taksonomik Birim (OTU)2’yi gösterir. Biyobelirteçleri daha hızlı ve doğru bir şekilde bulmak için, biyolojik verileri analiz etmek için bir araç gereklidir. Sınıflar arasındaki farklar, istatistiksel anlamlılık için standart testler ve biyolojik tutarlılığı ve etki alaka düzeyini kodlayan ek testlerle birlikte LEfSe ile açıklanabilir3. LEfSe, bir galaksi modülü, bir conda formülü, bir docker görüntüsü olarak mevcuttur ve bioBakery (VM ve bulut)4’e dahil edilmiştir. Genel olarak, mikrobiyal çeşitliliğin analizi genellikle bir örnek topluluğunun belirsiz dağılımı için parametrik olmayan bir test kullanır. Sıralama toplamı testi, numunelerin değerini değiştirmek için numunelerin sıralamasını kullanan parametrik olmayan bir test yöntemidir. Örneklem gruplarının farklılığına göre Wilcoxon rütbe toplamı testi ile iki numuneye, Kruskal-Wallis testi 5,6 ile birden fazla numuneye ayrılabilir. Özellikle, birden fazla numune grubu arasında önemli farklılıklar olduğunda, birden fazla numunenin çift yönlü karşılaştırılması için bir rank-sum testi yapılmalıdır. 1936’da Ronald Fisher tarafından icat edilen LDA (Doğrusal Diskriminant Analizi anlamına gelir), Fisher’s Linear Discriminant7 olarak da bilinen bir denetimli öğrenme türüdür. Makine öğrenimi veri madenciliğinin mevcut alanında klasik ve popüler bir algoritmadır.
Burada, LEfSe testi Conda ve Galaxy sunucuları tarafından optimize edilmiştir. Mikrobiyal toplulukların LDA skorları ve görselleştirme sonuçları ile farklı gruplar arasındaki anlamlı farklılıkları göstermek için üç grup 16S rRNA gen dizisi analiz edilmiştir.
Burada, farklı gruplardaki biyobelirteçlerin tanımlanması ve karakterizasyonu için protokol açıklanmaktadır. Bu protokol, mikroorganizmaların OTU’ları gibi diğer numune türleri için kolayca uyarlanabilir. LEfSe’nin istatistiksel yöntemi, her gruptaki karakteristik mikroorganizmaları (varsayılan LDA >2), yani bu grupta diğerlerine göre daha bol bulunan mikroorganizmaları bulabilir12. LEfSe, kullanıcıların web sayfalarında da LEfSe analizi yapabileceği hem yerel hem de web Li…
The authors have nothing to disclose.
Bu çalışma, Merkezi Kamu Refahı Araştırma Enstitüleri (TKS170205) ve Bilim ve Teknoloji Geliştirme Vakfı için Temel Araştırma Fonları ve Tianjin Su Taşımacılığı Mühendisliği Araştırma Enstitüsü (TIWTE), M.O.T. (KJFZJJ170201) tarafından desteklenmiştir.