生物标志物是可以测量的生物学特征,可以指示一些现象,如感染,疾病或环境。其中,功能性生物标志物可以是单一物种的特定生物学功能或某些物种共有的,如基因、蛋白质、代谢物和通路等。此外,分类生物标志物表明一种不寻常的物种,一组生物(王国,门,类,目,科,属,物种),扩增子序列变异(ASV)1或操作分类单位(OTU)2。为了更快,更准确地找到生物标志物,需要一种分析生物数据的工具。类之间的差异可以通过LFSe与统计显著性的标准测试以及编码生物学一致性和效应相关性的其他测试3来解释。LEfSe可作为星系模块,conda公式,docker图像提供,并包含在bioBakery(VM和cloud)4中。通常,微多样性分析通常使用非参数测试来检测样本群落的不确定分布。秩和检验是一种非参数检验方法,它使用样本的秩来代替样本的值。根据样本组的差异,可以分为两个具有Wilcoxon秩和测试的样本和具有Kruskal-Wallis测试5,6的多个样本。值得注意的是,当多组样本之间存在显着差异时,应执行多个样本成对比较的秩和检验。LDA(代表线性判别分析)由Ronald Fisher于1936年发明,是一种监督学习,也称为Fisher’s Linear Discriminant7。它是当前机器学习数据挖掘领域的经典和流行的算法。
Chang, F., He, S., Dang, C. Assisted Selection of Biomarkers by Linear Discriminant Analysis Effect Size (LEfSe) in Microbiome Data. J. Vis. Exp. (183), e61715, doi:10.3791/61715 (2022).