Summary

マイクロバイオームデータにおける線形判別分析効果サイズ(LEfSe)によるバイオマーカーの補助選択

Published: May 16, 2022
doi:

Summary

LEfSe(LDA Effect Size)は、マイクロバイオームデータ内の2つ以上のグループを有意に特徴付けるゲノム特徴(遺伝子、経路、分類法など)を特定するための高次元バイオマーカーマイニング用のツールです。

Abstract

環境や健康における閉鎖的な生物学的ゲノムに対する関心が高まっています。異なるサンプルまたは環境間のグループ間の差異を調査および明らかにするためには、グループ間で統計的な差異を有するバイオマーカーを発見することが極めて重要である。線形判別分析の効果サイズ(LEfSe)の適用は、優れたバイオマーカーを見つけるのに役立ちます。元のゲノムデータに基づいて、品質管理、分類群または遺伝子に基づく異なる配列の定量化が行われる。まず、クラスカル-ウォリス順位検定を用いて、統計群と生物学的群の特定の差異を区別した。次に、前のステップで得られた2つのグループ間でウィルコクソン順位検定を実施し、差が一貫しているかどうかを評価しました。最後に、線形判別分析(LDA)を実施し、LDAスコアに基づいて有意に異なるグループに対するバイオマーカーの影響を評価した。要約すると、LEfSeは、生物学的グループ間の統計的差異を特徴付けるゲノムバイオマーカーを同定するための利便性を提供しました。

Introduction

バイオマーカーは、測定可能な生物学的特性であり、感染、疾患、または環境などのいくつかの現象を示すことができる。その中で、機能的バイオマーカーは、遺伝子、タンパク質、代謝産物および経路などの単一種の特定の生物学的機能、またはいくつかの種に共通するものであり得る。さらに、分類学的バイオマーカーは、異常な種、生物群(王国、門、クラス、秩序、家族、属、種)、アンプリコン配列可変量(ASV)1、または運用分類学単位(OTU)2を示す。バイオマーカーをより迅速かつ正確に見つけるためには、生体データを解析するためのツールが必要です。クラス間の違いは、LEfSeと統計的有意性の標準検定、および生物学的一貫性および効果関連性をコードする追加検定と組み合わせることによって説明することができます3。LEfSeは、銀河モジュール、コンダ式、ドッカー画像として利用可能で、bioBakery(VMおよびクラウド)4に含まれています。一般に、微生物多様性の分析では、サンプルコミュニティの不確実な分布に対してノンパラメトリック検定が使用されることがよくあります。ランク合計検定はノンパラメトリック検定法で、サンプルのランクを使用してサンプルの値を置き換えます。サンプルグループの違いに応じて、ウィルコクソン順位和検定では2つのサンプルに、クラスカル・ウォリス検定では複数のサンプルに分けることができます5,6。特に、複数のサンプルグループ間に有意差がある場合は、複数のサンプルのペアワイズ比較のランク和検定を実行する必要があります。1936年にロナルド・フィッシャーによって発明されたLDA(線形判別分析の略)は、教師あり学習の一種であり、フィッシャーの線形判別式7としても知られています。これは、機械学習データマイニングの現在の分野で古典的で人気のあるアルゴリズムです。

ここでは、LEfSeアッセイはCondaおよびGalaxyサーバーによって最適化されています。16S rRNA遺伝子配列の3つのグループを解析して、微生物群集のLDAスコアおよび可視化結果を有する異なるグループ間の有意差を実証する。

Protocol

注:プロトコルは、Segata et al.3の研究から供給され、修正されました。このメソッドは、https://bitbucket.org/biobakery/biobakery/wiki/lefse で提供されます。 1. 解析用入力ファイルの準備 LEfSeの入力ファイル(表1)を準備します。これは、元のファイル(サンプルファイルと対応する種アノテーションファイル)を使用して、多くのワー?…

Representative Results

3つのサンプルの16S rRNA遺伝子配列を解析して各群において有意差を有する微生物群集のLDAスコアを 図8に示す。ヒストグラムの色は異なるグループを表し、長さはLDAスコアを表し、これは異なるグループ間で有意な差がある種の影響です。ヒストグラムは、LDA スコアが事前設定された値より大きい有意差のある種を示します。デフォルトのプリセット値は 2.0 であるた?…

Discussion

ここでは、異なるグループ内のバイオマーカーの同定および特性評価のためのプロトコルが記載されている。このプロトコルは、微生物のOTUなどの他のサンプルタイプに容易に適合させることができます。LEfSeによる統計的方法は、各群に特徴的な微生物(デフォルトはLDA>2)、すなわち、他の群と比較してこの群においてより豊富に存在する微生物を見出すことができる12。LE…

Disclosures

The authors have nothing to disclose.

Acknowledgements

本研究は、中央公共福祉研究所基礎研究費(TKS170205)と科学技術振興財団、天津水交通工学研究所(TIWTE)M.O.T.(KJFZJJ170201)の助成を受けて実施されました。

Materials

No materials used

References

  1. Bolyen, E., et al. Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. Nature Biotechnology. 37 (8), 852-857 (2019).
  2. Knight, R., et al. Best practices for analysing microbiomes. Nature Reviews. Microbiology. 16 (7), 410-422 (2018).
  3. Segata, N., et al. Metagenomic biomarker discovery and explanation. Genome Biology. 12 (6), 60 (2011).
  4. . Biobakery / lefse [tool] Available from: https://bitbucket.org/biobakery/biobakery/wiki/lefse (2019)
  5. Kruskal, W. H. A nonparametric test for the several sample problem. The Annals of Mathematical Statistics. 23 (4), 525-540 (1952).
  6. Wilcoxon, F. Individual comparisons by ranking methods. Biometrics Bulletin. 1 (6), 80-83 (1945).
  7. Fisher, R. A. The use of multiple measurements in taxonomic problems. Annals of Eugenics. 7 (1), 179-188 (1936).
  8. Liu, Y. X., et al. A practical guide to amplicon and metagenomic analysis of microbiome data. Protein and Cell. 41 (7), 1-16 (2020).
  9. Shahi, S. K., Zarei, K., Guseva, N. V., Mangalam, A. K. Microbiota analysis using two-step PCR and next-generation 16S rRNA gene sequencing. Journal of Visualized Experiments: JoVE. (152), e59980 (2019).
  10. Grüning, B., et al. Bioconda: sustainable and comprehensive software distribution for the life sciences. Nature Methods. 15 (7), 475-476 (2018).
  11. Blankenberg, D., Chilton, J., Coraor, N. Galaxy external display applications: closing a dataflow interoperability loop. Nature Methods. 17 (2), 123-124 (2020).
  12. Langille, M. G. I., et al. Predictive functional profiling of microbial communities using 16S rRNA marker gene sequences. Nature Biotechnology. 31 (9), 814-821 (2013).
  13. Shilei, Z., et al. Reservoir water stratification and mixing affects microbial community structure and functional community composition in a stratified drinking reservoir. Journal of Environmental Management. 267, 110456 (2020).

Play Video

Cite This Article
Chang, F., He, S., Dang, C. Assisted Selection of Biomarkers by Linear Discriminant Analysis Effect Size (LEfSe) in Microbiome Data. J. Vis. Exp. (183), e61715, doi:10.3791/61715 (2022).

View Video