Summary

ExCYT: 高次元フローサイトメトリー データの分析を合理化するためのグラフィカル ユーザー インターフェイス

Published: January 16, 2019
doi:

Summary

ExCYT は、MATLAB ベース グラフィカル ユーザー インターフェイス (GUI) を介して流れ cytometry データをよく分析できる採用法 t SNE、さまざまな自動および手動による次元圧縮を含む高次元データの解析技術クラスタ リングの方法、ヒートマップなど、および新規高次元フローがプロットされます。

Abstract

流れの cytometers パラメーター数の増加を測定することができるの出現により、科学者たちは、表現型、細胞のサンプルの特性の解明に大きなパネルを開発続けます。しかし、これらの技術の進歩はますます伝統的なゲーティング マニュアル ベースのプログラム内で客観的に分析が困難になっている高次元のデータ セットを得られます。良い分析し、データを表示、するために科学者は流れ cytometry データを解析する高次元データの分析に専門知識を持つ多くのパートナーします。一方、これらのメソッドは、フローサイトメトリーの勉強に非常に貴重なことに示されている、彼らはまだ計算やプログラミングに関する専門知識を欠いている科学者のための簡単で使いやすいパッケージに組み込まれるあります。この必要性に対処するため、MATLAB ベース グラフィカル ユーザー インターフェイス (GUI) 高次元データなどの一般的に使用される分析手法を実装することによって高次元の流れの cytometry のデータの解析を効率化する ExCYT を開発しました。t SNE による次元圧縮、様々 な自動と手動のクラスタ リング方法、ヒートマップなど、新規高次元フローがプロットされます。さらに、ExCYT はさらに t SNE と t SNE プロットに直接ゲートに適用する能力と同様に、分析をクラスタ リングのための興味の選択集団の伝統的なゲート オプションを提供します。ソフトウェアは、いずれかの補償での作業の付加的な利点または非補償 FCS ファイルを提供します。買収後の補償が必要な場合に、汚れの単一のディレクトリと無染色のサンプル プログラムを提供するユーザーを選択できます。プログラムはすべてのチャネルで肯定的なイベントを検出し、このデータの選択を使用してより客観的に補償行列を計算します。要約すると、ExCYT は、FCS ファイルの形で流れ cytometry のデータを取り出して計算トレーニング、そのデータを理解することで最新のアルゴリズムのアプローチを使用するに関係なく、任意の個人を許可する包括的な解析パイプラインを提供します。

Introduction

臨床医と科学者を迅速に特定し、表現型の解像度、大きなを作成する新しいレベルの生物学的および臨床的に興味深いサンプルを特徴付ける質量フローサイトメトリーの出現と同様、フローサイトメトリーの進歩を許可しています。情報豊富な1,2,3は、高次元のデータ設定します。このアプローチは、生成に失敗すること手動ゲートなど流れの cytometry データを分析するための従来の方法は、簡単かつわかりやすくいくつかマーカーがあるこれらのマーカーは、視覚的に認識できる人口を持って実験されているが、高次元データ セットまたはスペクトルに染色マーカーとのそれらを分析する際の再現性のある結果。たとえば、多施設共同研究では、細胞内染色 (ICS) アッセイされて行った特に良い厚生精度、分析、にもかかわらず、抗原特異的 T 細胞応答を量的に表わすの再現性を評価するためにゲート、変動4の重要な源を導入しました。さらに、手動で非常に主観的であることに加え、興味の人口をゲーティングのプロセスは非常に時間のかかる、労働集約的です。ただし、堅牢で効率的、かつタイムリーな方法で高次元のデータ セットを分析の問題は科学研究に新しいものではありません。遺伝子発現研究は多くの場合マニュアル形式の分析を単に実現するだろう (何百もの遺伝子の) 順序よく非常に高次元のデータ セットを生成します。これらのデータ セットの解析に取り組む、遺伝子表現データ5を解析する bioinformatic ツールの開発に多くの仕事がずっとあります。これらのアルゴリズム的な採用しているされて最近フローサイトメトリー データの解析パラメーターの数が増加するいるし、これらの高次元データの67の分析で非常に貴重であると証明。

生成アルゴリズムとその流れの cytometry データにこれらの高次元の bioinformatic のアプローチを適用する研究者を許可するソフトウェア パッケージの様々 なアプリケーションにもかかわらず、これらの分析技術まだ主として未使用のまま。さまざまな要因フローサイトメトリー データ8のこれらの手法の普及が限られているかもしれませんが、大きな障害の疑いがある我々 科学者によってこれらの方法を使用して、計算知識の欠如です。実際には、これらのソフトウェア パッケージ (すなわちflowCore、flowMeans、および OpenCyto) の多くはまだ実質的なプログラミング知識を必要とする R など言語をプログラミングで実装に書き込まれます。FlowJo などのソフトウェア パッケージは、PC のオペレーティング システムとの互換性と同様に使用および ‘プラグアンド プレイ’ 自然のシンプルさのための科学者間の好意を発見しました。ExCYT の最新技術の多くを引っ張る PC/Mac に簡単にインストールできるグラフィカル ユーザー インターフェイス (GUI) を開発した科学者の不慣れなプログラミングに受け入れられ、貴重な分析技術のさまざまなを提供するためにクラスタ リング アルゴリズム ヒートマップなどと小説の高次元フロー/ボックス プロットと直感的な可視化、これらの出力を探索する斬新な機能に沿って、文献で引用されたクラスタ リング手法の様々 な次元圧縮を含みます。

ExCYT は MATLAB に建てられたグラフィカル ユーザー インターフェイスしたがっていずれか MATLAB 内で直接実行または任意の PC/mac にソフトウェアをインストールする使用できるインストーラーはソフトウェアは、https://github.com/sidhomj/ExCYT でご利用いただけます。データをインポート、前処理、t SNE 次元削減、クラスター データ、並べ替えを行うし、ユーザー設定、およびヒートマップなどと小説による関心のクラスターに関する情報を表示に基づくクラスターにフィルターを適用する方法の詳細なプロトコルを提案します。高次元の流れ/ボックス プロット(図 1)。T SNE プロットの軸は任意、任意の単位で、ユーザーの便宜上数字で常に示すように、このようなインタ フェースします。「T SNE ヒートマップなど」内のデータ ポイントの色は青から黄色示されたマーカーの信号に基づいていますです。クラスタ リング ソリューションでは、データ ポイントの色はクラスター数に任意基づきます。ワークフローのすべての部分は、GUI (図 2の単一のパネルで行うことが& テーブル 1)。最後に、以前発行したデータも同様の方法で分析した文献で腎細胞癌の免疫の風景を探索で ExCYT の使用を示します。我々 は本稿で以下のプロトコルとともに、図形を作成する使用されるサンプル データセットは、アカウントを登録する時に、https://premium.cytobank.org/cytobank/projects/875 で見つけることが。

Protocol

1. 収集およびフローサイトメトリー データの準備 単一のすべての汚れに配置フォルダー自体およびラベルによってチャネル名で (ないマーカーの fluorophore)。 2. データ輸入・前処理 一時停止またはこの解析パイプライン全体を保存、作業状態の保存] をクリックしてプログラムの左下でとしてワークスペースを保存する ‘。マット ‘ 後<stron…

Representative Results

ExCYT の使いやすさをテストするために行った Chevrierらタイトルの ‘の免疫アトラスの明確な腎癌’ グループが 73 から採取した腫瘍サンプルの豊富な免疫パネルと CyTOF 分析を実施によって公開された精選されたデータ セット患者11。2 つの独立したパネル、骨髄性とリンパ性のパネルは、腫瘍微小環境を特徴付ける表現型に使用されました。本?…

Discussion

ここで提案する高次元データの最新情報を実装するプログラミングの背景を持つ個人を許可する ExCYT、高次元フローサイトメトリー データの分析を合理化するための MATLAB ベースのアルゴリズムを実行する新しいグラフィカル ユーザー インターフェイス解析アルゴリズム。広範な科学コミュニティにこのソフトウェアの可用性は、直感的で簡単なワークフローでは、流れ cytometry データを探…

Disclosures

The authors have nothing to disclose.

Acknowledgements

著者の謝辞があります。

Materials

Desktop SuperMicro Custom Build Computer used to run analysis
MATLAB Mathworks N/A Software used to develop ExCYT

References

  1. Benoist, C., Hacohen, N. Flow cytometry, amped up. Science. 332 (6030), 677-678 (2011).
  2. Ornatsky, O., et al. Highly multiparametric analysis by mass cytometry. Journal of immunological methods. 361 (1), 1-20 (2010).
  3. Tanner, S. D., et al. Flow cytometer with mass spectrometer detection for massively multiplexed single-cell biomarker assay. Pure and Applied Chemistry. 80 (12), 2627-2641 (2008).
  4. Maecker, H. T., et al. Standardization of cytokine flow cytometry assays. BMC immunology. 6 (1), 13 (2005).
  5. Brazma, A., Vilo, J. Gene expression data analysis. FEBS letters. 480 (1), 17-24 (2000).
  6. Pyne, S., et al. Automated high-dimensional flow cytometric data analysis. Proceedings of the National Academy of Sciences. 106 (21), 8519-8524 (2009).
  7. Ge, Y., Sealfon, S. C. flowPeaks: a fast unsupervised clustering for flow cytometry data via K-means and density peak finding. Bioinformatics. 28 (15), 2052-2058 (2012).
  8. Venkatesh, V. Determinants of perceived ease of use: Integrating control, intrinsic motivation, and emotion into the technology acceptance model. Information systems research. 11 (4), 342-365 (2000).
  9. Bagwell, C. B., Adams, E. G. Fluorescence spectral overlap compensation for any number of flow cytometry parameters. Annals of the New York Academy of Sciences. 677 (1), 167-184 (1993).
  10. Lavin, Y., et al. Innate immune landscape in early lung adenocarcinoma by paired single-cell analyses. Cell. 169 (4), 750-765 (2017).
  11. Chevrier, S., et al. An immune atlas of clear cell renal cell carcinoma. Cell. 169 (4), 736-749 (2017).
  12. Hartigan, J. A., Wong, M. A. Algorithm AS 136: A k-means clustering algorithm. Journal of the Royal Statistical Society. Series C (Applied Statistics). 28 (1), 100-108 (1979).
  13. Ester, M., Kriegel, H. P., Sander, J., Xu, X. Density-based spatial clustering of applications with noise. International Conference Knowledge Discovery and Data Mining. 240, (1996).
  14. Levine, J. H., et al. Data-driven phenotypic dissection of AML reveals progenitor-like cells that correlate with prognosis. Cell. 162 (1), 184-197 (2015).
  15. Blondel, V. D., Guillaume, J. L., Lambiotte, R., Lefebvre, E. Fast unfolding of communities in large networks. Journal of statistical mechanics: theory and experiment. 2008 (10), P10008 (2008).
  16. Le Martelot, E., Hankin, C. Fast multi-scale detection of relevant communities in large-scale networks. The Computer Journal. 56 (9), 1136-1150 (2013).
  17. Newman, M. E. Fast algorithm for detecting community structure in networks. Physical review E. 69 (6), 066133 (2004).
  18. Hespanha, J. P. . An efficient matlab algorithm for graph partitioning. , 1-8 (2004).
  19. Moon, T. K. The expectation-maximization algorithm. IEEE Signal processing. 13 (6), 47-60 (1996).
  20. Bishop, C. M. . Pattern recognition and machine learning. , (2006).

Play Video

Cite This Article
Sidhom, J., Theodros, D., Murter, B., Zarif, J. C., Ganguly, S., Pardoll, D. M., Baras, A. ExCYT: A Graphical User Interface for Streamlining Analysis of High-Dimensional Cytometry Data. J. Vis. Exp. (143), e57473, doi:10.3791/57473 (2019).

View Video