Summary

ExCYT: Eine grafische Benutzeroberfläche für die Straffung der Analyse hochdimensionaler Cytometry Daten

Published: January 16, 2019
doi:

Summary

ExCYT ist ein MATLAB-basierte grafische Benutzeroberfläche (GUI), die Benutzern erlaubt, ihre Flow Cytometry über häufig Datenanalyse Analysetechniken für hochdimensionale Daten, einschließlich der Reduzierung der Dimensionalität über t-SNE, eine Vielzahl von automatisierten und manuellen beschäftigt Clustering-Methoden, Heatmaps und neuartige hochdimensionalen Fluss Grundstücke.

Abstract

Mit dem Aufkommen der fließen Cytometers messen eine zunehmende Anzahl von Parametern weiterhin größere Platten phänotypisch Eigenschaften ihrer zellulären Muster zur Erkundung entwickeln Wissenschaftler. Allerdings liefern diese technologischen Zuführungen hochdimensionalen Daten-Sets, die immer schwieriger zu Objektiv im traditionellen Handbuch-gating Programme analysieren haben. Um besser zu analysieren und darstellen von Daten, arbeiten Wissenschaftler mit Bioinformatikern mit Erfahrung in der Analyse hochdimensionaler Daten um ihre Flow Cytometry Daten analysiert werden. Während diese Methoden sehr wertvoll bei der Untersuchung der Durchflusszytometrie gezeigt wurden, haben sie noch in eine einfache und leicht zu bedienenden Paket für Wissenschaftler einbezogen werden, die rechnerische oder Programmierung Fachwissen verfügen. Zu diesem Zweck haben wir ExCYT, ein MATLAB-basierte grafische Benutzeroberfläche (GUI) entwickelt, die die Analyse hochdimensionaler Flow Cytometry Daten optimiert durch die Implementierung verwendeten Analyseverfahren für hochdimensionale Daten einschließlich Reduzierung der Dimensionalität von t-SNE, Grundstücke eine Vielzahl von automatisierten und manuellen clustering Methoden, Heatmaps und neuartige hochdimensionalen fließen. Darüber hinaus bietet ExCYT traditionelle gating Optionen wählen Sie Populationen von Interesse für weitere t-SNE und clustering-Analyse sowie die Fähigkeit, Tore direkt am t-SNE Grundstücke anzuwenden. Die Software bietet den zusätzlichen Vorteil des Arbeitens mit entweder ausgeglichen oder unkompensierten FCS-Dateien. Für den Fall, dass nach der Übernahme Ausgleich erforderlich ist, können Benutzer dem Programm ein Verzeichnis von einzelnen Flecken und einer ungefärbten Probe zur Verfügung stellen. Das Programm erkennt positive Ereignisse in allen Kanälen und verwendet diese Daten auswählen mehr Objektiv die Vergütungsmatrix berechnen. ExCYT bietet eine umfassende Analyse Pipeline um Flow Cytometry Daten in Form von FCS-Dateien und jede Person, unabhängig von der rechnerische Ausbildung, um die neuesten algorithmische Ansätze für das Verständnis ihrer Daten verwenden lassen.

Introduction

Fortschritte in der Durchflusszytometrie sowie das Aufkommen der Masse Zytometrie hat erlaubt, Kliniker und Wissenschaftler, um schnell zu identifizieren und zu charakterisieren, phänotypisch biologisch und klinisch interessante Muster mit neuen Levels von Auflösung, große hochdimensionalen Daten-Sets, die Informationen reichen1,2,3sind. Während herkömmliche Methoden für die Analyse von Flow Cytometry Daten wie z. B. manuelle Anspritzung einfacher für Experimente wurden gibt es einige Marker und diese Marker haben optisch erkennbare Populationen, kann dieser Ansatz nicht generieren reproduzierbare Ergebnisse bei der Analyse der höherdimensionalen Datensätze oder solche mit Marker Flecken auf ein Spektrum. Beispielsweise wurden in einer Multi-institutionelle Studie, wo intrazelluläre Färbung (ICS) Assays durchgeführt, um die Reproduzierbarkeit der Quantifizierung antigenspezifischen T-Zell-Reaktionen, trotz guter laborübergreifenden Präzision, Analyse, insbesondere zu beurteilen Anspritzung, eine bedeutende Quelle der Variabilität4eingeführt. Darüber hinaus ist der Prozess der manuell Anspritzung Bevölkerung von Interessen, abgesehen davon, dass höchst subjektiv sehr zeitaufwendig und arbeitsintensiv. Das Problem der Analyse hochdimensionaler Datensätze in eine robuste, effiziente und rechtzeitige Weise ist jedoch nicht eine neue Forschung Wissenschaften. Genexpressionsstudien erzeugen oft sehr hochdimensionalen Daten-Sets (oft in der Größenordnung von Hunderten von Genen) wo manuelle Formen der Analyse einfach nicht machbar wäre. Um die Analyse dieser Daten-Sets zu begegnen, wurde viel Arbeit bei der Entwicklung von bioinformatische Werkzeuge gen Ausdruck Daten5analysieren. Diese algorithmische Ansätze wurden gerade vor kurzem in der Analyse der Zytometrie Daten angenommen wie die Anzahl der Parameter gestiegen ist und haben sich als von unschätzbarem Wert für die Analyse von diesen hohen dreidimensionale Datensätze6,7.

Trotz der Erzeugung und Anwendung einer Vielzahl von Algorithmen und Software-Pakete, mit denen Wissenschaftler dieser hochdimensionalen bioinformatische Ansätze auf ihre Flow Cytometry Daten anwenden, bleiben diese analytische Techniken noch weitgehend ungenutzt. Es gibt zwar eine Vielzahl von Faktoren, die die Verbreitung dieser Ansätze auf Zytometrie Daten8begrenzt haben, das große Hindernis, die wir in den Verdacht dieser Ansätze von Wissenschaftlern verwenden, ist ein Mangel an rechnerische wissen. In der Tat sind viele dieser Software-Pakete (z.B. FlowCore, FlowMeans und OpenCyto) geschrieben, um in Programmiersprachen wie z. B. R, die materiellen Programmierkenntnisse noch benötigen umgesetzt werden. Software-Pakete wie FlowJo haben Gnade unter Wissenschaftlern aufgrund der Einfachheit der Nutzung und “Plug-n-Play” Natur sowie Kompatibilität mit dem PC-Betriebssystem gefunden. Um die Vielfalt der anerkannte und wertvolle analytische Techniken der Wissenschaftler unbekannte Programmierung bieten, haben wir ExCYT, eine grafische Benutzeroberfläche (GUI) entwickelt, die leicht auf einem PC/Mac installiert werden kann, die viele der neuesten Techniken zieht einschließlich der Reduzierung der Dimensionalität für intuitive Visualisierung, eine Vielzahl von clustering Methoden in der Literatur, zusammen mit neuartigen Features zu erkunden die Ausgabe dieser zitiert clustering-Algorithmen mit Heatmaps und Roman hochdimensionalen Fluss/Box-Plots.

ExCYT ist eine grafische Benutzeroberfläche in MATLAB gebaut und daher können entweder direkt ausgeführt werden in MATLAB oder ein Installationsprogramm ist, vorausgesetzt, die verwendet werden können, um die Installation auf jedem PC/Mac. Die Software ist erhältlich bei https://github.com/sidhomj/ExCYT. Wir präsentieren Ihnen ein detailliertes Protokoll wie Sie Daten importieren, vorab zu bearbeiten, führen t-SNE Reduzierung der Dimensionalität, Cluster-Daten, Art & filtern Cluster basierend auf Benutzer-Einstellungen und Displayinformationen zu den Clustern von Interesse über Heatmaps und Roman hochdimensionalen Fluss/Box-Plots ()Abbildung 1(). Achsen in t-SNE Parzellen sind willkürlich und in beliebigen Einheiten und als solche nicht immer in den Figuren der Einfachheit des Benutzers dargestellt-Schnittstelle. Die Färbung der Datenpunkte in der “t-SNE Heatmaps” ist von blau auf Gelb basierend auf das Signal der angegebenen Markierung. Beim clustering-Lösungen, die Farbe des Datenpunkts willkürliche Blockzahl basiert. Alle Teile des Workflows können durchgeführt werden, im Bereich GUI ()Abbildung 2 & Tabelle 1). Zu guter Letzt demonstrieren wir Ihnen die Verwendung von ExCYT auf zuvor veröffentlichten Daten der immun Landschaft von Nierenzellkarzinomen in der Literatur auch mit ähnlichen Methoden analysiert. Die Beispiel-Dataset verwendeten wir die Zahlen in diesem Manuskript zusammen mit dem Protokoll unten erstellen finden Sie auf https://premium.cytobank.org/cytobank/projects/875, bei der Registrierung eines Accounts.

Protocol

(1) sammeln und aufbereiten Cytometry Daten Setzen Sie alle einzelnen Flecken in einem Ordner von selbst und Label von der Kanalname (indem Fluorophor, keine Markierung). 2. Daten Import & Pre-Processing Um anzuhalten oder während dieser Analyse Pipeline zu speichern, verwenden die Schaltfläche ” Arbeitsbereich speichern ” in der unteren linken Ecke des Programms, um den Arbeitsbereich zu speichern ein “. MAT “-Datei, die später über den Button <s…

Representative Results

Um die Nutzbarkeit des ExCYT zu testen, haben wir analysiert einen kuratierten Datensatz von Chevrier Et Al. mit dem Titel “Ein immun Atlas der klare Renal Basalzellkarzinom” wo die Gruppe CyTOF mit einem umfangreichen immun-Panel Tumor Proben 73 Analyse veröffentlicht Patienten-11. Zwei getrennte Platten, einer myeloischen und lymphatischen Panel wurden verwendet, um der Tumor Mikroumgebung phänotypisch zu charakterisieren. Das Ziel unserer Studie war e…

Discussion

Hier präsentieren wir Ihnen ExCYT, eine neue grafische Benutzeroberfläche laufen MATLAB-basierten Algorithmen zur Analyse hochdimensionaler Zytometrie Daten, Optimierung ermöglicht Personen ohne Hintergrund in der Programmierung, die neuesten in hochdimensionalen Daten zu implementieren Analysealgorithmen. Die Verfügbarkeit dieser Software der breiteren Fachöffentlichkeit können Wissenschaftler ihre Flow Cytometry Daten in einem intuitiven und einfachen Workflow durchsuchen. Durch Durchführung von t-SNE Reduzierun…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Die Autoren haben keine Bestätigungen.

Materials

Desktop SuperMicro Custom Build Computer used to run analysis
MATLAB Mathworks N/A Software used to develop ExCYT

References

  1. Benoist, C., Hacohen, N. Flow cytometry, amped up. Science. 332 (6030), 677-678 (2011).
  2. Ornatsky, O., et al. Highly multiparametric analysis by mass cytometry. Journal of immunological methods. 361 (1), 1-20 (2010).
  3. Tanner, S. D., et al. Flow cytometer with mass spectrometer detection for massively multiplexed single-cell biomarker assay. Pure and Applied Chemistry. 80 (12), 2627-2641 (2008).
  4. Maecker, H. T., et al. Standardization of cytokine flow cytometry assays. BMC immunology. 6 (1), 13 (2005).
  5. Brazma, A., Vilo, J. Gene expression data analysis. FEBS letters. 480 (1), 17-24 (2000).
  6. Pyne, S., et al. Automated high-dimensional flow cytometric data analysis. Proceedings of the National Academy of Sciences. 106 (21), 8519-8524 (2009).
  7. Ge, Y., Sealfon, S. C. flowPeaks: a fast unsupervised clustering for flow cytometry data via K-means and density peak finding. Bioinformatics. 28 (15), 2052-2058 (2012).
  8. Venkatesh, V. Determinants of perceived ease of use: Integrating control, intrinsic motivation, and emotion into the technology acceptance model. Information systems research. 11 (4), 342-365 (2000).
  9. Bagwell, C. B., Adams, E. G. Fluorescence spectral overlap compensation for any number of flow cytometry parameters. Annals of the New York Academy of Sciences. 677 (1), 167-184 (1993).
  10. Lavin, Y., et al. Innate immune landscape in early lung adenocarcinoma by paired single-cell analyses. Cell. 169 (4), 750-765 (2017).
  11. Chevrier, S., et al. An immune atlas of clear cell renal cell carcinoma. Cell. 169 (4), 736-749 (2017).
  12. Hartigan, J. A., Wong, M. A. Algorithm AS 136: A k-means clustering algorithm. Journal of the Royal Statistical Society. Series C (Applied Statistics). 28 (1), 100-108 (1979).
  13. Ester, M., Kriegel, H. P., Sander, J., Xu, X. Density-based spatial clustering of applications with noise. International Conference Knowledge Discovery and Data Mining. 240, (1996).
  14. Levine, J. H., et al. Data-driven phenotypic dissection of AML reveals progenitor-like cells that correlate with prognosis. Cell. 162 (1), 184-197 (2015).
  15. Blondel, V. D., Guillaume, J. L., Lambiotte, R., Lefebvre, E. Fast unfolding of communities in large networks. Journal of statistical mechanics: theory and experiment. 2008 (10), P10008 (2008).
  16. Le Martelot, E., Hankin, C. Fast multi-scale detection of relevant communities in large-scale networks. The Computer Journal. 56 (9), 1136-1150 (2013).
  17. Newman, M. E. Fast algorithm for detecting community structure in networks. Physical review E. 69 (6), 066133 (2004).
  18. Hespanha, J. P. . An efficient matlab algorithm for graph partitioning. , 1-8 (2004).
  19. Moon, T. K. The expectation-maximization algorithm. IEEE Signal processing. 13 (6), 47-60 (1996).
  20. Bishop, C. M. . Pattern recognition and machine learning. , (2006).

Play Video

Cite This Article
Sidhom, J., Theodros, D., Murter, B., Zarif, J. C., Ganguly, S., Pardoll, D. M., Baras, A. ExCYT: A Graphical User Interface for Streamlining Analysis of High-Dimensional Cytometry Data. J. Vis. Exp. (143), e57473, doi:10.3791/57473 (2019).

View Video