Summary

ExCYT : Une Interface graphique pour simplifier Analysis of High-Dimensional Data de cytométrie en flux

Published: January 16, 2019
doi:

Summary

ExCYT est une base MATLAB utilisateur Interface graphique (GUI) qui permet aux utilisateurs d’analyser leurs données de cytométrie de flux via couramment employé des techniques d’analyse de données grande dimension, y compris la réduction de dimensionnalité via t-SNE, une variété d’automatisés et manuels parcelles de nouveaux flux de grande dimension, heatmaps et méthodes de clustering.

Abstract

Avec l’avènement des cytomètres capable de mesurer un nombre croissant de paramètres, les scientifiques continuent à développer de grands panneaux pour explorer phénotypiquement caractéristiques de leurs échantillons cellulaires. Toutefois, ces progrès technologiques donnent des ensembles de données grande dimension qui sont devenus de plus en plus difficiles d’analyser objectivement au sein de programmes blocage manuel traditionnels. Afin de mieux analyser et présenter des données, les scientifiques en partenariat avec bioinformaticiens ayant une expertise dans l’analyse des données de grande dimension pour analyser leurs données de cytométrie de flux. Ces méthodes ont été montré pour être très utiles dans l’étude de cytométrie en flux, ils doivent encore être intégré dans un paquet simple et facile à utiliser pour les scientifiques qui manquent d’expertise informatique ou programmation. Pour répondre à ce besoin, nous avons développé ExCYT, une base MATLAB utilisateur Interface graphique (GUI) qui simplifie l’analyse des données de cytométrie en flux de grande dimension en mettant en œuvre des techniques d’analyse couramment utilisés pour les données de grande dimension, y compris parcelles de réduction dimensionnelle par t-end, une variété de méthodes de clustering automatisés et manuels, heatmaps et nouveaux flux de grande dimension. En outre, ExCYT fournit des options de blocage traditionnelles des populations choisies d’intérêt pour les autres t-end et le clustering analyse ainsi que la possibilité d’appliquer des portes directement sur des parcelles de t-end. Le logiciel offre l’avantage supplémentaire de travailler avec soit compensée ou des fichiers de FCS sans compensation. Dans le cas où la compensation après l’acquisition est nécessaire, l’utilisateur peut choisir de fournir le programme, un répertoire des taches simples et un échantillon non coloré. Le programme détecte les événements positifs dans tous les canaux et utilise ces données select plus objectivement calculer la matrice de compensation. En résumé, ExCYT fournit un pipeline d’analyse complète pour prendre des données de cytométrie de flux sous la forme de fichiers FCS et permettre à toute personne, quelle que soit la formation informatique, d’utiliser les dernières approches algorithmiques dans la compréhension de leurs données.

Introduction

Avances en cytométrie de flux ainsi que l’avènement de la cytométrie en flux massique a permis de cliniciens et chercheurs pour rapidement identifier et caractériser phénotypiquement échantillons intéressants sur le plan clinique et biologique avec nouveaux niveaux de résolution, créant de grandes ensembles de données grande dimension qui sont information riche1,2,3. Alors que les méthodes conventionnelles pour l’analyse des données de cytométrie en flux tels que déclenchement manuel ont été plus simples pour des expériences où il y a quelques marqueurs et ces marqueurs ont une population identifiable visuellement, cette approche peut ne pas générer résultats reproductibles lors de l’analyse des ensembles de données plus grande dimension ou ceux avec des marqueurs de coloration sur un spectre. Par exemple, dans une étude multi-établissements, où intra-cellulaire coloration (ICS) essais étaient exécutés afin d’évaluer la reproductibilité de la quantification des réponses spécifiques à l’antigène des lymphocytes T, malgré la bonne précision, analyse, en particulier Gate, a présenté une importante source de variabilité4. En outre, le processus de blocage manuellement des intérêts, en plus d’être très subjective, la population est très chronophage et labor intensive. Toutefois, le problème de l’analyse de grande dimension des ensembles de données de manière fiable, efficace et en temps opportun n’est pas une nouvelle pour la recherche en sciences. Études d’expression de gène génèrent souvent de très grande dimension des ensembles de données (souvent de l’ordre des centaines de gènes) où manuels formes d’analyse serait tout simplement impossible. Afin de s’attaquer à l’analyse de ces ensembles de données, il y a eu beaucoup de travail à concevoir des outils bioinformatiques pour analyser l’expression de gène données5. Ces approches algorithmiques viennent d’être récemment adoptés dans l’analyse de cytométrie de flux de données comme le nombre de paramètres a augmenté et s’est avérés pour être précieux dans l’analyse de ces ensembles de données dimensionnelles élevées6,7.

Malgré la génération et l’application d’une variété d’algorithmes et de logiciels qui permettent aux scientifiques d’appliquer ces approches bioinformatiques de grande dimension à leurs données de cytométrie de flux, ces techniques d’analyse restent encore peu utilisés. Alors qu’il peut y avoir une variété de facteurs qui ont limité l’adoption généralisée de ces approches de la cytométrie de flux de données8, l’obstacle majeur, nous croyons en l’utilisation de ces approches par les scientifiques, est un manque de connaissances informatiques. En fait, beaucoup de ces logiciels (c.-à-d., flowCore, flowMeans et OpenCyto) sont écrites en langages de programmation tels que R qui nécessitent encore des connaissances en programmation fond. Paquets de logiciels tels que FlowJo ont trouvé faveur parmi les scientifiques en raison de la simplicité d’utilisation et nature « plug-n-play », ainsi que la compatibilité avec le système d’exploitation de PC. Afin d’assurer la variété des techniques analytiques reconnues et précieux à la programmation non familiers du scientifique, nous avons développé ExCYT, une interface utilisateur graphique (GUI) qui peut être facilement installée sur un PC/Mac qui tire beaucoup de techniques les plus récentes y compris réduction dimensionnelle pour une visualisation intuitive, une variété de méthodes de clustering citée dans la littérature, ainsi que de nouvelles fonctionnalités à explorer la sortie de ces algorithmes à des parcelles de grande dimension flux/BTE heatmaps et roman de clustering.

ExCYT est une interface graphique construite en MATLAB et par conséquent peut soit être exécuté au sein de MATLAB directement ou un programme d’installation est fournie qui peut être utilisé pour installer le logiciel sur n’importe quel PC/Mac. Le logiciel est disponible à https://github.com/sidhomj/ExCYT. Nous présentons un protocole détaillé pour savoir comment importer des données, pré-traiter, effectuer la réduction dimensionnelle t-SNE, de données de cluster, de sorte et filtrer les grappes basés sur les préférences de l’utilisateur et afficher des informations sur les groupes d’intérêt via heatmaps et roman emplacements de grande dimension flux/boîte ()Figure 1). Axes dans les parcelles de t-SNE sont arbitraires et en unités arbitraires et comme tel, comme le ne montre pas toujours les chiffres pour la simplicité de l’utilisateur de l’interface. La coloration des points de données dans le « t-SNE Heatmaps » est du bleu au jaune fondée sur le signal du marqueur indiqué. Dans les solutions de clustering, la couleur du point de données est issue des arbitraires numéro de cluster. Toutes les parties du flux de travail peuvent être effectués dans le seul panneau GUI ()Figure 2 & tableau 1). Enfin, nous allons démontrer l’utilisation de ExCYT sur les données publiées antérieurement explorant le paysage immunitaire du carcinome à cellules rénales dans la littérature, également analysée avec des méthodes similaires. L’exemple de dataset que nous permet de créer les chiffres dans ce manuscrit, ainsi que le protocole ci-dessous se trouvent à https://premium.cytobank.org/cytobank/projects/875, lors de leur inscription à un compte.

Protocol

1. collecte et préparation des données de la cytométrie en flux Placez toutes les taches simples dans un dossier par eux-mêmes et étiquette sous le nom de canal (par un fluorophore, pas de marqueur). 2. pré-Processing & Importation de données Pour mettre en pause ou enregistrer tout au long de ce pipeline d’analyse, utilisez le bouton Save Workspace en bas à gauche du programme pour économiser l’espace de travail comme un ‘. MAT’ fichier …

Representative Results

Afin de tester la facilité d’utilisation de ExCYT, nous avons analysé un ensemble de données curated publié par Chevrier et al. , intitulé « An Immune Atlas de claire cellule carcinome rénal » où le groupe a effectué CyTOF analyse avec un vaste panneau immunitaire sur des échantillons de tumeur provenant de 73 les patients11. Deux panneaux séparés, un panneau myéloïde et lymphoïde, ont servi à caractériser phénotypiquement le microen…

Discussion

Nous présentons ici ExCYT, une nouvelle interface graphique exécute des algorithmes MATLAB pour simplifier l’analyse des données de grande dimension de cytométrie en flux, permettant aux individus avec aucune expérience en programmation pour mettre en œuvre plus tard dans des données de grande dimension algorithmes d’analyse. La disponibilité de ce logiciel à l’ensemble de la communauté scientifique permettra aux chercheurs d’explorer leurs données de cytométrie en flux dans un flux de travail intuiti…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Les auteurs n’ont aucun remerciements.

Materials

Desktop SuperMicro Custom Build Computer used to run analysis
MATLAB Mathworks N/A Software used to develop ExCYT

References

  1. Benoist, C., Hacohen, N. Flow cytometry, amped up. Science. 332 (6030), 677-678 (2011).
  2. Ornatsky, O., et al. Highly multiparametric analysis by mass cytometry. Journal of immunological methods. 361 (1), 1-20 (2010).
  3. Tanner, S. D., et al. Flow cytometer with mass spectrometer detection for massively multiplexed single-cell biomarker assay. Pure and Applied Chemistry. 80 (12), 2627-2641 (2008).
  4. Maecker, H. T., et al. Standardization of cytokine flow cytometry assays. BMC immunology. 6 (1), 13 (2005).
  5. Brazma, A., Vilo, J. Gene expression data analysis. FEBS letters. 480 (1), 17-24 (2000).
  6. Pyne, S., et al. Automated high-dimensional flow cytometric data analysis. Proceedings of the National Academy of Sciences. 106 (21), 8519-8524 (2009).
  7. Ge, Y., Sealfon, S. C. flowPeaks: a fast unsupervised clustering for flow cytometry data via K-means and density peak finding. Bioinformatics. 28 (15), 2052-2058 (2012).
  8. Venkatesh, V. Determinants of perceived ease of use: Integrating control, intrinsic motivation, and emotion into the technology acceptance model. Information systems research. 11 (4), 342-365 (2000).
  9. Bagwell, C. B., Adams, E. G. Fluorescence spectral overlap compensation for any number of flow cytometry parameters. Annals of the New York Academy of Sciences. 677 (1), 167-184 (1993).
  10. Lavin, Y., et al. Innate immune landscape in early lung adenocarcinoma by paired single-cell analyses. Cell. 169 (4), 750-765 (2017).
  11. Chevrier, S., et al. An immune atlas of clear cell renal cell carcinoma. Cell. 169 (4), 736-749 (2017).
  12. Hartigan, J. A., Wong, M. A. Algorithm AS 136: A k-means clustering algorithm. Journal of the Royal Statistical Society. Series C (Applied Statistics). 28 (1), 100-108 (1979).
  13. Ester, M., Kriegel, H. P., Sander, J., Xu, X. Density-based spatial clustering of applications with noise. International Conference Knowledge Discovery and Data Mining. 240, (1996).
  14. Levine, J. H., et al. Data-driven phenotypic dissection of AML reveals progenitor-like cells that correlate with prognosis. Cell. 162 (1), 184-197 (2015).
  15. Blondel, V. D., Guillaume, J. L., Lambiotte, R., Lefebvre, E. Fast unfolding of communities in large networks. Journal of statistical mechanics: theory and experiment. 2008 (10), P10008 (2008).
  16. Le Martelot, E., Hankin, C. Fast multi-scale detection of relevant communities in large-scale networks. The Computer Journal. 56 (9), 1136-1150 (2013).
  17. Newman, M. E. Fast algorithm for detecting community structure in networks. Physical review E. 69 (6), 066133 (2004).
  18. Hespanha, J. P. . An efficient matlab algorithm for graph partitioning. , 1-8 (2004).
  19. Moon, T. K. The expectation-maximization algorithm. IEEE Signal processing. 13 (6), 47-60 (1996).
  20. Bishop, C. M. . Pattern recognition and machine learning. , (2006).

Play Video

Cite This Article
Sidhom, J., Theodros, D., Murter, B., Zarif, J. C., Ganguly, S., Pardoll, D. M., Baras, A. ExCYT: A Graphical User Interface for Streamlining Analysis of High-Dimensional Cytometry Data. J. Vis. Exp. (143), e57473, doi:10.3791/57473 (2019).

View Video