Summary

ExCYT: Un'interfaccia utente grafica per semplificare l'analisi dei dati Cytometry alto-dimensionali

Published: January 16, 2019
doi:

Summary

ExCYT è una base di MATLAB utente interfaccia grafica (GUI) che consente agli utenti di analizzare i dati di cytometry di flusso tramite comunemente impiegate tecniche analitiche per alto-dimensionali dati compresa la riduzione della dimensionalità via t-SNE, una varietà di manuali e automatiche clustering di metodi, heatmaps e flusso alto-dimensionali romanzo trame.

Abstract

Con l’avvento dei citometri a flusso in grado di misurare un numero crescente di parametri, gli scienziati continuano a sviluppare pannelli più grandi per esplorare fenotipico caratteristiche dei loro campioni cellulari. Tuttavia, questi progressi tecnologici rendimento alto-dimensionali insiemi di dati che sono diventati sempre più difficili da analizzare obiettivamente all’interno dei tradizionali programmi gating basati su manuale. Al fine di meglio analizzare e presentare i dati, gli scienziati collaborano con bioinformatici con competenze in analisi dei dati alto-dimensionali per analizzare i dati di citometria a flusso. Mentre questi metodi hanno dimostrati di essere altamente utile nello studio della citometria a flusso, devono ancora essere incorporato in un pacchetto semplice e facile da usare per gli scienziati che non hanno competenze di programmazione o computazionale. Per soddisfare questa esigenza, abbiamo sviluppato ExCYT, una base di MATLAB utente interfaccia grafica (GUI) che semplifica l’analisi dei dati di cytometry di flusso alto-dimensionali implementando comunemente impiegate tecniche analitiche per l’inclusione di dati alto-dimensionali riduzione di dimensionalità di t-SNE, una varietà di metodi di clustering automatizzati e manuali, heatmaps e flusso alto-dimensionali romanzo trame. ExCYT fornisce inoltre opzioni Gate tradizionali delle popolazioni selezionate di interesse per ulteriore t-SNE e analisi, nonché la possibilità di applicare cancelli direttamente su t-SNE appezzamenti di clustering. Il software offre l’ulteriore vantaggio di lavorare con entrambi compensata o non compensata FCS file. Nel caso in cui è richiesta la compensazione post-acquisizione, l’utente può scegliere di fornire il programma in una directory di singole macchie e un campione senza macchia. Il programma rileva eventi positivi in tutti i canali e utilizza questi dati selezionare per calcolare più obiettivamente la matrice di compensazione. In sintesi, ExCYT fornisce una pipeline di analisi completa per prendere la citometria a flusso di dati sotto forma di file di FCS e consentire qualsiasi individuo, indipendentemente dalla formazione computazionale, di utilizzare i più recenti metodi algoritmici nella comprensione dei propri dati.

Introduction

Progressi in citometria a flusso, nonché l’avvento di massa cytometry ha permesso ai medici e scienziati rapidamente identificare e caratterizzare fenotipicamente biologicamente e clinicamente interessanti campioni con nuovi livelli di risoluzione, creando grande insiemi di dati alto-dimensionali che sono informazioni ricchi1,2,3. Mentre i metodi convenzionali per l’analisi dei dati di cytometry di flusso quali gating manuale sono stati più semplici per gli esperimenti dove ci sono alcuni indicatori che tali marcatori hanno popolazioni visivamente percepibile, questo approccio può non riuscire a generare riproducibilità dei risultati quando l’analisi di insiemi di dati più alto-dimensionali o quelli con marcatori che macchia su uno spettro. Ad esempio, in uno studio multi-istituzionale, dove intra-cellulare (ICS) la macchiatura saggi furono eseguiti per valutare la riproducibilità di quantificazione risposte di cellule T antigene-specifiche, nonostante la buona precisione interlaboratorio, analisi, particolarmente gating, presentare una significativa fonte di variabilità4. Inoltre, il processo di gating manualmente popolazione degli interessi, oltre ad essere altamente soggettiva è altamente in termini di tempo e di lavoro ad alta intensità. Tuttavia, il problema di analizzare set di dati di dimensioni elevate in maniera robusta, efficiente e tempestiva non è uno nuovo per la ricerca di scienze. Studi di espressione genica spesso generano insiemi di dati estremamente alto-dimensionali (spesso dell’ordine di centinaia di geni) dove forme manuale di analisi sarebbe semplicemente non fattibile. Al fine di affrontare l’analisi di questi insiemi di dati, c’è stato molto lavoro nello sviluppo di strumenti bioinformatici per analizzare l’espressione genica dei dati5. Questi approcci algoritmici appena sono state recentemente adottati nell’analisi di citometria a dati come il numero di parametri è aumentato e hanno dimostrato di essere prezioso per l’analisi di questi insiemi di dati dimensionali alta6,7.

Nonostante la generazione e l’applicazione di una varietà di algoritmi e pacchetti software che permettono agli scienziati di applicare questi approcci bioinformatici alto-dimensionali ai loro dati di citometria a flusso, queste tecniche analitiche rimangono ancora in gran parte inutilizzate. Mentre ci può essere una varietà di fattori che hanno limitato l’adozione diffusa di questi approcci per citometria a dati8, l’ostacolo principale abbiamo il sospetto in uso di questi approcci dagli scienziati, è una mancanza di conoscenza computazionale. Infatti, molti di questi pacchetti software (cioè, flowCore, flowMeans e OpenCyto) sono scritti per essere implementato in linguaggi di programmazione quali R che ancora richiedono conoscenze di programmazione sostanziali. Pacchetti software come FlowJo hanno trovato il favore fra gli scienziati grazie alla semplicità di utilizzo e ‘plug-n-play’ natura, nonché la compatibilità con il sistema operativo del PC. Al fine di fornire la varietà di tecniche analitiche accettati e preziosi per la programmazione di sconosciuto scienziato, abbiamo sviluppato ExCYT, un’interfaccia utente grafica (GUI) che può essere facilmente installata su un PC/Mac che tira molte delle più recenti tecniche compresa la riduzione della dimensionalità per visualizzazione intuitiva, una varietà di metodi di clustering citati nella letteratura, con caratteristiche innovative per esplorare l’output di questi algoritmi con trame di alto-dimensionali/cassa d’afflusso heatmaps e romanzo di clustering.

ExCYT è un’interfaccia di utente grafica costruita in MATLAB e pertanto può sia essere eseguito all’interno di MATLAB direttamente o un programma di installazione viene fornito che può essere utilizzato per installare il software su qualsiasi PC/Mac. Il software è disponibile presso https://github.com/sidhomj/ExCYT. Vi presentiamo un protocollo dettagliato su come importare dati, pre-elaborarlo, condurre riduzione di dimensionalità t-SNE, dati del cluster, sorta e filtrare cluster in base alle preferenze dell’utente e visualizzare informazioni sui cluster di interesse via heatmaps e romanzo trame di alto-dimensionali flusso/scatola (Figura 1). Assi in t-SNE trame sono arbitrari e in unità arbitrarie e così come non sempre mostrato nelle figure per semplicità dell’utente dell’interfaccia. La colorazione dei punti dati nel “t-SNE Heatmaps” è dal blu al giallo basato sul segnale del marcatore indicato. In soluzioni di clustering, il colore del punto dati è basato arbitrario il numero di cluster. Tutte le parti del flusso di lavoro possono essere effettuate nel pannello singolo GUI (Figura 2 & tabella 1). Infine, verrà illustrato l’utilizzo di ExCYT sui dati precedentemente pubblicati, esplorare il paesaggio immune di carcinoma renale delle cellule nella letteratura, anche analizzato con metodi simili. Il set di dati campione che abbiamo usato per creare le figure in questo manoscritto unitamente al protocollo sottostante è reperibile in https://premium.cytobank.org/cytobank/projects/875, al momento della registrazione di un account.

Protocol

1. raccolta e preparazione dei dati Cytometry Inserire tutte le singole macchie in una cartella di se stessi e l’etichetta con il nome di canale (da fluoroforo, non marcatore). 2. pre-elaborazione & importazione dati Per mettere in pausa o salvare in tutta questa pipeline di analisi, utilizzare il pulsante Salva area di lavoro in basso a sinistra del programma per salvare l’area di lavoro come un ‘. MAT’ file che successivamente possa essere caricati …

Representative Results

Al fine di testare l’usabilità di ExCYT, abbiamo analizzato un set di dati a cura pubblicato da Chevrier et al. , intitolato ‘An Immune Atlas di chiaro Carcinoma delle cellule renali’ dove il gruppo ha condotto analisi CyTOF con un vasto pannello immune su campioni di tumore prelevati da 73 pazienti11. Due pannelli separati, un pannello mieloide e linfoide, sono stati usati per caratterizzare fenotipicamente il microambiente tumorale. L’obiettivo del nost…

Discussion

Qui vi presentiamo ExCYT, un’interfaccia di utente grafica romanzo che esegue algoritmi basati su MATLAB, per semplificare l’analisi dei dati di alto-dimensionali cytometry, permettendo che gli individui senza sfondo di programmazione per implementare le ultime in alto-dimensionali dati algoritmi di analisi. La disponibilità di questo software per la più ampia comunità scientifica permetterà agli scienziati di esplorare i dati di cytometry di flusso in un flusso di lavoro intuitivo e semplice. Attraverso lo svolgimen…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Gli autori non hanno nessun ringraziamenti.

Materials

Desktop SuperMicro Custom Build Computer used to run analysis
MATLAB Mathworks N/A Software used to develop ExCYT

References

  1. Benoist, C., Hacohen, N. Flow cytometry, amped up. Science. 332 (6030), 677-678 (2011).
  2. Ornatsky, O., et al. Highly multiparametric analysis by mass cytometry. Journal of immunological methods. 361 (1), 1-20 (2010).
  3. Tanner, S. D., et al. Flow cytometer with mass spectrometer detection for massively multiplexed single-cell biomarker assay. Pure and Applied Chemistry. 80 (12), 2627-2641 (2008).
  4. Maecker, H. T., et al. Standardization of cytokine flow cytometry assays. BMC immunology. 6 (1), 13 (2005).
  5. Brazma, A., Vilo, J. Gene expression data analysis. FEBS letters. 480 (1), 17-24 (2000).
  6. Pyne, S., et al. Automated high-dimensional flow cytometric data analysis. Proceedings of the National Academy of Sciences. 106 (21), 8519-8524 (2009).
  7. Ge, Y., Sealfon, S. C. flowPeaks: a fast unsupervised clustering for flow cytometry data via K-means and density peak finding. Bioinformatics. 28 (15), 2052-2058 (2012).
  8. Venkatesh, V. Determinants of perceived ease of use: Integrating control, intrinsic motivation, and emotion into the technology acceptance model. Information systems research. 11 (4), 342-365 (2000).
  9. Bagwell, C. B., Adams, E. G. Fluorescence spectral overlap compensation for any number of flow cytometry parameters. Annals of the New York Academy of Sciences. 677 (1), 167-184 (1993).
  10. Lavin, Y., et al. Innate immune landscape in early lung adenocarcinoma by paired single-cell analyses. Cell. 169 (4), 750-765 (2017).
  11. Chevrier, S., et al. An immune atlas of clear cell renal cell carcinoma. Cell. 169 (4), 736-749 (2017).
  12. Hartigan, J. A., Wong, M. A. Algorithm AS 136: A k-means clustering algorithm. Journal of the Royal Statistical Society. Series C (Applied Statistics). 28 (1), 100-108 (1979).
  13. Ester, M., Kriegel, H. P., Sander, J., Xu, X. Density-based spatial clustering of applications with noise. International Conference Knowledge Discovery and Data Mining. 240, (1996).
  14. Levine, J. H., et al. Data-driven phenotypic dissection of AML reveals progenitor-like cells that correlate with prognosis. Cell. 162 (1), 184-197 (2015).
  15. Blondel, V. D., Guillaume, J. L., Lambiotte, R., Lefebvre, E. Fast unfolding of communities in large networks. Journal of statistical mechanics: theory and experiment. 2008 (10), P10008 (2008).
  16. Le Martelot, E., Hankin, C. Fast multi-scale detection of relevant communities in large-scale networks. The Computer Journal. 56 (9), 1136-1150 (2013).
  17. Newman, M. E. Fast algorithm for detecting community structure in networks. Physical review E. 69 (6), 066133 (2004).
  18. Hespanha, J. P. . An efficient matlab algorithm for graph partitioning. , 1-8 (2004).
  19. Moon, T. K. The expectation-maximization algorithm. IEEE Signal processing. 13 (6), 47-60 (1996).
  20. Bishop, C. M. . Pattern recognition and machine learning. , (2006).

Play Video

Cite This Article
Sidhom, J., Theodros, D., Murter, B., Zarif, J. C., Ganguly, S., Pardoll, D. M., Baras, A. ExCYT: A Graphical User Interface for Streamlining Analysis of High-Dimensional Cytometry Data. J. Vis. Exp. (143), e57473, doi:10.3791/57473 (2019).

View Video