Summary

ExCYT: Una interfaz gráfica de usuario para simplificar el análisis de datos multidimensional de citometría de

Published: January 16, 2019
doi:

Summary

ExCYT es una basada en MATLAB usuario interfaz gráfica (GUI) que permite a los usuarios analizar sus datos de citometría de flujo mediante comúnmente empleado técnicas de análisis de datos multidimensional, incluyendo la reducción de la dimensionalidad mediante t-SNE, una variedad de automatizados y manuales métodos de clustering, heatmaps, novela flujo multidimensional parcelas.

Abstract

Con el advenimiento de los citómetros de flujo capaz de medir un número cada vez mayor de parámetros, los científicos siguen a desarrollar paneles más grandes para explorar fenotípicamente las características de sus muestras celulares. Sin embargo, estos avances tecnológicos rendimiento multidimensional modems que se han vuelto cada vez más difíciles de analizar objetivamente dentro bloquea los programas tradicionales basados en el manual. Para mejor analizar y presentar datos, los científicos asocian bioinformáticos con experiencia en análisis de datos multidimensional para analizar los datos de la citometría de flujo. Mientras que estos métodos han demostrado ser muy valiosa en el estudio de citometría de flujo, tienen todavía que ser incorporado en un paquete sencillo y fácil de usar para los científicos que carecen de conocimientos de programación o computacional. Para abordar esta necesidad, hemos desarrollado ExCYT, una basada en MATLAB usuario interfaz gráfica (GUI) que optimiza el análisis de datos de citometría de flujo multidimensional mediante la aplicación de técnicas analíticas comúnmente empleadas para la inclusión de datos multidimensional reducción de la dimensionalidad por t-SNE, una variedad de métodos de agrupamiento automatizados y manuales, heatmaps y novela flujo multidimensional parcelas. Además, ExCYT ofrece tradicionales bloquea opciones de seleccionadas poblaciones de interés para más t-SNE y clustering análisis así como la capacidad de aplicar puertas directamente en parcelas t-SNE. El software proporciona la ventaja adicional de trabajar con ya sea compensado o archivos FCS no compensados. En caso de que después de la adquisición indemnización se requiere, el usuario puede elegir proporcionar el programa de un directorio de manchas únicos y una muestra sin manchas. El programa detecta eventos positivos en todos los canales y utiliza estos datos seleccionarlos objetivamente más calcular la matriz de compensación. En Resumen, ExCYT ofrece una tubería de análisis completo para tomar datos de citometría de flujo en forma de archivos de FCS y permitir que a cualquier persona, independientemente de la capacitación computacional, con los últimos enfoques algorítmicos en la comprensión de sus datos.

Introduction

Avances en citometría de flujo, así como el advenimiento de la citometría de masas ha permitido a los médicos y científicos para rápidamente identificar y caracterizar fenotípicamente las muestras biológica y clínicamente interesantes con nuevos niveles de resolución, creando grandes conjuntos de datos multidimensional que son información rica1,2,3. Mientras que los métodos convencionales para el análisis de datos de citometría de flujo como compuerta manual han sido más sencillos para los experimentos donde hay pocos marcadores y los marcadores tienen poblaciones visualmente discernibles, este enfoque puede no generar resultados reproducibles cuando se analizan conjuntos de datos de mayor dimensión o aquellos con marcadores de tinción en un espectro. Por ejemplo, en un estudio multi-institucional, donde intracelular tinción (ICS) ensayos se realizaron para evaluar la reproducibilidad de la cuantificación de las respuestas de células de T específicas de antígeno, a pesar de buena precisión entre laboratorios, análisis, particularmente sincronización, introdujo una importante fuente de variabilidad4. Además, el proceso de bloquear manualmente la población de interés, además de ser muy subjetivo es muy desperdiciador de tiempo y mano de obra intensiva. Sin embargo, el problema de analizar conjuntos de datos multidimensional de una manera robusta, eficiente y oportuna no es uno nuevo para la investigación en Ciencias. Estudios de expresión génica generan a menudo extremadamente multidimensional modems (a menudo del orden de cientos de genes) en formas manual de análisis sería simplemente imposible. Para abordar el análisis de estos datos, ha habido mucho trabajo en el desarrollo de herramientas bioinformáticas para analizar datos de expresión génica5. Estos enfoques algorítmicos se sólo han recientemente adoptados en el análisis de datos de citometría como el número de parámetros ha aumentado y ha demostrado para ser invaluables en el análisis de estos conjuntos de datos dimensional alta6,7.

A pesar de la generación y aplicación de una variedad de algoritmos y paquetes de software que permiten a los científicos a aplicar estos enfoques bioinformáticas multidimensional a los datos de la citometría de flujo, estas técnicas analíticas siguen siendo en gran parte inusitadas. Aunque puede haber una variedad de factores que han limitado la adopción generalizada de estos enfoques para citometría datos8, el obstáculo principal que sospechamos en el uso de estos enfoques por los científicos, es una falta de conocimiento computacional. De hecho, muchos de estos paquetes de software (es decir, flowCore, flowMeans y OpenCyto) están escritos en lenguajes como R que todavía requieren conocimientos de programación sustantiva de programación. Paquetes de software como FlowJo han encontrado favor entre los científicos por la sencillez de uso y naturaleza ‘plug-n-play’, así como compatibilidad con el sistema operativo de PC. Para proporcionar la variedad de técnicas analíticas aceptadas y valiosas para la programación desconocido científico, hemos desarrollado ExCYT, una interfaz gráfica de usuario (GUI) que puede ser fácilmente instalada en un PC/Mac que tira muchas de las técnicas más recientes incluyendo reducción de dimensionalidad para visualización intuitiva, una variedad de métodos de agrupamiento citado en la literatura, junto con características nuevas para explorar la producción de estos clústeres de algoritmos con diagramas de flujo/caja multidimensional heatmaps y novela.

ExCYT es una interfaz gráfica de usuario en MATLAB y por lo tanto puede tanto ejecutar dentro de MATLAB directamente o un instalador siempre puede utilizarse para instalar el software en cualquier PC/Mac. El software está disponible en https://github.com/sidhomj/ExCYT. Presentamos un protocolo detallado de cómo importar datos, pre-procesarlo, realizar reducción de dimensionalidad t-SNE, cluster de datos, tipo y filtro clusters basados en las preferencias del usuario y muestra información sobre los grupos de interés vía heatmaps y novela cuadro de flujo de alta dimensión parcelas ()figura 1). Los ejes en parcelas t-SNE son arbitrarias y en unidades arbitrarias y así como no siempre se muestra en las figuras para simplicidad del usuario interfaz. El color de los puntos de datos en el “t-SNE Heatmaps” es de azul a amarillo basado en la señal del marcador indicado. En soluciones de clustering, el color del punto de datos se basa arbitraria en número de clúster. Todas las partes del flujo de trabajo pueden llevarse a cabo en el panel solo GUI ()figura 2 y 1 mesa). Finalmente, demostraremos el uso de ExCYT en datos previamente publicados, explorando el paisaje inmune de carcinoma de células renales en la literatura, que también se analizaron con métodos similares. El conjunto de datos de muestra que se utilizó para crear las figuras en este manuscrito con el siguiente protocolo puede encontrarse en https://premium.cytobank.org/cytobank/projects/875, al registrar una cuenta.

Protocol

1. recolección y preparación de datos de citometría de Colocar todas las manchas solo en una carpeta propia y sello por el nombre del canal (fluoróforo, no de marcador). 2. los datos importación y pre-procesamiento Para pausar o guardar a lo largo de esta tubería de análisis, utilice el botón Guardar espacio de trabajo en la parte inferior izquierda del programa para guardar el espacio de trabajo como un ‘. ESTERA ‘ archivo que puede ser carga…

Representative Results

Para probar la usabilidad de los ExCYT, hemos analizado un conjunto de datos curado publicado por Chevrier et al. , titulado ‘Un inmune Atlas de clara célula Carcinoma Renal’ donde el grupo llevó a cabo análisis CyTOF con un amplio panel inmune en muestras tumorales de 73 pacientes11. Dos paneles separados, un panel mieloide y linfoide, se utilizaron para caracterizar fenotípicamente el microambiente tumoral. El objetivo de nuestro estudio fue recapitu…

Discussion

Aquí os presentamos ExCYT, una interfaz de usuario gráfica novela ejecutando algoritmos basados en MATLAB para simplificar el análisis de datos de citometría de alta dimensión, permitiendo que a las personas con ninguna experiencia en programación para implementar lo último en datos multidimensional algoritmos de análisis. La disponibilidad de este software a la comunidad científica permitirá a los científicos a explorar sus datos de citometría de flujo en un flujo de trabajo intuitivo y sencillo. A través d…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Los autores no tienen ninguna agradecimientos.

Materials

Desktop SuperMicro Custom Build Computer used to run analysis
MATLAB Mathworks N/A Software used to develop ExCYT

References

  1. Benoist, C., Hacohen, N. Flow cytometry, amped up. Science. 332 (6030), 677-678 (2011).
  2. Ornatsky, O., et al. Highly multiparametric analysis by mass cytometry. Journal of immunological methods. 361 (1), 1-20 (2010).
  3. Tanner, S. D., et al. Flow cytometer with mass spectrometer detection for massively multiplexed single-cell biomarker assay. Pure and Applied Chemistry. 80 (12), 2627-2641 (2008).
  4. Maecker, H. T., et al. Standardization of cytokine flow cytometry assays. BMC immunology. 6 (1), 13 (2005).
  5. Brazma, A., Vilo, J. Gene expression data analysis. FEBS letters. 480 (1), 17-24 (2000).
  6. Pyne, S., et al. Automated high-dimensional flow cytometric data analysis. Proceedings of the National Academy of Sciences. 106 (21), 8519-8524 (2009).
  7. Ge, Y., Sealfon, S. C. flowPeaks: a fast unsupervised clustering for flow cytometry data via K-means and density peak finding. Bioinformatics. 28 (15), 2052-2058 (2012).
  8. Venkatesh, V. Determinants of perceived ease of use: Integrating control, intrinsic motivation, and emotion into the technology acceptance model. Information systems research. 11 (4), 342-365 (2000).
  9. Bagwell, C. B., Adams, E. G. Fluorescence spectral overlap compensation for any number of flow cytometry parameters. Annals of the New York Academy of Sciences. 677 (1), 167-184 (1993).
  10. Lavin, Y., et al. Innate immune landscape in early lung adenocarcinoma by paired single-cell analyses. Cell. 169 (4), 750-765 (2017).
  11. Chevrier, S., et al. An immune atlas of clear cell renal cell carcinoma. Cell. 169 (4), 736-749 (2017).
  12. Hartigan, J. A., Wong, M. A. Algorithm AS 136: A k-means clustering algorithm. Journal of the Royal Statistical Society. Series C (Applied Statistics). 28 (1), 100-108 (1979).
  13. Ester, M., Kriegel, H. P., Sander, J., Xu, X. Density-based spatial clustering of applications with noise. International Conference Knowledge Discovery and Data Mining. 240, (1996).
  14. Levine, J. H., et al. Data-driven phenotypic dissection of AML reveals progenitor-like cells that correlate with prognosis. Cell. 162 (1), 184-197 (2015).
  15. Blondel, V. D., Guillaume, J. L., Lambiotte, R., Lefebvre, E. Fast unfolding of communities in large networks. Journal of statistical mechanics: theory and experiment. 2008 (10), P10008 (2008).
  16. Le Martelot, E., Hankin, C. Fast multi-scale detection of relevant communities in large-scale networks. The Computer Journal. 56 (9), 1136-1150 (2013).
  17. Newman, M. E. Fast algorithm for detecting community structure in networks. Physical review E. 69 (6), 066133 (2004).
  18. Hespanha, J. P. . An efficient matlab algorithm for graph partitioning. , 1-8 (2004).
  19. Moon, T. K. The expectation-maximization algorithm. IEEE Signal processing. 13 (6), 47-60 (1996).
  20. Bishop, C. M. . Pattern recognition and machine learning. , (2006).

Play Video

Cite This Article
Sidhom, J., Theodros, D., Murter, B., Zarif, J. C., Ganguly, S., Pardoll, D. M., Baras, A. ExCYT: A Graphical User Interface for Streamlining Analysis of High-Dimensional Cytometry Data. J. Vis. Exp. (143), e57473, doi:10.3791/57473 (2019).

View Video