Summary

ExCYT: Een grafische gebruikersinterface voor het stroomlijnen van de analyse van High-dimensionale Cytometry gegevens

Published: January 16, 2019
doi:

Summary

ExCYT is een MATLAB gebaseerde grafische User Interface (GUI) waarmee gebruikers hun stroom cytometry om gegevens te analyseren via algemeen gebruikte analytische technieken voor high-dimensional data waaronder dimensionaliteit vermindering via t-GND, een aantal handmatige en geautomatiseerde Clustering van de methoden, heatmaps en roman high-dimensionale stroom percelen.

Abstract

Met de komst van flow cytometers kan meten van een toenemend aantal parameters, blijven wetenschappers ontwikkelen grotere panelen om te verkennen fenotypische kenmerken van hun cellulaire monsters. Echter, deze technologische vooruitgang opleveren hoog-dimensionale datasets die steeds moeilijker te analyseren objectief binnen traditionele handleiding gebaseerde gating programma’s zijn geworden. Om beter analyseren en presenteren van gegevens, werken wetenschappers samen met bioinformaticians met expertise in het analyseren van hoge-dimensionale gegevens hun stroom cytometry gegevens parseren. Terwijl deze methoden is aangetoond dat het zeer waardevol zijn bij het bestuderen van stroom cytometry, moeten ze nog worden opgenomen in een eenvoudig en makkelijk te gebruiken pakket voor wetenschappers die computationele of programmeertaal deskundigheid ontbreken. Om aan deze behoefte, hebben we ExCYT, een MATLAB-based Graphical User Interface (GUI) die de analyse van hoge-dimensionale stroom cytometry gegevens stroomlijnt door de uitvoering van gewoonlijk werknemer analytische technieken voor het opnemen van high-dimensional data de vermindering van dimensionaliteit door t-GND, een aantal handmatige en geautomatiseerde clustering methoden, heatmaps en roman high-dimensionale stroom percelen. Daarnaast biedt ExCYT traditionele gating opties selecteren populaties van belang voor verdere t-GND en clustering analyse evenals het vermogen om poorten direct aan t-GND percelen. De software verstrekt het extra voordeel van het werken met ofwel gecompenseerd of de niet-gecompenseerde FCS-bestanden. In het geval dat na overname compensatie vereist is, kan de gebruiker kiezen om het programma een directory van enkele vlekken en een onbevlekt monster. Het programma detecteert positieve gebeurtenissen in alle kanalen en gebruikt deze gegevens selecteren om te meer objectief berekenen de compensatie-matrix. Kortom biedt ExCYT een uitgebreide analyse pijpleiding om stroom cytometry gegevens in de vorm van FCS-bestanden en elk individu, ongeacht de computationele opleiding, gebruik van de nieuwste algoritmische benaderingen in het begrip van hun gegevens toestaan.

Introduction

Voorschotten in stroom cytometry evenals de komst van massale cytometry heeft toegestaan clinici en wetenschappers te snel identificeren en fenotypische karakteriseren biologisch en klinisch interessant monsters met nieuwe niveaus van resolutie, maken grote high-dimensional data sets die informatie rijke1,2,3. Terwijl conventionele methoden voor het analyseren van stroom cytometry gegevens zoals handmatige gating eenvoudiger voor experimenten waarbij er paar markeringen en de markeringen hebben visueel waarneembaar populaties zijn, kan deze aanpak mislukken om te genereren reproduceerbare resultaten bij het analyseren van de hoger-dimensionale datasets of degenen met markeringen, vlekken op een spectrum. Bijvoorbeeld, in een multi-institutionele studie, waren waar intra-cellulaire kleuring (ICS) testen wordt uitgevoerd om na te gaan van de reproduceerbaarheid van antigeen-specifieke T cel reacties, ondanks goede interlaboratorium precisie, analyse, met name quantitating gating, introduceerde een belangrijke bron van variabiliteit4. Bovendien, het proces van gating handmatig bevolking van belangen, naast zeer subjectief is zeer tijdrovend en arbeid-intensieve. Echter behoort het probleem van het hoge-dimensionale datasets analyseren in een robuuste, efficiënte en tijdige wijze niet nieuw voor de wetenschappen van het onderzoek. Gen expressie studies genereren vaak extreem hoge-dimensionale datasets (vaak over de volgorde van honderden genen) waar handmatige vormen van analyse zou gewoon onhaalbaar. Om aan te pakken van de analyse van deze data sets, is er veel werk in het ontwikkelen van bioinformatic hulpmiddelen te parsen van gen expressie gegevens5. Deze algoritmische benaderingen hebben zojuist onlangs aangenomen in de analyse van cytometry gegevens zoals het aantal parameters is toegenomen en hebben bewezen te zijn van onschatbare waarde zijn in de analyse van deze hoge dimensionale datasets6,7.

Ondanks de generatie en de toepassing van een verscheidenheid van algoritmen en softwarepakketten waarmee wetenschappers deze hoge-dimensionale bioinformatic benaderingen toepassen op hun stroom cytometry gegevens, blijven deze analytische technieken nog steeds grotendeels ongebruikt. Hoewel er wellicht een verscheidenheid van factoren die de wijdverspreide goedkeuring van deze benaderingen van cytometry gegevens8hebben beperkt, de grote belemmering we vermoeden in gebruik van deze benaderingen van wetenschappers, is een gebrek aan computationele kennis. In feite, zijn veel van deze softwarepakketten (dat wil zeggen, flowCore, flowMeans en OpenCyto) geschreven in programmeertalen zoals R, waarvoor nog steeds inhoudelijke kennis van programmeren moeten worden uitgevoerd. Softwarepakketten zoals FlowJo hebben gevonden tussen wetenschappers te wijten aan de eenvoud van gebruik en ‘plug-n-play’ aard, alsmede de compatibiliteit met het besturingssysteem van de PC gunst. Om de verscheidenheid van geaccepteerde en waardevolle analytische technieken om de wetenschapper onbekend programmering, hebben we ExCYT, een grafische-gebruikersinterface (GUI) die gemakkelijk kan worden geïnstalleerd op een PC/Mac, die veel van de nieuwste technieken trekt inclusief dimensionaliteit reductie voor intuïtieve visualisatie, een verscheidenheid van clustering methoden genoemd in de literatuur, samen met nieuwe functies te verkennen van de uitvoer van deze clustering algoritmen met heatmaps en roman high-dimensionale stroom/vak percelen.

ExCYT is een grafische gebruikersinterface gebouwd in MATLAB en daarom kan ofwel worden uitgevoerd binnen MATLAB direct of een installateur is op voorwaarde dat kan worden gebruikt voor het installeren van de software op elke PC/Mac. De software is beschikbaar op https://github.com/sidhomj/ExCYT. Presenteren we een gedetailleerd protocol voor het importeren van gegevens, vooraf verwerken, voeren t-GND dimensionaliteit vermindering, clusterconfiguratiegegevens, sorteren & filteren op basis van gebruikersvoorkeuren, en weergave-informatie over de clusters van belang via heatmaps en roman clusters hoge-dimensionale stroom/vak percelen ()Figuur 1). Assen op de t-GND percelen zijn willekeurig en in willekeurige eenheden en als zodanig, zoals in de cijfers voor de eenvoud van de gebruiker niet altijd interface. De kleuring van gegevenspunten in de “t-GND Heatmaps” is van blauw naar geel op basis van het signaal van de aangegeven markering. Cluster oplossingen, is de kleur van het gegevenspunt willekeurige gebaseerd op clusteraantal. Alle onderdelen van de werkstroom kunnen worden uitgevoerd in het één deelvenster GUI ()Figuur 2 & tabel 1). Tot slot zullen we laten zien dat het gebruik van ExCYT op eerder gepubliceerde gegevens verkennen de immuun landschap van niercelcarcinoom in de literatuur, ook met soortgelijke methoden geanalyseerd. De monster-dataset die we gebruikt voor het maken van de cijfers in dit manuscript samen met het protocol hieronder vindt u op https://premium.cytobank.org/cytobank/projects/875, bij het registreren van een account.

Protocol

1. verzamelen en Cytometry gegevens voorbereiden Alle enkele vlekken in een map plaatsen door zichzelf en etiket door de naam van het kanaal (door fluorophore, niet de markering). 2. gegevens invoer & voorbehandeling Als u wilt onderbreken of op te slaan gedurende deze analyse-pijpleiding, gebruiken de Werkruimte opslaan -knop in de linkerbenedenhoek van het programma op te slaan van de werkruimte als een ‘. MAT’ bestand dat later kan worden geladen v…

Representative Results

Om te testen de bruikbaarheid van ExCYT, geanalyseerd wij een curator gegevensset gepubliceerd door Chevrier et al. getiteld ‘An immuun Atlas van duidelijke cel renale carcinoom’ waar de groep uitgevoerd CyTOF analyse met een uitgebreide immuun panel met tumor monsters van 73 patiënten11. Twee afzonderlijke panelen, een myeloïde en lymfoïde panel, werden gebruikt om de fenotypische karakteriseren de communicatie van de tumor. Het doel van onze studie wa…

Discussion

Hier presenteren we ExCYT, een nieuwe grafische gebruikersinterface uitgevoerd op basis van MATLAB algoritmen om te stroomlijnen analyse van hoge-dimensionale cytometry gegevens, waardoor individuen met geen achtergrond in programmeren uit te voeren uiterlijk in high-dimensional data analyse algoritmen. De beschikbaarheid van deze software aan de bredere wetenschappelijke gemeenschap kunnen wetenschappers om te verkennen hun stroom cytometry gegevens in een intuïtieve en eenvoudige workflow. Via het uitvoeren van t-GND …

Disclosures

The authors have nothing to disclose.

Acknowledgements

De auteurs hebben geen bevestigingen.

Materials

Desktop SuperMicro Custom Build Computer used to run analysis
MATLAB Mathworks N/A Software used to develop ExCYT

References

  1. Benoist, C., Hacohen, N. Flow cytometry, amped up. Science. 332 (6030), 677-678 (2011).
  2. Ornatsky, O., et al. Highly multiparametric analysis by mass cytometry. Journal of immunological methods. 361 (1), 1-20 (2010).
  3. Tanner, S. D., et al. Flow cytometer with mass spectrometer detection for massively multiplexed single-cell biomarker assay. Pure and Applied Chemistry. 80 (12), 2627-2641 (2008).
  4. Maecker, H. T., et al. Standardization of cytokine flow cytometry assays. BMC immunology. 6 (1), 13 (2005).
  5. Brazma, A., Vilo, J. Gene expression data analysis. FEBS letters. 480 (1), 17-24 (2000).
  6. Pyne, S., et al. Automated high-dimensional flow cytometric data analysis. Proceedings of the National Academy of Sciences. 106 (21), 8519-8524 (2009).
  7. Ge, Y., Sealfon, S. C. flowPeaks: a fast unsupervised clustering for flow cytometry data via K-means and density peak finding. Bioinformatics. 28 (15), 2052-2058 (2012).
  8. Venkatesh, V. Determinants of perceived ease of use: Integrating control, intrinsic motivation, and emotion into the technology acceptance model. Information systems research. 11 (4), 342-365 (2000).
  9. Bagwell, C. B., Adams, E. G. Fluorescence spectral overlap compensation for any number of flow cytometry parameters. Annals of the New York Academy of Sciences. 677 (1), 167-184 (1993).
  10. Lavin, Y., et al. Innate immune landscape in early lung adenocarcinoma by paired single-cell analyses. Cell. 169 (4), 750-765 (2017).
  11. Chevrier, S., et al. An immune atlas of clear cell renal cell carcinoma. Cell. 169 (4), 736-749 (2017).
  12. Hartigan, J. A., Wong, M. A. Algorithm AS 136: A k-means clustering algorithm. Journal of the Royal Statistical Society. Series C (Applied Statistics). 28 (1), 100-108 (1979).
  13. Ester, M., Kriegel, H. P., Sander, J., Xu, X. Density-based spatial clustering of applications with noise. International Conference Knowledge Discovery and Data Mining. 240, (1996).
  14. Levine, J. H., et al. Data-driven phenotypic dissection of AML reveals progenitor-like cells that correlate with prognosis. Cell. 162 (1), 184-197 (2015).
  15. Blondel, V. D., Guillaume, J. L., Lambiotte, R., Lefebvre, E. Fast unfolding of communities in large networks. Journal of statistical mechanics: theory and experiment. 2008 (10), P10008 (2008).
  16. Le Martelot, E., Hankin, C. Fast multi-scale detection of relevant communities in large-scale networks. The Computer Journal. 56 (9), 1136-1150 (2013).
  17. Newman, M. E. Fast algorithm for detecting community structure in networks. Physical review E. 69 (6), 066133 (2004).
  18. Hespanha, J. P. . An efficient matlab algorithm for graph partitioning. , 1-8 (2004).
  19. Moon, T. K. The expectation-maximization algorithm. IEEE Signal processing. 13 (6), 47-60 (1996).
  20. Bishop, C. M. . Pattern recognition and machine learning. , (2006).

Play Video

Cite This Article
Sidhom, J., Theodros, D., Murter, B., Zarif, J. C., Ganguly, S., Pardoll, D. M., Baras, A. ExCYT: A Graphical User Interface for Streamlining Analysis of High-Dimensional Cytometry Data. J. Vis. Exp. (143), e57473, doi:10.3791/57473 (2019).

View Video