Summary

ExCYT: yüksek boyutlu sitometresi veri analizi düzene için bir grafik kullanıcı arabirimi

Published: January 16, 2019
doi:

Summary

ExCYT bir MATLAB tabanlı grafiksel kullanıcı arayüzü (kullanıcıların kendi akış sitometresi veri yolu ile yaygın olarak analiz olanak sağlayan GUI) dimensionality azaltma yolu ile t-SNE, otomatik ve el ile çeşitli dahil olmak üzere yüksek boyutlu verileri için analitik teknikler istihdam olduğunu kümeleme yöntemleri, heatmaps ve Roman yüksek boyutlu Akış grafiğini çizer.

Abstract

Akış cytometers parametreleri giderek artan sayıda ölçme yeteneğine sahip çıkmasıyla, bilim adamları phenotypically onların hücresel örnekleri özelliklerini keşfetmek için daha büyük paneller geliştirmeye devam. Ancak, bu teknolojik gelişmeler objektif manuel tabanlı geleneksel gating programları içinde analiz için giderek daha zor hale gelmiştir yüksek boyutlu veri kümeleri verim. Daha iyi analiz ve veri sunmak için akış sitometresi verilerini ayrıştırmak için yüksek boyutlu veri çözümleme uzmanlık ile bioinformaticians ile bilim adamları ortak. Bu yöntemler akış sitometresi okumak çok değerli olduğu gösterilmiştir iken, onlar henüz basit ve kullanımı kolay bir pakette Hesaplamalı veya programlama uzmanlık eksikliği bilim adamları için dahil olmak gerek. Bu gereksinimi karşılamak için biz ExCYT, bir MATLAB tabanlı grafik kullanıcı arabirimi (yüksek boyutlu akış sitometresi verilerin analizi yüksek boyutlu veri de dahil olmak üzere yaygın olarak istihdam analitik tekniklerini uygulayarak akıcılık GUI) geliştirdik t-SNE tarafından dimensionality azaltma, otomatik ve el ile kümeleme yöntem, heatmaps ve Roman yüksek boyutlu akış çeşitli çizer. Ayrıca, ExCYT daha fazla t-SNE ve Kümeleme Analizi yanı sıra yetenek gates doğrudan t-SNE araziler üzerinde uygulamak için ilgi seçin örneğin alınma olasılığını geleneksel gating seçenekleri sağlar. Belgili tanımlık bilgisayar yazılımı da telafi işe ek avantajı veya uncompensated FCS dosyaları sağlar. Olay bu sonrası edinme tazminat gereklidir, Kullanıcı bir dizin tek lekeleri ve günahı bir örnek program sağlamak seçebilirsiniz. Program tüm kanalları olumlu olayları algılar ve bu verileri seçme daha objektif olarak tazminat matris hesaplamak için kullanır. Özetle, ExCYT akış sitometresi veri FCS dosyaları şeklinde almak ve herhangi bir bireysel hesaplama verilerini anlamada en son algoritmik yaklaşımlar kullanmak için eğitim, ne olursa olsun, izin vermek için kapsamlı bir analiz boru hattı sağlar.

Introduction

Akış Sitometresi yanı sıra kitle sitometresi gelişiyle gelişmeler klinisyenler ve bilim adamları hızla belirlemek ve phenotypically biyolojik ve klinik olarak ilginç örnekleri çözünürlük büyük oluşturma, yeni seviyeleri ile karakterize izin verdi bilgi zengin1,2,3olan yüksek boyutlu veri kümeleri. Ise manuel geçişi gibi akış sitometresi veri analizi için geleneksel yöntemler orada birkaç işaretleri ve görsel olarak discernable nüfus bu işaretleri var deneyler için daha basit olabilirdi, bu yaklaşım oluşturmak başarısız olabilir yüksek boyutlu veri kümeleri ya da bir spektrum üzerinde boyama işaretçileri olan analiz ederken tekrarlanabilir sonuçlar. Örneğin, bir çok kurumsal çalışmada, intra hücresel nerede (ICS) boyama deneyleri antijen spesifik T hücre yanıt-e doğru iyi inter-laboratory hassas, analiz, rağmen özellikle quantitating tekrarlanabilirlik değerlendirmek için gerçekleştirilen perdeleme, değişkenlik4önemli bir kaynak tanıttı. Ayrıca, el ile popülasyon çıkarlarının, son derece öznel olmasının yanı sıra perdeleme süreci son derece zaman alıcı ve emek yoğun olduğunu. Ancak, sağlam, verimli ve zamanında bir şekilde yüksek boyutlu veri kümeleri çözümleme sorunu araştırma Bilimleri yeni biri değil. Gen ifade çalışmalar genellikle son derece yüksek boyutlu veri kümeleri nerede analiz manuel formları sadece olanaksız olurdu (genellikle sırasına genler yüzlerce) oluşturur. Bu veri kümeleri çözümleme mücadele için bioinformatic araçları gen ifadesi verileri5ayrıştırmak için gelişmekte olan fazla çalışma olmuştur. Parametre sayısı artmıştır ve bu yüksek boyutlu veri kümeleri6,7analizinde çok değerli olduğu kanıtlanmıştır algoritmik bu yaklaşımlar sadece son zamanlarda sitometresi veri analizi benimsenmiştir.

Üretimi ve çeşitli algoritmalar ve bilim adamları bu yüksek boyutlu bioinformatic yaklaşımlar onların akış sitometresi verilere uygulamak izin yazılım paketleri uygulanmasına rağmen bu analitik teknikler hala büyük ölçüde kullanılmayan kalır. Bu yaklaşımların sitometresi veri8yaygınlaşmasının sınırlı olan faktörler çeşitli olsa, biz şüpheli büyük engel bu yaklaşımlar bilim adamları tarafından kullanımı, Hesaplamalı bilgi eksikliğidir. Aslında, çok sayıda bu yazılım paketi (Yani, flowCore, flowMeans ve OpenCyto) programlama hala önemli programlama bilgisi gerektiren dillerinde R gibi uygulanmak üzere yazılmıştır. FlowJo gibi yazılım paketlerini iyilik kolaylığı kullanım ve ‘Tak ve Çalıştır’ doğa gibi PC işletim sistemi ile uyumluluk nedeniyle bilim adamları arasında bulduk. Biz ExCYT, en son teknikleri çok çeker PC/Mac’te kolayca kurulabilir bir grafik kullanıcı arabirimi (GUI) geliştirilen çeşitli bilim adamı yabancı programlama için analitik teknikler kabul edilen ve değerli sağlamak, dimensionality azaltma sezgisel görselleştirme, kümeleme Yöntemler çıktı bu keşfetmek için yeni özellikler ile birlikte literatürde atıf için kümeleme algoritmaları ile heatmaps ve Roman yüksek boyutlu akış/kutu araziler de dahil olmak üzere.

ExCYT MATLAB’de yerleşik bir grafik kullanıcı arabirimidir ve bu nedenle de MATLAB içinde doğrudan çalıştırılabilir veya herhangi bir PC/Mac yazılım yüklemek için kullanılabilir bir yükleyici sağlanır Https://github.com/sidhomj/ExCYT kullanılabilir bir yazılımdır. Biz nasıl veri almak, ön işlemden, kuralları t-SNE dimensionality azaltma, küme veri, sıralama ve Kullanıcı tercihlerini ve faiz kümeleri üzerinden heatmaps ve roman hakkında bilgi görüntüler dayalı kümeleri filtre için detaylı bir iletişim kuralı mevcut yüksek boyutlu akış/kutu araziler ()Şekil 1). Eksenleri t-SNE parsellerde keyfi ve rasgele birimlerinde ve bu nedenle her zaman kullanıcı kolaylığı için rakamlar gösterildiği gibi arabirim. Boyama “t-SNE Heatmaps” veri noktalarının belirtilen işaretleyici sinyal dayalı sarı maviden etmektir. Çözümler kümeleme, veri noktası rengini rasgele küme sayısına dayanır. İş akışının tüm parçalar tek panelinde GUI ()Şekil 2 yürütülen olabilir & Tablo 1). Son olarak, biz ExCYT kullanımı daha önce yayımlanmış veri renal hücreli karsinom da benzer yöntemlerle analiz literatürde bağışıklık manzara keşfetmek Tarih gösterecektir. Bir hesap kayıt üzerine https://premium.cytobank.org/cytobank/projects/875, rakamlar bu el yazması ile birlikte aşağıdaki iletişim kuralı oluşturmak için kullanılan örnek veri kümesi bulunabilir.

Protocol

1. toplama ve sitometresi veri hazırlama Tüm tek lekeleri bir klasörde kendilerini ve etiket tarafından kanal adıyla (fluorophore tarafından imini içermeden) yerleştirin. 2. veri ithalat & ön işleme Duraklatmak veya bu analiz boru hattı kaydetmek için çalışma alanı olarak kaydetme için programın sol alt Çalışma alanını Kaydet’i düğmesini kullanın bir ‘. MAT’ Yük çalışma alanı düğmesi ile daha sonra yü…

Representative Results

ExCYT kullanılabilirliğini sınamak için analiz ettik adlı bir veri kümesinin Chevrier ve ark. ‘Bir bağışıklık Atlas, açık hücre böbrek nerede grubu CyTOF analiz 73 alınan tümör örnekler üzerinde kapsamlı bir bağışıklık paneliyle yürütülen Karsinomu’ başlıklı tarafından yayınlandı hastalar11. İki ayrı panel, myeloid ve lenfoid bir panel, phenotypically tümör microenvironment karakterize etmek için kullanılmıştır. …

Discussion

Burada en son yüksek boyutlu veri uygulamak için programlama arka plan ile bireylerin izin ExCYT, MATLAB tabanlı algoritmalar yüksek boyutlu sitometresi, veri çözümlemesi kolaylaştırmak için çalışan bir roman grafik kullanıcı arabirimi mevcut analiz algoritmaları. Bu yazılım daha geniş bilimsel topluluk için kullanılabilirliğini akış sitometresi verilerine bir sezgisel ve kolay iş akışı içinde keşfetmek bilim adamları sağlayacaktır. T-SNE dimensionality azaltma iletken bir kümeleme yönt…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Yazarlar hiçbir katkıda bulunanlar var.

Materials

Desktop SuperMicro Custom Build Computer used to run analysis
MATLAB Mathworks N/A Software used to develop ExCYT

References

  1. Benoist, C., Hacohen, N. Flow cytometry, amped up. Science. 332 (6030), 677-678 (2011).
  2. Ornatsky, O., et al. Highly multiparametric analysis by mass cytometry. Journal of immunological methods. 361 (1), 1-20 (2010).
  3. Tanner, S. D., et al. Flow cytometer with mass spectrometer detection for massively multiplexed single-cell biomarker assay. Pure and Applied Chemistry. 80 (12), 2627-2641 (2008).
  4. Maecker, H. T., et al. Standardization of cytokine flow cytometry assays. BMC immunology. 6 (1), 13 (2005).
  5. Brazma, A., Vilo, J. Gene expression data analysis. FEBS letters. 480 (1), 17-24 (2000).
  6. Pyne, S., et al. Automated high-dimensional flow cytometric data analysis. Proceedings of the National Academy of Sciences. 106 (21), 8519-8524 (2009).
  7. Ge, Y., Sealfon, S. C. flowPeaks: a fast unsupervised clustering for flow cytometry data via K-means and density peak finding. Bioinformatics. 28 (15), 2052-2058 (2012).
  8. Venkatesh, V. Determinants of perceived ease of use: Integrating control, intrinsic motivation, and emotion into the technology acceptance model. Information systems research. 11 (4), 342-365 (2000).
  9. Bagwell, C. B., Adams, E. G. Fluorescence spectral overlap compensation for any number of flow cytometry parameters. Annals of the New York Academy of Sciences. 677 (1), 167-184 (1993).
  10. Lavin, Y., et al. Innate immune landscape in early lung adenocarcinoma by paired single-cell analyses. Cell. 169 (4), 750-765 (2017).
  11. Chevrier, S., et al. An immune atlas of clear cell renal cell carcinoma. Cell. 169 (4), 736-749 (2017).
  12. Hartigan, J. A., Wong, M. A. Algorithm AS 136: A k-means clustering algorithm. Journal of the Royal Statistical Society. Series C (Applied Statistics). 28 (1), 100-108 (1979).
  13. Ester, M., Kriegel, H. P., Sander, J., Xu, X. Density-based spatial clustering of applications with noise. International Conference Knowledge Discovery and Data Mining. 240, (1996).
  14. Levine, J. H., et al. Data-driven phenotypic dissection of AML reveals progenitor-like cells that correlate with prognosis. Cell. 162 (1), 184-197 (2015).
  15. Blondel, V. D., Guillaume, J. L., Lambiotte, R., Lefebvre, E. Fast unfolding of communities in large networks. Journal of statistical mechanics: theory and experiment. 2008 (10), P10008 (2008).
  16. Le Martelot, E., Hankin, C. Fast multi-scale detection of relevant communities in large-scale networks. The Computer Journal. 56 (9), 1136-1150 (2013).
  17. Newman, M. E. Fast algorithm for detecting community structure in networks. Physical review E. 69 (6), 066133 (2004).
  18. Hespanha, J. P. . An efficient matlab algorithm for graph partitioning. , 1-8 (2004).
  19. Moon, T. K. The expectation-maximization algorithm. IEEE Signal processing. 13 (6), 47-60 (1996).
  20. Bishop, C. M. . Pattern recognition and machine learning. , (2006).

Play Video

Cite This Article
Sidhom, J., Theodros, D., Murter, B., Zarif, J. C., Ganguly, S., Pardoll, D. M., Baras, A. ExCYT: A Graphical User Interface for Streamlining Analysis of High-Dimensional Cytometry Data. J. Vis. Exp. (143), e57473, doi:10.3791/57473 (2019).

View Video