Summary

اكسسيت: واجهة مستخدم رسومية لتبسيط تحليل البيانات الخلوي عالية ثلاثي الأبعاد

Published: January 16, 2019
doi:

Summary

اكسسيت هو أساس MATLAB واجهة المستخدم الرسومية (GUI) التي تسمح للمستخدمين لتحليل البيانات التدفق الخلوي عبر عادة تستخدم التقنيات التحليلية للبيانات عالية ثلاثي الأبعاد، بما في ذلك الحد من أبعاد عبر تي-SNE، مجموعة متنوعة من التلقائية واليدوية تجميع أساليب heatmaps وتدفق عالية ثلاثي الأبعاد رواية المؤامرات.

Abstract

مع ظهور تدفق سيتوميتيرس قادرة على قياس عدد متزايد من المعلمات، تواصل العلماء تطوير لوحات أكبر phenotypically استكشاف خصائص العينات الخلوية الخاصة بهم. بيد أن هذه التطورات التكنولوجية تسفر عن عالية ثلاثي الأبعاد مجموعات البيانات التي أصبحت متزايدة الصعوبة لتحليل موضوعي ضمن البرامج النابضة التقليدية المستندة إلى دليل. من أجل تحسين تحليل وتقديم البيانات، شريك العلماء مع بيوينفورماتيسيانس ذوي الخبرة في تحليل البيانات عالية ثلاثي الأبعاد لتحليل البيانات التدفق الخلوي. بينما أظهرت هذه الطرق تكون قيمة للغاية في دراسة التدفق الخلوي، أنها لم تدمج في مجموعة واضحة وسهلة الاستخدام للعلماء الذين يفتقرون إلى الخبرة الحاسوبية أو برمجة. ولتلبية هذه الحاجة، قمنا بتطوير اكسسيت، أساس MATLAB واجهة المستخدم الرسومية (GUI) أن يبسط تحليل البيانات الخلوي تدفق عالية ثلاثي الأبعاد بتنفيذ العاملين لحسابهم عادة التقنيات التحليلية للبيانات عالية ثلاثي الأبعاد بما في ذلك أبعاد الحد من تي-SNE، مجموعة متنوعة من أساليب التجميع الآلي واليدوي و heatmaps وتدفق عالية ثلاثي الأبعاد رواية المؤامرات. بالإضافة إلى ذلك، يوفر اكسسيت خيارات النابضة التقليدية من السكان تحديد الاهتمام لمزيد من تي-SNE وتجميع التحليل، فضلا عن القدرة على تطبيق البوابات مباشرة في مؤامرات تي-SNE. ويوفر البرنامج ميزة إضافية للعمل مع أي تعويض أو دون تعويض FCS الملفات. في حالة ما إذا التعويض بعد اكتساب مطلوب، يمكن للمستخدم اختيار لتقديم البرنامج دليل للبقع واحد ونموذج أونستينيد. البرنامج بالكشف عن الأحداث الإيجابية في جميع القنوات ويستخدم هذه البيانات حدد لحساب مصفوفة التعويض أكثر موضوعية. وباختصار، يوفر اكسسيت خط أنابيب تحليل شامل أخذ بيانات التدفق الخلوي في شكل ملفات FCS والسماح لأي فرد، بغض النظر عن التدريب الحسابي، واستخدام أحدث نهج حسابي في فهم البيانات الخاصة بهم.

Introduction

قد أتاح التقدم في التدفق الخلوي، فضلا عن ظهور الخلوي الشامل الأطباء والعلماء سرعة تحديد وتوصيف phenotypically عينات مثيرة للاهتمام من الناحية البيولوجية وسريريا مع مستويات جديدة من القرار، إنشاء كبير عالية ثلاثي الأبعاد مجموعات البيانات التي هي معلومات غنية1،2،3. بينما الطرق التقليدية لتحليل بيانات التدفق الخلوي مثل النابضة اليدوي كان أكثر وضوحاً للتجارب حيث هناك علامات قليلة وتلك العلامات السكان بصريا ملموسا، وهذا النهج يمكن أن تفشل لتوليد النتائج استنساخه عند تحليل مجموعات البيانات أعلى ثلاثي الأبعاد أو تلك مع علامات تلطيخ على طائفة. على سبيل المثال، في دراسة متعددة المؤسسات، حيثما كان ذلك داخل الخلوية تلطيخ (ICS) فحوصات يجري أجريت لتقييم إمكانية تكرار نتائج من كوانتيتاتينج الردود محددة مستضد T الخلية، على الرغم من دقة المختبرات الجيدة، والتحليل، لا سيما وعرض النابضة، مصدرا هاما لتقلب4. وعلاوة على ذلك، عملية يدوياً النابضة سكان مصالح، إلى جانب كونها ذاتية جداً مكثفة تستغرق وقتاً طويلاً للغاية وحزب العمل. ومع ذلك، مشكلة تحليل مجموعات البيانات عالية ثلاثي الأبعاد بطريقة قوية وفعالة وفي الوقت المناسب ليس واحدة جديدة لبحوث العلوم. غالباً ما تولد دراسات التعبير الجيني الغاية السامية الأبعاد مجموعات البيانات (غالباً ما يقارب مئات جينات) التي يكون فيها أشكال التحليل اليدوي ببساطة غير مجدية. من أجل التصدي لتحليل مجموعات البيانات هذه، كان هناك الكثير من العمل في وضع بيوينفورماتيك أدوات لتحليل البيانات التعبير الجيني5. هذه نهج حسابي فقط مؤخرا اعتمدت في تحليل البيانات الخلوي كما زاد عدد المعلمات وأثبتت أنها لا تقدر بثمن في تحليل هذه مجموعات بيانات الأبعاد عالية6،7.

وعلى الرغم من استحداث وتطبيق مجموعة متنوعة من خوارزميات وحزم البرمجيات التي تسمح للعلماء تطبيق هذه النهج bioinformatic عالية ثلاثي الأبعاد للبيانات التدفق الخلوي، لا تزال هذه التقنيات التحليلية غير المستخدمة إلى حد كبير. بينما قد يكون هناك مجموعة متنوعة من العوامل التي حدت من اعتماد هذه النهج لقياس البيانات8على نطاق واسع، عائقا رئيسيا أننا نشتبه في استخدام هذه النهج من العلماء، وهو الافتقار إلى المعرفة الحسابية. في الواقع، العديد من حزم البرامج هذه (أي، فلووكوري، فلووميانس، وأوبينسيتو) مكتوبة التي ستنفذ في البرمجة لغات مثل البحث والتطوير التي لا تزال تتطلب معرفة البرمجة الفنية. حزم برامج مثل فلوجو قد وجدت لصالح بين العلماء بسبب البساطة في الاستخدام وطبيعة ‘n-التوصيل’، فضلا عن التوافق مع نظام تشغيل جهاز الكمبيوتر. وبغية توفير مجموعة متنوعة التقنيات التحليلية المقبولة وقيما لبرمجة عالم غير مألوف، قمنا بتطوير اكسسيت، واجهة المستخدم الرسومية (GUI) التي يمكن تثبيتها بسهولة على جهاز كمبيوتر/ماك أن تسحب العديد من أحدث التقنيات بما في ذلك الحد من أبعاد للتصور بديهية، ومجموعة متنوعة من أساليب التجميع المشار إليها في الأدب، جنبا إلى جنب مع ميزات جديدة لاستكشاف الإخراج من هذه تجميع الخوارزميات مع قطع تدفق عالية ثلاثي الأبعاد/مربع heatmaps والرواية.

اكسسيت واجهة مستخدم رسومية التي بنيت في MATLAB وذلك يمكن أما تشغيل داخل MATLAB مباشرة أو مثبت المقدمة التي يمكن استخدامها لتثبيت البرنامج على أي جهاز كمبيوتر/ماك. البرنامج غير متوفر في https://github.com/sidhomj/ExCYT. نقدم بروتوكول مفصل لكيفية استيراد البيانات، قبل العملية، وإجراء الحد من أبعاد تي-SNE، كتلة البيانات، فرز وتصفية مجموعات استناداً إلى تفضيلات المستخدم، وعرض معلومات حول مجموعات المصالح عبر heatmaps ورواية قطع تدفق عالية ثلاثي الأبعاد/مربع (رقم 1). المحاور في مؤامرات تي-SNE التعسفي وفي وحدات التعسفي والصفة كما هو موضح ليس دائماً في الأرقام المتعلقة ببساطة للمستخدم واجهة. تلوين نقاط البيانات في “Heatmaps تي-SNE” من الأزرق إلى الأصفر استناداً إلى إشارة العلامة المشار إليها. في تجميع الحلول، يستند لون نقطة البيانات التعسفي في عدد الكتلة. يمكن أن تنفذ جميع أجزاء من سير العمل في لوحة واحدة واجهة المستخدم الرسومية (الشكل 2 & 1 الجدول). وأخيراً، سوف نظهر باستخدام اكسسيت على البيانات المنشورة سابقا استكشاف المناظر الطبيعية محصنة من سرطان الخلايا الكلوية في الأدب، حلل أيضا مع أساليب مماثلة. يمكن الاطلاع على dataset عينة أننا المستخدمة لإنشاء الأرقام في هذه المخطوطة إلى جانب البروتوكول أدناه في https://premium.cytobank.org/cytobank/projects/875، عند تسجيل حساب.

Protocol

1-جمع وإعداد البيانات الخلوي وضع جميع البقع واحدة في مجلد بأنفسهم وتسمية باسم القناة (فلوروفوري، لا علامة). 2. بيانات استيراد ومعالجة مسبقة للإيقاف المؤقت أو حفظ في جميع أنحاء هذا الأنبوب التحليل، استخدم الزر حفظ مساحة العمل في أسفل يسار البرنامج لحفظ …

Representative Results

من أجل اختبار قابليتها للاستخدام اكسسيت، قمنا بتحليل مجموعة بيانات المنسق نشرتها تشيفرير et al. ، تحت عنوان ‘”مأمن أطلس من واضحة خلية سرطان الكلي”‘ حيث أجرى الفريق تحليل سيتوف مع فريق حصانة واسعة النطاق بشأن الورم العينات المأخوذة من 73 11من المرضى. فريقين من…

Discussion

نقدم هنا اكسسيت، واجهة مستخدم رسومية رواية تشغيل خوارزميات MATLAB المستندة إلى تبسيط تحليل البيانات الخلوي عالية ثلاثي الأبعاد، والسماح للأفراد بأي خلفية في البرمجة لتنفيذ الأحدث بيانات عالية ثلاثي الأبعاد تحليل الخوارزميات. توفر هذه البرامج للمجتمع العلمي الأوسع نطاقا سيسمح العلماء لاس?…

Disclosures

The authors have nothing to disclose.

Acknowledgements

المؤلفين قد لا شكر وتقدير.

Materials

Desktop SuperMicro Custom Build Computer used to run analysis
MATLAB Mathworks N/A Software used to develop ExCYT

References

  1. Benoist, C., Hacohen, N. Flow cytometry, amped up. Science. 332 (6030), 677-678 (2011).
  2. Ornatsky, O., et al. Highly multiparametric analysis by mass cytometry. Journal of immunological methods. 361 (1), 1-20 (2010).
  3. Tanner, S. D., et al. Flow cytometer with mass spectrometer detection for massively multiplexed single-cell biomarker assay. Pure and Applied Chemistry. 80 (12), 2627-2641 (2008).
  4. Maecker, H. T., et al. Standardization of cytokine flow cytometry assays. BMC immunology. 6 (1), 13 (2005).
  5. Brazma, A., Vilo, J. Gene expression data analysis. FEBS letters. 480 (1), 17-24 (2000).
  6. Pyne, S., et al. Automated high-dimensional flow cytometric data analysis. Proceedings of the National Academy of Sciences. 106 (21), 8519-8524 (2009).
  7. Ge, Y., Sealfon, S. C. flowPeaks: a fast unsupervised clustering for flow cytometry data via K-means and density peak finding. Bioinformatics. 28 (15), 2052-2058 (2012).
  8. Venkatesh, V. Determinants of perceived ease of use: Integrating control, intrinsic motivation, and emotion into the technology acceptance model. Information systems research. 11 (4), 342-365 (2000).
  9. Bagwell, C. B., Adams, E. G. Fluorescence spectral overlap compensation for any number of flow cytometry parameters. Annals of the New York Academy of Sciences. 677 (1), 167-184 (1993).
  10. Lavin, Y., et al. Innate immune landscape in early lung adenocarcinoma by paired single-cell analyses. Cell. 169 (4), 750-765 (2017).
  11. Chevrier, S., et al. An immune atlas of clear cell renal cell carcinoma. Cell. 169 (4), 736-749 (2017).
  12. Hartigan, J. A., Wong, M. A. Algorithm AS 136: A k-means clustering algorithm. Journal of the Royal Statistical Society. Series C (Applied Statistics). 28 (1), 100-108 (1979).
  13. Ester, M., Kriegel, H. P., Sander, J., Xu, X. Density-based spatial clustering of applications with noise. International Conference Knowledge Discovery and Data Mining. 240, (1996).
  14. Levine, J. H., et al. Data-driven phenotypic dissection of AML reveals progenitor-like cells that correlate with prognosis. Cell. 162 (1), 184-197 (2015).
  15. Blondel, V. D., Guillaume, J. L., Lambiotte, R., Lefebvre, E. Fast unfolding of communities in large networks. Journal of statistical mechanics: theory and experiment. 2008 (10), P10008 (2008).
  16. Le Martelot, E., Hankin, C. Fast multi-scale detection of relevant communities in large-scale networks. The Computer Journal. 56 (9), 1136-1150 (2013).
  17. Newman, M. E. Fast algorithm for detecting community structure in networks. Physical review E. 69 (6), 066133 (2004).
  18. Hespanha, J. P. . An efficient matlab algorithm for graph partitioning. , 1-8 (2004).
  19. Moon, T. K. The expectation-maximization algorithm. IEEE Signal processing. 13 (6), 47-60 (1996).
  20. Bishop, C. M. . Pattern recognition and machine learning. , (2006).

Play Video

Cite This Article
Sidhom, J., Theodros, D., Murter, B., Zarif, J. C., Ganguly, S., Pardoll, D. M., Baras, A. ExCYT: A Graphical User Interface for Streamlining Analysis of High-Dimensional Cytometry Data. J. Vis. Exp. (143), e57473, doi:10.3791/57473 (2019).

View Video