Summary

ExCYT: ממשק משתמש גרפי עבור התייעלות ניתוח של נתוני Cytometry גבוהה-ממדי

Published: January 16, 2019
doi:

Summary

ExCYT הוא MATLAB מבוסס גרפי וממשקי משתמש (GUI) המאפשר למשתמשים לנתח את הנתונים cytometry זרימה שלהם דרך כלל המועסקים בשיטות אנליטיות עבור נתונים גבוהה-ממדי כולל הפחתת dimensionality באמצעות t-סנה, מגוון אוטומטיות וידניות קיבוץ באשכולות שיטות heatmaps, זרימה גבוהה-ממדי הרומן חלקות.

Abstract

עם כניסתו של זרימה cytometers מסוגל מדידת מספר גדל והולך של פרמטרים, המדענים ממשיכים לפתח לוחות גדולים יותר לחקור phenotypically מאפייני דוגמאות הסלולר שלהם. עם זאת, הפיתוחים הטכנולוגיים האלה תשואה גבוהה-ממדי בערכות נתונים הפכו להיות יותר ויותר קשה לנתח באופן אובייקטיבי בתוך תוכניות המגביל מבוססות ידנית מסורתית. כדאי לנתח, להציג נתונים, מדענים משתפים פעולה עם bioinformaticians עם מומחיות בניתוח נתונים גבוהה-ממדי כדי לנתח את הנתונים שלהם cytometry זרימה. בעוד ששיטות אלה הוכחו להיות חשוב מאוד ללמוד cytometry זרימה, הם טרם ניתן לשלב בחבילה פשוטה, קלה לשימוש עבור המדענים חסרי התמחות חישובית או תכנות. כדי לטפל צורך זה, פיתחנו ExCYT, MATLAB מבוסס גרפי וממשקי משתמש (GUI) המייעל את הניתוח של נתוני cytometry זרימה גבוהה-ממדי על-ידי יישום שיטות אנליטיות הנפוצות עבור נתונים גבוהה-ממדי כולל הפחתת dimensionality על ידי t-סנה, מגוון רחב של שיטות קיבוץ באשכולות אוטומטיות וידניות, heatmaps זרימה גבוהה-ממדי הרומן חלקות. בנוסף, ExCYT מספק אפשרויות המגביל המסורתי של אוכלוסיות נבחרות עניין נוסף t-סנה, קיבוץ באשכולות ניתוח, כמו גם את היכולת להחיל גייטס ישירות על t-סנה חלקות. התוכנה מספקת את היתרון הנוסף של עבודה עם גם פיצוי כספי או הקבצים FCS uncompensated. בכל מקרה שבו נדרש פיצוי שלאחר הרכישה, המשתמש יכול לבחור לספק התוכנית ספרייה של כתמי יחיד דוגמה וללא רבב. התוכנית מזהה אירועים חיוביים של כל הערוצים ומשתמש בחר נתונים לחישוב המטריצה פיצוי באופן יותר אובייקטיבי. לסיכום, ExCYT מספק קו צינור ניתוח מקיף לקחת נתונים cytometry זרימה בצורה של FCS הקבצים ולאפשר כל אדם, ללא קשר אימונים חישובית, להשתמש הגישות אלגוריתמית האחרון בהבנת הנתונים שלהם.

Introduction

ההתקדמות cytometry זרימה, כמו גם כניסתו של cytometry המוני אפשרה רופאים ומדענים לזהות במהירות ולאפיין phenotypically דגימות ביולוגית, קלינית מעניין עם רמות חדשות של רזולוציה, יצירת גדול ערכות גבוהה-ממדי נתונים המהווים מידע עשיר1,2,3. בעוד בשיטות המקובלות לניתוח נתונים cytometry זרימה כגון gating ידני כבר יותר ישירה עבור ניסויים בהם קיימות בכמה חוטים או הסמנים יש אוכלוסיות ניכרת באופן חזותי, גישה זו יכול להיכשל ליצור תוצאות לשחזור בעת ניתוח ערכות נתונים-ממדים או אלה עם סמנים מכתים על הספקטרום. לדוגמה, במחקר רב מוסדיים, היכן התוך תאית מכתים (ICS) מבחני היו המבוצעת כדי להעריך את הפארמצבטית של quantitating תגובות תא T אנטיגן ספציפי, למרות דיוק inter-laboratory טוב, ניתוח, במיוחד gating, הציג מקור לא מבוטל של השתנות4. יתר על כן, תהליך ידני gating אוכלוסייה של אינטרסים, מלבד היותו סובייקטיבית הוא מאוד זמן רב, עבודה אינטנסיבית. עם זאת, הבעיה של ניתוח ערכות נתונים גבוהה-מימדי בצורה איתנה, יעיל ומתוזמן אינה אחד חדש מחקר למדעים. מחקרים ביטוי גנים לעיתים קרובות ליצור ערכות נתונים מאוד גבוהים-ממדי (לעיתים קרובות גודל מאות גנים) איפה הטפסים ידנית של ניתוח יהיה פשוט באמצעות חישוב. על מנת להתמודד עם הניתוח של ערכות נתונים אלה, יש כבר הרבה עבודה בפיתוח bioinformatic כלים לניתוח נתונים של ביטוי גנים5. גישות אלה אלגוריתמית רק לאחרונה שאומצו בניתוח נתונים cytometry מספר הפרמטרים גדל, הוכיחו להיות בעל ערך לצורך הניתוח של אלה6,גבוהה ערכות נתונים תלת-ממדי7.

למרות הדור של יישום מגוון רחב של חבילות תוכנה מאפשרות להחיל גישות אלה bioinformatic גבוהה-ממדי על הנתונים שלהם cytometry זרימה והאלגוריתמים, שיטות אנליטיות אלה עדיין נשארים בעיקר שאינם בשימוש. בעוד שיכול להיות מגוון גורמים מוגבל של אימוץ נרחב של גישות אלה נתונים cytometry8, מכשול גדול אנחנו חושדים להשתמש גישות אלה על ידי מדענים, חוסר הידע חישובית. למעשה, רבים של אלה חבילות תוכנה (קרי, flowCore, flowMeans ו OpenCyto) נכתבות ניתן ליישם תכנות כגון R עדיין דורשים ידע בתכנות מהותית. חבילות תוכנה כגון FlowJo מצאו בקרב מדענים בשל הפשטות של השימוש, הטבע ‘הכנס-הפעל’, כמו גם תאימות עם מערכת ההפעלה במחשב. על מנת לספק מגוון רחב של שיטות אנליטיות מקובל ובעל ערך על תיכנות לא מוכר המדען, פיתחנו ExCYT, ממשק משתמש גרפי (GUI) שניתן בקלות להתקין ב- PC/Mac שמושכת הרבה בטכניקות האחרונות הפחתת dimensionality להמחשת אינטואיטיבי, מגוון שיטות קיבוץ באשכולות המצוטטים בספרות, יחד עם תכונות הרומן לחקור את הפלט של אלה כולל קיבוץ באשכולות אלגוריתמים עם heatmaps, רומן מתווה בקופסה זרימה גבוהה-ממדי.

ExCYT הוא ממשק משתמש גרפי שנבנה ב- MATLAB, ולכן ניתן גם להפעיל בתוך MATLAB ישירות או מתקין מסופק זה יכול לשמש כדי להתקין את התוכנה על כל PC/mac. התוכנה זמינה במלון https://github.com/sidhomj/ExCYT. אנו מציגים פרוטוקול מפורט כיצד לייבא נתונים, לעבד אותו מראש, לערוך רדוקציה dimensionality t-סנה, נתוני אשכול, מיון & לסנן אשכולות בהתבסס על העדפות משתמשים, הצגת מידע על האשכולות עניין באמצעות heatmaps ו הרומן זרימה גבוהה-ממדי/תיבת חלקות (איור 1). צירים ב- t-סנה חלקות שרירותית ובלתי ביחידות שרירותי, וככזה כפי שמוצג לא תמיד הדמויות לפשטות של המשתמש בממשק. צביעה של נקודות נתונים ב- “Heatmaps t-סנה” היא כחול צהוב המבוססת על האות של סמן המצוין. בקיבוץ באשכולות פתרונות, הצבע של נקודת הנתונים מבוסס שרירותי על מספר האשכולות. כל החלקים של זרימת העבודה יכולה לצאת לפועל שבלוח יחיד GUI (איור 2 & טבלה 1). לבסוף, אנו נדגים את השימוש ExCYT על נתונים שפורסמו בעבר לחקור את הנוף המערכת החיסונית של קרצינומה של תאי הכליה בספרות, נותחו גם בשיטות דומות. ניתן למצוא את ערכת הנתונים לדוגמה שהשתמשנו כדי ליצור את הדמויות בכתב היד יחד עם פרוטוקול למטה ב https://premium.cytobank.org/cytobank/projects/875, בעת רישום חשבון.

Protocol

1. איסוף והכנת Cytometry נתונים במקום כל כתמי יחיד בתוך תיקיה על-ידי עצמם ותווית בשם ערוץ (על ידי fluorophore, לא סמן). 2. הנתונים היבוא & עיבוד קדם כדי להשהות או לשמור לאורך צינור ניתוח זה, השתמש בלחצן שמירת סביבת עבודה בפינה השמאלית התחתונה של התוכנית כדי להציל את …

Representative Results

על מנת לבדוק את השימושיות של ExCYT, ניתחנו את ערכת נתונים אצר בהוצאת שוורייה. ואח שכותרתו “המערכת החיסונית אטלס של ברור כליות קרצינומה של תאים’ איפה הקבוצה נערך ניתוח CyTOF עם לוח המערכת החיסונית מקיף על גידול דגימות שנלקחו 73 חולים11. שני לוחות נפרדים, לוח מיאל?…

Discussion

כאן אנו מציגים ExCYT, ממשק משתמש גרפי הרומן פועל אלגוריתמים מבוססי-MATLAB כדי לייעל את ניתוח של נתוני cytometry גבוהה-ממדי, המאפשר לאנשים ללא רקע לתיכנות ליישם את המילה האחרונה נתונים גבוהה-ממדי ניתוח אלגוריתמים. הזמינות של תוכנה זו על הקהילה המדעית רחבה יותר יאפשר למדענים לחקור את הנתונים שלהם cytomet…

Disclosures

The authors have nothing to disclose.

Acknowledgements

המחברים לא תודות לך

Materials

Desktop SuperMicro Custom Build Computer used to run analysis
MATLAB Mathworks N/A Software used to develop ExCYT

References

  1. Benoist, C., Hacohen, N. Flow cytometry, amped up. Science. 332 (6030), 677-678 (2011).
  2. Ornatsky, O., et al. Highly multiparametric analysis by mass cytometry. Journal of immunological methods. 361 (1), 1-20 (2010).
  3. Tanner, S. D., et al. Flow cytometer with mass spectrometer detection for massively multiplexed single-cell biomarker assay. Pure and Applied Chemistry. 80 (12), 2627-2641 (2008).
  4. Maecker, H. T., et al. Standardization of cytokine flow cytometry assays. BMC immunology. 6 (1), 13 (2005).
  5. Brazma, A., Vilo, J. Gene expression data analysis. FEBS letters. 480 (1), 17-24 (2000).
  6. Pyne, S., et al. Automated high-dimensional flow cytometric data analysis. Proceedings of the National Academy of Sciences. 106 (21), 8519-8524 (2009).
  7. Ge, Y., Sealfon, S. C. flowPeaks: a fast unsupervised clustering for flow cytometry data via K-means and density peak finding. Bioinformatics. 28 (15), 2052-2058 (2012).
  8. Venkatesh, V. Determinants of perceived ease of use: Integrating control, intrinsic motivation, and emotion into the technology acceptance model. Information systems research. 11 (4), 342-365 (2000).
  9. Bagwell, C. B., Adams, E. G. Fluorescence spectral overlap compensation for any number of flow cytometry parameters. Annals of the New York Academy of Sciences. 677 (1), 167-184 (1993).
  10. Lavin, Y., et al. Innate immune landscape in early lung adenocarcinoma by paired single-cell analyses. Cell. 169 (4), 750-765 (2017).
  11. Chevrier, S., et al. An immune atlas of clear cell renal cell carcinoma. Cell. 169 (4), 736-749 (2017).
  12. Hartigan, J. A., Wong, M. A. Algorithm AS 136: A k-means clustering algorithm. Journal of the Royal Statistical Society. Series C (Applied Statistics). 28 (1), 100-108 (1979).
  13. Ester, M., Kriegel, H. P., Sander, J., Xu, X. Density-based spatial clustering of applications with noise. International Conference Knowledge Discovery and Data Mining. 240, (1996).
  14. Levine, J. H., et al. Data-driven phenotypic dissection of AML reveals progenitor-like cells that correlate with prognosis. Cell. 162 (1), 184-197 (2015).
  15. Blondel, V. D., Guillaume, J. L., Lambiotte, R., Lefebvre, E. Fast unfolding of communities in large networks. Journal of statistical mechanics: theory and experiment. 2008 (10), P10008 (2008).
  16. Le Martelot, E., Hankin, C. Fast multi-scale detection of relevant communities in large-scale networks. The Computer Journal. 56 (9), 1136-1150 (2013).
  17. Newman, M. E. Fast algorithm for detecting community structure in networks. Physical review E. 69 (6), 066133 (2004).
  18. Hespanha, J. P. . An efficient matlab algorithm for graph partitioning. , 1-8 (2004).
  19. Moon, T. K. The expectation-maximization algorithm. IEEE Signal processing. 13 (6), 47-60 (1996).
  20. Bishop, C. M. . Pattern recognition and machine learning. , (2006).

Play Video

Cite This Article
Sidhom, J., Theodros, D., Murter, B., Zarif, J. C., Ganguly, S., Pardoll, D. M., Baras, A. ExCYT: A Graphical User Interface for Streamlining Analysis of High-Dimensional Cytometry Data. J. Vis. Exp. (143), e57473, doi:10.3791/57473 (2019).

View Video