Summary

JUMPn: יישום יעיל עבור אשכולות ביטוי משותף של חלבונים וניתוח רשת בפרוטאומיקה

Published: October 19, 2021
doi:

Summary

אנו מציגים כלי לביולוגיה של מערכות JUMPn כדי לבצע ולהמחיש ניתוח רשת עבור נתוני פרוטאומיקה כמותית, עם פרוטוקול מפורט הכולל עיבוד נתונים מראש, אשכולות ביטוי משותף, העשרת מסלולים וניתוח רשת אינטראקציות חלבון-חלבון.

Abstract

עם ההתקדמות האחרונה בטכנולוגיות פרוטאומיקה מבוססות ספקטרומטריית מסות, פרופיל עמוק של מאות פרוטאומים הפך אפשרי יותר ויותר. עם זאת, הפקת תובנות ביולוגיות ממערכי נתונים כה חשובים היא מאתגרת. כאן אנו מציגים תוכנה מבוססת ביולוגיה של מערכות JUMPn, ואת הפרוטוקול הקשור אליה כדי לארגן את הפרוטאום לאשכולות ביטוי משותף של חלבונים על פני דגימות ורשתות אינטראקציה בין חלבונים לחלבונים (PPI) המחוברות באמצעות מודולים (למשל, קומפלקסים של חלבונים). באמצעות פלטפורמת R/Shiny, תוכנת JUMPn מייעלת את הניתוח של אשכולות ביטויים משותפים, העשרת מסלולים וזיהוי מודול PPI, עם הדמיית נתונים משולבת וממשק ידידותי למשתמש. השלבים העיקריים של הפרוטוקול כוללים התקנה של תוכנת JUMPn, הגדרת חלבונים המבוטאים באופן דיפרנציאלי או פרוטאום מווסת (dys), קביעת אשכולות ביטוי משותף משמעותיים ומודולי PPI, והדמיית תוצאות. בעוד שהפרוטוקול מודגם באמצעות פרופיל פרוטאום מבוסס תוויות איזובריות, JUMPn ישים בדרך כלל למגוון רחב של מערכי נתונים כמותיים (למשל, פרוטאומיקה ללא תוויות). התוכנה והפרוטוקול של JUMPn מספקים אפוא כלי רב עוצמה כדי להקל על פרשנות ביולוגית בפרוטאומיקה כמותית.

Introduction

פרוטאומיקה מבוססת ספקטרומטריית מסה של רובה ציד הפכה לגישה המרכזית לניתוח מגוון הפרוטאומים של דגימות מורכבות1. עם ההתקדמות האחרונה במכשור ספקטרומטריית מסות 2,3, כרומטוגרפיה 4,5, זיהוי ניידות יונים6, שיטות רכישה (7 בלתי תלויות בנתונים ורכישה תלוית נתונים8), גישות כימות (שיטת תיוג פפטיד איזוברי רב-plex, למשל, TMT 9,10, וכימות ללא תווית11,12) ואסטרטגיות ניתוח נתונים/ פיתוח תוכנה 13,14,15,16,17,18, כימות של הפרוטאום כולו (למשל, מעל 10,000 חלבונים) הוא כיום שגרתי 19,20,21. עם זאת, כיצד להשיג תובנות מכניסטיות ממערכי נתונים כמותיים כה עמוקים עדיין מאתגר22. ניסיונות ראשוניים לחקור מערכי נתונים אלה הסתמכו בעיקר על ביאור של אלמנטים בודדים של הנתונים, תוך התייחסות לכל רכיב (חלבון) באופן עצמאי. עם זאת, מערכות ביולוגיות והתנהגותן אינן ניתנות להסבר אך ורק על ידי בחינת מרכיבים בודדים23. לכן, גישה מערכתית הממקמת את הביומולקולות הכימותיות בהקשר של רשתות אינטראקציה חיונית להבנת מערכות מורכבות והתהליכים הקשורים אליהן כגון עוברי, תגובה חיסונית ופתוגנזה של מחלות אנושיות24.

ביולוגיה של מערכות מבוססות רשת התפתחה כפרדיגמה רבת עוצמה לניתוח נתוני פרוטאומיקה כמותית בקנה מידה גדול 25,26,27,28,29,30,31,32,33. מבחינה מושגית, מערכות מורכבות כגון תאי יונקים יכולות להיות ממודלות כרשת היררכית34,35, שבה המערכת כולה מיוצגת בשכבות: תחילה על ידי מספר רכיבים גדולים, שכל אחד מהם לאחר מכן ממודל באופן איטרטיבי על ידי תת-מערכות קטנות יותר. מבחינה טכנית, המבנה של דינמיקת פרוטאום יכול להיות מוצג על ידי רשתות מחוברות זו בזו של אשכולות חלבונים המתבטאים במשותף (מכיוון שגנים/חלבונים המתבטאים במשותף חולקים לעתים קרובות פונקציות ביולוגיות דומות או מנגנונים של ויסות36) ומודולי PPI בעלי אינטראקציה פיזית37. כדוגמה אחרונה25, יצרנו פרופילים טמפורליים של פרוטאום שלם ופוספופרוטאום במהלך הפעלת תאי T והשתמשנו ברשתות ביטוי משותפות אינטגרטיביות עם PPIs כדי לזהות מודולים פונקציונליים המתווכים יציאה של תאי T. מספר מודולים הקשורים לביו-אנרגיה הודגשו ואומתו בניסוי (לדוגמה, מודולי המיטוריבוסום וה-IV המורכבים25, ומודול פחמן אחד38). בדוגמה אחרת26, הרחבנו עוד יותר את הגישה שלנו לחקר הפתוגנזה של מחלת אלצהיימר, ותיעדפנו בהצלחה את התקדמות המחלה במודולים ובמולקולות הקשורים להתקדמות המחלה. חשוב לציין שרבות מהתגליות הבלתי משוחדות שלנו אומתו על ידי קבוצות חולים עצמאיות26,29 ו/או מודלים של עכברי מחלה26. דוגמאות אלה המחישו את כוחה של גישת הביולוגיה של המערכות לניתוח מנגנונים מולקולריים באמצעות פרוטאומיקה כמותית ושילובי אומיקה אחרים.

כאן אנו מציגים את JUMPn, תוכנה יעילה החוקרת נתוני פרוטאומיקה כמותית באמצעות גישות ביולוגיות של מערכות מבוססות רשת. JUMPn משמש כמרכיב במורד הזרם של חבילת התוכנה מבוססת JUMP פרוטאומיקה 13,14,39, ומטרתו למלא את הפער מכימות חלבונים בודדים למסלולים בעלי משמעות ביולוגית ומודולי חלבונים באמצעות גישת הביולוגיה של המערכות. על-ידי לקיחת מטריצת הכימות של חלבונים המבוטאים באופן דיפרנציאלי (או המשתנה ביותר) כקלט, JUMPn שואף לארגן את הפרוטאום בהיררכיה שכבתית של צבירי חלבונים המתבטאים יחד על פני דגימות ומודולי PPI המחוברים בצפיפות (למשל, קומפלקסים של חלבונים), אשר מבוארים עוד יותר עם מסדי נתונים של מסלולים ציבוריים על ידי ניתוח ייצוג יתר (או העשרה) (איור 1). JUMPn פותחה עם פלטפורמת R/Shiny40 עבור ממשק ידידותי למשתמש ומשלבת שלושה מודולים פונקציונליים עיקריים: ניתוח אשכולות ביטוי משותף, ניתוח העשרת מסלולים וניתוח רשת PPI (איור 1). לאחר כל ניתוח, התוצאות מוצגות באופן אוטומטי באופן חזותי וניתנות לכוונון באמצעות פונקציות הווידג’ט R/מבריק וניתנות להורדה בקלות כטבלאות פרסום בתבנית Microsoft Excel. בפרוטוקול הבא, אנו משתמשים בנתוני פרוטאום שלמים כמותיים כדוגמה ומתארים את השלבים העיקריים של השימוש ב- JUMPn, כולל התקנת תוכנת JUMPn, ההגדרה של חלבונים המבוטאים באופן דיפרנציאלי או הפרוטאום המווסת (dys), ניתוח רשת ביטוי משותף וניתוח מודול PPI, הדמיה ופרשנות של תוצאות, וירי בעיות. תוכנת JUMPn זמינה באופן חופשי ב-GitHub41.

Protocol

הערה: בפרוטוקול זה, השימוש ב- JUMPn מודגם על ידי שימוש במערך נתונים שפורסם של פרופיל פרוטאום שלם במהלך התמיינות תאי B המכומת על ידי ריאגנט התווית האיזוברית TMT27. 1. הגדרת תוכנת JUMPn הערה: שתי אפשרויות מסופקות להגדרת תוכנת JUMPn: (i) התקנה במחשב מקומי לשימוש אי…

Representative Results

השתמשנו בערכות הנתונים של פרוטאומיקה עמוקה שפורסמו עלידינו 25,26,27,30 (איורים 5 ואיור 6) וכן בסימולציות נתונים57 (טבלה 1) כדי לייעל ולהעריך את ביצועי JUMPn. לצורך ניתוח אשכו…

Discussion

כאן הצגנו את תוכנת JUMPn שלנו ואת הפרוטוקול שלה, אשר יושמו בפרויקטים מרובים לניתוח מנגנונים מולקולריים באמצעות נתוני פרוטאומיקה כמותית עמוקה 25,26,27,30,64. התוכנה והפרוטוקול של JUMPn עברו אופטימיזציה מלאה, כו…

Disclosures

The authors have nothing to disclose.

Acknowledgements

התמיכה במימון ניתנה על ידי המכונים הלאומיים לבריאות (NIH) (R01AG047928, R01AG053987, RF1AG064909, RF1AG068581 ו-U54NS110435) ו-ALSAC (ארגוני צדקה סוריים לבנוניים אמריקאים). ניתוח הטרשת הנפוצה בוצע במרכז הפרוטאומיקה והמטבולומיקה של בית החולים למחקר לילדים סנט ג’וד, שנתמך בחלקו על ידי מענק תמיכה במרכז הסרטן של NIH (P30CA021765). התוכן הוא באחריותם הבלעדית של המחברים ואינו מייצג בהכרח את הדעות הרשמיות של המכונים הלאומיים לבריאות.

Materials

MacBook Pro with a 2.3 GHz Quad-Core Processor running OS 10.15.7. Apple Inc. MacBook Pro 13'' Hardware used for software development and testing
Anoconda Anaconda, Inc. version 4.9.2 https://docs.anaconda.com/anaconda/install/
miniconda Anaconda, Inc. version 4.9.2 https://docs.conda.io/en/latest/miniconda.html
RStudio RStudio Public-benefit corporation version 4.0.3 https://www.rstudio.com/products/rstudio/download/
Shiny Server RStudio Public-benefit corporation https://shiny.rstudio.com/articles/shinyapps.html

References

  1. Aebersold, R., Mann, M. Mass-spectrometric exploration of proteome structure and function. Nature. 537, 347-355 (2016).
  2. Senko, M. W., et al. Novel parallelized quadrupole/linear ion trap/orbitrap tribrid mass spectrometer improving proteome coverage and peptide identification rates. Analytical Chemistry. 85, 11710-11714 (2013).
  3. Eliuk, S., Makarov, A. Evolution of orbitrap mass spectrometry instrumentation. Annual Review of Analytical Chemistry. 8, 61-80 (2015).
  4. Wang, H., et al. Systematic optimization of long gradient chromatography mass spectrometry for deep analysis of brain proteome. Journal of Proteome Research. 14, 829-838 (2015).
  5. Blue, L. E. Recent advances in capillary ultrahigh pressure liquid chromatography. Journal of Chromatography A. 1523, 17-39 (2017).
  6. Meier, F., et al. Online parallel accumulation-serial fragmentation (PASEF) with a novel trapped ion mobility mass spectrometer. Molecular & Cellular Proteomics. 17, 2534-2545 (2018).
  7. Ludwig, C., et al. Data-independent acquisition-based SWATH-MS for quantitative proteomics: a tutorial. Molecular Systems Biology. 14 (8), 8126 (2018).
  8. Zhang, Y. Y., Fonslow, B. R., Shan, B., Baek, M. C., Yates, J. R. Protein analysis by shotgun/bottom-up proteomics. Chemical Reviews. 113, 2343-2394 (2013).
  9. Wang, Z., et al. 27-Plex tandem mass tag mass spectrometry for profiling brain proteome in Alzheimer’s disease. Analytical Chemistry. 92, 7162-7170 (2020).
  10. Li, J. M., et al. TMTpro reagents: a set of isobaric labeling mass tags enables simultaneous proteome-wide measurements across 16 samples. Nature Methods. 17 (4), 399-404 (2020).
  11. Collins, B. C., et al. Multi-laboratory assessment of reproducibility, qualitative and quantitative performance of SWATH-mass spectrometry. Nature Communications. 8 (1), 291 (2017).
  12. Navarro, P., et al. A multicenter study benchmarks software tools for label-free proteome quantification. Nature Biotechnology. 34, 1130 (2016).
  13. Wang, X. S., et al. A tag-based database search tool for peptide identification with high sensitivity and accuracy. Molecular & Cellular Proteomics. 13, 3663-3673 (2014).
  14. Li, Y. X., et al. JUMPg: An integrative proteogenomics pipeline identifying unannotated proteins in human brain and cancer cells. Journal of Proteome Research. 15, 2309-2320 (2016).
  15. Cox, J., Mann, M. MaxQuant enables high peptide identification rates, individualized p.p.b.-range mass accuracies and proteome-wide protein quantification. Nature Biotechnology. 26, 1367-1372 (2008).
  16. Kong, A. T., Leprevost, F. V., Avtonomov, D. M., Mellacheruvu, D., Nesvizhskii, A. I. MSFragger: ultrafast and comprehensive peptide identification in mass spectrometry-based proteomics. Nature Methods. 14, 513 (2017).
  17. Chi, H., et al. Comprehensive identification of peptides in tandem mass spectra using an efficient open search engine. Nature Biotechnology. 36, 1059 (2018).
  18. Demichev, V., Messner, C. B., Vernardis, S. I., Lilley, K. S., Ralser, M. DIA-NN neural networks and interference correction enable deep proteome coverage in high throughput. Nature Methods. 17, 41 (2020).
  19. High, A. A., et al. Deep proteome profiling by isobaric labeling, extensive liquid chromatography, mass spectrometry, and software-assisted quantification. Journal of Visualized Experiments: JoVE. (129), e56474 (2017).
  20. Wang, Z., et al. High-throughput and deep-proteome profiling by 16-plex tandem mass tag labeling coupled with two-dimensional chromatography and mass spectrometry. Journal of Visualized Experiments: JoVE. (162), e61684 (2020).
  21. Meier, F., Geyer, P. E., Winter, S. V., Cox, J., Mann, M. BoxCar acquisition method enables single-shot proteomics at a depth of 10,000 proteins in 100 minutes. Nature Methods. 15, 440 (2018).
  22. Sinitcyn, P., Rudolph, J. D., Cox, J. Computational methods for understanding mass spectrometry-based shotgun proteomics data. Annual Review of Biomedical Data Science. 1, 207-234 (2018).
  23. Ideker, T., Galitski, T., Hood, L. A new approach to decoding life: Systems biology. Annual Review of Genomics and Human Genetics. 2, 343-372 (2001).
  24. Barabasi, A. L., Oltvai, Z. N. Network biology: understanding the cell’s functional organization. Nature Reviews Genetics. 5, 101-113 (2004).
  25. Tan, H., et al. Integrative proteomics and phosphoproteomics profiling reveals dynamic signaling networks and bioenergetics pathways underlying T cell activation. Immunity. 46, 488-503 (2017).
  26. Bai, B., et al. Deep multilayer brain proteomics identifies molecular networks in alzheimer’s disease progression. Neuron. 105, 975-991 (2020).
  27. Zeng, H., et al. Discrete roles and bifurcation of PTEN signaling and mTORC1-mediated anabolic metabolism underlie IL-7-driven B lymphopoiesis. Science Advances. 4, 5701 (2018).
  28. Seyfried, N. T., et al. A multi-network approach identifies protein-specific co-expression in asymptomatic and symptomatic Alzheimer’s disease. Cell Systems. 4, 60-72 (2017).
  29. Johnson, E. C. B., et al. Large-scale proteomic analysis of Alzheimer’s disease brain and cerebrospinal fluid reveals early changes in energy metabolism associated with microglia and astrocyte activation. Nature Medicine. 26, 769-780 (2020).
  30. Stewart, E., et al. Identification of therapeutic targets in rhabdomyosarcoma through integrated genomic, epigenomic, and proteomic analyses. Cancer Cell. 34, 411-426 (2018).
  31. Rudolph, J. D., Cox, J. A network module for the perseus software for computational proteomics facilitates proteome interaction graph analysis. Journal of Proteome Research. 18, 2052-2064 (2019).
  32. Zhang, B., et al. Proteogenomic characterization of human colon and rectal cancer. Nature. 513, 382 (2014).
  33. Petralia, F., et al. Integrated proteogenomic characterization across major histological types of pediatric brain cancer. Cell. 183, 1962 (2020).
  34. Dutkowski, J., et al. A gene ontology inferred from molecular networks. Nature Biotechnology. 31, 38 (2013).
  35. Yu, M. K., et al. Translation of genotype to phenotype by a hierarchy of cell subsystems. Cell Systems. 2, 77-88 (2016).
  36. Jansen, R., Greenbaum, D., Gerstein, M. Relating whole-genome expression data with protein-protein interactions. Genome Research. 12, 37-46 (2002).
  37. Huttlin, E. L., et al. Architecture of the human interactome defines protein communities and disease networks. Nature. 545, 505-509 (2017).
  38. Ron-Harel, N., et al. Mitochondrial biogenesis and proteome remodeling promote one-carbon metabolism for T cell activation. Cell Metabolism. 24, 104-117 (2016).
  39. Niu, M. M., et al. Extensive peptide fractionation and y(1) ion-based interference detection method for enabling accurate quantification by isobaric labeling and mass spectrometry. Analytical Chemistry. 89, 2956-2963 (2017).
  40. Chang, W. shiny: Web Application Framework for. Nature Protocols. 11, 2301-2319 (2021).
  41. . JUMPn Available from: https://github.com/VanderwallDavid/JUMPn_1.0.0 (2021)
  42. . Anaconda Available from: https://docs.anaconda.com/anaconda/install/ (2021)
  43. . miniconda Available from: https://docs.conda.io/en/latest/miniconda.html (2021)
  44. . RStudio Available from: https://www.rstudio.com/products/rstudio/download/ (2021)
  45. . Shiny Server Available from: https://shiny.rstudio.com/articles/shinyapps.html (2021)
  46. Tyanova, S., Temu, T., Cox, J. The MaxQuant computational platform for mass spectrometry-based shotgun proteomics. Nature Protocol. 11, 2301-2319 (2016).
  47. . R code Available from: https://github.com/VanderwallDavid/JUMPn_1.0.0/tree/main/JUMPn_preprocessing (2021)
  48. Florens, L., et al. Analyzing chromatin remodeling complexes using shotgun proteomics and normalized spectral abundance factors. Methods. 40, 303-311 (2006).
  49. Zhang, B., Horvath, S. A general framework for weighted gene co-expression network analysis. Statistical Applications in Genetics and Molecular Biology. 4, (2005).
  50. Voineagu, I., et al. Transcriptomic analysis of autistic brain reveals convergent molecular pathology. Nature. 474, 380 (2011).
  51. Langfelder, P., Zhang, B., Horvath, S. Defining clusters from a hierarchical cluster tree: the Dynamic Tree Cut package for R. Bioinformatics. 24, 719-720 (2008).
  52. Ravasz, E., Somera, A. L., Mongru, D. A., Oltvai, Z. N., Barabasi, A. L. Hierarchical organization of modularity in metabolic networks. Science. 297, 1551-1555 (2002).
  53. Kuleshov, M. V., et al. Enrichr: a comprehensive gene set enrichment analysis web server 2016 update. Nucleic Acids Research. 44, 90-97 (2016).
  54. Liberzon, A., et al. Molecular signatures database (MSigDB) 3.0. Bioinformatics. 27, 1739-1740 (2011).
  55. . FlyEn rich r Available from: https://maayanlab.cloud/FlyEnrichr/#stats (2021)
  56. . JUMPn GitHub Available from: https://github.com/VanderwallDavid/JUMPn_1.0.0/tree/main/resources/example_fly (2021)
  57. Langfelder, P., Horvath, S. Eigengene networks for studying the relationships between co-expression modules. BMC Systems Biology. 1, 54 (2007).
  58. Benjamini, Y., Hochberg, Y. Controlling the false discovery rate – a practical and powerful approach to multiple testing. Journal of the Royal Statistical Society: Series B. 57, 289-300 (1995).
  59. Szklarczyk, D., et al. STRING v10: protein-protein interaction networks, integrated over the tree of life. Nucleic Acids Research. 43, 447-452 (2015).
  60. Szklarczyk, D., et al. STRING v11: protein-protein association networks with increased coverage, supporting functional discovery in genome-wide experimental datasets. Nucleic Acids Research. 47, 607-613 (2019).
  61. Huttlin, E. L., et al. The BioPlex network: A systematic exploration of the human interactome. Cell. 162, 425-440 (2015).
  62. Huttlin, E. L., et al. Dual proteome-scale networks reveal cell-specific remodeling of the human interactome. Cell. 184, 3022-3040 (2021).
  63. Li, T., et al. A scored human protein-protein interaction network to catalyze genomic interpretation. Nature Methods. 14, 61-64 (2017).
  64. Wang, H., et al. Deep multiomics profiling of brain tumors identifies signaling networks downstream of cancer driver genes. Nature Communications. 10, 3718 (2019).
  65. Gerstein, M. B., et al. Architecture of the human regulatory network derived from ENCODE data. Nature. 489, 91-100 (2012).
  66. Yu, J., Peng, J., Chi, H. Systems immunology: Integrating multi-omics data to infer regulatory networks and hidden drivers of immunity. Current Opinion in Systems Biology. 15, 19-29 (2019).
  67. Califano, A., Alvarez, M. J. The recurrent architecture of tumour initiation, progression and drug sensitivity. Nature Reviews Cancer. 17, 116-130 (2017).
  68. Hein, M. Y., et al. A human interactome in three quantitative dimensions organized by stoichiometries and abundances. Cell. 163, 712-723 (2015).
  69. Liang, Z., Xu, M., Teng, M. K., Niu, L. W. Comparison of protein interaction networks reveals species conservation and divergence. BMC Bioinformatics. 7, 457 (2006).
  70. Shou, C., et al. Measuring the evolutionary rewiring of biological networks. PLOS Computational Biology. 7, 1001050 (2011).
  71. Zhou, Y., et al. Metascape provides a biologist-oriented resource for the analysis of systems-level datasets. Nature Communications. 10, 1523 (2019).
  72. Cline, M. S., et al. Integration of biological networks and gene expression data using Cytoscape. Nature Protocols. 2, 2366-2382 (2007).

Play Video

Cite This Article
Vanderwall, D., Suresh, P., Fu, Y., Cho, J., Shaw, T. I., Mishra, A., High, A. A., Peng, J., Li, Y. JUMPn: A Streamlined Application for Protein Co-Expression Clustering and Network Analysis in Proteomics. J. Vis. Exp. (176), e62796, doi:10.3791/62796 (2021).

View Video