Summary

JUMPn:プロテオミクスにおけるタンパク質共発現クラスタリングとネットワーク解析のための合理化されたアプリケーション

Published: October 19, 2021
doi:

Summary

我々は、データの前処理、共発現クラスタリング、経路濃縮、タンパク質間相互作用ネットワーク解析を含む詳細なプロトコルを用いて、定量的プロテオミクスデータのネットワーク解析を実行および視覚化するためのシステム生物学ツールJUMPnを提示する。

Abstract

質量分析ベースのプロテオミクス技術の最近の進歩により、何百ものプロテオームのディーププロファイリングがますます実現可能になっています。しかし、このような貴重なデータセットから生物学的な洞察を引き出すことは困難です。ここでは、システム生物学ベースのソフトウェアJUMPnと、モジュール(タンパク質複合体など)によって接続されたサンプルおよびタンパク質間相互作用(PPI)ネットワークにわたってプロテオームをタンパク質共発現クラスターに編成するための関連プロトコルを紹介します。R/Shinyプラットフォームを使用して、JUMPnソフトウェアは、統合されたデータ視覚化とユーザーフレンドリーなインターフェースにより、共発現クラスタリング、経路エンリッチメント、PPIモジュール検出の分析を合理化します。プロトコルの主なステップには、JUMPnソフトウェアのインストール、発現差のあるタンパク質または(dys)調節プロテオームの定義、意味のある共発現クラスターおよびPPIモジュールの決定、および結果の視覚化が含まれます。このプロトコルは、等圧標識ベースのプロテオームプロファイルを使用して実証されていますが、JUMPnは一般に、広範囲の定量データセット(例えば、ラベルフリープロテオミクス)に適用可能です。したがって、JUMPnソフトウェアとプロトコルは、定量的プロテオミクスにおける生物学的解釈を容易にする強力なツールを提供します。

Introduction

質量分析ベースのショットガンプロテオミクスは、複雑なサンプル1のプロテオーム多様性を分析するための重要なアプローチとなっています。質量分析装置23クロマトグラフィー45、イオン移動度検出6、取得方法(データ非依存7およびデータ依存取得8)、定量アプローチ(多重鎖等圧ペプチド標識法例えば、TMT910、および標識フリー定量1112)およびデータ分析戦略における最近の進歩/ソフトウェア開発13、14、15、161718は、プロテオーム全体(例えば、10,000を超えるタンパク質)の定量化が、現在、192021のルーチンである。しかし、このような深い定量的データセットから機械的な洞察を得る方法は依然として挑戦的です22。これらのデータセットを調査する最初の試みは、主にデータの個々の要素の注釈に依存し、各成分(タンパク質)を独立して処理しました。しかしながら、生物学的システムおよびその挙動は、個々の構成要素23を調べることによってのみ説明できない。したがって、定量化された生体分子を相互作用ネットワークの文脈に置くシステムアプローチは、複雑なシステムおよびヒト疾患の胚発生、免疫応答、および病因などの関連プロセスの理解に不可欠である24

ネットワークベースのシステム生物学は、大規模な定量的プロテオミクスデータ25、2627、282930、31、3233を分析するための強力なパラダイムとして浮上している。概念的には、哺乳類細胞のような複雑なシステムは、階層ネットワーク34,35としてモデル化することができ、その中で、システム全体が層で表され、最初に多数の大きな構成要素によって、次にそれぞれがより小さなサブシステムによって反復的にモデル化される。技術的には、プロテオームダイナミクスの構造は、共発現タンパク質クラスターの相互接続されたネットワーク(共発現遺伝子/タンパク質はしばしば調節36の類似の生物学的機能または機構を共有するため)および物理的に相互作用するPPIモジュール37によって提示され得る。最近の例25として、我々は、T細胞活性化中にプロテオーム全体およびホスホプロテオムの時間的プロファイルを生成し、PPIとの統合的共発現ネットワークを使用して、T細胞静止出口を媒介する機能モジュールを同定した。複数の生体エネルギー関連モジュールが強調表示され、実験的に検証された(例えば、ミトリボソームおよび複合体IVモジュール25、ならびに一炭素モジュール38)。別の例26では、アルツハイマー病の病因を研究するための我々のアプローチをさらに拡張し、疾患進行関連タンパク質モジュールおよび分子の優先順位付けに成功した。重要なことに、我々の偏りのない発見の多くは、独立した患者コホート26,29および/または疾患マウスモデル26によって検証された。これらの例は、定量的プロテオミクスおよび他のオミクス統合を用いて分子機構を解剖するためのシステム生物学アプローチの力を示した。

ここでは、ネットワークベースのシステム生物学アプローチを用いて定量的プロテオミクスデータを探求する合理化されたソフトウェアであるJUMPnを紹介します。JUMPnは、確立されたJUMPプロテオミクスソフトウェアスイート131439の下流コンポーネントとして機能し個々のタンパク質定量から生物学的に意味のある経路およびタンパク質モジュールまでのギャップを埋めることを目指しています。JUMPnは、発現差のある(または最も可変的な)タンパク質の定量化マトリックスを入力として取ることにより、プロテオームを、サンプルおよび高密度に接続されたPPIモジュール(例えば、タンパク質複合体)にわたって共発現するタンパク質クラスターの階層階層に編成し、過剰発現(または濃縮)分析によってパブリック経路データベースでさらに注釈を付けることを目指しています(図1)。JUMPnは、ユーザーフレンドリーなインターフェースのためにR/Shinyプラットフォーム40で開発され、共発現クラスタリング解析、経路エンリッチメント解析、PPIネットワーク解析の3つの主要な機能モジュールを統合しています(図1)。各分析後、結果は自動的に視覚化され、R /光沢のあるウィジェット機能を介して調整可能で、Microsoft Excel形式のパブリケーションテーブルとして簡単にダウンロードできます。以下のプロトコルでは、定量的な全プロテオームデータを例にとり、JUMPnソフトウェアのインストール、発現差のあるタンパク質または(dys)調節プロテオームの定義、共発現ネットワーク解析、PPIモジュール解析、結果の視覚化と解釈、トラブルシューティングなど、JUMPnを使用する主なステップについて説明します。JUMPn ソフトウェアは GitHub41 で自由に入手できます。

Protocol

注:このプロトコルにおいて、JUMPnの使用は、TMT等圧標識試薬27によって定量されたB細胞分化中の全プロテオームプロファイリングの公開されたデータセットを利用することによって例示される。 1. JUMPnソフトウェアのセットアップ メモ: JUMPn ソフトウェアの設定には、(i) 個人使用のためにローカルコンピュータにインストールする 2 …

Representative Results

我々は、JUMPnの性能を最適化および評価するために、公開されたディーププロテオミクスデータセット25、26、27、30(図5および図6)およびデータシミュレーション57(表1)を使用した。WGCNAを介した共発現タンパク質クラスタ?…

Discussion

ここでは、深い定量的プロテオミクスデータ25,26,27,30,64を用いて分子機構を解剖するための複数のプロジェクトに適用されているJUMPnソフトウェアとそのプロトコルを紹介しました。JUMPnソフトウェアとプロトコルは、共発現ネットワーク解析のためのDEタンパク質の検討…

Disclosures

The authors have nothing to disclose.

Acknowledgements

資金援助は、国立衛生研究所(NIH)(R01AG047928、R01AG053987、RF1AG064909、RF1AG068581、およびU54NS110435)およびALSAC(米国レバノンシリア関連慈善団体)によって提供されました。MS解析は、NIHがんセンター支援助成金(P30CA021765)によって部分的に支援されたセントジュード小児研究病院のプロテオミクスおよびメタボロミクスセンターで実施された。コンテンツは著者の責任であり、必ずしも国立衛生研究所の公式見解を表すものではありません。

Materials

MacBook Pro with a 2.3 GHz Quad-Core Processor running OS 10.15.7. Apple Inc. MacBook Pro 13'' Hardware used for software development and testing
Anoconda Anaconda, Inc. version 4.9.2 https://docs.anaconda.com/anaconda/install/
miniconda Anaconda, Inc. version 4.9.2 https://docs.conda.io/en/latest/miniconda.html
RStudio RStudio Public-benefit corporation version 4.0.3 https://www.rstudio.com/products/rstudio/download/
Shiny Server RStudio Public-benefit corporation https://shiny.rstudio.com/articles/shinyapps.html

References

  1. Aebersold, R., Mann, M. Mass-spectrometric exploration of proteome structure and function. Nature. 537, 347-355 (2016).
  2. Senko, M. W., et al. Novel parallelized quadrupole/linear ion trap/orbitrap tribrid mass spectrometer improving proteome coverage and peptide identification rates. Analytical Chemistry. 85, 11710-11714 (2013).
  3. Eliuk, S., Makarov, A. Evolution of orbitrap mass spectrometry instrumentation. Annual Review of Analytical Chemistry. 8, 61-80 (2015).
  4. Wang, H., et al. Systematic optimization of long gradient chromatography mass spectrometry for deep analysis of brain proteome. Journal of Proteome Research. 14, 829-838 (2015).
  5. Blue, L. E. Recent advances in capillary ultrahigh pressure liquid chromatography. Journal of Chromatography A. 1523, 17-39 (2017).
  6. Meier, F., et al. Online parallel accumulation-serial fragmentation (PASEF) with a novel trapped ion mobility mass spectrometer. Molecular & Cellular Proteomics. 17, 2534-2545 (2018).
  7. Ludwig, C., et al. Data-independent acquisition-based SWATH-MS for quantitative proteomics: a tutorial. Molecular Systems Biology. 14 (8), 8126 (2018).
  8. Zhang, Y. Y., Fonslow, B. R., Shan, B., Baek, M. C., Yates, J. R. Protein analysis by shotgun/bottom-up proteomics. Chemical Reviews. 113, 2343-2394 (2013).
  9. Wang, Z., et al. 27-Plex tandem mass tag mass spectrometry for profiling brain proteome in Alzheimer’s disease. Analytical Chemistry. 92, 7162-7170 (2020).
  10. Li, J. M., et al. TMTpro reagents: a set of isobaric labeling mass tags enables simultaneous proteome-wide measurements across 16 samples. Nature Methods. 17 (4), 399-404 (2020).
  11. Collins, B. C., et al. Multi-laboratory assessment of reproducibility, qualitative and quantitative performance of SWATH-mass spectrometry. Nature Communications. 8 (1), 291 (2017).
  12. Navarro, P., et al. A multicenter study benchmarks software tools for label-free proteome quantification. Nature Biotechnology. 34, 1130 (2016).
  13. Wang, X. S., et al. A tag-based database search tool for peptide identification with high sensitivity and accuracy. Molecular & Cellular Proteomics. 13, 3663-3673 (2014).
  14. Li, Y. X., et al. JUMPg: An integrative proteogenomics pipeline identifying unannotated proteins in human brain and cancer cells. Journal of Proteome Research. 15, 2309-2320 (2016).
  15. Cox, J., Mann, M. MaxQuant enables high peptide identification rates, individualized p.p.b.-range mass accuracies and proteome-wide protein quantification. Nature Biotechnology. 26, 1367-1372 (2008).
  16. Kong, A. T., Leprevost, F. V., Avtonomov, D. M., Mellacheruvu, D., Nesvizhskii, A. I. MSFragger: ultrafast and comprehensive peptide identification in mass spectrometry-based proteomics. Nature Methods. 14, 513 (2017).
  17. Chi, H., et al. Comprehensive identification of peptides in tandem mass spectra using an efficient open search engine. Nature Biotechnology. 36, 1059 (2018).
  18. Demichev, V., Messner, C. B., Vernardis, S. I., Lilley, K. S., Ralser, M. DIA-NN neural networks and interference correction enable deep proteome coverage in high throughput. Nature Methods. 17, 41 (2020).
  19. High, A. A., et al. Deep proteome profiling by isobaric labeling, extensive liquid chromatography, mass spectrometry, and software-assisted quantification. Journal of Visualized Experiments: JoVE. (129), e56474 (2017).
  20. Wang, Z., et al. High-throughput and deep-proteome profiling by 16-plex tandem mass tag labeling coupled with two-dimensional chromatography and mass spectrometry. Journal of Visualized Experiments: JoVE. (162), e61684 (2020).
  21. Meier, F., Geyer, P. E., Winter, S. V., Cox, J., Mann, M. BoxCar acquisition method enables single-shot proteomics at a depth of 10,000 proteins in 100 minutes. Nature Methods. 15, 440 (2018).
  22. Sinitcyn, P., Rudolph, J. D., Cox, J. Computational methods for understanding mass spectrometry-based shotgun proteomics data. Annual Review of Biomedical Data Science. 1, 207-234 (2018).
  23. Ideker, T., Galitski, T., Hood, L. A new approach to decoding life: Systems biology. Annual Review of Genomics and Human Genetics. 2, 343-372 (2001).
  24. Barabasi, A. L., Oltvai, Z. N. Network biology: understanding the cell’s functional organization. Nature Reviews Genetics. 5, 101-113 (2004).
  25. Tan, H., et al. Integrative proteomics and phosphoproteomics profiling reveals dynamic signaling networks and bioenergetics pathways underlying T cell activation. Immunity. 46, 488-503 (2017).
  26. Bai, B., et al. Deep multilayer brain proteomics identifies molecular networks in alzheimer’s disease progression. Neuron. 105, 975-991 (2020).
  27. Zeng, H., et al. Discrete roles and bifurcation of PTEN signaling and mTORC1-mediated anabolic metabolism underlie IL-7-driven B lymphopoiesis. Science Advances. 4, 5701 (2018).
  28. Seyfried, N. T., et al. A multi-network approach identifies protein-specific co-expression in asymptomatic and symptomatic Alzheimer’s disease. Cell Systems. 4, 60-72 (2017).
  29. Johnson, E. C. B., et al. Large-scale proteomic analysis of Alzheimer’s disease brain and cerebrospinal fluid reveals early changes in energy metabolism associated with microglia and astrocyte activation. Nature Medicine. 26, 769-780 (2020).
  30. Stewart, E., et al. Identification of therapeutic targets in rhabdomyosarcoma through integrated genomic, epigenomic, and proteomic analyses. Cancer Cell. 34, 411-426 (2018).
  31. Rudolph, J. D., Cox, J. A network module for the perseus software for computational proteomics facilitates proteome interaction graph analysis. Journal of Proteome Research. 18, 2052-2064 (2019).
  32. Zhang, B., et al. Proteogenomic characterization of human colon and rectal cancer. Nature. 513, 382 (2014).
  33. Petralia, F., et al. Integrated proteogenomic characterization across major histological types of pediatric brain cancer. Cell. 183, 1962 (2020).
  34. Dutkowski, J., et al. A gene ontology inferred from molecular networks. Nature Biotechnology. 31, 38 (2013).
  35. Yu, M. K., et al. Translation of genotype to phenotype by a hierarchy of cell subsystems. Cell Systems. 2, 77-88 (2016).
  36. Jansen, R., Greenbaum, D., Gerstein, M. Relating whole-genome expression data with protein-protein interactions. Genome Research. 12, 37-46 (2002).
  37. Huttlin, E. L., et al. Architecture of the human interactome defines protein communities and disease networks. Nature. 545, 505-509 (2017).
  38. Ron-Harel, N., et al. Mitochondrial biogenesis and proteome remodeling promote one-carbon metabolism for T cell activation. Cell Metabolism. 24, 104-117 (2016).
  39. Niu, M. M., et al. Extensive peptide fractionation and y(1) ion-based interference detection method for enabling accurate quantification by isobaric labeling and mass spectrometry. Analytical Chemistry. 89, 2956-2963 (2017).
  40. Chang, W. shiny: Web Application Framework for. Nature Protocols. 11, 2301-2319 (2021).
  41. . JUMPn Available from: https://github.com/VanderwallDavid/JUMPn_1.0.0 (2021)
  42. . Anaconda Available from: https://docs.anaconda.com/anaconda/install/ (2021)
  43. . miniconda Available from: https://docs.conda.io/en/latest/miniconda.html (2021)
  44. . RStudio Available from: https://www.rstudio.com/products/rstudio/download/ (2021)
  45. . Shiny Server Available from: https://shiny.rstudio.com/articles/shinyapps.html (2021)
  46. Tyanova, S., Temu, T., Cox, J. The MaxQuant computational platform for mass spectrometry-based shotgun proteomics. Nature Protocol. 11, 2301-2319 (2016).
  47. . R code Available from: https://github.com/VanderwallDavid/JUMPn_1.0.0/tree/main/JUMPn_preprocessing (2021)
  48. Florens, L., et al. Analyzing chromatin remodeling complexes using shotgun proteomics and normalized spectral abundance factors. Methods. 40, 303-311 (2006).
  49. Zhang, B., Horvath, S. A general framework for weighted gene co-expression network analysis. Statistical Applications in Genetics and Molecular Biology. 4, (2005).
  50. Voineagu, I., et al. Transcriptomic analysis of autistic brain reveals convergent molecular pathology. Nature. 474, 380 (2011).
  51. Langfelder, P., Zhang, B., Horvath, S. Defining clusters from a hierarchical cluster tree: the Dynamic Tree Cut package for R. Bioinformatics. 24, 719-720 (2008).
  52. Ravasz, E., Somera, A. L., Mongru, D. A., Oltvai, Z. N., Barabasi, A. L. Hierarchical organization of modularity in metabolic networks. Science. 297, 1551-1555 (2002).
  53. Kuleshov, M. V., et al. Enrichr: a comprehensive gene set enrichment analysis web server 2016 update. Nucleic Acids Research. 44, 90-97 (2016).
  54. Liberzon, A., et al. Molecular signatures database (MSigDB) 3.0. Bioinformatics. 27, 1739-1740 (2011).
  55. . FlyEn rich r Available from: https://maayanlab.cloud/FlyEnrichr/#stats (2021)
  56. . JUMPn GitHub Available from: https://github.com/VanderwallDavid/JUMPn_1.0.0/tree/main/resources/example_fly (2021)
  57. Langfelder, P., Horvath, S. Eigengene networks for studying the relationships between co-expression modules. BMC Systems Biology. 1, 54 (2007).
  58. Benjamini, Y., Hochberg, Y. Controlling the false discovery rate – a practical and powerful approach to multiple testing. Journal of the Royal Statistical Society: Series B. 57, 289-300 (1995).
  59. Szklarczyk, D., et al. STRING v10: protein-protein interaction networks, integrated over the tree of life. Nucleic Acids Research. 43, 447-452 (2015).
  60. Szklarczyk, D., et al. STRING v11: protein-protein association networks with increased coverage, supporting functional discovery in genome-wide experimental datasets. Nucleic Acids Research. 47, 607-613 (2019).
  61. Huttlin, E. L., et al. The BioPlex network: A systematic exploration of the human interactome. Cell. 162, 425-440 (2015).
  62. Huttlin, E. L., et al. Dual proteome-scale networks reveal cell-specific remodeling of the human interactome. Cell. 184, 3022-3040 (2021).
  63. Li, T., et al. A scored human protein-protein interaction network to catalyze genomic interpretation. Nature Methods. 14, 61-64 (2017).
  64. Wang, H., et al. Deep multiomics profiling of brain tumors identifies signaling networks downstream of cancer driver genes. Nature Communications. 10, 3718 (2019).
  65. Gerstein, M. B., et al. Architecture of the human regulatory network derived from ENCODE data. Nature. 489, 91-100 (2012).
  66. Yu, J., Peng, J., Chi, H. Systems immunology: Integrating multi-omics data to infer regulatory networks and hidden drivers of immunity. Current Opinion in Systems Biology. 15, 19-29 (2019).
  67. Califano, A., Alvarez, M. J. The recurrent architecture of tumour initiation, progression and drug sensitivity. Nature Reviews Cancer. 17, 116-130 (2017).
  68. Hein, M. Y., et al. A human interactome in three quantitative dimensions organized by stoichiometries and abundances. Cell. 163, 712-723 (2015).
  69. Liang, Z., Xu, M., Teng, M. K., Niu, L. W. Comparison of protein interaction networks reveals species conservation and divergence. BMC Bioinformatics. 7, 457 (2006).
  70. Shou, C., et al. Measuring the evolutionary rewiring of biological networks. PLOS Computational Biology. 7, 1001050 (2011).
  71. Zhou, Y., et al. Metascape provides a biologist-oriented resource for the analysis of systems-level datasets. Nature Communications. 10, 1523 (2019).
  72. Cline, M. S., et al. Integration of biological networks and gene expression data using Cytoscape. Nature Protocols. 2, 2366-2382 (2007).

Play Video

Cite This Article
Vanderwall, D., Suresh, P., Fu, Y., Cho, J., Shaw, T. I., Mishra, A., High, A. A., Peng, J., Li, Y. JUMPn: A Streamlined Application for Protein Co-Expression Clustering and Network Analysis in Proteomics. J. Vis. Exp. (176), e62796, doi:10.3791/62796 (2021).

View Video