Presentiamo uno strumento di biologia dei sistemi JUMPn per eseguire e visualizzare l’analisi di rete per i dati quantitativi di proteomica, con un protocollo dettagliato che include la pre-elaborazione dei dati, il clustering di co-espressione, l’arricchimento del percorso e l’analisi della rete di interazione proteina-proteina.
Con i recenti progressi nelle tecnologie di proteomica basate sulla spettrometria di massa, la profilazione profonda di centinaia di proteomi è diventata sempre più fattibile. Tuttavia, ricavare informazioni biologiche da set di dati così preziosi è una sfida. Qui introduciamo un software basato sulla biologia dei sistemi JUMPn e il suo protocollo associato per organizzare il proteoma in cluster di co-espressione proteica attraverso campioni e reti di interazione proteina-proteina (PPI) collegate da moduli (ad esempio, complessi proteici). Utilizzando la piattaforma R/Shiny, il software JUMPn semplifica l’analisi del clustering di co-espressione, dell’arricchimento del percorso e del rilevamento dei moduli PPI, con la visualizzazione dei dati integrata e un’interfaccia user-friendly. Le fasi principali del protocollo includono l’installazione del software JUMPn, la definizione di proteine differenzialmente espresse o del proteoma (dis)regolato, la determinazione di cluster di co-espressione significativi e moduli PPI e la visualizzazione dei risultati. Mentre il protocollo è dimostrato utilizzando un profilo proteoma basato sull’etichettatura isobarica, JUMPn è generalmente applicabile a una vasta gamma di set di dati quantitativi (ad esempio, proteomica senza etichette). Il software e il protocollo JUMPn forniscono quindi un potente strumento per facilitare l’interpretazione biologica nella proteomica quantitativa.
La proteomica del fucile a pompa basata sulla spettrometria di massa è diventata l’approccio chiave per analizzare la diversità del proteoma di campioni complessi1. Con i recenti progressi nella strumentazione di spettrometria di massa 2,3, cromatografia 4,5, rilevamento della mobilità ionica6, metodi di acquisizione (acquisizione 7 indipendente dai dati e acquisizione dipendente dai dati8), approcci di quantificazione (metodo di etichettatura dei peptidi isobarici multiplex, ad esempio TMT 9,10 e quantificazione senza etichetta11,12) e strategie di analisi dei dati. sviluppo software 13,14,15,16,17,18, quantificazione dell’intero proteoma (ad esempio, oltre 10.000 proteine) è ora di routine 19,20,21. Tuttavia, come ottenere approfondimenti meccanicistici da set di dati quantitativi così profondi è ancora impegnativo22. I tentativi iniziali di indagare su questi set di dati si basavano prevalentemente sull’annotazione di singoli elementi dei dati, trattando ogni componente (proteina) in modo indipendente. Tuttavia, i sistemi biologici e il loro comportamento non possono essere spiegati esclusivamente esaminando i singoli componenti23. Pertanto, un approccio sistemico che colloca le biomolecole quantificate nel contesto delle reti di interazione è essenziale per la comprensione dei sistemi complessi e dei processi associati come l’embriogenesi, la risposta immunitaria e la patogenesi delle malattie umane24.
La biologia dei sistemi basata sulla rete è emersa come un potente paradigma per l’analisi dei dati quantitativi di proteomica su larga scala 25,26,27,28,29,30,31,32,33. Concettualmente, sistemi complessi come le cellule di mammifero potrebbero essere modellati come una rete gerarchica34,35, in cui l’intero sistema è rappresentato in livelli: prima da un numero di componenti di grandi dimensioni, ognuno dei quali poi modellato iterativamente da sottosistemi più piccoli. Tecnicamente, la struttura della dinamica del proteoma può essere presentata da reti interconnesse di cluster proteici co-espressi (perché geni/proteine co-espressi spesso condividono funzioni biologiche simili o meccanismi di regolazione36) e moduli PPI fisicamente interagenti37. Come esempio recente25, abbiamo generato profili temporali di proteoma intero e fosfoproteoma durante l’attivazione delle cellule T e utilizzato reti di co-espressione integrative con PPI per identificare moduli funzionali che mediano l’uscita di quiescenza delle cellule T. Sono stati evidenziati e convalidati sperimentalmente più moduli correlati alla bioenergetica (ad esempio, il mitoribosoma e i moduli IV complessi25 e il modulo a un carbonio38). In un altro esempio26, abbiamo ulteriormente esteso il nostro approccio per studiare la patogenesi della malattia di Alzheimer e abbiamo dato priorità con successo ai moduli e alle molecole proteiche associate alla progressione della malattia. È importante sottolineare che molte delle nostre scoperte imparziali sono state convalidate da coorti di pazienti indipendenti26,29 e / o modelli murini di malattia26. Questi esempi hanno illustrato la potenza dell’approccio di biologia dei sistemi per sezionare i meccanismi molecolari con la proteomica quantitativa e altre integrazioni omiche.
Qui presentiamo JUMPn, un software semplificato che esplora i dati quantitativi di proteomica utilizzando approcci di biologia dei sistemi basati sulla rete. JUMPn funge da componente a valle della suite software di proteomica JUMP13,14,39 e mira a colmare il divario dalle singole quantificazioni proteiche a percorsi biologicamente significativi e moduli proteici utilizzando l’approccio della biologia dei sistemi. Prendendo la matrice di quantificazione delle proteine differenzialmente espresse (o le più variabili) come input, JUMPn mira a organizzare il proteoma in una gerarchia a più livelli di cluster proteici co-espressi tra campioni e moduli PPI densamente connessi (ad esempio, complessi proteici), che sono ulteriormente annotati con database di percorsi pubblici mediante analisi di sovrarappresentazione (o arricchimento) (Figura 1). JUMPn è sviluppato con la piattaforma R/Shiny40 per un’interfaccia user-friendly e integra tre principali moduli funzionali: analisi di clustering di co-espressione, analisi di arricchimento del percorso e analisi della rete PPI (Figura 1). Dopo ogni analisi, i risultati vengono visualizzati automaticamente e sono regolabili tramite le funzioni widget R/shiny e facilmente scaricabili come tabelle di pubblicazione in formato Microsoft Excel. Nel seguente protocollo, utilizziamo i dati quantitativi dell’intero proteoma come esempio e descriviamo i passaggi principali dell’utilizzo di JUMPn, inclusa l’installazione del software JUMPn, la definizione di proteine differenzialmente espresse o il proteoma (dis)regolato, l’analisi della rete di co-espressione e l’analisi del modulo PPI, la visualizzazione e l’interpretazione dei risultati e le riprese dei problemi. Il software JUMPn è disponibile gratuitamente su GitHub41.
Qui abbiamo introdotto il nostro software JUMPn e il suo protocollo, che sono stati applicati in più progetti per la dissezione di meccanismi molecolari utilizzando dati quantitativi profondidi proteomica 25,26,27,30,64. Il software e il protocollo JUMPn sono stati completamente ottimizzati, compresa la considerazione delle proteine DE per l’analisi della ret…
The authors have nothing to disclose.
Il sostegno finanziario è stato fornito dal National Institutes of Health (NIH) (R01AG047928, R01AG053987, RF1AG064909, RF1AG068581 e U54NS110435) e ALSAC (American Lebanese Syrian Associated Charities). L’analisi della SM è stata effettuata nel Centro di Proteomica e Metabolomica del St. Jude Children’s Research Hospital, che è stato parzialmente supportato dal NIH Cancer Center Support Grant (P30CA021765). Il contenuto è di esclusiva responsabilità degli autori e non rappresenta necessariamente le opinioni ufficiali del National Institutes of Health.
MacBook Pro with a 2.3 GHz Quad-Core Processor running OS 10.15.7. | Apple Inc. | MacBook Pro 13'' | Hardware used for software development and testing |
Anoconda | Anaconda, Inc. | version 4.9.2 | https://docs.anaconda.com/anaconda/install/ |
miniconda | Anaconda, Inc. | version 4.9.2 | https://docs.conda.io/en/latest/miniconda.html |
RStudio | RStudio Public-benefit corporation | version 4.0.3 | https://www.rstudio.com/products/rstudio/download/ |
Shiny Server | RStudio Public-benefit corporation | https://shiny.rstudio.com/articles/shinyapps.html |