Apresentamos uma ferramenta de biologia de sistemas JUMPn para realizar e visualizar análises de rede para dados quantitativos de proteômica, com um protocolo detalhado que inclui pré-processamento de dados, agrupamento de co-expressão, enriquecimento de caminhos e análise de rede de interação proteína-proteína.
Com os recentes avanços nas tecnologias de proteômica baseadas em espectrometria de massa, o perfil profundo de centenas de proteomes tornou-se cada vez mais viável. No entanto, obter insights biológicos de tais conjuntos de dados valiosos é um desafio. Aqui introduzimos um software baseado em biologia de sistemas JUMPn, e seu protocolo associado para organizar o proteome em clusters de co-expressão de proteínas em amostras e redes de interação proteína-proteína (PPI) conectadas por módulos (por exemplo, complexos proteicos). Usando a plataforma R/Shiny, o software JUMPn simplifica a análise de agrupamento de co-expressão, enriquecimento de caminhos e detecção de módulos PPI, com visualização integrada de dados e interface amigável. As principais etapas do protocolo incluem a instalação do software JUMPn, a definição de proteínas expressas diferencialmente ou o proteome (dis)regulado, determinação de clusters de co-expressão significativos e módulos PPI, e visualização de resultados. Embora o protocolo seja demonstrado usando um perfil proteome baseado em rotulagem isobáica, o JUMPn é geralmente aplicável a uma ampla gama de conjuntos de dados quantitativos (por exemplo, proteômica livre de rótulos). O software e o protocolo JUMPn fornecem assim uma poderosa ferramenta para facilitar a interpretação biológica em proteômica quantitativa.
A proteômica de espingarda baseada em espectrometria em massa tornou-se a abordagem chave para analisar a diversidade de proteomes de amostras complexas1. Com os recentes avanços na instrumentação de espectrometria de massa 2,3, cromatografia 4,5, detecção de mobilidade de íons6, métodos de aquisição (independente de dados7 e aquisição dependente de dados8), abordagens de quantificação (método de rotulagem de peptídeo isobárico multi-plex, por exemplo, TMT 9,10 e quantificação sem rótulo 11,12) e método de estratégia de análise de dados/ desenvolvimento de software 13,14,15,16,17,18, quantificação de todo o proteome (por exemplo, mais de 10.000 proteínas) é agora rotina 19,20,21. No entanto, como obter insights mecanicistas a partir de conjuntos de dados quantitativos tão profundos ainda é desafiador22. As tentativas iniciais de investigação desses conjuntos de dados dependiam predominantemente da anotação de elementos individuais dos dados, tratando cada componente (proteína) de forma independente. No entanto, os sistemas biológicos e seu comportamento não podem ser explicados unicamente examinando componentes individuais23. Portanto, uma abordagem de sistemas que coloca as biomoléculas quantificadas no contexto das redes de interação é essencial para a compreensão de sistemas complexos e dos processos associados, como embriogênese, resposta imune e patogênese das doenças humanas24.
A biologia de sistemas baseados em rede emergiu como um poderoso paradigma para a análise de dados quantitativos de proteômica em larga escala 25,26,27,28,29,30,31,32,33. Conceitualmente, sistemas complexos como células mamíferas poderiam ser modelados como uma rede hierárquica34,35, na qual todo o sistema é representado em níveis: primeiro por um número de componentes grandes, cada um dos quais então iterativamente modelado por subsistemas menores. Tecnicamente, a estrutura da dinâmica proteome pode ser apresentada por redes interconectadas de aglomerados proteicos co-expressos (porque genes/proteínas co-expressos geralmente compartilham funções biológicas ou mecanismos de regulação36) e módulos PPI interagindo fisicamente37. Como exemplo recente25, geramos perfis temporais de proteome e fosfomésomo durante a ativação de células T e usamos redes integrativas de co-expressão com PPIs para identificar módulos funcionais que mediam a saída de quiescência de células T. Múltiplos módulos relacionados ao bioenergetic foram destacados e validados experimentalmente (por exemplo, os módulos IV mitoribosome ecomplexos 25 e o módulo de um carbono38). Em outro exemplo26, ampliamos ainda mais nossa abordagem para estudar a patogênese da doença de Alzheimer, e priorizamos com sucesso a progressão da doença, módulos e moléculas associadas à progressão da doença. É importante ressaltar que muitas de nossas descobertas imparcial foram validadas por coortes independentes de pacientes26,29 e/ou modelos de camundongos26. Esses exemplos ilustraram o poder da abordagem da biologia dos sistemas para dissecar mecanismos moleculares com proteômica quantitativa e outras integrações omicais.
Aqui introduzimos o JUMPn, um software simplificado que explora dados quantitativos de proteômica usando abordagens de biologia de sistemas baseados em rede. A JUMPn serve como o componente a jusante do conjunto de software de proteômica JUMPestabelecido 13,14,39, e tem como objetivo preencher a lacuna desde quantificações proteicas individuais até caminhos biologicamente significativos e módulos proteicos usando a abordagem biológica dos sistemas. Ao tomar a matriz de quantificação de proteínas de PPI expressos diferencialmente (ou a mais variável) como entrada, a JUMPn pretende organizar o proteome em uma hierarquia hierárquica de aglomerados proteicos co-expressos entre amostras e módulos PPI densamente conectados (por exemplo, complexos proteicos), que são ainda mais anotados com bancos de dados de vias públicas por análise de super-representação (ou enriquecimento) (Figura 1). O JUMPn é desenvolvido com a plataforma R/Shiny40 para uma interface fácil de usar e integra três módulos funcionais principais: análise de clustering de co-expressão, análise de enriquecimento de caminhos e análise de rede PPI (Figura 1). Após cada análise, os resultados são visualizados automaticamente e são ajustáveis através das funções de widget R/shiny e prontamente para download como tabelas de publicação no formato Microsoft Excel. No protocolo a seguir, utilizamos dados de proteome completo quantitativo como exemplo e descrevemos os principais passos do uso do JUMPn, incluindo a instalação do software JUMPn, a definição de proteínas expressas diferencialmente ou o proteome (dis)regulado, análise de rede de co-expressão e análise de módulos PPI, visualização e interpretação de resultados e soluções de problemas. O software JUMPn está disponível gratuitamente no GitHub41.
Aqui introduzimos nosso software JUMPn e seu protocolo, que foram aplicados em vários projetos para dissecar mecanismos moleculares usando dados de proteômica quantitativa profunda 25,26,27,30,64. O software e o protocolo JUMPn foram totalmente otimizados, incluindo a consideração de proteínas DE para análise de rede de co-expressão, uma compilação de…
The authors have nothing to disclose.
O apoio ao financiamento foi fornecido pelos Institutos Nacionais de Saúde (NIH) (R01AG047928, R01AG053987, RF1AG064909, RF1AG068581 e U54NS110435) e ALSAC (American Libanbanese Syrian Associated Charities). A análise de MS foi realizada no Centro de Proteômica e Metabolômica do Hospital de Pesquisa Infantil de São Judas, que foi parcialmente apoiado pelo NIH Cancer Center Support Grant (P30CA021765). O conteúdo é de responsabilidade exclusiva dos autores e não representa necessariamente as opiniões oficiais dos Institutos Nacionais de Saúde.
MacBook Pro with a 2.3 GHz Quad-Core Processor running OS 10.15.7. | Apple Inc. | MacBook Pro 13'' | Hardware used for software development and testing |
Anoconda | Anaconda, Inc. | version 4.9.2 | https://docs.anaconda.com/anaconda/install/ |
miniconda | Anaconda, Inc. | version 4.9.2 | https://docs.conda.io/en/latest/miniconda.html |
RStudio | RStudio Public-benefit corporation | version 4.0.3 | https://www.rstudio.com/products/rstudio/download/ |
Shiny Server | RStudio Public-benefit corporation | https://shiny.rstudio.com/articles/shinyapps.html |