Wir präsentieren ein systembiologisches Tool JUMPn zur Durchführung und Visualisierung von Netzwerkanalysen für quantitative Proteomikdaten mit einem detaillierten Protokoll, das Datenvorverarbeitung, Co-Expression-Clustering, Signalweganreicherung und Protein-Protein-Interaktionsnetzwerkanalyse umfasst.
Mit den jüngsten Fortschritten bei massenspektrometriebasierten Proteomiktechnologien ist die Tiefenprofilierung von Hunderten von Proteomen zunehmend möglich geworden. Es ist jedoch eine Herausforderung, biologische Erkenntnisse aus solch wertvollen Datensätzen abzuleiten. Hier stellen wir eine auf Systembiologie basierende Software JUMPn und das zugehörige Protokoll vor, um das Proteom in Protein-Coexpressionscluster über Proben und Protein-Protein-Interaktionsnetzwerke (PPI) zu organisieren, die durch Module (z. B. Proteinkomplexe) verbunden sind. Mit der R/Shiny-Plattform optimiert die JUMPn-Software die Analyse von Co-Expression-Clustering, Pathway-Anreicherung und PPI-Modulerkennung mit integrierter Datenvisualisierung und einer benutzerfreundlichen Oberfläche. Die Hauptschritte des Protokolls umfassen die Installation der JUMPn-Software, die Definition von differentiell exprimierten Proteinen oder des (dys)regulierten Proteoms, die Bestimmung von aussagekräftigen Co-Expressionsclustern und PPI-Modulen sowie die Ergebnisvisualisierung. Während das Protokoll anhand eines isobaren, markierungsbasierten Proteomprofils demonstriert wird, ist JUMPn im Allgemeinen auf eine Vielzahl von quantitativen Datensätzen anwendbar (z. B. markierungsfreie Proteomik). Die JUMPn-Software und das JUMPn-Protokoll stellen somit ein leistungsfähiges Werkzeug zur Verfügung, um die biologische Interpretation in der quantitativen Proteomik zu erleichtern.
Massenspektrometrie-basierte Schrotflintenproteomik ist zum Schlüsselansatz für die Analyse der Proteomdiversität komplexer Probengeworden 1. Mit den jüngsten Fortschritten in der MassenspektrometrieInstrumentierung 2,3, Chromatographie 4,5, Ionenmobilitätsdetektion6, Erfassungsmethoden (datenunabhängig7 und datenabhängige Erfassung8), Quantifizierungsansätze (multiplexe isobare Peptidmarkierungsmethode, z. B. TMT9,10 und markierungsfreie Quantifizierung 11,12) und Datenanalysestrategien / Softwareentwicklung 13,14,15,16,17,18, Quantifizierung des gesamten Proteoms (z.B. über 10.000 Proteine) ist jetzt Routine 19,20,21. Wie man jedoch mechanistische Erkenntnisse aus solch tiefen quantitativen Datensätzen gewinnen kann, ist immer noch eine Herausforderung22. Erste Versuche, diese Datensätze zu untersuchen, stützten sich hauptsächlich auf die Annotation einzelner Elemente der Daten, wobei jede Komponente (Protein) unabhängig voneinander behandelt wurde. Biologische Systeme und ihr Verhalten lassen sich jedoch nicht allein durch die Untersuchung einzelner Komponentenerklären 23. Daher ist ein Systemansatz, der die quantifizierten Biomoleküle in den Kontext von Interaktionsnetzwerken stellt, für das Verständnis komplexer Systeme und der damit verbundenen Prozesse wie Embryogenese, Immunantwort und Pathogenese menschlicher Krankheitenunerlässlich 24.
Die netzwerkbasierte Systembiologie hat sich zu einem leistungsfähigen Paradigma für die Analyse großer quantitativer Proteomikdaten 25,26,27,28,29,30,31,32,33 entwickelt. Konzeptionell könnten komplexe Systeme wie Säugetierzellen als hierarchisches Netzwerk34,35 modelliert werden, in dem das gesamte System in Ebenen dargestellt wird: zuerst durch eine Reihe von großen Komponenten, von denen jede dann iterativ durch kleinere Subsysteme modelliert wird. Technisch gesehen kann die Struktur der Proteomdynamik durch miteinander verbundene Netzwerke von koexprimierten Proteinclustern (weil koexprimierte Gene / Proteine oft ähnliche biologische Funktionen oder Mechanismen der Regulation36 teilen) und physikalisch interagierenden PPI-Modulen37 dargestellt werden. Als aktuelles Beispiel25 generierten wir zeitliche Profile des gesamten Proteoms und des Phosphoproteoms während der T-Zell-Aktivierung und verwendeten integrative Co-Expressionsnetzwerke mit PPIs, um funktionelle Module zu identifizieren, die den T-Zell-Ruhezustand vermitteln. Mehrere bioenergetische Module wurden hervorgehoben und experimentell validiert (z. B. die Mitoribosom- und komplexen IV-Module25 und das Ein-Kohlenstoff-Modul38). In einem weiteren Beispiel26 haben wir unseren Ansatz zur Untersuchung der Pathogenese der Alzheimer-Krankheit weiter ausgebaut und erfolgreich die mit dem Krankheitsverlauf assoziierten Proteinmodule und -moleküle priorisiert. Wichtig ist, dass viele unserer unvoreingenommenen Entdeckungen durch unabhängige Patientenkohorten 26,29 und/oder Krankheitsmausmodelle26 validiert wurden. Diese Beispiele veranschaulichten die Leistungsfähigkeit des systembiologischen Ansatzes zur Sezierung molekularer Mechanismen mit quantitativer Proteomik und anderen Omics-Integrationen.
Hier stellen wir JUMPn vor, eine optimierte Software, die quantitative Proteomikdaten mit netzwerkbasierten systembiologischen Ansätzen untersucht. JUMPn dient als nachgelagerte Komponente der etablierten JUMP Proteomik-Software-Suite13,14,39 und zielt darauf ab, die Lücke von einzelnen Proteinquantifizierungen zu biologisch sinnvollen Signalwegen und Proteinmodulen mit dem systembiologischen Ansatz zu schließen. Durch die Berücksichtigung der Quantifizierungsmatrix von differentiell exprimierten (oder den variabelsten) Proteinen als Input zielt JUMPn darauf ab, das Proteom in einer abgestuften Hierarchie von Proteinclustern zu organisieren, die über Proben und dicht verbundene PPI-Module (z. B. Proteinkomplexe) koexprimiert werden, die durch Überrepräsentationsanalyse (oder Anreicherungsanalyse) weiter mit öffentlichen Pfaddatenbanken annotiert werden (Abbildung 1). JUMPn wurde mit der R/Shiny-Plattform40 für eine benutzerfreundliche Oberfläche entwickelt und integriert drei Hauptfunktionsmodule: Co-Expression-Clustering-Analyse, Pathway-Enrichment-Analyse und PPI-Netzwerkanalyse (Abbildung 1). Nach jeder Analyse werden die Ergebnisse automatisch visualisiert und über die R/shiny-Widget-Funktionen einstellbar und können als Publikationstabellen im Microsoft Excel-Format heruntergeladen werden. Im folgenden Protokoll verwenden wir quantitative Gesamtproteomdaten als Beispiel und beschreiben die wichtigsten Schritte der Verwendung von JUMPn, einschließlich der Installation der JUMPn-Software, der Definition von differentiell exprimierten Proteinen oder des (dys)regulierten Proteoms, der Co-Expressionsnetzwerkanalyse und der PPI-Modulanalyse, der Ergebnisvisualisierung und -interpretation sowie der Fehlerbehebung. Die JUMPn-Software ist auf GitHub41 frei verfügbar.
Hier haben wir unsere JUMPn-Software und ihr Protokoll vorgestellt, die in mehreren Projekten zur Sezierung molekularer Mechanismen unter Verwendung tiefer quantitativer Proteomik-Daten 25,26,27,30,64 angewendet wurden. Die JUMPn-Software und das Protokoll wurden vollständig optimiert, einschließlich der Berücksichtigung von DE-Proteinen für die Co-Express…
The authors have nothing to disclose.
Die finanzielle Unterstützung wurde von den National Institutes of Health (NIH) (R01AG047928, R01AG053987, RF1AG064909, RF1AG068581 und U54NS110435) und ALSAC (American Lebanese Syrian Associated Charities) bereitgestellt. Die MS-Analyse wurde im Zentrum für Proteomik und Metabolomik des St. Jude Children’s Research Hospital durchgeführt, das teilweise durch den NIH Cancer Center Support Grant (P30CA021765) unterstützt wurde. Der Inhalt liegt in der alleinigen Verantwortung der Autoren und stellt nicht unbedingt die offiziellen Ansichten der National Institutes of Health dar.
MacBook Pro with a 2.3 GHz Quad-Core Processor running OS 10.15.7. | Apple Inc. | MacBook Pro 13'' | Hardware used for software development and testing |
Anoconda | Anaconda, Inc. | version 4.9.2 | https://docs.anaconda.com/anaconda/install/ |
miniconda | Anaconda, Inc. | version 4.9.2 | https://docs.conda.io/en/latest/miniconda.html |
RStudio | RStudio Public-benefit corporation | version 4.0.3 | https://www.rstudio.com/products/rstudio/download/ |
Shiny Server | RStudio Public-benefit corporation | https://shiny.rstudio.com/articles/shinyapps.html |