Мы представляем инструмент системной биологии JUMPn для выполнения и визуализации сетевого анализа количественных данных протеомики с подробным протоколом, включающим предварительную обработку данных, кластеризацию коэкспрессии, обогащение путей и сетевой анализ белково-белкового взаимодействия.
С недавними достижениями в технологиях протеомики на основе масс-спектрометрии глубокое профилирование сотен протеомов становится все более осуществимым. Однако получение биологической информации из таких ценных наборов данных является сложной задачей. Здесь мы представляем программное обеспечение JUMPn на основе системной биологии и связанный с ним протокол для организации протеома в кластеры экспрессии белка в образцах и сетях белково-белкового взаимодействия (PPI), соединенных модулями (например, белковыми комплексами). Используя платформу R/Shiny, программное обеспечение JUMPn упрощает анализ кластеризации коэкспрессии, обогащения путей и обнаружения модуля PPI с интегрированной визуализацией данных и удобным интерфейсом. Основные этапы протокола включают установку программного обеспечения JUMPn, определение дифференциально экспрессированных белков или (дис)регулируемого протеома, определение значимых кластеров коэкспрессии и модулей PPI, а также визуализацию результатов. Хотя протокол демонстрируется с использованием профиля протеома на основе изобарической маркировки, JUMPn обычно применим к широкому спектру количественных наборов данных (например, протеомика без меток). Таким образом, программное обеспечение и протокол JUMPn обеспечивают мощный инструмент для облегчения биологической интерпретации в количественной протеомике.
Протоомика дробовика на основе масс-спектрометрии стала ключевым подходом к анализу разнообразия протеомов сложных образцов1. С последними достижениями в области масс-спектрометрических приборов 2,3, хроматографии 4,5, обнаружения подвижности ионов6, методов сбора (независимый от данных7 и зависящий от данных сбор8), подходов к количественной оценке (метод многоплексной маркировки изобарических пептидов, например, TMT 9,10 и количественной оценки без маркировки11,12) и стратегий анализа данных/ Разработка программного обеспечения 13,14,15,16,17,18, количественная оценка всего протеома (например, более 10 000 белков) теперь является рутинной 19,20,21. Тем не менее, как получить механистическое понимание из таких глубоких количественных наборов данных, все еще сложно22. Первоначальные попытки исследования этих наборов данных основывались преимущественно на аннотации отдельных элементов данных, рассматривая каждый компонент (белок) независимо. Однако биологические системы и их поведение не могут быть объяснены исключительно путем изучения отдельных компонентов23. Поэтому системный подход, который помещает количественные биомолекулы в контекст сетей взаимодействия, имеет важное значение для понимания сложных систем и связанных с ними процессов, таких как эмбриогенез, иммунный ответ и патогенез заболеваний человека24.
Сетевая системная биология стала мощной парадигмой для анализа крупномасштабных количественных данных протеомики 25,26,27,28,29,30,31,32,33. Концептуально сложные системы, такие как клетки млекопитающих, могут быть смоделированы как иерархическая сеть34,35, в которой вся система представлена в уровнях: сначала рядом крупных компонентов, каждый из которых затем итеративно моделируется более мелкими подсистемами. Технически структура динамики протеомов может быть представлена взаимосвязанными сетями коэкспрессированных белковых кластеров (поскольку коэкспрессированные гены/белки часто имеют сходные биологические функции или механизмы регуляции36) и физически взаимодействующими модулямиPPI 37. В качестве недавнего примера25 мы сгенерировали временные профили всего протеома и фосфопротеома во время активации Т-клеток и использовали интегративные сети коэкспрессии с ИПП для идентификации функциональных модулей, которые опосредуют выход Т-клеток из покоя. Было выделено и экспериментально проверено несколько модулей, связанных с биоэнергетикой (например, миторибосомы и комплексные модулиIV 25 и одноуглеродный модуль38). В другом примере26 мы еще больше расширили наш подход к изучению патогенеза болезни Альцгеймера и успешно определили приоритеты прогрессирования заболевания, связанных с белковыми модулями и молекулами. Важно отметить, что многие из наших непредвзятых открытий были подтверждены независимыми когортами пациентов26,29 и / или моделями мышей с заболеваниями26. Эти примеры проиллюстрировали силу подхода системной биологии для препарирования молекулярных механизмов с помощью количественной протеомики и других омических интеграций.
Здесь мы представляем JUMPn, оптимизированное программное обеспечение, которое исследует количественные данные протеомики с использованием сетевых системных подходов к биологии. JUMPn служит последующим компонентом установленного пакета программного обеспечения протеомики JUMP 13,14,39 и направлен на заполнение пробела от отдельных количественных оценок белка до биологически значимых путей и белковых модулей с использованием подхода системной биологии. Принимая матрицу количественной оценки дифференциально экспрессированных (или наиболее изменчивых) белков в качестве входных данных, JUMPn стремится организовать протеом в многоуровневую иерархию белковых кластеров, совместно экспрессируемых в образцах и плотно связанных модулях PPI (например, белковых комплексах), которые дополнительно аннотируются в общедоступных базах данных путей путем анализа чрезмерного представления (или обогащения) (рисунок 1). JUMPn разработан с использованием платформы R/Shiny40 для удобного интерфейса и объединяет три основных функциональных модуля: кластерный анализ коэкспрессии, анализ обогащения путей и сетевой анализ PPI (рисунок 1). После каждого анализа результаты автоматически визуализируются и настраиваются с помощью функций виджетов R/shiny и легко загружаются в виде таблиц публикации в формате Microsoft Excel. В следующем протоколе мы используем количественные данные всего протеома в качестве примера и описываем основные этапы использования JUMPn, включая установку программного обеспечения JUMPn, определение дифференциально экспрессированных белков или (дис)регулируемого протеома, анализ сети коэкспрессии и анализ модуля PPI, визуализацию и интерпретацию результатов, а также устранение неполадок. Программное обеспечение JUMPn находится в свободном доступе на GitHub41.
Здесь мы представили наше программное обеспечение JUMPn и его протокол, которые были применены в нескольких проектах для препарирования молекулярных механизмов с использованием глубоких количественных данных протеомики 25,26,27,30,64<…
The authors have nothing to disclose.
Финансовая поддержка была предоставлена Национальными институтами здравоохранения (NIH) (R01AG047928, R01AG053987, RF1AG064909, RF1AG068581 и U54NS110435) и ALSAC (Американские ливанские сирийские ассоциированные благотворительные организации). Анализ РС был проведен в Центре протеомики и метаболомики детской исследовательской больницы Святого Иуды, который был частично поддержан грантом поддержки Онкологического центра NIH (P30CA021765). Содержание является исключительной ответственностью авторов и не обязательно отражает официальную точку зрения Национальных институтов здравоохранения.
MacBook Pro with a 2.3 GHz Quad-Core Processor running OS 10.15.7. | Apple Inc. | MacBook Pro 13'' | Hardware used for software development and testing |
Anoconda | Anaconda, Inc. | version 4.9.2 | https://docs.anaconda.com/anaconda/install/ |
miniconda | Anaconda, Inc. | version 4.9.2 | https://docs.conda.io/en/latest/miniconda.html |
RStudio | RStudio Public-benefit corporation | version 4.0.3 | https://www.rstudio.com/products/rstudio/download/ |
Shiny Server | RStudio Public-benefit corporation | https://shiny.rstudio.com/articles/shinyapps.html |