Целевая сшивающая масс-спектрометрия создает четвертичные модели структуры белка с использованием данных масс-спектрометрии, полученных с использованием до трех различных протоколов сбора. При выполнении в виде упрощенного рабочего процесса на веб-сервере Cheetah-MS результаты отображаются в записной книжке Jupyter. Здесь мы демонстрируем технические аспекты того, как Jupyter Notebook может быть расширен для более глубокого анализа.
Белково-белковые взаимодействия могут быть сложными для изучения, но дают представление о том, как функционируют биологические системы. Целевая сшивающая масс-спектрометрия (TX-MS), метод, сочетающий моделирование четвертичной структуры белка и химическую сшивающую масс-спектрометрию, создает высокоточные структурные модели с использованием данных, полученных из сложных, нефракционированных образцов. Это устраняет одно из основных препятствий для анализа сложной структуры белка, потому что интересующие белки больше не нуждаются в очистке в больших количествах. Веб-сервер Cheetah-MS был разработан, чтобы сделать упрощенную версию протокола более доступной для сообщества. Учитывая тандемные данные MS /MS, Cheetah-MS генерирует Jupyter Notebook, графический отчет, обобщающий наиболее важные результаты анализа. Расширение Jupyter Notebook может дать более глубокое понимание и лучше понять модель и данные масс-спектрометрии, поддерживающие ее. Технический протокол, представленный здесь, демонстрирует некоторые из наиболее распространенных расширений и объясняет, какую информацию можно получить. Он содержит блоки, помогающие анализировать тандемные данные сбора MS / MS и общее влияние обнаруженных XL на сообщаемые четвертичные модели. Результат такого анализа может быть применен к структурным моделям, которые встроены в ноутбук с помощью NGLView.
Белково-белковые взаимодействия лежат в основе структуры и функции биологических систем. Доступ к четвертичным структурам белков может дать представление о том, как два или более белка взаимодействуют, образуя структуры высокого порядка. К сожалению, получение четвертичных структур остается сложной задачей; это отражено в сравнительно небольшом числе записей1 Банка белковых данных (PDB), содержащих более одного полипептида. Белково-белковые взаимодействия могут быть изучены с помощью таких технологий, как рентгеновская кристаллография, ЯМР и крио-ЭМ, но получение достаточного количества очищенного белка в условиях, где могут быть применены методы, может занять много времени.
Химическая сшивающая масс-спектрометрия была разработана для получения экспериментальных данных о белково-белковых взаимодействиях с меньшими ограничениями на пробоподготовку, поскольку масс-спектрометрия может быть использована для получения данных о произвольно сложных образцах 2,3,4,5,6,7,8,9 . Однако комбинаторный характер анализа данных и относительно небольшое количество сшитых пептидов требуют, чтобы образцы были фракционированы перед анализом. Чтобы устранить этот недостаток, мы разработали TX-MS, метод, который сочетает в себе вычислительное моделирование с химической сшивающей масс-спектрометрией10. TX-MS может быть использован на произвольно сложных образцах и является значительно более чувствительным по сравнению с предыдущими методами10. Он достигает этого, оценивая все данные, связанные с данным белково-белковым взаимодействием, как набор вместо того, чтобы интерпретировать каждый спектр MS независимо. TX-MS также использует до трех различных протоколов сбора MS: MS1 с высоким разрешением (hrMS1), сбор данных в зависимости от данных (DDA) и независимый от данных сбор (DIA), что дополнительно предоставляет возможности для идентификации сшитого пептида путем объединения нескольких наблюдений. Вычислительный рабочий процесс TX-MS сложен по нескольким причинам. Во-первых, он опирается на несколько программ анализаMS 11,12,13 для создания моделей структуры белка 14,15. Во-вторых, объем данных может быть значительным. В-третьих, этап моделирования может потреблять значительное количество вычислительной мощности компьютера.
Следовательно, TX-MS лучше всего использовать в качестве автоматизированного, упрощенного вычислительного рабочего процесса через веб-сервер Cheetah-MS16, который работает на больших вычислительных инфраструктурах, таких как компьютерные облака или кластеры. Чтобы облегчить интерпретацию результатов, мы создали интерактивный Jupyter Notebook17. Здесь мы демонстрируем, как отчет Jupyter Notebook может быть расширен для получения более глубокого анализа заданного результата.
Современные вычислительные рабочие процессы часто сложны, с несколькими инструментами от разных поставщиков, сложными взаимозависимостями, большими объемами данных и многогранными результатами. Следовательно, становится все труднее точно задокументировать все шаги, необходимые для получения результата, что затрудняет воспроизведение данного результата. Здесь мы демонстрируем общую стратегию, которая сочетает в себе автоматизацию и простоту автоматизированного рабочего процесса, создающего общий отчет, с гибкостью настройки отчета воспроизводимым образом.
Для работы протокола необходимо выполнить три требования: во-первых, белки, отобранные для анализа, должны взаимодействовать таким образом, чтобы эксперимент по химическому сшиванию мог производить сшитые виды в достаточно высокой концентрации, которая может быть обнаружена масс-спектрометром; различные масс-спектрометры имеют разные уровни обнаружения, а также зависят от протокола сбора, а также от выбора реагента для сшивания. Текущая версия протокола TX-MS допускает только DSS, гомобифункциональный реагент лизин-лизина. Тем не менее, это ограничение в первую очередь связано с возможностью того, что этап машинного обучения должен быть скорректирован для других реагентов. Это ограничение было улучшено на веб-сервере Cheetah-MS, поскольку можно рассмотреть еще два сшивающих реагента, но все три являются нерасщепляемыми реагентами. Во-вторых, эти два белка должны либо иметь экспериментально определенную структуру, либо моделироваться с использованием методов сравнительного моделирования или методов de novo . Не все белки могут быть смоделированы, но сочетание улучшенного программного обеспечения и постоянного осаждения экспериментальных структур в PDB расширяет количество белков, которые могут быть смоделированы. В-третьих, взаимодействующие белки должны оставаться достаточно похожими в своих связанных и несвязанных состояниях, чтобы алгоритмы стыковки, используемые TX-MS и Cheetah-MS, могли создавать четвертичные структуры адекватного качества для обеспечения оценки. Это требование относительно расплывчато, поскольку приемлемое качество сильно зависит от системы, где меньшие белки известной структуры, как правило, легче сравнивать, чем более крупные белки неизвестной структуры.
В случае отрицательного результата сначала проверьте, что TX-MS обнаружил внутрисвязи, поперечные связи между остатками, которые являются частью одной полипептидной цепи. Если ни один из них не обнаружен, наиболее вероятным объяснением является то, что что-то пошло не так с подготовкой образца или сбором данных. Если множественные ограничения расстояния не поддерживают модели, визуально проверьте модели, чтобы убедиться, что конформация поддерживается сшитыми остатками. Не существует очевидного способа повернуть один из интеракторов, не нарушив хотя бы одну перекрестную связь. Если для данного реагента имеются поперечные ссылки, превышающие допустимое расстояние, попробуйте улучшить моделирование интеракторов путем включения данных о перекрестных связях.
Возможно использование альтернативных программных приложений для достижения эквивалентных результатов при условии, что чувствительность выбранного программного обеспечения сопоставима с чувствительностью TX-MS. Например, существуют онлайн-версии RosettaDock, HADDOCK и другие. Также можно анализировать данные химических сшивок через xQuest/xProphet 5,6, plink7 и SIM-XL26.
Мы постоянно применяем TX-MS и Cheetah-MS к новым проектам 27,28,29, тем самым улучшая отчеты, создаваемые этими подходами, чтобы обеспечить более подробный анализ результатов, не увеличивая отчеты.
The authors have nothing to disclose.
Эта работа была поддержана Фондом Кнута и Алисы Валленберг (грант No 2016.0023) и Швейцарским национальным научным фондом (грант No. P2ZHP3_191289). Кроме того, мы благодарим S3IT, Цюрихский университет, за вычислительную инфраструктуру и техническую поддержку.
Two Protein DataBank files of the proteins of interest. | N/A | N/A | Example files available on txms.org and zenodo.org, DOI 10.5281/zenodo.3361621 |
An mzML data file acquired on a sample where the proteins of interest were crosslinked. | N/A | N/A | Example files available on txms.org or zenodo.org, DOI 10.5281/zenodo.3361621 |