Summary

Исследование последовательности протеинов-структуры-динамики Отношения с Bio3D-web

Published: July 16, 2017
doi:

Summary

Представлен протокол для онлайн-исследования взаимосвязей структуры-структуры-динамики белка с использованием Bio3D-web.

Abstract

Мы демонстрируем использование Bio3D-web для интерактивного анализа данных биомолекулярной структуры. Веб-приложение Bio3D предоставляет онлайн-функции для: (1) идентификация связанной структуры белка устанавливает пользовательские пороговые значения сходства; (2) их множественное выравнивание и наложение структуры; (3) Анализ сохранения последовательности и структуры; (4) Отображение отношений между конформерами с анализом основных компонент и (5) сравнение предсказанной внутренней динамики с помощью ансамблевого нормального режима анализа. Эта интегрированная функциональность обеспечивает полный интерактивный рабочий процесс для исследования последовательностей-динамических отношений внутри белковых семейств и суперсемейств.

Introduction

В настоящее время банк данных о белках содержит более 120 000 белковых структур, многие из которых имеют одно и то же семейство белков, но разрешаются в разных экспериментальных условиях. Эти множественные структуры представляют собой бесценный ресурс для понимания тонкостей белковой формы и функции. Например, строгое сопоставление этих структурных ансамблей может выявить важные молекулярные механизмы 1 , 2 , 3 и проинформировать о конформационной динамике, связанной с процессами, включая связывание лиганда, ферментативный катализ и бимолекулярное распознавание 4 , 5 , 6 , 7 . Новые подробности могут быть получены из подробного крупномасштабного анализа последовательности, структуры и динамики семейств белков. Однако это, как правило, требует значительного биоинфекцииОпыта в области оргматики и компьютерного программирования, а также знакомство с изучаемыми белковыми системами. Например, программные пакеты, такие как Bio3D, ProDy и Maven, требуют программирования в R, python и Matlab соответственно 8 , 9 , 10 . Напротив, онлайн-инструменты для анализа структурной гибкости обычно ограничиваются исследованием отдельных структур 11 , 12 . Исключением в этом отношении является недавно разработанный сервер WebNM @, который позволяет сравнивать шаблоны гибкости, полученные из анализа нормального режима (NMA) нескольких предварительно настроенных пользовательских структур 13 . Однако на этом сервере отсутствует автоматизированная процедура идентификации структур для сравнения, их выравнивания или дальнейшего анализа за пределами NMA. Еще один недавний вклад – онлайн-база данных PDBFlex, которая представляет собой предварительнуюOmputed анализ структур PDB, разделяющих 95% или более позднюю идентичность 14 . Однако анализ более разнообразных наборов структур в настоящее время недоступен.

Ранее мы представили Bio3D-web – простое в использовании веб-приложение для анализа взаимосвязей между структурой и структурой последовательности белка 15 . Bio3D-web уникален в обеспечении простой в использовании интегрированной функциональности для идентификации, сравнения и детального анализа больших наборов гомологичных структур в Интернете. Здесь мы представляем подробный протокол для онлайн-исследования взаимосвязи структуры и структуры последовательности белка с использованием Bio3D-web. Bio3D-web предоставляет множество функций для поддержки пяти основных этапов анализа данных, показанных на рисунке 1 и подробно обсуждаемых ниже. Эти этапы представляют собой рабочий процесс, который охватывает последовательность запросов или структуру ввода, посредством нескольких уровней последовательности-структуры-динамического анализа, с целью обобщенияВывода. Результаты доступны сразу через обширные средства визуализации и построения графиков в браузере, а также путем загрузки файлов результатов в широко используемых форматах. В дополнение к удобному удобному динамическому интерфейсу для изучения эффектов выбора параметров и методов, Bio3D-web также записывает полный ввод пользователя и последующие графические результаты сеанса пользователя в виде совместного воспроизводимого отчета в форматах PDF, DOC и HTML. Пользовательские сессии могут быть сохранены и перезагружены в будущем, а результаты будут загружены и дополнительно интерпретированы пакетом Bio3D R на локальной машине пользователя.

Bio3D-web питается от Bio3D R-пакета для анализа данных биомолекулярной структуры, последовательности и молекулярного моделирования 8 , 16 . В частности, алгоритмы Bio3D для идентификации жесткого ядра 8 , суперпозиция, анализ основных компонентов(PCA) 8 , и анализ нормального режима ансамбля (eNMA) 16 составляют основу приложения. Мы также используем протоколы Bio3D, которые зависят от pHMMER 17 для идентификации связанных структур белка и MUSCLE 18 для множественного выравнивания последовательностей. Структура и аннотации последовательностей выводятся с помощью утилит Bio3D из баз данных RCSB PDB 19 и PFAM 20 . Bio3D-web можно запустить с нашего онлайн-сервера или установить локально на любом компьютере под управлением R. Bio3D-web открыт для всех пользователей и предоставляется бесплатно по лицензии GPL-3 с открытым исходным кодом: http: // thegrantlab. орг / bio3d / WebApps

Protocol

ПРИМЕЧАНИЕ. Типичная веб-сессия Bio3D проходит через пять последовательных и зависимых шагов (см. Рисунок 1 для схематического представления). Каждый шаг реализуется как последовательная вкладка навигации веб-приложения, а именно SEARCH, ALIGN, FIT, PCA и eNMA. 1. Поиск и выбор структуры (ПОИСК) Структура ввода Получите идентификатор PDB аденилат-киназы (Adk), например, путем поиска PDB [http://www.rcsb.org/pdb]. Альтернативно, получить интересующую аминокислотную последовательность, например, от UniProt [http://uniprot.org]. Введите четырехзначный идентификатор PDB для Adk ( например, 1AKE) или вставьте последовательность белков в текстовое поле на панели «Структура ввода или последовательность». Хит-выбор Нажмите синюю кнопку «Далее» («Хит») на первой панели или просто прокрутите вниз до панели B) «Хит-выбор»Для дальнейшего анализа. Убедитесь, что ползунок «Ограничить общее количество включенных структур» установлен на максимальное значение, чтобы включить все структуры выше отсечки. Опустите «Настроить включение BitScore cutoff», чтобы включить более отдаленные удары или увеличить его, чтобы исключить. Дополнительная фильтрация попадания Нажмите синюю кнопку «Далее» (Хит) на первой панели или просто прокрутите вниз до панели C) «Дополнительная фильтрация связанных структур для дальнейшего анализа». Убедитесь, что выбранные образы представляют собой соответствующие структуры, проверяя детали таблицы, например имя PDB, виды и связанные лиганды. В случае необходимости вручную отредактируйте выбранное подмножество структур, щелкнув строки таблицы. ПРИМЕЧАНИЕ. Строки, выделенные синим цветом, отображают идентификаторы PDB, выбранные для дальнейшего анализа на последующих вкладках. 2, Анализ согласованности нескольких последовательностей (ALIGN) Перейдите на вкладку ALIGN, чтобы выполнить выравнивание последовательности выбранных структур на вкладке SEARCH. Сводка выравнивания Просмотрите сводку выравнивания в панели A) «Сводка выравнивания». Убедитесь, что интересующие области выровнены и не замаскированы пробелами в одной или нескольких структурах. При необходимости переключите «Параметры редактирования выравнивания экрана» и удалите ненужные идентификаторы PDB, например PDB с отсутствующими остатками. Анализ выравнивания последовательности Нажмите синюю кнопку «Далее» (Анализ), чтобы выполнить последовательный анализ кластеров собранных структур. Выберите вариант графика Dendrogram. Настройте кластер на слайдер групп K, чтобы разделить структуры на k групп. При необходимости измените метод кластеризации, если хотите, переключив опцию Больше кластеризации и вывода. </oл> Анализ остаточного остатка Нажмите синюю кнопку «Далее» (Сохранение), чтобы вычислить сохранение остатков столбцов. Выделите наборы выравниваемых структур, чтобы создать график сохранения остатков в каждой позиции выравнивания. Выберите Структуры, выровненные с выравниванием семян PFAM, чтобы показать сохранение, рассчитанное относительно соответствующего выравнивания семян PFAM, содержащего репрезентативных членов семейства. Отображение выравнивания последовательностей Нажмите синюю кнопку «Далее» («Выравнивание»), чтобы отобразить полное выравнивание последовательностей с помощью инструмента визуализации выравнивания в браузере. 3. Структура и анализ структуры (FIT) Выполните наложение структуры, введя вкладку FIT. Наложение структуры Установите флажок «Показать PDB», чтобы визуализировать выровненные протеиN структур в браузере. Убедитесь, что белковые структуры накладываются на соответствующие и соответствующие регионы визуальными осмотрами. Нажмите и перетащите указатель мыши над структурами, чтобы повернуть, и прокрутите для увеличения. Отрегулируйте расцветку структур, нажав «Параметры цвета». Параметры раскраски включают положение выравнивания, структурную изменчивость на позицию, группы кластеров RMSD, группы кластеров последовательностей, выровненные области и вторичную структуру. Загрузите наложенные структуры как обычные файлы PDB или как один файл сеанса PyMOL для визуализации в специализированной программе молекулярного просмотра. Структурный анализ Нажмите синюю кнопку «Далее» (Анализ), чтобы выполнить кластеризацию собранных структур PDB на основе структуры. Переключите RMSD Heatmap в раскрывающемся меню «Параметры графика». Отрегулируйте параметры кластеризации, включая сам метод кластеризации, Переключив флажок «Дополнительные параметры кластеризации и вывода». ПРИМЕЧАНИЕ. Данные Pairwise RMSD также можно визуализировать как дендрограмму, гистограмму или карту тепла. Колебания остатков Нажмите синюю кнопку «Далее» (RMSF), чтобы просмотреть структурную изменчивость каждого остатка (показана как график RMSF) с основными элементами вторичной структуры, показанными в маргинальных областях оси x. Переключить флажок Показать B-факторы, чтобы наложить кристаллографические B-факторы ссылочной структуры на график RMSF. 4. Анализ основных компонентов (PCA) Выполните анализ основных компонентов, введя вкладку «PCA». Визуализация основных компонентов Установите флажок «Показать ПК Траектория», чтобы визуализировать движения, описанные ПК, с помощью средства визуализации в браузере. Убедитесь, что «PrinCipal Component 1 "выбирается из первого выпадающего меню. Чтобы визуализировать движения, описанные другими ПК, выберите нужный ПК из раскрывающегося меню «Выбрать основной компонент». Измените окраску траектории в раскрывающемся меню «Параметры цвета». Выберите «Изменчивость на позицию» в «Параметры цвета» для цвета по величине смещения. Нажмите кнопку «Загрузить траекторию PDB» на панели «Основные компоненты», чтобы получить представление траектории движения, описанного на ПК. Нажмите кнопку «Загрузить PyMOL» файл сеанса, чтобы создать файл сеанса PyMOL, который дает движения в виде векторного поля. Конформный анализ Проецируйте отдельные структуры на два выбранных ПК, нажав на синюю кнопку «Далее» (Сюжет). Убедитесь, что «ПК по оси X» установлен в 1, а «ПК oN Y-axis "до 2. Чтобы проектировать структуры на другие ПК, соответствующим образом отредактируйте нумерацию ПК. Выберите «Cluster by PC Subspace», чтобы покрасить структуры на графике с помощью кластеризации на базе ПК; «RMSD» для цветной «кластеризации на основе RMSD»; И «Последовательность» для окраски с помощью кластеризации на основе последовательности. Нажмите на какие-либо отдельные точки на графике, чтобы маркировать структуры. В качестве альтернативы выделите одну или несколько структур в таблице «Контракторный контур конформатора PCA» ниже графика. Передвиньте ПК в слайдере подпространства, чтобы включить больше / меньше ПК для алгоритма кластеризации. Остатки Рассчитайте вклад остатков на отдельные ПК, нажав синюю кнопку «Далее» (вкладки «Остатки»). Заплатите взносы за дополнительные ПК, включив номер ПК в текстовое поле «Выбрать основной компонент». Переключить «Spread liNes ", избегая компоновки вкладов остатков друг на друга. Переключить флажок «Многострочный график», чтобы отобразить вклады в отдельные графики. Переключите «Показать RMSF», чтобы включить значения RMSF (со вкладки FIT). 5. Анализ нормального режима ансамбля (eNMA) Перейдите на вкладку eNMA, чтобы начать расчет нормальных режимов (NM). Структура фильтра Отрегулируйте количество структур, уменьшив или увеличив «Cutoff» для включения / исключения структуры. Нажмите зеленый «Run Ensemble NMA», чтобы начать расчет NMA. Визуализация нормальных режимов Прокрутите вниз до второй панели вкладки eNMA (визуализация нормальных режимов) для визуализации NM. ПРИМЕЧАНИЕ. По умолчанию NM с наивысшим перекрытием (сходством) с ПК-1 отображается в визуальномIzation. Чтобы визуализировать движения, описанные другими NM или другими структурами PDB, выберите нужный NM и структуру из выпадающих меню «Choose Mode» и «Show NMs for structure» соответственно. Колебания остатков Нажмите синюю кнопку «Далее» (флуктуации), чтобы рассчитать остаточные колебания структур, выбранных для eNMA. Переключите «Cluster by RMSD», чтобы покрасить флуктуационные профили с помощью кластеризации на основе RMSD. Переключите «Cluster by RMSIP», чтобы покрасить флуктуационные профили с помощью кластеризации на основе RMSIP. Переключите флажок «Распределить линии», чтобы разделить сгруппированные флуктуационные профили друг от друга. Сравнение NMA и PCA Нажмите синюю кнопку «Далее» (PCA-vs-NMA), чтобы рассчитать сходство между отдельными NM и ПК. Выберите PDB ID из раскрывающегося меню «Сравнить NMs of structure», чтобы рассчитать сходство между NMs этой структуры и компьютерами, вычисленными на вкладке PCA. Анализ перекрытия Нажмите синюю кнопку «Далее» (анализ перекрытия), чтобы рассчитать перекрытие между рассчитанными ЯМ и вектором разности структур между двумя выбранными структурами. Выберите «ссылочный» идентификатор PDB из выпадающего меню «Сравнить ямы структуры» и / или один или несколько идентификаторов PDB в таблице структуры для парного сравнения с эталонным PDB. Анализ кластеризации Нажмите синюю кнопку « Далее» (кластеризация), чтобы выполнить кластеризацию структуры, основанную на сходстве по нескольким NM (RMSIP).

Representative Results

Аденилат-киназа (Adk) является вездесущим ферментом, который функционирует для поддержания равновесия между цитоплазматическими нуклеотидами, необходимыми для многих клеточных процессов. Adk работает, катализируя обратимый перенос фосфорильной группы из АТФ в AMP. Эта реакция сопровождается хорошо изученными скоростными конформационными переходами 3 , 21 . Здесь мы анализируем все имеющиеся в настоящее время структуры Adk с Bio3D-web, чтобы выявить подробные характеристики и механистические принципы этих существенных переходов. Мы можем начать наш Bio3D-веб-анализ Adk, введя код RCSB PDB любой известной структуры Adk. Например, ввод идентификатора PDB 1AKE в панели A на вкладке SEARCH возвращает 167 аналогичных структур, из которых верхний 26 автоматически выбирается для дальнейшего анализа (см. Панель B). Представленная аннотацияEd на панели C указывает, что эти выбранные структуры все из E. coli были решены с помощью рентгеновской дифракции в диапазоне пространственных групп; Имеют диапазон разрешений от 1,63 до 2,8 Å и сокристаллизовываются с рядом различных лигандов (включая лиганды, AMP, ADP, MG и ингибитор AP5). Обратите внимание, что дополнительные детали аннотации можно отобразить, нажав кнопку «Показать / скрыть столбцы» на панели C. При вводе вкладки ALIGN выполняется выравнивание нескольких последовательностей. Первая панель вкладки ALIGN отображает сводку выравнивания, в которой подробно описывается количество строк последовательности (эквивалентно количеству структур PDB), а также количество позиций ( то есть столбцов выравнивания). Это включает в себя спецификацию количества столбцов с пробелом и без зазора. Рисунок справа от первой строки обеспечивает схематическое изображение выравнивания последовательности. ЗдесьСерые области представляют собой нелокальные позиции, а белые области в выравнивании соответствуют разрыву. Представление сохранения последовательности показано выше выравнивания с красными областями, указывающими хорошо сохраненные позиции, а белый – менее консервативным. Обратите внимание, что последовательности на этом рисунке упорядочены в зависимости от их сходства, предоставляемого кластерирующей дендрограммой с левой стороны. Вторая панель этой вкладки дополнительно облегчает кластеризацию выбранных PDB на основе их сходства по парной последовательности, которые могут быть визуализированы либо в виде дендрограммы, либо в виде тепловой карты. По умолчанию показана дендрограмма (или древовидная диаграмма), представляющая расположение кластеров. Ось оси дендрограммы представляет собой расстояние (в терминах идентичности последовательности) между кластерами. Наложение суперпозиции выполняется автоматически при входе на вкладку FIT. Наложенные структуры, отображаемые интерактивно в панели A, indicaТ. Е. Наличие относительно жесткой области сердцевины (охватывающей остатки 1-29, 68-117 и 161-214, см. Панель «необязательное ядро ​​и RMSD детали» в нижней части вкладки FIT для деталей). Также хорошо видны еще две области с переменным нуклеотидным связыванием (остатки 30-67 и 118-167) ( рисунок 2 ). RMSD-кластеры группируют эти структуры в две различные конформации. Нажатие на вкладке PCA более четко показывает взаимосвязь между структурами с точки зрения смещений этих областей, которые эффективно закрывают связанные связанные нуклеотидные виды в смежных структурах ( рис. 2B и 2C ). Большинство структур находятся в «закрытой» форме (голубой на рисунке 2C ) и связаны с лигандом или ингибитором. Напротив, более «открытые» конформации не содержат нуклеотидов и ингибиторов. Это согласуется сОбширный объем исследований структуры и динамики Adk, указывающий на то, что для нуклеотидного связывания необходима открытая конфигурация этих областей и замкнутая конформация для эффективного переноса фосфорила и подавления вредных событий гидролиза. Примечательно, что один ПК фиксирует 97% общего смещения среднего квадрата в этом наборе структуры Adk и дает четкое и убедительное описание открытого с закрытым переходом вместе с отдельными вкладами вклада в это функциональное смещение (панель C приложения И рис. 2 ). Посещение вкладки NMA и увеличение количества рассмотренных для расчета структур (путем уменьшения отсечки для фильтрации подобных структур) указывает на то, что открытые государственные структуры демонстрируют улучшенную локальную и глобальную динамику по сравнению с структурами закрытой формы ( рисунок 2D и панель приложения C) , Сравнение результатов PCA и NMA дляОтдельные панели (панель D) указывают на то, что первый режим всех структур открытой формы отображает относительно высокое перекрытие с PC1 (со средним значением 0,37 ± 0,04). Напротив, структуры закрытой формы отображают более низкие значения (со средним значением 0,30 ± 0,01). Значения RMSIP для структур открытой формы (0,62 ± 0,003) также выше, чем у закрытых структур (0,56 ± 0,008). Кроме того, анализ перекрытия показывает, что первые моды открытого состояния хорошо согласуются с конформационным изменением, которое описывает разность открытых и закрытых состояний (панель E). Кластеризация на основе значений RMSIP снова отображает последовательное разбиение открытых и закрытых государственных структур (панель F). В совокупности эти результаты указывают на существование двух значительных конформационных состояний для Adk. Они различаются коллективным низкочастотным смещением двух нуклеотидсвязывающих участков участка, которые отображают различные flexibiПри нуклеотидном связывании. Рисунок 1: Обзор Bio3D-web с снимками экрана вкладок PCA и NMA. Bio3D-web использует предоставленную пользователем структуру белка или последовательность в качестве входных данных на вкладке SEARCH ( 1 ). Сервер предоставляет список связанных структур, которые могут быть выбраны для дальнейшего анализа. ( 2 ) Вкладка ALIGN обеспечивает выравнивание последовательности и анализ структур, выбранных на вкладке SEARCH. ( 3 ) На вкладке FIT все структуры накладываются и визуализируются в 3D вместе с результатами традиционного парного анализа структуры. ( 4 ) Анализ основных компонентов набора структур выполняется на вкладке PCA для описания отношений между конформерами. ( 5 ) Анализ нормальной моды для каждой структуры может быть выполнен на вкладке eNMAДля изучения динамических тенденций существующих структурных состояний. Нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка. Рисунок 2: Результаты Bio3D-веб-анализа аденилаткиназы. ( A ) Доступные структуры PDB аденилат киназы, наложенные на идентифицированный инвариантный сердечник. Структуры окрашены в соответствии с кластеризацией на основе RMSD, предусмотренной на вкладке FIT. ( B ) Визуализация основных компонентов доступна на вкладке PCA, чтобы охарактеризовать основные конформационные изменения в наборе данных. Здесь траектория, соответствующая первому главному компоненту, показана в трубном представлении, показывающем крупномасштабное замыкающее движение белка. ( C ) Структуры являются prНаложенные на их две первые главные компоненты на конформерном графике, показывающие низкоразмерное представление конформационной изменчивости. Каждая точка (или структура) окрашена в соответствии с указанными пользователем критериями, в этом случае результаты кластеризации на основе PCA. ( D ) Анализ нормального режима на вкладке eNMA предлагает усиленную локальную и глобальную динамику для структур в открытом состоянии (красный) по сравнению с закрытыми (синими) структурами. Нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

Discussion

Bio3D-web может использоваться для интерактивного изучения и отображения структурных, динамических и функциональных состояний белков из доступных кристаллографических структур. Кроме того, результаты кластеризации на основе NMA и PCA, а также аннотации и анализ, основанный на последовательности, могут быть особенно полезны для выбора репрезентативных структур для более трудоемкого анализа, такого как стыковка небольших молекул молекулы или моделирование молекулярной динамики. Таким образом, Bio3D-web облегчает расширенный анализ структурной биоинформатики для более широкого круга исследователей путем снижения необходимого уровня технической экспертизы. Нынешний дизайн Bio3D-web подчеркивает простоту в отношении исчерпывающего включения многих методов анализа, доступных в полном автономном пакете Bio3D. Во многих случаях предполагается, что исследователи будут использовать Bio3D-web для понимания общих тенденций в их семействе белков или надсемейства, которые могут затем сообщать более специализированные анализы. Bio3D-web – этоРазработанный для быстрого изучения наборов данных биомолекулярной структуры и для работы в качестве инструмента генерации гипотез. Мы поощряем пользователей к дальнейшему изучению их данных, предоставляя пример кода Bio3D в воспроизводимом отчете, который также хранит все данные запроса и результаты анализа.

В представленном выше примере примера мы показываем способность Bio3D-web выявлять структурные особенности функциональных конформационных переходов Adk. Дополнительные приложения Bio3D-web включают структурный и динамический анализ загруженных пользователем структур PDB. Например, пользователь может загружать новые структуры или даже последовательности белка для анализа. Вышеупомянутые этапы анализа, особенно шаг eNMA, могут выявить как локальные, так и глобальные тенденции в движениях белков, причем коллективные движения имеют функциональное значение. Сравнение с структурами апо также может выявить характеристики несвязанных к связанным конформационным переходам. Дополнительные примеры примененияРяд различных семейств белков предоставляется онлайн.

Хотя все белки являются гибкими и динамическими сущностями, не все белки имеют структуры атомного разрешения, доступные в разных состояниях ( например, в активных и неактивных состояниях). Таким образом, наш взгляд на структуру белковой структуры ограничен, и, следовательно, проницательность, полученная из таких инструментов, как Bio3D-web, также ограничена для определенных белков. Однако с нынешними технологическими достижениями и новыми инициативами по структурной геномике представленный здесь протокол будет все чаще становиться важным маршрутом для получения понимания важных структурно-функциональных отношений. Критический шаг, который особенно важен при анализе более отдаленных связанных белков, – это потенциальное появление ошибок выравнивания на вкладке ALIGN. Ошибки выравнивания неизбежно возникают, когда сходство последовательностей падает ниже 30%, и пользователь должен в таких случаях дважды проверять и корректировать выравнивание последовательностиНа вкладке ALIGN. Ошибки выравнивания могут привести к неправильным наложенным структурам на вкладке FIT и маскировать наиболее соответствующие конформационные вариации для последующего СПС. Кроме того, пользователь должен знать о недостатках остатков в выбранных структурах PDB, так как в текущей реализации PCA может выполняться только на остатках белка, в которых все структуры имеют соответствующий углерод-альфа-атом. Следовательно, если выбранный PDB имеет нерешенные остатки для конкретной области белка, эта область будет исключена из PCA.

Bio3D-web в настоящее время ограничивается анализом одноцепочечных структур PDB. Следовательно, функциональные движения, происходящие на четвертичном уровне, не могут быть изучены с использованием текущего протокола. Хотя в настоящее время мы разрабатываем новые алгоритмы для включения такого анализа в Bio3D-web, единственным текущим вариантом является использование обычного Bio3D.

Bio3D-web – единственное онлайн-приложениеКоторый позволяет запрашивать и идентифицировать наборы структур, интерпретировать их закономерности последовательности и структурной изменчивости и извлекать механистическую информацию как из анализа, так и для прогнозирования их структурной пластичности. Широкий спектр инструментов молекулярной визуализации и онлайн-серверов позволяет исследователям исследовать и анализировать отдельные биомолекулярные структуры. Однако существующие инструменты для анализа последовательности, структуры и динамики крупных гетерогенных семейств белков часто требуют значительных вычислительных знаний и обычно остаются доступными только для пользователей с соответствующими навыками программирования. Например, для пакета Bio3D требуется R 8 , для ProDy требуется питон, а Maven требует знания Matlab 9 , 10 . Bio3D-web в отличие от этого не требует знания программирования и, таким образом, увеличивает доступность и уменьшает входной барьер для выполнения расширенной сравнительной последовательности, структуры и dyАнализ динамики. Кроме того, подготовка, сведение, аннотация и очистка молекулярных структур, которые часто необходимы для эффективного анализа, включены в веб-службу Bio3D. Кроме того, ограничение на выполнение такого анализа на способных вычислительных ресурсах облегчается нашим экземпляром сервера, который позволяет широкомасштабный анализ многих структур, которые можно инициировать и контролировать из любого современного веб-браузера.

Открытая разработка Bio3D-сети продолжается (см. Https://bitbucket.org/Grantlab/bio3d). Мы продолжаем добавлять новые функции анализа и улучшать существующие методы. Будущее развитие будет сосредоточено на добавлении PCA на основе пространственной матрицы и крутильных PCA, более широких подходах сохранения последовательности, которые включают филогенетический компонент, идентификацию сайта привязки ансамбля и новые подходы к динамическому сетевому анализу в семействах белков. В этом отношении текущее веб-приложение представляет собой отправную точкуT для многих других совместных структурных процессов биоинформационного анализа, позволяя воспроизводимые и совместно используемые этапы на пользовательских наборах экспериментальных структур. Мы также планируем будущую поддержку восстановленных наборов координат биологических единиц в дополнение к индивидуальным и множественным цепям из асимметричной единицы структур PDB. Дополнительные функции будут включать улучшенную экономию и загрузку совместных рабочих пространств вместе с возможностью отмены.

Bio3D-web – это онлайн-приложение для интерактивного анализа данных о структуре биомолекулярной структуры. Bio3D-web работает в любом современном веб-браузере и обеспечивает функциональность для: (1) идентификация связанной структуры белка устанавливает пользовательские пороговые значения сходства; (2) их множественное выравнивание и наложение структуры; (3) Анализ сохранения последовательности и структуры; (4) Отображение отношений между конформерами с анализом главных компонент и (5) сравнение предсказанной внутренней динамики через ансамбль иМалый режим анализа. Эта интегрированная функциональность обеспечивает полный рабочий процесс для исследования последовательностей-динамических отношений внутри белковых семейств и надсемейств. В дополнение к удобному легкому использованию динамического интерфейса для изучения эффектов выбора параметров и методов, Bio3D-web также записывает полный ввод пользователя и последующие графические результаты сеанса пользователя. Это позволяет пользователям легко делиться и воспроизводить последовательность шагов анализа, которые создали их результаты. Bio3D-web полностью реализован на языке R и основан на пакетах Bio3D и Shiny R. Его можно запустить с нашего онлайн-сервера или установить локально на любом компьютере под управлением R. Это включает установку локального сервера, чтобы предоставить настраиваемому экземпляру нескольких пользователей доступ к приоритетным структурным наборам данных, таким как распространенные в фармацевтической промышленности. Полный исходный код и обширная документация предоставляются по лицензии GPL-3 с открытым исходным кодом: http://thegrantlab.org/ Bio3d / WebApps

Disclosures

The authors have nothing to disclose.

Acknowledgements

Мы благодарим доктора Гвидо Скарабелли и Хонгьяна Ли за всестороннее тестирование на протяжении всего развития, а также сообщество пользователей Bio3D и участников семинара по структурной биоинформатике Университета Бергена за отзывы и комментарии, которые улучшили это приложение.

Materials

Bio3D-web
Web-site http://thegrantlab.org/bio3d-web/
Requirements Web browser

References

  1. Kornev, A. P., Taylor, S. S. Dynamics-Driven Allostery in Protein Kinases. Trends Biochem. Sci. 40 (11), 628-647 (2015).
  2. Yao, X. -. Q., Grant, B. J. Domain-opening and dynamic coupling in the α-subunit of heterotrimeric G proteins. Biophys. J. 105 (2), L08-L10 (2013).
  3. Henzler-Wildman, K. A., et al. Intrinsic motions along an enzymatic reaction trajectory. Nature. 450 (7171), 838-844 (2007).
  4. Boehr, D., Nussinov, R., Wright, P. The role of dynamic conformational ensembles in biomolecular recognition. Nat. Chem. Biol. 5 (11), 789-796 (2009).
  5. Teilum, K., Olsen, J. G., Kragelund, B. B. Functional aspects of protein flexibility. Cell Mol Life Sci. 66 (14), 2231-2247 (2009).
  6. Henzler-Wildman, K., Kern, D. Dynamic personalities of proteins. Nature. 450 (7172), 964-972 (2007).
  7. Grant, B. J., Gorfe, A. A., McCammon, J. A. Large conformational changes in proteins: signaling and other functions. Curr. Opin. Struct. Biol. 20 (2), 142-147 (2010).
  8. Grant, B. J., Rodrigues, A. P. C., ElSawy, K. M., McCammon, J. A., Caves, L. S. D. Bio3d: an R package for the comparative analysis of protein structures. Bioinformatics. 22 (21), 2695-2696 (2006).
  9. Bakan, A., Meireles, L. M., Bahar, I. ProDy: protein dynamics inferred from theory and experiments. Bioinformatics. 27 (11), 1575-1577 (2011).
  10. Zimmermann, M. T., Kloczkowski, A., Jernigan, R. L. MAVENs: motion analysis and visualization of elastic networks and structural ensembles. BMC Bioinformatics. 12 (1), 264 (2011).
  11. Yang, L. -. W., et al. oGNM: online computation of structural dynamics using the Gaussian Network Model. Nucleic Acids Res. 34, 24-31 (2006).
  12. Suhre, K., Sanejouand, Y. -. H. ElNemo: a normal mode web server for protein movement analysis and the generation of templates for molecular replacement. Nucleic Acids Res. 32, W610-W614 (2004).
  13. Tiwari, S. P., et al. WEBnm@ v2.0: Web server and services for comparing protein flexibility. BMC Bioinformatics. 15 (1), 427 (2014).
  14. Hrabe, T., et al. PDBFlex: exploring flexibility in protein structures. Nucleic Acids Res. 44, D423-D428 (2016).
  15. Skjærven, L., Jariwala, S., Yao, X. -. Q., Grant, B. J. Online interactive analysis of protein structure ensembles with Bio3D-web. Bioinformatics. , (2016).
  16. Skjærven, L., Yao, X., Scarabelli, G., Grant, B. J. Integrating protein structural dynamics and evolutionary analysis with Bio3D. BMC Bioinformatics. 15 (399), 1-11 (2014).
  17. Eddy, S. R. Accelerated Profile HMM Searches. PLoS Comput. Biol. 7 (10), (2011).
  18. Edgar, R. C. MUSCLE: multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Res. 32 (5), 1792-1797 (2004).
  19. Berman, H. M. The Protein Data Bank. Nucleic Acids Res. 28 (1), 235-242 (2000).
  20. Finn, R. D., et al. Pfam: the protein families database. Nucleic Acids Res. 42, D222-D230 (2014).
  21. Kerns, S. J., et al. The energy landscape of adenylate kinase during catalysis. Nat. Struct. Mol. Biol. 22 (2), 124-131 (2015).

Play Video

Cite This Article
Jariwala, S., Skjærven, L., Yao, X., Grant, B. J. Investigating Protein Sequence-structure-dynamics Relationships with Bio3D-web. J. Vis. Exp. (125), e55640, doi:10.3791/55640 (2017).

View Video