Представлен протокол для онлайн-исследования взаимосвязей структуры-структуры-динамики белка с использованием Bio3D-web.
Мы демонстрируем использование Bio3D-web для интерактивного анализа данных биомолекулярной структуры. Веб-приложение Bio3D предоставляет онлайн-функции для: (1) идентификация связанной структуры белка устанавливает пользовательские пороговые значения сходства; (2) их множественное выравнивание и наложение структуры; (3) Анализ сохранения последовательности и структуры; (4) Отображение отношений между конформерами с анализом основных компонент и (5) сравнение предсказанной внутренней динамики с помощью ансамблевого нормального режима анализа. Эта интегрированная функциональность обеспечивает полный интерактивный рабочий процесс для исследования последовательностей-динамических отношений внутри белковых семейств и суперсемейств.
В настоящее время банк данных о белках содержит более 120 000 белковых структур, многие из которых имеют одно и то же семейство белков, но разрешаются в разных экспериментальных условиях. Эти множественные структуры представляют собой бесценный ресурс для понимания тонкостей белковой формы и функции. Например, строгое сопоставление этих структурных ансамблей может выявить важные молекулярные механизмы 1 , 2 , 3 и проинформировать о конформационной динамике, связанной с процессами, включая связывание лиганда, ферментативный катализ и бимолекулярное распознавание 4 , 5 , 6 , 7 . Новые подробности могут быть получены из подробного крупномасштабного анализа последовательности, структуры и динамики семейств белков. Однако это, как правило, требует значительного биоинфекцииОпыта в области оргматики и компьютерного программирования, а также знакомство с изучаемыми белковыми системами. Например, программные пакеты, такие как Bio3D, ProDy и Maven, требуют программирования в R, python и Matlab соответственно 8 , 9 , 10 . Напротив, онлайн-инструменты для анализа структурной гибкости обычно ограничиваются исследованием отдельных структур 11 , 12 . Исключением в этом отношении является недавно разработанный сервер WebNM @, который позволяет сравнивать шаблоны гибкости, полученные из анализа нормального режима (NMA) нескольких предварительно настроенных пользовательских структур 13 . Однако на этом сервере отсутствует автоматизированная процедура идентификации структур для сравнения, их выравнивания или дальнейшего анализа за пределами NMA. Еще один недавний вклад – онлайн-база данных PDBFlex, которая представляет собой предварительнуюOmputed анализ структур PDB, разделяющих 95% или более позднюю идентичность 14 . Однако анализ более разнообразных наборов структур в настоящее время недоступен.
Ранее мы представили Bio3D-web – простое в использовании веб-приложение для анализа взаимосвязей между структурой и структурой последовательности белка 15 . Bio3D-web уникален в обеспечении простой в использовании интегрированной функциональности для идентификации, сравнения и детального анализа больших наборов гомологичных структур в Интернете. Здесь мы представляем подробный протокол для онлайн-исследования взаимосвязи структуры и структуры последовательности белка с использованием Bio3D-web. Bio3D-web предоставляет множество функций для поддержки пяти основных этапов анализа данных, показанных на рисунке 1 и подробно обсуждаемых ниже. Эти этапы представляют собой рабочий процесс, который охватывает последовательность запросов или структуру ввода, посредством нескольких уровней последовательности-структуры-динамического анализа, с целью обобщенияВывода. Результаты доступны сразу через обширные средства визуализации и построения графиков в браузере, а также путем загрузки файлов результатов в широко используемых форматах. В дополнение к удобному удобному динамическому интерфейсу для изучения эффектов выбора параметров и методов, Bio3D-web также записывает полный ввод пользователя и последующие графические результаты сеанса пользователя в виде совместного воспроизводимого отчета в форматах PDF, DOC и HTML. Пользовательские сессии могут быть сохранены и перезагружены в будущем, а результаты будут загружены и дополнительно интерпретированы пакетом Bio3D R на локальной машине пользователя.
Bio3D-web питается от Bio3D R-пакета для анализа данных биомолекулярной структуры, последовательности и молекулярного моделирования 8 , 16 . В частности, алгоритмы Bio3D для идентификации жесткого ядра 8 , суперпозиция, анализ основных компонентов(PCA) 8 , и анализ нормального режима ансамбля (eNMA) 16 составляют основу приложения. Мы также используем протоколы Bio3D, которые зависят от pHMMER 17 для идентификации связанных структур белка и MUSCLE 18 для множественного выравнивания последовательностей. Структура и аннотации последовательностей выводятся с помощью утилит Bio3D из баз данных RCSB PDB 19 и PFAM 20 . Bio3D-web можно запустить с нашего онлайн-сервера или установить локально на любом компьютере под управлением R. Bio3D-web открыт для всех пользователей и предоставляется бесплатно по лицензии GPL-3 с открытым исходным кодом: http: // thegrantlab. орг / bio3d / WebApps
Bio3D-web может использоваться для интерактивного изучения и отображения структурных, динамических и функциональных состояний белков из доступных кристаллографических структур. Кроме того, результаты кластеризации на основе NMA и PCA, а также аннотации и анализ, основанный на последовательности, могут быть особенно полезны для выбора репрезентативных структур для более трудоемкого анализа, такого как стыковка небольших молекул молекулы или моделирование молекулярной динамики. Таким образом, Bio3D-web облегчает расширенный анализ структурной биоинформатики для более широкого круга исследователей путем снижения необходимого уровня технической экспертизы. Нынешний дизайн Bio3D-web подчеркивает простоту в отношении исчерпывающего включения многих методов анализа, доступных в полном автономном пакете Bio3D. Во многих случаях предполагается, что исследователи будут использовать Bio3D-web для понимания общих тенденций в их семействе белков или надсемейства, которые могут затем сообщать более специализированные анализы. Bio3D-web – этоРазработанный для быстрого изучения наборов данных биомолекулярной структуры и для работы в качестве инструмента генерации гипотез. Мы поощряем пользователей к дальнейшему изучению их данных, предоставляя пример кода Bio3D в воспроизводимом отчете, который также хранит все данные запроса и результаты анализа.
В представленном выше примере примера мы показываем способность Bio3D-web выявлять структурные особенности функциональных конформационных переходов Adk. Дополнительные приложения Bio3D-web включают структурный и динамический анализ загруженных пользователем структур PDB. Например, пользователь может загружать новые структуры или даже последовательности белка для анализа. Вышеупомянутые этапы анализа, особенно шаг eNMA, могут выявить как локальные, так и глобальные тенденции в движениях белков, причем коллективные движения имеют функциональное значение. Сравнение с структурами апо также может выявить характеристики несвязанных к связанным конформационным переходам. Дополнительные примеры примененияРяд различных семейств белков предоставляется онлайн.
Хотя все белки являются гибкими и динамическими сущностями, не все белки имеют структуры атомного разрешения, доступные в разных состояниях ( например, в активных и неактивных состояниях). Таким образом, наш взгляд на структуру белковой структуры ограничен, и, следовательно, проницательность, полученная из таких инструментов, как Bio3D-web, также ограничена для определенных белков. Однако с нынешними технологическими достижениями и новыми инициативами по структурной геномике представленный здесь протокол будет все чаще становиться важным маршрутом для получения понимания важных структурно-функциональных отношений. Критический шаг, который особенно важен при анализе более отдаленных связанных белков, – это потенциальное появление ошибок выравнивания на вкладке ALIGN. Ошибки выравнивания неизбежно возникают, когда сходство последовательностей падает ниже 30%, и пользователь должен в таких случаях дважды проверять и корректировать выравнивание последовательностиНа вкладке ALIGN. Ошибки выравнивания могут привести к неправильным наложенным структурам на вкладке FIT и маскировать наиболее соответствующие конформационные вариации для последующего СПС. Кроме того, пользователь должен знать о недостатках остатков в выбранных структурах PDB, так как в текущей реализации PCA может выполняться только на остатках белка, в которых все структуры имеют соответствующий углерод-альфа-атом. Следовательно, если выбранный PDB имеет нерешенные остатки для конкретной области белка, эта область будет исключена из PCA.
Bio3D-web в настоящее время ограничивается анализом одноцепочечных структур PDB. Следовательно, функциональные движения, происходящие на четвертичном уровне, не могут быть изучены с использованием текущего протокола. Хотя в настоящее время мы разрабатываем новые алгоритмы для включения такого анализа в Bio3D-web, единственным текущим вариантом является использование обычного Bio3D.
Bio3D-web – единственное онлайн-приложениеКоторый позволяет запрашивать и идентифицировать наборы структур, интерпретировать их закономерности последовательности и структурной изменчивости и извлекать механистическую информацию как из анализа, так и для прогнозирования их структурной пластичности. Широкий спектр инструментов молекулярной визуализации и онлайн-серверов позволяет исследователям исследовать и анализировать отдельные биомолекулярные структуры. Однако существующие инструменты для анализа последовательности, структуры и динамики крупных гетерогенных семейств белков часто требуют значительных вычислительных знаний и обычно остаются доступными только для пользователей с соответствующими навыками программирования. Например, для пакета Bio3D требуется R 8 , для ProDy требуется питон, а Maven требует знания Matlab 9 , 10 . Bio3D-web в отличие от этого не требует знания программирования и, таким образом, увеличивает доступность и уменьшает входной барьер для выполнения расширенной сравнительной последовательности, структуры и dyАнализ динамики. Кроме того, подготовка, сведение, аннотация и очистка молекулярных структур, которые часто необходимы для эффективного анализа, включены в веб-службу Bio3D. Кроме того, ограничение на выполнение такого анализа на способных вычислительных ресурсах облегчается нашим экземпляром сервера, который позволяет широкомасштабный анализ многих структур, которые можно инициировать и контролировать из любого современного веб-браузера.
Открытая разработка Bio3D-сети продолжается (см. Https://bitbucket.org/Grantlab/bio3d). Мы продолжаем добавлять новые функции анализа и улучшать существующие методы. Будущее развитие будет сосредоточено на добавлении PCA на основе пространственной матрицы и крутильных PCA, более широких подходах сохранения последовательности, которые включают филогенетический компонент, идентификацию сайта привязки ансамбля и новые подходы к динамическому сетевому анализу в семействах белков. В этом отношении текущее веб-приложение представляет собой отправную точкуT для многих других совместных структурных процессов биоинформационного анализа, позволяя воспроизводимые и совместно используемые этапы на пользовательских наборах экспериментальных структур. Мы также планируем будущую поддержку восстановленных наборов координат биологических единиц в дополнение к индивидуальным и множественным цепям из асимметричной единицы структур PDB. Дополнительные функции будут включать улучшенную экономию и загрузку совместных рабочих пространств вместе с возможностью отмены.
Bio3D-web – это онлайн-приложение для интерактивного анализа данных о структуре биомолекулярной структуры. Bio3D-web работает в любом современном веб-браузере и обеспечивает функциональность для: (1) идентификация связанной структуры белка устанавливает пользовательские пороговые значения сходства; (2) их множественное выравнивание и наложение структуры; (3) Анализ сохранения последовательности и структуры; (4) Отображение отношений между конформерами с анализом главных компонент и (5) сравнение предсказанной внутренней динамики через ансамбль иМалый режим анализа. Эта интегрированная функциональность обеспечивает полный рабочий процесс для исследования последовательностей-динамических отношений внутри белковых семейств и надсемейств. В дополнение к удобному легкому использованию динамического интерфейса для изучения эффектов выбора параметров и методов, Bio3D-web также записывает полный ввод пользователя и последующие графические результаты сеанса пользователя. Это позволяет пользователям легко делиться и воспроизводить последовательность шагов анализа, которые создали их результаты. Bio3D-web полностью реализован на языке R и основан на пакетах Bio3D и Shiny R. Его можно запустить с нашего онлайн-сервера или установить локально на любом компьютере под управлением R. Это включает установку локального сервера, чтобы предоставить настраиваемому экземпляру нескольких пользователей доступ к приоритетным структурным наборам данных, таким как распространенные в фармацевтической промышленности. Полный исходный код и обширная документация предоставляются по лицензии GPL-3 с открытым исходным кодом: http://thegrantlab.org/ Bio3d / WebApps
The authors have nothing to disclose.
Мы благодарим доктора Гвидо Скарабелли и Хонгьяна Ли за всестороннее тестирование на протяжении всего развития, а также сообщество пользователей Bio3D и участников семинара по структурной биоинформатике Университета Бергена за отзывы и комментарии, которые улучшили это приложение.
Bio3D-web | |||
Web-site | http://thegrantlab.org/bio3d-web/ | ||
Requirements | Web browser |