Мы описываем методологию, основанную на диверсификации последовательностей, для оценки аминокислотных предпочтений мультиспецифических сайтов связывания в белок-белковых взаимодействиях (ИПП). В рамках этой стратегии тысячи потенциальных пептидных лигандов генерируются и экранируются in silico, тем самым преодолевая некоторые ограничения доступных экспериментальных методов.
Многие белок-белковые взаимодействия включают связывание коротких белковых сегментов с пептид-связывающими доменами. Обычно такие взаимодействия требуют распознавания линейных мотивов с переменным сохранением. Комбинация высококонсервативных и более вариабельных областей в одних и тех же лигандах часто способствует мультиспецифичности связывания, что является общим свойством ферментов и клеточных сигнальных белков. Характеристика аминокислотных предпочтений пептид-связывающих доменов важна для разработки медиаторов белок-белковых взаимодействий (ИПП). Вычислительные методы являются эффективной альтернативой часто дорогостоящим и громоздким экспериментальным методам, позволяя разрабатывать потенциальные медиаторы, которые впоследствии могут быть проверены в последующих экспериментах. В данной работе мы описали методологию с использованием приложения Pepspec пакета молекулярного моделирования Rosetta для прогнозирования аминокислотных предпочтений пептид-связывающих доменов. Эта методология полезна, когда структура рецепторного белка и природа пептидного лиганда известны или могут быть выведены. Методология начинается с хорошо охарактеризованного якоря из лиганда, который расширяется за счет случайного добавления аминокислотных остатков. Аффинность связывания полученных таким образом пептидов затем оценивается с помощью докинга пептидов гибкого каркаса с целью выбора пептидов с наилучшими прогнозируемыми показателями связывания. Эти пептиды затем используются для расчета аминокислотных предпочтений и для опционального вычисления матрицы позицион-вес (ШИМ), которая может быть использована в дальнейших исследованиях. Чтобы проиллюстрировать применение этой методологии, мы использовали взаимодействие между субъединицами регуляторного фактора интерферона человека 5 (IRF5), ранее известного как мультиспецифичный, но глобально управляемого коротким консервативным мотивом под названием pLxIS. Оцененные предпочтения аминокислот согласуются с предыдущими знаниями о поверхности связывания IRF5. Позиции, занимаемые фосфорилируемыми сериновыми остатками, демонстрировали высокую частоту аспартата и глутамата, вероятно, потому, что их отрицательно заряженные боковые цепи подобны фосфосерину.
Взаимодействие между двумя белками часто включает связывание коротких сегментов аминокислот с пептид-связывающими доменами, напоминающими белок-пептидные границы. Рецепторные белки, участвующие в таких белок-белковых взаимодействиях (ИПП), часто обладают способностью распознавать определенный набор перекрывающихся, но расходящихся последовательностей лигандов, свойство, известное как мультиспецифичность 1,2. Мультиспецифическое распознавание является особенностью многих клеточных белков, но особенно заметно оно проявляется в ферментах и клеточных сигнальных белках3. Белки, взаимодействующие с мультиспецифическими сайтами связывания, часто имеют комбинацию более и менее консервативных областей в своей последовательности 4,5,6. В этом сценарии более консервативные мотивы последовательности вовлечены в строгие молекулярные взаимодействия. И наоборот, более вариабельные последовательности взаимодействуют с каким-то образом разрешающими поверхностями в месте связывания рецептора. Как правило, эти менее консервативные, но все же функционально значимые сегменты представляют собой петли, лишенные определенных структурных паттернов или имеющие еще более динамичные конформации, такие как типичные для внутренне неупорядоченныхбелков.
Идентификация потенциальных пептидных лигандов сайтов связывания обычно является первым шагом в разработке медиаторов, способных интерферировать с соответствующими ИПП8. Тем не менее, часто маловероятно найти один наиболее часто встречающийся аминокислотный остаток в большинстве позиций последовательности в лигандах мультиспецифических сайтов связывания. Вместо этого эти сайты могут иметь особые предпочтения в отношении определенного класса аминокислот в соответствии с их химическими свойствами, например, кислых и отрицательно заряженных аминокислот, таких как аспартат или глутамат, объемных ароматических аминокислот, таких как фенилаланин, или более гидрофобных остатков, таких как алифатические аминокислоты аланин, валин, лейцин или изолейцин3. Несколько экспериментальных методов могут дать представление о аминокислотных предпочтениях сайтов связывания белков, включая направленную эволюцию9, мутагенез мультикодонового сканирования10 и глубокое мутационное сканирование11. Все эти методы основаны на подходе диверсификации последовательностей, который основан на введении мутаций в исходные лиганды и дальнейшем анализе их влияния на функцию рецепторного белка (см. Bratulic and Badran12 для всестороннего обзора). Однако эти методы часто требуют изучения больших библиотек последовательностей, что делает их более громоздкими, дорогостоящими и трудоемкими.
Вычислительные методы для вывода аминокислотных предпочтений мультиспецифических сайтов связывания могут обойти ограничения методов мокрой лаборатории. Среди них подход к диверсификации последовательностей in silico оценивает энергетическое воздействие широкого спектра заменителей аминокислот в последовательности лигандов как способ характеристики структурной пластичности PPI13. Этот метод начинается со структуры или модели пептидного лиганда, связанного с рецепторным сайтом связывания, и впоследствии вводит мутации в последовательность лиганда. Затем статистические функции и функции оценки энергии используются для оценки влияния этих мутаций на стабильность и аффинность связывания. Набор последовательностей лигандов с наилучшей оценкой, полученных в результате фазы оценки, может быть затем использован для вычисления предпочтений аминокислот. Эта стратегия обладает потенциалом для эффективной обработки очень большого числа последовательностей лигандов. Таким образом, он может обеспечить более полный и последовательный вывод о предпочтениях аминокислот по сравнению с теми, которые были вычислены из более ограниченного числа последовательностей, которые обычно могут быть обработаны в подходах к мокрой лаборатории.
Приложение Pepspec пакета молекулярного моделированияRosetta 14 представляет собой инструмент, который выполняет диверсификацию последовательностей в качестве ключевого шага в режиме пептидного проектирования. Для этого требуется структура или модель рецепторного белка со связанным пептидом вплоть до одного аминокислотного остатка в длину, который используется в качестве якоря для следующих шагов. Затем последовательность связанного пептида удлиняют (при необходимости) и диверсифицируют для получения большого числа предполагаемых пептидных лигандов. Аффинность связывания этих пептидов затем оценивается с помощью докинга пептидов гибкого каркаса, чтобы выбрать те из них с наилучшими прогнозируемыми показателями связывания. Несмотря на то, что основным результатом данного применения являются наилучшие пептидные кандидаты, выбранные в конце фазы проектирования, гораздо больший набор пептидов, принятых во время этой фазы, также может быть использован для вычисления аминокислотных предпочтений целевого сайта связывания. Аминокислотные предпочтения вычисляются как частота каждого аминокислотного остатка на позицию лигандной последовательности, представленной либо в виде матрицы веса положения (ШИМ), либо в виде более визуального логотипа последовательности.
В этой статье мы описываем протокол для оценки аминокислотных предпочтений на поверхности связывания рецепторного белка, участвующего в ИПП. Протокол ориентирован на ИПП, в которых линейный сегмент белок-лиганда, как известно, связывается с рецепторным белком, поэтому сценарий может быть смоделирован как граница белок-пептид. В этом сценарии консервативные мотивы лиганда обычно взаимодействуют с определенными карманами в сайте связывания рецептора, хотя весь сегмент лиганда, участвующий в ИПП, может содержать менее консервативные области. Блок-схема, обобщающая основные этапы протокола, показана на рисунке 1. Протокол начинается с 3D-структуры белок-белкового комплекса и далее восстанавливает лигандный белок до потенциально наиболее взаимодействующего сегмента, оставляя рецепторный белок нетронутым. Наиболее взаимодействующий сегмент определяют с помощью сервера15 сканирования аланина BUDE, который проводит компьютерный мутагенез сканирования аланина для идентификации остатков горячих точек между двумя взаимодействующими белками. При таком подходе остатки лиганда по отдельности замещаются аланином, а расчетное изменение свободной энергии или стабильности комплекса (ΔΔG) затем используется для вывода о значимости соответствующего остатка для целевого PPI. После того, как выведен наиболее взаимодействующий сегмент, его комплекс с рецепторным белком используется в качестве базовой структуры, представленной в Pepspec для выполнения диверсификации последовательностей.
Рисунок 1: Обзор основных этапов протокола, предложенных в данной работе. Номера совпадают с номерами шагов в разделе протокола. Рисунки были выполнены с использованием белок-белкового комплекса, используемого в качестве примера, описанного в тексте. В этом комплексе белковая цепь, рассматриваемая как рецептор, показана розовым цветом, в то время как цепь, рассматриваемая как лиганд, показана светло-голубым цветом, а ее прогнозируемый наиболее взаимодействующий сегмент выделен красным. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этой цифры.
Одним из ограничений предлагаемого протокола является требование к разрешенной структуре белок-пептидного интерфейса. В качестве альтернативы протокол может начинаться с моделирования интерфейса белок-пептид-мишень, хотя конкретные этапы моделирования в настоящем документе не описаны. Более того, хотя протокол может быть реализован на персональном компьютере под управлением любой операционной системы, для выполнения шагов, связанных с приложениями Rosetta, требуется среда Linux. Компьютерный кластер также настоятельно рекомендуется для этапа диверсификации последовательностей из-за большого количества итераций, обычно выполняемых Pepspec.
Применение предложенного протокола проиллюстрировано оценкой аминокислотных предпочтений бидинговой поверхности IRF5, входящего в семейство фактора регуляции интерферона человека (IRF). Мы выбрали этот белок в качестве примера, потому что во время его активации две субъединицы связываются, образуя димер, структура которого хорошо охарактеризована16. В димерах IRF связывание может быть смоделировано как граница белок-пептид, в которой одна субъединица обеспечивает поверхность связывания, а другая взаимодействует через область, содержащую короткий консервативный мотив, называемый pLxIS17,18. Кроме того, связывание с субъединицами IRF является мультиспецифичным; Таким образом, они могут образовывать гомодимеры, гетеродимеры и комплексы с другими клеточными белками, известными как коактиваторы18.
В настоящей статье описан протокол оценки аминокислотных предпочтений потенциально мультиспецифических сайтов связывания на основе диверсификации последовательностей in silico. Разработано несколько вычислительных инструментов для оценки аминокислотных предпочтен…
The authors have nothing to disclose.
Выражаем благодарность за финансовую поддержку со стороны Sistema Nacional de Investigación (SNI) (номера грантов SNI-043-2023 и SNI-170-2021), Secretaría Nacional de Ciencia, Tecnología e Innovación (SENACYT) Панамы и Instituto para la Formación y Aprovechamiento de Recursos Humanos (IFARHU). Авторы хотели бы поблагодарить доктора Мигеля Родригеса за тщательное рецензирование рукописи.
BUDE Alanine Scan Server | University of Edinburgh | https://pragmaticproteindesign.bio.ed.ac.uk/balas/ | doi: 10.1021/acschembio.9b00560 |
Rosetta Modeling Software | Rosetta Commons | https://www.rosettacommons.org/software | doi: 10.1002/prot.22851 |
UCSF Chimera | University of California San Francisco | https://www.cgl.ucsf.edu/chimera/ | doi: 10.1002/jcc.20084 |