Summary

Вычислительное прогнозирование аминокислотных предпочтений потенциально мультиспецифических пептид-связывающих доменов, участвующих в белок-белковых взаимодействиях

Published: January 26, 2024
doi:

Summary

Мы описываем методологию, основанную на диверсификации последовательностей, для оценки аминокислотных предпочтений мультиспецифических сайтов связывания в белок-белковых взаимодействиях (ИПП). В рамках этой стратегии тысячи потенциальных пептидных лигандов генерируются и экранируются in silico, тем самым преодолевая некоторые ограничения доступных экспериментальных методов.

Abstract

Многие белок-белковые взаимодействия включают связывание коротких белковых сегментов с пептид-связывающими доменами. Обычно такие взаимодействия требуют распознавания линейных мотивов с переменным сохранением. Комбинация высококонсервативных и более вариабельных областей в одних и тех же лигандах часто способствует мультиспецифичности связывания, что является общим свойством ферментов и клеточных сигнальных белков. Характеристика аминокислотных предпочтений пептид-связывающих доменов важна для разработки медиаторов белок-белковых взаимодействий (ИПП). Вычислительные методы являются эффективной альтернативой часто дорогостоящим и громоздким экспериментальным методам, позволяя разрабатывать потенциальные медиаторы, которые впоследствии могут быть проверены в последующих экспериментах. В данной работе мы описали методологию с использованием приложения Pepspec пакета молекулярного моделирования Rosetta для прогнозирования аминокислотных предпочтений пептид-связывающих доменов. Эта методология полезна, когда структура рецепторного белка и природа пептидного лиганда известны или могут быть выведены. Методология начинается с хорошо охарактеризованного якоря из лиганда, который расширяется за счет случайного добавления аминокислотных остатков. Аффинность связывания полученных таким образом пептидов затем оценивается с помощью докинга пептидов гибкого каркаса с целью выбора пептидов с наилучшими прогнозируемыми показателями связывания. Эти пептиды затем используются для расчета аминокислотных предпочтений и для опционального вычисления матрицы позицион-вес (ШИМ), которая может быть использована в дальнейших исследованиях. Чтобы проиллюстрировать применение этой методологии, мы использовали взаимодействие между субъединицами регуляторного фактора интерферона человека 5 (IRF5), ранее известного как мультиспецифичный, но глобально управляемого коротким консервативным мотивом под названием pLxIS. Оцененные предпочтения аминокислот согласуются с предыдущими знаниями о поверхности связывания IRF5. Позиции, занимаемые фосфорилируемыми сериновыми остатками, демонстрировали высокую частоту аспартата и глутамата, вероятно, потому, что их отрицательно заряженные боковые цепи подобны фосфосерину.

Introduction

Взаимодействие между двумя белками часто включает связывание коротких сегментов аминокислот с пептид-связывающими доменами, напоминающими белок-пептидные границы. Рецепторные белки, участвующие в таких белок-белковых взаимодействиях (ИПП), часто обладают способностью распознавать определенный набор перекрывающихся, но расходящихся последовательностей лигандов, свойство, известное как мультиспецифичность 1,2. Мультиспецифическое распознавание является особенностью многих клеточных белков, но особенно заметно оно проявляется в ферментах и клеточных сигнальных белках3. Белки, взаимодействующие с мультиспецифическими сайтами связывания, часто имеют комбинацию более и менее консервативных областей в своей последовательности 4,5,6. В этом сценарии более консервативные мотивы последовательности вовлечены в строгие молекулярные взаимодействия. И наоборот, более вариабельные последовательности взаимодействуют с каким-то образом разрешающими поверхностями в месте связывания рецептора. Как правило, эти менее консервативные, но все же функционально значимые сегменты представляют собой петли, лишенные определенных структурных паттернов или имеющие еще более динамичные конформации, такие как типичные для внутренне неупорядоченныхбелков.

Идентификация потенциальных пептидных лигандов сайтов связывания обычно является первым шагом в разработке медиаторов, способных интерферировать с соответствующими ИПП8. Тем не менее, часто маловероятно найти один наиболее часто встречающийся аминокислотный остаток в большинстве позиций последовательности в лигандах мультиспецифических сайтов связывания. Вместо этого эти сайты могут иметь особые предпочтения в отношении определенного класса аминокислот в соответствии с их химическими свойствами, например, кислых и отрицательно заряженных аминокислот, таких как аспартат или глутамат, объемных ароматических аминокислот, таких как фенилаланин, или более гидрофобных остатков, таких как алифатические аминокислоты аланин, валин, лейцин или изолейцин3. Несколько экспериментальных методов могут дать представление о аминокислотных предпочтениях сайтов связывания белков, включая направленную эволюцию9, мутагенез мультикодонового сканирования10 и глубокое мутационное сканирование11. Все эти методы основаны на подходе диверсификации последовательностей, который основан на введении мутаций в исходные лиганды и дальнейшем анализе их влияния на функцию рецепторного белка (см. Bratulic and Badran12 для всестороннего обзора). Однако эти методы часто требуют изучения больших библиотек последовательностей, что делает их более громоздкими, дорогостоящими и трудоемкими.

Вычислительные методы для вывода аминокислотных предпочтений мультиспецифических сайтов связывания могут обойти ограничения методов мокрой лаборатории. Среди них подход к диверсификации последовательностей in silico оценивает энергетическое воздействие широкого спектра заменителей аминокислот в последовательности лигандов как способ характеристики структурной пластичности PPI13. Этот метод начинается со структуры или модели пептидного лиганда, связанного с рецепторным сайтом связывания, и впоследствии вводит мутации в последовательность лиганда. Затем статистические функции и функции оценки энергии используются для оценки влияния этих мутаций на стабильность и аффинность связывания. Набор последовательностей лигандов с наилучшей оценкой, полученных в результате фазы оценки, может быть затем использован для вычисления предпочтений аминокислот. Эта стратегия обладает потенциалом для эффективной обработки очень большого числа последовательностей лигандов. Таким образом, он может обеспечить более полный и последовательный вывод о предпочтениях аминокислот по сравнению с теми, которые были вычислены из более ограниченного числа последовательностей, которые обычно могут быть обработаны в подходах к мокрой лаборатории.

Приложение Pepspec пакета молекулярного моделированияRosetta 14 представляет собой инструмент, который выполняет диверсификацию последовательностей в качестве ключевого шага в режиме пептидного проектирования. Для этого требуется структура или модель рецепторного белка со связанным пептидом вплоть до одного аминокислотного остатка в длину, который используется в качестве якоря для следующих шагов. Затем последовательность связанного пептида удлиняют (при необходимости) и диверсифицируют для получения большого числа предполагаемых пептидных лигандов. Аффинность связывания этих пептидов затем оценивается с помощью докинга пептидов гибкого каркаса, чтобы выбрать те из них с наилучшими прогнозируемыми показателями связывания. Несмотря на то, что основным результатом данного применения являются наилучшие пептидные кандидаты, выбранные в конце фазы проектирования, гораздо больший набор пептидов, принятых во время этой фазы, также может быть использован для вычисления аминокислотных предпочтений целевого сайта связывания. Аминокислотные предпочтения вычисляются как частота каждого аминокислотного остатка на позицию лигандной последовательности, представленной либо в виде матрицы веса положения (ШИМ), либо в виде более визуального логотипа последовательности.

В этой статье мы описываем протокол для оценки аминокислотных предпочтений на поверхности связывания рецепторного белка, участвующего в ИПП. Протокол ориентирован на ИПП, в которых линейный сегмент белок-лиганда, как известно, связывается с рецепторным белком, поэтому сценарий может быть смоделирован как граница белок-пептид. В этом сценарии консервативные мотивы лиганда обычно взаимодействуют с определенными карманами в сайте связывания рецептора, хотя весь сегмент лиганда, участвующий в ИПП, может содержать менее консервативные области. Блок-схема, обобщающая основные этапы протокола, показана на рисунке 1. Протокол начинается с 3D-структуры белок-белкового комплекса и далее восстанавливает лигандный белок до потенциально наиболее взаимодействующего сегмента, оставляя рецепторный белок нетронутым. Наиболее взаимодействующий сегмент определяют с помощью сервера15 сканирования аланина BUDE, который проводит компьютерный мутагенез сканирования аланина для идентификации остатков горячих точек между двумя взаимодействующими белками. При таком подходе остатки лиганда по отдельности замещаются аланином, а расчетное изменение свободной энергии или стабильности комплекса (ΔΔG) затем используется для вывода о значимости соответствующего остатка для целевого PPI. После того, как выведен наиболее взаимодействующий сегмент, его комплекс с рецепторным белком используется в качестве базовой структуры, представленной в Pepspec для выполнения диверсификации последовательностей.

Figure 1
Рисунок 1: Обзор основных этапов протокола, предложенных в данной работе. Номера совпадают с номерами шагов в разделе протокола. Рисунки были выполнены с использованием белок-белкового комплекса, используемого в качестве примера, описанного в тексте. В этом комплексе белковая цепь, рассматриваемая как рецептор, показана розовым цветом, в то время как цепь, рассматриваемая как лиганд, показана светло-голубым цветом, а ее прогнозируемый наиболее взаимодействующий сегмент выделен красным. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этой цифры.

Одним из ограничений предлагаемого протокола является требование к разрешенной структуре белок-пептидного интерфейса. В качестве альтернативы протокол может начинаться с моделирования интерфейса белок-пептид-мишень, хотя конкретные этапы моделирования в настоящем документе не описаны. Более того, хотя протокол может быть реализован на персональном компьютере под управлением любой операционной системы, для выполнения шагов, связанных с приложениями Rosetta, требуется среда Linux. Компьютерный кластер также настоятельно рекомендуется для этапа диверсификации последовательностей из-за большого количества итераций, обычно выполняемых Pepspec.

Применение предложенного протокола проиллюстрировано оценкой аминокислотных предпочтений бидинговой поверхности IRF5, входящего в семейство фактора регуляции интерферона человека (IRF). Мы выбрали этот белок в качестве примера, потому что во время его активации две субъединицы связываются, образуя димер, структура которого хорошо охарактеризована16. В димерах IRF связывание может быть смоделировано как граница белок-пептид, в которой одна субъединица обеспечивает поверхность связывания, а другая взаимодействует через область, содержащую короткий консервативный мотив, называемый pLxIS17,18. Кроме того, связывание с субъединицами IRF является мультиспецифичным; Таким образом, они могут образовывать гомодимеры, гетеродимеры и комплексы с другими клеточными белками, известными как коактиваторы18.

Protocol

1. Начальная подготовка белок-пептидной границы раздела Скачивание структуры белок-белкового комплексаПерейдите на домашнюю страницу Protein Data Bank (PDB) (https://www.rcsb.org/) и введите PDB ID для структуры белок-белкового комплекса в главном окне поиска (<strong class="xfig…

Representative Results

В этой статье мы описали протокол для прогнозирования аминокислотных предпочтений на поверхности связывания IRF5, члена семейства транскрипционных факторов, известных как регуляторные факторы интерферона человека. Эти белки являются регуляторами врожденных и адапт?…

Discussion

В настоящей статье описан протокол оценки аминокислотных предпочтений потенциально мультиспецифических сайтов связывания на основе диверсификации последовательностей in silico. Разработано несколько вычислительных инструментов для оценки аминокислотных предпочтен…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Выражаем благодарность за финансовую поддержку со стороны Sistema Nacional de Investigación (SNI) (номера грантов SNI-043-2023 и SNI-170-2021), Secretaría Nacional de Ciencia, Tecnología e Innovación (SENACYT) Панамы и Instituto para la Formación y Aprovechamiento de Recursos Humanos (IFARHU). Авторы хотели бы поблагодарить доктора Мигеля Родригеса за тщательное рецензирование рукописи.

Materials

BUDE Alanine Scan Server University of Edinburgh https://pragmaticproteindesign.bio.ed.ac.uk/balas/ doi: 10.1021/acschembio.9b00560
Rosetta Modeling Software Rosetta Commons https://www.rosettacommons.org/software doi: 10.1002/prot.22851
UCSF Chimera University of California San Francisco https://www.cgl.ucsf.edu/chimera/ doi: 10.1002/jcc.20084

References

  1. Kim, P. M., Lu, L. J., Xia, Y., Gerstein, M. B. Relating three-dimensional structures to protein networks provides evolutionary insights. Science. 314 (5807), 1938-1941 (2006).
  2. Schreiber, G., Keating, A. E. Protein binding specificity versus promiscuity. Current Opinion in Structural Biology. 21 (1), 50-61 (2011).
  3. Erijman, A., Aizner, Y., Shifman, J. M. Multispecific recognition: Mechanism, evolution, and design. Biochemistry. 50 (5), 602-611 (2011).
  4. Fromer, M., Shifman, J. M. Tradeoff between stability and multispecificity in the design of promiscuous proteins. PLoS Computational Biology. 5 (12), e1000627 (2009).
  5. Xie, T., Zmyslowski, A. M., Zhang, Y., Radhakrishnan, I. Structural basis for multispecificity of MRG domains. Structure. 23 (6), 1049-1057 (2015).
  6. Hendler, A., et al. Human SIRT1 multispecificity is modulated by active-site vicinity substitutions during natural evolution. Molecular Biology and Evolution. 38 (2), 545-556 (2021).
  7. Teilum, K., Olsen, J. G., Kragelund, B. B. On the specificity of protein-protein interactions in the context of disorder. The Biochemical Journal. 478 (11), 2035-2050 (2021).
  8. Pelay-Gimeno, M., Glas, A., Koch, O., Grossmann, T. N. Structure-based design of inhibitors of protein-protein interactions: Mimicking peptide binding epitopes. Angewandte Chemie (International ed. in English). 54 (31), 8896-8927 (2015).
  9. Wang, Y., Xue, P., Cao, M., Yu, T., Lane, S. T., Zhao, H. Directed evolution: Methodologies and applications. Chemical Reviews. 121 (20), 12384-12444 (2021).
  10. Liu, J., Cropp, T. A. Rational protein sequence diversification by multi-codon scanning mutagenesis. Methods in Molecular Biology. 978, 217-228 (2013).
  11. Wei, H., Li, X. Deep mutational scanning: A versatile tool in systematically mapping genotypes to phenotypes. Frontiers in Genetics. 14, 1087267 (2023).
  12. Bratulic, S., Badran, A. H. Modern methods for laboratory diversification of biomolecules. Current Opinion in Chemical Biology. 41, 50-60 (2017).
  13. Humphris, E. L., Kortemme, T. Prediction of protein-protein interface sequence diversity using flexible backbone computational protein design. Structure. 16 (12), 1777-1788 (2008).
  14. King, C. A., Bradley, P. Structure-based prediction of protein-peptide specificity in Rosetta. Proteins. 78 (16), 3437-3449 (2010).
  15. Ibarra, A. A., et al. Predicting and experimentally validating hot-spot residues at protein-protein interfaces. ACS Chemical Biology. 14 (10), 2252-2263 (2019).
  16. Chen, W., Srinath, H., Lam, S. S., Schiffer, C. A., Royer, W. E., Lin, K. Contribution of Ser386 and Ser396 to activation of interferon regulatory factor 3. Journal of Molecular Biology. 379 (2), 251-260 (2008).
  17. Mancino, A., Natoli, G. Specificity and function of IRF family transcription factors: Insights from genomics. Journal of Interferon & Cytokine Research. 36 (7), 462-469 (2016).
  18. Schwanke, H., Stempel, M., Brinkmann, M. M. Of keeping and tipping the balance: Host regulation and viral modulation of IRF3-dependent IFNB1 expression. Viruses. 12 (7), 33 (2020).
  19. Chen, W., et al. Insights into interferon regulatory factor activation from the crystal structure of dimeric IRF5. Nature Structural & Molecular Biology. 15 (11), 1213-1220 (2008).
  20. Pettersen, E. F., et al. UCSF Chimera-A visualization system for exploratory research and analysis. Journal of Computational Chemistry. 25, 1605-1612 (2004).
  21. Crooks, G. E., Hon, G., Chandonia, J. -. M., Brenner, S. E. WebLogo: a sequence logo generator. Genome Research. 14 (6), 1188-1190 (2004).
  22. Panne, D., McWhirter, S. M., Maniatis, T., Harrison, S. C. Interferon regulatory factor 3 is regulated by a dual phosphorylation-dependent switch. The Journal of Biological Chemistry. 282 (31), 22816-22822 (2007).
  23. Weihrauch, D., et al. An IRF5 decoy peptide reduces myocardial inflammation and fibrosis and improves endothelial cell function in tight-skin mice. PloS One. 11 (4), e0151999 (2016).
  24. Mori, M., Yoneyama, M., Ito, T., Takahashi, K., Inagaki, F., Fujita, T. Identification of Ser-386 of interferon regulatory factor 3 as critical target for inducible phosphorylation that determines activation. The Journal of Biological Chemistry. 279 (11), 9698-9702 (2004).
  25. Smith, C. A., Kortemme, T. Predicting the tolerated sequences for proteins and protein interfaces using RosettaBackrub flexible backbone design. PloS One. 6 (7), e20451 (2011).
  26. Rubenstein, A. B., Pethe, M. A., Khare, S. D. MFPred: Rapid and accurate prediction of protein-peptide recognition multispecificity using self-consistent mean field theory. PLoS Computational Biology. 13 (6), e1005614 (2017).

Play Video

Cite This Article
Cruz, H., Llanes, A., Fernández, P. L. Computational Prediction of Amino Acid Preferences of Potentially Multispecific Peptide-Binding Domains Involved in Protein-Protein Interactions. J. Vis. Exp. (203), e66314, doi:10.3791/66314 (2024).

View Video