Computational Prediction of Amino Acid Preferences of Potentially Multispecific Peptide-Binding Domains Involved in Protein-Protein Interactions

H&#233;ctor Cruz; Alejandro Llanes; Patricia L. Fern&#225;ndez

doi:10.3791/66314

JoVE Journal > Biochemistry

Please note that all translations are automatically generated. Click here for the English version.

生化学

Computationele voorspelling van aminozuurvoorkeuren van potentieel multispecifieke peptide-bindende domeinen die betrokken zijn bij eiwit-eiwitinteracties

Published: January 26, 2024

doi:

10.3791/66314

Héctor Cruz², Alejandro Llanes³, Patricia L. Fernández³

¹Facultad de Ciencias y Tecnología,Universidad Tecnológica de Panamá (UTP), ²Centro de Biología Molecular y Celular de Enfermedades,Instituto de Investigaciones Científicas y Servicios de Alta Tecnología AIP (INDICASAT AIP), ³Sistema Nacional de Investigación de Panamá (SNI)

概要

We beschrijven een methodologie gebaseerd op sequentiediversificatie om de aminozuurvoorkeuren van multispecifieke bindingsplaatsen in eiwit-eiwitinteracties (PPI’s) te schatten. In deze strategie worden duizenden potentiële peptideliganden gegenereerd en gescreend in silico, waardoor enkele beperkingen van beschikbare experimentele methoden worden overwonnen.

Abstract

Veel eiwit-eiwitinteracties omvatten de binding van korte eiwitsegmenten aan peptidebindende domeinen. Gewoonlijk vereisen dergelijke interacties de herkenning van lineaire motieven met variabele conservering. De combinatie van sterk geconserveerde en meer variabele regio’s in dezelfde liganden draagt vaak bij aan de multispecificiteit van binding, een gemeenschappelijke eigenschap van enzymen en celsignaleringseiwitten. Karakterisering van aminozuurvoorkeuren van peptide-bindende domeinen is belangrijk voor het ontwerp van mediatoren van eiwit-eiwitinteracties (PPI’s). Computationele methoden zijn een efficiënt alternatief voor de vaak dure en omslachtige experimentele technieken, waardoor het mogelijk is om potentiële mediatoren te ontwerpen die later kunnen worden gevalideerd in stroomafwaartse experimenten. Hier hebben we een methodologie beschreven met behulp van de Pepspec-toepassing van het moleculaire modelleringspakket Rosetta om de aminozuurvoorkeuren van peptidebindende domeinen te voorspellen. Deze methodologie is nuttig wanneer de structuur van het receptoreiwit en de aard van het peptideligand beide bekend zijn of kunnen worden afgeleid. De methodologie begint met een goed gekarakteriseerd anker uit het ligand, dat wordt uitgebreid door willekeurig aminozuurresiduen toe te voegen. De bindingsaffiniteit van peptiden die op deze manier worden gegenereerd, wordt vervolgens geëvalueerd door docking van peptiden met flexibele ruggengraat om de peptiden met de best voorspelde bindingsscores te selecteren. Deze peptiden worden vervolgens gebruikt om aminozuurvoorkeuren te berekenen en om optioneel een positie-gewichtsmatrix (PWM) te berekenen die in verdere studies kan worden gebruikt. Om de toepassing van deze methodologie te illustreren, gebruikten we de interactie tussen subeenheden van humane interferonregulerende factor 5 (IRF5), waarvan eerder bekend was dat ze multispecifiek waren, maar wereldwijd worden geleid door een kort geconserveerd motief genaamd pLxIS. De geschatte aminozuurvoorkeuren kwamen overeen met eerdere kennis over het IRF5-bindingsoppervlak. Posities ingenomen door fosforyleerbare serineresiduen vertoonden een hoge frequentie van aspartaat en glutamaat, waarschijnlijk omdat hun negatief geladen zijketens vergelijkbaar zijn met fosfoserine.

Introduction

Interactie tussen twee eiwitten omvat vaak de binding van korte segmenten van aminozuren aan peptide-bindende domeinen, die lijken op eiwit-peptide-interfaces. Receptoreiwitten die betrokken zijn bij dergelijke eiwit-eiwitinteracties (PPI) hebben vaak het vermogen om een bepaalde reeks overlappende maar uiteenlopende ligandsequenties te herkennen, een eigenschap die bekend staat als multispecificiteit ^1,2. Multispecifieke herkenning is een kenmerk van veel cellulaire eiwitten, maar het is vooral opmerkelijk in enzymen en celsignalerende eiwitten³. Eiwitten die interageren met multispecifieke bindingsplaatsen hebben vaak een combinatie van meer en minder geconserveerde regio’s in hun sequentie ^4,5,6. In dit scenario zijn de meer geconserveerde sequentiemotieven betrokken bij strikte moleculaire interacties. Omgekeerd interageren de meer variabele sequenties met op de een of andere manier permissieve oppervlakken in de receptorbindingsplaats. Meestal zijn deze minder geconserveerde maar nog steeds functioneel relevante segmenten lussen zonder gedefinieerde secundaire structuurpatronen of hebben ze zelfs meer dynamische conformaties, zoals die typisch zijn voor intrinsiek ongeordende eiwitten⁷.

Identificatie van potentiële peptideliganden van bindingsplaatsen is meestal de eerste stap in het ontwerp van mediatoren die kunnen interfereren met de overeenkomstige PPI’s⁸. Het is echter vaak onwaarschijnlijk dat er op de meeste sequentieposities in liganden van multispecifieke bindingsplaatsen een enkel meest frequent aminozuurresidu wordt gevonden. In plaats daarvan kunnen deze sites specifieke voorkeuren hebben voor een specifieke klasse aminozuren op basis van hun chemische eigenschappen, bijvoorbeeld zure en negatief geladen aminozuren zoals aspartaat of glutamaat, volumineuze aromatische aminozuren zoals fenylalanine of meer hydrofobe residuen zoals alifatische aminozuren alanine, valine, leucine of isoleucine³. Verschillende experimentele methoden kunnen inzicht verschaffen in aminozuurvoorkeuren van eiwitbindingsplaatsen, waaronder gerichte evolutie⁹, multi-codon scanning mutagenese¹⁰ en diepe mutatiescanning¹¹. Al deze methoden volgen de benadering van sequentiediversificatie, die is gebaseerd op het introduceren van mutaties in oorspronkelijke liganden en het verder analyseren van hun effect op de functie van het receptoreiwit (zie Bratulic en Badran¹² voor een uitgebreid overzicht). Deze methoden vereisen echter vaak het onderzoeken van grote sequentiebibliotheken, waardoor ze omslachtiger, duurder en tijdrovender worden.

Computationele methoden om de aminozuurvoorkeuren van multispecifieke bindingsplaatsen af te leiden, hebben het potentieel om de beperkingen van natte laboratoriummethoden te omzeilen. Onder deze evalueert de in silico sequentiediversificatiebenadering de energetische impact van een breed scala aan aminozuurvervangingen in de ligandsequentie als een manier om de structurele plasticiteit van de PPI¹³ te karakteriseren. Deze methode begint met de structuur of het model van het peptideligand dat aan de receptorbindingsplaats is gebonden en introduceert vervolgens mutaties in de ligandsequentie. Statistische en energiescorefuncties worden vervolgens gebruikt om de impact van deze mutaties op de stabiliteit en bindingsaffiniteit te evalueren. De set van best scorende ligandsequenties die het resultaat zijn van de evaluatiefase kan vervolgens worden gebruikt om de aminozuurvoorkeuren te berekenen. Deze strategie heeft het potentieel om een zeer hoog aantal ligandsequenties op een efficiënte manier te verwerken. Daarom kan het een completere en consistentere gevolgtrekking van aminozuurvoorkeuren bieden in vergelijking met die berekend op basis van het beperktere aantal sequenties dat gewoonlijk kan worden verwerkt in natte laboratoriumbenaderingen.

De Pepspec-toepassing van de moleculaire modelleringssuite¹⁴ van Rosetta is een hulpmiddel dat sequentiediversificatie uitvoert als een belangrijke stap van de peptide-ontwerpmodus. Deze toepassing vereist een structuur of model van het receptoreiwit met een gebonden peptide tot een enkel aminozuurresidu in lengte, dat wordt gebruikt als anker voor de volgende stappen. De sequentie van het gebonden peptide wordt vervolgens uitgebreid (indien nodig) en gediversifieerd om een groot aantal vermeende peptideliganden te genereren. De bindingsaffiniteit van deze peptiden wordt vervolgens geëvalueerd door middel van docking van peptiden met flexibele ruggengraat om de peptiden te selecteren met de best voorspelde bindingsscores. Hoewel de belangrijkste output van deze applicatie de beste peptidekandidaten zijn die aan het einde van de ontwerpfase zijn geselecteerd, kan de veel grotere set peptiden die tijdens deze fase wordt geaccepteerd, ook worden gebruikt om de aminozuurvoorkeuren van de doelbindingsplaats te berekenen. Aminozuurvoorkeuren worden berekend als de frequentie van elk aminozuurresidu per positie van de ligandsequentie die wordt weergegeven als een positiegewichtsmatrix (PWM) of als een meer visueel sequentielogo.

In dit artikel beschrijven we een protocol om de aminozuurvoorkeuren van het bindingsoppervlak van een receptoreiwit dat betrokken is bij een PPI te schatten. Het protocol is gericht op PPI’s waarvan bekend is dat een lineair segment van het eiwitligand bindt aan het receptoreiwit, zodat het scenario kan worden gemodelleerd als een eiwit-peptide-interface. In dit scenario interageren geconserveerde motieven van de ligand doorgaans met gedefinieerde pockets in de receptorbindingsplaats, hoewel het hele ligandsegment dat betrokken is bij de PPI mogelijk minder geconserveerde regio’s bevat. Een stroomdiagram met een samenvatting van de belangrijkste stappen van het protocol is weergegeven in figuur 1. Het protocol begint met de 3D-structuur van het eiwit-eiwitcomplex en reduceert het ligand-eiwit verder tot het potentieel best interagerende segment, waarbij het receptoreiwit intact blijft. Het best interagerende segment wordt afgeleid door gebruik te maken van de BUDE Alanine Scan-server¹⁵, die computationele alaninescanmutagenese uitvoert om hot-spot-residuen tussen de twee op elkaar inwerkende eiwitten te identificeren. In deze benadering worden residuen van het ligand afzonderlijk vervangen door alanine, en de geschatte verandering in vrije energie of stabiliteit van het complex (ΔΔG) wordt vervolgens gebruikt om de relevantie van het overeenkomstige residu voor de doel-PPI af te leiden. Zodra het best interagerende segment is afgeleid, wordt het complex met het receptoreiwit gebruikt als de basisstructuur die aan Pepspec wordt voorgelegd om sequentiediversificatie uit te voeren.

Figuur 1: Overzicht van de belangrijkste stappen van het protocol dat in dit werk wordt voorgesteld. Nummers komen overeen met stapnummers in het protocolgedeelte. Er zijn figuren gemaakt met het eiwit-eiwitcomplex dat als voorbeeld in de tekst wordt gebruikt. In dit complex wordt de eiwitketen die als de receptor wordt beschouwd, in roze weergegeven, terwijl de keten die als ligand wordt beschouwd, in lichtblauw wordt weergegeven, waarbij het voorspelde best interagerende segment in rood wordt gemarkeerd. Klik hier om een grotere versie van deze figuur te bekijken.

Een van de beperkingen van het voorgestelde protocol is de vereiste voor een opgeloste structuur van de eiwit-peptide-interface. Het protocol kan ook beginnen met een model van de doeleiwit-peptide-interface, hoewel de specifieke modelleringsstappen hierin niet worden beschreven. Bovendien, hoewel het protocol kan worden uitgevoerd op een pc met elk besturingssysteem, is een Linux-omgeving vereist voor de stappen met betrekking tot de Rosetta-applicaties. Een computercluster wordt ook ten zeerste aanbevolen voor de stap van sequentiediversificatie vanwege het grote aantal iteraties dat doorgaans door Pepspec wordt uitgevoerd.

De toepassing van het voorgestelde protocol wordt geïllustreerd met de schatting van aminozuurvoorkeuren van het biding-oppervlak van IRF5, een lid van de familie van de humane interferonregulerende factor (IRF). We hebben dit eiwit als voorbeeld gekozen omdat tijdens de activering twee subeenheden binden om een dimeer te vormen waarvan de structuur goed is gekarakteriseerd¹⁶. In IRF-dimeren kan binding worden gemodelleerd als een eiwit-peptide-interface waarbij de ene subeenheid het bindingsoppervlak levert en de andere interageert via een gebied met een kort geconserveerd motief genaamd pLxIS^17,18. Bovendien is binding aan IRF-subeenheden multispecifiek; Daarom kunnen ze homodimeren, heterodimeren en complexen vormen met andere cellulaire eiwitten die bekend staan als coactivatoren¹⁸.

Protocol

1. Eerste voorbereiding van de eiwit-peptide-interface De structuur van het eiwit-eiwitcomplex downloadenNavigeer naar de homepage van de Protein Data Bank (PDB) (https://www.rcsb.org/) en typ de PDB-ID voor de structuur van het eiwit-eiwitcomplex in het hoofdzoekvak (Figuur 2A). De PDB-ID voor de structuur van het IRF5-dimeer, die in dit werk als voorbeeld wordt gebruikt, is 3DSH19. Klik …

Representative Results

In dit artikel hebben we een protocol beschreven om de aminozuurvoorkeuren van het bindingsoppervlak van IRF5 te voorspellen, een lid van een familie van transcriptiefactoren die bekend staat als humane interferonregulerende factoren. Deze eiwitten zijn regulatoren van aangeboren en adaptieve immuunresponsen en nemen deel aan de differentiatie en activering van verschillende immuuncellen. IRF-subeenheden hebben zeer plastische en multispecifieke bindingsoppervlakken en zijn in staat homo…

Discussion

Het huidige artikel beschrijft een protocol om de aminozuurvoorkeuren van potentieel multispecifieke bindingsplaatsen te schatten op basis van in silico sequentiediversificatie. Er zijn maar weinig computationele tools ontwikkeld om aminozuurvoorkeuren van eiwit-peptide-interfaces te schatten 14,25,26. Deze tools hebben een voorspellend karakter, maar ze verschillen in de computationele algoritm…

開示

The authors have nothing to disclose.

Acknowledgements

Financiële steun van Sistema Nacional de Investigación (SNI) (subsidienummers SNI-043-2023 en SNI-170-2021), Secretaría Nacional de Ciencia, Tecnología e Innovación (SENACYT) van Panama en Instituto para la Formación y Aprovechamiento de Recursos Humanos (IFARHU) wordt dankbaar erkend. De auteurs willen Dr. Miguel Rodríguez bedanken voor het zorgvuldig nakijken van het manuscript.

Materials

BUDE Alanine Scan Server	University of Edinburgh	https://pragmaticproteindesign.bio.ed.ac.uk/balas/	doi: 10.1021/acschembio.9b00560
Rosetta Modeling Software	Rosetta Commons	https://www.rosettacommons.org/software	doi: 10.1002/prot.22851
UCSF Chimera	University of California San Francisco	https://www.cgl.ucsf.edu/chimera/	doi: 10.1002/jcc.20084

参考文献

Kim, P. M., Lu, L. J., Xia, Y., Gerstein, M. B. Relating three-dimensional structures to protein networks provides evolutionary insights. Science. 314 (5807), 1938-1941 (2006).
Schreiber, G., Keating, A. E. Protein binding specificity versus promiscuity. Current Opinion in Structural Biology. 21 (1), 50-61 (2011).
Erijman, A., Aizner, Y., Shifman, J. M. Multispecific recognition: Mechanism, evolution, and design. 生化学. 50 (5), 602-611 (2011).
Fromer, M., Shifman, J. M. Tradeoff between stability and multispecificity in the design of promiscuous proteins. PLoS Computational Biology. 5 (12), e1000627 (2009).
Xie, T., Zmyslowski, A. M., Zhang, Y., Radhakrishnan, I. Structural basis for multispecificity of MRG domains. Structure. 23 (6), 1049-1057 (2015).
Hendler, A., et al. Human SIRT1 multispecificity is modulated by active-site vicinity substitutions during natural evolution. Molecular Biology and Evolution. 38 (2), 545-556 (2021).
Teilum, K., Olsen, J. G., Kragelund, B. B. On the specificity of protein-protein interactions in the context of disorder. The Biochemical Journal. 478 (11), 2035-2050 (2021).
Pelay-Gimeno, M., Glas, A., Koch, O., Grossmann, T. N. Structure-based design of inhibitors of protein-protein interactions: Mimicking peptide binding epitopes. Angewandte Chemie (International ed. in English). 54 (31), 8896-8927 (2015).
Wang, Y., Xue, P., Cao, M., Yu, T., Lane, S. T., Zhao, H. Directed evolution: Methodologies and applications. Chemical Reviews. 121 (20), 12384-12444 (2021).
Liu, J., Cropp, T. A. Rational protein sequence diversification by multi-codon scanning mutagenesis. Methods in Molecular Biology. 978, 217-228 (2013).
Wei, H., Li, X. Deep mutational scanning: A versatile tool in systematically mapping genotypes to phenotypes. Frontiers in Genetics. 14, 1087267 (2023).
Bratulic, S., Badran, A. H. Modern methods for laboratory diversification of biomolecules. Current Opinion in Chemical Biology. 41, 50-60 (2017).
Humphris, E. L., Kortemme, T. Prediction of protein-protein interface sequence diversity using flexible backbone computational protein design. Structure. 16 (12), 1777-1788 (2008).
King, C. A., Bradley, P. Structure-based prediction of protein-peptide specificity in Rosetta. Proteins. 78 (16), 3437-3449 (2010).
Ibarra, A. A., et al. Predicting and experimentally validating hot-spot residues at protein-protein interfaces. ACS Chemical Biology. 14 (10), 2252-2263 (2019).
Chen, W., Srinath, H., Lam, S. S., Schiffer, C. A., Royer, W. E., Lin, K. Contribution of Ser386 and Ser396 to activation of interferon regulatory factor 3. Journal of Molecular Biology. 379 (2), 251-260 (2008).
Mancino, A., Natoli, G. Specificity and function of IRF family transcription factors: Insights from genomics. Journal of Interferon & Cytokine Research. 36 (7), 462-469 (2016).
Schwanke, H., Stempel, M., Brinkmann, M. M. Of keeping and tipping the balance: Host regulation and viral modulation of IRF3-dependent IFNB1 expression. Viruses. 12 (7), 33 (2020).
Chen, W., et al. Insights into interferon regulatory factor activation from the crystal structure of dimeric IRF5. Nature Structural & Molecular Biology. 15 (11), 1213-1220 (2008).
Pettersen, E. F., et al. UCSF Chimera-A visualization system for exploratory research and analysis. Journal of Computational Chemistry. 25, 1605-1612 (2004).
Crooks, G. E., Hon, G., Chandonia, J. -. M., Brenner, S. E. WebLogo: a sequence logo generator. Genome Research. 14 (6), 1188-1190 (2004).
Panne, D., McWhirter, S. M., Maniatis, T., Harrison, S. C. Interferon regulatory factor 3 is regulated by a dual phosphorylation-dependent switch. The Journal of Biological Chemistry. 282 (31), 22816-22822 (2007).
Weihrauch, D., et al. An IRF5 decoy peptide reduces myocardial inflammation and fibrosis and improves endothelial cell function in tight-skin mice. PloS One. 11 (4), e0151999 (2016).
Mori, M., Yoneyama, M., Ito, T., Takahashi, K., Inagaki, F., Fujita, T. Identification of Ser-386 of interferon regulatory factor 3 as critical target for inducible phosphorylation that determines activation. The Journal of Biological Chemistry. 279 (11), 9698-9702 (2004).
Smith, C. A., Kortemme, T. Predicting the tolerated sequences for proteins and protein interfaces using RosettaBackrub flexible backbone design. PloS One. 6 (7), e20451 (2011).
Rubenstein, A. B., Pethe, M. A., Khare, S. D. MFPred: Rapid and accurate prediction of protein-peptide recognition multispecificity using self-consistent mean field theory. PLoS Computational Biology. 13 (6), e1005614 (2017).

Play Video

PDF

DOI

DOWNLOAD MATERIALS LIST

記事を引用

Cruz, H., Llanes, A., Fernández, P. L. Computational Prediction of Amino Acid Preferences of Potentially Multispecific Peptide-Binding Domains Involved in Protein-Protein Interactions. J. Vis. Exp. (203), e66314, doi:10.3791/66314 (2024).

Computationele voorspelling van aminozuurvoorkeuren van potentieel multispecifieke peptide-bindende domeinen die betrokken zijn bij eiwit-eiwitinteracties