Computational Prediction of Amino Acid Preferences of Potentially Multispecific Peptide-Binding Domains Involved in Protein-Protein Interactions

H&#233;ctor Cruz; Alejandro Llanes; Patricia L. Fern&#225;ndez

doi:10.3791/66314

JoVE Journal > Biochemistry

Please note that all translations are automatically generated. Click here for the English version.

生化学

Predizione computazionale delle preferenze amminoacidiche di domini di legame peptidico potenzialmente multispecifici coinvolti nelle interazioni proteina-proteina

Published: January 26, 2024

doi:

10.3791/66314

Héctor Cruz², Alejandro Llanes³, Patricia L. Fernández³

¹Facultad de Ciencias y Tecnología,Universidad Tecnológica de Panamá (UTP), ²Centro de Biología Molecular y Celular de Enfermedades,Instituto de Investigaciones Científicas y Servicios de Alta Tecnología AIP (INDICASAT AIP), ³Sistema Nacional de Investigación de Panamá (SNI)

概要

Descriviamo una metodologia basata sulla diversificazione delle sequenze per stimare le preferenze amminoacidiche dei siti di legame multispecifici nelle interazioni proteina-proteina (PPI). In questa strategia, migliaia di potenziali ligandi peptidici vengono generati e sottoposti a screening in silico, superando così alcune limitazioni dei metodi sperimentali disponibili.

Abstract

Molte interazioni proteina-proteina coinvolgono il legame di brevi segmenti proteici ai domini di legame dei peptidi. Di solito, tali interazioni richiedono il riconoscimento di motivi lineari con conservazione variabile. La combinazione di regioni altamente conservate e più variabili negli stessi ligandi spesso contribuisce alla multispecificità del legame, una proprietà comune degli enzimi e delle proteine di segnalazione cellulare. La caratterizzazione delle preferenze amminoacidiche dei domini di legame dei peptidi è importante per la progettazione di mediatori delle interazioni proteina-proteina (PPI). I metodi computazionali sono un’alternativa efficiente alle tecniche sperimentali, spesso costose e ingombranti, consentendo la progettazione di potenziali mediatori che possono essere successivamente convalidati in esperimenti a valle. Qui, abbiamo descritto una metodologia che utilizza l’applicazione Pepspec del pacchetto di modellazione molecolare Rosetta per prevedere le preferenze amminoacidiche dei domini di legame peptidico. Questa metodologia è utile quando la struttura della proteina recettore e la natura del ligando peptidico sono entrambe note o possono essere dedotte. La metodologia inizia con un’ancora ben caratterizzata dal ligando, che viene estesa aggiungendo in modo casuale residui di amminoacidi. L’affinità di legame dei peptidi generati in questo modo viene quindi valutata mediante docking del peptide della spina dorsale flessibile al fine di selezionare i peptidi con i migliori punteggi di legame previsti. Questi peptidi vengono quindi utilizzati per calcolare le preferenze degli amminoacidi e per calcolare facoltativamente una matrice posizione-peso (PWM) che può essere utilizzata in ulteriori studi. Per illustrare l’applicazione di questa metodologia, abbiamo utilizzato l’interazione tra subunità del fattore regolatore dell’interferone umano 5 (IRF5), precedentemente noto per essere multispecifico ma globalmente guidato da un breve motivo conservato chiamato pLxIS. Le preferenze stimate per gli amminoacidi erano coerenti con le conoscenze precedenti sulla superficie di legame di IRF5. Le posizioni occupate da residui di serina fosforilabili hanno mostrato un’alta frequenza di aspartato e glutammato, probabilmente perché le loro catene laterali caricate negativamente sono simili alla fosfosserina.

Introduction

L’interazione tra due proteine spesso comporta il legame di brevi segmenti di amminoacidi a domini di legame peptidico, simili alle interfacce proteina-peptide. Le proteine recettoriali coinvolte in tali interazioni proteina-proteina (PPI) hanno spesso la capacità di riconoscere un certo insieme di sequenze di ligandi sovrapposte ma divergenti, una proprietà nota come multispecificità ^1,2. Il riconoscimento multispecifico è una caratteristica di molte proteine cellulari, ma è particolarmente notevole negli enzimi e nelle proteine di segnalazione cellulare³. Le proteine che interagiscono con i siti di legame multispecifici hanno spesso una combinazione di regioni più e meno conservate nella loro sequenza ^4,5,6. In questo scenario, i motivi di sequenza più conservati sono coinvolti in interazioni molecolari rigorose. Al contrario, le sequenze più variabili interagiscono con superfici in qualche modo permissive nel sito di legame del recettore. Di solito, questi segmenti meno conservati ma ancora funzionalmente rilevanti sono loop privi di modelli di struttura secondaria definiti o hanno conformazioni ancora più dinamiche, come quelle tipiche delle proteine intrinsecamente disordinate⁷.

L’identificazione di potenziali ligandi peptidici dei siti di legame è solitamente il primo passo nella progettazione di mediatori in grado di interferire con i corrispondenti PPI⁸. Tuttavia, è spesso improbabile trovare un singolo residuo di amminoacidi più frequente nella maggior parte delle posizioni di sequenza nei ligandi dei siti di legame multispecifici. Invece, questi siti possono avere particolari preferenze per una specifica classe di amminoacidi in base alle loro proprietà chimiche, ad esempio, amminoacidi acidi e caricati negativamente come l’aspartato o il glutammato, amminoacidi aromatici voluminosi come la fenilalanina o residui più idrofobici come gli amminoacidi alifatici alanina, valina, leucina o isoleucina³. Diversi metodi sperimentali possono fornire informazioni sulle preferenze aminoacidiche dei siti di legame delle proteine, tra cui l’evoluzione diretta⁹, la mutagenesi a scansione multi-codone¹⁰ e la scansione mutazionale profonda¹¹. Tutti questi metodi seguono l’approccio della diversificazione delle sequenze, che si basa sull’introduzione di mutazioni nei ligandi originali e sull’ulteriore analisi del loro effetto sulla funzione della proteina recettore (vedi Bratulic e Badran¹² per una revisione completa). Tuttavia, questi metodi spesso richiedono l’indagine di librerie di sequenze di grandi dimensioni, il che li rende più ingombranti, costosi e dispendiosi in termini di tempo.

I metodi computazionali per dedurre le preferenze amminoacidiche dei siti di legame multispecifici hanno il potenziale per aggirare i limiti dei metodi di laboratorio umido. Tra questi, l’approccio di diversificazione della sequenza in silico valuta l’impatto energetico di un’ampia gamma di sostituti di amminoacidi nella sequenza del ligando come un modo per caratterizzare la plasticità strutturale del PPI¹³. Questo metodo inizia con la struttura o il modello del ligando peptidico legato al sito di legame del recettore e successivamente introduce mutazioni nella sequenza del ligando. Le funzioni statistiche e di punteggio energetico vengono quindi utilizzate per valutare l’impatto di queste mutazioni sulla stabilità e sull’affinità di legame. L’insieme delle sequenze di ligandi con il miglior punteggio risultanti dalla fase di valutazione può quindi essere utilizzato per calcolare le preferenze degli amminoacidi. Questa strategia ha il potenziale per elaborare un numero molto elevato di sequenze di ligando in modo efficiente. Pertanto, può fornire un’inferenza più completa e coerente delle preferenze amminoacidiche rispetto a quelle calcolate dal numero più limitato di sequenze che di solito possono essere elaborate negli approcci di laboratorio umido.

L’applicazione Pepspec della suite di modellazione molecolare Rosetta¹⁴ è uno strumento che esegue la diversificazione delle sequenze come passaggio chiave della sua modalità di progettazione dei peptidi. Questa applicazione richiede una struttura o un modello della proteina del recettore con un peptide legato fino a un singolo residuo di amminoacido in lunghezza, che viene utilizzato come ancoraggio per i passaggi successivi. La sequenza del peptide legato viene quindi estesa (se necessario) e diversificata per generare un gran numero di ligandi peptidici putativi. L’affinità di legame di questi peptidi viene quindi valutata mediante docking del peptide della spina dorsale flessibile al fine di selezionare quelli con i migliori punteggi di legame previsti. Sebbene l’output principale di questa applicazione siano i migliori peptidi candidati selezionati alla fine della fase di progettazione, l’insieme molto più ampio di peptidi accettati durante questa fase può essere utilizzato anche per calcolare le preferenze amminoacidiche del sito di legame target. Le preferenze degli amminoacidi sono calcolate come la frequenza di ciascun residuo di amminoacido per posizione della sequenza del ligando, rappresentata come una matrice di peso della posizione (PWM) o come un logo di sequenza più visivo.

In questo articolo, descriviamo un protocollo per stimare le preferenze aminoacidiche della superficie di legame di una proteina recettore coinvolta in un PPI. Il protocollo è focalizzato su PPI in cui è noto che un segmento lineare della proteina-ligando si lega alla proteina recettore, quindi lo scenario può essere modellato come un’interfaccia proteina-peptide. In questo scenario, i motivi conservati del ligando interagiscono tipicamente con tasche definite nel sito di legame del recettore, sebbene l’intero segmento del ligando coinvolto nel PPI possa contenere regioni meno conservate. Nella Figura 1 è mostrato un diagramma di flusso che riassume le fasi principali del protocollo. Il protocollo inizia con la struttura 3D del complesso proteina-proteina e riduce ulteriormente la proteina ligando al segmento potenzialmente più interagente, lasciando intatta la proteina recettore. Il segmento con la migliore interazione viene dedotto utilizzando il server BUDE Alanine Scan¹⁵, che conduce la mutagenesi computazionale della scansione dell’alanina per identificare i residui di punti caldi tra le due proteine interagenti. In questo approccio, i residui del ligando vengono sostituiti individualmente dall’alanina e la variazione stimata dell’energia libera o della stabilità del complesso (ΔΔG) viene quindi utilizzata per dedurre la rilevanza del residuo corrispondente per il PPI target. Una volta dedotto il segmento con la migliore interazione, il suo complesso con la proteina recettore viene utilizzato come struttura di base sottoposta a Pepspec per eseguire la diversificazione della sequenza.

Figura 1: Panoramica delle fasi principali del protocollo proposto in questo lavoro. I numeri corrispondono ai numeri di passaggio nella sezione del protocollo. Le figure sono state realizzate con il complesso proteina-proteina utilizzato come esempio descritto nel testo. In questo complesso, la catena proteica considerata come recettore è mostrata in rosa, mentre la catena considerata come ligando è mostrata in azzurro con il suo segmento di migliore interazione previsto evidenziato in rosso. Clicca qui per visualizzare una versione più grande di questa figura.

Uno dei limiti del protocollo suggerito è la necessità di una struttura risolta dell’interfaccia proteina-peptide. In alternativa, il protocollo può iniziare con un modello dell’interfaccia proteina-peptide bersaglio, sebbene le fasi specifiche della modellazione non siano descritte nel presente documento. Inoltre, sebbene il protocollo possa essere eseguito su un personal computer con qualsiasi sistema operativo, è necessario un ambiente Linux per i passaggi che coinvolgono le applicazioni Rosetta. Un cluster di computer è anche altamente raccomandato per la fase di diversificazione delle sequenze a causa del gran numero di iterazioni tipicamente eseguite da Pepspec.

L’applicazione del protocollo suggerito è illustrata con la stima delle preferenze aminoacidiche della superficie di offerta di IRF5, un membro della famiglia dei fattori regolatori dell’interferone umano (IRF). Abbiamo scelto questa proteina come esempio perché, durante la sua attivazione, due subunità si legano per formare un dimero la cui struttura è ben caratterizzata¹⁶. Nei dimeri IRF, il legame può essere modellato come un’interfaccia proteina-peptide in cui una subunità fornisce la superficie di legame e l’altra interagisce attraverso una regione contenente un breve motivo conservato chiamato pLxIS^17,18. Inoltre, il legame con le subunità IRF è multispecifico; Pertanto, possono formare omodimeri, eterodimeri e complessi con altre proteine cellulari note come coattivatori¹⁸.

Protocol

1. Preparazione iniziale dell’interfaccia proteina-peptide Scaricare la struttura del complesso proteina-proteinaAccedere alla home page della Protein Data Bank (PDB) (https://www.rcsb.org/) e digitare l’ID PDB per la struttura del complesso proteina-proteina nella casella di ricerca principale (Figura 2A). L’ID PDB per la struttura del dimero IRF5, utilizzato come esempio in questo lavoro, è 3DSH19…

Representative Results

In questo articolo, abbiamo descritto un protocollo per prevedere le preferenze aminoacidiche della superficie di legame di IRF5, un membro di una famiglia di fattori di trascrizione noti come fattori regolatori dell’interferone umano. Queste proteine sono regolatori delle risposte immunitarie innate e adattative e partecipano alla differenziazione e all’attivazione di diverse cellule immunitarie. Le subunità IRF hanno superfici di legame altamente plastiche e multispecifiche, essendo i…

Discussion

Il presente articolo descrive un protocollo per stimare le preferenze amminoacidiche di siti di legame potenzialmente multispecifici basato sulla diversificazione di sequenze in silico. Pochi strumenti computazionali sono stati sviluppati per stimare le preferenze amminoacidiche delle interfacce proteina-peptide 14,25,26. Questi strumenti hanno una natura predittiva, ma differiscono per gli algo…

開示

The authors have nothing to disclose.

Acknowledgements

Si ringrazia il sostegno finanziario del Sistema Nacional de Investigación (SNI) (numeri di sovvenzione SNI-043-2023 e SNI-170-2021), della Secretaría Nacional de Ciencia, Tecnología e Innovación (SENACYT) di Panama e dell’Instituto para la Formación y Aprovechamiento de Recursos Humanos (IFARHU). Gli autori ringraziano il Dr. Miguel Rodríguez per l’attenta revisione del manoscritto.

Materials

BUDE Alanine Scan Server	University of Edinburgh	https://pragmaticproteindesign.bio.ed.ac.uk/balas/	doi: 10.1021/acschembio.9b00560
Rosetta Modeling Software	Rosetta Commons	https://www.rosettacommons.org/software	doi: 10.1002/prot.22851
UCSF Chimera	University of California San Francisco	https://www.cgl.ucsf.edu/chimera/	doi: 10.1002/jcc.20084

参考文献

Kim, P. M., Lu, L. J., Xia, Y., Gerstein, M. B. Relating three-dimensional structures to protein networks provides evolutionary insights. Science. 314 (5807), 1938-1941 (2006).
Schreiber, G., Keating, A. E. Protein binding specificity versus promiscuity. Current Opinion in Structural Biology. 21 (1), 50-61 (2011).
Erijman, A., Aizner, Y., Shifman, J. M. Multispecific recognition: Mechanism, evolution, and design. 生化学. 50 (5), 602-611 (2011).
Fromer, M., Shifman, J. M. Tradeoff between stability and multispecificity in the design of promiscuous proteins. PLoS Computational Biology. 5 (12), e1000627 (2009).
Xie, T., Zmyslowski, A. M., Zhang, Y., Radhakrishnan, I. Structural basis for multispecificity of MRG domains. Structure. 23 (6), 1049-1057 (2015).
Hendler, A., et al. Human SIRT1 multispecificity is modulated by active-site vicinity substitutions during natural evolution. Molecular Biology and Evolution. 38 (2), 545-556 (2021).
Teilum, K., Olsen, J. G., Kragelund, B. B. On the specificity of protein-protein interactions in the context of disorder. The Biochemical Journal. 478 (11), 2035-2050 (2021).
Pelay-Gimeno, M., Glas, A., Koch, O., Grossmann, T. N. Structure-based design of inhibitors of protein-protein interactions: Mimicking peptide binding epitopes. Angewandte Chemie (International ed. in English). 54 (31), 8896-8927 (2015).
Wang, Y., Xue, P., Cao, M., Yu, T., Lane, S. T., Zhao, H. Directed evolution: Methodologies and applications. Chemical Reviews. 121 (20), 12384-12444 (2021).
Liu, J., Cropp, T. A. Rational protein sequence diversification by multi-codon scanning mutagenesis. Methods in Molecular Biology. 978, 217-228 (2013).
Wei, H., Li, X. Deep mutational scanning: A versatile tool in systematically mapping genotypes to phenotypes. Frontiers in Genetics. 14, 1087267 (2023).
Bratulic, S., Badran, A. H. Modern methods for laboratory diversification of biomolecules. Current Opinion in Chemical Biology. 41, 50-60 (2017).
Humphris, E. L., Kortemme, T. Prediction of protein-protein interface sequence diversity using flexible backbone computational protein design. Structure. 16 (12), 1777-1788 (2008).
King, C. A., Bradley, P. Structure-based prediction of protein-peptide specificity in Rosetta. Proteins. 78 (16), 3437-3449 (2010).
Ibarra, A. A., et al. Predicting and experimentally validating hot-spot residues at protein-protein interfaces. ACS Chemical Biology. 14 (10), 2252-2263 (2019).
Chen, W., Srinath, H., Lam, S. S., Schiffer, C. A., Royer, W. E., Lin, K. Contribution of Ser386 and Ser396 to activation of interferon regulatory factor 3. Journal of Molecular Biology. 379 (2), 251-260 (2008).
Mancino, A., Natoli, G. Specificity and function of IRF family transcription factors: Insights from genomics. Journal of Interferon & Cytokine Research. 36 (7), 462-469 (2016).
Schwanke, H., Stempel, M., Brinkmann, M. M. Of keeping and tipping the balance: Host regulation and viral modulation of IRF3-dependent IFNB1 expression. Viruses. 12 (7), 33 (2020).
Chen, W., et al. Insights into interferon regulatory factor activation from the crystal structure of dimeric IRF5. Nature Structural & Molecular Biology. 15 (11), 1213-1220 (2008).
Pettersen, E. F., et al. UCSF Chimera-A visualization system for exploratory research and analysis. Journal of Computational Chemistry. 25, 1605-1612 (2004).
Crooks, G. E., Hon, G., Chandonia, J. -. M., Brenner, S. E. WebLogo: a sequence logo generator. Genome Research. 14 (6), 1188-1190 (2004).
Panne, D., McWhirter, S. M., Maniatis, T., Harrison, S. C. Interferon regulatory factor 3 is regulated by a dual phosphorylation-dependent switch. The Journal of Biological Chemistry. 282 (31), 22816-22822 (2007).
Weihrauch, D., et al. An IRF5 decoy peptide reduces myocardial inflammation and fibrosis and improves endothelial cell function in tight-skin mice. PloS One. 11 (4), e0151999 (2016).
Mori, M., Yoneyama, M., Ito, T., Takahashi, K., Inagaki, F., Fujita, T. Identification of Ser-386 of interferon regulatory factor 3 as critical target for inducible phosphorylation that determines activation. The Journal of Biological Chemistry. 279 (11), 9698-9702 (2004).
Smith, C. A., Kortemme, T. Predicting the tolerated sequences for proteins and protein interfaces using RosettaBackrub flexible backbone design. PloS One. 6 (7), e20451 (2011).
Rubenstein, A. B., Pethe, M. A., Khare, S. D. MFPred: Rapid and accurate prediction of protein-peptide recognition multispecificity using self-consistent mean field theory. PLoS Computational Biology. 13 (6), e1005614 (2017).

Play Video

PDF

DOI

DOWNLOAD MATERIALS LIST

記事を引用

Cruz, H., Llanes, A., Fernández, P. L. Computational Prediction of Amino Acid Preferences of Potentially Multispecific Peptide-Binding Domains Involved in Protein-Protein Interactions. J. Vis. Exp. (203), e66314, doi:10.3791/66314 (2024).

Predizione computazionale delle preferenze amminoacidiche di domini di legame peptidico potenzialmente multispecifici coinvolti nelle interazioni proteina-proteina