We beschrijven een methodologie gebaseerd op sequentiediversificatie om de aminozuurvoorkeuren van multispecifieke bindingsplaatsen in eiwit-eiwitinteracties (PPI’s) te schatten. In deze strategie worden duizenden potentiële peptideliganden gegenereerd en gescreend in silico, waardoor enkele beperkingen van beschikbare experimentele methoden worden overwonnen.
Veel eiwit-eiwitinteracties omvatten de binding van korte eiwitsegmenten aan peptidebindende domeinen. Gewoonlijk vereisen dergelijke interacties de herkenning van lineaire motieven met variabele conservering. De combinatie van sterk geconserveerde en meer variabele regio’s in dezelfde liganden draagt vaak bij aan de multispecificiteit van binding, een gemeenschappelijke eigenschap van enzymen en celsignaleringseiwitten. Karakterisering van aminozuurvoorkeuren van peptide-bindende domeinen is belangrijk voor het ontwerp van mediatoren van eiwit-eiwitinteracties (PPI’s). Computationele methoden zijn een efficiënt alternatief voor de vaak dure en omslachtige experimentele technieken, waardoor het mogelijk is om potentiële mediatoren te ontwerpen die later kunnen worden gevalideerd in stroomafwaartse experimenten. Hier hebben we een methodologie beschreven met behulp van de Pepspec-toepassing van het moleculaire modelleringspakket Rosetta om de aminozuurvoorkeuren van peptidebindende domeinen te voorspellen. Deze methodologie is nuttig wanneer de structuur van het receptoreiwit en de aard van het peptideligand beide bekend zijn of kunnen worden afgeleid. De methodologie begint met een goed gekarakteriseerd anker uit het ligand, dat wordt uitgebreid door willekeurig aminozuurresiduen toe te voegen. De bindingsaffiniteit van peptiden die op deze manier worden gegenereerd, wordt vervolgens geëvalueerd door docking van peptiden met flexibele ruggengraat om de peptiden met de best voorspelde bindingsscores te selecteren. Deze peptiden worden vervolgens gebruikt om aminozuurvoorkeuren te berekenen en om optioneel een positie-gewichtsmatrix (PWM) te berekenen die in verdere studies kan worden gebruikt. Om de toepassing van deze methodologie te illustreren, gebruikten we de interactie tussen subeenheden van humane interferonregulerende factor 5 (IRF5), waarvan eerder bekend was dat ze multispecifiek waren, maar wereldwijd worden geleid door een kort geconserveerd motief genaamd pLxIS. De geschatte aminozuurvoorkeuren kwamen overeen met eerdere kennis over het IRF5-bindingsoppervlak. Posities ingenomen door fosforyleerbare serineresiduen vertoonden een hoge frequentie van aspartaat en glutamaat, waarschijnlijk omdat hun negatief geladen zijketens vergelijkbaar zijn met fosfoserine.
Interactie tussen twee eiwitten omvat vaak de binding van korte segmenten van aminozuren aan peptide-bindende domeinen, die lijken op eiwit-peptide-interfaces. Receptoreiwitten die betrokken zijn bij dergelijke eiwit-eiwitinteracties (PPI) hebben vaak het vermogen om een bepaalde reeks overlappende maar uiteenlopende ligandsequenties te herkennen, een eigenschap die bekend staat als multispecificiteit 1,2. Multispecifieke herkenning is een kenmerk van veel cellulaire eiwitten, maar het is vooral opmerkelijk in enzymen en celsignalerende eiwitten3. Eiwitten die interageren met multispecifieke bindingsplaatsen hebben vaak een combinatie van meer en minder geconserveerde regio’s in hun sequentie 4,5,6. In dit scenario zijn de meer geconserveerde sequentiemotieven betrokken bij strikte moleculaire interacties. Omgekeerd interageren de meer variabele sequenties met op de een of andere manier permissieve oppervlakken in de receptorbindingsplaats. Meestal zijn deze minder geconserveerde maar nog steeds functioneel relevante segmenten lussen zonder gedefinieerde secundaire structuurpatronen of hebben ze zelfs meer dynamische conformaties, zoals die typisch zijn voor intrinsiek ongeordende eiwitten7.
Identificatie van potentiële peptideliganden van bindingsplaatsen is meestal de eerste stap in het ontwerp van mediatoren die kunnen interfereren met de overeenkomstige PPI’s8. Het is echter vaak onwaarschijnlijk dat er op de meeste sequentieposities in liganden van multispecifieke bindingsplaatsen een enkel meest frequent aminozuurresidu wordt gevonden. In plaats daarvan kunnen deze sites specifieke voorkeuren hebben voor een specifieke klasse aminozuren op basis van hun chemische eigenschappen, bijvoorbeeld zure en negatief geladen aminozuren zoals aspartaat of glutamaat, volumineuze aromatische aminozuren zoals fenylalanine of meer hydrofobe residuen zoals alifatische aminozuren alanine, valine, leucine of isoleucine3. Verschillende experimentele methoden kunnen inzicht verschaffen in aminozuurvoorkeuren van eiwitbindingsplaatsen, waaronder gerichte evolutie9, multi-codon scanning mutagenese10 en diepe mutatiescanning11. Al deze methoden volgen de benadering van sequentiediversificatie, die is gebaseerd op het introduceren van mutaties in oorspronkelijke liganden en het verder analyseren van hun effect op de functie van het receptoreiwit (zie Bratulic en Badran12 voor een uitgebreid overzicht). Deze methoden vereisen echter vaak het onderzoeken van grote sequentiebibliotheken, waardoor ze omslachtiger, duurder en tijdrovender worden.
Computationele methoden om de aminozuurvoorkeuren van multispecifieke bindingsplaatsen af te leiden, hebben het potentieel om de beperkingen van natte laboratoriummethoden te omzeilen. Onder deze evalueert de in silico sequentiediversificatiebenadering de energetische impact van een breed scala aan aminozuurvervangingen in de ligandsequentie als een manier om de structurele plasticiteit van de PPI13 te karakteriseren. Deze methode begint met de structuur of het model van het peptideligand dat aan de receptorbindingsplaats is gebonden en introduceert vervolgens mutaties in de ligandsequentie. Statistische en energiescorefuncties worden vervolgens gebruikt om de impact van deze mutaties op de stabiliteit en bindingsaffiniteit te evalueren. De set van best scorende ligandsequenties die het resultaat zijn van de evaluatiefase kan vervolgens worden gebruikt om de aminozuurvoorkeuren te berekenen. Deze strategie heeft het potentieel om een zeer hoog aantal ligandsequenties op een efficiënte manier te verwerken. Daarom kan het een completere en consistentere gevolgtrekking van aminozuurvoorkeuren bieden in vergelijking met die berekend op basis van het beperktere aantal sequenties dat gewoonlijk kan worden verwerkt in natte laboratoriumbenaderingen.
De Pepspec-toepassing van de moleculaire modelleringssuite14 van Rosetta is een hulpmiddel dat sequentiediversificatie uitvoert als een belangrijke stap van de peptide-ontwerpmodus. Deze toepassing vereist een structuur of model van het receptoreiwit met een gebonden peptide tot een enkel aminozuurresidu in lengte, dat wordt gebruikt als anker voor de volgende stappen. De sequentie van het gebonden peptide wordt vervolgens uitgebreid (indien nodig) en gediversifieerd om een groot aantal vermeende peptideliganden te genereren. De bindingsaffiniteit van deze peptiden wordt vervolgens geëvalueerd door middel van docking van peptiden met flexibele ruggengraat om de peptiden te selecteren met de best voorspelde bindingsscores. Hoewel de belangrijkste output van deze applicatie de beste peptidekandidaten zijn die aan het einde van de ontwerpfase zijn geselecteerd, kan de veel grotere set peptiden die tijdens deze fase wordt geaccepteerd, ook worden gebruikt om de aminozuurvoorkeuren van de doelbindingsplaats te berekenen. Aminozuurvoorkeuren worden berekend als de frequentie van elk aminozuurresidu per positie van de ligandsequentie die wordt weergegeven als een positiegewichtsmatrix (PWM) of als een meer visueel sequentielogo.
In dit artikel beschrijven we een protocol om de aminozuurvoorkeuren van het bindingsoppervlak van een receptoreiwit dat betrokken is bij een PPI te schatten. Het protocol is gericht op PPI’s waarvan bekend is dat een lineair segment van het eiwitligand bindt aan het receptoreiwit, zodat het scenario kan worden gemodelleerd als een eiwit-peptide-interface. In dit scenario interageren geconserveerde motieven van de ligand doorgaans met gedefinieerde pockets in de receptorbindingsplaats, hoewel het hele ligandsegment dat betrokken is bij de PPI mogelijk minder geconserveerde regio’s bevat. Een stroomdiagram met een samenvatting van de belangrijkste stappen van het protocol is weergegeven in figuur 1. Het protocol begint met de 3D-structuur van het eiwit-eiwitcomplex en reduceert het ligand-eiwit verder tot het potentieel best interagerende segment, waarbij het receptoreiwit intact blijft. Het best interagerende segment wordt afgeleid door gebruik te maken van de BUDE Alanine Scan-server15, die computationele alaninescanmutagenese uitvoert om hot-spot-residuen tussen de twee op elkaar inwerkende eiwitten te identificeren. In deze benadering worden residuen van het ligand afzonderlijk vervangen door alanine, en de geschatte verandering in vrije energie of stabiliteit van het complex (ΔΔG) wordt vervolgens gebruikt om de relevantie van het overeenkomstige residu voor de doel-PPI af te leiden. Zodra het best interagerende segment is afgeleid, wordt het complex met het receptoreiwit gebruikt als de basisstructuur die aan Pepspec wordt voorgelegd om sequentiediversificatie uit te voeren.
Figuur 1: Overzicht van de belangrijkste stappen van het protocol dat in dit werk wordt voorgesteld. Nummers komen overeen met stapnummers in het protocolgedeelte. Er zijn figuren gemaakt met het eiwit-eiwitcomplex dat als voorbeeld in de tekst wordt gebruikt. In dit complex wordt de eiwitketen die als de receptor wordt beschouwd, in roze weergegeven, terwijl de keten die als ligand wordt beschouwd, in lichtblauw wordt weergegeven, waarbij het voorspelde best interagerende segment in rood wordt gemarkeerd. Klik hier om een grotere versie van deze figuur te bekijken.
Een van de beperkingen van het voorgestelde protocol is de vereiste voor een opgeloste structuur van de eiwit-peptide-interface. Het protocol kan ook beginnen met een model van de doeleiwit-peptide-interface, hoewel de specifieke modelleringsstappen hierin niet worden beschreven. Bovendien, hoewel het protocol kan worden uitgevoerd op een pc met elk besturingssysteem, is een Linux-omgeving vereist voor de stappen met betrekking tot de Rosetta-applicaties. Een computercluster wordt ook ten zeerste aanbevolen voor de stap van sequentiediversificatie vanwege het grote aantal iteraties dat doorgaans door Pepspec wordt uitgevoerd.
De toepassing van het voorgestelde protocol wordt geïllustreerd met de schatting van aminozuurvoorkeuren van het biding-oppervlak van IRF5, een lid van de familie van de humane interferonregulerende factor (IRF). We hebben dit eiwit als voorbeeld gekozen omdat tijdens de activering twee subeenheden binden om een dimeer te vormen waarvan de structuur goed is gekarakteriseerd16. In IRF-dimeren kan binding worden gemodelleerd als een eiwit-peptide-interface waarbij de ene subeenheid het bindingsoppervlak levert en de andere interageert via een gebied met een kort geconserveerd motief genaamd pLxIS17,18. Bovendien is binding aan IRF-subeenheden multispecifiek; Daarom kunnen ze homodimeren, heterodimeren en complexen vormen met andere cellulaire eiwitten die bekend staan als coactivatoren18.
Het huidige artikel beschrijft een protocol om de aminozuurvoorkeuren van potentieel multispecifieke bindingsplaatsen te schatten op basis van in silico sequentiediversificatie. Er zijn maar weinig computationele tools ontwikkeld om aminozuurvoorkeuren van eiwit-peptide-interfaces te schatten 14,25,26. Deze tools hebben een voorspellend karakter, maar ze verschillen in de computationele algoritm…
The authors have nothing to disclose.
Financiële steun van Sistema Nacional de Investigación (SNI) (subsidienummers SNI-043-2023 en SNI-170-2021), Secretaría Nacional de Ciencia, Tecnología e Innovación (SENACYT) van Panama en Instituto para la Formación y Aprovechamiento de Recursos Humanos (IFARHU) wordt dankbaar erkend. De auteurs willen Dr. Miguel Rodríguez bedanken voor het zorgvuldig nakijken van het manuscript.
BUDE Alanine Scan Server | University of Edinburgh | https://pragmaticproteindesign.bio.ed.ac.uk/balas/ | doi: 10.1021/acschembio.9b00560 |
Rosetta Modeling Software | Rosetta Commons | https://www.rosettacommons.org/software | doi: 10.1002/prot.22851 |
UCSF Chimera | University of California San Francisco | https://www.cgl.ucsf.edu/chimera/ | doi: 10.1002/jcc.20084 |