Wir beschreiben eine auf Sequenzdiversifikation basierende Methodik zur Abschätzung der Aminosäurepräferenzen multispezifischer Bindungsstellen in Protein-Protein-Wechselwirkungen (PPIs). Bei dieser Strategie werden Tausende von potentiellen Peptidliganden erzeugt und in silico gescreent, wodurch einige Einschränkungen der verfügbaren experimentellen Methoden überwunden werden.
Viele Protein-Protein-Wechselwirkungen beinhalten die Bindung kurzer Proteinsegmente an Peptidbindungsdomänen. In der Regel erfordern solche Wechselwirkungen das Erkennen linearer Motive mit variabler Konservierung. Die Kombination von hochkonservierten und variableren Regionen in denselben Liganden trägt oft zur Multispezifität der Bindung bei, eine gemeinsame Eigenschaft von Enzymen und zellulären Signalproteinen. Die Charakterisierung der Aminosäurepräferenzen von Peptidbindungsdomänen ist wichtig für das Design von Mediatoren von Protein-Protein-Wechselwirkungen (PPIs). Computergestützte Methoden sind eine effiziente Alternative zu den oft kostspieligen und umständlichen experimentellen Techniken und ermöglichen das Design potenzieller Mediatoren, die später in nachgelagerten Experimenten validiert werden können. In dieser Arbeit haben wir eine Methodik beschrieben, die die Pepspec-Anwendung des molekularen Modellierungspakets von Rosetta verwendet, um die Aminosäurepräferenzen von Peptidbindungsdomänen vorherzusagen. Diese Methode ist nützlich, wenn sowohl die Struktur des Rezeptorproteins als auch die Art des Peptidliganden bekannt sind oder abgeleitet werden können. Die Methodik beginnt mit einem gut charakterisierten Anker aus dem Liganden, der durch zufällige Zugabe von Aminosäureresten erweitert wird. Die Bindungsaffinität der auf diese Weise erzeugten Peptide wird dann durch flexibles Rückgrat-Peptid-Docking bewertet, um die Peptide mit den besten vorhergesagten Bindungswerten auszuwählen. Diese Peptide werden dann zur Berechnung von Aminosäurepräferenzen und optional zur Berechnung einer Positionsgewichtsmatrix (PWM) verwendet, die in weiteren Studien verwendet werden kann. Um die Anwendung dieser Methodik zu veranschaulichen, verwendeten wir die Interaktion zwischen Untereinheiten des humanen Interferon-Regulationsfaktors 5 (IRF5), von dem bisher bekannt war, dass er multispezifisch ist, aber global von einem kurzen konservierten Motiv namens pLxIS geleitet wird. Die geschätzten Aminosäurepräferenzen stimmten mit den bisherigen Erkenntnissen über die IRF5-Bindungsoberfläche überein. Positionen, die von phosphorylierbaren Serinresten eingenommen wurden, wiesen eine hohe Häufigkeit von Aspartat und Glutamat auf, wahrscheinlich weil ihre negativ geladenen Seitenketten denen von Phosphoserin ähneln.
Die Interaktion zwischen zwei Proteinen beinhaltet oft die Bindung kurzer Segmente von Aminosäuren an Peptid-Bindungsdomänen, die Protein-Peptid-Grenzflächen ähneln. Rezeptorproteine, die an solchen Protein-Protein-Wechselwirkungen (PPI) beteiligt sind, haben oft die Fähigkeit, einen bestimmten Satz überlappender, aber divergierender Ligandensequenzen zu erkennen, eine Eigenschaft, die als Multispezifität bekannt ist 1,2. Die multispezifische Erkennung ist ein Merkmal vieler zellulärer Proteine, aber besonders bemerkenswert ist sie bei Enzymen und zellulären Signalproteinen3. Proteine, die mit multispezifischen Bindungsstellen interagieren, haben oft eine Kombination aus mehr und weniger konservierten Regionen in ihrer Sequenz 4,5,6. In diesem Szenario sind die stärker konservierten Sequenzmotive an stringenten molekularen Wechselwirkungen beteiligt. Umgekehrt interagieren die variableren Sequenzen mit irgendwie permissiven Oberflächen in der Rezeptorbindungsstelle. In der Regel handelt es sich bei diesen weniger konservierten, aber immer noch funktionell relevanten Segmenten um Schleifen ohne definierte Sekundärstrukturmuster oder um noch dynamischere Konformationen, wie sie für intrinsisch ungeordnete Proteine typisch sind7.
Die Identifizierung potenzieller Peptidliganden von Bindungsstellen ist in der Regel der erste Schritt bei der Entwicklung von Mediatoren, die in der Lage sind, die entsprechenden PPIs zu interferieren8. Es ist jedoch oft unwahrscheinlich, einen einzigen der häufigsten Aminosäurereste an den meisten Sequenzpositionen in Liganden multispezifischer Bindungsstellen zu finden. Stattdessen können diese Stellen besondere Präferenzen für eine bestimmte Klasse von Aminosäuren entsprechend ihren chemischen Eigenschaften haben, z. B. saure und negativ geladene Aminosäuren wie Aspartat oder Glutamat, sperrige aromatische Aminosäuren wie Phenylalanin oder mehr hydrophobe Reste wie aliphatische Aminosäuren Alanin, Valin, Leucin oder Isoleucin3. Verschiedene experimentelle Methoden können Einblicke in die Aminosäurepräferenzen von Proteinbindungsstellen liefern, darunter die gerichtete Evolution9, die Multicodon-Scanning-Mutagenese10 und die tiefeMutations-Scanning 11. Alle diese Methoden folgen dem Ansatz der Sequenzdiversifizierung, der darauf basiert, Mutationen in ursprüngliche Liganden einzuführen und deren Wirkung auf die Funktion des Rezeptorproteins weiter zu analysieren (siehe Bratulic und Badran12 für eine umfassende Übersicht). Diese Methoden erfordern jedoch oft die Durchsicht großer Sequenzbibliotheken, was sie umständlicher, kostspieliger und zeitaufwändiger macht.
Computergestützte Methoden zur Ableitung der Aminosäurepräferenzen multispezifischer Bindungsstellen haben das Potenzial, die Einschränkungen von Nasslabormethoden zu umgehen. Unter diesen bewertet der In-silico-Sequenzdiversifikationsansatz den energetischen Einfluss einer Vielzahl von Aminosäureersatzstoffen in der Ligandensequenz, um die strukturelle Plastizität des PPI13 zu charakterisieren. Diese Methode beginnt mit der Struktur oder dem Modell des Peptidliganden, der an die Rezeptorbindungsstelle gebunden ist, und führt anschließend Mutationen in die Ligandensequenz ein. Statistische und Energie-Scoring-Funktionen werden dann verwendet, um den Einfluss dieser Mutationen auf die Stabilität und Bindungsaffinität zu bewerten. Der Satz der Ligandensequenzen mit der besten Punktzahl, der sich aus der Evaluierungsphase ergibt, kann dann zur Berechnung der Aminosäurepräferenzen verwendet werden. Diese Strategie hat das Potenzial, eine sehr große Anzahl von Ligandensequenzen effizient zu verarbeiten. Daher kann es eine vollständigere und konsistentere Rückschluss auf die Aminosäurepräferenzen liefern, verglichen mit denen, die aus der begrenzteren Anzahl von Sequenzen berechnet werden, die normalerweise in Nasslaboransätzen verarbeitet werden können.
Die Pepspec-Anwendung der Rosetta Molecular Modeling Suite14 ist ein Werkzeug, das die Sequenzdiversifizierung als wichtigen Schritt seines Peptiddesignmodus durchführt. Diese Anwendung erfordert eine Struktur oder ein Modell des Rezeptorproteins mit einem gebundenen Peptid bis zu einem einzigen Aminosäurerest in der Länge, das als Anker für die nächsten Schritte verwendet wird. Die Sequenz des gebundenen Peptids wird dann (falls erforderlich) verlängert und diversifiziert, um eine große Anzahl von mutmaßlichen Peptidliganden zu erzeugen. Die Bindungsaffinität dieser Peptide wird dann durch Peptid-Docking mit flexiblem Rückgrat bewertet, um diejenigen mit den besten vorhergesagten Bindungswerten auszuwählen. Obwohl das Hauptergebnis dieser Anwendung die besten Peptidkandidaten sind, die am Ende der Designphase ausgewählt werden, kann die viel größere Menge von Peptiden, die in dieser Phase akzeptiert werden, auch zur Berechnung der Aminosäurepräferenzen der Zielbindungsstelle verwendet werden. Aminosäurepräferenzen werden als Häufigkeit jedes Aminosäurerests pro Position der Ligandensequenz berechnet, die entweder als Positionsgewichtsmatrix (PWM) oder als visuelleres Sequenzlogo dargestellt wird.
In diesem Artikel beschreiben wir ein Protokoll zur Abschätzung der Aminosäurepräferenzen der Bindungsoberfläche eines Rezeptorproteins, das an einem PPI beteiligt ist. Das Protokoll konzentriert sich auf PPIs, bei denen bekannt ist, dass ein lineares Segment des Protein-Liganden an das Rezeptorprotein bindet, so dass das Szenario als Protein-Peptid-Schnittstelle modelliert werden kann. In diesem Szenario interagieren konservierte Motive aus dem Liganden typischerweise mit definierten Taschen in der Rezeptorbindungsstelle, obwohl das gesamte Ligandensegment, das an der PPI beteiligt ist, weniger konservierte Regionen enthalten kann. Ein Flussdiagramm, das die wichtigsten Schritte des Protokolls zusammenfasst, ist in Abbildung 1 dargestellt. Das Protokoll beginnt mit der 3D-Struktur des Protein-Protein-Komplexes und reduziert das Ligandenprotein weiter auf das potenziell am besten interagierende Segment, wobei das Rezeptorprotein intakt bleibt. Das am besten interagierende Segment wird unter Verwendung des BUDE Alanin-Scan-Servers15 abgeleitet, der eine rechnergestützte Alanin-Scanning-Mutagenese durchführt, um Hot-Spot-Reste zwischen den beiden interagierenden Proteinen zu identifizieren. Bei diesem Ansatz werden Reste aus dem Liganden einzeln durch Alanin ersetzt, und die geschätzte Änderung der freien Energie oder Stabilität des Komplexes (ΔΔG) wird dann verwendet, um auf die Relevanz des entsprechenden Rests für den Ziel-PPI zu schließen. Sobald das am besten interagierende Segment abgeleitet ist, wird sein Komplex mit dem Rezeptorprotein als Basisstruktur verwendet, die an Pepspec übermittelt wird, um eine Sequenzdiversifizierung durchzuführen.
Abbildung 1: Überblick über die wichtigsten Schritte des Protokolls, das in dieser Arbeit vorgeschlagen wird. Die Nummern stimmen mit den Schrittnummern im Protokollabschnitt überein. Die Abbildungen wurden mit dem Protein-Protein-Komplex erstellt, der als Beispiel für das im Text beschriebene Beispiel verwendet wird. In diesem Komplex ist die Proteinkette, die als Rezeptor betrachtet wird, rosa dargestellt, während die Kette, die als Ligand betrachtet wird, in hellblau dargestellt ist, wobei ihr vorhergesagtes Segment mit der besten Wechselwirkung rot hervorgehoben ist. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.
Eine der Einschränkungen des vorgeschlagenen Protokolls ist die Anforderung einer aufgelösten Struktur der Protein-Peptid-Grenzfläche. Das Protokoll kann alternativ mit einem Modell der Zielprotein-Peptid-Grenzfläche beginnen, obwohl die spezifischen Modellierungsschritte hier nicht beschrieben werden. Obwohl das Protokoll auf einem PC mit einem beliebigen Betriebssystem ausgeführt werden kann, ist für die Schritte mit den Rosetta-Anwendungen eine Linux-Umgebung erforderlich. Ein Computercluster wird auch für den Schritt der Sequenzdiversifizierung dringend empfohlen, da Pepspec typischerweise eine große Anzahl von Iterationen durchführt.
Die Anwendung des vorgeschlagenen Protokolls wird durch die Schätzung der Aminosäurepräferenzen der Gebotsfläche von IRF5, einem Mitglied der Familie der humanen Interferon-Regulationsfaktoren (IRF), veranschaulicht. Wir haben dieses Protein als Beispiel gewählt, weil sich während seiner Aktivierung zwei Untereinheiten zu einem Dimer verbinden, dessen Struktur gut charakterisiert ist16. In IRF-Dimeren kann die Bindung als Protein-Peptid-Grenzfläche modelliert werden, bei der eine Untereinheit die Bindungsoberfläche bildet und die andere durch eine Region interagiert, die ein kurzes konserviertes Motiv namens pLxIS17,18 enthält. Darüber hinaus ist die Bindung an IRF-Untereinheiten multispezifisch; Daher können sie Homodimere, Heterodimere und Komplexe mit anderen zellulären Proteinen bilden, die als Koaktivatoren bekannt sind18.
Der vorliegende Artikel beschreibt ein Protokoll zur Abschätzung der Aminosäurepräferenzen potentiell multispezifischer Bindungsstellen auf der Grundlage einer in silico Sequenzdiversifikation. Es wurden nur wenige computergestützte Werkzeuge entwickelt, um die Aminosäurepräferenzen von Protein-Peptid-Grenzflächen abzuschätzen 14,25,26. Diese Tools haben einen prädiktiven Charakter, unt…
The authors have nothing to disclose.
Die finanzielle Unterstützung durch das Sistema Nacional de Investigación (SNI) (Förderkennzeichen SNI-043-2023 und SNI-170-2021), die Secretaría Nacional de Ciencia, die Tecnología e Innovación (SENACYT) von Panama und das Instituto para la Formación y Aprovechamiento de Recursos Humanos (IFARHU) werden dankbar gewürdigt. Die Autoren danken Dr. Miguel Rodríguez für die sorgfältige Durchsicht des Manuskripts.
BUDE Alanine Scan Server | University of Edinburgh | https://pragmaticproteindesign.bio.ed.ac.uk/balas/ | doi: 10.1021/acschembio.9b00560 |
Rosetta Modeling Software | Rosetta Commons | https://www.rosettacommons.org/software | doi: 10.1002/prot.22851 |
UCSF Chimera | University of California San Francisco | https://www.cgl.ucsf.edu/chimera/ | doi: 10.1002/jcc.20084 |