Describimos una metodología basada en la diversificación de secuencias para estimar las preferencias de aminoácidos de sitios de unión multiespecíficos en interacciones proteína-proteína (PPIs). En esta estrategia, se generan miles de ligandos peptídicos potenciales y se seleccionan in silico, superando así algunas limitaciones de los métodos experimentales disponibles.
Muchas interacciones proteína-proteína implican la unión de segmentos cortos de proteína a dominios de unión a péptidos. Por lo general, tales interacciones requieren el reconocimiento de motivos lineales con conservación variable. La combinación de regiones altamente conservadas y más variables en los mismos ligandos a menudo contribuye a la multiespecificidad de la unión, una propiedad común de las enzimas y las proteínas de señalización celular. La caracterización de las preferencias de aminoácidos de los dominios de unión a péptidos es importante para el diseño de mediadores de las interacciones proteína-proteína (PPI). Los métodos computacionales son una alternativa eficiente a las técnicas experimentales, a menudo costosas y engorrosas, ya que permiten el diseño de mediadores potenciales que pueden validarse posteriormente en experimentos posteriores. Aquí, describimos una metodología utilizando la aplicación Pepspec del paquete de modelado molecular Rosetta para predecir las preferencias de aminoácidos de los dominios de unión a péptidos. Esta metodología es útil cuando la estructura de la proteína receptora y la naturaleza del ligando peptídico son conocidas o se pueden inferir. La metodología comienza con un anclaje bien caracterizado del ligando, que se amplía mediante la adición aleatoria de residuos de aminoácidos. La afinidad de unión de los péptidos generados de esta manera se evalúa mediante el acoplamiento de péptidos de columna vertebral flexible para seleccionar los péptidos con las mejores puntuaciones de unión predichas. Estos péptidos se utilizan para calcular las preferencias de aminoácidos y, opcionalmente, para calcular una matriz de posición-peso (PWM) que se puede utilizar en estudios posteriores. Para ilustrar la aplicación de esta metodología, utilizamos la interacción entre subunidades del factor regulador 5 del interferón humano (IRF5), previamente conocido como multiespecífico pero guiado globalmente por un motivo conservado corto llamado pLxIS. Las preferencias estimadas de aminoácidos fueron consistentes con el conocimiento previo sobre la superficie de unión de IRF5. Las posiciones ocupadas por residuos de serina fosforilatables exhibieron una alta frecuencia de aspartato y glutamato, probablemente porque sus cadenas laterales cargadas negativamente son similares a las de la fosfoserina.
La interacción entre dos proteínas a menudo implica la unión de segmentos cortos de aminoácidos a dominios de unión a péptidos, que se asemejan a las interfaces proteína-péptido. Las proteínas receptoras involucradas en tales interacciones proteína-proteína (PPI) a menudo tienen la capacidad de reconocer un cierto conjunto de secuencias de ligandos superpuestas pero divergentes, una propiedad conocida como multiespecificidad 1,2. El reconocimiento multiespecífico es una característica de muchas proteínas celulares, pero es particularmente notable en las enzimas y las proteínas de señalización celular3. Las proteínas que interactúan con sitios de unión multiespecíficos a menudo tienen una combinación de regiones más y menos conservadas en su secuencia 4,5,6. En este escenario, los motivos de secuencia más conservados están involucrados en interacciones moleculares estrictas. Por el contrario, las secuencias más variables interactúan con superficies de alguna manera permisivas en el sitio de unión al receptor. Por lo general, estos segmentos menos conservados, pero aún funcionalmente relevantes, son bucles que carecen de patrones de estructura secundaria definidos o tienen conformaciones aún más dinámicas, como las típicas de las proteínas intrínsecamente desordenadas7.
La identificación de posibles ligandos peptídicos de los sitios de unión suele ser el primer paso en el diseño de mediadores capaces de interferir con los PPIs correspondientes8. Sin embargo, a menudo es poco probable encontrar un único residuo de aminoácidos más frecuente en la mayoría de las posiciones de secuencia en ligandos de sitios de unión multiespecíficos. En cambio, estos sitios pueden tener preferencias particulares por una clase específica de aminoácidos de acuerdo con sus propiedades químicas, por ejemplo, aminoácidos ácidos y cargados negativamente como aspartato o glutamato, aminoácidos aromáticos voluminosos como fenilalanina o residuos más hidrofóbicos como aminoácidos alifáticos alanina, valina, leucina o isoleucina3. Varios métodos experimentales pueden proporcionar información sobre las preferencias de aminoácidos de los sitios de unión a proteínas, incluida la evolución dirigida9, la mutagénesis de escaneo multicodón10 y la exploración mutacional profunda11. Todos estos métodos siguen el enfoque de diversificación de secuencias, que se basa en la introducción de mutaciones en los ligandos originales y en el análisis posterior de su efecto sobre la función de la proteína receptora (véase Bratulic y Badran12 para una revisión exhaustiva). Sin embargo, estos métodos a menudo requieren el estudio de grandes bibliotecas de secuencias, lo que los hace más engorrosos, costosos y lentos.
Los métodos computacionales para inferir las preferencias de aminoácidos de los sitios de unión multiespecíficos tienen el potencial de eludir las limitaciones de los métodos de laboratorio húmedo. Entre estos, el enfoque de diversificación de secuencia in silico evalúa el impacto energético de una amplia gama de reemplazos de aminoácidos en la secuencia del ligando como una forma de caracterizar la plasticidad estructural del PPI13. Este método comienza con la estructura o modelo del ligando peptídico unido al sitio de unión al receptor y, posteriormente, introduce mutaciones en la secuencia del ligando. A continuación, se utilizan funciones estadísticas y de puntuación de energía para evaluar el impacto de estas mutaciones en la estabilidad y la afinidad de unión. El conjunto de secuencias de ligandos con mejor puntuación resultante de la fase de evaluación se puede utilizar para calcular las preferencias de aminoácidos. Esta estrategia tiene el potencial de procesar un número muy alto de secuencias de ligandos de manera eficiente. Por lo tanto, puede proporcionar una inferencia más completa y consistente de las preferencias de aminoácidos en comparación con las calculadas a partir del número más limitado de secuencias que generalmente se pueden procesar en enfoques de laboratorio húmedo.
La aplicación Pepspec de la suite de modelado molecularRosetta 14 es una herramienta que realiza la diversificación de secuencias como un paso clave de su modo de diseño de péptidos. Esta aplicación requiere una estructura o modelo de la proteína receptora con un péptido unido a un solo residuo de aminoácido de longitud, que se utiliza como ancla para los siguientes pasos. A continuación, la secuencia del péptido unido se amplía (si es necesario) y se diversifica para generar un gran número de ligandos peptídicos putativos. A continuación, se evalúa la afinidad de unión de estos péptidos mediante el acoplamiento de péptidos de columna vertebral flexible para seleccionar aquellos con las mejores puntuaciones de unión predichas. Aunque el resultado principal de esta aplicación son los mejores candidatos a péptidos seleccionados al final de la fase de diseño, el conjunto mucho mayor de péptidos aceptados durante esta fase también se puede utilizar para calcular las preferencias de aminoácidos del sitio de unión objetivo. Las preferencias de aminoácidos se calculan como la frecuencia de cada residuo de aminoácidos por posición de la secuencia del ligando, representada como una matriz de peso de posición (PWM) o como un logotipo de secuencia más visual.
En este artículo, describimos un protocolo para estimar las preferencias de aminoácidos de la superficie de unión de una proteína receptora involucrada en un IBP. El protocolo se centra en los IBP en los que se sabe que un segmento lineal del ligando de la proteína se une a la proteína receptora, por lo que el escenario se puede modelar como una interfaz proteína-péptido. En este escenario, los motivos conservados del ligando suelen interactuar con bolsillos definidos en el sitio de unión al receptor, aunque todo el segmento del ligando implicado en el PPI puede contener regiones menos conservadas. En la Figura 1 se muestra un diagrama de flujo que resume los pasos principales del protocolo. El protocolo comienza con la estructura 3D del complejo proteína-proteína y reduce aún más la proteína ligando al segmento potencial de mejor interacción, dejando intacta la proteína receptora. El segmento que mejor interactúa se infiere mediante el uso del servidor BUDE Alanine Scan15, que realiza mutagénesis computacional de barrido con alanina para identificar residuos de puntos calientes entre las dos proteínas que interactúan. En este enfoque, los residuos del ligando se reemplazan individualmente por alanina, y el cambio estimado en la energía libre o la estabilidad del complejo (ΔΔG) se utiliza para inferir la relevancia del residuo correspondiente para el PPI objetivo. Una vez que se infiere el segmento que mejor interactúa, su complejo con la proteína receptora se utiliza como estructura base presentada a Pepspec para realizar la diversificación de secuencias.
Figura 1: Resumen de los principales pasos del protocolo propuesto en este trabajo. Los números coinciden con los números de paso de la sección de protocolo. Las figuras se realizaron con el complejo proteína-proteína utilizado como ejemplo descrito en el texto. En este complejo, la cadena de proteínas considerada como el receptor se muestra en rosa, mientras que la cadena considerada como el ligando se muestra en azul claro con su segmento de mejor interacción resaltado en rojo. Haga clic aquí para ver una versión más grande de esta figura.
Una de las limitaciones del protocolo sugerido es el requisito de una estructura resuelta de la interfaz proteína-péptido. Alternativamente, el protocolo puede comenzar con un modelo de la interfaz proteína-péptido diana, aunque los pasos específicos del modelado no se describen aquí. Además, aunque el protocolo se puede llevar a cabo en una computadora personal que ejecute cualquier sistema operativo, se requiere un entorno Linux para los pasos que involucran las aplicaciones de Rosetta. Un clúster de computadoras también es muy recomendable para el paso de diversificación de secuencias debido a la gran cantidad de iteraciones que normalmente realiza Pepspec.
La aplicación del protocolo sugerido se ilustra con la estimación de las preferencias de aminoácidos de la superficie de oferta de IRF5, un miembro de la familia del factor regulador del interferón humano (IRF). Elegimos esta proteína como ejemplo porque, durante su activación, dos subunidades se unen para formar un dímero cuya estructura está bien caracterizada16. En los dímeros IRF, la unión se puede modelar como una interfaz proteína-péptido en la que una subunidad proporciona la superficie de unión y la otra interactúa a través de una región que contiene un motivo conservado corto llamado pLxIS17,18. Además, el enlace a las subunidades IRF es multiespecífico; Por lo tanto, pueden formar homodímeros, heterodímeros y complejos con otras proteínas celulares conocidos como coactivadores18.
El presente artículo describe un protocolo para estimar las preferencias de aminoácidos de sitios de unión potencialmente multiespecíficos basado en la diversificación de secuencias in silico. Se han desarrollado pocas herramientas computacionales para estimar las preferencias de aminoácidos de las interfaces proteína-péptido 14,25,26. Estas herramientas tienen una naturaleza predictiva,…
The authors have nothing to disclose.
Se agradece el apoyo financiero del Sistema Nacional de Investigación (SNI) (subvenciones números SNI-043-2023 y SNI-170-2021), la Secretaría Nacional de Ciencia, Tecnología e Innovación (SENACYT) de Panamá y el Instituto para la Formación y Aprovechamiento de Recursos Humanos (IFARHU). Los autores desean agradecer al Dr. Miguel Rodríguez por la cuidadosa revisión del manuscrito.
BUDE Alanine Scan Server | University of Edinburgh | https://pragmaticproteindesign.bio.ed.ac.uk/balas/ | doi: 10.1021/acschembio.9b00560 |
Rosetta Modeling Software | Rosetta Commons | https://www.rosettacommons.org/software | doi: 10.1002/prot.22851 |
UCSF Chimera | University of California San Francisco | https://www.cgl.ucsf.edu/chimera/ | doi: 10.1002/jcc.20084 |