Este protocolo presenta las herramientas disponibles para modelar ligandos de moléculas pequeñas en mapas crioEM de macromoléculas.
Descifrar las interacciones proteína-ligando en un complejo macromolecular es crucial para comprender el mecanismo molecular, los procesos biológicos subyacentes y el desarrollo de fármacos. En los últimos años, la microscopía electrónica criogénica de muestras (cryoEM) ha surgido como una técnica poderosa para determinar las estructuras de las macromoléculas e investigar el modo de unión del ligando a una resolución casi atómica. La identificación y el modelado de moléculas no proteicas en los mapas de crioEM suele ser un reto debido a la resolución anisotrópica de la molécula de interés y al ruido inherente a los datos. En este artículo, se presenta a los lectores varios programas y métodos que se utilizan actualmente para la identificación de ligandos, la construcción de modelos y el refinamiento de coordenadas atómicas utilizando macromoléculas seleccionadas. Una de las formas más sencillas de identificar la presencia de un ligando, como se ilustra con la enzima enolasa, es restar los dos mapas obtenidos con y sin el ligando. Es probable que la densidad adicional del ligando se destaque en el mapa de diferencias incluso en un umbral más alto. Hay casos, como se muestra en el caso del receptor metabotrópico de glutamato mGlu5, en los que no se pueden generar mapas de diferencias tan simples. El método recientemente introducido para derivar el mapa de omisión Fo-Fc puede servir como herramienta para validar y demostrar la presencia del ligando. Por último, utilizando como ejemplo la bien estudiada β-galactosidasa, se analiza el efecto de la resolución en el modelado de los ligandos y las moléculas de disolvente en los mapas de crioEM, y se presenta una perspectiva sobre cómo se puede utilizar la crioEM en el descubrimiento de fármacos.
Las células cumplen sus funciones llevando a cabo innumerables reacciones químicas de forma simultánea e independiente, cada una de las cuales está meticulosamente regulada para garantizar su supervivencia y adaptabilidad en respuesta a las señales ambientales. Esto se logra mediante el reconocimiento molecular, que permite que las biomoléculas, especialmente las proteínas, formen complejos transitorios o estables con otras macromoléculas, así como con pequeñas moléculas o ligandos1. Por lo tanto, las interacciones proteína-ligando son fundamentales para todos los procesos de la biología, que incluyen la regulación de la expresión y la actividad de las proteínas, el reconocimiento de sustratos y cofactores por parte de las enzimas, así como la forma en que las células perciben y transmiten las señales 1,2. Una mejor comprensión de las propiedades cinéticas, termodinámicas y estructurales del complejo proteína-ligando revela las bases moleculares de la interacción del ligando y también facilita el diseño racional de fármacos al optimizar la interacción y la especificidad del fármaco. Un enfoque económico y más rápido para estudiar la interacción proteína-ligando es utilizar el acoplamiento molecular, que es un método computacional que examina virtualmente una amplia gama de moléculas pequeñas y predice el modo de unión y la afinidad de estos ligandos con las proteínas diana. Sin embargo, la evidencia experimental de estructuras de alta resolución determinadas por difracción de rayos X (XRD), resonancia magnética nuclear (RMN) o criomicroscopía electrónica (crioEM) proporciona la prueba esencial para tales predicciones y ayuda en el desarrollo de activadores o inhibidores más nuevos y efectivos para un objetivo determinado. Este artículo utiliza la abreviatura ‘cryoEM’, como se conoce comúnmente a la técnica. Sin embargo, existe un debate en curso sobre la elección de la nomenclatura correcta y, recientemente, se ha propuesto el términoicroscopia M del lectrón Ede la muestra criogénica (cryoEM) para indicar que la muestra está a temperatura criogénica y se ha obtenido una imagen con electrones4. Del mismo modo, los mapas derivados de la crioEM se han denominado potencial electrónico, potencial electrostático o potencial de Coulomb, y para simplificar, aquí utilizamos los mapas crioEM 5,6,7,8,9,10.
A pesar de que la DRX ha sido la técnica de referencia en la determinación de la estructura de alta resolución de complejos proteína-ligando, la crioEM post-revolución de la resolución11 ha ganado impulso, como lo indica el aumento de los mapas de potencial de Coulomb o mapas de crioEM depositados en la Base de Datos de Microscopía Electrónica (EMDB)12,13 en los últimos años14. Debido a los avances en los métodos de preparación de muestras, imágenes y procesamiento de datos, el número de deposiciones del Banco de Datos de Proteínas (PDB)14 que emplean crioEM aumentó del 0,7% al 17% entre 2010 y 2020, y aproximadamente el 50% de las estructuras reportadas en 2020 se determinaron con una resolución de 3,5 Å o mejor15,16. CryoEM ha sido rápidamente adoptado por la comunidad de biología estructural, incluida la industria farmacéutica, ya que permite el estudio de macromoléculas biológicas flexibles y no cristalinas, especialmente proteínas de membrana y complejos multiproteicos, a una resolución casi atómica, superando el proceso de cristalización y obteniendo cristales bien difractantes necesarios para la determinación de estructuras de alta resolución por XRD.
El modelado preciso del ligando en el mapa crioEM es primordial, ya que sirve como modelo del complejo proteína-ligando a nivel molecular. Existen varias herramientas automatizadas de construcción de ligandos utilizadas en la cristalografía de rayos X que dependen de la forma y la topología de la densidad del ligando para ajustar o construir el ligando en la densidad de electrones 17,18,19,20. Sin embargo, si la resolución es inferior a 3 Å, estos enfoques tienden a producir resultados menos deseables porque las características topológicas de las que dependen para el reconocimiento y la construcción se vuelven menos definidas. En muchos casos, estos métodos han demostrado ser ineficaces para modelar con precisión ligandos en mapas crioEM, ya que estos mapas se han determinado en el rango de resolución baja a media, normalmente entre 3,5 Å-5 Å17.
El primer paso en la determinación de la estructura 3D de un complejo proteína-ligando mediante crioEM implica la copurificación del ligando con la proteína (cuando el ligando tiene una alta afinidad de unión a la proteína) o la incubación de la solución proteica con el ligando durante un período específico antes de la preparación en red. Posteriormente, se coloca un pequeño volumen de muestra en una rejilla TEM agujereada con plasma limpiada con plasma, seguida de una congelación instantánea en etano líquido y, finalmente, la obtención de imágenes con un crio-TEM. Las imágenes de proyección 2D de cientos de miles a millones de partículas individuales se promedian para reconstruir un mapa de potencial de Coulomb tridimensional (3D) de la macromolécula. La identificación y el modelado de ligandos y moléculas de solvente en estos mapas plantean desafíos significativos en muchos casos debido a la resolución anisotrópica en todo el mapa (es decir, la resolución no es uniforme en toda la macromolécula), la flexibilidad en la región donde se une el ligando y el ruido en los datos. Muchas de las herramientas de modelado, refinamiento y visualización que se desarrollaron para XRD ahora se están adaptando para su uso en crioEM para los mismos propósitos 18,19,20,21. En este artículo, se presenta una descripción general de varios métodos y software utilizados actualmente para identificar ligandos, construir modelos y refinar las coordenadas derivadas de la crioEM. Se ha proporcionado un protocolo paso a paso para ilustrar los procesos involucrados en el modelado de ligandos utilizando complejos proteína-ligando específicos con resolución y complejidad variables.
El primer paso en el modelado de ligandos en mapas crioEM incluye la identificación de la densidad de ligandos (no proteínas) en el mapa. Si la unión del ligando no induce ningún cambio conformacional en la proteína, entonces el cálculo de un mapa de diferencias simple entre el complejo proteína-ligando y la apo-proteína esencialmente resalta las regiones de densidad adicional, lo que sugiere la presencia del ligando. Tales diferencias se pueden observar de inmediato, ya que solo se requieren dos mapas, e incluso se pueden usar mapas intermedios durante el proceso de refinamiento 3D para verificar si el ligando está presente. Además, si la resolución es lo suficientemente alta (<3,0 Å), el mapa de diferencias también puede proporcionar información sobre la ubicación de las moléculas de agua, así como sobre los iones que interactúan con el ligando y los residuos de proteínas.
En ausencia del mapa de apoproteínas, ahora es posible utilizar Servalcat22, que está disponible como herramienta independiente y también se ha integrado en el paquete de software CCP-EM 23,24 como parte del refinamiento de Refmac y en CCP4 8.0 versión25,26. Servalcat permite el cálculo de un mapa de diferencia ponderada FSC (Fo-Fc) utilizando los semimapas sin nitir y el modelo de apoproteínas como entrada. El mapa de omisión Fo-Fc representa la disparidad entre el mapa experimental (Fo) y el mapa derivado del modelo (Fc). En ausencia de un ligando en el modelo, una densidad positiva en un mapa Fo-Fc que se superpone con el mapa EM experimental generalmente sugiere la presencia del ligando. La suposición aquí es que la cadena de proteínas está bien ajustada en el mapa, y la densidad positiva restante indica la ubicación del ligando. Sin embargo, es importante examinar meticulosamente si la densidad positiva se debe a imprecisiones en el modelado, como el rotámero incorrecto de una cadena lateral de proteína.
El segundo paso consiste en obtener o crear un archivo de coordenadas cartesianas del ligando con una geometría bien definida a partir de la información química disponible. Los ligandos estándar (por ejemplo, ATP y NADP+) que ya están disponibles en la biblioteca de monómeros CCP4 se pueden utilizar para el refinamiento mediante la recuperación de los archivos de coordenadas y geometría a través de su código de acceso de monómeros. Sin embargo, para ligandos desconocidos o no estándar, hay varias herramientas disponibles para crear los archivos de geometría. Algunos de los ejemplos incluyen el eLBOW27 – (generador electrónico de ligandos y banco de trabajo de optimización) en Phenix28, Lidia – una herramienta incorporada en Coot29, JLigand/ACEDRG30,31, CCP-EM23,24, Ligprep32-a módulo de Glide dentro de la suite Schrödinger. A continuación, el archivo de coordenadas del ligando se ajusta en la densidad, guiado tanto por el mapa experimental de crioEM como por el mapa de diferencias en Coot. A esto le sigue el refinamiento del espacio real en Phenix28 o el refinamiento recíproco en Refmac33. Se requiere una estación de trabajo Linux o una computadora portátil equipada con una buena tarjeta gráfica y el software mencionado anteriormente. La mayoría de estos programas están incluidos en varias suites. CCP-EM24 y Phenix28 están disponibles gratuitamente para usuarios académicos e incluyen una variedad de herramientas que se utilizan en este artículo, incluidas Coot, Refmac5 33,34,35,36, Servalcat, phenix.real_space_refine, etcetera. Del mismo modo, Chimera37 y ChimeraX38 proporcionan licencias gratuitas a usuarios académicos.
Las mejoras en el hardware y el software de los microscopios han dado lugar a un aumento en el número de estructuras crioEM en los últimos años. Aunque la resolución más alta alcanzada hasta el momento en crioEM de una sola partícula es de 1,2 Å57,58,59, la mayoría de las estructuras se están determinando alrededor de una resolución de 3-4 Å. El modelado de ligandos en mapas de resolución media a baja puede ser compl…
The authors have nothing to disclose.
SJ es beneficiario de la beca de doctorado de DAE-TIFR, y se reconoce la financiación. KRV agradece la subvención DBT B-Life DBT/PR12422/MED/31/287/2014 y el apoyo del Departamento de Energía Atómica del Gobierno de la India, bajo la Identificación de Proyecto No. RTI4006.
CCP4-8.0 | Consortium of several institutes | https://www.ccp4.ac.uk | Free for academic users and includes Coot and list of tools developed for X-ray crystallography |
CCP-EM | Consortium of several institutes | https://www.ccpem.ac.uk/download.php | Free for academic users and includes Coot, Relion and many others |
Coot | Paul Emsley, LMB, Cambridge | https://www2.mrc-lmb.cam.ac.uk/personal/pemsley/coot/ | General software for model building but also available with other suites described above |
DockinMap (Phenix) | Consortium of several institutes | https://phenix-online.org/documentation/reference/dock_in_map.html | Software inside the Phenix suite for docking model into cryoEM maps |
Electron Microscopy Data Bank | Consortium of several institutes | https://www.ebi.ac.uk/emdb/ | Public Repository for Electron Microscopy maps |
Falcon | Thermo Fisher Scientific | https://assets.thermofisher.com/TFS-Assets/MSD/Technical-Notes/Falcon-3EC-Datasheet.pdf | Commercial, camera from Thermo Fisher |
Phenix | Consortium of several institutes | https://phenix-online.org/download | Free for academic users and includes Coot |
Protein Data Bank | Consortium of several institutes | https://rcsb.org | Public database of macromolecular structures |
Pymol | Schrodinger | https://pymol.org/2/ | Molecular viusalization tool. Educational version is free but comes with limitation. The full version can be obtained with a small fee. |
Relion | MRC-LMB, Cambridge | https://relion.readthedocs.io/en/release-4.0/Installation.html | Software for cryoEM image processing, also available with CCP-EM |
Titan Krios | Thermo Fisher Scientific | https://www.thermofisher.com/in/en/home/electron-microscopy/products/transmission-electron-microscopes/krios-g4-cryo-tem.html?cid=msd_ls_xbu_xmkt_tem-krios_285811_gl_pso_gaw_tpne1c& gad_source=1&gclid=CjwKCAiA-P-rBhBEEiwAQEXhHyw5c8MKThmdA AkZesWC4FYQSwIQRk ZApkj08MfYG040DtiiuL8 RihoCebEQAvD_BwE |
Commercial, cryoTEM from Thermo Fisher |
UCSF Chimera | UCSF, USA | https://www.cgl.ucsf.edu/chimera/download.html | General purpose software for display, analysis and more |
UCSF Chimera X | UCSF, USA | https://www.cgl.ucsf.edu/chimerax/ | General purpose software for display, analysis and more |