Ce protocole présente les outils disponibles pour la modélisation de ligands de petites molécules dans les cartes cryoEM des macromolécules.
Déchiffrer les interactions protéine-ligand dans un complexe macromoléculaire est crucial pour comprendre le mécanisme moléculaire, les processus biologiques sous-jacents et le développement de médicaments. Ces dernières années, la microscopie électronique cryogénique d’échantillon (cryoEM) est apparue comme une technique puissante pour déterminer les structures des macromolécules et pour étudier le mode de liaison des ligands à une résolution proche de l’atome. L’identification et la modélisation de molécules non protéiques dans les cartes cryoEM sont souvent difficiles en raison de la résolution anisotrope de la molécule d’intérêt et du bruit inhérent aux données. Dans cet article, les lecteurs sont initiés à divers logiciels et méthodes actuellement utilisés pour l’identification des ligands, la construction de modèles et l’affinement des coordonnées atomiques à l’aide de macromolécules sélectionnées. L’une des façons les plus simples d’identifier la présence d’un ligand, comme illustré avec l’enzyme énolase, est de soustraire les deux cartes obtenues avec et sans le ligand. La densité supplémentaire du ligand est susceptible de se démarquer dans la carte des différences, même à un seuil plus élevé. Il y a des cas, comme le montre le cas du récepteur métabotropique du glutamate mGlu5, où de telles cartes de différences simples ne peuvent pas être générées. La méthode récemment introduite pour dériver la carte d’omission Fo-Fc peut servir d’outil pour valider et démontrer la présence du ligand. Enfin, en utilisant l’exemple bien étudié de la β-galactosidase, l’effet de la résolution sur la modélisation des ligands et des molécules de solvant dans les cartes cryoEM est analysé, et une perspective sur la façon dont la cryoEM peut être utilisée dans la découverte de médicaments est présentée.
Les cellules accomplissent leurs fonctions en effectuant d’innombrables réactions chimiques simultanément et indépendamment, chacune méticuleusement régulée pour assurer leur survie et leur adaptabilité en réponse aux signaux environnementaux. Ceci est réalisé par la reconnaissance moléculaire, qui permet aux biomolécules, en particulier aux protéines, de former des complexes transitoires ou stables avec d’autres macromolécules ainsi qu’avec de petites molécules ou des ligands1. Ainsi, les interactions protéine-ligand sont fondamentales pour tous les processus de la biologie, qui comprennent la régulation de l’expression et de l’activité des protéines, la reconnaissance des substrats et des cofacteurs par les enzymes, ainsi que la façon dont les cellules perçoivent et relaient les signaux 1,2. Une meilleure compréhension des propriétés cinétiques, thermodynamiques et structurelles du complexe protéine-ligand révèle la base moléculaire de l’interaction des ligands et facilite également la conception rationnelle de médicaments en optimisant l’interaction et la spécificité des médicaments. Une approche économique et plus rapide pour étudier l’interaction protéine-ligand consiste à utiliser l’amarrage moléculaire, qui est une méthode computationnelle qui crible virtuellement une gamme variée de petites molécules et prédit le mode de liaison et l’affinité de ces ligands pour cibler les protéines3. Cependant, les preuves expérimentales provenant de structures à haute résolution déterminées par diffraction des rayons X (DRX), résonance magnétique nucléaire (RMN) ou cryomicroscopie électronique (cryoEM) fournissent la preuve essentielle de ces prédictions et aident au développement d’activateurs ou d’inhibiteurs plus récents et plus efficaces pour une cible donnée. Cet article utilise l’abréviation « cryoEM » comme on l’appelle communément. Cependant, il y a un débat en cours sur le choix de la bonne nomenclature, et récemment, le terme cryogénique-échantillon Electron Microscopie (cryoEM) a été proposé pour indiquer que l’échantillon est à température cryogénique et imagé avec des électrons4. De même, les cartes dérivées de la cryoEM ont été appelées potentiel électron, potentiel électrostatique ou potentiel de Coulomb, et pour simplifier, nous utilisons ici les cartes cryoEM 5,6,7,8,9,10.
Bien que la XRD ait été la technique de référence dans la détermination de la structure à haute résolution des complexes protéine-ligand, la cryoEM post-révolutionde résolution 11 a pris de l’ampleur, comme l’indique l’augmentation des cartes de potentiel de Coulomb ou des cartes cryoEM déposées dans la base de données de microscopie électronique (EMDB)12,13 au cours des dernières années14. En raison des progrès réalisés dans les méthodes de préparation des échantillons, d’imagerie et de traitement des données, le nombre de dépôts de la banque de données sur les protéines (PDB)14 utilisant la cryoEM est passé de 0,7 % à 17 % entre 2010 et 2020, avec environ 50 % des structures signalées en 2020 déterminées à une résolution de 3,5 Å ou mieux15,16. La cryoEM a été rapidement adoptée par la communauté de la biologie structurale, y compris l’industrie pharmaceutique, car elle permet l’étude de macromolécules biologiques flexibles et non cristallines, en particulier les protéines membranaires et les complexes multiprotéiques, à une résolution quasi atomique, surmontant le processus de cristallisation et obtenant des cristaux bien diffractant nécessaires à la détermination de la structure à haute résolution par DRX.
La modélisation précise du ligand dans la carte cryoEM est primordiale, car elle sert de modèle du complexe protéine-ligand au niveau moléculaire. Il existe plusieurs outils automatisés de construction de ligands utilisés en cristallographie aux rayons X qui dépendent de la forme et de la topologie de la densité du ligand afin d’ajuster ou de construire le ligand dans la densité électronique 17,18,19,20. Néanmoins, si la résolution est inférieure à 3 Å, ces approches ont tendance à produire des résultats moins souhaitables car les caractéristiques topologiques dont elles dépendent pour la reconnaissance et la construction deviennent moins définies. Dans de nombreux cas, ces méthodes se sont avérées inefficaces pour modéliser avec précision les ligands dans des cartes cryoEM, car ces cartes ont été déterminées dans la gamme de résolution faible à moyenne, généralement entre 3,5 Å-5 Å17.
La première étape de la détermination de la structure 3D d’un complexe protéine-ligand par cryoEM consiste soit à co-purifier le ligand avec la protéine (lorsque le ligand a une affinité de liaison élevée avec la protéine), soit à incuber la solution protéique avec le ligand pendant une durée spécifique avant la préparation de la grille. Ensuite, un petit volume d’échantillon est placé sur une grille TEM perforée nettoyée au plasma, suivie d’une congélation instantanée dans de l’éthane liquide et enfin d’une imagerie avec un cryo-TEM. La moyenne des images de projection 2D de centaines de milliers à des millions de particules individuelles est calculée pour reconstruire une carte de potentiel de Coulomb en 3D (3D) de la macromolécule. L’identification et la modélisation des ligands et des molécules de solvant dans ces cartes posent des défis importants dans de nombreux cas en raison de la résolution anisotrope sur l’ensemble de la carte (c’est-à-dire que la résolution n’est pas uniforme sur l’ensemble de la macromolécule), de la flexibilité dans la région où le ligand est lié et du bruit dans les données. De nombreux outils de modélisation, d’affinement et de visualisation qui ont été développés pour la DRX sont maintenant adaptés pour être utilisés dans la cryoEM aux mêmes fins 18,19,20,21. Dans cet article, nous présentons un aperçu des différentes méthodes et logiciels actuellement utilisés pour identifier les ligands, construire des modèles et affiner les coordonnées dérivées de la cryoEM. Un protocole étape par étape a été fourni pour illustrer les processus impliqués dans la modélisation de ligands à l’aide de complexes protéine-ligand spécifiques avec une résolution et une complexité variables.
La première étape de la modélisation des ligands dans les cartes cryoEM comprend l’identification de la densité du ligand (non-protéine) dans la carte. Si la liaison du ligand n’induit aucun changement de conformation dans la protéine, le calcul d’une simple carte de différence entre le complexe protéine-ligand et l’apo-protéine met essentiellement en évidence les régions de densité supplémentaire, suggérant la présence du ligand. De telles différences peuvent être observées immédiatement, car il suffit de deux cartes, et même des cartes intermédiaires pendant le processus de raffinement 3D peuvent être utilisées pour vérifier si le ligand est présent. De plus, si la résolution est suffisamment élevée (<3,0 Å), la carte des différences peut également fournir des informations sur l’emplacement des molécules d’eau ainsi que des ions interagissant avec le ligand et les résidus protéiques.
En l’absence de la carte apo-protéine, il est maintenant possible d’utiliser Servalcat22, qui est disponible en tant qu’outil autonome et a également été intégré dans la suite logicielle CCP-EM 23,24 dans le cadre du raffinement de Refmac et dans CCP4 8.0 version25,26. Servalcat permet le calcul d’une carte de différence pondérée FSC (Fo-Fc) en utilisant les demi-cartes non nettes et le modèle d’apoprotéine comme entrée. La carte omise Fo-Fc représente la disparité entre la carte expérimentale (Fo) et la carte dérivée du modèle (Fc). En l’absence d’un ligand dans le modèle, une densité positive dans une carte Fo-Fc qui chevauche la carte EM expérimentale suggère généralement la présence du ligand. L’hypothèse ici est que la chaîne protéique est bien ajustée sur la carte, et que la densité positive restante indique l’emplacement du ligand. Cependant, il est important d’examiner méticuleusement si la densité positive provient d’inexactitudes de modélisation, telles que le mauvais rotamère d’une chaîne latérale de protéines.
La deuxième étape consiste à obtenir ou à créer un fichier de coordonnées cartésiennes du ligand avec une géométrie bien définie à partir des informations chimiques disponibles. Les ligands standard (par exemple, ATP et NADP+) qui sont déjà disponibles dans la bibliothèque de monomères CCP4 peuvent être utilisés pour le raffinement en récupérant les fichiers de coordonnées et de géométrie via leur code d’accession de monomère. Cependant, pour les ligands inconnus ou non standard, divers outils sont disponibles pour créer les fichiers de géométrie. Parmi les exemples, citons l’eLBOW27 – (constructeur de ligands électroniques et atelier d’optimisation) dans Phenix28, Lidia – un outil intégré dans Coot29, JLigand/ACEDRG30,31, CCP-EM23,24, Ligprep32-un module de Glide au sein de la suite Schrödinger. Le fichier de coordonnées du ligand est ensuite ajusté dans la densité, guidé à la fois par la carte expérimentale cryoEM et la carte de différence dans Coot. Vient ensuite le raffinement dans l’espace réel dans Phenix28 ou le raffinement réciproque dans Refmac33. Un poste de travail Linux ou un ordinateur portable équipé d’une bonne carte graphique et des logiciels mentionnés ci-dessus est nécessaire. La plupart de ces programmes sont inclus dans diverses suites. CCP-EM24 et Phenix28 sont disponibles gratuitement pour les utilisateurs universitaires et incluent une variété d’outils qui sont utilisés dans cet article, notamment Coot, Refmac5 33,34,35,36, Servalcat, phenix.real_space_refine, etc. De même, Chimera37 et ChimeraX38 fournissent des licences gratuites aux utilisateurs universitaires.
Les améliorations apportées au matériel et aux logiciels des microscopes ont entraîné une augmentation du nombre de structures cryoEM au cours des dernières années. Bien que la résolution la plus élevée atteinte à l’heure actuelle dans la cryoEM à particule unique soit de 1,2 Å 57,58,59, la majorité des structures sont déterminées autour de la résolution de 3-4 Å. La modélisation de ligands dans des cartes ?…
The authors have nothing to disclose.
SJ est récipiendaire d’une bourse de doctorat de DAE-TIFR, et le financement est reconnu. KRV reconnaît la subvention DBT B-Life DBT/PR12422/MED/31/287/2014 et le soutien du Département de l’énergie atomique du gouvernement de l’Inde, dans le cadre de l’identification du projet n°. RTI4006.
CCP4-8.0 | Consortium of several institutes | https://www.ccp4.ac.uk | Free for academic users and includes Coot and list of tools developed for X-ray crystallography |
CCP-EM | Consortium of several institutes | https://www.ccpem.ac.uk/download.php | Free for academic users and includes Coot, Relion and many others |
Coot | Paul Emsley, LMB, Cambridge | https://www2.mrc-lmb.cam.ac.uk/personal/pemsley/coot/ | General software for model building but also available with other suites described above |
DockinMap (Phenix) | Consortium of several institutes | https://phenix-online.org/documentation/reference/dock_in_map.html | Software inside the Phenix suite for docking model into cryoEM maps |
Electron Microscopy Data Bank | Consortium of several institutes | https://www.ebi.ac.uk/emdb/ | Public Repository for Electron Microscopy maps |
Falcon | Thermo Fisher Scientific | https://assets.thermofisher.com/TFS-Assets/MSD/Technical-Notes/Falcon-3EC-Datasheet.pdf | Commercial, camera from Thermo Fisher |
Phenix | Consortium of several institutes | https://phenix-online.org/download | Free for academic users and includes Coot |
Protein Data Bank | Consortium of several institutes | https://rcsb.org | Public database of macromolecular structures |
Pymol | Schrodinger | https://pymol.org/2/ | Molecular viusalization tool. Educational version is free but comes with limitation. The full version can be obtained with a small fee. |
Relion | MRC-LMB, Cambridge | https://relion.readthedocs.io/en/release-4.0/Installation.html | Software for cryoEM image processing, also available with CCP-EM |
Titan Krios | Thermo Fisher Scientific | https://www.thermofisher.com/in/en/home/electron-microscopy/products/transmission-electron-microscopes/krios-g4-cryo-tem.html?cid=msd_ls_xbu_xmkt_tem-krios_285811_gl_pso_gaw_tpne1c& gad_source=1&gclid=CjwKCAiA-P-rBhBEEiwAQEXhHyw5c8MKThmdA AkZesWC4FYQSwIQRk ZApkj08MfYG040DtiiuL8 RihoCebEQAvD_BwE |
Commercial, cryoTEM from Thermo Fisher |
UCSF Chimera | UCSF, USA | https://www.cgl.ucsf.edu/chimera/download.html | General purpose software for display, analysis and more |
UCSF Chimera X | UCSF, USA | https://www.cgl.ucsf.edu/chimerax/ | General purpose software for display, analysis and more |