Questo protocollo introduce gli strumenti disponibili per la modellazione di ligandi a piccole molecole nelle mappe cryoEM di macromolecole.
Decifrare le interazioni proteina-ligando in un complesso macromolecolare è fondamentale per comprendere il meccanismo molecolare, i processi biologici sottostanti e lo sviluppo di farmaci. Negli ultimi anni, la microscopia elettronica criogenica su campione (cryoEM) è emersa come una potente tecnica per determinare le strutture delle macromolecole e per studiare la modalità di legame del ligando a risoluzione quasi atomica. L’identificazione e la modellazione di molecole non proteiche nelle mappe cryoEM è spesso impegnativa a causa della risoluzione anisotropa attraverso la molecola di interesse e del rumore intrinseco nei dati. In questo articolo, i lettori vengono introdotti a vari software e metodi attualmente utilizzati per l’identificazione dei ligandi, la costruzione di modelli e il perfezionamento delle coordinate atomiche utilizzando macromolecole selezionate. Uno dei modi più semplici per identificare la presenza di un ligando, come illustrato con l’enzima enolasi, è quello di sottrarre le due mappe ottenute con e senza il ligando. È probabile che la densità extra del ligando risalti nella mappa delle differenze anche a una soglia più alta. Ci sono casi, come mostrato nel caso del recettore metabotropico del glutammato mGlu5, in cui tali semplici mappe di differenza non possono essere generate. Il metodo recentemente introdotto per derivare la mappa di omissione Fo-Fc può servire come strumento per convalidare e dimostrare la presenza del ligando. Infine, utilizzando come esempio la ben studiata β-galattosidasi, viene analizzato l’effetto della risoluzione sulla modellazione dei ligandi e delle molecole di solvente nelle mappe cryoEM e viene presentata una prospettiva su come la cryoEM può essere utilizzata nella scoperta di farmaci.
Le cellule svolgono le loro funzioni eseguendo innumerevoli reazioni chimiche simultaneamente e in modo indipendente, ciascuna meticolosamente regolata per garantire la loro sopravvivenza e adattabilità in risposta a stimoli ambientali. Ciò si ottiene mediante il riconoscimento molecolare, che consente alle biomolecole, in particolare alle proteine, di formare complessi transitori o stabili con altre macromolecole e con piccole molecole o ligandi1. Pertanto, le interazioni proteina-ligando sono fondamentali per tutti i processi in biologia, che includono la regolazione dell’espressione e dell’attività proteica, il riconoscimento di substrati e cofattori da parte degli enzimi, nonché il modo in cui le cellule percepiscono e trasmettono i segnali 1,2. Una migliore comprensione delle proprietà cinetiche, termodinamiche e strutturali del complesso proteina-ligando rivela le basi molecolari dell’interazione tra ligando e facilita anche la progettazione razionale di farmaci ottimizzando l’interazione e la specificità dei farmaci. Un approccio economico e più veloce allo studio dell’interazione proteina-ligando consiste nell’utilizzare il docking molecolare, che è un metodo computazionale che esamina virtualmente una vasta gamma di piccole molecole e prevede la modalità di legame e l’affinità di questi ligandi per le proteine bersaglio3. Tuttavia, le prove sperimentali provenienti da strutture ad alta risoluzione determinate dalla diffrazione a raggi X (XRD), dalla risonanza magnetica nucleare (NMR) o dalla criomicroscopia elettronica (cryoEM) forniscono la prova essenziale per tali previsioni e aiutano nello sviluppo di attivatori o inibitori più nuovi e più efficaci per un determinato bersaglio. Questo articolo utilizza l’abbreviazione “cryoEM” come viene comunemente chiamata la tecnica. Tuttavia, c’è un dibattito in corso sulla scelta della nomenclatura corretta e, recentemente, il termine criogenico-campione Electron Microscopia (cryoEM) è stato proposto per indicare che il campione è a temperatura criogenica e visualizzato con elettroni4. Allo stesso modo, le mappe derivate dalla cryoEM sono state chiamate potenziale elettronico, potenziale elettrostatico o potenziale di Coulomb e, per semplicità, qui usiamo le mappe cryoEM 5,6,7,8,9,10.
Sebbene l’XRD sia stata la tecnica gold standard nella determinazione della struttura ad alta risoluzione dei complessi proteina-ligando, la cryoEM post-rivoluzione11 ha guadagnato slancio, come indicato dall’ondata di mappe di potenziale di Coulomb o mappe crioEM depositate nel database di microscopia elettronica (EMDB)12,13 negli ultimi anni14. A causa dei progressi nella preparazione dei campioni, nell’imaging e nei metodi di elaborazione dei dati, il numero di deposizioni di Protein Data Bank (PDB)14 che utilizzano cryoEM è aumentato dallo 0,7% al 17% tra il 2010 e il 2020, con circa il 50% delle strutture riportate nel 2020 determinate con una risoluzione di 3,5 Å o miglioredi 15,16. La CryoEM è stata rapidamente adottata dalla comunità della biologia strutturale, compresa l’industria farmaceutica, in quanto consente lo studio di macromolecole biologiche flessibili e non cristalline, in particolare proteine di membrana e complessi multiproteici, a risoluzione quasi atomica, superando il processo di cristallizzazione e ottenendo cristalli ben diffranti necessari per la determinazione della struttura ad alta risoluzione mediante XRD.
Una modellazione accurata del ligando nella mappa cryoEM è fondamentale, in quanto funge da modello del complesso proteina-ligando a livello molecolare. Esistono diversi strumenti automatizzati per la costruzione di ligandi utilizzati nella cristallografia a raggi X che dipendono dalla forma e dalla topologia della densità del ligando al fine di adattare o costruire il ligando nella densità elettronica 17,18,19,20. Tuttavia, se la risoluzione è inferiore a 3 Å, questi approcci tendono a produrre risultati meno desiderabili perché le caratteristiche topologiche da cui dipendono per il riconoscimento e la costruzione diventano meno definite. In molti casi, questi metodi si sono dimostrati inefficaci nel modellare accuratamente i ligandi in mappe cryoEM, poiché queste mappe sono state determinate nell’intervallo di risoluzione medio-bassa, tipicamente tra 3,5 Å-5 Å17.
Il primo passo nella determinazione della struttura 3D di un complesso proteina-ligando mediante cryoEM prevede la co-purificazione del ligando con la proteina (quando il ligando ha un’elevata affinità di legame con la proteina) o l’incubazione della soluzione proteica con il ligando per un periodo specifico prima della preparazione della griglia. Successivamente, un piccolo volume di campione viene posizionato su una griglia TEM forata pulita al plasma, seguito dal congelamento rapido in etano liquido e infine dall’imaging con un crio-TEM. Le immagini di proiezione 2D da centinaia di migliaia a milioni di singole particelle vengono mediate per ricostruire una mappa del potenziale di Coulomb tridimensionale (3D) della macromolecola. L’identificazione e la modellazione di ligandi e molecole di solvente in queste mappe pone sfide significative in molti casi a causa della risoluzione anisotropa in tutta la mappa (cioè, la risoluzione non è uniforme in tutta la macromolecola), della flessibilità nella regione in cui il ligando è legato e del rumore nei dati. Molti degli strumenti di modellazione, perfezionamento e visualizzazione che sono stati sviluppati per XRD vengono ora adattati per l’uso in cryoEM per gli stessi scopi 18,19,20,21. In questo articolo viene presentata una panoramica dei vari metodi e software attualmente utilizzati per identificare i ligandi, costruire modelli e perfezionare le coordinate derivate dalla crioEM. È stato fornito un protocollo passo-passo per illustrare i processi coinvolti nella modellazione dei ligandi utilizzando specifici complessi proteina-ligando con risoluzione e complessità variabili.
Il primo passo nella modellazione dei ligandi nelle mappe cryoEM include l’identificazione della densità del ligando (non proteico) nella mappa. Se il legame del ligando non induce alcun cambiamento conformazionale nella proteina, allora il calcolo di una semplice mappa di differenza tra il complesso proteina-ligando e l’apo-proteina evidenzia essenzialmente le regioni di densità extra, suggerendo la presenza del ligando. Tali differenze possono essere osservate immediatamente, poiché sono necessarie solo due mappe, e anche mappe intermedie durante il processo di affinamento 3D possono essere utilizzate per verificare se il ligando è presente. Inoltre, se la risoluzione è sufficientemente alta (<3,0 Å), la mappa delle differenze può anche fornire informazioni sulla posizione delle molecole d'acqua e degli ioni che interagiscono con il ligando e i residui proteici.
In assenza della mappa apo-proteica, è ora possibile utilizzare Servalcat22, che è disponibile come strumento autonomo ed è stato anche integrato nella suite software CCP-EM 23,24 come parte del perfezionamento di Refmac e nella versione25,26 di CCP4 8.0. Servalcat consente il calcolo di una mappa di differenza ponderata FSC (Fo-Fc) utilizzando come input le semimappe non nitide e il modello dell’apoproteina. La mappa di omissione Fo-Fc rappresenta la disparità tra la mappa sperimentale (Fo) e la mappa derivata dal modello (Fc). In assenza di un ligando nel modello, una densità positiva in una mappa Fo-Fc che si sovrappone alla mappa EM sperimentale suggerisce tipicamente la presenza del ligando. L’ipotesi qui è che la catena proteica sia ben adattata nella mappa e la densità positiva rimanente indichi la posizione del ligando. Tuttavia, è importante esaminare meticolosamente se la densità positiva deriva da imprecisioni di modellazione, come il rotamero sbagliato di una catena laterale proteica.
Il secondo passo consiste nell’ottenere o creare un file di coordinate cartesiane del legante con una geometria ben definita dalle informazioni chimiche disponibili. I ligandi standard (ad esempio, ATP e NADP+) già disponibili nella libreria di monomeri CCP4 possono essere utilizzati per il raffinamento recuperando i file di coordinate e geometrie tramite il loro codice di accesso ai monomeri. Tuttavia, per i ligandi sconosciuti o non standard, sono disponibili vari strumenti per creare i file di geometria. Alcuni degli esempi includono l’eLBOW27 – (generatore di ligandi elettronici e banco di ottimizzazione) in Phenix28, Lidia – uno strumento integrato in Coot29, JLigand/ACEDRG 30,31, CCP-EM23,24, Ligprep32-un modulo di Glide all’interno della suite Schrodinger. Il file di coordinate del ligando viene quindi inserito nella densità, guidato sia dalla mappa sperimentale cryoEM che dalla mappa delle differenze in Coot. Questo è seguito dal raffinamento nello spazio reale in Phenix28 o dal raffinamento reciproco in Refmac33. È necessaria una workstation Linux o un laptop dotato di una buona scheda grafica e del software sopra menzionato. La maggior parte di questi programmi sono inclusi in varie suite. CCP-EM24 e Phenix28 sono disponibili gratuitamente per gli utenti accademici e includono una varietà di strumenti utilizzati in questo articolo, tra cui Coot, Refmac5 33,34,35,36, Servalcat, phenix.real_space_refine, ecc. Allo stesso modo, Chimera37 e ChimeraX38 forniscono licenze gratuite agli utenti accademici.
I miglioramenti nell’hardware e nel software del microscopio hanno portato a un aumento del numero di strutture cryoEM negli ultimi anni. Sebbene la risoluzione più alta raggiunta al momento nella crioEM a singola particella sia 1,2 Å 57,58,59, la maggior parte delle strutture viene determinata intorno alla risoluzione di 3-4 Å. La modellazione di ligandi in mappe a media e bassa risoluzione può essere complicata e spesso pi…
The authors have nothing to disclose.
SJ è un destinatario della borsa di dottorato DAE-TIFR e il finanziamento è riconosciuto. KRV riconosce la sovvenzione DBT B-Life DBT/PR12422/MED/31/287/2014 e il supporto del Dipartimento dell’Energia Atomica, Governo dell’India, nell’ambito dell’identificazione del progetto n. RTI4006.
CCP4-8.0 | Consortium of several institutes | https://www.ccp4.ac.uk | Free for academic users and includes Coot and list of tools developed for X-ray crystallography |
CCP-EM | Consortium of several institutes | https://www.ccpem.ac.uk/download.php | Free for academic users and includes Coot, Relion and many others |
Coot | Paul Emsley, LMB, Cambridge | https://www2.mrc-lmb.cam.ac.uk/personal/pemsley/coot/ | General software for model building but also available with other suites described above |
DockinMap (Phenix) | Consortium of several institutes | https://phenix-online.org/documentation/reference/dock_in_map.html | Software inside the Phenix suite for docking model into cryoEM maps |
Electron Microscopy Data Bank | Consortium of several institutes | https://www.ebi.ac.uk/emdb/ | Public Repository for Electron Microscopy maps |
Falcon | Thermo Fisher Scientific | https://assets.thermofisher.com/TFS-Assets/MSD/Technical-Notes/Falcon-3EC-Datasheet.pdf | Commercial, camera from Thermo Fisher |
Phenix | Consortium of several institutes | https://phenix-online.org/download | Free for academic users and includes Coot |
Protein Data Bank | Consortium of several institutes | https://rcsb.org | Public database of macromolecular structures |
Pymol | Schrodinger | https://pymol.org/2/ | Molecular viusalization tool. Educational version is free but comes with limitation. The full version can be obtained with a small fee. |
Relion | MRC-LMB, Cambridge | https://relion.readthedocs.io/en/release-4.0/Installation.html | Software for cryoEM image processing, also available with CCP-EM |
Titan Krios | Thermo Fisher Scientific | https://www.thermofisher.com/in/en/home/electron-microscopy/products/transmission-electron-microscopes/krios-g4-cryo-tem.html?cid=msd_ls_xbu_xmkt_tem-krios_285811_gl_pso_gaw_tpne1c& gad_source=1&gclid=CjwKCAiA-P-rBhBEEiwAQEXhHyw5c8MKThmdA AkZesWC4FYQSwIQRk ZApkj08MfYG040DtiiuL8 RihoCebEQAvD_BwE |
Commercial, cryoTEM from Thermo Fisher |
UCSF Chimera | UCSF, USA | https://www.cgl.ucsf.edu/chimera/download.html | General purpose software for display, analysis and more |
UCSF Chimera X | UCSF, USA | https://www.cgl.ucsf.edu/chimerax/ | General purpose software for display, analysis and more |