Dit protocol introduceert de tools die beschikbaar zijn voor het modelleren van liganden van kleine moleculen in cryoEM-kaarten van macromoleculen.
Het ontcijferen van de eiwit-ligandinteracties in een macromoleculair complex is cruciaal voor het begrijpen van het moleculaire mechanisme, de onderliggende biologische processen en de ontwikkeling van geneesmiddelen. In de afgelopen jaren is cryogene monsterelektronenmicroscopie (cryoEM) naar voren gekomen als een krachtige techniek om de structuren van macromoleculen te bepalen en om de wijze van ligandbinding bij bijna-atomaire resolutie te onderzoeken. Het identificeren en modelleren van niet-eiwitmoleculen in cryoEM-kaarten is vaak een uitdaging vanwege de anisotrope resolutie over het betreffende molecuul en de inherente ruis in de gegevens. In dit artikel maken de lezers kennis met verschillende software en methoden die momenteel worden gebruikt voor ligandidentificatie, modelbouw en verfijning van atomaire coördinaten met behulp van geselecteerde macromoleculen. Een van de eenvoudigste manieren om de aanwezigheid van een ligand te identificeren, zoals geïllustreerd met het enolase-enzym, is door de twee afbeeldingen die met en zonder het ligand zijn verkregen, af te trekken. De extra dichtheid van het ligand zal waarschijnlijk opvallen in de verschilkaart, zelfs bij een hogere drempel. Er zijn gevallen, zoals aangetoond in het geval van metabotrope glutamaatreceptor mGlu5, waarin dergelijke eenvoudige verschilkaarten niet kunnen worden gegenereerd. De onlangs geïntroduceerde methode voor het afleiden van de Fo-Fc weglaatkaart kan dienen als een hulpmiddel om de aanwezigheid van het ligand te valideren en aan te tonen. Ten slotte wordt, met behulp van het goed bestudeerde β-galactosidase als voorbeeld, het effect van resolutie op het modelleren van de liganden en oplosmiddelmoleculen in cryoEM-kaarten geanalyseerd en wordt een kijk gepresenteerd op hoe cryoEM kan worden gebruikt bij het ontdekken van geneesmiddelen.
Cellen vervullen hun functies door talloze chemische reacties tegelijkertijd en onafhankelijk uit te voeren, elk zorgvuldig gereguleerd om hun overleving en aanpassingsvermogen te garanderen als reactie op omgevingssignalen. Dit wordt bereikt door moleculaire herkenning, waardoor biomoleculen, met name eiwitten, voorbijgaande of stabiele complexen kunnen vormen met andere macromoleculen en met kleine moleculen of liganden1. Eiwit-ligandinteracties zijn dus van fundamenteel belang voor alle processen in de biologie, waaronder de regulatie van eiwitexpressie en -activiteit, de herkenning van substraten en cofactoren door enzymen, evenals hoe cellen signalen waarnemen en doorgeven 1,2. Een beter begrip van de kinetische, thermodynamische en structurele eigenschappen van het eiwit-ligandcomplex onthult de moleculaire basis van ligandinteractie en vergemakkelijkt ook een rationeel geneesmiddelontwerp door de geneesmiddelinteractie en specificiteit te optimaliseren. Een economische en snellere benadering voor het bestuderen van eiwit-ligandinteractie is het gebruik van moleculaire docking, een computationele methode die virtueel een breed scala aan kleine moleculen screent en de bindingsmodus en affiniteit van deze liganden aan doeleiwitten voorspelt3. Experimenteel bewijs van structuren met een hoge resolutie bepaald door röntgendiffractie (XRD), nucleaire magnetische resonantie (NMR) of elektronencryomicroscopie (cryoEM) levert echter het essentiële bewijs voor dergelijke voorspellingen en helpt bij de ontwikkeling van nieuwere en effectievere activatoren of remmers voor een bepaald doelwit. In dit artikel wordt de afkorting ‘cryoEM’ gebruikt, zoals de techniek gewoonlijk wordt genoemd. Er is echter een voortdurend debat gaande over het kiezen van de juiste nomenclatuur, en onlangs is de term cryogenic-sample Electron Microscopie (cryoEM) voorgesteld om aan te geven dat het monster op cryogene temperatuur is en in beeld is gebracht met elektronen4. Evenzo worden de kaarten die zijn afgeleid van cryoEM elektronenpotentiaal, elektrostatische potentiaal of Coulomb-potentiaal genoemd, en voor de eenvoud gebruiken we hier cryoEM-kaarten 5,6,7,8,9,10.
Hoewel XRD de gouden standaardtechniek is geweest voor de bepaling van de structuur van eiwit-ligandcomplexen met hoge resolutie, is cryoEM na resolutie-revolutie11 in een stroomversnelling geraakt, zoals blijkt uit de golf van Coulomb-potentiaalkaarten of cryoEM-kaarten die de afgelopen jaren in de Electron Microscopy Database (EMDB)12,13 zijn gedeponeerd14. Als gevolg van de vooruitgang in monstervoorbereiding, beeldvorming en gegevensverwerkingsmethoden is het aantal Protein Data Bank (PDB)14-afzettingen met cryoEM tussen 2010 en 2020 toegenomen van 0,7% naar 17%, waarbij ongeveer 50% van de gerapporteerde structuren in 2020 werd bepaald met een resolutie van 3,5 Å of beter15,16. CryoEM is snel geadopteerd door de structurele biologiegemeenschap, inclusief de farmaceutische industrie, omdat het de studie mogelijk maakt van flexibele en niet-kristallijne biologische macromoleculen, met name membraaneiwitten en multi-eiwitcomplexen, met een bijna atomaire resolutie, waardoor het proces van kristallisatie wordt overwonnen en goed diffracterende kristallen worden verkregen die nodig zijn voor structuurbepaling met hoge resolutie door XRD.
Nauwkeurige modellering van het ligand in de cryoEM-kaart is van het grootste belang, omdat het dient als een blauwdruk van het eiwit-ligandcomplex op moleculair niveau. Er zijn verschillende geautomatiseerde hulpmiddelen voor het opbouwen van liganden die worden gebruikt in röntgenkristallografie die afhankelijk zijn van de vorm en topologie van de liganddichtheid om het ligand in de elektronendichtheid 17,18,19,20 te passen of te bouwen. Desalniettemin, als de resolutie lager is dan 3 Å, hebben deze benaderingen de neiging om minder gewenste resultaten te produceren omdat de topologische kenmerken waarvan ze afhankelijk zijn voor herkenning en opbouw minder gedefinieerd worden. In veel gevallen zijn deze methoden niet effectief gebleken bij het nauwkeurig modelleren van liganden in cryoEM-kaarten, omdat deze kaarten zijn bepaald in het bereik van lage tot gemiddelde resolutie, meestal tussen 3,5 Å-5 Å17.
De eerste stap in de 3D-structuurbepaling van een eiwit-ligandcomplex door cryoEM omvat ofwel het co-zuiveren van het ligand met het eiwit (wanneer het ligand een hoge bindingsaffiniteit heeft met het eiwit) of het incuberen van de eiwitoplossing met het ligand voor een bepaalde duur vóór de roostervoorbereiding. Vervolgens wordt een klein monstervolume op een met plasma gereinigd holey TEM-rooster geplaatst, gevolgd door flash-invriezen in vloeibaar ethaan en uiteindelijk beeldvorming met een cryo-TEM. De 2D-projectiebeelden van honderdduizenden tot miljoenen individuele deeltjes worden gemiddeld om een 3-dimensionale (3D) Coulomb-potentiaalkaart van het macromolecuul te reconstrueren. Het identificeren en modelleren van liganden en oplosmiddelmoleculen in deze kaarten levert in veel gevallen aanzienlijke uitdagingen op vanwege de anisotrope resolutie over de kaart (d.w.z. de resolutie is niet uniform over het macromolecuul), flexibiliteit in het gebied waar het ligand is gebonden en de ruis in de gegevens. Veel van de modellerings-, verfijnings- en visualisatietools die voor XRD zijn ontwikkeld, worden nu aangepast voor gebruik in cryoEM voor dezelfde doeleinden 18,19,20,21. In dit artikel wordt een overzicht gegeven van verschillende methoden en software die momenteel worden gebruikt om liganden te identificeren, modellen te bouwen en de coördinaten afgeleid van cryoEM te verfijnen. Er is een stapsgewijs protocol opgesteld om de processen te illustreren die betrokken zijn bij het modelleren van liganden met behulp van specifieke eiwit-ligandcomplexen met verschillende resolutie en complexiteit.
De eerste stap in het modelleren van liganden in cryoEM-kaarten omvat de identificatie van de liganddichtheid (niet-eiwit) in de kaart. Als ligandbinding geen conformationele verandering in het eiwit veroorzaakt, dan markeert het berekenen van een eenvoudige verschilkaart tussen het eiwit-ligandcomplex en het apo-eiwit in wezen de gebieden met extra dichtheid, wat de aanwezigheid van het ligand suggereert. Dergelijke verschillen kunnen onmiddellijk worden waargenomen, omdat er slechts twee kaarten nodig zijn, en zelfs tussenliggende kaarten tijdens het proces van 3D-verfijning kunnen worden gebruikt om te controleren of de ligand aanwezig is. Bovendien, als de resolutie hoog genoeg is (<3.0 Å), kan de verschilkaart ook inzicht geven in de locatie van watermoleculen en ionen die interageren met de ligand en de eiwitresiduen.
Bij afwezigheid van de apo-eiwitkaart is het nu mogelijk om Servalcat22 te gebruiken, dat beschikbaar is als een op zichzelf staande tool en ook is geïntegreerd in de CCP-EM-softwaresuite23,24 als onderdeel van de Refmac-verfijning en in CCP4 8.0 release25,26. Servalcat maakt het mogelijk om een FSC-gewogen verschilkaart (Fo-Fc) te berekenen met behulp van de niet-verscherpte half-maps en het apoproteïnemodel als invoer. De Fo-Fc weggelaten kaart geeft de ongelijkheid weer tussen de experimentele kaart (Fo) en de kaart die is afgeleid van het model (Fc). Bij afwezigheid van een ligand in het model, suggereert een positieve dichtheid in een Fo-Fc-kaart die overlapt met de experimentele EM-kaart doorgaans de aanwezigheid van het ligand. De aanname hier is dat de eiwitketen goed in de kaart past, en de resterende positieve dichtheid geeft de locatie van het ligand aan. Het is echter belangrijk om nauwgezet te onderzoeken of de positieve dichtheid voortkomt uit onnauwkeurigheden in het modelleren, zoals de verkeerde rotamer van een eiwitzijketen.
De tweede stap is het verkrijgen of maken van een cartesisch coördinatenbestand van de ligand met een goed gedefinieerde geometrie op basis van de beschikbare chemische informatie. Standaard liganden (bijvoorbeeld ATP en NADP+) die al beschikbaar zijn in de CCP4-monomeerbibliotheek kunnen worden gebruikt voor verfijning door de coördinaten- en geometriebestanden op te halen via hun monomeertoetredingscode. Voor onbekende of niet-standaard liganden zijn er echter verschillende tools beschikbaar om de geometriebestanden te maken. Enkele van de voorbeelden zijn de eLBOW27 – (elektronische ligandbouwer en optimalisatiewerkbank) in Phenix28, Lidia – een ingebouwde tool in Meerkoet29, JLigand/ACEDRG30,31, CCP-EM23,24, Ligprep32-een module van Glide binnen de Schrödinger-suite. Het ligandcoördinatenbestand wordt vervolgens in de dichtheid gepast, geleid door zowel de experimentele cryoEM-kaart als de verschilkaart in Coot. Dit wordt gevolgd door real-space verfijning in Phenix28 of wederzijdse verfijning in Refmac33. Een Linux-werkstation of een laptop uitgerust met een goede grafische kaart en de bovengenoemde software is vereist. De meeste van deze programma’s zijn opgenomen in verschillende suites. CCP-EM24 en Phenix28 zijn gratis beschikbaar voor academische gebruikers en bevatten een verscheidenheid aan tools die in dit artikel worden gebruikt, waaronder Coot, Refmac5 33,34,35,36, Servalcat, phenix.real_space_refine, enz. Evenzo bieden Chimera37 en ChimeraX38 gratis licenties aan academische gebruikers.
De verbeteringen in de hardware en software van microscopen hebben de afgelopen jaren geleid tot een toename van het aantal cryoEM-structuren. Hoewel de hoogste resolutie die op dit moment wordt bereikt in cryoEM met één deeltje 1,2 Å 57,58,59 is, wordt het merendeel van de structuren bepaald rond de 3-4 Å resolutie. Het modelleren van liganden in kaarten met een gemiddelde tot lage resolutie kan lastig zijn en vaak beladen …
The authors have nothing to disclose.
SJ is een ontvanger van het PhD-studentschap van DAE-TIFR, en de financiering wordt erkend. KRV erkent DBT B-Life-subsidie DBT/PR12422/MED/31/287/2014 en de steun van het Department of Atomic Energy, Government of India, onder Project Identification No. RTI4006.
CCP4-8.0 | Consortium of several institutes | https://www.ccp4.ac.uk | Free for academic users and includes Coot and list of tools developed for X-ray crystallography |
CCP-EM | Consortium of several institutes | https://www.ccpem.ac.uk/download.php | Free for academic users and includes Coot, Relion and many others |
Coot | Paul Emsley, LMB, Cambridge | https://www2.mrc-lmb.cam.ac.uk/personal/pemsley/coot/ | General software for model building but also available with other suites described above |
DockinMap (Phenix) | Consortium of several institutes | https://phenix-online.org/documentation/reference/dock_in_map.html | Software inside the Phenix suite for docking model into cryoEM maps |
Electron Microscopy Data Bank | Consortium of several institutes | https://www.ebi.ac.uk/emdb/ | Public Repository for Electron Microscopy maps |
Falcon | Thermo Fisher Scientific | https://assets.thermofisher.com/TFS-Assets/MSD/Technical-Notes/Falcon-3EC-Datasheet.pdf | Commercial, camera from Thermo Fisher |
Phenix | Consortium of several institutes | https://phenix-online.org/download | Free for academic users and includes Coot |
Protein Data Bank | Consortium of several institutes | https://rcsb.org | Public database of macromolecular structures |
Pymol | Schrodinger | https://pymol.org/2/ | Molecular viusalization tool. Educational version is free but comes with limitation. The full version can be obtained with a small fee. |
Relion | MRC-LMB, Cambridge | https://relion.readthedocs.io/en/release-4.0/Installation.html | Software for cryoEM image processing, also available with CCP-EM |
Titan Krios | Thermo Fisher Scientific | https://www.thermofisher.com/in/en/home/electron-microscopy/products/transmission-electron-microscopes/krios-g4-cryo-tem.html?cid=msd_ls_xbu_xmkt_tem-krios_285811_gl_pso_gaw_tpne1c& gad_source=1&gclid=CjwKCAiA-P-rBhBEEiwAQEXhHyw5c8MKThmdA AkZesWC4FYQSwIQRk ZApkj08MfYG040DtiiuL8 RihoCebEQAvD_BwE |
Commercial, cryoTEM from Thermo Fisher |
UCSF Chimera | UCSF, USA | https://www.cgl.ucsf.edu/chimera/download.html | General purpose software for display, analysis and more |
UCSF Chimera X | UCSF, USA | https://www.cgl.ucsf.edu/chimerax/ | General purpose software for display, analysis and more |