Dieses Protokoll stellt die Werkzeuge vor, die für die Modellierung von niedermolekularen Liganden in KryoEM-Karten von Makromolekülen zur Verfügung stehen.
Die Entschlüsselung der Protein-Liganden-Wechselwirkungen in einem makromolekularen Komplex ist entscheidend für das Verständnis des molekularen Mechanismus, der zugrunde liegenden biologischen Prozesse und der Arzneimittelentwicklung. In den letzten Jahren hat sich die kryogene Probenelektronenmikroskopie (KryoEM) zu einer leistungsfähigen Technik entwickelt, um die Strukturen von Makromolekülen zu bestimmen und die Art der Ligandenbindung mit nahezu atomarer Auflösung zu untersuchen. Die Identifizierung und Modellierung von Nicht-Protein-Molekülen in KryoEM-Karten ist aufgrund der anisotropen Auflösung über das interessierende Molekül und des inhärenten Rauschens in den Daten oft eine Herausforderung. In diesem Artikel werden die Leser mit verschiedenen Softwares und Methoden vertraut gemacht, die derzeit zur Identifizierung von Liganden, zur Modellerstellung und zur Verfeinerung atomarer Koordinaten unter Verwendung ausgewählter Makromoleküle verwendet werden. Eine der einfachsten Möglichkeiten, das Vorhandensein eines Liganden zu identifizieren, wie am Enzym Enolase dargestellt, besteht darin, die beiden Karten zu subtrahieren, die mit und ohne Liganden erhalten wurden. Die zusätzliche Dichte des Liganden wird wahrscheinlich auch bei einem höheren Schwellenwert in der Differenzkarte hervorstechen. Es gibt Fälle, wie im Fall des metabotrope Glutamatrezeptors mGlu5 gezeigt, in denen solche einfachen Differenzkarten nicht erstellt werden können. Die kürzlich vorgestellte Methode zur Ableitung der Fo-Fc-Omit-Map kann als Werkzeug zur Validierung und Demonstration des Vorhandenseins des Liganden dienen. Schließlich wird am Beispiel der gut untersuchten β-Galactosidase der Effekt der Auflösung auf die Modellierung der Liganden und Lösungsmittelmoleküle in KryoEM-Karten analysiert und ein Ausblick darauf gegeben, wie KryoEM in der Wirkstoffforschung eingesetzt werden kann.
Zellen erfüllen ihre Funktionen, indem sie unzählige chemische Reaktionen gleichzeitig und unabhängig voneinander durchführen, die jeweils akribisch reguliert werden, um ihr Überleben und ihre Anpassungsfähigkeit als Reaktion auf Umwelteinflüsse zu gewährleisten. Dies wird durch die molekulare Erkennung erreicht, die es Biomolekülen, insbesondere Proteinen, ermöglicht, mit anderen Makromolekülen sowie kleinen Molekülen oder Liganden transiente oder stabile Komplexe zu bilden1. Daher sind Protein-Liganden-Wechselwirkungen grundlegend für alle Prozesse in der Biologie, einschließlich der Regulation der Proteinexpression und -aktivität, der Erkennung von Substraten und Cofaktoren durch Enzyme sowie der Art und Weise, wie Zellen Signale wahrnehmen und weiterleiten 1,2. Ein besseres Verständnis der kinetischen, thermodynamischen und strukturellen Eigenschaften des Protein-Liganden-Komplexes enthüllt die molekularen Grundlagen der Ligandeninteraktion und erleichtert auch ein rationales Wirkstoffdesign, indem die Wirkstoffinteraktion und Spezifität optimiert werden. Ein wirtschaftlicher und schnellerer Ansatz zur Untersuchung der Protein-Liganden-Wechselwirkung ist die Verwendung von molekularem Docking, einer computergestützten Methode, die virtuell eine Vielzahl kleiner Moleküle durchleuchtet und den Bindungsmodus und die Affinität dieser Liganden zu Zielproteinen vorhersagt3. Experimentelle Beweise aus hochauflösenden Strukturen, die durch Röntgenbeugung (XRD), Kernspinresonanz (NMR) oder Elektronenkryomikroskopie (KryoEM) bestimmt wurden, liefern jedoch den wesentlichen Beweis für solche Vorhersagen und helfen bei der Entwicklung neuerer und wirksamerer Aktivatoren oder Inhibitoren für ein bestimmtes Ziel. In diesem Artikel wird die Abkürzung “KryoEM” verwendet, da die Technik allgemein genannt wird. Es gibt jedoch eine anhaltende Debatte über die Wahl der richtigen Nomenklatur, und kürzlich wurde der Begriff Kryo-Gen-Probe Electron Microscopy (KryoEM) vorgeschlagen, um anzuzeigen, dass die Probe bei kryogener Temperatur ist und mit Elektronen abgebildetwird 4. In ähnlicher Weise wurden die von der KryoEM abgeleiteten Karten als Elektronenpotential, elektrostatisches Potential oder Coulomb-Potential bezeichnet, und der Einfachheit halber verwenden wir hier die KryoEM-Karten 5,6,7,8,9,10.
Obwohl die XRD die Goldstandardtechnik bei der hochauflösenden Strukturbestimmung von Protein-Liganden-Komplexen war, hat die KryoEM nach der Auflösungsrevolution11 an Dynamik gewonnen, wie der Anstieg der Coulomb-Potentialkarten oder KryoEM-Karten zeigt, die in den letzten Jahren in der Electron Microscopy Database (EMDB)12,13 hinterlegt wurden14. Aufgrund von Fortschritten in der Probenvorbereitung, der Bildgebung und den Datenverarbeitungsmethoden stieg die Anzahl der Proteindatenbanken (PDB)14 mit KryoEM zwischen 2010 und 2020 von 0,7 % auf 17 %, wobei etwa 50 % der im Jahr 2020 gemeldeten Strukturen mit einer Auflösung von 3,5 Å oder besser bestimmt wurden15,16. Die KryoEM wurde von der Strukturbiologie, einschließlich der pharmazeutischen Industrie, schnell übernommen, da sie die Untersuchung flexibler und nichtkristalliner biologischer Makromoleküle, insbesondere von Membranproteinen und Multiproteinkomplexen, mit nahezu atomarer Auflösung ermöglicht, den Prozess der Kristallisation überwindet und gut beugende Kristalle erhält, die für die hochauflösende Strukturbestimmung durch XRD erforderlich sind.
Eine genaue Modellierung des Liganden in der KryoEM-Karte ist von größter Bedeutung, da er als Bauplan des Protein-Liganden-Komplexes auf molekularer Ebene dient. Es gibt mehrere automatisierte Ligandenbildungswerkzeuge, die in der Röntgenkristallographie verwendet werden und von der Form und Topologie der Ligandendichte abhängen, um den Liganden in die Elektronendichte 17,18,19,20 einzupassen oder aufzubauen. Wenn die Auflösung jedoch kleiner als 3 Å ist, führen diese Ansätze tendenziell zu weniger wünschenswerten Ergebnissen, da die topologischen Merkmale, von denen sie für die Erkennung und Erstellung abhängen, weniger definiert sind. In vielen Fällen haben sich diese Methoden als unwirksam erwiesen, wenn es darum geht, Liganden genau in KryoEM-Karten zu modellieren, da diese Karten im niedrigen bis mittleren Auflösungsbereich bestimmt wurden, typischerweise zwischen 3,5 Å und 5 Å17.
Der erste Schritt bei der 3D-Strukturbestimmung eines Protein-Liganden-Komplexes durch KryoEM besteht entweder darin, den Liganden mit dem Protein zu co-reinigen (wenn der Ligand eine hohe Bindungsaffinität zum Protein aufweist) oder die Inkubation der Proteinlösung mit dem Liganden für eine bestimmte Zeit vor der Gittervorbereitung. Anschließend wird ein kleines Probenvolumen auf ein plasmagereinigtes, löchriges TEM-Gitter aufgebracht, gefolgt von einem Schockfrosten in flüssigem Ethan und schließlich einer Bildgebung mit einem Kryo-TEM. Die 2D-Projektionsbilder von Hunderttausenden bis Millionen einzelner Teilchen werden gemittelt, um eine 3-dimensionale (3D) Coulomb-Potentialkarte des Makromoleküls zu rekonstruieren. Die Identifizierung und Modellierung von Liganden und Lösungsmittelmolekülen in diesen Karten stellt in vielen Fällen eine große Herausforderung dar, da die anisotrope Auflösung über die gesamte Karte (d. h. die Auflösung ist im gesamten Makromolekül nicht einheitlich), die Flexibilität in der Region, in der der Ligand gebunden ist, und das Rauschen in den Daten zu beachten ist. Viele der Modellierungs-, Verfeinerungs- und Visualisierungswerkzeuge, die für die XRD entwickelt wurden, werden nun für den Einsatz in der KryoEM für die gleichen Zwecke angepasst 18,19,20,21. In diesem Artikel wird ein Überblick über verschiedene Methoden und Software gegeben, die derzeit zur Identifizierung von Liganden, zum Aufbau von Modellen und zur Verfeinerung der aus der KryoEM abgeleiteten Koordinaten verwendet werden. Es wurde ein Schritt-für-Schritt-Protokoll erstellt, um die Prozesse bei der Modellierung von Liganden unter Verwendung spezifischer Protein-Liganden-Komplexe mit unterschiedlicher Auflösung und Komplexität zu veranschaulichen.
Der erste Schritt bei der Modellierung von Liganden in KryoEM-Karten umfasst die Identifizierung der Ligandendichte (Nicht-Protein) in der Karte. Wenn die Ligandenbindung keine Konformationsänderung im Protein induziert, dann hebt die Berechnung einer einfachen Differenzkarte zwischen dem Protein-Liganden-Komplex und dem Apo-Protein im Wesentlichen die Regionen mit zusätzlicher Dichte hervor, was auf das Vorhandensein des Liganden hindeutet. Solche Unterschiede können sofort beobachtet werden, da nur zwei Karten benötigt werden, und sogar Zwischenkarten während des Prozesses der 3D-Verfeinerung können verwendet werden, um zu überprüfen, ob der Ligand vorhanden ist. Wenn die Auflösung hoch genug ist (<3,0 Å), kann die Differenzkarte auch Einblicke in die Position von Wassermolekülen sowie von Ionen geben, die mit dem Liganden und den Proteinresten interagieren.
In Ermangelung der Apo-Protein-Karte ist es nun möglich, Servalcat22 zu verwenden, das als eigenständiges Tool verfügbar ist und im Rahmen der Refmac-Verfeinerung auch in die CCP-EM-Software-Suite 23,24 und in CCP4 8.0 Release25,26 integriert wurde. Servalcat ermöglicht die Berechnung einer FSC-gewichteten Differenzkarte (Fo-Fc) unter Verwendung der ungeschärften Halbkarten und des Apoproteinmodells als Eingabe. Die Fo-Fc-Auslassungskarte stellt die Diskrepanz zwischen der experimentellen Karte (Fo) und der vom Modell abgeleiteten Karte (Fc) dar. In Ermangelung eines Liganden im Modell deutet eine positive Dichte in einer Fo-Fc-Karte, die sich mit der experimentellen EM-Karte überschneidet, typischerweise auf das Vorhandensein des Liganden hin. Hier wird davon ausgegangen, dass die Proteinkette gut in die Karte eingepasst ist, und die verbleibende positive Dichte gibt an, wo sich der Ligand befindet. Es ist jedoch wichtig, akribisch zu untersuchen, ob die positive Dichte auf Modellierungsungenauigkeiten zurückzuführen ist, wie z. B. das falsche Rotamer einer Proteinseitenkette.
Der zweite Schritt besteht darin, aus den verfügbaren chemischen Informationen eine kartesische Koordinatendatei des Liganden mit wohldefinierter Geometrie zu erhalten oder zu erstellen. Standardliganden (z. B. ATP und NADP+), die bereits in der CCP4-Monomerbibliothek verfügbar sind, können zur Verfeinerung verwendet werden, indem die Koordinaten- und Geometriedateien über ihren Monomer-Zugangscode abgerufen werden. Für unbekannte oder nicht standardmäßige Liganden stehen jedoch verschiedene Werkzeuge zur Verfügung, um die Geometriedateien zu erstellen. Einige der Beispiele sind der eLBOW27 – (Electronic Ligand Builder and Optimization Workbench) in Phenix28, Lidia – ein eingebautes Tool in Coot29, JLigand/ACEDRG30,31, CCP-EM23,24, Ligprep32 – ein Modul von Glide innerhalb der Schrödinger-Suite. Die Ligandenkoordinatendatei wird dann in die Dichte eingepasst, wobei sowohl die experimentelle KryoEM-Karte als auch die Differenzkarte in Coot verwendet werden. Darauf folgt die Realraumverfeinerung in Phenix28 bzw. die reziproke Verfeinerung in Refmac33. Voraussetzung ist eine Linux-Workstation oder ein Laptop, der mit einer guten Grafikkarte und der oben genannten Software ausgestattet ist. Die meisten dieser Programme sind in verschiedenen Suiten enthalten. CCP-EM24 und Phenix28 sind für akademische Benutzer frei verfügbar und enthalten eine Vielzahl von Tools, die in diesem Artikel verwendet werden, darunter Coot, Refmac5 33,34,35,36, Servalcat, phenix.real_space_refine usw. In ähnlicher Weise bieten Chimera37 und ChimeraX38 kostenlose Lizenzen für akademische Benutzer.
Die Verbesserungen in der Mikroskop-Hard- und -Software haben in den letzten Jahren zu einer Zunahme der Anzahl von KryoEM-Strukturen geführt. Obwohl die derzeit höchste Auflösung, die in der Einzelpartikel-KryoEM erreicht wird, bei 1,2 Å 57,58,59 liegt, wird der Großteil der Strukturen mit einer Auflösung von etwa 3-4 Å bestimmt. Die Modellierung von Liganden in Karten mit mittlerer bis niedriger Auflösung kann schwieri…
The authors have nothing to disclose.
SJ ist Empfänger des PhD-Stipendiums von DAE-TIFR, und die Finanzierung wird anerkannt. KRV bedankt sich für den DBT B-Life-Zuschuss DBT/PR12422/MED/31/287/2014 und die Unterstützung des Ministeriums für Atomenergie der indischen Regierung unter der Projektidentifikationsnummer RTI4006.
CCP4-8.0 | Consortium of several institutes | https://www.ccp4.ac.uk | Free for academic users and includes Coot and list of tools developed for X-ray crystallography |
CCP-EM | Consortium of several institutes | https://www.ccpem.ac.uk/download.php | Free for academic users and includes Coot, Relion and many others |
Coot | Paul Emsley, LMB, Cambridge | https://www2.mrc-lmb.cam.ac.uk/personal/pemsley/coot/ | General software for model building but also available with other suites described above |
DockinMap (Phenix) | Consortium of several institutes | https://phenix-online.org/documentation/reference/dock_in_map.html | Software inside the Phenix suite for docking model into cryoEM maps |
Electron Microscopy Data Bank | Consortium of several institutes | https://www.ebi.ac.uk/emdb/ | Public Repository for Electron Microscopy maps |
Falcon | Thermo Fisher Scientific | https://assets.thermofisher.com/TFS-Assets/MSD/Technical-Notes/Falcon-3EC-Datasheet.pdf | Commercial, camera from Thermo Fisher |
Phenix | Consortium of several institutes | https://phenix-online.org/download | Free for academic users and includes Coot |
Protein Data Bank | Consortium of several institutes | https://rcsb.org | Public database of macromolecular structures |
Pymol | Schrodinger | https://pymol.org/2/ | Molecular viusalization tool. Educational version is free but comes with limitation. The full version can be obtained with a small fee. |
Relion | MRC-LMB, Cambridge | https://relion.readthedocs.io/en/release-4.0/Installation.html | Software for cryoEM image processing, also available with CCP-EM |
Titan Krios | Thermo Fisher Scientific | https://www.thermofisher.com/in/en/home/electron-microscopy/products/transmission-electron-microscopes/krios-g4-cryo-tem.html?cid=msd_ls_xbu_xmkt_tem-krios_285811_gl_pso_gaw_tpne1c& gad_source=1&gclid=CjwKCAiA-P-rBhBEEiwAQEXhHyw5c8MKThmdA AkZesWC4FYQSwIQRk ZApkj08MfYG040DtiiuL8 RihoCebEQAvD_BwE |
Commercial, cryoTEM from Thermo Fisher |
UCSF Chimera | UCSF, USA | https://www.cgl.ucsf.edu/chimera/download.html | General purpose software for display, analysis and more |
UCSF Chimera X | UCSF, USA | https://www.cgl.ucsf.edu/chimerax/ | General purpose software for display, analysis and more |