Este protocolo apresenta as ferramentas disponíveis para modelar ligantes de moléculas pequenas em mapas crioEM de macromoléculas.
Decifrar as interações proteína-ligante em um complexo macromolecular é crucial para entender o mecanismo molecular, os processos biológicos subjacentes e o desenvolvimento de medicamentos. Nos últimos anos, a microscopia eletrônica de amostra criogênica (cryoEM) surgiu como uma técnica poderosa para determinar as estruturas de macromoléculas e investigar o modo de ligação do ligante em resolução quase atômica. Identificar e modelar moléculas não proteicas em mapas cryoEM é muitas vezes um desafio devido à resolução anisotrópica em toda a molécula de interesse e ao ruído inerente aos dados. Neste artigo, os leitores são apresentados a vários softwares e métodos atualmente usados para identificação de ligantes, construção de modelos e refinamento de coordenadas atômicas usando macromoléculas selecionadas. Uma das maneiras mais simples de identificar a presença de um ligante, conforme ilustrado com a enzima enolase, é subtrair os dois mapas obtidos com e sem o ligante. A densidade extra do ligante provavelmente se destacará no mapa de diferenças, mesmo em um limite mais alto. Há casos, como mostrado no caso do receptor metabotrópico de glutamato mGlu5, em que esses mapas de diferença simples não podem ser gerados. O método recentemente introduzido de derivar o mapa de omitir Fo-Fc pode servir como uma ferramenta para validar e demonstrar a presença do ligante. Finalmente, usando a bem estudada β-galactosidase como exemplo, o efeito da resolução na modelagem dos ligantes e moléculas de solvente em mapas de crioEM é analisado e uma perspectiva de como o cryoEM pode ser usado na descoberta de medicamentos é apresentada.
As células realizam suas funções realizando inúmeras reações químicas simultânea e independentemente, cada uma meticulosamente regulada para garantir sua sobrevivência e adaptabilidade em resposta a estímulos ambientais. Isso é obtido pelo reconhecimento molecular, que permite que as biomoléculas, especialmente as proteínas, formem complexos transitórios ou estáveis com outras macromoléculas, bem como pequenas moléculas ou ligantes1. Assim, as interações proteína-ligante são fundamentais para todos os processos da biologia, que incluem a regulação da expressão e atividade proteica, o reconhecimento de substratos e cofatores por enzimas, bem como a forma como as células percebem e transmitem sinais 1,2. Uma melhor compreensão das propriedades cinéticas, termodinâmicas e estruturais do complexo proteína-ligante revela a base molecular da interação do ligante e também facilita o design racional do medicamento, otimizando a interação e a especificidade do medicamento. Uma abordagem econômica e mais rápida para estudar a interação proteína-ligante é usar o docking molecular, que é um método computacional que rastreia virtualmente uma gama diversificada de pequenas moléculas e prevê o modo de ligação e a afinidade desses ligantes às proteínas-alvo3. No entanto, evidências experimentais de estruturas de alta resolução determinadas por difração de raios X (XRD), ressonância magnética nuclear (RMN) ou criomicroscopia eletrônica (cryoEM) fornecem a prova essencial para tais previsões e auxiliam no desenvolvimento de ativadores ou inibidores mais novos e eficazes para um determinado alvo. Este artigo usa a abreviatura ‘cryoEM’, como a técnica é comumente chamada. No entanto, há um debate em andamento sobre a escolha da nomenclatura correta e, recentemente, o termo amostra criogênica Electron Microscopy (cryoEM) foi proposto para indicar que a amostra está em temperatura criogênica e fotografada com elétrons4. Da mesma forma, os mapas derivados do cryoEM foram chamados de potencial de elétrons, potencial eletrostático ou potencial de Coulomb e, para simplificar, aqui usamos mapas cryoEM 5,6,7,8,9,10.
Embora o XRD tenha sido a técnica padrão-ouro na determinação da estrutura de alta resolução de complexos proteína-ligante, o cryoEM pós-revoluçãode resolução 11 ganhou impulso, conforme indicado pelo aumento de mapas de potencial de Coulomb ou mapas de cryoEM depositados no Banco de Dados de Microscopia Eletrônica (EMDB) 12 , 13 nos últimos anos14 . Devido aos avanços nos métodos de preparação de amostras, imagens e processamento de dados, o número de depósitos do Protein Data Bank (PDB)14 empregando crioEM aumentou de 0,7% para 17% entre 2010 e 2020, com aproximadamente 50% das estruturas relatadas em 2020 sendo determinadas com resolução de 3,5 Å ou melhor15,16. O CryoEM tem sido rapidamente adotado pela comunidade de biologia estrutural, incluindo a indústria farmacêutica, pois permite o estudo de macromoléculas biológicas flexíveis e não cristalinas, especialmente proteínas de membrana e complexos multiproteicos, em resolução quase atômica, superando o processo de cristalização e obtendo cristais bem difrativos necessários para a determinação da estrutura de alta resolução por DRX.
A modelagem precisa do ligante no mapa cryoEM é fundamental, pois serve como um modelo do complexo proteína-ligante em nível molecular. Existem várias ferramentas automatizadas de construção de ligantes usadas na cristalografia de raios-X que dependem da forma e topologia da densidade do ligante para ajustar ou construir o ligante na densidade de elétrons 17,18,19,20. No entanto, se a resolução for inferior a 3 Å, essas abordagens tendem a produzir resultados menos desejáveis porque as características topológicas das quais dependem para reconhecimento e construção tornam-se menos definidas. Em muitos casos, esses métodos se mostraram ineficazes na modelagem precisa de ligantes em mapas cryoEM, pois esses mapas foram determinados na faixa de resolução baixa a média, normalmente entre 3,5 Å-5 Å17.
A primeira etapa na determinação da estrutura 3D de um complexo proteína-ligante por cryoEM envolve a co-purificação do ligante com a proteína (quando o ligante tem uma alta afinidade de ligação com a proteína) ou a incubação da solução proteica com o ligante por um período específico antes da preparação da grade. Posteriormente, um pequeno volume de amostra é colocado em uma grade TEM perfurada limpa por plasma, seguida de congelamento instantâneo em etano líquido e, finalmente, imagem com um crio-TEM. As imagens de projeção 2D de centenas de milhares a milhões de partículas individuais são calculadas para reconstruir um mapa de potencial de Coulomb tridimensional (3D) da macromolécula. Identificar e modelar ligantes e moléculas de solvente nesses mapas apresenta desafios significativos em muitos casos devido à resolução anisotrópica em todo o mapa (ou seja, a resolução não é uniforme em toda a macromolécula), flexibilidade na região onde o ligante está ligado e o ruído nos dados. Muitas das ferramentas de modelagem, refinamento e visualização que foram desenvolvidas para XRD estão agora sendo adaptadas para uso em cryoEM para os mesmos propósitos 18,19,20,21. Neste artigo, é apresentada uma visão geral de vários métodos e softwares usados atualmente para identificar ligantes, construir modelos e refinar as coordenadas derivadas do cryoEM. Um protocolo passo a passo foi fornecido para ilustrar os processos envolvidos na modelagem de ligantes usando complexos proteína-ligante específicos com resolução e complexidade variadas.
A primeira etapa na modelagem de ligantes em mapas cryoEM inclui a identificação da densidade de ligantes (não proteica) no mapa. Se a ligação do ligante não induz nenhuma mudança conformacional na proteína, então o cálculo de um mapa de diferença simples entre o complexo proteína-ligante e a apo-proteína destaca essencialmente as regiões de densidade extra, sugerindo a presença do ligante. Tais diferenças podem ser observadas imediatamente, pois requer apenas dois mapas, e mesmo mapas intermediários durante o processo de refinamento 3D podem ser usados para verificar se o ligante está presente. Além disso, se a resolução for alta o suficiente (<3,0 Å), o mapa de diferenças também pode fornecer informações sobre a localização das moléculas de água, bem como dos íons que interagem com o ligante e os resíduos de proteínas.
Na ausência do mapa de apo-proteína, agora é possível usar o Servalcat22, que está disponível como uma ferramenta autônoma e também foi integrado ao pacote de software CCP-EM 23,24 como parte do refinamento do Refmac e no CCP4 8.0 versão25,26. O Servalcat permite o cálculo de um mapa de diferença ponderada FSC (Fo-Fc) usando os semimapas não nitidos e o modelo de apoproteína como entrada. O mapa de omitir Fo-Fc representa a disparidade entre o mapa experimental (Fo) e o mapa derivado do modelo (Fc). Na ausência de um ligante no modelo, uma densidade positiva em um mapa Fo-Fc que se sobrepõe ao mapa EM experimental normalmente sugere a presença do ligante. A suposição aqui é que a cadeia de proteínas está bem ajustada no mapa e a densidade positiva restante indica a localização do ligante. No entanto, é importante examinar meticulosamente se a densidade positiva decorre de imprecisões de modelagem, como o rotâmero errado de uma cadeia lateral de proteína.
A segunda etapa envolve a obtenção ou criação de um arquivo de coordenadas cartesianas do ligante com geometria bem definida a partir das informações químicas disponíveis. Os ligantes padrão (por exemplo, ATP e NADP+) que já estão disponíveis na biblioteca de monômeros CCP4 podem ser usados para refinamento recuperando os arquivos de coordenadas e geometria por meio de seu código de acesso de monômero. No entanto, para ligantes desconhecidos ou não padrão, várias ferramentas estão disponíveis para criar os arquivos de geometria. Alguns dos exemplos incluem o eLBOW27 – (construtor de ligantes eletrônicos e bancada de otimização) no Phenix28, Lidia – uma ferramenta embutida no Coot29, JLigand / ACEDRG30,31, CCP-EM23,24, Ligprep32-a módulo do Glide dentro da suíte Schrödinger. O arquivo de coordenadas do ligante é então ajustado na densidade, guiado pelo mapa experimental cryoEM e pelo mapa de diferença em Coot. Isso é seguido pelo refinamento do espaço real no Phenix28 ou refinamento recíproco no Refmac33. É necessária uma estação de trabalho Linux ou um laptop equipado com uma boa placa gráfica e o software mencionado acima. A maioria desses programas está incluída em várias suítes. CCP-EM24 e Phenix28 estão disponíveis gratuitamente para usuários acadêmicos e incluem uma variedade de ferramentas usadas neste artigo, incluindo Coot, Refmac5 33,34,35,36, Servalcat, phenix.real_space_refine, etc. Da mesma forma, o Chimera37 e o ChimeraX38 fornecem licenças gratuitas para usuários acadêmicos.
As melhorias no hardware e software do microscópio resultaram em um aumento no número de estruturas crioEM nos últimos anos. Embora a resolução mais alta alcançada no momento em crioEM de partícula única seja de 1,2 Å 57,58,59, a maioria das estruturas está sendo determinada em torno de 3-4 Å de resolução. A modelagem de ligantes em mapas de média a baixa resolução pode ser complicada e muitas vezes repleta de am…
The authors have nothing to disclose.
SJ é beneficiário da bolsa de doutorado do DAE-TIFR, e o financiamento é reconhecido. A KRV reconhece a concessão DBT B-Life DBT/PR12422/MED/31/287/2014 e o apoio do Departamento de Energia Atômica, Governo da Índia, sob a Identificação do Projeto No. RTI4006.
CCP4-8.0 | Consortium of several institutes | https://www.ccp4.ac.uk | Free for academic users and includes Coot and list of tools developed for X-ray crystallography |
CCP-EM | Consortium of several institutes | https://www.ccpem.ac.uk/download.php | Free for academic users and includes Coot, Relion and many others |
Coot | Paul Emsley, LMB, Cambridge | https://www2.mrc-lmb.cam.ac.uk/personal/pemsley/coot/ | General software for model building but also available with other suites described above |
DockinMap (Phenix) | Consortium of several institutes | https://phenix-online.org/documentation/reference/dock_in_map.html | Software inside the Phenix suite for docking model into cryoEM maps |
Electron Microscopy Data Bank | Consortium of several institutes | https://www.ebi.ac.uk/emdb/ | Public Repository for Electron Microscopy maps |
Falcon | Thermo Fisher Scientific | https://assets.thermofisher.com/TFS-Assets/MSD/Technical-Notes/Falcon-3EC-Datasheet.pdf | Commercial, camera from Thermo Fisher |
Phenix | Consortium of several institutes | https://phenix-online.org/download | Free for academic users and includes Coot |
Protein Data Bank | Consortium of several institutes | https://rcsb.org | Public database of macromolecular structures |
Pymol | Schrodinger | https://pymol.org/2/ | Molecular viusalization tool. Educational version is free but comes with limitation. The full version can be obtained with a small fee. |
Relion | MRC-LMB, Cambridge | https://relion.readthedocs.io/en/release-4.0/Installation.html | Software for cryoEM image processing, also available with CCP-EM |
Titan Krios | Thermo Fisher Scientific | https://www.thermofisher.com/in/en/home/electron-microscopy/products/transmission-electron-microscopes/krios-g4-cryo-tem.html?cid=msd_ls_xbu_xmkt_tem-krios_285811_gl_pso_gaw_tpne1c& gad_source=1&gclid=CjwKCAiA-P-rBhBEEiwAQEXhHyw5c8MKThmdA AkZesWC4FYQSwIQRk ZApkj08MfYG040DtiiuL8 RihoCebEQAvD_BwE |
Commercial, cryoTEM from Thermo Fisher |
UCSF Chimera | UCSF, USA | https://www.cgl.ucsf.edu/chimera/download.html | General purpose software for display, analysis and more |
UCSF Chimera X | UCSF, USA | https://www.cgl.ucsf.edu/chimerax/ | General purpose software for display, analysis and more |