Este artigo apresenta um método para gerar cristais proteicos derivados com I3C (5-amino-2,4,6-triiodoisophthalic ácido) utilizando microseeding para gerar novas condições de cristalização em telas de matriz esparsas. As bandejas podem ser configuradas usando robôs de distribuição de líquidos ou à mão.
A elucidação da estrutura proteica usando cristalografia de raios-X requer cristais difusores de alta qualidade e solução computacional do problema da fase de difração. Novas estruturas que não possuem um modelo de homologia adequado são frequentemente derivadas com átomos pesados para fornecer informações de fase experimental. O protocolo apresentado gera eficientemente cristais de proteína derivatizadas, combinando triagem de matriz de microseedação aleatória com derivatização com uma molécula atômica pesada I3C (5-amino-2,4,6-triiodoisophthalic acid). Ao incorporar i3C na rede de cristal, o problema da fase de difusão pode ser resolvido eficientemente usando uma dispersão anômada de comprimento de onda único (SAD). O arranjo do triângulo equilátero dos átomos de iodo em I3C permite a validação rápida de uma subestrutura anômala correta. Este protocolo será útil para biólogos estruturais que resolvem estruturas macromoleculares usando técnicas baseadas em cristalografia com interesse em fase experimental.
No campo da biologia estrutural, a cristalografia de raios-X é considerada a técnica padrão-ouro para determinar as estruturas de resolução atômica das macromoléculas. Tem sido amplamente utilizado para compreender a base molecular das doenças, orientar projetos racionais de desenho de drogas e elucidar o mecanismo catalítico das enzimas1,2. Embora os dados estruturais forneçam uma riqueza de conhecimento, o processo de expressão e purificação de proteínas, cristalização e determinação da estrutura podem ser extremamente trabalhosos. Vários gargalos são comumente encontrados que dificultam o andamento desses projetos e isso deve ser enfrentado para agilizar eficientemente o gasoduto de determinação da estrutura cristalina.
Após a expressão recombinante e purificação, devem ser identificadas condições preliminares propícias à cristalização, o que muitas vezes é um aspecto árduo e demorado da cristalografia de raios-X. Telas de matriz esparsas comerciais que consolidam condições conhecidas e publicadas foram desenvolvidas para aliviar esse gargalo3,4. No entanto, é comum gerar poucos hits a partir dessas telas iniciais, apesar de usar amostras de proteínas altamente puras e concentradas. Observar gotas claras indica que a proteína pode não estar atingindo os níveis de supersaturação necessários para nuclear um cristal. Para incentivar a nucleação e o crescimento cristalinos, as sementes produzidas a partir de cristais pré-existentes podem ser adicionadas às condições e isso permite maior amostragem do espaço de cristalização. Ireton e Stoddard introduziram pela primeira vez o método de triagem de matriz microseed5. Cristais de má qualidade foram esmagados para fazer um estoque de sementes e, em seguida, adicionados sistematicamente às condições de cristalização contendo diferentes sais para gerar novos cristais de qualidade de difração que não teriam se formado de outra forma. Esta técnica foi ainda melhorada por D’Arcy et al. que desenvolveram triagem de matriz microseed aleatória (rMMS) na qual as sementes foram introduzidas em uma tela de cristalização de matriz sobressalente6,7. Isso melhorou a qualidade dos cristais e aumentou o número de acertos de cristalização em média em um fator de 7.
Depois que os cristais são produzidos com sucesso e um padrão de difração de raios-X é obtido, outro gargalo na forma de resolver o ‘problema de fase’ é encontrado. Durante o processo de aquisição de dados, a intensidade da difração (proporcional ao quadrado da amplitude) é registrada, mas as informações de fase são perdidas, dando origem ao problema de fase que interrompe a determinação imediata da estrutura8. Se a proteína alvo compartilhar a identidade de alta sequência a uma proteína com uma estrutura previamente determinada, a substituição molecular pode ser usada para estimar as informações de fase9,10,11,12. Embora este método seja rápido e barato, as estruturas do modelo podem não estar disponíveis ou adequadas. O sucesso do método de substituição molecular baseado em modelo de homologia cai significativamente à medida que a identidade sequencial fica abaixo de 35%13. Na ausência de um modelo de ecologia adequado, podem ser testados métodos ab initio, como ARCIMBOLDO14,15 e AMPLE16. Esses métodos usam modelos ou fragmentos previstos computacionalmente como pontos de partida para substituição molecular. A AMPLE, que usa modelos de isca previstos como pontos de partida, luta para resolver estruturas de grandes proteínas (>100 resíduos) e proteínas que contêm predominantemente β-folhas. ARCIMBOLDO, que tenta encaixar pequenos fragmentos para se estender a uma estrutura maior, limita-se a dados de alta resolução (≤2 Å) e pela capacidade dos algoritmos de expandir os fragmentos em uma estrutura completa.
Se os métodos de substituição molecular falharem, devem ser utilizados métodos diretos como substituição isomorfo17,18 e dispersão anômal por um único comprimento de onda (SAD19) ou múltiplos comprimentos de onda (MAD20). Este é frequentemente o caso de estruturas verdadeiramente novas, onde o cristal deve ser formado ou derivado com um átomo pesado. Isso pode ser conseguido por imersão ou co-cristalização com um composto átomo pesado, modificação química (como incorporação de 5 bromouracil no RNA) ou expressão proteica rotulada (como incorporar aminoácidos de selenomethionina ou selenocisteína na estrutura primária)21,22. Isso complica ainda mais o processo de cristalização e requer triagem e otimização adicionais.
Uma nova classe de compostos de corte, incluindo i3C (5-amino-2,4,6-triiodoisophthalic acid) e B3C (5-amino-2,4,6-tribromoisophthalic acid), oferecem vantagens emocionantes sobre compostos pré-existentes23,24,25. Tanto o I3C quanto o B3C apresentam um andaime aro aromático com um arranjo alternado de dispersões anômalas necessárias para métodos de eliminação direta e grupos funcionais amino ou carboxilato que interagem especificamente com a proteína e fornecem especificidade do local de ligação. O arranjo triangular equilateral subsequente de grupos de metais pesados permite validação simplificada da subestrutura de eliminação. No momento da redação, existem 26 estruturas vinculadas ao I3C no Banco de Dados de Proteínas (PDB), das quais 20 foram resolvidas utilizando o CED26.
Este protocolo melhora a eficácia do pipeline de determinação da estrutura, combinando os métodos de derivatização de metais pesados e triagem rMMS para aumentar simultaneamente o número de hits de cristalização e simplificar o processo de derivatização de cristal. Demonstramos que este método foi extremamente eficaz com a lise branca de ovo de galinha e um domínio de uma nova proteína de lise de bacteriófago P6827. A solução de estrutura usando o altamente automatizado pipeline de determinação da estrutura auto-riquixá é descrita, especificamente adaptada para o composto de eliminação I3C. Existem outros dutos automatizados que podem ser usados como AutoSol28,ELVES29 e CRANK230. Pacotes não totalmente automatizados, como SHELXC/D/E, também podem ser usados31,32,33. Este método é particularmente benéfico para pesquisadores que estão estudando proteínas sem modelos homólogos no PDB, reduzindo significativamente o número de etapas de triagem e otimização. Um pré-requisito para este método são cristais proteicos ou um precipitado cristalino da proteína alvo, obtido a partir de ensaios de cristalização anteriores.
A determinação da estrutura de uma nova proteína na ausência de um modelo de homologia adequado para substituição molecular requer um ajuste experimental. Esses métodos requerem a incorporação de átomos pesados no cristal proteico que adiciona um nível de complexidade ao pipeline de determinação da estrutura e pode introduzir inúmeros obstáculos que devem ser enfrentados. Átomos pesados podem ser incorporados diretamente à proteína através da expressão rotulada usando selenomethionina e selenocisteína. Como este método é caro, trabalhoso e pode resultar em menores rendimentos proteicos, a proteína rotulada é frequentemente expressa após condições de cristalização ter sido encontrada e otimizada com proteína sem rótulo. Alternativamente, os cristais podem ser derivados por imersão em uma solução contendo átomos pesados22,63,64. Este método muitas vezes usa cristais de alta qualidade e, portanto, é realizado após um método robusto de cristalização já ter sido desenvolvido. A obtenção com sucesso de um cristal derivatizado usando este método requer maior otimização dos procedimentos de imersão e triagem de diferentes compostos de eliminação, adicionando assim mais tempo a um processo já trabalhoso.
A co-cristalização da proteína com o átomo pesado pode ser realizada na fase de triagem, simplificando assim o processo e reduzindo as etapas de manipulação de cristais que podem causar danos. No entanto, ainda existe o cenário potencial de obtenção de poucos golpes iniciais de cristalização e o problema de escolher um composto átomo pesado compatível. Muitos compostos de eliminação disponíveis atualmente são incompatíveis com precipitantes, buffers e aditivos comumente encontrados em condições de cristalização. Eles podem ser insolúveis em tampões de sulfato e fosfato, quelato para citar e acetato, reagir desfavoravelmente com buffers HEPES e Tris ou ser sequestrado por DTT e β-mercaptoethanol21. Como o composto de eliminação I3C não sofre dessas incompatibilidades, é um composto robusto que pode ser favorável a muitas condições diferentes.
Neste estudo, é apresentado um método simplificado de produção de cristais derivativos prontos para a eliminação da SAD através da co-cristalização simultânea do composto de eliminação I3C e da RMMS. A combinação de ambas as técnicas aumenta o número de acertos de cristalização, com muitas das condições com características de morfologia e difração melhoradas. Em ambos os casos de teste Orf11 NTD e HEWL, foram identificadas novas condições na tela I3C-rMMS que estavam ausentes quando o I3C não estava presente. Potencialmente, o I3C pode se ligar favoravelmente à proteína, facilitando a formação e estabilização dos contatos cristais27. Por sua vez, isso pode induzir a cristalização e possivelmente melhorar as características de difração. Além de ser um composto compatível com telas de matriz esparsas, o I3C também é um composto atraente devido às suas propriedades intrínsecas. Os grupos funcionais que alternam com iodo no andaime aromático do anel aromático permitem a ligação específica às proteínas. Isso leva a uma maior ocupação e potencialmente reduz o sinal de fundo23. Além disso, o arranjo de dispersores anômalos em um triângulo equilátero é óbvio na subestrutura e pode ser usado para validar rapidamente a ligação de I3C (Figura 4B e 4C). Finalmente, pode produzir um sinal anômeo com radiação síncrotron tunable, bem como fontes de raios-X de cromo e cobre rotativos. Assim, pode ser aplicado a muitos fluxos de trabalho diferentes. Como o I3C está amplamente disponível e barato de compra, essa abordagem está ao alcance da maioria dos laboratórios de biologia estrutural.
Existem várias considerações experimentais que devem ser abordadas ao utilizar o método I3C-rMMS. Este método não pode ser aplicado se o material cristalino inicial da proteína não puder ser obtido. Em casos difíceis, material cristalino de uma proteína homólogo também pode ser usado para gerar sementes. Esta abordagem de cross-semeamento para rMMS mostrou alguns resultados promissores7. Otimizar o número de cristal através da diluição do estoque de sementes é um passo crucial, que não deve ser negligenciado, para maximizar a chance de produzir cristais grandes de alta qualidade e adquirir dados adequados de difração. Se houver poucos locais I3C identificados na unidade assimétrica, as condições propícias à cristalização devem ser ainda mais otimizadas com uma concentração aumentada de I3C. Isso pode aumentar a ocupação do I3C para maximizar o sinal anômroo e ajudar a derivatização do cristal.
Pode haver casos em que essa técnica pode não ser o método ideal para derivatizar cristais proteicos. À medida que o tamanho de uma proteína ou complexo proteico aumenta, o número limitado de locais I3C na superfície da proteína pode não fornecer poder de corte suficiente para resolver a estrutura. Nestes cenários em que se suspeita que o tamanho da proteína esteja impedindo a eliminação, a rotulagem selenomethionina da proteína pode ser uma abordagem mais viável para a eliminação da proteína. Se a proteína tiver um número adequado de resíduos de metionina na proteína (recomendado ter pelo menos uma metionina por 100 resíduos65) e a incorporação de selenomethionina de alta eficiência em uma proteína pode ser alcançada (como nos sistemas de expressão bacteriana66),múltiplos átomos de selênio de alta ocupação estarão presentes nos cristais para fase da estrutura.
Além disso, algumas proteínas podem ser inerentemente inadequadas para a derivatização com I3C. Os locais de ligação I3C em proteínas dependem da estrutura proteica. Pode haver proteínas que naturalmente têm poucas manchas expostas compatíveis com a ligação I3C. Assim, não é imprevisível que possa haver dificuldades em co-cristalizar algumas proteínas-alvo com I3C.
The authors have nothing to disclose.
Esta pesquisa foi realizada na linha de vigas MX1 no Síncrotron Australiano, parte da ANSTO. Os autores gostariam de reconhecer os membros dos laboratórios Shearwin e Bruning para discussões sobre este trabalho. Os autores também gostariam de reconhecer o Dr. Santosh Panjikar e a Dra.
O seguinte financiamento é reconhecido: Australian Research Council (grant Nos. DP150103009 e DP160101450 para Keith E. Shearwin); Universidade de Adelaide (Bolsa de Estudos do Programa de Pesquisa do Governo Australiano para Jia Quyen Truong e Stephanie Nguyen).
10 mL disposable luer lock syringes | Adelab Scientific | T3SS10LAT | Used for dispensing vacuum grease for hanging drop crystal tray wells |
24 well tissue culture plate | Sigma Aldrich | CLS3527 | Used for hanging drop crystal tray |
3 inch wide Crystal Clear Sealing Tape | Hampton Research | HR4-506 | For 96 well crystallization screens set up by robot |
5-amino-2,4,6-triiodoisophthalic acid | Alfa Aesar | B22178 | Commonly referred to as I3C in the article |
Art Robbins Intelli-Plate 96-2 Original | Hampton Research | HR3-297 | For 96 well crystallization screens set up by robot |
Coverslips | Thermo Fisher Scientific | 18X18-2 | Coverslips for hanging drop crystal tray wells |
Dow Corning vacuum grease | Hampton Research | HR3-510 | Used for sealing hanging drop crystal tray wells |
Eppendorf Pipette 0.1 μL-2.5 μL | Eppendorf | 3120000011 | |
Gilson Pipette 2 μL-20 μL | John Morris Group | 1153247 | |
Gilson Pipette 20 μL-200 μL | John Morris Group | 1152006 | |
Glass pasteur pipettes | Adelab Scientific | HIR92601.01 | |
Hen Egg White Lysozyme | Sigma-Aldrich | L6876 | Approximately 95% pure |
IndexHT screen | Hampton Research | HR2-134 | |
Microscope illuminator | Meiji Techno | FT192/230 | Light source to illuminate crystallography experiments |
PEG/ION HT screen | Hampton Research | HR2-139 | |
Phoenix Liquid Dispenser | Art Robbins Instruments | 602-0001-10 | |
Scalpel with scalpel blade no. 15 | Adelab Scientific | LV-SMSCPO15 | |
Seed bead kit | Hampton Research | HR2-320 | Kit contains a glass probe for crushing crystals. A PTFE seed bead, designed for crushing crystals, is also part of the kit but not used in this protocol. |
Stereo microscope | Meiji Techno | EMZ-5TR | Microscope for visualising crystallography experiments |
Tweezers | Sigma-Aldrich | T5415 | |
Vortex mixer | Adelab Scientific | RAVM1 |