Um método avançado de seleção de partículas para crio-EM, ou seja, CryoSieve, melhora a resolução do mapa de densidade removendo a maioria das partículas nas pilhas finais, conforme demonstrado por meio de sua aplicação em um conjunto de dados do mundo real.
Na última década, os avanços na tecnologia e na metodologia no campo da análise de partícula única (SPA) de microscopia eletrônica criogênica (cryo-EM) melhoraram substancialmente nossa capacidade de exame estrutural de alta resolução de macromoléculas biológicas. Esse avanço inaugurou uma nova era de insights moleculares, substituindo a cristalografia de raios-X como o método dominante e fornecendo respostas a questões de longa data na biologia. Como o crio-EM não depende da cristalização, que é uma limitação significativa da cristalografia de raios-X, ele captura partículas de qualidade variável. Consequentemente, a seleção de partículas é crucial, pois a qualidade das partículas selecionadas influencia diretamente na resolução do mapa de densidade reconstruído. Uma abordagem iterativa inovadora para seleção de partículas, denominada CryoSieve, melhora significativamente a qualidade dos mapas de densidade reconstruídos, reduzindo efetivamente o número de partículas na pilha final. Evidências experimentais mostram que este método pode eliminar a maioria das partículas nas pilhas finais, resultando em um aumento notável na qualidade dos mapas de densidade. Este artigo descreve o fluxo de trabalho detalhado dessa abordagem e mostra sua aplicação em um conjunto de dados do mundo real.
A análise de partícula única (SPA) por microscopia eletrônica criogênica (cryo-EM) tornou-se um método dominante para determinar mapas de densidade tridimensional de alta resolução de macromoléculas biológicas. Devido a uma série de inovações tecnológicas 1,2,3,4,5,6, denominada revolução de resolução 7, o crio-EM tem a capacidade de determinar as estruturas de macromoléculas biológicas com resolução atômica a uma taxa sem precedentes. Essa descoberta marca o início de uma nova era nos insights moleculares, ultrapassando a cristalografia de raios-X como a técnica predominante e respondendo a questões biológicas de longa data.
O Cryo-EM SPA diverge da cristalografia de raios-X por não exigir a cristalização de macromoléculas biológicas. Em vez disso, uma solução contendo as macromoléculas biológicas alvo é rapidamente congelada em gelo vítreo. Em seguida, é fotografado com um feixe de elétrons para produzir uma série de micrografias, ignorando a necessidade de cristalização8. Posteriormente, algoritmos de seleção de partículas são utilizados para extrair partículas brutas individuais dessas micrografias 4,9,10,11,12. Como o crio-EM não depende da cristalização, é natural que as partículas extraídas sejam predominantemente danificadas ou em estados conformacionais indesejados, necessitando de várias rodadas de seleção de partículas para obter um mapa de densidade de alta resolução. No processamento de imagens crio-EM SPA, a seleção de partículas é, portanto, crucial para a obtenção de mapas de densidade de alta resolução13.
No SPA crio-EM, os métodos padrão de seleção de partículas incluem classificação bidimensional (2D) e tridimensional (3D)14. A classificação 2D categoriza as partículas em um número predefinido de grupos, produzindo uma imagem média e uma resolução 2D estimada para cada classe. Os pesquisadores podem então inspecionar visualmente essas classes, removendo partículas de grupos de resolução mais baixa para usar as restantes em reconstruções destinadas a alcançar uma resolução mais alta. Uma vez que as poses das partículas são estabelecidas usando algoritmos de refinamento, os pesquisadores prosseguirão com a classificação 3D, agrupando as partículas em várias classes. Isso permite a inspeção visual do mapa de densidade reconstruído para cada classe, permitindo a exclusão de partículas indesejáveis, como aquelas de conformações indesejadas. Após várias rodadas de classificação, uma pilha final composta por partículas de qualidade relativamente alta é obtida. Essas pilhas finais são fundamentais na produção de mapas de densidade de resolução atômica ou quase atômica.
Zhu e seus colegas demonstraram que uma seleção adicional de partículas pode ser realizada nessas pilhas finais15. O CryoSieve15, um método iterativo inovador para seleção de partículas, pode ser aplicado para melhorar a qualidade do mapa de densidade final, reduzindo significativamente o número de partículas. Embora outros critérios e softwares de classificação de partículas, como o método de correlação cruzada normalizada (NCC)16, a abordagem de consistência de gráfico angular (AGC)17 e a classificação de não alinhamento5, estejam atualmente em uso no campo, esse método demonstrou superar esses algoritmos em termos de eficácia.
Neste estudo, apresentamos um guia detalhado de todo o processo. Como estudo de caso, aplicamos esse novo método ao conjunto de dados do trímero de hemaglutinina da influenza (entrada EMPIAR: 10097)18, que inclui 130.000 partículas em sua pilha final. Nosso procedimento descartou com sucesso cerca de 73,8% das partículas da pilha final deste conjunto de dados, melhorando a resolução do mapa de densidade reconstruído de 4,11 Å para 3,62 Å. Além do trímero de hemaglutinina da gripe, os resultados de vários conjuntos de dados são apresentados em publicações anteriores15, mostrando uma variedade de resoluções e pesos moleculares de biomoléculas.
Cryo-EM é uma técnica fundamental para elucidar as estruturas de moléculas biológicas. Nesse processo, após a coleta de dados via microscopia, a extração de partículas das micrografias é essencial, seguida de sua classificação em várias etapas para compilar a pilha final. Um desafio comum é a predominância de partículas danificadas ou indesejavelmente conformadas, ressaltando a necessidade de seleção repetida de partículas para obter mapas de densidade de alta resolução. Isso torna a seleção de partículas uma etapa crítica no SPA crio-EM para obter mapas de densidade de alta qualidade. As técnicas de seleção de partículas existentes incluem o algoritmo de validação estatística sem inclinação22, a abordagem baseada em pontuação z23 e o método de estimativa de precisão angular24.
O CryoSieve surge como uma ferramenta valiosa neste contexto, adepta da eliminação de um número significativo de partículas estranhas da pilha final. Essa redução não apenas aumenta a eficiência computacional da reconstrução, mas também agiliza o processo. Ele oferece um conjunto abrangente para seleção de partículas, onde a extensão do descarte de partículas e a consequente melhoria na resolução dependem em grande parte da qualidade inicial dos dados e das metodologias empregadas no processamento de dados.
Neste manuscrito, apresentamos um fluxo de trabalho completo de peneiramento de partículas usando o conjunto de dados de casos reais de trímero de hemaglutinina influenza (entrada EMPIAR: 10097). As etapas abordadas e discutidas aqui podem ser resumidas como peneiramento de partículas e reestimativa de pose. O volume final reconstruído em 3D alcançou uma resolução de 3,62 Å, e as cadeias laterais em alfa-hélices foram mais claras no volume pós-processado em comparação com o mapa de densidade publicado.
CryoSieve é um método de código aberto que está disponível no GitHub (https://github.com/mxhulab/cryosieve). Um tutorial detalhado também pode ser encontrado em sua página inicial. Os usuários podem instalá-lo e usá-lo seguindo o tutorial. Além disso, dois módulos, cryosieve-csrefine e cryosieve-csrhbfactor, são fornecidos. O módulo cryosieve-csrefine foi criado especificamente para automatizar a execução sequencial de várias operações no CryoSPARC (Arquivo Suplementar 5). Essas operações incluem a importação de pilhas de partículas e a realização de trabalhos de refinamento ab initio, homogêneo ou não uniforme. Por outro lado, o módulo cryosieve-csrhbfactor foi projetado para automatizar a determinação do fator B de Rosenthal-Henderson, aproveitando os recursos do cryosieve-csrefine (Arquivo Suplementar 6).
Atualmente, a aplicação deste método está confinada a cenários de conformação única. Consequentemente, nos casos em que as partículas representam múltiplas conformações, suas capacidades são limitadas. Os usuários são aconselhados a se envolver inicialmente na classificação 3D para segregar partículas de conformações díspares antes de empregá-la para seleção de partículas refinadas. Além disso, embora o método demonstre proficiência na filtragem de mais de 50% das partículas da pilha final, as origens dessas partículas descartadas e as razões subjacentes para sua contribuição insignificante para a qualidade da reconstrução permanecem obscuras. Essa lacuna na compreensão requer pesquisas adicionais para abordar de forma abrangente e potencialmente corrigir essa limitação.
Existem três métodos possíveis de classificação de partículas ou peneiramento de partículas. Em primeiro lugar, o cisTEM4 pode relatar uma pontuação para cada imagem de partícula após o refinamento 3D. Os usuários podem classificar as partículas usando a pontuação cisTEM para descartar partículas. A abordagem de consistência de grafo angular (AGC)17 também é um método para descartar partículas desalinhadas. Além disso, a classificação de não alinhamento5 é uma maneira tradicional de descartar partículas usando a classificação 3D. Comparamos a qualidade das partículas retidas por esses métodos com o CryoSieve e descobrimos que as partículas retidas do CryoSieve são de maior qualidade15. O método apresentado aqui supera significativamente os métodos alternativos e atinge o menor número de partículas na mesma resolução.
Conforme demonstrado no resultado, a maioria das partículas em uma pilha final de crio-EM não contribui para a reconstrução do mapa de densidade. Em outras palavras, entre todas as partículas coletadas durante a aquisição da imagem, apenas algumas poucas, ou seja, o subconjunto mais fino, realmente contribuem para a reconstrução final. Consequentemente, a razão entre esse subconjunto final e o número total de partículas coletadas pode servir como uma métrica quantitativa para avaliar a qualidade da amostra. Quanto maior essa proporção, melhor a qualidade da amostra. Apesar dos avanços técnicos que tornaram o cryo-EM mais acessível aos biólogos estruturais, a preparação de amostras continua sendo um grande gargalo no fluxo de trabalho. Cientistas e engenheiros estão, portanto, concentrando seus esforços nesse desafio25. Na análise de partícula única (SPA), a preparação da amostra consiste em duas etapas cruciais: otimização da amostra e preparação da grade. O primeiro envolve a purificação do espécime, mantendo seu estado bioquímico ideal. Este último envolve a preparação da amostra para análise no microscópio, incluindo tratamento químico ou de plasma da grade, deposição de amostras e vitrificação. Inúmeras técnicas foram propostas para lidar com a instabilidade macromolecular, mas a eficácia de uma abordagem em relação a outra depende das características da amostra25,26. Atualmente, os resultados da preparação da grade são fortemente influenciados pelo conhecimento e experiência do usuário, o que pode tornar o processo demorado e desafiador27,28. As inúmeras variáveis encontradas na preparação da amostra e da grade representam desafios no estabelecimento de relações de causa e efeito, pois os pesquisadores só podem avaliar a amostra em nível molecular usando o microscópio. Como resultado, ainda faltam estatísticas quantitativas a partir de comparações de diferentes protocolos de preparação de amostras e grades, sendo necessária uma abordagem sistemática para investigar tendências e compreender os mecanismos fundamentais do comportamento da amostra29.
The authors have nothing to disclose.
Este trabalho foi apoiado pela Academia de Pesquisa e Tradução de Shenzhen (para M.H.), o Centro de Inovação Avançada para Biologia Estrutural (para M.H.), o Centro de Pesquisa de Fronteira de Pequim para Estrutura Biológica (para M.H.), o Programa Nacional de P&D da China (No.2021YFA1001300) (para C.B.), a Fundação Nacional de Ciências Naturais da China (No.12271291) (para C.B.), e a Fundação Nacional de Ciências Naturais da China (No.12071244) (para Z.S.).
CryoSPARC | Structura Biotechnology Inc. Toronto, Canada | CryoSPARC (Cryo-EM Single Particle Ab-Initio Reconstruction and Classification) is a state of the art HPC software solution for complete processing of single-particle cryo-electron microscopy (cryo-EM) data. CryoSPARC is useful for solving cryo-EM structures of membrane proteins, viruses, complexes, flexible molecules, small particles, phase plate data and negative stain data. | |
EMPIAR-10097 Dataset | https://ftp.ebi.ac.uk/empiar/world_availability/10097/data/Particle-Stack/T40_HA_130K-Equalized-Particle-Stack.mrcs | This dataset comprises single-particle cryo-EM data of the Influenza Hemagglutinin trimer, characterized by its highly preferred orientation, collected using a 40-degree tilted collection strategy. | |
initial.mrc | https://github.com/mxhulab/cryosieve-demos/tree/master/EMPIAR-10097 | ||
mask.mrc | https://github.com/mxhulab/cryosieve-demos/tree/master/EMPIAR-10097 | ||
RELION | 4.0-beta-2 | RELION (REgularised LIkelihood OptimisatioN) is an open-source software for cryo-electron microscopy (cryo-EM) data processing, particularly for refining macromolecular structures. Utilizing a Bayesian approach, it excels in separating signal from noise, enabling high-resolution structure determination. RELION supports single-particle analysis, tomography, and sub-tomogram averaging, and has become widely used in structural biology due to its effectiveness and user-friendly interface. | |
T40_HA_130K-Equalized_run-data_CryoSPARC_refined.star | https://github.com/mxhulab/cryosieve-demos/tree/master/EMPIAR-10097 | Metadata file for the final stack of particles from EMPIAR-10097 |