Un método avanzado de selección de partículas para crio-EM, a saber, CryoSieve, mejora la resolución del mapa de densidad al eliminar la mayoría de las partículas en las pilas finales, como se demostró a través de su aplicación en un conjunto de datos del mundo real.
Durante la última década, los avances en tecnología y metodología dentro del campo del análisis de partículas individuales (SPA) de microscopía electrónica criogénica (crio-EM) han mejorado sustancialmente nuestra capacidad para el examen estructural de alta resolución de macromoléculas biológicas. Este avance ha marcado el comienzo de una nueva era de conocimientos moleculares, reemplazando a la cristalografía de rayos X como método dominante y proporcionando respuestas a preguntas de larga data en biología. Dado que la crio-EM no depende de la cristalización, que es una limitación significativa de la cristalografía de rayos X, captura partículas de calidad variable. En consecuencia, la selección de las partículas es crucial, ya que la calidad de las partículas seleccionadas influye directamente en la resolución del mapa de densidad reconstruido. Un innovador enfoque iterativo para la selección de partículas, denominado CryoSieve, mejora significativamente la calidad de los mapas de densidad reconstruidos al reducir eficazmente el número de partículas en la pila final. La evidencia experimental muestra que este método puede eliminar la mayoría de las partículas en las pilas finales, lo que resulta en una mejora notable en la calidad de los mapas de densidad. En este artículo se describe el flujo de trabajo detallado de este enfoque y se muestra su aplicación en un conjunto de datos del mundo real.
El análisis de una sola partícula (SPA) de microscopía electrónica criogénica (crio-EM) se ha convertido en un método dominante para determinar mapas de densidad tridimensional de alta resolución de macromoléculas biológicas. Debido a una serie de innovaciones tecnológicas 1,2,3,4,5,6, denominadas revolución de resolución 7, la crio-EM tiene la capacidad de determinar las estructuras de macromoléculas biológicas con una resolución atómica de hasta un ritmo sin precedentes. Este avance marca el comienzo de una nueva era en los conocimientos moleculares, superando a la cristalografía de rayos X como técnica predominante y respondiendo a preguntas biológicas de larga data.
Cryo-EM SPA difiere de la cristalografía de rayos X al no requerir la cristalización de macromoléculas biológicas. En su lugar, una solución que contiene las macromoléculas biológicas objetivo se congela rápidamente en hielo vítreo. A continuación, se obtienen imágenes con un haz de electrones para producir una serie de micrografías, evitando la necesidad de cristalización8. Posteriormente, se utilizan algoritmos de selección de partículas para extraer partículas crudas individuales de estas micrografías 4,9,10,11,12. Como la crio-EM no depende de la cristalización, es natural que las partículas extraídas estén predominantemente dañadas o en estados conformacionales no deseados, lo que requiere múltiples rondas de selección de partículas para lograr un mapa de densidad de alta resolución. Por lo tanto, en el procesamiento de imágenes crio-EM SPA, la selección de partículas es crucial para obtener mapas de densidad de alta resolución13.
En la crio-EM SPA, los métodos estándar de selección de partículas incluyen la clasificación bidimensional (2D) y tridimensional (3D)14. La clasificación 2D clasifica las partículas en un número predefinido de grupos, lo que produce una imagen promedio y una resolución 2D estimada para cada clase. Luego, los investigadores pueden inspeccionar visualmente estas clases, eliminando partículas de grupos de menor resolución para usar las restantes en reconstrucciones destinadas a lograr una resolución más alta. Una vez que se establezcan las poses de las partículas mediante algoritmos de refinamiento, los investigadores procederán con la clasificación en 3D, agrupando las partículas en múltiples clases. Esto permite la inspección visual del mapa de densidad reconstruido para cada clase, lo que permite la exclusión de partículas indeseables, como las de conformaciones no deseadas. Después de múltiples rondas de clasificación, se obtiene una pila final que comprende partículas de calidad relativamente alta. Estas pilas finales son fundamentales para producir mapas de densidad de resolución atómica o casi atómica.
Zhu y sus colegas han demostrado que se puede llevar a cabo una mayor selección de partículas en estas pilas finales15. CryoSieve15, un innovador método iterativo para la selección de partículas, se puede aplicar para mejorar la calidad del mapa de densidad final al reducir significativamente el número de partículas. Si bien otros criterios y software de clasificación de partículas, como el método de correlación cruzada normalizada (NCC)16, el enfoque de consistencia de grafo angular (AGC)17 y la clasificación de no alineación5, se utilizan actualmente en el campo, se ha demostrado que este método supera a estos algoritmos en términos de efectividad.
En este estudio, presentamos una guía detallada de todo el proceso. Como caso de estudio, aplicamos este nuevo método al conjunto de datos del trímero de hemaglutinina de la gripe (entrada EMPIAR: 10097)18, que incluye 130.000 partículas en su pila final. Nuestro procedimiento descartó con éxito alrededor del 73,8% de las partículas de la pila final de este conjunto de datos, mejorando la resolución del mapa de densidad reconstruido de 4,11 Å a 3,62 Å. Además del trímero de hemaglutinina de la gripe, los resultados de múltiples conjuntos de datos se presentan en la publicación anterior15, que muestra una variedad de resoluciones y pesos moleculares de las biomoléculas.
Cryo-EM se presenta como una técnica fundamental para dilucidar las estructuras de las moléculas biológicas. En este proceso, después de la recopilación de datos mediante microscopía, es esencial la extracción de partículas de las micrografías, seguida de su clasificación en múltiples etapas para compilar la pila final. Un desafío común es el predominio de partículas dañadas o no deseadas, lo que subraya la necesidad de una selección repetida de partículas para obtener mapas de densidad de alta resolución. Esto hace que la selección de partículas sea un paso crítico en la SPA crio-EM para lograr mapas de densidad de alta calidad. Las técnicas de selección de partículas existentes incluyen el algoritmo de validación estadística sin inclinación22, el enfoque basado en la puntuación z23 y el método de estimación de precisión angular24.
CryoSieve emerge como una herramienta valiosa en este contexto, experta en eliminar un número significativo de partículas extrañas de la pila final. Esta reducción no solo mejora la eficiencia computacional de la reconstrucción, sino que también agiliza el proceso. Ofrece un conjunto completo para la selección de partículas, donde el grado de descarte de partículas y la consiguiente mejora en la resolución dependen en gran medida de la calidad inicial de los datos y las metodologías empleadas en el procesamiento de datos.
En este manuscrito, hemos presentado un flujo de trabajo completo de tamizado de partículas utilizando el conjunto de datos de casos reales del trímero de hemaglutinina de influenza (entrada EMPIAR: 10097). Los pasos cubiertos y discutidos aquí se pueden resumir como tamizado de partículas y reestimación de planteas. El volumen final reconstruido en 3D alcanzó una resolución de 3,62 Å, y las cadenas laterales en las hélices alfa fueron más claras en el volumen postprocesado en comparación con el mapa de densidad publicado.
CryoSieve es un método de código abierto que está disponible en GitHub (https://github.com/mxhulab/cryosieve). También se puede encontrar un tutorial detallado en su página de inicio. Los usuarios pueden instalarlo y usarlo siguiendo el tutorial. Además, se proporcionan dos módulos, cryosieve-csrefine y cryosieve-csrhbfactor. El módulo cryosieve-csrefine está diseñado específicamente para automatizar la ejecución secuencial de varias operaciones dentro de CryoSPARC (Archivo complementario 5). Estas operaciones incluyen la importación de pilas de partículas y la realización de trabajos de refinamiento ab initio, homogéneos o no uniformes. Por otro lado, el módulo cryosieve-csrhbfactor está diseñado para automatizar la determinación del factor B de Rosenthal-Henderson aprovechando las capacidades de cryosieve-csrefine (Archivo suplementario 6).
En la actualidad, la aplicación de este método se limita a escenarios de conformación única. En consecuencia, en los casos en que las partículas representan múltiples conformaciones, sus capacidades son limitadas. Se aconseja a los usuarios que inicialmente participen en la clasificación 3D para segregar partículas de conformaciones dispares antes de emplearla para una selección refinada de partículas. Además, aunque el método demuestra ser competente para filtrar más del 50% de las partículas de la pila final, los orígenes de estas partículas desechadas y las razones subyacentes de su insignificante contribución a la calidad de la reconstrucción siguen sin estar claros. Esta brecha en la comprensión requiere investigación adicional para abordar de manera integral y potencialmente rectificar esta limitación.
Existen tres posibles métodos de clasificación de partículas o tamizado de partículas. En primer lugar, cisTEM4 puede informar de una puntuación para cada imagen de partícula después del refinamiento 3D. Los usuarios podían clasificar las partículas utilizando la puntuación cisTEM para descartar las partículas. El enfoque de consistencia de grafo angular (AGC)17 también es un método para descartar partículas desalineadas. Además, la clasificación de no alineación5 es una forma tradicional de descartar partículas mediante la clasificación 3D. Comparamos la calidad de las partículas retenidas por estos métodos con CryoSieve y encontramos que las partículas retenidas de CryoSieve son de mayor calidad15. El método presentado aquí supera significativamente a los métodos alternativos y logra el menor número de partículas con la misma resolución.
Como se demuestra en el resultado, la mayoría de las partículas en una pila final de crio-EM no contribuyen a la reconstrucción del mapa de densidad. En otras palabras, entre todas las partículas recogidas durante la adquisición de imágenes, solo unas pocas, es decir, el subconjunto más fino, contribuyen realmente a la reconstrucción final. En consecuencia, la relación entre este último subconjunto y el número total de partículas recolectadas podría servir como una métrica cuantitativa para evaluar la calidad de la muestra. Cuanto mayor sea esta proporción, mejor será la calidad de la muestra. A pesar de los avances técnicos que han hecho que la crio-EM sea más accesible para los biólogos estructurales, la preparación de muestras sigue siendo un cuello de botella importante en el flujo de trabajo. Por lo tanto, los científicos e ingenieros están centrando sus esfuerzos en este desafío25. En el análisis de una sola partícula (SPA), la preparación de la muestra consta de dos pasos cruciales: la optimización de la muestra y la preparación de la cuadrícula. El primero consiste en purificar la muestra manteniendo su estado bioquímico óptimo. Este último implica la preparación de la muestra para su análisis en el microscopio, incluido el tratamiento químico o con plasma de la rejilla, la deposición de la muestra y la vitrificación. Se han propuesto numerosas técnicas para abordar la inestabilidad macromolecular, pero la eficacia de un enfoque sobre otro depende de las características de la muestra25,26. En la actualidad, los resultados de la preparación de la red están muy influenciados por los conocimientos y la experiencia del usuario, lo que puede hacer que el proceso sea lento y desafiante27,28. Las numerosas variables encontradas en la preparación de muestras y cuadrículas plantean desafíos para establecer relaciones de causa y efecto, ya que los investigadores solo pueden evaluar la muestra a nivel molecular usando el microscopio. Como resultado, aún faltan estadísticas cuantitativas a partir de comparaciones de diferentes protocolos de preparación de muestras y cuadrículas, y es necesario un enfoque sistemático para investigar las tendencias y comprender los mecanismos fundamentales del comportamiento de la muestra29.
The authors have nothing to disclose.
Este trabajo fue apoyado por la Academia de Investigación y Traducción de Shenzhen (a M.H.), el Centro de Innovación Avanzada para la Biología Estructural (a M.H.), el Centro de Investigación de la Frontera de Beijing para la Estructura Biológica (a M.H.), el Programa Nacional Clave de Investigación y Desarrollo de China (No.2021YFA1001300) (a C.B.), la Fundación Nacional de Ciencias Naturales de China (No.12271291) (a C.B.), y la Fundación Nacional de Ciencias Naturales de China (No.12071244) (a Z.S.).
CryoSPARC | Structura Biotechnology Inc. Toronto, Canada | CryoSPARC (Cryo-EM Single Particle Ab-Initio Reconstruction and Classification) is a state of the art HPC software solution for complete processing of single-particle cryo-electron microscopy (cryo-EM) data. CryoSPARC is useful for solving cryo-EM structures of membrane proteins, viruses, complexes, flexible molecules, small particles, phase plate data and negative stain data. | |
EMPIAR-10097 Dataset | https://ftp.ebi.ac.uk/empiar/world_availability/10097/data/Particle-Stack/T40_HA_130K-Equalized-Particle-Stack.mrcs | This dataset comprises single-particle cryo-EM data of the Influenza Hemagglutinin trimer, characterized by its highly preferred orientation, collected using a 40-degree tilted collection strategy. | |
initial.mrc | https://github.com/mxhulab/cryosieve-demos/tree/master/EMPIAR-10097 | ||
mask.mrc | https://github.com/mxhulab/cryosieve-demos/tree/master/EMPIAR-10097 | ||
RELION | 4.0-beta-2 | RELION (REgularised LIkelihood OptimisatioN) is an open-source software for cryo-electron microscopy (cryo-EM) data processing, particularly for refining macromolecular structures. Utilizing a Bayesian approach, it excels in separating signal from noise, enabling high-resolution structure determination. RELION supports single-particle analysis, tomography, and sub-tomogram averaging, and has become widely used in structural biology due to its effectiveness and user-friendly interface. | |
T40_HA_130K-Equalized_run-data_CryoSPARC_refined.star | https://github.com/mxhulab/cryosieve-demos/tree/master/EMPIAR-10097 | Metadata file for the final stack of particles from EMPIAR-10097 |